Pet Vocal Emotion Deep Classification | 宠物叫声情绪深度分类（无需翻译，已提供中文翻译）如需重新翻译： Pet Vocal Emotion Deep Classification | 利用深度学习技术对宠物叫声的情绪进行分类。

v1.0.0

当用户提供宠物叫声音频/视频URL或文件时，触发本技能进行叫声情绪深度分类分析；利用AI音频分析技术提取频率、时长、间隔、谐波结构等声学特征，将叫声分类为6+种情绪类别（如howling、growling、excitement、loneliness、fear、whining/coaxing），并输出置信度；帮助宠物主人理解宠物情绪状态，改善human-pet interaction，及时发现潜在压力或健康问题。应用场景：日常companionship（smart camera/ collar），boarding center情绪监测，vet clinic calming assessment，behavior training assistance。仅输出基于音频的情绪分类结果及置信度，不提供medical或behavior-modification建议。

0· 0·0 当前·0 累计

by @smyx-sunjinhui·MIT-0

开发工具代码生成文件处理 AI模型访问 CI/CD

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install smyx-vocal-emotion-classification-analysis

镜像加速npx clawhub@latest install smyx-vocal-emotion-classification-analysis --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

Pet Vocal Emotion Deep Classification | 宠物叫声情绪深度分类触发条件：当用户提供宠物叫声音频/视频 URL 或文件时，触发本技能进行叫声情绪深度分类分析；提取声学特征：频率、时长、间隔、谐波结构等；分类情绪：哀嚎、低吼、兴奋、孤独、恐惧、撒娇等 6 种以上情绪类别，输出置信度；帮助宠物主人：理解宠物情绪状态，改善人宠互动，及时发现潜在压力或健康问题。应用场景：日常陪伴（智能摄像头/项圈）、寄养中心情绪监测、宠物医院安抚评估、行为训练辅助。仅输出音频基于的情绪分类结果及置信度，不提供医疗或行为矫正建议。

AI 角色：专业的宠物行为与情绪分析 AI，分析宠物叫声音频片段，提取声学特征，分类情绪。任务目标：通过宠物叫声音频/视频片段进行情绪深度分类，获取标准化的情绪标签和置信度分布。能力包含：音频降噪与切片、声学特征提取、情绪分类、置信度计算、长期情绪趋势提示。

触发条件：默认触发：用户提供宠物叫声音频或包含叫声的视频 URL/文件需要分析时；用户明确需要理解宠物情绪时，提及狗叫、猫叫、宠物叫声、情绪识别、情绪分类等关键词，并上传了音频或视频文件；用户提及历史报告查询关键词时，自动触发历史报告查询功能。

自动行为：如果用户上传了附件或者音频/视频文件，则自动保存为本地文件。

强制数据获取规则：如果用户触发任何历史报告查询关键词，必须直接使用 API 查询云端的历史报告数据，严格禁止从本地读取历史会话信息或手动汇总本地记录中的报告。

前置准备：依赖说明：scripts 脚本所需的依赖包及版本。

操作步骤：获取 open-id：第 1 步：检查技能所在目录的配置文件；第 2 步：检查 workspace 公共目录的配置文件；第 3 步：检查用户是否在消息中明确提供了 open-id；第 4 步：必须暂停执行，明确提示用户提供用户名或手机号作为 open-id。

标准流程：准备音频/视频输入；获取 open-id；执行叫声情绪分类：调用 scripts.smyx_vocal_emotion_classification_analysis 脚本；参数说明：--input、--url、--pet-type、--open-id、--list、--api-key、--api-url、--detail、--output。

查看分析结果：接收结构化的情绪分类报告；包含：主情绪标签、置信度、Top-3 情绪分布、声学特征摘要、片段时间戳、潜在状态提示。

重要提示：仅输出基于音频的情绪分类客观结果，不提供医疗诊断或行为矫正建议。

资源索引：必要脚本：scripts/smyx_vocal_emotion_classification_analysis.py；配置文件：scripts/config.py；领域参考：references/api_doc.md。

注意事项：仅在需要时读取参考文档；保持上下文简洁；输入要求：支持 mp3/wav/m4a 音频或 mp4/avi/mov 视频格式，最大 10MB；推荐音频时长 1～30 秒。

API 密钥可选，如果通过参数传入则必须确保调用鉴权成功；分析结果仅作情绪参考，不提供医疗、训练或行为矫正建议；若叫声混杂多种情绪或背景噪声过大，可能返回 "low_confidence"。

禁止临时生成脚本，只能用技能本身的脚本；传入的网络地址参数，不需要下载本地，默认地址都是公网地址，API 服务会自动下载。

当显示历史分析报告清单时，从接口返回 json 数据中提取字段 reportImageUrl 作为超链接地址，且自动转化为 Markdown 表格格式输出。

使用示例：分析本地宠物叫声音频/视频；分析网络宠物叫声音频/视频；显示历史分析报告/情绪分类历史清单；输出精简报告；保存结果到文件。

License

运行时依赖

安装命令

技能文档

相关技能推荐