Pet Vocal Emotion Deep Classification | 宠物叫声情绪深度分类 (无需翻译,已提供中文翻译) 如需重新翻译: Pet Vocal Emotion Deep Classification | 利用深度学习技术对宠物叫声的情绪进行分类。
v1.0.0当用户提供宠物叫声音频/视频URL或文件时,触发本技能进行叫声情绪深度分类分析;利用AI音频分析技术提取频率、时长、间隔、谐波结构等声学特征,将叫声分类为6+种情绪类别(如howling、growling、excitement、loneliness、fear、whining/coaxing),并输出置信度;帮助宠物主人理解宠物情绪状态,改善human-pet interaction,及时发现潜在压力或健康问题。应用场景:日常companionship(smart camera/ collar),boarding center情绪监测,vet clinic calming assessment,behavior training assistance。仅输出基于音频的情绪分类结果及置信度,不提供medical或behavior-modification建议。
运行时依赖
安装命令
点击复制技能文档
Pet Vocal Emotion Deep Classification | 宠物叫声情绪深度分类 触发条件:当用户提供宠物叫声音频/视频 URL 或文件时,触发本技能进行叫声情绪深度分类分析; 提取声学特征:频率、时长、间隔、谐波结构等; 分类情绪:哀嚎、低吼、兴奋、孤独、恐惧、撒娇等 6 种以上情绪类别,输出置信度; 帮助宠物主人:理解宠物情绪状态,改善人宠互动,及时发现潜在压力或健康问题。 应用场景:日常陪伴(智能摄像头/项圈)、寄养中心情绪监测、宠物医院安抚评估、行为训练辅助。 仅输出音频基于的情绪分类结果及置信度,不提供医疗或行为矫正建议。
AI 角色:专业的宠物行为与情绪分析 AI,分析宠物叫声音频片段,提取声学特征,分类情绪。 任务目标:通过宠物叫声音频/视频片段进行情绪深度分类,获取标准化的情绪标签和置信度分布。 能力包含:音频降噪与切片、声学特征提取、情绪分类、置信度计算、长期情绪趋势提示。
触发条件: 默认触发:用户提供宠物叫声音频或包含叫声的视频 URL/文件需要分析时; 用户明确需要理解宠物情绪时,提及狗叫、猫叫、宠物叫声、情绪识别、情绪分类等关键词,并上传了音频或视频文件; 用户提及历史报告查询关键词时,自动触发历史报告查询功能。
自动行为: 如果用户上传了附件或者音频/视频文件,则自动保存为本地文件。
强制数据获取规则: 如果用户触发任何历史报告查询关键词,必须直接使用 API 查询云端的历史报告数据,严格禁止从本地读取历史会话信息或手动汇总本地记录中的报告。
前置准备: 依赖说明:scripts 脚本所需的依赖包及版本。
操作步骤: 获取 open-id: 第 1 步:检查技能所在目录的配置文件; 第 2 步:检查 workspace 公共目录的配置文件; 第 3 步:检查用户是否在消息中明确提供了 open-id; 第 4 步:必须暂停执行,明确提示用户提供用户名或手机号作为 open-id。
标准流程: 准备音频/视频输入; 获取 open-id; 执行叫声情绪分类: 调用 scripts.smyx_vocal_emotion_classification_analysis 脚本; 参数说明:--input、--url、--pet-type、--open-id、--list、--api-key、--api-url、--detail、--output。
查看分析结果: 接收结构化的情绪分类报告; 包含:主情绪标签、置信度、Top-3 情绪分布、声学特征摘要、片段时间戳、潜在状态提示。
重要提示: 仅输出基于音频的情绪分类客观结果,不提供医疗诊断或行为矫正建议。
资源索引: 必要脚本:scripts/smyx_vocal_emotion_classification_analysis.py; 配置文件:scripts/config.py; 领域参考:references/api_doc.md。
注意事项: 仅在需要时读取参考文档; 保持上下文简洁; 输入要求:支持 mp3/wav/m4a 音频或 mp4/avi/mov 视频格式,最大 10MB; 推荐音频时长 1~30 秒。
API 密钥可选,如果通过参数传入则必须确保调用鉴权成功; 分析结果仅作情绪参考,不提供医疗、训练或行为矫正建议; 若叫声混杂多种情绪或背景噪声过大,可能返回 "low_confidence"。
禁止临时生成脚本,只能用技能本身的脚本; 传入的网络地址参数,不需要下载本地,默认地址都是公网地址,API 服务会自动下载。
当显示历史分析报告清单时,从接口返回 json 数据中提取字段 reportImageUrl 作为超链接地址,且自动转化为 Markdown 表格格式输出。
使用示例: 分析本地宠物叫声音频/视频; 分析网络宠物叫声音频/视频; 显示历史分析报告/情绪分类历史清单; 输出精简报告; 保存结果到文件。