IT之家 6 月 7 日消息,研究人员正在尝试使用 AI 来解读狗的叫声是在玩耍还是在生气。与此同时,研究人员还尝试使用 AI 识别狗的年龄、性别和品种。
密歇根大学的研究人员与位于普埃布拉的墨西哥国家天体物理、光学和电子研究所(INAOE)合作开展了这一研究,发现最初用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。
图源 Pixabay
密歇根大学人工智能实验室负责人 Rada Mihalcea 表示,人工智能在理解语音的微妙之处方面有了显著进步,可以区分音调、音调和口音的细微差别,可凭借这些研究基础来理解狗吠。
开发这种分析动物发声 AI 模型的主要障碍之一,是缺乏公开可用的数据。虽然有许多资源和机会来记录人类的语音,但从动物身上收集数据更加困难。
团队尝试使用采集人类语音数据的方式来采集狗的叫声信息,各种情况下收集了 74 只不同品种、年龄和性别狗狗的吠叫、咆哮和呜呜声。
团队将采集到的这些声音信息用于分析人类语音的机器模型中,模型可以很好地理解狗之间的交流,模型在各种测试中准确率达到 70%。
Rada Mihalcea 表示,“来自人类语音的声音和模式可以作为分析和理解其他声音(如动物发声)的声学模式的基础”。团队其他研究人员也表示,更好地了解动物发出各种声音的细微差别,可以改善人类对其情感和身体需求的解释和反应。
据悉实验结果在 2024 年计算语言学、语言资源与评估国际联合会议进行了展示。IT之家附论文链接:
领取专属 10元无门槛券
私享最新 技术干货