Google 计划如何使用 AI 和 Pixel 手机与海豚交流

发布时间：2025年4月15日来源：szf

快速阅读: 《技术点》消息，谷歌开发“海豚Gemini”AI模型，尝试与海豚交流。该模型基于野生海豚项目数据训练，能解读海豚声音。配合CHAT装置，目标是实现人类与海豚的初步双向对话。谷歌计划在2025年夏完善系统，提高交互效率和研究安全性。

谷歌正通过一项新的人工智能模型，尝试与海豚展开交流，这一突破性进展为哺乳动物沟通领域带来了全新可能。这项名为“海豚Gemini”的大语言模型，能够解读海豚发出的各种复杂声音，包括口哨声、点击声以及尖叫声等。

谷歌与乔治亚理工学院的研究团队携手合作，共同参与由野生海豚项目（WDP）主导的实地研究。多年来，WDP致力于收集并分析海豚声音及其对应行为的相关数据。研究发现，海豚拥有独特的个性化口哨声，用于识别彼此身份；而在求偶或驱赶捕食者时，它们会发出特定的点击声；争斗过程中，则会出现高频的尖锐叫声。

基于WDP海量声音数据库及详细标注资料，“海豚Gemini”模型得以精准训练。此款具备四亿参数量级的AI工具，特别优化以便直接运行于野外作业所需的Pixel手机之上，大大降低了硬件成本需求。其工作原理与其他主流大型语言模型相似，即通过对声音信号序列进行分析，挖掘其中隐藏的规律与结构，进而预测后续可能出现的音调组合。

此外，WDP联合乔治亚理工学院推出了名为CHAT（Whale Hearing Augmented Telemetry）的创新装置，该设备依托Pixel 6平台构建而成。CHAT能够生成模拟人类语音的口哨音，并将其与某些特定物体或场景挂钩，比如某种海藻或者科研人员佩戴的围巾，以此激发海豚的兴趣。长远来看，CHAT旨在促成人类与海豚之间初步形式的双向对话交流。

展望未来，谷歌计划于2025年的夏季考察周期推出基于最新Pixel 9系列产品的升级版CHAT系统。届时，这套集成解决方案将结合“海豚Gemini”强大的预测功能，进一步提升人机交互效率，确保每一次互动都能更加自然流畅。谷歌坚信，这些前沿技术的应用有望有效预防因误判而导致的问题发生，从而保障整个研究过程的安全性和准确性。

(以上内容均由Ai生成)