Google 计划如何使用 AI 和 Pixel 手机与海豚交流
快速阅读: 《技术点》消息,谷歌开发“海豚Gemini”AI模型,尝试与海豚交流。该模型基于野生海豚项目数据训练,能解读海豚声音。配合CHAT装置,目标是实现人类与海豚的初步双向对话。谷歌计划在2025年夏完善系统,提高交互效率和研究安全性。
谷歌正通过一项新的人工智能模型,尝试与海豚展开交流,这一突破性进展为哺乳动物沟通领域带来了全新可能。这项名为“海豚Gemini”的大语言模型,能够解读海豚发出的各种复杂声音,包括口哨声、点击声以及尖叫声等。
谷歌与乔治亚理工学院的研究团队携手合作,共同参与由野生海豚项目(WDP)主导的实地研究。多年来,WDP致力于收集并分析海豚声音及其对应行为的相关数据。研究发现,海豚拥有独特的个性化口哨声,用于识别彼此身份;而在求偶或驱赶捕食者时,它们会发出特定的点击声;争斗过程中,则会出现高频的尖锐叫声。
基于WDP海量声音数据库及详细标注资料,“海豚Gemini”模型得以精准训练。此款具备四亿参数量级的AI工具,特别优化以便直接运行于野外作业所需的Pixel手机之上,大大降低了硬件成本需求。其工作原理与其他主流大型语言模型相似,即通过对声音信号序列进行分析,挖掘其中隐藏的规律与结构,进而预测后续可能出现的音调组合。
此外,WDP联合乔治亚理工学院推出了名为CHAT(Whale Hearing Augmented Telemetry)的创新装置,该设备依托Pixel 6平台构建而成。CHAT能够生成模拟人类语音的口哨音,并将其与某些特定物体或场景挂钩,比如某种海藻或者科研人员佩戴的围巾,以此激发海豚的兴趣。长远来看,CHAT旨在促成人类与海豚之间初步形式的双向对话交流。
展望未来,谷歌计划于2025年的夏季考察周期推出基于最新Pixel 9系列产品的升级版CHAT系统。届时,这套集成解决方案将结合“海豚Gemini”强大的预测功能,进一步提升人机交互效率,确保每一次互动都能更加自然流畅。谷歌坚信,这些前沿技术的应用有望有效预防因误判而导致的问题发生,从而保障整个研究过程的安全性和准确性。
(以上内容均由Ai生成)