AI 模型更喜欢与 Apple 的移动平台合作,而不是 Google 的移动平台
快速阅读: 据《商业内幕》最新报道,一款名为“SmartResolve”的AI工具由Instabug公司推出,用于自动检测和修复移动应用崩溃问题,但其在iOS的表现明显优于Android。研究显示,iOS平台上的崩溃修复准确性及合理性更高,原因在于其语言特性。相比之下,Android由于设备多样化和语言复杂性,修复难度更大。苹果和谷歌暂无回应。
当你的移动应用程序崩溃时,通常会迅速找到漏洞并修复。现在,有一项基于人工智能的解决方案问世。然而,周四发布的一项研究表明,这项技术在苹果的iOS平台上的表现远胜于谷歌的Android系统。
一家名为“Instabug”的软件公司推出了一款名为“SmartResolve”的工具,该工具利用顶尖的人工智能模型,实现应用崩溃的自动化检测、问题诊断及有效代码修复。微软首席执行官探讨了关于ChatGPT、伦理人工智能以及失败风险的话题。研究团队采用了来自OpenAI、Anthropic、谷歌和Meta的模型,对一组真实世界的应用程序崩溃数据集进行了测试。每种修复方案都根据正确性、与人工修复的相似度、根本原因分析的深度、相关性以及整体连贯性进行评分。
一个重要发现是:AI模型在iOS上的表现始终优于Android。Instabug发现,在苹果平台上,几乎所有的测试模型中,崩溃修复都更加准确且结构合理。即便谷歌自己的AI模型在Android上的表现也不如OpenAI的模型。例如,OpenAI的GPT-4o在iOS上获得了60%的分数,而在Android上仅为49%。采用OpenAI的o1模型时差距更为显著:它在iOS上达到62%,但在Android上下降至26%,并且在许多Android测试中完全无法响应。其他模型也呈现出类似的趋势。Anthropic的Claude Sonnet 3.5 V1在iOS上得分为58%,在Android上为56%——尽管差距不大,但依然是iOS领先。即使谷歌自己的Gemini 1.5 Pro在Android(51%)上的表现也低于iOS的59%。
Instabug还发现,当使用更大范围的上下文时,它还会面临更多的幻觉问题。
相关报道《商业内幕》讲述了你想了解的创新故事。
为什么Android表现较弱?这种差异可能源于Android碎片化的系统环境。与提供更统一环境的iOS相比,Android设备种类繁多,崩溃类型多样,这使得AI模型更难推广修复方案。“在iOS上的更强性能部分归因于Swift和Objective-C等原生语言的特点,”Instabug的首席产品官肯尼·约翰斯顿说道。“这些语言的语法更具可预测性,并且具有严格的类型定义,这使得大型语言模型能够更容易生成精准的修复。”
约翰斯顿表示,Android所使用的语言——Java和Kotlin——加上崩溃格式的多样性,意味着修复的复杂性更高。苹果和谷歌均未回应《商业内幕》的评论请求。
将文中的英文单词都翻译成中文,最终的内容仅输出中文。装备名称、人名、地名、公司名称都翻译成中文,最后将语句再润色,使其更加通顺生动,同时确保格式美观,除此之外,不提供任何解释文字。
(以上内容均由Ai生成)