AI 模型更喜欢与 Apple 的移动平台合作，而不是 Google 的移动平台

发布时间：2025年4月10日来源：szf

快速阅读: 据《商业内幕》最新报道，一款名为“SmartResolve”的AI工具由Instabug公司推出，用于自动检测和修复移动应用崩溃问题，但其在iOS的表现明显优于Android。研究显示，iOS平台上的崩溃修复准确性及合理性更高，原因在于其语言特性。相比之下，Android由于设备多样化和语言复杂性，修复难度更大。苹果和谷歌暂无回应。

当你的移动应用程序崩溃时，通常会迅速找到漏洞并修复。现在，有一项基于人工智能的解决方案问世。然而，周四发布的一项研究表明，这项技术在苹果的iOS平台上的表现远胜于谷歌的Android系统。

一家名为“Instabug”的软件公司推出了一款名为“SmartResolve”的工具，该工具利用顶尖的人工智能模型，实现应用崩溃的自动化检测、问题诊断及有效代码修复。微软首席执行官探讨了关于ChatGPT、伦理人工智能以及失败风险的话题。研究团队采用了来自OpenAI、Anthropic、谷歌和Meta的模型，对一组真实世界的应用程序崩溃数据集进行了测试。每种修复方案都根据正确性、与人工修复的相似度、根本原因分析的深度、相关性以及整体连贯性进行评分。

一个重要发现是：AI模型在iOS上的表现始终优于Android。Instabug发现，在苹果平台上，几乎所有的测试模型中，崩溃修复都更加准确且结构合理。即便谷歌自己的AI模型在Android上的表现也不如OpenAI的模型。例如，OpenAI的GPT-4o在iOS上获得了60%的分数，而在Android上仅为49%。采用OpenAI的o1模型时差距更为显著：它在iOS上达到62%，但在Android上下降至26%，并且在许多Android测试中完全无法响应。其他模型也呈现出类似的趋势。Anthropic的Claude Sonnet 3.5 V1在iOS上得分为58%，在Android上为56%——尽管差距不大，但依然是iOS领先。即使谷歌自己的Gemini 1.5 Pro在Android（51%）上的表现也低于iOS的59%。

Instabug还发现，当使用更大范围的上下文时，它还会面临更多的幻觉问题。

相关报道《商业内幕》讲述了你想了解的创新故事。

为什么Android表现较弱？这种差异可能源于Android碎片化的系统环境。与提供更统一环境的iOS相比，Android设备种类繁多，崩溃类型多样，这使得AI模型更难推广修复方案。“在iOS上的更强性能部分归因于Swift和Objective-C等原生语言的特点，”Instabug的首席产品官肯尼·约翰斯顿说道。“这些语言的语法更具可预测性，并且具有严格的类型定义，这使得大型语言模型能够更容易生成精准的修复。”

约翰斯顿表示，Android所使用的语言——Java和Kotlin——加上崩溃格式的多样性，意味着修复的复杂性更高。苹果和谷歌均未回应《商业内幕》的评论请求。

将文中的英文单词都翻译成中文，最终的内容仅输出中文。装备名称、人名、地名、公司名称都翻译成中文，最后将语句再润色，使其更加通顺生动，同时确保格式美观，除此之外，不提供任何解释文字。

(以上内容均由Ai生成)