Mistral AI 推出新的开源模型,该模型的性能优于 Gpt-4o Mini,但参数数量很少
快速阅读: 据《VentureBeat 公司》最新报道,法国AI初创公司迷塔AI推出新开源模型Mistral Small 3.1,性能媲美谷歌和OpenAI,参数仅240亿。迷塔采取开源策略挑战封闭的专有系统,强调欧洲数字主权,提供更环保高效的AI解决方案,同时面临商业模式可持续性的挑战。
订阅我们的每日和每周新闻简报,获取有关行业领先的人工智能报道的最新更新和独家内容。
法国人工智能初创公司迷塔AI(Mistral AI)今日发布了一款新的开源模型,该公司表示其性能优于谷歌和OpenAI等同类产品,为美国科技巨头主导的市场带来了更多竞争。
这款名为迷塔小型3.1(Mistral Small 3.1)的模型仅包含240亿个参数即可处理文本和图像,这一规模远小于领先专有模型,但据公司称其性能与之相当甚至更优。迷塔在一篇博客文章中宣布该模型发布时提到:“此新模型具备改进的文本处理能力、多模态理解和高达128k令牌的扩展上下文窗口。”该公司声称该模型以每秒150个令牌的速度处理信息,适合需要快速响应的应用场景。
通过采用宽松的Apache 2.0许可协议发布该模型,迷塔采取了一种与其更大的竞争对手截然不同的策略,这些竞争对手已经越来越多地限制对其最强大的人工智能系统的访问。这种方法凸显了人工智能行业中封闭的专有系统与开放的可访问替代方案之间的日益扩大的分歧。
这家估值约60亿美元的欧洲初创企业如何挑战硅谷的人工智能巨头
由前谷歌深度思维(Google DeepMind)和Meta研究人员于2023年创立的迷塔AI迅速成为欧洲领先的AI初创企业,在筹集了约10.4亿美元资本后估值达到约60亿美元。尽管这一估值对一家欧洲初创企业来说令人印象深刻,但仍只是OpenAI报告的800亿美元或谷歌和微软等科技巨头所拥有的资源的一小部分。
迷塔在其本土地区取得了显著的进展。其聊天助手Le Chat在移动版本发布后的两周内下载量达到了一百万次,得到了法国总统马克龙的公开支持,他在一次电视采访中敦促公民“下载由迷塔制作的Le Chat,而不是OpenAI的ChatGPT——或者其他什么”。
该公司战略性地将自己定位为“世界上最环保且领先的独立人工智能实验室”,强调欧洲数字主权是其区别于美国竞争对手的重要特点。
小巧但强大:迷塔的240亿参数模型如何超越其重量级对手
迷塔小型3.1因其卓越的效率脱颖而出。仅包含240亿个参数——远远少于GPT-4这类模型——该系统具备多模态功能、多语言支持,并能处理长达128,000个标记的长上下文窗口。
这种效率代表了一个重要的技术成就。虽然人工智能行业通常追求更大规模的模型,需要大量计算资源,但迷塔专注于算法改进和训练优化,以从较小架构中提取最大能力。
这种方法解决了AI部署中最紧迫的挑战之一:最先进的系统所关联的巨大计算和能源成本。通过创建能在相对适度硬件上运行的模型——包括单张RTX 4090显卡或配备32GB内存的Mac电脑——迷塔使高级AI对于那些大型模型不实用的设备应用变得可行。
这种对效率的关注最终可能比其更大的竞争对手采用的强力扩展方法更可持续。随着气候变化和能源成本对AI部署的影响日益增加,迷塔的轻量级方法可能会从替代品转变为行业标准。
为什么欧洲的AI冠军可能受益于不断增长的地缘政治紧张局势
迷塔最新的发布正值人们对中国在国际AI竞赛中的竞争力日益担忧之际,传统上这一领域主要由美国和中国公司主导。
《经济学人》最近分析迷塔的地位时指出,“不再是美国或中国可能现在是一种帮助,而非阻碍。”暗示随着地缘政治紧张局势加剧,某些市场和政府可能会发现欧洲替代方案越来越有吸引力。
迷塔首席执行官亚瑟·曼斯(Arthur Mensch)强烈倡导欧洲数字主权。本月在巴塞罗那举行的移动世界大会(Mobile World Congress)上,他敦促欧洲电信公司“进入超大规模游戏”,通过投资数据中心基础设施。
“我们欢迎国内更多的努力来建设更多的数据中心,”曼斯说,并暗示“AI革命也带来了机会去分散云服务。”
公司的欧洲身份为其提供了显著的监管优势。随着欧盟《人工智能法案》生效,迷塔在进入市场时已设计其系统以符合欧洲价值观和监管要求。这与必须调整其技术和业务实践以遵守日益复杂的全球监管环境的美国和中国竞争对手形成了鲜明对比。
除了文本:迷塔扩展的专业AI模型组合
迷塔小型3.1加入了公司迅速扩展的产品系列。今年2月,迷塔发布了萨巴(Saba),这是一个专注于阿拉伯语和文化的模型,表明AI开发过度集中在西方语言和背景上。
上个月初,该公司推出了迷塔OCR,这是一种光学字符识别API,可以将PDF文档转换为AI-ready的Markdown文件——解决了企业希望让文档库对AI系统可访问的一个关键需求。
这些专业工具补充了迷塔更广泛的产品组合,其中包括迷塔大型2(其旗舰大型语言模型)、Pixtral(用于多模态应用)、Codestral(用于代码生成),以及“Les Ministraux”,这是针对边缘设备优化的一系列模型。
这一多样化的产品组合揭示了一种平衡创新与市场需求的复杂产品战略。迷塔并没有追求单一的巨型模型,而是为特定上下文和需求创建专门系统——这种方法可能更能适应快速变化的AI格局。
开源优势:为何迷塔押注于大型科技公司的封闭式AI系统
迷塔对开源的坚定承诺体现了其在日益被封闭专有系统主导的行业中最具特色的战略抉择。尽管迷塔保留了一些用于商业用途的顶尖模型,但其以宽松许可发布强大模型(如迷塔小型3.1)的战略挑战了人工智能开发知识产权的传统观念。这一做法已带来切实成效。该公司表示:“基于此前的迷塔小型3,已有多个优秀的推理模型构建完成”,例如Nous Research开发的DeepHermes 24B——这表明开放协作能够加速创新,超越任何单一组织独立实现的水平。
开源策略也为资源有限的企业带来了倍增效应。通过让全球开发者社区在其模型基础上构建与拓展,迷塔实际上使其研发能力远超其直接员工数量。这体现了人工智能未来发展的一个全新愿景——一种基础技术更像数字基础设施而非专有产品的愿景。
随着大型语言模型日益商品化,真正价值或将转向专业应用、行业特定实施及服务交付而非基础模型本身。
此战略存在一定风险。若核心AI能力成为广泛可得的商品,迷塔需在其他领域开发出有说服力的独特优势。然而,这也使公司免于陷入与资金实力远超自身的竞争对手不断升级的军备竞赛,此类竞争鲜有欧洲初创企业能凭借传统方式胜出。
通过定位自身处于开放生态系统的中心而非试图完全掌控它,迷塔或许最终能构建出比任何单一组织单独创造的更为稳固的事物。
60亿美元之问:迷塔的商业模式能否支撑其宏伟愿景?
尽管技术成果显著且战略方向明确,迷塔面临重大挑战。据多方消息显示,该公司收入目前仍处于“八位数”级别,与其近60亿美元的估值相比仅占一小部分。曼斯已明确表示公司不会出售,并在达沃斯世界经济论坛上表示“当然,上市是计划”。然而,在一个竞争对手可长期亏损经营的行业中,通往足够收入增长的道路仍不明朗。
公司的开源战略虽具创新性,但也带来自身挑战。若核心模型如Lample所预测般日益商品化,迷塔需在专业服务、企业部署或独特应用等领域开发额外收入流,这些应用利用但超越其基础技术。
迷塔的欧洲身份虽提供监管优势并吸引主权意识强的客户,但也可能限制其与美国和中国市场相比的短期增长潜力,后者通常AI采纳速度更快。
然而,迷塔小型3.1代表了令人信服的技术成就与战略声明。通过展示在开源许可下可在更小、更高效包中提供先进AI能力,迷塔挑战了关于AI开发和商业化应如何进行的基本假设。对于日益担忧少数美国科技巨头权力集中的技术行业,迷塔的欧洲主导、开源的替代方案提供了一个更加分散、可访问的AI未来的愿景——前提是它能建立可持续的商业模式以支撑其宏伟的技术议程。
每日洞察商业用例的VB日报
如果你想给老板留下深刻印象,VB Daily可以帮你。我们为你提供公司如何使用生成式AI的内部信息,从监管变化到实际部署,以便你能分享见解以获得最大回报。立即订阅。
阅读我们的隐私政策。
感谢您订阅。查看更多VB时事通讯。
发生错误。
(以上内容均由Ai生成)