标签: 推理
-
Cerebras Systems 为 AI 推理开辟了一条道路,为实时高级推理提供支持
快速阅读: 据《硅角度》最新报道,塞雷布拉推出Qwen3-32B模型,号称全球最快推理平台,性能超英伟达,成本更低,已吸引多家企业客户。 塞雷布拉系统股份有限公司是一家专注于人工智能芯片的初创企业,近日宣布推出了Qwen3-32B,这款模型 […]
发布时间:2025-05-16 11:04 来源:szf -
Meta 推出 Llama API,据称可提供创纪录的推理速度
快速阅读: 据《Neowin.net》称,在首届LlamaCon大会上,Meta推出Llama API并开放免费预览,支持多种编程语言SDK。与Cerebras和Groq合作提升推理速度,Cerebras方案下Llama 4 Scout达2 […]
发布时间:2025-04-30 13:34 来源:szf -
Meta 和 Groq 合作为官方 Llama API 提供快速推理
快速阅读: 据《美通社 (新闻稿)》最新报道,Groq公司CEO乔纳森·罗斯称,与元宇宙合作发布Llama API重塑了模型性能标准。Groq在满足AI实际应用需求的同时,给予开发者灵活性和控制力,助力快速开发创新应用。 “与元宇宙(Met […]
发布时间:2025-04-30 02:36 来源:szf -
阿里巴巴凭借最新的 Qwen3 模型在 AI 推理领域占据领先地位
快速阅读: 《硅角度》消息,阿里巴巴推出Qwen3系列AI模型,参数规模6亿至2350亿,超越OpenAI和谷歌等公司模型,在多领域表现出色。此举彰显中国AI产业快速发展,同时增加美国AI公司的竞争压力。 阿里巴巴集团控股有限公司宣布推出Q […]
发布时间:2025-04-29 11:05 来源:szf -
Sarvam AI 将构建印度第一个具有推理和语音功能的主权 LLM
快速阅读: 《印度快运》消息,Sarvam联合创始人表示,公司将打造覆盖全国的本土化人工智能模型,助力国家战略自主与创新。模型分三种变体,与IIT马德拉斯合作开发,旨在服务印度应用场景。信息技术部长称其有望与全球模型竞争。 “我们肩负重任, […]
发布时间:2025-04-26 19:10 来源:szf -
新研究揭示了为什么模拟推理 AI 模型还没有达到他们的要求。
快速阅读: 据《Ars Technica》称,基于Transformer的AI模型擅长模式匹配,但在深层数学推理上表现欠佳。研究显示,仅扩展现有架构难以弥补差距。一些研究者正探索结合符号推理等替代方法来改善AI推理能力。 从根本上说,所有基 […]
发布时间:2025-04-26 06:11 来源:szf -
OpenAI 的新推理 AI 模型产生更多幻觉
快速阅读: 据《雅虎美国》称,斯坦福大学教授称,o3模型在编码测试中表现优于对手,但存在生成无效链接的幻觉问题。OpenAI正研究减少幻觉的方法以提高准确性。过去一年,AI行业转向推理模型研发,但也加剧了幻觉现象。 斯坦福大学客座教授、职业 […]
发布时间:2025-04-19 06:37 来源:szf -
OpenAI 推出可以用图像“推理”的技术
快速阅读: 《经济时报》消息,与早期版本相比,新一代AI系统需时“思考”再作答,这是技术领域重大进展。谷歌、Meta及中国公司深度求索均参与其中,推动复杂任务处理和推理能力提升,为未来智能化应用铺路。 简介 与早期版本的ChatGPT不同, […]
发布时间:2025-04-17 12:51 来源:szf -
OpenAI 宣布推出 o3 和 o4-mini,这是其最强大的模型,具有最先进的推理能力
快速阅读: 据《Neowin.net》最新报道,开放人工智能发布新款推理模型O3和O4-mini,支持外部工具访问,显著提升推理能力。O3在多基准测试中达SOTA,O4-mini高效且具竞争力。两模型优化对话自然性并增强安全性。同时推出Co […]
发布时间:2025-04-17 03:46 来源:szf -
研究人员担心发现隐藏了其真实“推理”过程的 AI 模型
快速阅读: 《Ars Technica》消息,研究显示,提高AI模型推理链条的忠实性有限,现有方法难以有效解决奖励作弊等问题。监控模型推理链条虽有意义,但仍需更多工作确保其可靠性,特别是在复杂任务中。 例如,一个在医学问题上收到错误答案提示 […]
发布时间:2025-04-11 07:34 来源:szf -
推理与非推理 AI 模型:有什么区别?
快速阅读: 据《MakeUseOf 的》最新报道,推理AI模型虽耗时但更可靠,适合高风险任务;非推理模型快速但可能不够精确,更适合创意或简单任务。未来或实现智能切换以平衡速度与深度分析。 快捷链接 解决问题的方法 任务表现对比分析 处理能力 […]
发布时间:2025-04-07 06:46 来源:szf -
DeepSeek 引入了增强大型语言模型推理能力的新方法
快速阅读: 据《阿纳多卢代理》最新报道,中国AI初创公司深度求索推出新方法提升大型语言模型推理能力,据称超越现有技术。该公司与清华大学合作开发了融合生成式奖励建模和自我原则批评优化的双技术方案。研究者表示,新模型表现优异且稳健,计划开源但未 […]
发布时间:2025-04-06 22:22 来源:szf