标签: 推理
-
OpenAI 研究负责人 Noam Brown 认为 AI“推理”模型可能在几十年前就已经出现
快速阅读: 据《雅虎美国》最新报道,在圣何塞Nvidia GTC大会上,OpenAI研究员诺姆·布朗指出,推理型AI模型可能早在二十年前就已出现,但因关键元素缺失未受重视。他强调预训练与测试时推断互补,并建议学术界通过低计算需求领域合作及改 […]
发布时间:2025-03-20 07:10 来源:szf -
Oracle 与 NVIDIA 合作加速企业 AI 推理
快速阅读: 《快速模式》消息,甲骨文与英伟达合作,将英伟达AI技术与甲骨文云基础设施集成,加速企业构建自主AI应用。双方合作涵盖AI工具、微服务及数据库优化,助力快速AI部署与创新。 甲骨文与英伟达宣布了一项开创性的集成,将英伟达的加速计算 […]
发布时间:2025-03-19 11:11 来源:szf -
使用差分私有 LLM 推理生成合成数据
快速阅读: 据《Google Research 博客》最新报道,本文介绍一种新方法,通过差分隐私预测生成高质量合成数据,降低隐私保护技术门槛,促进跨部门高效协作,拓展隐私计算应用场景,推动研究与实践发展。 差分隐私(DP)提供了一种数学上严 […]
发布时间:2025-03-19 01:57 来源:szf -
LG 将凭借韩国首个推理 AI 模型与 OpenAI 和 DeepSeek 竞争
快速阅读: 据《韩国先驱报》称,LG展示韩国首个顶级推理AI模型ExaOne Deep,参数量少但性能优异,可媲美国际领先者。模型已在多项测试中表现突出,LG开源所有模型以促进发展。集团CEO强调将创造便捷AI生活。 LG人工智能研究院院长 […]
发布时间:2025-03-18 16:20 来源:szf -
百度发布推理 AI 模型,与 DeepSeek 抗衡
快速阅读: 据《雅虎英国和爱尔兰》称,百度推出能解释推理过程的新AI模型Ernie X1,以抗衡DeepSeek等竞争者。百度同时升级了Ernie 4.5并提前免费开放服务,还计划开源其AI模型。尽管云收入增长,但疲软的广告销售影响了百度的 […]
发布时间:2025-03-16 23:17 来源:szf -
百度推出推理 AI 模型以重新战胜 DeepSeek
快速阅读: 《商务标准》消息,百度发布全新AI模型ERNIE X1,升级ERNIE 4.5并开源,与深寻等竞争。百度还计划推出ERNIE 5,增强AI产品线,并将云收入增长用于AI和云基础设施投资。 据彭博新闻社报道,百度公司发布了一款全新 […]
发布时间:2025-03-16 11:25 来源:szf -
新技术帮助 LLM 控制 CoT 长度,在不增加计算成本的情况下优化推理
快速阅读: 据《VentureBeat 公司》称,卡内基梅隆大学的研究人员开发了一种名为长度控制策略优化(LCPO)的技术,通过训练让大型语言模型在保持推理准确性的同时控制链式思维(CoT)的长度。实验表明,基于LCPO训练的模型在准确性与 […]
发布时间:2025-03-14 04:42 来源:szf -
推理扩展成为 AISC 2025 的下一个前沿领域
快速阅读: 据《越南新闻》称,2025年人工智能与半导体国际会议探讨了AI推理扩展的新方法,通过增加推理阶段的计算资源提高AI性能,展示在软件、硬件及芯片设计中的应用潜力与挑战,强调其经济高效性与实用性。 斯坦福大学教授兼谷歌DeepMin […]
发布时间:2025-03-13 13:13 来源:szf -
大型 AI 推理已成为一件大事和更大的业务
快速阅读: 《福布斯》消息,创新AI技术降低了训练成本,但推理复杂度增加。英伟达等公司通过推出加速器推动发展,预计下周将在推理领域取得突破,虽计算量可能是训练的100-200倍,但AI展现的价值远超预期。 得益于创新技术如深度求索(Deep […]
发布时间:2025-03-13 05:24 来源:szf -
Nvidia 赢得了 AI 训练竞赛,但推理仍然是任何人的游戏
快速阅读: 《The Register》消息,专注提升运行速度的公司如赛睿脑、桑巴诺瓦和格罗克,利用大量SRAM和推测解码等技术,使模型运行速度大幅提升,产品重新定义行业标准,推动AI技术快速发展。 在另一端,像赛睿脑(Cerebras)、 […]
发布时间:2025-03-13 04:40 来源:szf -
Pliops 宣布与 vLLM 生产堆栈合作,以增强 LLM 推理性能
快速阅读: 据《GlobeNewswire(新闻稿)》最新报道,2025年3月12日,存储解决方案领导者Pliops宣布与芝加哥大学LMCache实验室合作,优化大型语言模型推理性能。双方将结合各自优势,提升AI应用效率与成本效益,合作成果 […]
发布时间:2025-03-12 23:17 来源:szf -
鸿海研究院推出具有推理能力的繁体中文 LLM
快速阅读: 据《美通社 (新闻稿)》最新报道,FoxBrain的训练过程由120块NVIDIA H100 GPU支持,采用NVIDIA量子二型因芬iband网络,在约四周内完成。这一更高效且成本更低的模型训练方法为台湾的人工智能技术发展树立 […]
发布时间:2025-03-10 18:21 来源:szf