标签: 提速
-
蚂蚁 dInfer 框架提速10倍,突破扩散模型推理瓶颈
快速阅读: 蚂蚁集团开源dInfer框架,大幅提升扩散模型推理速度至10倍,超过传统自回归模型。通过并行解码和KV缓存管理等技术创新,dInfer在多个数据集上表现出色,平均TPS达407.36。 近日,蚂蚁集团开源了全新的 dInfer […]
发布时间:2025-10-15 19:04 来源:szf -
Meta新实验室推REFRAG框架,RAG推理提速30倍
快速阅读: Meta成立超级智能实验室,发布REFRAG框架,大幅提升大语言模型在RAG任务中的推理速度超30倍,降低计算成本,提高效率。 近日,Meta公司宣布成立全新的超级智能实验室(Meta Superintelligence Lab […]
发布时间:2025-10-14 13:18 来源:szf -
“中国芯片使‘类脑’AI响应提速百倍”
快速阅读: 该技术通过选择性响应输入而非激活整个网络,实现节省电力并加速响应,与ChatGPT等主流AI工具不同。 因此,它不是激活整个网络,如ChatGPT和其他主流AI工具那样,而是选择性地响应输入,从而节省电力并加快响应速度。 (以上 […]
发布时间:2025-09-10 14:32 来源:szf -
AI自动生成Metal内核,PyTorch推理提速87%
快速阅读: Gimlet Labs研究显示,AI自动生成的Metal内核使PyTorch在苹果设备上的推理速度提升87%,215个模块平均加速1.87倍,部分工作负载提速数百倍,验证了AI在硬件优化领域的潜力。 在苹果设备上,AI技术正展现 […]
发布时间:2025-09-05 10:49 来源:szf -
NVIDIA推出Jet-Nemotron,混合架构语言模型提速53倍节省98%推理成本
快速阅读: NVIDIA发布Jet-Nemotron语言模型,生成速度提升53.6倍,推理成本降低98%,通过PostNAS技术改造现有模型,保持高准确性,适用于边缘设备。 NVIDIA 研究团队近日发布了 Jet-Nemotron,这是一 […]
发布时间:2025-08-28 02:11 来源:szf -
NVIDIA推出Jet-Nemotron,53倍提速实现98%推理成本节约
快速阅读: NVIDIA 发布 Jet-Nemotron 语言模型,生成速度提升53.6倍,推理成本降低98%,通过 PostNAS 技术改造现有模型,保持高准确性,适用于边缘设备,降低成本,提高投资回报率。 NVIDIA 研究团队近日发布 […]
发布时间:2025-08-27 22:55 来源:szf -
NVIDIA 推出 Jet-Nemotron:53倍提速,98%推理成本节省
快速阅读: NVIDIA发布Jet-Nemotron语言模型,生成速度提升53.6倍,推理成本降低98%,采用PostNAS技术改造现有模型,保持准确性,适用于边缘设备,降低成本提高性能。 近日,NVIDIA 研究团队发布了 Jet-Nem […]
发布时间:2025-08-27 19:44 来源:szf -
kimi-k2-turbo 模型提速至每秒60 Tokens
快速阅读: Moonshot AI宣布Kimi K2模型输出速度大幅提升,最高达每秒100个Tokens,优化用户体验,满足高效需求。目前享受5折优惠,持续至9月1日。 8月22日,Moonshot AI 宣布 Kimi K2 模型的输出速 […]
发布时间:2025-08-24 06:18 来源:szf -
kimi-k2-turbo模型提速至每秒60 Tokens
快速阅读: Moonshot AI宣布Kimi K2模型输出速度大幅提升至每秒60至100个Tokens,优化用户体验,满足高效需求。目前享5折优惠,每百万Tokens输入价格2.00元(缓存命中),8.00元(缓存未命中),输出32.00 […]
发布时间:2025-08-23 22:44 来源:szf -
Kimi-K2-Turbo 模型提速至每秒 60 Tokens
快速阅读: Moonshot AI宣布Kimi K2模型输出速度大幅提升至每秒60至100个Tokens,优化用户体验,满足高效需求。当前特惠5折,优惠至9月1日。 8月22日,Moonshot AI 宣布 Kimi K2 模型的输出速度再 […]
发布时间:2025-08-23 15:09 来源:szf -
金顶资金能否助新一代拦截器提速?
快速阅读: 4月12日,美国阿拉巴马州亨茨维尔,洛克希德·马丁公司副总裁莎拉·里夫斯表示,公司正寻求加速下一代拦截器项目,以应对洲际弹道导弹威胁,尽管项目面临延期。 4月12日,美国阿拉巴马州亨茨维尔,洛克希德·马丁公司副总裁莎拉·里夫斯表 […]
发布时间:2025-08-11 06:22 来源:szf -
金顶资金能否助力下一代拦截器提速?
快速阅读: 7月11日,美国亨茨维尔,洛克希德·马丁公司副总裁萨拉·里夫斯表示,公司正寻找方法加速下一代拦截器项目,以应对洲际弹道导弹威胁,项目因延迟需加快进度。 7月11日,美国阿拉巴马州亨茨维尔,洛克希德·马丁公司正在寻找加速下一代拦截 […]
发布时间:2025-08-08 08:04 来源:szf