标签: 语言模型
-
蚂蚁集团发布dInfer,加速扩散语言模型推理10倍
快速阅读: 蚂蚁集团开源dInfer框架,实现扩散语言模型推理速度大幅提升,比英伟达Fast-dLLM快10.7倍,有望推动AI技术广泛应用。 近日,蚂蚁集团正式开源了业内首个高性能扩散语言模型推理框架——dInfer。这一框架的推出,不仅 […]
发布时间:2025-10-13 20:46 来源:szf -
谷歌发布差分隐私语言模型VaultGemma,保护用户数据安全
快速阅读: 谷歌DeepMind推出开源语言模型VaultGemma,具备10亿参数和差分隐私技术,防止训练时泄露敏感信息,增强用户数据隐私保护,性能保守但安全性强,将在Hugging Face和Kaggle上公开。 谷歌 DeepMind […]
发布时间:2025-09-16 16:37 来源:szf -
阿里巴巴推出超万亿参数语言模型Qwen3-Max-Preview
快速阅读: 阿里巴巴发布Qwen3-Max-Preview,超一万亿参数,性能优于前代,在知识理解、对话、任务处理等方面显著提升,定价每百万输入令牌2,151美元,输出令牌8,602美元,不支持图像处理。 近日,阿里巴巴推出迄今为止最大的语 […]
发布时间:2025-09-08 12:42 来源:szf -
NVIDIA推出Jet-Nemotron,混合架构语言模型提速53倍,节省98%推理成本
快速阅读: NVIDIA 发布 Jet-Nemotron 语言模型,采用 PostNAS 技术,生成速度提升 53.6 倍,推理成本降低 98%,显著提高边缘设备部署效率,为企业和研究者带来成本和性能双重优势。 NVIDIA 研究团队近日发 […]
发布时间:2025-08-28 22:08 来源:szf -
NVIDIA推出Jet-Nemotron,53倍提速语言模型推理成本节省98%
快速阅读: NVIDIA 发布 Jet-Nemotron 语言模型,生成速度提升53.6倍,推理成本降低98%,采用 PostNAS 技术改造现有模型,保持高准确性,适用于边缘设备,为企业和研究者带来成本和性能双重收益。 NVIDIA 研究 […]
发布时间:2025-08-28 07:42 来源:szf -
NVIDIA推出Jet-Nemotron,混合架构语言模型提速53倍节省98%推理成本
快速阅读: NVIDIA发布Jet-Nemotron语言模型,生成速度提升53.6倍,推理成本降低98%,通过PostNAS技术改造现有模型,保持高准确性,适用于边缘设备。 NVIDIA 研究团队近日发布了 Jet-Nemotron,这是一 […]
发布时间:2025-08-28 02:11 来源:szf -
Anthropic推出个性向量技术,语言模型行为控制获新突破
快速阅读: 近日,Anthropic推出个性向量技术,用于监控和控制大型语言模型的特定个性特征,如“邪恶”、“阿谀奉承”等,旨在预防不良行为,提高模型安全性。该技术可在训练阶段和后期使用,但可能影响模型智能水平。 Anthropic 普近日 […]
发布时间:2025-08-04 11:08 来源:szf