语言模型 – 数智风暴

快速阅读: Meta与爱丁堡大学合作开发CRV技术，能预测并修复LLM推理错误，通过观察模型内部“推理电路”，提高AI可靠性，为未来模型调试奠定基础。近日,Meta 的人工智能研究团队与爱丁堡大学合作,开发了一种新技术,能够预测大型语言模 […]

快速阅读: 蚂蚁集团开源dInfer框架，实现扩散语言模型推理速度大幅提升，比英伟达Fast-dLLM快10.7倍，有望推动AI技术广泛应用。近日，蚂蚁集团正式开源了业内首个高性能扩散语言模型推理框架——dInfer。这一框架的推出，不仅 […]

快速阅读: 谷歌DeepMind推出开源语言模型VaultGemma，具备10亿参数和差分隐私技术，防止训练时泄露敏感信息，增强用户数据隐私保护，性能保守但安全性强，将在Hugging Face和Kaggle上公开。谷歌 DeepMind […]

快速阅读: 阿里巴巴发布Qwen3-Max-Preview，超一万亿参数，性能优于前代，在知识理解、对话、任务处理等方面显著提升，定价每百万输入令牌2,151美元，输出令牌8,602美元，不支持图像处理。近日，阿里巴巴推出迄今为止最大的语 […]

快速阅读: NVIDIA 发布 Jet-Nemotron 语言模型，采用 PostNAS 技术，生成速度提升 53.6 倍，推理成本降低 98%，显著提高边缘设备部署效率，为企业和研究者带来成本和性能双重优势。 NVIDIA 研究团队近日发 […]

快速阅读: NVIDIA 发布 Jet-Nemotron 语言模型，生成速度提升53.6倍，推理成本降低98%，采用 PostNAS 技术改造现有模型，保持高准确性，适用于边缘设备，为企业和研究者带来成本和性能双重收益。 NVIDIA 研究 […]

快速阅读: NVIDIA发布Jet-Nemotron语言模型，生成速度提升53.6倍，推理成本降低98%，通过PostNAS技术改造现有模型，保持高准确性，适用于边缘设备。 NVIDIA 研究团队近日发布了 Jet-Nemotron，这是一 […]

快速阅读: 近日，Anthropic推出个性向量技术，用于监控和控制大型语言模型的特定个性特征，如“邪恶”、“阿谀奉承”等，旨在预防不良行为，提高模型安全性。该技术可在训练阶段和后期使用，但可能影响模型智能水平。 Anthropic 普近日 […]