标签: 大语言模型
-
Karpathy提出图像输入或成大语言模型新趋势
快速阅读: 特斯拉前自动驾驶负责人、OpenAI联合创始人Andrej Karpathy提出,图像输入比传统文本输入更高效,可提升信息压缩率、表达丰富性和注意力机制优化,引发AI研究社区广泛讨论。 特斯拉前自动驾驶负责人、OpenAI联合创 […]
发布时间:2025-10-21 15:58 来源:szf -
250份文件即可“洗脑”大语言模型,AI安全再受挑战
快速阅读: 来自Anthropic、英国AI安全研究所和艾伦・图灵研究所的研究显示,大语言模型对数据中毒攻击的抵抗力低,攻击者仅需插入250份污染文件即可植入“后门”。研究警示AI安全需加强。 在近期的一项联合研究中,来自 Anthropi […]
发布时间:2025-10-20 14:39 来源:szf -
谷歌推出Stax:助力开发者定制化评估大语言模型
快速阅读: 谷歌AI发布Stax工具,帮助开发者有效测试大语言模型,提供“快速比较”和“项目与数据集”功能,支持自定义评估器,提升模型评估的针对性和效率。 谷歌 AI 最近发布了一款名为 Stax 的实验性评估工具,旨在帮助开发者更有效地测 […]
发布时间:2025-09-03 16:29 来源:szf -
腾讯ARC发布AudioStory,大语言模型生成长音频
快速阅读: 腾讯ARC团队发布AudioStory模型,结合大语言模型和音频生成技术,生成连贯的长篇叙事音频,提升用户体验,已发布推理代码及应用案例。 近日,腾讯 ARC 团队发布了一款名为 AudioStory 的模型,旨在利用大语言模型 […]
发布时间:2025-09-01 11:14 来源:szf -
DeepSeek关联公司 发布大语言模型创新部署专利,推动 AI 技术新发展
快速阅读: 近日,杭州深度求索人工智能基础技术研究有限公司公开一项名为“一种大语言模型的部署方法及系统”的专利,创新性地将大语言模型的预填充和解码阶段分别部署在高性能计算和大内存机器上,提高系统性能,降低延迟,增强扩展性和容错性。 近日,D […]
发布时间:2025-08-01 16:24 来源:szf