标签: 开源
-
DeepSeek开源新模型,实现高效视觉文本压缩
快速阅读: DeepSeek开源DeepSeek-OCR新模型,通过光学2D映射压缩长上下文,首次实现此技术。模型由DeepEncoder和DeepSeek3B-MoE-A570M组成,可在高分辨率下保持低激活状态,大幅减少计算成本,受到业 […]
发布时间:2025-10-21 23:53 来源:szf -
LLaVA-OneVision-1.5开源,多模态模型新突破
快速阅读: 开源社区推出LLaVA-OneVision-1.5,多模态模型支持图像、视频输入,训练分三阶段,提升视觉语言理解,性能优异超越Qwen2.5-VL。 近日,开源社区推出了LLaVA-OneVision-1.5,这是一款全新的多模 […]
发布时间:2025-10-17 12:49 来源:szf -
腾讯开源Youtu-Embedding,提升企业智能服务效率
快速阅读: 腾讯优图实验室开源 Youtu-Embedding 模型,提升企业级智能客服和知识库管理效率,解决特定领域误导性生成问题,采用3万亿 Token 语料训练,支持多任务和弱监督训练,适用于智能问答、内容推荐等场景。 近日,腾讯优图 […]
发布时间:2025-10-14 19:20 来源:szf -
蚂蚁发布万亿参数思考模型Ring-1T,开源刷新SOTA
快速阅读: 蚂蚁集团推出万亿参数思考模型Ring-1T,开源模型权重及训练配方,强化自然语言推理与通用能力,解决IMO难题,表现优异,采用“棒冰”算法优化训练稳定性。 10月14日凌晨,蚂蚁集团正式推出了万亿参数思考模型Ring-1T,并全 […]
发布时间:2025-10-14 16:39 来源:szf -
Radical Numerics开源30B参数RND1,AI自我进化关键一步
快速阅读: AI研究机构Radical Numerics发布RND1-Base,最大规模开源扩散语言模型,参数30B,活跃3B,采用稀疏专家混合架构,显著提升推理效率和生成灵活性,开源权重和代码,推动扩散模型研究。 AI模型架构正经历深刻变 […]
发布时间:2025-10-13 20:48 来源:szf -
首次超越自回归模型!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
快速阅读: 蚂蚁集团开源dInfer框架,大幅提升扩散语言模型推理速度,超过英伟达Fast-dLLM 10.7倍。dInfer优化KV缓存管理等,促进AI高效应用。 10月13日,蚂蚁集团正式开源了业界首个高性能扩散语言模型推理框架dInf […]
发布时间:2025-10-13 17:25 来源:szf -
快手开源72B代码模型,登顶SWE-Bench刷新记录
快速阅读: 快手Kwaipilot团队正式开源720亿参数的KAT-Dev-72B-Exp模型,该模型在SWE-Bench Verified测试中以74.6%的准确率登顶,展现国产AI在编程助手领域的重大突破。 国产AI在代码生成领域取得了 […]
发布时间:2025-10-11 13:51 来源:szf -
寒武纪适配DeepSeek-V3.2-Exp,开源大模型推理引擎
快速阅读: 寒武纪成功适配DeepSeek-V3.2-Exp模型并开源vLLM-MLU源代码,提升AI计算效率,降低训练成本,为开发者提供强大支持,推动AI技术发展。 寒武纪宣布成功适配最新发布的 DeepSeek-V3.2-Exp 模型, […]
发布时间:2025-09-30 10:11 来源:szf -
蚂蚁百灵开源高性能思考模型Ring-flash-2.0,推理能力大幅提升
快速阅读: 蚂蚁百灵团队开源Ring-flash-2.0模型,总参数量100亿,每次推理激活6.1亿参数,性能超越40亿参数模型,支持数学竞赛、代码生成及逻辑推理,采用两阶段强化学习训练,模型权重及数据配方全开源。 近日,蚂蚁百灵大模型团队 […]
发布时间:2025-09-29 20:34 来源:szf -
开源!腾讯混元图像3.0正式上线,支持中英文精准渲染、长文本生成
快速阅读: 腾讯发布混元图像3.0,首个商用级原生多模态生图模型,参数80亿,支持文字、图片、视频、音频多形式处理,语义理解和图像生成能力显著提升,大幅提高创作效率,模型已开源。 腾讯宣布正式发布混元图像3.0,这是业界首个开源的商用级原生 […]
发布时间:2025-09-28 16:09 来源:szf -
腾讯开源混元图像3.0,参数达80B创工业级新高
快速阅读: 腾讯发布开源多模态图像生成模型“混元图像3.0”,参数规模达80B,能解析复杂语义生成长文本图像,提升创作体验与AI领域可能性。 腾讯混元推出并开源其 最新 的多模态图像生成模型 ——“混元图像3.0”(HunyuanImage […]
发布时间:2025-09-28 13:24 来源:szf -
阿里开源Wan-Animate,AI视频创作门槛大降
快速阅读: 阿里巴巴Wan团队开源Wan2.2-Animate-14B模型,解决角色动画生成与替换难题,支持高精度表情动作迁移及环境融合,降低视频创作门槛,模型已上线Hugging Face平台。 阿里巴巴旗下Wan团队正式开源Wan2.2 […]
发布时间:2025-09-22 18:04 来源:szf