开源 – 数智风暴

快速阅读: 据最新消息，美团LongCat团队开源发布60亿参数的LongCat-Image图像生成模型，在文生图、中文文字渲染及图像编辑方面表现突出，支持海报设计等专业场景，用户可通过Hugging Face和GitHub获取。近日，美 […]

快速阅读: 马斯克透露X平台进展迅速，计划下月开源全部代码。新算法由Grok运行，提升内容质量和科技行业帖子数量，未来将更开放有用。 IT之家 12 月 6 日消息,北京时间今天凌晨,马斯克在 X 平台发文透露,X 在向人们展示“引人入胜的 […]

快速阅读: 微软开源VibeVoice-Realtime-0.5B，全球延迟最低的TTS模型之一，支持4角色对话，情感感知自动调整情绪，中英文混读流畅，设计轻量，适配普通笔记本，已在HuggingFace和GitHub开源。微软悄然开源了 […]

快速阅读: 美国Arcee AI推出Trinity系列模型，包括Trinity Mini和Nano，采用AFMoE架构，提升推理能力和长文本处理效率，目标重塑美国开源AI格局，计划2026年推出更大规模的Trinity Large模型。近 […]

快速阅读: 商汤科技与南洋理工大学S-Lab联合发布NEO，实现视觉与语言深层统一，数据效率极高，仅需3.9亿图像文本示例，性能超越Qwen2-VL等模型，多项评测中表现优异。商汤科技与南洋理工大学S-Lab联合发布并开源了全新的多模态模 […]

快速阅读: vLLM团队发布首个“全模态”推理框架vLLM-Omni，支持文本、图像、音频、视频的统一生成，采用解耦流水线架构，性能提升显著，开源代码已上线GitHub。 vLLM团队发布了首个“全模态”推理框架vLLM-Omni，将文本、 […]

快速阅读: 研究表明，开源AI模型性能接近闭源模型，成本低84%，但市场占有率仅20%。企业因转换成本、品牌信任、安全性顾虑及监管要求偏好闭源模型，尽管开源模型可节省数百亿美元并提供更高透明度和可审计性。开源人工智能模型的表现通常与闭源选 […]

快速阅读: 阿里巴巴通义实验室开源Z-Image图像生成模型，参数仅6B，性能媲美20B参数模型。采用单流DiT架构，具备快速推理、基础开发、图像编辑三大变体，支持中英双语文字渲染，显存占用低，适配消费级显卡。近日，阿里巴巴通义实验室重磅 […]

快速阅读: 黑森林实验室公开Flux.2代码及权重，性能显著提升，成本极低，远超谷歌同类产品，引发广泛关注。 Flux.2支持多平台运行，实现高质量图像生成，对预算有限用户尤为有利。凌晨一点，黑森林实验室的GitHub仓库Star数开始猛 […]

快速阅读: Black Forest Labs发布FLUX.2系列四款模型，包括pro、flex、dev和klein，其中dev已开源。核心升级包括十图参考、4MP编辑、高精度文本渲染和现实逻辑优化，显著提升图像生成质量。 Black Fo […]

快速阅读: 腾讯混元11月25日宣布开源HunyuanOCR模型，参数量10亿，性能优越，支持多语种翻译，广泛应用于文档解析、票据处理等领域，提供高效轻量解决方案。 11月25日，腾讯混元正式宣布开源全新的OCR模型HunyuanOCR。该 […]

快速阅读: 小米发布MiMo-Embodied模型，实现自动驾驶与具身智能跨域融合，性能全面领先，计划应用于扫地机器人、AGV及智能驾驶系统，2026年一季度起OTA更新推送，开放API促进跨域智能发展。 2025年11月21日，小米正式发 […]