推理速度 – 数智风暴

快速阅读: 蚂蚁数科推出隐私保护AI训练框架Gibbon，提升数据隐私与计算效率，被ACM CCS和IEEE TDSC收录，应用场景广泛，涵盖金融、营销等行业，提供高安全、高性能的隐私计算解决方案。近日,蚂蚁数科在全球信息安全领域引发关注 […]

快速阅读: 今日推出Ring-mini-2.0，基于Ling-mini-2.0架构优化，总参数16B，实际仅需激活1.4B，推理能力媲美10B以下密集模型。支持128K长上下文，生成速度快，开源以促研究应用。今天我们正式推出了Ring-m […]

快速阅读: 硅基流动平台上线蚂蚁集团百灵团队开源的Ling-flash-2.0，拥有100亿参数，支持128K上下文长度，性能优于40亿参数Dense模型，新用户可获赠金体验。近日，硅基流动大模型服务平台正式上线了蚂蚁集团百灵团队最新开源 […]

快速阅读: 阿里巴巴通义千问团队发布Qwen3-Next-80B-A3B-Instruct模型，总参数80亿，实际激活仅3亿，推理速度大幅提升，训练成本降低90%，支持多语言及代码生成，开源促进AI技术普及。阿里巴巴通义千问团队刚刚向全球 […]

快速阅读: 新加坡初创公司Sapient Intelligence推出创新AI架构HRM，通过层次化设计在复杂推理任务中超越大型语言模型，数据需求和模型规模更低，推理速度提升100倍。新加坡初创公司 Sapient Intelligenc […]

快速阅读: 7月11日，阿里云发布最新图生视频模型Wan2.2-12V-Flash，生成速度提升12倍，成本低至0.1元/秒，支持特效提示词和风格化图像动态效果，提升创作效率和视频质量。阿里通义大模型今日宣布推出其最新图生视频模型Wa […]