标签: 推理速度
-
蚂蚁数科发布新隐私保护AI算法,推理速度提升超100倍
快速阅读: 蚂蚁数科推出隐私保护AI训练框架Gibbon,提升数据隐私与计算效率,被ACM CCS和IEEE TDSC收录,应用场景广泛,涵盖金融、营销等行业,提供高安全、高性能的隐私计算解决方案。 近日,蚂蚁数科在全球信息安全领域引发关注 […]
发布时间:2025-09-26 15:55 来源:szf -
Ring-mini-2.0发布,性能超10B模型,推理速度突破500tokens
快速阅读: 今日推出Ring-mini-2.0,基于Ling-mini-2.0架构优化,总参数16B,实际仅需激活1.4B,推理能力媲美10B以下密集模型。支持128K长上下文,生成速度快,开源以促研究应用。 今天我们正式推出了Ring-m […]
发布时间:2025-09-18 19:49 来源:szf -
硅基流动上线Ling-flash-2.0,推理速度大幅提升
快速阅读: 硅基流动平台上线蚂蚁集团百灵团队开源的Ling-flash-2.0,拥有100亿参数,支持128K上下文长度,性能优于40亿参数Dense模型,新用户可获赠金体验。 近日,硅基流动大模型服务平台正式上线了蚂蚁集团百灵团队最新开源 […]
发布时间:2025-09-18 13:26 来源:szf -
阿里发布新模型,80亿参数仅用3亿,推理速度提升10倍
快速阅读: 阿里巴巴通义千问团队发布Qwen3-Next-80B-A3B-Instruct模型,总参数80亿,实际激活仅3亿,推理速度大幅提升,训练成本降低90%,支持多语言及代码生成,开源促进AI技术普及。 阿里巴巴通义千问团队刚刚向全球 […]
发布时间:2025-09-10 14:12 来源:szf -
层次推理模型HRM实现AI推理速度百倍提升
快速阅读: 新加坡初创公司Sapient Intelligence推出创新AI架构HRM,通过层次化设计在复杂推理任务中超越大型语言模型,数据需求和模型规模更低,推理速度提升100倍。 新加坡初创公司 Sapient Intelligenc […]
发布时间:2025-09-02 10:29 来源:szf -
阿里通义发布图生视频模型,推理速度显著提升
快速阅读: 7月11日,阿里云发布最新图生视频模型Wan2.2-12V-Flash,生成速度提升12倍,成本低至0.1元/秒,支持特效提示词和风格化图像动态效果,提升创作效率和视频质量。 阿里通义大模型今日宣布推出其 最新 图生视频模型Wa […]
发布时间:2025-08-12 09:47 来源:szf