标签: PyTorch
-
AI自动生成Metal内核,PyTorch推理提速87%
快速阅读: Gimlet Labs研究显示,AI自动生成的Metal内核使PyTorch在苹果设备上的推理速度提升87%,215个模块平均加速1.87倍,部分工作负载提速数百倍,验证了AI在硬件优化领域的潜力。 在苹果设备上,AI技术正展现 […]
发布时间:2025-09-05 10:49 来源:szf -
PyTorch 2.8发布:量化LLM推理性能飞跃,支持Intel GPU
快速阅读: 近日,PyTorch 发布 2.8 版本,大幅提升量化大语言模型在 Intel CPU 上的推理性能,首次支持 Intel GPU 分布式后端,优化算法提高推理速度,支持多种量化模式,增强 ROCm 支持,提供更强大的工具推动大 […]
发布时间:2025-08-08 19:55 来源:szf