台积电展示新一代C-HBM4E和N3P逻辑芯片
快速阅读: 台积电推出C-HBM4E高带宽内存堆栈与N3P工艺逻辑芯片,旨在提升AI和高性能计算的内存带宽与能效,减少能量浪费,支持灵活的芯片设计与高效热管理。
台积电展示了其在高带宽内存集成方面的下一步进展,推出了定制的C-HBM4E堆栈,搭配新的基于N3P工艺的逻辑芯片。公司显然将这些组件定位为下一代人工智能和高性能计算硬件的关键,其中内存带宽和能效越来越决定整体性能。台积电展示的不仅是更快的内存接口,还是一种更紧密的计算与内存之间的链接,旨在减少系统层面的能量浪费并提高吞吐量。
C-HBM4E是台积电对先进HBM连接技术的更新版本。其理念很简单:将内存和逻辑单元更紧密地结合在一起,缩小电气路径,减少通常会减慢数据传输的开销。随着更大的AI模型推动带宽极限,每一点效率都至关重要。台积电表示,这种设计可以实现大约两倍于早期方法的效率,主要是因为它减少了逻辑芯片与内存堆栈之间通信时的能量损失。
这些新的逻辑芯片基于N3P工艺,这是台积电3纳米技术的更新版本。N3P工艺经过优化,具有更高的密度和改进的晶体管效率,有助于降低切换功耗。对于AI加速器而言,数十甚至数百瓦的功率通过内存连接的逻辑部分流动,这一点非常重要。即使每个操作的能量消耗有微小的减少,在数千个计算引擎上也会大幅累积。
芯片灵活性是另一个重要的方面。厂商不再依赖单一的单片芯片,而是可以在一个封装中组合不同的计算芯片、I/O芯片和多个HBM4E堆栈。这种方法允许开发人员针对特定的工作负载定制产品,从AI训练模块到推理优化的加速器。借助2.5D中介层和3D堆叠等高级封装技术,台积电的平台支持低延迟的密集布局。
热管理也是一个实际问题。高带宽内存以最大速度运行时会产生大量热量。通过重新设计布局和逻辑接口,台积电旨在更有效地在整个封装中分布热量。更好的热性能使加速器能够在不触及过热阈值的情况下维持更高的性能水平,这是当今高功率AI系统中常见的挑战。
总体而言,性能不再是单纯依赖工艺节点的问题。封装、内存位置和芯片结构现在决定了处理器的数据移动能力。AI模型不断增长,其计算需求直接与内存能力相关。台积电的C-HBM4E + N3P组合正是为了应对这一趋势,为厂商提供一个现成的平台,最大限度地减少瓶颈并提高整体效率。
来源:
TrendForce
TechPowerUp
HardwareLUXX
(以上内容均由Ai生成)