保持芯片冷却的科学:热芯片,酷炫技巧

发布时间:2025年4月28日    来源:szf
保持芯片冷却的科学:热芯片,酷炫技巧

快速阅读: 《技术点》消息,本文探讨了电子设备发热的原因及冷却技术,包括被动和主动冷却、热管、液体冷却等,并强调了高效热管理在提升性能和延长设备寿命中的关键作用。

几乎所有现代电子设备都会产生热量,无论我们是否注意到。如果没有适当的热管理,我们的电子系统要么会自我损坏,要么相反地在计算能力上受到严重限制。平均的科技爱好者当然会想到CPU和GPU的散热问题,但为什么RAM通常不需要风扇来保持低温?为什么移动处理器和台式机处理器的性能之间存在如此巨大的差异,尽管它们的裸片大小相当相似?为什么来自新芯片世代的近期性能改进开始放缓?虽然晶体管数量继续增长,但我们越来越面临硅材料的物理和热极限。随着晶体管缩小,漏电流上升,并且每平方毫米产生的热量变得更难散发。近年来,行业已经转向先进的封装技术——如Chiplet、3D堆叠和中介层——以绕开这些限制,而不是强行突破它们。导致性能改进现在更多是关于聪明的架构、互连和热设计策略,而不仅仅是缩小晶体管。

为了正确回答这些问题,这些问题涉及热量以及计算机在纳米尺度上的工作原理,本文将介绍热量的基本科学知识,以及它如何以及为何在电子设备中产生,以及我们开发的各种控制方法。

### 热量的基础:能量如何在电子设备中传递

如果你还记得高中物理课,热量只是构成我们世界的原子和分子的随机运动。当一个分子比另一个分子具有更高的动能时,我们就说它更热。这种热量可以在物体接触时从一个物体传递到另一个物体,直到两者达到平衡。这意味着较热的物体将向较冷的物体传递一些热量,最终的结果是在两者之间的某个温度。热量传递所需的时间取决于所涉及材料的热导率。热导率衡量一种材料传导热量的能力。热导率像泡沫塑料这样的绝缘体的热导率相对较低,约为0.03,而像铜这样的导体的热导率较高,约为400。在两个极端情况下,真正的真空的热导率为0,而钻石的已知最高热导率超过2,000。

要记住的重要一点是,热量总是流向较冷的区域,但从技术上讲,没有“冷”这样的东西——我们只有在某物比周围环境热量少时才会感知到它是“冷”的。

另一个我们需要的关键定义是热质量,它代表一个物体对温度波动的惯性。使用相同大小的炉子,加热单个房间要比整个房子容易得多。这是因为单个房间的热质量比整个房子的小得多。

我们可以用简单的水沸腾的例子把这些概念结合起来。当你打开炉灶时,热火焰与较冷的锅接触。因为锅的材料是优良的热导体,火的热量被转移到水中直到水沸腾。沸腾所需的时间取决于加热方式、锅的材料和水量。如果你尝试用一个小打火机煮一锅水,它会花费很长时间,而使用炉灶的大火焰则快得多。这是因为炉灶的热输出远高于小打火机,以瓦特为单位测量。

如果你足够富有,一个钻石锅将是终极目标!最后,我们都知道一小锅水比一大锅水沸腾得快。这是因为较小的锅需要加热的质量较小。一旦你烹饪完毕,可以让水自然冷却下来。当这种情况发生时,水的热量释放到较冷的房间中。由于房间的热质量远大于锅的热质量,其温度不会改变太多。

### 芯片中的三大热源

现在我们了解了热量如何工作以及在物体之间如何传递,让我们谈谈它最初是从哪里来的。所有的数字电子设备都是由数百万甚至数十亿个晶体管组成的。要详细了解它们的工作原理,请查看我们关于现代CPU设计研究的第三部分。本质上,晶体管是电控开关器件,每秒可以开闭数十亿次。通过将它们连接在一起,我们可以形成复杂的计算机芯片结构。

当这些晶体管运行时,它们从三个来源散发功率:切换、短路和泄漏。

#### 切换功率

切换功率被认为是一种动态热源,因为它受晶体管开闭的影响。要打开或关闭晶体管,我们必须将其栅极设置为接地(逻辑0)或Vdd(逻辑1)。这不像简单地翻转开关那样简单,因为这个输入栅极有一定的电容。我们可以把它想象成一个微小的可充电电池。为了激活栅极,我们必须给电池充电到超过某个阈值水平。一旦我们准备再次关闭栅极,我们需要将那个电荷放电至地。尽管这些栅极是微观的,但在现代芯片中有数十亿个它们,而且它们每秒切换数十亿次。每次栅极电容放电至地时都会产生少量热量。要找到切换功率,我们将活动因子(每个周期内切换的晶体管平均比例)、频率、栅极电容和电压平方相乘。

#### 短路功率

现代数字电子设备采用了一种名为互补金属氧化物半导体(CMOS)的技术。晶体管的排列方式使得电流永远不会直接流向地面。在上述非门示例中,有两个互补的晶体管。每当上面的那个开启时,下面的那个就会关闭,反之亦然。这确保输出要么为0要么为1,并且与输入相反。

然而,当我们切换晶体管开和关时,会有非常短暂的时间两个晶体管同时导通。当一组正在关闭而另一组正在开启时,它们在达到中间点时都会导通。这是不可避免的,并提供了一个临时路径让电流直接流向地面。我们可以通过加快晶体管在开和关状态之间的转换速度来尝试限制这种情况,但无法完全消除它。要计算短路功率,需将短路电流、工作电压和开关频率相乘。这两种情况都是动态功率的例子。

若要减少动态功率,最简单的方法就是降低芯片的工作频率。但这通常不可行,因为这会降低芯片性能。另一个选择是降低芯片的工作电压。过去的芯片运行在5伏或更高电压上,而现代CPU大约在1伏左右运行。通过设计晶体管在较低电压下运行,我们可以减少通过动态功率损失的热量。动态功率也是CPU和GPU超频时变热的原因。你提高了操作频率,通常也提高了电压。这些值越高,每次循环产生的热量就越多。

#### 漏电功率

数字电子设备中产生的最后一类热量是漏电功率。我们喜欢认为晶体管要么完全开启要么完全关闭,但实际上并非如此。即使在晶体管处于非导通状态时,总会有一小部分电流流过。这是一个非常复杂的公式,而且随着我们继续缩小晶体管,这种效应只会变得更糟。当它们变得越来越小时,当我们要它们关闭时,阻挡电子流动的材料越来越少。这是新一代芯片性能受限的主要原因之一,因为每一代芯片的漏电功率比例都在不断增加。

### 冷却技术解释

所以我们知道电子设备中热量来自哪里——但我们能对它做些什么呢?我们需要摆脱它,因为如果温度过高,晶体管可能会开始分解并受到损坏。如果内部温度传感器检测到温度过高,芯片会自动降低其操作频率以减少热量的产生。然而,这不是你想要发生的事情,计算机系统中有更好的方法来处理多余的热量。

有些芯片实际上不需要复杂的冷却解决方案。看看你的主板周围,你会发现几十个没有散热器的小芯片。它们是如何不过热并自我毁灭的呢?原因是它们可能根本不会产生太多的热量。大型强大的CPU和GPU可以散发出数百瓦的功率,而一个小的网络或音频芯片可能只使用几分之一瓦。如果内部温度传感器检测到温度过高,芯片会自动降低其操作频率以减少热量的产生。然而,这不是你想要发生的事情,计算机系统中有更好的方法来处理多余的热量。

在这种情况下,主板本身或芯片的外包装可以作为一个足够的散热器来保持芯片冷却。然而,一般来说,一旦功率耗散超过约1瓦,你就需要开始考虑适当的热管理。

一块较老的主板,上面有许多没有散热器的小芯片——它们不需要主动冷却,因为它们产生的热量很少。

**被动冷却**用于北桥和南桥芯片,这些芯片覆盖有铝制散热器——在这种情况下,主板本身或芯片的外包装可以作为一个足够的散热器来保持芯片冷却。然而,一般来说,一旦功率耗散超过约1瓦,你就需要开始考虑适当的热管理。

来自我们的主板解剖特征

这里的关键是要尽可能降低材料之间的热阻。我们希望构建从芯片到环境空气最短且最高效的热传导路径。这就是为什么CPU和GPU裸片顶部带有集成热扩散器(IHS)。实际的硅芯片要比封装小得多,但通过将热量分散到更大的区域,我们可以更有效地冷却它。在芯片和冷却器之间使用良好的热界面材料也很重要。如果没有这条高导热路径,热量将很难从IHS传递到散热器。

**被动冷却**和**主动冷却**是两种主要的冷却形式:

– **被动冷却**使用简单的散热器附着在芯片上,依靠环境气流带走热量。材料将是具有高导热性和大面积的东西,以便能够高效地将热量从芯片传递到周围的空气中。
– **主动冷却**涉及使用风扇或其他方式强制空气流过散热器,使其能够处理数百瓦的热量。

然而,要充分利用如此大的散热能力,我们需要确保热量能从芯片高效地分布到整个散热器表面。如果没有有效的方式将热量传递到散热器,那么拥有一个大散热器就毫无意义。这就是液体冷却和热管发挥作用的地方。

**液体冷却**和**热管**都执行相同的基本任务:尽可能多地将热量从芯片转移到散热器或散热片上。在液体冷却系统中,热量通过高导热性的热界面材料从芯片传递到水块。水块通常由铜或其他高导电材料制成,然后加热液体。这种液体储存热量并将其带到散热器,在那里可以释放到空气中。

对于像笔记本电脑这样的小型系统,无法容纳完整的液体冷却装置,**热管**非常常见。与基本的铜管相比,热管装置在将热量从芯片转移出去方面可以提高10到100倍的效率。

### 鳍片和散热器

一旦达到几十瓦,你可能就会开始考虑主动散热。这涉及使用风扇或其他方式强制空气流过散热器,使其能够处理数百瓦的热量。然而,要充分利用如此大的散热能力,我们需要确保热量能从芯片高效地分布到整个散热器表面。如果没有有效的方式将热量传递到散热器,那么拥有一个大散热器就毫无意义。

**Xbox 360**使用了一个带有集成热管的散热器。热管通过相变冷却显著提高了热传导效率,比单独使用固体金属更有效地将热量从CPU或GPU等高温组件移走。

热管与液体冷却非常相似,但利用相变来增加热传导效率。在热管内部,液体受热时蒸发变成蒸汽。蒸汽沿管道流动,直到到达较冷的一端,凝结回液体。然后液体通过重力或毛细作用返回到热端。这种蒸发冷却的原理与你洗完澡或游完泳后感到凉爽的原因相同:液体在蒸发时吸收热量,并在凝结时释放热量。

散热器或散热片中的薄鳍片将热量分散到大面积表面上,使得风扇能够高效地带走热量。鳍片越薄,单位空间内可容纳的表面积就越多。然而,如果鳍片太薄,它们就不会与热管有足够的接触面积来有效将热量传递到鳍片上。这是一个微妙的平衡——这就是为什么在某些情况下,较大的散热器表现不如较小但更优化的散热器。

### 低于环境温度的冷却:先进和异国情调的冷却方式

到目前为止我们讨论的所有冷却方法都是通过简单地将热量从炽热的芯片转移到周围空气中实现的。这意味着芯片的温度永远不可能低于其所在房间的环境温度。如果我们想让芯片冷却到低于环境温度,或者需要冷却像整个数据中心这样庞大的东西,就需要应用一些额外的科学知识。这就是制冷机和热电冷却器登场的时候了。

**热电冷却**,又称珀耳帖设备,目前尚不普及,但有潜力变得非常重要。这些设备通过消耗电力将冷却板一侧的热量转移到另一侧。它们利用特殊热电材料,通过电势产生温差。当直流电通过设备时,热量从一侧被吸收并转移到另一侧,使“冷”侧的温度降到环境温度以下。目前,这些设备仍然局限于小众市场,因为它们需要大量的能量才能实现显著的冷却效果。然而,研究人员正在努力开发更高效的版本以供广泛使用。

正如状态变化可以传递热量一样,改变流体的压力也可以用来移动热量。这是冰箱、空调和其他大多数大型冷却系统背后的原理。在这些系统中,一种特殊的制冷剂在一个封闭的回路中循环,它首先以气态形式存在,然后被压缩,冷凝成液态,膨胀后又蒸发回气态。这个循环不断重复,在此过程中传递热量。尽管压缩机需要输入能量,但这种系统能使温度降至环境温度以下。这就是为什么即使在夏季最炎热的日子,数据中心和建筑物也能保持凉爽。

就电子设备而言,这类系统通常是二级冷却系统:首先,芯片的热量被排放到房间内,然后通过蒸汽压缩系统将房间内的热量排出室外。然而,极端超频者和性能爱好者可能会直接连接专用的制冷机到他们的CPU上,以获得额外的冷却性能。使用液氮或干冰等消耗品也可以实现临时的极端冷却方法。

### 为什么冷却比以往任何时候都更重要

所有电子设备都需要冷却,但冷却的形式多种多样。我们的目标是将芯片或系统的热量从高温转移到低温环境中。我们无法真正消除热量——我们只能将其转移到不会成为问题的地方。由于内部晶体管的运行方式,所有数字电子设备都会产生热量。如果不妥善管理这些热量,半导体材料会开始分解,损坏芯片并缩短其使用寿命。

热量是所有电子设计师的敌人,仍然是推动性能提升的关键限制因素之一。我们不能简单地增大CPU和GPU的尺寸,因为没有实际可行的方法来冷却如此强大的设备。你无法足够快地将热量排出。

所有电子设备都需要冷却,但冷却的形式多种样。我们的目标是将芯片或系统的热量从高温转移到低温环境中。我们无法真正消除热量——我们只能将其转移到不会成为问题的地方。随着计算需求的不断增加,高效管理热量变得愈发关键——不仅是在单个芯片层面,而且在整个数据中心、人工智能计算农场,甚至是未来的量子系统中也是如此。热创新现在已经成为扩展技术的核心。

希望你现在对保持电子设备冷却所需的全部科学知识有了更深的认识。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日