深寻工程师用汇编优化AI模型,挑战传统认知
快速阅读: 汇编语言在现代编程中地位下降,但DeepSeek利用其优化AI模型,通过低精度数据压缩提高效率,展示了人类与硬件沟通的新方式。
确实,如今在日常编程工作中使用汇编语言已经没有太大意义。高级语言效率如此之高,其抽象层次几乎总是更优。即使是汇编语言的发明者也转向了其他领域;布斯在20世纪90年代的最后一篇论文中,使用神经网络来匹配海豹与其叫声。索耶也转行了。他最近一直在研究家庭自动化——灯光、温度传感器、音响系统等,使用Python在树莓派上编写代码,尽管他最初觉得“相当难以接受”。但在那个小小的处理器上,Python依然能很好地完成工作。
随后,像DeepSeek这样的技术再次提醒我们,人类仍然能够更好地与硬件沟通。今年早些时候,这家中国公司推出的高效AI模型颠覆了AI进步只能依赖更多芯片和更多能源的论调。其中一个令人惊讶的原因是汇编语言。DeepSeek的工程师深入到了英伟达芯片的底层,精确地控制每个机器单元将数据从32位压缩到8位——牺牲精度以换取效率。观察者们感到震惊。这竟然可以做到?DeepSeek的工程师们唤醒了一门大多数人都已遗忘的艺术。
2023年,当DeepMind的研究人员教会机器x86汇编语言,然后要求它改进C语言中长期存在的sort()函数时,我也同样感到震撼。AI做出了奇怪且不直观的选择,在寄存器之间进行了奇特的跳跃,最终节省了一个步骤。或许只是节省了几毫秒的一小部分时间。但随着新算法被正式采用,这一微小的进步每天都在无数次地发生。
对我来说,这是一个提醒:这些机器是我们人类创造的,即使它们似乎变得复杂到超出了我们的理解范围,它们仍然受我们指挥。我们可以让它们表现得更好。就像索耶在他最近的家庭自动化实验中所说的一样。可能是他的想象,但显示似乎有点卡顿。如果可以的话,他会重写代码。然而,索耶和机器并没有使用同一种汇编语言。
(以上内容均由Ai生成)