IBM正在借助与Synopsys合作开发的热建模技术,向1.4nm节点迈进,并得到了美国军方研究机构DARPA的支持。该公司表示,将与芯片制造商合作伙伴分享这项技术,以支持2nm节点的扩展。TSMC和其他芯片制造商如三星去年已开始2nm制造。
IBM在2021年率先宣布了世界上首款2nm芯片,这是其在芯片制造领域的重大突破。尽管IBM几十年前退出了商业芯片制造,但其仍然凭借先进的技术栈(包括制造和先进封装)在行业中占据重要地位。
作为最新努力的一部分,IBM研究部门与Ansys(现为Synopsys的一部分)合作开发了一种新的机器学习(ML)工具,该项目由美国DARPA(国防高级研究计划局)资助。IBM在DARPA的Thermonat项目下公布了这一成果,该项目旨在对纳米级晶体管进行热设计。IBM对芯片的热行为进行了原子级别的建模。
随着晶体管节点缩小,热量问题变得愈发严重。AI正推动芯片功率密度增加并产生更多热量。IBM表示,它利用半导体数据训练了该ML软件,实现了1摄氏度内的预测精度,比现有最佳模拟工具快数万倍。
www.eic.net.cn
IBM的研究人员表示,采用这种技术的芯片将在本次2nm节点技术周期中出现。这将成为1.4nm节点及以下性能的直接需求。数据中心和高性能应用(如AI)是首批应用领域,但手机也将紧随其后。
易IC库存管理软件
为了准确建模芯片中的热源,工程师可以利用这一强大的工具来设计新芯片的冷却系统。根据IBM研究部门的子系统冷却和集成专家Timothy Chainer的说法,“在设计芯片布局时,他们可以生成热感知布局。”
DARPA需要一个能够以1%的误差率预测热特性的模型。美国机构希望找到比当前最先进的技术快100倍的解决方案——建立一个新设备的物理模型以收集热数据。Robison和他的同事能够在实验数据1摄氏度范围内进行建模,并且比现有方法快50,000倍。
“Thermonat团队推动了芯片级热预测的可能边界,”DARPA的Thermonat项目主管Yogendra Joshi在一份新闻稿中说道。“通过将基础物理与设计就绪工具相结合,他们创造了能够加速国家安全应用和更广泛的半导体行业创新的能力。”
芯片制造商需要工具来预测热驱动故障,而不是在制造投资数年和数亿美元后才发现问题。然而,现有的商业建模工具尚未能完全捕捉纳米级热流,而新兴的原子级方法虽然准确,但通常需要数周或数月才能运行,使其在实际设计周期中不可行,DARPA在一份新闻稿中指出。
对于今天的半导体而言,热优化设计与非热优化设计之间的性能差异在5%至15%之间。Robison补充道,从开发角度来看,该技术需要考虑整个“客户端”应用的热性能,包括电路设计和使用案例。从设计/使用角度来看,热行为是潜在性能/余量的一大限制因素,拥有更好的热反馈是一种改进,Robison说。
IBM正在使用这种方法来考虑整体3D-IC芯片的应用场景。
“由于速度和能力,我们可以像处理普通芯片一样对整个3D-IC示例进行建模,只是运行时间稍长一些,”Robison说。“目前的热知识正朝着IBM的芯片小片和先进封装技术以及组装设计套件方向发展。”
IBM没有透露将与哪些芯片制造商分享这项技术。该公司正在与日本初创晶圆代工厂Rapidus合作,以在2027年开始生产2nm节点。去年8月,Rapidus开始在其新设施中原型设计2nm环绕栅极(GAA)晶体管,这是2027年启动生产的一步。IBM还使用三星作为晶圆代工供应商。
大多数新发展将保留在内部,用于IBM项目和IBM客户的项目。一支负责晶体管的团队正在采用这项技术,另一支则在开发未来的3D-IC设备。IBM还将使用该技术进行芯片封装和异构集成。
Ansys,现为Synopsys的一部分,与IBM在Thermonat项目中贡献了两项关键技术,Synopsys资深研究员Norman Chang告诉EE Times。
“第一项是减少阶次建模方法,可用于快速计算2nm GAA晶体管设计的自加热情况,”Chang说。“第二项是基于机器学习的热求解器,采用按块激活的方法结合傅里叶神经算子建模,可实现高达1000倍的速度提升,而不会牺牲准确性。我们的意图是继续完善这两种技术,并扩大其功能以供未来发布。”
一种称为傅里叶神经算子的机器学习技术,采用了神经网络训练格式,有助于减少阶次建模(ROM)的发展。傅里叶神经算子特别适用于解决偏微分方程矩阵的机器学习,因此非常适合这一场景,Robison说。
ROM是一个复杂、高保真数学模型的简化版本,创建目的是降低计算成本,同时保留基本行为,从而实现更快的分析和实时模拟,其中完整模型过于缓慢或资源密集。ROM在一定程度上牺牲了一些准确性,以获得巨大的速度提升,使复杂的工程问题更容易处理。
该工具可以帮助提高芯片的性能,Chainer说。改进的冷却解决方案可以让芯片在相同的运行温度下提供更高的功率,从而提高计算性能。或者,更有效的冷却解决方案可以降低芯片运行温度,从而减少芯片功耗并提高效率。
Synopsys正在评估新的自加热ROM和快速机器学习热求解器。
“基于机器学习的求解器支持数字和模拟电路中的静态和瞬态工作负载,可实现1000倍或更大的速度提升,”Chang说。“这是Synopsys如何应用机器学习和人工智能来加速设计流程所有阶段的另一个例子。我们期待在DesignCon 2026上分享更多相关内容。”