Chiplet技术对AI芯片的影响:性能、成本与生态的重构
一、引言:AI芯片的瓶颈与Chiplet的崛起
随着生成式AI(如GPT-4、Claude 3)的爆发,AI芯片的**算力、存力(内存容量与带宽)、运力(数据传输效率)
成为制约模型训练与推理的核心瓶颈。传统系统级芯片(SoC)通过
先进制程(如5nm、3nm)**提升性能,但面临三大痛点:
制程成本指数级增长
:5nm制程成本较7nm高50%,3nm制程成本再提升30%(Yole,2024);
良率下降
:3nm晶圆良率约50%,全尺寸SoC(如英伟达H100)的良率进一步降低至40%以下;
内存带宽瓶颈
:AI大模型(如GPT-3)的训练需要算力与内存带宽匹配,但传统SoC的DDR接口无法满足高带宽需求(如A100的HBM2E带宽仅2039GB/s)。
Chiplet(小芯片)技术通过
模块化设计
,将不同功能的小芯片(如计算核心、内存、IO)通过**先进封装(如2.5D/3D CoWoS、InFO)**集成,成为解决AI芯片瓶颈的关键路径。其核心逻辑是:
用“先进封装+模块化”替代“单一制程+全集成”
,实现性能提升与成本优化的平衡。
二、性能提升:模块化整合突破算力与带宽限制
Chiplet技术的核心优势在于
按需整合高性能模块
,通过先进封装实现模块间的高速互连,突破传统SoC的性能边界。
1. 算力提升:多核心Chiplet的并行计算
传统SoC的计算核心数量受限于晶圆面积与良率(如5nm SoC的核心数量通常不超过64个),而Chiplet通过整合
多个计算核心小芯片(如AMD的CCD,Compute Cache Die)
,实现更大规模的并行计算。例如:
AMD MI300X
:采用Chiplet设计,整合8个CCD(每个含8个Zen 4核心)和
6个MCD(Memory Cache Die),FP32算力达到128 TFLOPS
,较上一代MI250X(64 TFLOPS)提升100%;
英伟达B100(2025年推出)
:将采用Chiplet设计,整合4个计算核心小芯片
,FP32算力预计达到256 TFLOPS
,较H100(66.9 TFLOPS)提升2.8倍。
2. 带宽突破:内存与计算核心的紧密集成
AI大模型的训练需要
算力与内存带宽匹配
(如GPT-4的训练需要每TFLOPS算力对应至少50GB/s带宽),而Chiplet通过**2.5D封装(如CoWoS-S工艺)**将HBM(高带宽内存)与计算核心直接连接,大幅提升内存带宽。例如:
英伟达H100
:搭载80GB HBM3,通过CoWoS-S工艺与计算核心集成,内存带宽达到3.35 TB/s
,较A100(2039GB/s)提升1.5倍;
AMD MI300X
:搭载192GB HBM3,通过2.5D封装与计算核心集成,内存带宽达到5.2 TB/s
,较H100提升55%,更好地满足了大模型训练的存力需求(如GPT-4的训练需要每TFLOPS算力对应60GB/s带宽)。
3. 互连效率:先进封装的高速通信
Chiplet之间的互连依赖于
硅中介层(Si Interposer)或
混合键合(Hybrid Bonding),实现低延迟、高带宽的通信。例如:
UCIe 2.0协议(2024年发布)
:支持16Gbps per lane
的速率,较PCIe 5.0(32Gbps per lane,但延迟更高)实现更紧密的模块间通信(延迟降低30%);
台积电CoWoS工艺
:通过硅中介层将计算核心与HBM连接,模块间延迟仅1ns
(传统PCB连接延迟约10ns),大幅提升数据传输效率。
三、成本优化:不同制程的模块化成本分摊
传统SoC采用
单一先进制程
,面临
制程成本高
与
良率低
的双重压力。Chiplet通过
不同制程的模块化分摊
,降低整体成本。
1. 制程成本:先进制程用于核心模块,成熟制程用于辅助模块
Chiplet将
计算核心
(对性能敏感)采用先进制程(如5nm),
内存、IO
(对性能不敏感)采用成熟制程(如14nm、28nm),减少先进制程的使用面积。例如,假设一个AI芯片需要1000mm²的晶圆面积:
传统SoC
:全部采用5nm制程,成本约18750美元
(5nm晶圆价格1.5万美元,良率60%);
Chiplet
:计算核心(200mm²,5nm)+ 内存(600mm²,14nm)+ IO(200mm²,28nm),总成本约9375美元
(14nm晶圆价格5000美元,良率80%;28nm晶圆价格3000美元,良率90%)。
根据Yole(2024)的报告,Chiplet设计较传统SoC
降低30%-50%的成本
,主要得益于成熟制程的成本优势(如14nm制程成本仅为5nm的1/3)。
2. 良率提升:小芯片的高良率优势
小芯片的晶圆面积更小(如AMD的CCD面积约200mm²),良率更高(如5nm小芯片良率约70%,而全尺寸SoC良率约40%)。例如:
英伟达H100
:全尺寸SoC面积约800mm²,良率约40%,每晶圆可生产约50颗
(8英寸晶圆面积约5000mm²);
英伟达B100(Chiplet)
:计算核心小芯片面积约400mm²,良率约70%,每晶圆可生产约87颗
(计算核心)+ 内存小芯片(600mm²,14nm,良率80%,每晶圆可生产约8颗
),整体良率提升至60%
,减少了晶圆浪费。
四、供应链韧性:灵活产能分配与风险分散
Chiplet技术改变了AI芯片的供应链结构,降低了对
单一先进制程
和
单一晶圆厂
的依赖,提升了供应链韧性。
1. 产能灵活分配:先进制程与成熟制程的组合
传统SoC需要大量
先进制程产能
(如台积电5nm),而Chiplet可以将部分模块(如内存、IO)转移至
成熟制程
,减少对先进制程的需求。例如:
英伟达B100
:计算核心采用台积电3nm制程,内存采用三星14nm制程,IO采用英特尔28nm制程,灵活分配产能,缓解先进制程产能紧张的问题(2024年台积电3nm产能仅占总产能的5%)。
2. 供应链分散:多厂商参与的模块化供应
Chiplet技术让
第三方厂商
可以参与AI芯片的研发与生产,例如:
内存厂商
:美光、三星生产符合UCIe标准的HBM Chiplet;
IO厂商
:博通、美满电子生产高速IO Chiplet;
封测厂商
:台积电、长电科技提供先进封装服务(如CoWoS、InFO)。
这种分散的供应链结构降低了AI芯片厂商(如英伟达、AMD)对单一供应商的依赖,减少了
地缘政治
(如美国对中国的芯片限制)与
产能短缺
(如台积电5nm产能紧张)的风险。
五、生态构建:UCIe协议与第三方Chiplet的崛起
Chiplet生态的核心是
统一互连标准
,UCIe(Universal Chiplet Interconnect Express)协议的推出,让不同厂商的Chiplet可以互相兼容,加速了生态的形成。
1. UCIe协议的进展:从1.0到2.0
2023年,UCIe 1.0发布,支持
8Gbps per lane
的速率,实现Chiplet间的基本通信;2024年,UCIe 2.0发布,提升至
16Gbps per lane
,支持
3D堆叠
与
低延迟通信
,满足AI芯片的高速互连需求。目前,
英伟达、AMD、英特尔、台积电
等厂商均加入UCIe联盟,推动协议的普及。
2. 第三方Chiplet的崛起
UCIe协议让第三方厂商可以生产符合标准的Chiplet,例如:
第三方Chiplet的崛起降低了AI芯片的研发门槛,让
小厂商
也能参与AI芯片的研发(如通过整合第三方计算核心、内存Chiplet,生产定制化AI芯片),推动AI芯片市场进入
模块化、生态化
的新阶段。
六、市场影响:AI芯片市场的格局重构
Chiplet技术的普及将改变AI芯片市场的格局,
英伟达的垄断地位面临挑战
,
AMD、英特尔等厂商通过Chiplet技术抢占市场份额
,而
封测厂商
将成为Chiplet生态的关键参与者。
1. 市场份额变化:AMD的崛起
2024年,英伟达占AI芯片市场的
60%
(主要来自H100的销售),AMD占
20%
,英特尔占
10%
,其他厂商占
10%
(IDC,2024)。AMD通过
MI300X的Chiplet设计
,性能接近英伟达H100(FP32算力128 TFLOPS vs 66.9 TFLOPS),但成本更低(约8000美元 vs 15000美元),抢占了数据中心AI芯片的市场份额(2024年市场份额较2023年增长5个百分点)。
2. 先进封装市场增长:Chiplet的需求驱动
Chiplet需要大量的
先进封装产能
(如2.5D/3D CoWoS、InFO),推动先进封装市场的增长。根据Yole(2024)的预测:
- 2025年,先进封装市场规模将达到
786亿美元
,占全球封装市场的50%
;
- 2.5D/3D封装增速最快(2021-2027年CAGR达14.34%),主要由AI芯片的需求驱动(如英伟达H100的CoWoS封装需求占台积电CoWoS产能的60%)。
例如,台积电2025年第一季度
先进封装业务收入
同比增长
35%
,占总营收的
20%
,主要来自英伟达、AMD的Chiplet订单。
七、结论:Chiplet成为AI芯片的未来方向
Chiplet技术通过
模块化设计
、
先进封装
、
统一互连标准
,解决了传统SoC的
性能、成本、供应链
问题,成为AI芯片的核心技术路径。未来,随着UCIe协议的普及、第三方Chiplet的崛起,AI芯片市场将进入
模块化、生态化
的新阶段:
英伟达
:将面临AMD、英特尔的挑战,需通过Chiplet技术(如B100)维持领先;
AMD、英特尔
:通过Chiplet技术抢占市场份额,成为AI芯片市场的重要玩家;
封测厂商
:台积电、长电科技将成为Chiplet生态的关键参与者,其先进封装产能将决定AI芯片的供应能力。
对于投资者而言,Chiplet技术带来的投资机会主要集中在
先进封装厂商
(如台积电、长电科技)、
Chiplet互连厂商
(如博通、美满电子)、
第三方Chiplet厂商
(如美光、长江存储)。