国产GPU四小龙突破英伟达CUDA生态壁垒的分析
解锁更多功能
登录后即可使用AI智能分析、深度投研报告等高级功能
关于我们:Ginlix AI 是由真实数据驱动的 AI 投资助手,将先进的人工智能与专业金融数据库相结合,提供可验证的、基于事实的答案。请使用下方的聊天框提出任何金融问题。
相关个股
根据最新市场数据和行业分析[1][2][3],我将为您系统分析国产GPU四小龙突破英伟达CUDA生态壁垒的可能性。
- 2024年上半年营收约7亿元,已超过去年全年但仍处亏损期
- 预计最早2027年实现合并报表盈利[1]
- 国内市场份额不足1%,但增量空间显著[1]
- 累计研发投入超43亿元人民币[3]
- 智算推理(曦思N系列)
- 训推一体/通用运算(曦云C系列)
- 图形渲染(曦彩G系列)[3]
- 2024年推训一体系列GPU板卡产品为主要收入来源(占比70%)
- 首款全国产通用GPU"曦云C600"已实现全流程国产供应链闭环
- 新一代训推一体芯片"曦云C600"预计2025年底进入风险量产[2]
- 产销率在2025年突破100%,预计最早2026年实现损益平衡[3]
CUDA(Compute Unified Device Architecture)是英伟达于2006年推出的并行计算平台和编程模型,已成为AI训练领域的
- 开发者粘性:全球AI开发者500万+,CUDA代码库积累超16年,迁移成本极高
- 软件栈完整性:从底层驱动、CUDA工具包到cuDNN、TensorRT等加速库,形成完整技术栈
- 行业应用深度:PyTorch、TensorFlow等主流框架深度优化,企业级应用已深度绑定
- 摩尔线程MUSA架构选择与CUDA生态兼容,降低开发者迁移成本[7]
- 这是一种务实策略:在无法短期内撼动CUDA生态时,选择"兼容+迁移"路径
- 华为昇腾的CANN架构选择完全自主路线
- 优势:不受制裁影响、长期自主可控
- 劣势:生态建设周期长、迁移成本高
- 中国企业开创性地将竞争维度提升至"系统级"竞争
- 通过架构和互联技术创新(如华为Atlas系列、阿里云磐久超节点服务器)
- 不追求在单卡上对标顶级GPU,而是通过高效互联成千上万颗国产芯片,形成超级计算机等级的统一算力底座[6]
| 技术类型 | 定义 | 代表产品 | 优势 | 劣势 |
|---|---|---|---|---|
GPU |
图形处理单元,兼顾图形渲染和通用计算 | 英伟达H100/A100、摩尔线程 | 通用性强、生态成熟 | 功耗高、成本高 |
GPGPU |
通用GPU,专注通用计算任务 | 沐曦曦云系列、燧原云燧系列 | 计算密度高、适用训练 | 缺乏图形渲染能力 |
ASIC |
专用集成电路,针对特定算法优化 | Google TPU、亚马逊Trainium 2、Meta MTIA | 能效极致、成本控制好 | 灵活性差、研发周期长 |
NPU |
神经网络处理器,专门针对神经网络 | 华为昇腾、寒武纪思元系列 | 推理能效高 | 训练能力弱 |
TPU |
张量处理单元,Google的ASIC | Google TPU v5 | 与TensorFlow深度优化 | 仅限Google云 |
DSA |
领域特定架构,介于通用和专用之间 | 华为昇腾、阿里含光800 | 平衡性能和灵活性 | 生态壁垒高 |
根据行业分析[6]:
- 2026年预测:ASIC整体出货量最快有望超越英伟达GPU
- 2027年预测:ASIC芯片出货量将突破千万颗大关,与GPU出货量平分秋色
- 推理场景占比:到2026年,推理计算将占AI总计算需求的70%以上
过去:GPU一家独大
现在:GPU训练 + ASIC推理混合架构
未来:多架构共存、场景化分工
中国AI芯片产业正走出一条
- 市场规模:中国AI芯片市场规模预计从2024年的1,425.37亿元激增至2029年的1.34万亿元,年均复合增长率53.7%
- 本土化率:预计到2027年,本土AI芯片渗透率将快速提升至55%左右
- 系统级创新:通过大规模集群互联,规避先进制程限制
- 十五五规划:明确提出大幅提高科技自立自强水平[1]
- 资金支持:中国据报考虑新的芯片行业资金支持,规模或高达5000亿元[2]
- 国产替代刚需:美国将摩尔线程、壁仞等列入"实体清单",切断先进芯片制造设备和技术通道,使国产替代从"可选项"变为"必选项"[1]
- 通过兼容CUDA生态,降低迁移门槛
- 聚焦特定垂直场景(推理、边缘计算)
- 提升国产供应链闭环能力
- 系统级集群能力形成规模
- 自主生态初步建立
- 在推理场景实现对国际厂商超越
- 在训练场景逐步逼近国际顶尖水平
- 形成中国自主的AI芯片生态体系
- 产销率突破:沐曦股份产销率在2025年突破100%[3]
- 量产能力:寒武纪计划2026年芯片产量提高两倍以上,交付50万件AI加速器[8]
- 客户认可:机构投资者热情高涨,量化私募在配售中占主导地位(九坤投资、幻方量化、灵均投资等)[1]
- 先进制程受限:美国制裁导致无法获得7nm以下先进制程
- 单卡性能差距:在单颗芯片绝对性能上暂时落后
- 软件生态薄弱:与CUDA相比,国产生态成熟度差距明显
- 盈利压力:四小龙均处于亏损期,需持续烧钱
- 估值过高:摩尔线程静态市销率高达123倍,高于行业平均111倍[1]
- 市场竞争激烈:不仅要对抗英伟达,还要面对华为昇腾、寒武纪等国内对手
- 开发者迁移意愿:开发者是否愿意学习新的编程模型
- 客户接受度:企业客户对国产芯片的稳定性和性能信心
- 国际市场准入:难以进入海外市场
- 中国AI芯片市场53.7%的年复合增长率提供巨大空间[6]
- 本土化率从低位快速提升(2027年目标55%)
- ASIC在推理场景的爆发性增长机遇
- 技术追赶需要时间和持续投入
- 生态建设非一日之功
- 地缘政治风险持续存在
- 通过兼容CUDA,在特定场景实现商业化落地
- 推理市场有望率先取得进展
- 在推理和边缘计算场景实现对国际厂商超越
- 系统级集群能力形成差异化优势
- 自主生态初步建立
- 形成与CUDA并存的第二生态体系
- 在中国市场实现对国际厂商的全面替代
- 逐步向海外市场拓展
当前国产算力卡赛道与30年前硅谷GPU百卡争鸣时代确实存在相似之处:
- 技术路线多元:GPU、ASIC、NPU等多种路线并存
- 资本热情高涨:IPO市场火热,投资者竞相追逐
- 洗牌在所难免:最终可能只有少数厂商胜出
- 当时的竞争主要是市场驱动,现在是"市场+地缘政治"双轮驱动
- 国产厂商面临更复杂的技术封锁和供应链限制
- 系统级创新成为差异化竞争的关键
国产GPU四小龙
- 持续研发投入:保持高研发费用率
- 生态建设:兼容与自主并行,短期降低迁移门槛,长期建立自主生态
- 场景聚焦:在推理、边缘计算等特定场景率先突破
- 系统级创新:通过大规模集群形成差异化优势
- 政策支持:充分利用国家政策和资金支持
- 关注具有明确技术路线和量产能力的厂商
- 重视商业化进展(产销率、订单量等指标)
- 警惕估值过高风险
- 长期看好,但短期波动难免
[1] Bloomberg - “中國GPU新貴摩爾線程散戶認購倍數創三年來之最” (https://hk.finance.yahoo.com/news/中國gpu新貴摩爾線程將在科創板亮相-散戶認購倍數創三年來之最-233148786.html)
[2] Yahoo Finance - “沐曦股份亮相科創板AMD光環及GPU四小龍標籤料為公司打開估值空間” (https://hk.finance.yahoo.com/news/沐曦股份亮相科創板-amd光環及gpu四小龍標籤料為公司打開估值空間-220000870.html)
[3] Yahoo Finance - “中國算力進入資本收割期!GPU四小龍衝刺上市沐曦股份17日登科創版” (https://hk.finance.yahoo.com/news/中國算力進入資本收割期-gpu四小龍衝刺上市-沐曦股份17日登科創版-010003148.html)
[4] Wall Street Journal - “中國GPU「四小龍」之一壁仞科技計劃通過香港IPO籌資至多6.23億美元” (https://cn.wsj.com/articles/中國gpu-四小龍-之一壁仞科技計劃通過香港ipo筹資至多6-23億美元-ed3cd68f)
[5] Yahoo Finance - “壁仞科技(06082)孖展暫超購逾230倍” (https://hk.finance.yahoo.com/news/財經-壁仞科技-06082-孖展暫超購逾230倍-074421595.html)
[6] Yahoo Finance - “7兆美元商機!ASIC晶片衝破千萬顆中國AI靠「系統級」逆襲突圍” (https://hk.finance.yahoo.com/news/7兆美元商機-asic晶片衝破千萬顆-中國ai靠-系統級-逆襲突圍-025409147.html)
[7] Yahoo Finance - “未上市但概念股已爆漲!A股市場引頸期盼摩爾線程成為國產GPU第…” (https://hk.finance.yahoo.com/news/未上市但概念股已爆漲-a股市場引頸期盼摩爾線程成為-�%9
数据基于历史,不代表未来趋势;仅供投资者参考,不构成投资建议
关于我们:Ginlix AI 是由真实数据驱动的 AI 投资助手,将先进的人工智能与专业金融数据库相结合,提供可验证的、基于事实的答案。请使用下方的聊天框提出任何金融问题。
