作为当前对性能要求最高的半导体应用领域之一,人工智能芯片市场正呈现鲜明的竞争格局。英伟达(NVIDIA)在此领域占据绝对主导地位,其AI芯片出货量约占全球市场的90%。

然而,全球范围内的追赶从未停止。即便在英伟达高端产品(如H200芯片)逐步解禁对华出口的大背景下,包括华为、寒武纪、海光、百度、阿里在内的多家国内厂商,也在持续加大对自研AI芯片的投入,力图缩小技术差距。
近期一份由伯恩斯坦绘制的全球AI芯片性能全景图,揭示了当前的技术分布。该图表以英伟达约六年前发布的A100显卡为性能基准线,对比了各大厂商主要产品的TPP性能密度。值得注意的是,A100至今仍是众多AI大模型训练的关键硬件平台。
在性能对比中,英伟达的优势极为显著。其H100及后续型号的性能已远超A100。最新的B300芯片TPP性能高达60000,B200约为36000,B100在28000左右。而目前可获对华出口许可的最先进产品H200,其TPP性能约为15832。
在美国阵营中,能与英伟达展开竞争的厂商主要包括AMD和英特尔。AMD的MI355X产品达到了38400 TPP性能,而其下一代MI450X系列预计将有能力对标甚至超越B200/B300级别。英特尔则通过Gaudi3系列实现了约30000 TPP性能。谷歌的自研TPU v7同样表现不俗,达到3.7万TPP左右。总体而言,这三家公司的产品性能约达到英伟达最前沿芯片的50%至80%,并有希望通过后续迭代实现性能追平。
相比之下,国内AI芯片厂商数量众多,但多数初创企业的性能表现与行业领先水平仍存在较大距离,达到A100同等水准的尚属少数。目前,能够在TPP性能上超越10000大关的,主要集中在华为、阿里和百度这几家公司。其中,华为与阿里的芯片性能均可达到约12800 TPP,相当于当前顶级英伟达芯片性能的20%。百度新一代昆仑芯片的性能也基本处于同一梯队。
需要承认的是,由于在设计及最关键的先进制程制造环节(普遍落后台积电顶尖工艺2-3代)存在系统性差距,国产AI芯片在单芯片性能上的追赶难度极大、周期较长,这与国产CPU单核性能长期落后于国际巨头的局面相似。
然而,AI整体算力并非完全取决于单芯片的峰值性能。通过构建和优化超大规模集群(超节点),即使单一芯片性能存在差距,其聚合后的系统级算力仍可能取得领先优势。华为等厂商已通过实践证明,这条路径是可行的。
展望未来,更值得关注的是国产AI芯片快速的迭代节奏。随着未来两到三年内,国内先进制造工艺逐步实现规模化量产,AI芯片的性能差距有望加速缩小。届时,头部国产芯片实现单芯片性能达到国际顶级产品的80%将极具希望,这一地位类似于当前AMD与谷歌的定位。在此基础上,再结合本土化服务、系统集成等综合优势,国产AI计算生态的整体竞争力将不容小觑。





























浙公网安备 33010502007447号