国产GPU供不应求——国产之光性能超乎想象-Kaiyun·开云中国官方网站

国产GPU供不应求——国产之光性能超乎想象

作者：小编　日期：2025-03-10　点击数：　

　　kaiyun中国网页版登录 kaiyun中国网页版登录届春晚—英伟达GTC大会在3月召开，B100/B200晶片的亮相，刷新了计算新速度，随着人工智能技术的日新月异，从数据处理到算法优化，再到应用场景的拓展，每一步都可能带来新的市场机会。从智能硬件到云计算，再到物联网等多个领域，

　　台积电董事长刘德音预测：未来 15 年每瓦 GPU 性能提升 1000 倍，GPU 晶体管数破万亿

　　就在近期，在一则对英伟达CEO黄仁勋的最新专访中，黄仁勋表示：当下我们正处于生成式人工智能革命的开端，机器人基础模型可能即将出现，新一代GPU性能超乎想象，今年到明年，GPU都会供不应求！

　　面对国外的行业龙头，国内GPU在对标的同时也在不断进步，缩小与头部公司的差距，在我看来，GPU 有传统 2D/3D 图形渲染 GPU 和专注高性能计算的GPU两条主要的发展路线。随着国家的政策支持及厂商的大力投入，国产GPU 厂商在图形渲染 GPU 和高性能计算 GPGPU 领域上均推出了较为成熟的产品，在性能上不断追赶行业主流产品，在特定领域达到业界一流水平。在软件支持方面，国产GPU企业正在积极与主流操作系统、开发环境以及图形处理软件等进行适配，确保用户能够流畅地使用各种应用软件。同时，一些企业还在推动GPU在人工智能、云计算等新兴领域的应用，为国产GPU生态注入新的活力。

　　生态方面国产厂商大多兼容英伟达 CUDA，融入大生态进而实现客户端导入。

国产GPU供不应求——国产之光性能超乎想象(图1)

　　我国移动GPU和桌面GPU两大主要终端应用场景市场持续保持增长。全球GPU的市场已经达到了448亿美元，我国约占全球市场规模的24.7%。互联网、政府侧、服务、电信、金融、制造、教育等领域是GPU算力需求较大的领域，目前国产GPU企业都在积极朝大模型方向布局，包括训练和推理。另外软件和生态建设也在加速推进。

国产GPU供不应求——国产之光性能超乎想象(图2)

　　沐曦于2020年9月成立于上海，致力于为异构计算提供全栈GPU芯片及解决方案，可广泛应用于人工智能、智慧城市、自动驾驶、数字孪生、元宇宙等前沿领域。公司拥有技术完备、设计和产业化经验丰富的团队，核心成员平均拥有近20年高性能GPU产品端到端研发经验。

国产GPU供不应求——国产之光性能超乎想象(图3)

　　公司拥有完全自主研发的GPU IP、指令集和架构，以及兼容主流GPU生态的完整软件栈（MXMACA），产品具备高能效、高通用性。目前已推出MXN系列GPU（曦思）用于AI推理，MXC系列GPU（曦云）用于AI训练及通用计算，以及MXG系列GPU（曦彩）用于图形渲染，可满足数据中心对高能效和高通用性的算力需求。

　　沐曦拥有目前国内出生于全球顶级GPU厂商的全建制团队，拥有二十年高性能GPU从设计到量产交付的全流程经验。作为初创公司，成立一年内获得四轮共数十亿人民币的融资。2021年8月25日，公司获得十亿人民币融资，由国调基金和中网投领投，和利资本、红杉中国等跟投。通过此轮融资，进一步加强了沐曦在高性能GPU领域的研发投入。

　　海光信息主要从事高端处理器、加速器等计算芯片产品和系统的研发、设计和销售。公司的产品包括海光通用处理器（CPU）和海光协处理器（DCU），具有成熟而丰富的应用生态环境，内置专用安全硬件，可满足互联网、金融、能源等行业的广泛应用需求。

　　其系列产品海光 8100 采用先进的 FinFET 工艺，以GPU架构为基础，兼容通用的“类 CUDA”环境以及国际主流商业计算软件和人工智能软件，可充分挖掘应用的并行性，发挥其大规模并行计算的能力。

　　摩尔线年，是一家以全功能GPU芯片设计为主的集成电路高科技公司，能够为广泛的科技生态合作伙伴提供强大的计算加速能力，致力于打造为下一代互联网提供多元算力的元计算平台。

　　摩尔线程的创始人是原NVIDIA全球副总裁、中国区总经理张建中先生。核心创建团队基本都来自NVIDIA，拥有完整的高端芯片人才团队，全面覆盖GPU芯片IP研发、系统软硬件设计、生态建设和市场营销等。

国产GPU供不应求——国产之光性能超乎想象(图4)

　　2022 年 8 月公司发布的通用 GPU 芯片 BR100 创下全球通用 GPU 算力记录，峰值算力达到国际厂商在售旗舰产品 3 倍以上。BR100 率先采用 Chiplet 技术、新一代主机接口PCIe 5.0、支持 CXL 互连协议，确立了公司在国内厂商间的技术领先地位。公司坚持自主研发，同步推出原创架构“壁立仞”和自研BIRENSUPA 软件平台，实现了 BR100 性能的大幅提升。

　　以壁仞科技于 2022 年8 月发布的首款 GP GPU BR100 为例，该芯片采用 Chiplet 技术，16 位浮点算力达到 1000T 以上、8 位定点算力达到 2000T 以上，单芯片峰值算力达到 PFLOPS级别，是国际厂商在售旗舰产品的 3 倍以上，创造了全球通用 GPU 的算力记录。

　　寒武纪是国内领先人工智能芯片设计企业，搭建广泛覆盖终端、云端、边缘端场景的智能芯片产品体系。公司面向终端、云端、边缘端三大场景，分别研发推出终端智能处理器IP（智能处理器的产品级实现方案，由核心架构、代码、文档等组成）、云端智能芯片及加速卡（用于加速特定领域应用程序的板卡产品，以计算芯片为核心部件）、边缘智能芯片及加速卡等产品，适用于各类智能终端、云服务器、边缘计算设备等，并为该三类产品，研发推出统一的基础系统软件平台，为客户提供丰富芯片产品与系统软件解决方案，致力构建云、边、端一体的智能生态。

　　寒武纪1A、寒武纪1H应用于华为海思等旗舰智能手机芯片内，已集成在超过1亿台智能手机及其他智能终端中。思元系列芯片及对应加速器产品，已应用在中科曙光、浪潮、联想等多家厂商的服务器中。基于此，公司产品辐射互联网、云计算、能源、教育、金融、电信、交通、医疗等行业，支持人工智能行业各类中小企业发展。

国产GPU供不应求——国产之光性能超乎想象(图5)

　　芯原依托自主半导体 IP，为客户提供平台化、全方位、一站式芯片定制服务和半导体 IP 授权服务，拥有独特的“芯片设计平台即服务”经营模式。公司可提供高清视频、物联网连接、数据中心等多种一站式芯片定制解决方案，拥有自主可控的图形处理器 IP、神经网络处理器 IP 等五类处理器 IP 及 1400 多个数模混合 IP 和射频 IP，可快速打造出从定义到测试封装完成的半导体产品，业务范围覆盖消费电子、汽车电子、物联网等多种应用领域。据 IPnest 在 2021 年的统计，芯原的半导体 IP 销售收入排中国大陆第二，全球第七，其中公司的图形处理器 IP 排名全球前三。

　　近些年国产GPU正在蓬勃发展，不过相较于国际巨头，仍然存在较大差距。近年来，大模型快速发展，国产GPU在大模型训练方面的不足也凸显出来，在大模型训练及软件和生态方面都面临诸多挑战，举个例子，多媒体和图形处理都属于单精度浮点计算（FP32）的计算需求，双精度浮点计算能力FP64是进行高算力计算的硬性指标。英伟达的A100同时具备上述两类能力，而国内大多GPU只能处理单精度浮点计算。

【2025年1月】1月装机走向与推荐（市场分析部分总第105

2025年03月08日B

Kaiyun - 中国官方版权服务网站