Kaiyun - 中国官方版权服务网站

关闭
GPU出现性能瓶颈ASIC架构才是AI芯片未来
作者:小编 日期:2025-03-08 点击数: 

  近年来,AI技术的迅猛发展对计算能力提出了更高的要求。GPU作为AI芯片的主流选择,凭借其强大的并行处理能力和广泛的应用场景,长期以来占据了市场的主导地位。然而,随着AI应用的不断深入和复杂化,GPU在性能瓶颈、功耗和成本等方面的问题逐渐显现,ASIC架构的崛起则为AI芯片领域带来了新的发展方向。

GPU出现性能瓶颈ASIC架构才是AI芯片未来(图1)

  算力通常是指计算机处理信息的能力,特别是在进行数字运算、数据处理和执行程序时的速度和效率。根据使用设备和提供算力强度的不同,算力可分为基础算力、智能算力、超算算力。智能算力即AI算力,负责提供AI算法模型训练与模型运行服务的计算机系统能力,其算力芯片通常包括GPU、ASICFPGA、NPU等各类专用芯片。

GPU出现性能瓶颈ASIC架构才是AI芯片未来(图2)

  目前通用的CPU、GPU、FPGA等都能执行AI算法,只是执行效率差异较大。但狭义上讲一般将AI芯片定义为“专门针对AI算法做了特殊加速设计的芯片”。AI芯片本身分为GPU、FPGA和ASIC架构,根据场景可以分为云端和端侧。

  当前市场主流AI芯片为GPU和ASIC,国际上,NVIDIA的H200Tensor Core GPU以其卓越的计算性能和能效比领先市场,而Google的第六代TPU Trilium ASIC芯片则以其专为机器学习优化的设计提供高速数据处理。

  在国内,寒武纪的思元370芯片(ASIC)凭借其先进的计算处理能力在智能计算领域占据重要地位,已与主流互联网厂商开展深入适配,海光信息的DCU系列则基于GPGPU架构,以其类“CUDA”通用并行计算架构较好地适配、适应国际主流商业计算软件和AI软件。

GPU出现性能瓶颈ASIC架构才是AI芯片未来(图3)

  在GPU与CPU的关于AI市场的争锋中,GPU凭借其独特的架构和并行处理能力占据了显著的优势地位。然而,随着AI生态的不断壮大和算力需求的持续提升 ,当下主流GPU架构出现明显的性能瓶颈。

  以英伟达最新发布的H100 GPU为例,其理论算力达到1979 TFLOPS,但在实际AI训练任务中,有效利用率往往不足30%。这种效率损失主要源于GPU的通用计算架构设计,使其在处理特定AI任务时产生大量冗余计算。

  在这样的背景下,针对特定算法和应用优化设计的ASIC架构凭借较高的能效比开始冒头。

  ASIC架构针对特定算法和应用进行优化设计,在特定任务上的计算能力强大,如在某些AI深度学习算法中实现高效的矩阵运算和数据处理。

  虽然GPU具有强大的并行计算能力,拥有众多计算核心,可同时处理多个任务,在通用计算和图形处理方面表现出色,适用于大规模的数据并行计算,如科学计算、图形渲染、视频处理等,但GPU在特定任务上的计算效率可能不如ASIC,尤其是在能效方面。

GPU出现性能瓶颈ASIC架构才是AI芯片未来(图4)

  ASIC通常具有较高的能效比,因其硬件结构是为特定任务定制的,能最大限度减少不必要的功耗。GPU由于其通用的设计架构,在执行特定任务时可能存在一些功耗浪费。

  具体而言,谷歌TPU v4在同等功耗下,AI训练性能较GPU提升3倍以上,能效比提升5倍。这种优势就是源于ASIC针对特定算法进行硬件级优化,消除了通用计算架构中的冗余设计。在自然语言处理任务中,ASIC芯片的推理速度可达GPU的10倍,延迟降低80%。

GPU出现性能瓶颈ASIC架构才是AI芯片未来(图5)

  此外,成本也是ASIC架构有望成为主流的关键原因。ASIC因其硬件结构是为特定任务定制的,减少了很多针对通用加速计算的不必要的硬件设计,其单位算力成本相比GPU或更低。谷歌TPUv5、亚马逊Trainium2的单位算力成本分别为英伟达H100的70%、60%。

GPU出现性能瓶颈ASIC架构才是AI芯片未来(图6)

  目前,全球科技巨头已展开ASIC布局,谷歌TPU已迭代至第四代,亚马逊推出Inferentia芯片,特斯拉自研Dojo超算系统。

  这些专用芯片在各自领域展现出惊人性能,其中TPU v4在图像识别任务中实现99.9%准确率,Inferentia将推理成本降低kaiyun官方开云70%,Dojo使自动驾驶训练效率提升10倍。

  值得一提的是我国AI芯片公司多以 ASIC 为主如知名的昇腾、寒武纪等都属于这一品类。在近两年的全球大模型竞赛中,中国企业并未落后太多,而在未来百花齐放的应用时代,ASIC将不再成为软肋,也将随着 AI芯片的发展大放异彩。

GPU出现性能瓶颈ASIC架构才是AI芯片未来(图7)

  未来三年,ASIC架构将重塑AI计算格局。预计在2025年,全球AI芯片市场规模将突破1000亿美元,其中ASIC占比将超过40%。随着工艺制程进入3nm时代,ASIC的性能优势将进一步扩大,推动AI计算进入专用化时代,届时,全球AI芯片话语权必然出现新的变化。

GPU出现性能瓶颈ASIC架构才是AI芯片未来(图8)

  壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者

顶部