(报告出品方:长江证券)
GPU:核心计算底座
GPU,指GraphicsProcessingUnit,图形处理器,进行图形和图像相关运算工作的微处理器。在该产品基础上,衍生出GPGPU,即GeneralPurposeGraphicsProcessingUnit,其在图形处理器GPU的基础上进行改造,使之可以进行部分科学计算和AI计算等的处理器。GPU概念自20世纪70年代末提出,其角色变换从最早分担CPU压力的附属硬件,到由于能承担大规模运算而逐渐被人们重视。
摩尔定律放缓无法匹配爆发式算力需求,GPU兴起
历史上,由于摩尔定律的存在,使得CPU处理器的性能可以满足应用软件不断升级的需求。但近几年随着半导体技术改进达到物理极限,电路复杂度逐渐提升。年3月24日,英特尔宣布正式停用“Tick-Tock”处理器研发模式,未来研发周期将从两年周期向三年期转变。至此,摩尔定律对英特尔几近失效。随着互联网用户和各类网络应用的快速增长,数据体量的急剧膨胀,数据中心对计算的需求也在迅猛上涨。诸如深度学习在线预测、直播中的视频转码、图片压缩解压缩以及HTTPS加密等各类应用对计算的需求已远远超出了传统CPU处理器的能力所及。一方面处理器性能再无法按照摩尔定律进行增长,另一方面数据增长对计算性能要求超过了按“摩尔定律”增长的速度。CPU处理器本身无法满足计算性能需求,导致需求和性能之间出现了缺口。解决方法是通过硬件加速,采用专用协处理器的异构计算方式来提升处理性能,而GPU凭借其相对通用灵活和适应并行计算等特性成为主要选择。
GPU在并行运算层面具备一定优势
当前主要兴起的计算芯片分别为GPU、ASIC、FPGA等,其中GPU最初专用于图形处理制作,后逐渐应用于计算。其内部包含大量的运算单元核心,尽管单个核心缓存较小,逻辑功能简单,仅能执行有限类型的逻辑运算操作,但其多核心架构天然适合执行复杂的数学和几何计算,且科学计算领域通用性较高,相比CPU,综合性能更好。当前缺点在于功耗过高,效率不足。
GPU是核心计算资源底座。虽然提供各类计算资源的芯片种类众多,但GPU依然是市场的最为主要的支撑点。以在AI市场的应用为例,IDC研究发现,年上半年中国人工智能芯片中,GPU依然是实现数据中心加速的首选,占有90%以上的市场份额,而ASIC、FPGA、NPU等其他非GPU芯片也在各个行业和领域被越来越多地采用,整体市场份额接近10%。
历史复盘:当前GPU进入高速发展期
前GPU时代,图形处理器初具雏形:年世界上第一台个人电脑IBM由IBM公司发布,其搭配黑白显示适配器与彩色图形适配器,是最早的图形显示控制器。20世纪80年代初期,出现了以GE芯片为标志的图形处理器,GE芯片的具备四位向量的浮点运算功能,可以实现图形渲染过程中的矩阵,裁剪,投影等运算,其出现标志着计算机图形学进入以图形处理器为主导的阶段。后续随着GE等图形处理器功能不断完善,图形处理功能逐渐由CPU向GPU(前身)转移。
GeForce横空出世,GPU正式诞生:20世纪90年代,NVIDIA进入个人电脑3D市场,并于年推出具有标志意义的图形处理器GeForce,真正意义上的GPU第一次出现。相较过往图形处理器,第二代GPUGeForce将TL硬件(用于处理图形的整体角度旋转与光晕阴影等三维效果)从CPU中分离出来并整合进GPU中,使得GPU可以独立进行三维顶点的空间坐标变换,将CPU从繁重的光照计算中解脱出来。即便是低端CPU,搭配了支持硬件TL的显卡也可以流畅地玩游戏,这使得英伟达在市场竞争中能以产品价格获得较大优势,市占率持续提升。顶点编程确立GPU编程思路:经过年的显卡厂商洗牌后,S3、SIS等厂商无力与英伟达和ATI竞争,逐渐淡出了显卡市场,拥有产品高速迭代能力的ATI成为继3Dfx后唯一有实力和英伟达竞争的厂商。年第三代GPU芯片陆续推出(如英伟达的GeForce4Ti与ATI的),其均具备顶点编程能力,可以通过赋予特定算法在工作中改变三维模型的外形。顶点编程能力的出现确立了GPU芯片的编程思路,使后续GPU芯片用于其他计算领域成为可能。但本时期GPU尚不支持像素级编程能力(片段编程能力),其编程自由度尚不完备。
GPU用于通用计算,GPGPU概念出现:年SIGGRAPH大会上首次提出将GPU运用于通用运算,为GPGPU的出现打下基础。其后3年,通过用统一的流处理器取代GPU中原有的不同着色单元的设计释放了GPU的计算能力,第四代GPU均具有顶点编程和片段编程能力,完全可编程的GPU正式诞生。由于GPU的并行处理能力强于CPU,因此GPU可以在同一时间处理大量顶点数据,使其在人体CT、地质勘探、气象数据、流体力学等科学可视化计算处理上具备较大优势,足以满足各项实时性任务。后续伴随线性代数、物理仿真和光线跟踪等各类算法向GPU芯片移植,GPU由专用图形显示向通用计算逐渐转型。架构持续迭代,AI计算