毕业论文
您现在的位置: 框架 >> 框架优势 >> 正文 >> 正文

图显计算场景应用崛起,千亿美元GPU市

来源:框架 时间:2022/10/31
白癜风病初期是什么情况 http://baidianfeng.39.net/a_bdfnzhm/141222/4541952.html

目前GPU应用领域正从图形显示向计算领域拓展,我们看好GPU在大数据和AI时代的应用潜力,国产GPU厂商景嘉微是目前国内唯一商用GPU公司,国产化背景下我们看好景嘉微GPU在民用领域发展前景。

风险:市场竞争加剧的风险;GPU市场发展不及预期;Nvidia产品迭代不及预期;景嘉微第三代芯片性能不及预期。

1、GPU:计算机图显核心

1.1GPU:计算机图形显示核心

GPU基本概念:图形处理器(graphicsprocessingunit,缩写GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。

GPU是显卡的处理器:显卡全称显示适配卡,又称显示适配器,用于协助CPU进行图像处理,作用是将CPU送来的图像信号经过处理再输送到显示器上,由主板连接设备、监视器连接设备、处理器和内存组成,GPU即是显卡处理器。

1.2GPU擅长大规模并发计算

GPU工作原理与结构

GPU工作原理:GPU的工作通俗的来说就是完成3D图形的生成,将图形映射到相应的像素点上,对每个像素进行计算确定最终颜色并完成输出,一般分为顶点处理、光栅化计算、纹理贴图、像素处理、输出五个步骤。

GPU采用流式并行计算模式,可对每个数据行独立的并行计算。

GPU与CPU区别:CPU基于低延时设计,由运算器(ALU)和控制器(CU),以及若干个寄存器和高速缓冲存储器组成,功能模块较多,擅长逻辑控制,串行运算。GPU基于大吞吐量设计,拥有更多的ALU用于数据处理,适合对密集数据进行并行处理,擅长大规模并发计算,因此GPU也被应用于AI训练等需要大规模并发计算场景。

1.3GPU可分为独立GPU和集成GPU

GPU分类

独立GPU:独立GPU一般封装在独立的显卡电路板上,使用专用的显示存储器,独立显卡性能由GPU性能与显存带宽共同决定。一般来讲,独立GPU的性能更高,但因此系统功耗、发热量较大。

集成GPU:集成GPU常和CPU共用一个Die,共享系统内存。集成GPU的制作由CPU厂家完成,因此兼容性较强,并且功耗低、发热量小。但如果显卡运行需要占用大量内存,整个系统运行会受限,此外系统内存的频率通常比独立显卡的显存低很多,因此一般集成GPU的性能比独立GPU更低。

1.4GPU广泛运用在图显和并行计算场景

GPU应用场景

GPU拥有单一的强大并行计算能力,所以用途往往是需要大规模并行计算的场景。早期GPU多被用于2D和3D图形的计算和处理,因为图形数据的处理往往涉及到大量的大型矩阵运算,计算量大但易于并行化。近年由于大数据、人工智能发展,GPU也常常被用于需要大量重复计算的数据挖掘领域,如机器学习,深度学习等。

GPU使用场景:GPU被广泛地运用于PC、服务器、移动等领域。其中服务器GPU可做专业图形处理、计算加速、深度学习等应用,以独立GPU为主;移动端GPU主要采用集成GPU;PC根据使用用途不同,既可以搭载独立GPU,也可以使用集成GPU。

1.5全球GPU巨头:NVIDIA、AMD

全球GPU巨头

NVIDIA(英伟达):创立于年,年发明了GPU,最初专注PC图形,后来拓展到密集计算领域,Nvidia利用GPU创建了科学计算、人工智能、数据科学、自动驾驶汽车、机器人技术、AR和VR的平台。Nvidia是目前全球最大的独立GPU供应商,年营收.8亿美元,Q2Nvidia全球独立GPU市场份额达到83%。

AMD(超威半导体):成立于年,目前业内稀缺的可以提供高性能CPU、高性能独立显卡GPU、主板芯片组三大组件的半导体公司。年AMD营收97.6亿美元,其中计算和图形(包括CPU、GPU、APU等)业务营收64.3亿美元,Q2AMD全球独立GPU市场份额达到17%。

2.GPU两大应用场景:图显、计算

2.1全球GPU市场规模接近千亿美元

GPU市场规模

年全球GPU市场规模达到.1亿美元。3D图像显示、人工智能深度学习的需求支撑GPU市场持续增长,根据VerifiedMarketResearch数据,年全球GPU市场规模达到.1亿美元,预计年达到.6亿美元,CAGR为5.9%。

测算年中国大陆独立GPU市场规模约亿美元。中国是全球GPU市场重要组成部分,年Nvidia、AMD在中国大陆收入占比分别为23.3%、23.9%,我们假设中国大陆独立GPU市场占全球23.5%,测算年中国大陆独立GPU市场规模约为亿美元。

2.2PCGPU:年全球出货3.94亿片

PCGPU

PC(个人电脑)是GPU重要应用场景,根据JonPeddieResearch(JPR)数据,年全球GPU出货3.94亿片,同比增长17.9%。

比特币等加密货币的行情火爆带动矿卡GPU需求,Q4-Q2全球PCGPU单季度出货量连续三个季度超过1亿片,Q2达到1.23亿片,同比大增42%,GPU与PC配售比为%。JPR预计-年全球PCGPU市场保有量将以3.5%复合增速增长,到年达到33.18亿片。

2.3PCGPU:Nvidia和AMD占据独立GPU市场

PCGPU竞争格局

Intel领导集成GPU市场。Intel(英特尔)是全球最大的CPU制造商,Q2占据全球77.5%的x86CPU市场,集成GPU集成在CPU中,Intel凭借CPU市场地位,占据全球PCGPU大部分市场。根据JPR数据,Q2Intel占据全球68.3%的PCGPU市场份额,Nvidia和AMD市场份额分别为15.2%、16.5%。

Nvidia和AMD占据独立GPU市场。在独立GPU领域,Nvidia具备明显的份额领先,Q2市占率达到83%。年AMD收购ATI,年放弃ATI品牌后推出AMDRadeon(镭龙)独立显卡系列,Q2AMD独立PCGPU市场份额17%。

2.4AI服务器与加速芯片

AI加速芯片

AI服务器:通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求,为自然语言处理、计算机视觉、机器学习等AI应用场景提供强大的算力支持,支撑AI算法训练和推理过程。

AI加速芯片:由于CPU并不适合大规模并行计算,因此需要加速芯片执行AI算法,目前AI加速芯片主要包括图形处理器(graphicsprocessingunit,GPU)、现场可编程门阵列(field-programmablegatearray,FPGA)、专用集成电路(applicationspecificintegratedcircuits,ASIC)、神经拟态芯片等。

GPU:优势在于提供了多核并行计算的基础结构,且核心数非常多,可以支撑大量数据的并行计算,拥有更高的浮点运算能力;缺点在于管理控制能力弱,功耗高。

FPGA:优势在于可以无限次编程,延时性比较低,同时拥有流水线并行和数据并行(GPU只有数据并行)、实时性最强、灵活性最高;缺点在于开发难度大、只适合定点运算、价格比较昂贵

ASIC:与通用集成电路相比具有体积更小、重量更轻、功耗更低、可靠性提高、性能提高、保密性增强、成本降低等优点;缺点是灵活性不够,成本比FPGA贵。

2.5GPU是AI服务器首选加速方案

GPU服务器

服务器是AI核心基础设施。根据IDC数据,年中国AI基础设施市场规模为39.3亿美元,同比增长26.8%,并将在年达到78.0亿美元,其中年服务器市场规模占AI基础设施的87%以上,承担着最为重要的角色。

互联网行业是AI服务器最大采购行业。根据IDC数据,年上半年,互联网占整体加速计算服务器市场近60%的份额,同比增持超过%;政府行业和服务业分别依次位居第二位和第三位。

GPU服务器是AI加速方案首选。IDC预计年中国GPU服务器占比91.9%左右的市场份额,是数据中心AI加速方案首选。根据IDC数据,年中国GPU服务器市场规模达到20亿美元,预计年将达到64亿美元。

2.6AI服务器通常配置多个GPU芯片

GPU服务器

GPU加速服务器能够提供优秀的浮点计算能力,从容应对高实时、高并发的海量计算场景,例如深度学习、科学计算、3D动画渲染、CAE等应用场景

年平均每台服务器配置8.02个GPU。一台GPU服务器通常搭载多个GPU加速芯片,根据IDC数据,年中国AI服务器出货量为台,同比增长46.7%,每个服务器配置1-20个GPU,加权计算平均每台服务器配置8.02个GPU加速卡。

3.全球GPU巨头

3.1Nvidia:全球GPU巨头

全球GPU巨头

Nvidia成立于年,年上市,市值近10年增长超过83倍,近6年增长超过49倍。截至年11月5日,Nvidia总市值亿美元,总市值美股排名第七,是目前全球市值最大的半导体公司。

3.2Nvidia:三大因素推动地位提升

进阶之路

技术革新、场景拓展、外延并购,Nvidia引领全球GPU发展。

GPU架构:Nvidia坚持每2-3年推出一代新的GPU架构,持续保持技术领先,新的Ampere已经采用7nm工艺;

应用场景:从最初图形处理到通用计算,再到AI深度学习和自动驾驶,Nvidia不断推动GPU应用场景的突破;

外延并购:-年Nvidia密集收购额多家公司,涵盖显卡、图形处理、半导体等多个领域,年宣布计划收购ARM。

3.3Nvidia:近年业绩高速增长

业务分类

Nvidia产品主要分为两大类:图形处理、计算网络。下游市场包括游戏、专业可视化、数据中心、汽车四大类。

年Nvidia营收.8亿美元(yoy+52.7%),净利润43.3亿美元(yoy+54.9%),其中图形处理业务营收98.3亿美元,计算网络业务营收68.4亿美元。除去年游戏市场需求波动造成业绩下滑外,Nvidia近5年营收、利润均保持较快增长。

得益于基于Ampere架构新GPU产品带动游戏业务高增,以及数据中心对算力需求旺盛,上半年Nvidia营收、净利润快速增长。

3.4Nvidia:游戏是最大市场,数据中心市场增速较快

下游分类与产品

Nvidia下游市场分为四类:游戏、专业可视化、数据中心、汽车,各市场重点产品如下:

游戏:GeForceRTX/GTX系列GPU(PCs)、GeForceNOW(云游戏)、SHIELD(游戏主机)

专业可视化:Quadro/RTXGPU(企业工作站)

数据中心:基于GPU的计算平台和系统,包括DGX(AI服务器)、HGX(超算)、EGX(边缘计算)、AGX(自动设备)

汽车:NVIDIADRIVE计算平台,包括AGXXavier(SoC芯片)、DRIVEAV(自动驾驶)、DRIVEIX(驾驶舱软件)、Constellation(仿真软件)

3.5Nvidia:计算业务驱动高成长

计算业务

计算业务是Nvidia成长的主要驱动力:数据中心已成规模,智能汽车将进入收获期。

在数据中心市场,Nvidia拥有芯片、硬件、硬件的全栈布局。得益于全球AI应用场景的快速增加,对算力的需求飙升。是Nvidia成长最快的市场,年营收达到约66.96亿美元,近4年CAGR达到68.5%,远高于游戏市场的17.6%。年Nvidia数据中心市场营收占比已经超过40%,预计未来仍将继续提升。

在智能汽车市场,Nvidia形成了全栈式自动驾驶解决方案。AGXXavier芯片于年开始出货,下一代自动驾驶芯片Orin计划用于年量产,算力将达到TOPS,目前已经获得蔚来、理想、沃尔沃、奔驰等多个整车厂定点项目。我们认为年高阶自动驾驶汽车或将集中落地,Nvidia自动驾驶将进入收获期。

3.6Nvidia:中国大陆收入贡献提升

中国大陆贡献

Nvidia中国大陆收入快速增长。年Nvidia来自中国大陆收入38.86亿美元,同比增长42.3%,近4年CAGR达到31.4%,同期Nvidia整体营收CAGR为24.6%。

Nvidia中国大陆收入占比呈上升趋势。年Nvidia中国大陆收入占比达到23.3%,相比于年的18.9%提升4.4pct,上半年Nvidia中国大陆收入占比25.6%,上升趋势明显。

我们预计中国大陆占比仍将提升。图显业务层面,人均收入提升将带动PC需求增加;计算业务层面,目前中国大陆在AI算法、应用层面具有领先优势,自动驾驶场景也将率先得到释放。

4.景嘉微:国产GPU领军

4.1景嘉微:国内唯一商用GPU公司

景嘉微

景嘉微成立于年,公司主营业务分为图形显控、小型专用化雷达、GPU芯片三类。其中图显、雷达产品主要面向军用市场,GPU芯片产品包括JM、JM,其中JM主要应用于公司图显模块中,JM成功拓展了民用和信创市场。年9月,公司第三代GPU芯片JM9成功流片,目前正在进行性能测试。

4.2景嘉微:两个系列、三款GPU量产应用

景嘉微量产芯片

景嘉微已完成两个系列、三款GPU芯片量产应用。第一代GPU产品JM于年流片成功,主要支撑军用装备,已在国产军用飞机上实现了对ATIM9、M54、M72等芯片的替代;第二代产品JM于年8月流片成功,性能与Nvidia的GT显卡相近。在JM基础上,公司又推出能耗更低的JM,成功进入民用领域。

4.2景嘉微:两个系列、三款GPU量产应用

景嘉微三款量产GPU芯片介绍

4.3景嘉微:JM已在信创市场批量落地

JM

目前JM已完成与国内主要的CPU和操作系统厂商的适配工作,与长城、联想、同方等十余家国内主要计算机整机厂商建立合作关系并进行产品测试,成功进入商用领域。JM是JM针对民用市场的升级,在保证性能基础上降低能耗。

年11月,景嘉微全资子公司长沙景美与湖南长城科技信息有限公司签署了《战略合作协议》,根据协议,年湖南长城拟采购10万套基于JM芯片的国产图形显卡;年3月,景嘉微全资子公司长沙景美与北京神州数码有限公司签署《采购合作框架协议》,神州数码以景嘉微“大陆地区经销商”名义代理公司GPU及显卡产品。中国长城是国内信创市场的核心整机厂商,神州数码是国内重要的IT分销商和信创参与方,合作是景嘉微GPU产品在民用信创大批量落地的体现。

4.4景嘉微:信创驱动年GPU芯片营收高增

景嘉微芯片营收

年上半年景嘉微芯片营收2.14亿元,同比增长13.5倍,占总营收比例达到45.1%。

4.5景嘉微:JM9系列芯片目标中高端市场

JM9系列芯片

预计JM系列芯片性能达到GTX水平,目标中高端市场。根据公司公告,JM和JM将采用业界主流的统一渲染架构,支持OpenGL4.5接口,可以无缝兼容市面上主流的CPU、操作系统和应用程序。

JM性能与国际同类公司年中低端产品性能相当,主要针对国产化办公电脑,便携式计算机、中低端的游戏机和高端嵌入式系统等消费电子领域。

JM在JM基础上对科学计算能力进行大幅度提高和改进,可以达到国际同类公司年中高端产品的性能,主要针对人工智能、安防监控、语音识别、深度学习、云计算等对计算速度要求非常高的高端应用领域。

5.潜在风险

1、市场竞争加剧的风险

当前全球独立GPU市场由Nvidia和AMD垄断,景嘉微是国内唯一商用GPU公司,未来全球和国内GPU市场竞争或将加剧;

2、GPU市场发展不及预期

GPU应用正从图像显示向计算领域拓展,FPGA、ASIC芯片也应用于计算领域,未来或将挤占GPU在计算领域应用;

3、Nvidia产品迭代不及预期

Nvidia推动GPU向数据中心、汽车等新兴场景应用,若产品迭代不及预期,或将影响Nvidia市场地位和业绩表现;

4、景嘉微第三代芯片性能不及预期

目前景嘉微JM9系列芯片正在性能测试过程中,若性能不及预期,将影响景嘉微向民用领域拓展。

附:GPU重要参数解析

CUDACore和TensorCore:为GPU提供计算能力的硬件单元。CUDAcore也叫StreamingProcessor(SP),是单精度,组成SM的重要部分。TensorCore已发展到第三代,TensorCore大幅减少了深度学习需要的时间。Core的数量越多,并行运算的线程越大,计算的峰值越高。

像素填充速率:指GPU一秒钟内能处理多少个像素,单位是GPixel/S(每秒十亿像素),或MPixel/S(每秒百万像素)。像素填充速率是较好衡量GPU图像显示功能的整体指标,说明了显卡能以多快的速度对图像进行光栅化处理。

纹理填充率:指对多边形图像进行纹理贴图、实现3D效果的速度,和像素填充率类似,单位是GTexels/S或MTexels/S。游戏采用了多纹理贴图的方式,使画面具有更好的光影效果。

显存容量:其主要功能就是暂时储存GPU要处理的数据和处理完毕的数据。显存容量大小决定了GPU能够加载的数据量大小,在深度学习、机器学习的训练场景,显存的大小决定了一次能够加载训练数据的量,在大规模训练时,显存会显得比较重要。

显存位宽:显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。

显存频率:一定程度上反应着该显存的速度,以MHz(兆赫兹)为单位,显存频率随着显存的类型、性能的不同而不同。显存频率和位宽决定显存带宽。

显存带宽:指显示芯片与显存之间的数据传输速率,它以字节/秒为单位。显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成,显存带宽=显存频率×显存位宽/8。

制作工艺:制作工艺,指的是晶体管与晶体管之间的距离,单位是纳米。制作工艺越小说明集成度越高,功耗越小,性能越好。

功率:集显依靠CPU的主板连接提供电源,但独显性能较强,需要单独接电源。

总线接口:显示卡要插在主板上才能与主板互相交换数据,现在主流接口为PCLe(PCI-Express)。接口提供数据流量带宽,目前主流采用PCLe4.0版本,16个通道。

Directx支持:简称DX,是一种应用程序接口(API)。DX由微软编写,由很多的API组成,包括显示、声音、输入和网络。DirectX11还支持高质量实时渲染和预渲染场景,目前DX已发展到Directx12版本,提高了多线程效率,可以充分发挥多线程硬件的潜力。(资料源/天风证券研究所)

转载请注明:http://www.0431gb208.com/sjszjzl/2394.html

  • 上一篇文章:
  • 下一篇文章: 没有了