请选择 进入手机版 | 继续访问电脑版
专注物联网产业服务
微信二维码
威腾网服务号
游客您好
第三方账号登陆
  • 点击联系客服

    在线时间:8:00-16:00

    客服电话

    17600611919

    电子邮件

    online@weiot.net
  • 威腾网服务号

    随时掌握企业动态

  • 扫描二维码

    关注威腾小程序

裘谦 论坛元老
未知星球 | 未知职业
  • 关注0
  • 粉丝0
  • 帖子1488
热议话题
精选帖子

GPU决战新时代,外乡厂商加速入局

[复制链接]
 楼主| 裘谦 发表于 2021-12-1 11:35:37 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
GPU决战新时代,外乡厂商加速入局-y1.jpg

在英伟达于2000年收买3DFX,以及AMD在2006年收买ATI以后,桌面GPU这个市场原本就已经灰尘落定。

英伟达是GPU市场当之无愧的巨头,AMD的GPU则挣扎前行,而Intel则依靠其CPU的号令力,在集成显卡市场具有绝对的号令力,但在自力显卡市场,不管是之前的Intel 740还是后续的Larrabee都无疾而终。

但在Alex Krizhevsky利用英伟达GPU成功练习出了深度卷积神经收集AlexNet,并凭仗该收集在图像分类识别范畴大幅提升了性能以后。野生智能新时代正式开启。也正是从这个时辰起头,GPU市场起头进入了一个新阶段。英伟达则成为这个时代当之无愧的大赢家。

GPU决战新时代,外乡厂商加速入局-y2.jpg

英伟达从2012年到现在的股价走势

英伟达叱咤AI时代的两大利器

回看图形处置器的成长史,据相关材料显现,MIT在1951年制造的Whirlwind也许是天下上第一个3D图形系统,但这不是现代GPU的根本。据报道,现在的GPU雏形是基于上世纪70年月中期的所谓视频移位器(video shifters)和视频地址天生器(video address generators)组成的。


在历经大型系统、小型工作站的成长后,图像处置器在90年月中前期于PC上的3D游戏而发扬光大,在此时代,很多公司涌入其中,英伟达也是其中的一家。据英伟达官网先容,在他们建立的1993年,全球有跨越二十家的图形芯片公司,到1997年,这个数字猛增至70家。但到2006年,英伟达是唯一仍在运营的自力公司,他们也成为最初的赢家。被其冲上沙滩的前浪包括了ATI、S3 Graphics和3DFx等合作对手。


和其他玩家一样,英伟达最初建立的时辰也只是聚焦于显卡市场,最初推出的两款产物NV1和NV2也市场反应平平平。但英伟达不气馁,投入大量的履历去研发NV3,并在1997年推出。作为全球首个128位3D处置器,NV3在推出四个月后的出货就冲破一百万。由于NV3能对OpenGL的杰出支持,英伟达自NV3起头,逐步打败了那时市场占比高达85%的3DFx,成为了显卡市场的霸主。

值得一提的是,英伟达暗示,他们在1999年发现了GPU( 这是NVIDIA初创的辞汇,GPU即是Graphics Processing Unit的缩写),而昔时推出GeForce 256就是全天下第一款GPU。


假如英伟达接下来,还是只盯着图形市场,那末他们的充其量就就只是下一个3DFx,但黄仁勋有更大的野心,那就是把GPU推到通用市场,这就是大师所熟悉的GPGPU。

据半导体行业观察之前的报道:“在2000年左右,学术界对于利用GPU做通用计较(GPGPU)发生了爱好。那时,首要面向履行通用算法的CPU是履行科学计较的主力,可是CPU为了能在通用算法上都有较好的性能,是以很多芯全面积究竟上用在了片上内存和分支猜测等控制逻辑,而真正用于计较的单元并不多。相反,GPU架构中的控制逻辑较为简单,绝大大都芯全面积都用于衬着、多边形等计较。学术界发现,科学运算中的矩阵等计较可以很简单地映照到GPU的处置单元,是以能实现很是高的计较性能。”

报道进一步指出,那时,GPGPU最首要的瓶颈在于难以利用。由于GPU是面向图像利用而开辟,是以要在其编程模子中支持通用高性能计较并不轻易,需要很多手工调试和编码,是以形成了很高的门坎,能熟练利用的人并不多。

GPU决战新时代,外乡厂商加速入局-y6.jpg

为了让GPU从软硬件都走向通用,英伟达在2006年推出了Tesla架构,一改之前利用矢量计较单元做衬着的做法,而是把一个矢量计较单元拆成了多个标量计较衬着单元。这就使得基于这个架构的GPU除了衬着才能强之外,还合适做通用计较。


也就是在这一年,英伟达推出了CUDA。依照他们的说法,这是一种用于通用GPU计较的反动性架构。CUDA将使科学家和研讨职员可以操纵GPU的并行处置才能来应对其最复杂的计较应战。

正是得益于这两个偏向的结构,英伟达在AI时代如鱼得水。

据行业专家所说,现在的云端AI芯片市场,除了谷歌自用的TPU外,其他绝大大都的厂商都是利用英伟达的GPU来做相关的模子练习,这让英伟达在云端AI芯片的市场居高不下。这也让英伟达的业绩在曩昔几年屡创新高。按照赛迪顾文的猜测数据显现,光是国内的云端AI芯片市场,在2019年到2021年间的累计增加将高达152%,麦肯锡也猜测,在未来几年,练习市场将长大迅猛,且在未来十年,这还将是英伟达GPU的全国。

GPU决战新时代,外乡厂商加速入局-y8.jpg

看到这个数据需求和猜测,国外就出现出了类似Graphcore IPU和Google TPU等ASIC产物,计划在练习市场应战英伟达。Intel和AMD则希望在GPU硬扛英伟达。

AMD和Intel的捋臂张拳

实在早在英伟达进军GPGPU的前后,AMD也有了响应的计划。但和英伟达属在曩昔多年里大力投入推行CUDA开辟情况纷歧样,AMD将鸡蛋都放在了“OpenCL”这个篮子里面,这就致使即使他们在2017年公布了ROCm平台来供给深度进修支持,但也改变不了他们GPU在AI时代几无所获的终局。

但AMD不宁愿。为了与Nvidia合作,AMD在今年三月份推出了新的CDNA架构。据先容,这是AMD针对数据中心和其他用处的,专注于计较的GPU系统结构。AMD针对CDNA的方针既简单又间接:构建一个大型的,功用强大的GPU系列,这些GPU针对一般的计较和数据中心利用停止了优化。

GPU决战新时代,外乡厂商加速入局-y9.jpg

据先容,新架构中很大一部分的性能提升将会表现在机械进修方面,这意味着支持更快地履行较小数据范例(例如INT4 / INT8 / FP16),而AMD在先容新架构的时辰也明白提到了张量运算。此外,新架构可以经过Infinity Fabric互连总线灵活设想性能,并支持增强的企业级RAS特征、平安、虚拟化技术,还将供给更高的能效比,从而下降企业TCO本钱。

基于这个架构,AMD在本月中公布了新一代的Instinct MI100计较卡。数据显现,新的架构可供给高达11.5 TFLOPS的FP64峰值吞吐量,这使其成为第一个在FP64中冲破10 TFLOPS的GPU。与上一代MI50相比,新加速卡的性能进步了3倍。它还在FP32工作负载中具有23.1 TFLOPS的峰值吞吐量。数据显现,AMD的新加速卡在这两个种别中都击败了Nvidia的A100 GPU。

GPU决战新时代,外乡厂商加速入局-y10.jpg

Instinct MI100还支持AMD的新Matrix Core技术,该技术可进步FP32,FP16,bFloat 16,INT8和INT4等单精度和夹杂精度矩阵运算的性能,还可将FP32性能进步到46.1 TFLOPS。

为了更好地与英伟达合作,AMD还暗示,其开源ROCm 4.0开辟职员软件现在具有开源编译器,并同一支持OpenMP 5.0,HIP,PyTorch和Tensorflow。

除了AMD外,Intel在比来几年也加大在其GPU的投入,想在AI这个市场分一杯羹。


英特尔先容,公司的Xe架构GPU将覆盖从集成显卡到高性能计较的一切范围。其中代号为Ponte Vecchio的自力GPU则是公司面临HPC建模和仿真以及AI练习而推出的设想。Ponte Vecchio将采用英特尔的7纳米技术制造,并将成为英特尔首款针对HPC和AI工作负载停止了优化的基于Xe的GPU。但直到今朝为止,尚未看到Intel的这款新品。


此外,为了更好地在包括AI在内的利用市场中发挥其包括CPU、GPU、FPGA和AISC在内的芯片的为例,方便开辟者编程,Intel还推出了具有远达理想的OneAPI。在开辟者看来,这是一个不错的计划,但同时也是一个极具应战的使命。

中国厂商加速入局

在GPU重要性日益凸显的本日,国内越来越多的厂商起头投入到这个市场中去。这些厂商中除了有之前一向在这个市场结构的景嘉微、兆芯和航锦外,还有一些新进入这个范畴的企业。傍边特别以壁仭、沐曦、海飞科、芯瞳最为着名。

首先看壁仞科技,据官网先容,该公司创建于2019年,团队由国内外芯片和云计较范畴焦点专业职员、研发职员组成,在GPU、DSA(公用加速器)和计较机系统结构等范畴具有深厚的技术堆集和独到的行业洞见。

在产物方面,壁仞科技努力于开辟原创性的通用计较系统,建立高效的软硬件平台,同时在智能计较范畴供给一体化的处理计划。从成长途径上,壁仞科技将首先聚焦云端通用智能计较,慢慢在野生智能练习和推理、图形衬着、高性能通用计较等多个范畴赶超现有处理计划,实现国产高端通用智能计较芯片的冲破。

再看沐曦,则是由AMD前高管离职创建的公司。据先容,沐曦集成电路建立于2020年9月,焦点团队来自天下一流的GPU芯片公司,均匀具有15年以上高性能GPU芯片设想经历和丰富的5nm流片和7nm芯片量产经历。公司努力于研发生产具有自立常识产权的、平安牢靠的高性能GPU芯片,办事数据中心、云游戏、野生智能等需要高算力的诸多重要范畴,填补国内高性能GPU芯片自立可控的空缺。

海飞科(Hexaflake)则建立于2019年,是一家高科技草创公司,努力于AI高性能处置器芯片和软硬件全栈系统处理计划的研发,是可以在该范畴与国际巨头不相高低的头部AI通用型处置器公司。首要开创人及焦点团队会聚中美各地多位国际顶级资深专家;特长涵盖并行计较与AI处置器系统架构、GPU等超大范围SoC芯片以及处置器系统软件的研发;并曾在国际领先企业焦点研发部分持久任职,成功研制多款芯片和系统产物。他们公司建立的目标是配合打造新一代通用型AI处置器芯片及其软硬件生态情况。

芯瞳半导体建立于2018年。在接管媒体采访的时辰,他们暗示公司的GPU瞄准的利用范畴有三个方面:嵌入式、办公PC和云游戏。此外,还有授权了Imagination IP的芯动、继续了相关GPU专利的兆芯以及一向做国产CPU的龙芯也是GPU市场的玩家。

斟酌到国内的GPU现状和中美之间的贸易状态,上述GPU厂商除了有看中AI市场的玩家外,也有希望在图形GPU市场有冲破的创业者。

不外正如行业专家告诉笔者,不管是在图形还是通用计较市场,对于GPU而言,更重要的是软件和开辟者生态。只要做好了这个,才是GPU可以商用的条件。国内厂商中何时会有厂商可以真正突围成功的?这值得我们观望。




        原文章作者:一点资讯,转载或内容合作请点击 转载说明 ,违规转载法令必究。追求报道,请 点击这里
Weiot(威腾网)是一家以原创内容、高端活动与全产业渠道为核心的垂直类物联网产业媒体。
回复

使用道具 举报

Weiot(威腾网)是一家以原创内容、高端活动与全产业渠道为核心的垂直类物联网产业媒体。我们关注新兴创新的物联网领域,提供有价值的报道和服务,连接物联网创业者和各种渠道资源,助力物联网产业化升级。
15201069869
关注我们
  • 访问移动手机版
  • 官方微信公众号

© 2014-2020 Weiot.NETEPICGame 威腾网 北京微物联信息技术有限公司 ( 京ICP备20000381号-1 )