最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 算力时代,GPU开拓新场景广义上讲AI芯片

    1、算力时代,GPU开辟新场景

    从广义上讲,任何可以运行人工智能算法的芯片都称为人工智能芯片。但是,通常意义上的AI芯片是指专门为加速人工智能算法而设计的芯片。AI芯片也称为AI加速器或计算卡,是专门用于处理人工智能应用中大量计算任务的模块(其他非计算任务仍由CPU处理)。

    第一阶段:由于芯片算力不足,神经网络没有得到重视;

    第二阶段:通用芯片CPU的计算能力得到很大提升,但仍无法满足神经网络的需求;

    第三阶段:新架构的GPU和AI芯片推动人工智能落地。

    GPT-3模型被MIT Technology Review评选为“2021年十大突破性技术”之一。GPT-3 模型使用的最大数据集在处理前的容量为 45TB。根据 OpenAI 的算力统计单位 petaflops /s-days,训练 AlphaGoZero 需要 1800-2000pfs-days,而 GPT-3 需要 3640pfs-days。

    AI计算是指以“深度学习”为代表的神经网络算法,需要系统高效处理大量非结构化数据(文本、视频、图像、语音等)。硬件需要具备高效的线性代数计算能力,计算任务具有单元计算任务简单、逻辑控制难度要求低、并行运算量大、参数多的特点。对芯片的多核并行运行、片上存储、带宽、低延迟内存访问等提出了更高的要求。

    从2012年开始,人工智能训练任务所需的计算能力每3.43个月翻一番,远超芯片行业长期以来的摩尔定律(芯片性能每18个月翻一番)。. 针对不同的应用场景,AI芯片还应满足与主流AI算法框架的兼容性、可编程性、可扩展性、低功耗、尺寸和价格等要求。

    根据机器学习算法步骤ls可编程控制器,可分为训练芯片和推理芯片。训练芯片主要是指通过大量数据输入构建复杂的深度神经网络模型,具有强大计算能力的AI芯片。推理芯片主要是指使用训练好的模型加载数据并计算并“推断”出各种结论的AI芯片,重点关注单位能耗、算力、延迟、成本等方面的表现。

    从技术架构来看,AI芯片主要分为图形处理单元(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)和类脑芯片四大类。其中GPU是比较成熟的通用人工智能芯片,FPGA和ASIC是满足人工智能要求特性的半定制和全定制芯片。类脑芯片的开发仍处于起步阶段。

    GPU(图形处理单元),也称为显示核心、显卡、视觉处理器、显示芯片或图形芯片,是一种专门设计用于在个人电脑、工作站、游戏机和一些移动设备(如平板电脑)上运行的计算机、智能手机等)。执行图形操作的微处理器。GPU减少了显卡对CPU的依赖,分担了部分原本由CPU承担的工作,尤其是在进行3D图形运算时,效果更加明显。图形处理器使用的核心技术包括硬件坐标变换与光源、三维环境材质映射与顶点混合、纹理压缩与凹凸映射、双纹理四像素256位渲染引擎等。GPU 是一种特殊类型的处理器,具有成百上千个经过优化以并行运行大量计算的内核。虽然 GPU 以游戏中的 3D 渲染而闻名,但它们对于运行分析、深度学习和机器学习算法特别有用。

    2019年全球人工智能芯片市场规模为110亿美元。随着人工智能技术的成熟和数字基础设施的不断完善,人工智能的商业应用将加速,推动人工智能芯片市场的快速增长。预计2025年全球人工智能芯片市场规模将达到726亿美元。2019年中国人工智能芯片市场规模约为1.15.5亿元。5G商用的普及,将引发AI芯片在军用、民用等领域的应用需求。在政策、市场、技术的共同作用下,中国人工智能芯片产业将快速发展,2023年市场规模将突破1000亿元。

    2、GPU的三大下游应用市场

    GPU实际上是硬件实现的图形函数的集合,这些函数主要用于绘制各种图形所需的操作。这些与像素、光影处理、3D坐标变换等相关的操作都是通过GPU硬件加速来实现的。图形运算的特点是对大量相同类型的数据进行密集运算——例如对图形数据的矩阵运算。GPU的微架构专为适合矩阵类型的数值计算,以及大量重复设计的计算单元而设计。这样的计算可以分为无数个独立的数值计算——数值运算的大量线程,并且数据不像程序执行那样在逻辑上相关。

    GPU微架构的设计和开发非常重要,而先进和优秀的微架构对于提高GPU的实际性能至关重要。目前市面上有非常丰富的GPU微架构,如Pascal、Volta、Turing(图灵)、Ampere(安培),分别于2016年、2017年、2018年和2020年发布,代表了最高技术水平英伟达显卡。

    GPU微架构的计算部分由流处理器(SP)、纹理映射单元(TMU)、张量核、光线追踪单元(RT Cores)、光栅化处理单元(ROPs)组成。在这些计算单元中,张量单元和光线追踪单元是英伟达在 Volt/Turing 微架构中引入的。GPU的微架构还包括L0/L1操作缓存、Warp调度器、Dispatch Unit、寄存器文件(register file)、特殊功能单元(SFU)、访问单元和显卡互连单元(NV Link)。)、PCIe总线接口、L2缓存、第二代高位宽显存(HBM2)等接口。

    整体布局比较中性。八个 GPC 和 L2 Cache 位于核心区域。左右为外部存储接口。12路显存控制器负责与6个HBM2内存进行数据交互。顶部是负责与主机通信的 PCIe 4.0 控制器。通讯,底部有12个高速NVLink通道,可与其他GPU连接。

    根据GPU下游应用的不同,可分为终端GPU、服务器GPU、智能驾驶GPU、军用显示控制GPU等应用领域。在终端GPU中,分为集成GPU(集成显示)和独立GPU(独立显示)。前者注重轻薄,后者注重性能输出。在服务器等高性能场景中,GPU主要是独立的。

    2020 年 GPU 市场规模为 2.54.1 亿美元,预计到 2027 年将达到 18.53.1 亿美元,从 2021 年到 2027 年的复合年增长率为 32. 82%。GPU 市场分为独立、集成和混合市场。集成在 2019 年主导了 GPU 市场份额,但由于混合处理器同时具有集成和离散 GPU 功能,因此混合细分市场预计将见证最高的复合年增长率。

    市场分为计算机、平板电脑、智能手机、游戏机、电视等。2019 年,智能手机市场主导了全球 GPU 市场份额,预计这一趋势将在预测期内持续。然而,由于医疗设备等其他设备对小型 GPU 的需求不断增长,预计其他细分市场未来的复合年增长率最高。由于图形处理器在设计和工程应用中的广泛使用,预计汽车应用领域将在预测期内以最高的复合年增长率增长。

    在边缘计算场景下,AI芯片主要负责推理任务,通过将终端设备上传感器(麦克风阵列、摄像头等)采集的数据代入训练好的模型进行推理得到推理结果。由于边缘侧场景多样且不同,对计算硬件的考虑也不同,对算力、能耗等性能要求也有大有小。因此,应用于边缘侧的计算芯片需要针对特殊场景进行专门设计,以实现最优解决方案。

    人工智能服务器通常配备GPU、FPGA、ASIC等加速芯片。CPU与加速芯片的结合可以满足高吞吐量互联的需求,为自然语言处理、计算机视觉、语音交互等人工智能应用场景提供强大的算力。支撑已成为人工智能发展的重要支撑力量。与传统CPU服务器相比,在提供相同计算能力的情况下,GPU服务器在成本、空间占用和能耗方面是传统方案的1/8、1/。15 和 1/8。

    目前,云场景中应用最广泛的AI芯片是英伟达的GPU,主要得益于:强大的并行计算能力(相对于CPU)、通用性和成熟的开发环境。2020年全球AI服务器市场规模为122亿美元。预计到2025年全球AI智能服务器市场规模将达到288亿美元,五年CAGR达到18.8%。

    3.海外GPU巨头英伟达

    GPU通用计算标准目前包括OpenCL、CUDA、AMD APP、DirectCompute。其中,OpenCL、DirectCompute、AMD APP(基于开放标准OpenCL开发)为开放标准,CUDA为私有标准。(报告来源:未来智库)

    2006年,公司启动CUDA软件推广,推动GPU向通用计算转型,继而继续加强通用系统的生态建设。为开发者提供丰富的开发软件站SDK,支持现有的大部分机器学习和深度学习开发框架。推出的cuDNN、TensorRT、DeepStream等优化软件也为GPU通用计算提供加速。

    NVIDIA Geforce 系列主要面向家庭和企业娱乐应用。分为性能导向的GTX系列、市场主流的GTS和GT系列,以及已经性价比高的GS系列。数据中心的主要产品是特斯拉系列。通过将不同类型的GPU加速器与CPU、DDR等硬件产品和软件开发相结合,推出了高性能计算HPC、人工智能DGX、边缘计算EGX等硬件产品。软件产品NGC用于GPU加速云平台服务,加速深度学习框架的使用;虚拟GPU主要用于在虚拟机上运行人工智能、深度学习和高性能计算。

    融合 Mellanox 的计算力推 DPU 产品。BlueField DPU 通过卸载、加速和隔离各种高级网络、存储和安全服务,为云、数据中心或边缘等环境中的各种工作负载提供安全的加速基础架构。BlueField DPU 结合了计算能力、数据中心基础的可编程性和高性能网络,可实现非常高的工作负载。

    2021年,GPC将面向服务器市场推出基于ARM架构的CPU,用于大型计算中心或超级计算机等场景,通过Nvlink实现CPU与GPU之间的高带宽链接和交互。未来数据中心将有GPU+CPU+DPU的整体解决方案。

    4、国产GPU赛道掀起投资热潮

    2020年国内AI芯片产业投融资额同比增长52.8%。2021年1-4月投融资事项及金额均超过去年全年。资本投资于国内半导体和集成电路领域。高的。

    从热门领域来看,人工智能领域是2020年资本高度看好的细分领域之一。2020年资本投资主要针对相对成熟的AI芯片公司,获得1-2甚至2轮以上融资。Muxi IC专注于为异构计算等各种应用设计具有完全自主知识产权的高性能通用GPU芯片。

    公司致力于打造国内最强商用GPU芯片。产品主要应用方向包括传统GPU及移动应用、人工智能、云计算、数据中心等高性能异构计算领域。重要基础产品水平。

    计划采用业界最先进的5nm制程技术,重点研发与CUDA和ROCm生态完全兼容的国产高性能GPU芯片,满足HPC、数据中心和AI的计算需求。致力于研发和生产安全可靠的具有自主知识产权的高性能GPU芯片,服务于数据中心、云游戏、人工智能等众多需要高算力的重要领域。

    比仁科技成立于2019年,公司在GPU和DSA(专用加速器)领域拥有丰富的技术储备,专注于云通用智能计算,并在AI训练与推理、图形渲染、图形渲染等多个领域逐步赶超。高性能通用计算。超越现有解决方案,实现国产高端通用智能计算芯片的突破。

    对智能物联网的需求将成倍增加云计算的负载。智能物联网是未来的趋势。海量碎片化场景和计算旭日处理器强大的边缘计算能力,帮助设备高效处理本地数据。针对AIoT,地平线推出了Rising Sun系列边缘AI芯片。旭日2采用BPU Bernoulli1.0架构ls可编程控制器,可提供4TOPS等效算力,旭日3采用伯努利2.0,可提供5TOPS等效算力。

    黑芝麻智能科技是一家专注于视觉感知技术和自主IP芯片开发的企业。公司主要专注领域为嵌入式图像和计算机视觉,提供基于光控技术、图像处理、计算图像和人工智能的嵌入式视觉感知芯片计算平台,为ADAS和自动驾驶提供完整的商业解决方案。

    黑芝麻基于华山二号A1000芯片,提供四种智能驾驶解决方案。单颗A1000L芯片适用于ADAS辅助驾驶;单颗A1000芯片适用于L2+自动驾驶;双A1000芯片互联可达140TOPS算力,支持L3级自动驾驶;4颗A1000芯片可支持L4以上自动驾驶需求。此外,黑芝麻还可以根据不同的客户需求提供定制服务。

    黑芝麻智能与上汽合作的第一颗芯片已实现量产,第二颗芯片A1000正在量产中。在汽车领域开始量产。黑芝麻智能已与一汽、蔚来、上汽、比亚迪、博世、滴滴、迅雷、亚太等公司就L2、L3级自动驾驶感知系统解决方案展开合作。

    五、重点企业分析

    精臣股份:公司是智能机顶盒芯片的领导者,智能电视芯片的领导者,AI音视频系统终端芯片的开拓者。AI音视频系统终端芯片是晶辰大力研发的产品。2017-2020年营收从0.39亿增长到3.42亿,营收占比从2.3%增长到12.48%,复合年增长率高达106.2%,具有很高的增长潜力。

    晨晨的AI音视频系统终端芯片主要分为智能视频和智能音频两大类。A311D和A311X两款智能视频产品基于台积电12nm工艺,采用六核内置神经网络设计。智能音频的A113X/D、S905D2和T962E分别用在各自的终端上,其中Google Home Hub的S905D2基于台积电12nm工艺,支持远场语音识别。公司的AI音视频系统终端芯片也应用于JBL、哈曼、百度等产品。

    报告摘录:

    (本文仅供参考,不代表我们的任何投资建议,相关信息请参阅报告原文。)

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 算力时代,GPU开拓新场景广义上讲AI芯片

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论