当初英特尔和微软,搞出来个Wintel,制霸电脑时期很多年。
从某种意义上,英伟达的CUDA,就相称于CPU时期的windows,承担了构建运用生态的重任。而生态的壁垒,是比芯片性能更深厚的竞争壁垒。以是,CUDA才是英伟达最大的王牌。

在CPU时期,我们被Wintel压制了很多年。在AI时期,英伟达集GPU和CUDA于一身,会是另一个难以冲破的Wintel么?目前看是的。
由于美国对中国AI家当的打压,芯片这张牌被用的越来越频繁。不仅美国政府,便是英伟达自身处于商业竞争的考虑,也越来越方向于“打牌”。而CUDA,便是英伟达最大的王牌。中国要在AI打算领域打破封锁,不仅要有自己的GPU,也要有自己的CUDA。要做成这件事情,目前来看,彷佛只有靠华为了。
CUDA才是英伟达最深的护城河在图形渲染的天下中,英伟达以其博识的GPU技能赢得了市场的青睐。然而,英伟达并未止步于此,它的目光早已超越了图形渲染的边界,投向了更为广阔的打算领域。2006年,英伟达推出了CUDA(Compute Unified Device Architecture),这一举措标志着英伟达从图形渲染巨子向打算巨子的华美转身。
CUDA的发展进程中,有几个关键节点:
2007年:CUDA 1.0的发布,开放了GPU的通用打算能力,为开拓者供应了进入GPU编程天下的钥匙。
2008年:CUDA 2.0增加了对双精度浮点运算的支持,这对付科学打算和工程仿照等领域至关主要。
2010年:CUDA 3.0进一步扩展了GPU的并行处理能力,为更繁芜的打算任务供应了支持。
2012年:CUDA 5.0引入了动态并行性,许可GPU内核自我复制,极大地提升了程序的灵巧性和效率。
这些版本不仅推动了CUDA技能的进步,也成为了GPU并行打算发展史上的主要里程碑。
CUDA的核心在于其创新的并行打算模型,通过将打算任务分解为成千上万的线程,CUDA能够在GPU上实现前所未有的并行处理能力。这种模型不仅极大地提高了打算效率,也使得GPU成为理解决繁芜打算问题的空想平台。从深度学习到科学仿照,CUDA定义了并行打算的新纪元,开启了高性能打算的新篇章。
随着AI和大数据的兴起,CUDA的市场影响力不断扩大。开拓者们纷纭转向CUDA,以利用GPU的强大打算能力来加速他们的运用程序。企业也认识到了CUDA的代价,将其作为提升产品性能和竞争力的关键技能。根据统计数据,CUDA的下载量已经超过了3300万次。
对付英伟达而言,CUDA已经成为英伟达最深的护城河。它不仅巩固了英伟达在GPU市场的领导地位,更为英伟达打开了进入高性能打算、深度学习、自动驾驶等多个前沿领域的大门。随着技能的不断进步和市场的不断扩大,CUDA无疑将连续扮演着英伟达最深护城河的角色,引领着打算技能的未来。
比CUDA晚了12年的达芬奇架构,能撑得起华为的AI野心么?达芬奇架构,作为华为自研的AI打算架构,其起源与华为对AI未来运用的深远洞察密切干系。早在几年前,华为就预测到2025年,环球智能终真个数量将达到400亿台,智能助理的遍及率将达到90%,企业数据的利用率将达到86%。基于这样的预测,华为在2018年全联接大会上提出全栈全场景AI计策,并设计了达芬奇打算架构,以在不同体积和功耗条件下供应强劲的AI算力。
达芬奇架构的发展可以追溯到2018年,华为推出的AI芯片Ascend 310(昇腾310)首次亮相,标志着达芬奇架构的正式运用。紧接着,华为在2019年6月发布了全新8系列手机SoC芯片麒麟810,首次采取达芬奇架构NPU,实现了业界领先的端侧AI算力。麒麟810在AI Benchmark榜单中表现卓越,证明了达芬奇架构的实力。
达芬奇架构是专为AI打算特色而设计的全新打算架构,具备高算力、高能效、灵巧可裁剪的特性。其核心上风在于采取3D Cube针对矩阵运举措看成加速,每个AI Core可以在一个时钟周期内实现4096个MAC操作,比较传统的CPU和GPU实现数量级的提升。此外,达芬奇架构还集成了向量、标量、硬件加速器等多种打算单元,并支持多种精度打算,支撑演习和推理两种场景的数据精度哀求。
达芬奇架构的运用领域广泛,覆盖了从端侧到云真个全场景AI运用。在端侧,麒麟810芯片的AI算力已经在智好手机中得到运用,为消费者供应了丰富的AI运用体验。在边缘侧和云端,Ascend系列AI处理器可以知足从几十毫瓦到几百瓦的演习场景,供应最优的AI算力。达芬奇架构的灵巧性和高效性,使其在聪慧城市、自动驾驶、工业制造等多个领域中发挥着重要浸染。
诚然,达芬奇架构在华为的AI市场布局中霸占了核心的位置。它不仅是华为AI芯片的技能根本,也是华为实现全栈全场景AI计策的主要支撑。通过达芬奇架构,华为能够供应从硬件到软件的全栈AI办理方案,加速AI技能的家当化和运用落地。此外,达芬奇架构的统一性也为开拓者带来了便利,降落了开拓和迁移本钱,促进了AI运用的创新和发展。
达芬奇VS CUDA,有几分胜算?比较于2006年推出的CUDA,华为达芬奇要晚了12个年头。这12年中,达芬奇一贯在追赶。除了韶光上的差距,达芬奇和CUDA还在架构设计哲学、性能表现、工具链、开拓者生态等多个层面存在显著的差异。
在设计哲学方面,CUDA是英伟达开拓的并行打算平台和API模型,它许可开拓者利用NVIDIA的GPU进行高效的并行打算。而达芬奇架构是华为自研的面向AI打算特色的全新打算架构,它采取了3D Cube针对矩阵运举措看成加速,大幅提升单位功耗下的AI算力。CUDA的设计更看重通用性,而达芬奇则专注于AI打算的高效性。
在AI打算性能方面,CUDA和达芬奇各有千秋。CUDA凭借多年的技能积累,支持大规模并行处理能力,适宜处理各种繁芜的打算任务。达芬奇架构则通过其3D Cube打算引擎,针对矩阵运算进行优化,实现了在单位面积下的AI算力显著提升。在深度学习等AI运用处景中,达芬奇架构展现出了精良的性能表现。
CUDA和达芬奇架构在不同领域下的适用性各有侧重,CUDA由于其通用性,被广泛运用于科学研究、医学、金融等多个领域。而达芬奇架构则紧张针对AI打算,特殊是在端侧、边缘侧及云真个AI运用处景中,如智好手机、自动驾驶、云业务等。
从开拓者的角度来看,CUDA和达芬奇架构在编程模型与工具链的易用性上有所不同。CUDA供应了一套完全的开拓工具链,包括CUDA编译器、调试器、性能剖析工具等,支持多种编程措辞和深度学习框架。达芬奇架构虽然起步较晚,但华为也在积极构建其工具链和开拓者生态,供应必要的支持以促进开拓者的利用和创新。但从工具链的完全性和丰富度来看,达芬奇离CUDA还有不少的差距。
CUDA通过其广泛的运用和成熟的技能,已经建立了一个弘大的开拓者社区和生态系统。而生态的培植,是比纯挚提升GPU性能更难得事情,这才是对华为真正的磨练。
华为GPU快成了,但离构建自己的CUDA还很迢遥目前看,华为GPU发展态势较好。
根据公开信息,2023年华为算力GPU的出货量大约为十万片。随着产能的增加,估量到2024年,这个数字将翻几番,达到几十万片的规模。只管产能有所提升,市场上的订单需求依然非常兴旺,仅在2024年1月份的下单量就已经达到了数十万片。目前,下单需求已经达到上百万片,远超华为当前的供应能力。
在海内购买情形方面,华为算力GPU受到了市场的热烈追捧。华为算力GPU的客户紧张分为三个梯队:第一类是三大运营商和政务类客户,第二类是互联网客户,第三类是其他公司。由于算力GPU的紧缺,客户为了尽快拿到产品,都在努力成为第一梯队的客户,乃至采纳与地方政府互助等方法以确保优先供应。
价格方面,华为算力GPU自2023年8月上市以来,价格已经经历了至少两次提价。最初上市的价格约为7万元公民币,而目前市场价格已经上涨至约12万元公民币。
总体来看,华为GPU的发展态势良好,市场需求强劲,只管供应紧张,但这也反响出华为GPU在性能和国产化方面的上风,使其成为市场中的热门选择。随着技能的不断进步和产能的进一步提升,估量华为GPU将在未来市场中霸占更主要的位置。
在一次专访中,黄仁勋表示:“华为是个好公司”。此外,英伟达在财报中将华为列为紧张竞争对手,这反响了华为在GPU及干系技能领域的竞争力正在增强。
只管华为GPU发展态势良好,但CUDA作为GPU领域占主导地位的框架,其生态系统的成熟度和广泛接管度远远超过了其他框架,包括AMD开拓的框架。华为的AI打算框架在生态培植方面确实还有很长的路要走,须要持续的技能创新和市场推广才能逐步构建起与CUDA相匹敌的生态系统。
然而,英伟达不想给华为发展起来的韶光了。
近期,英伟达对其CUDA平台的兼容性政策进行了调度,限定了CUDA软件在非英伟达硬件平台上的运行行为,这一决策始于2021年,并在随后的韶光里逐步加强。详细来说,英伟达通过更新其终极用户容许协议(EULA),明确禁止了利用转换层或仿照层在非英伟达GPU上运行CUDA代码的行为。
这一政策变动紧张影响了那些试图通过转译技能实现CUDA兼容性的第三方项目,例如ZLUDA等。ZLUDA是一个许可在非英伟达硬件上运行CUDA程序的转译库,它供应了一种相对大略的办法,使得开拓者能够在性能略有丢失的情形下,运行CUDA程序。
英伟达此举,被广泛认为是保护其市场份额和掩护其技能掌握权的计策举措。通过限定在其他芯片上利用CUDA软件的办法,英伟达确保其GPU仍旧是开拓职员和依赖其并行打算平台的企业的首选。
然而,这一决策在业界引起了不小的震撼,并引发了广泛的谈论。不少人责怪英伟达借助封锁政策垄断市场,压制竞争对手的发展机会。
面对英伟达的限定政策,一些海内GPU企业如摩尔线程选择了遵守EULA规定,并表态采取重新编译代码的办法与EULA保持同等,以避免违反英伟达的限定条款。
此外,业界其他力量,包括AMD、英特尔等厂商,并未因英伟达的限定而止步,他们正在积极推动开放、可移植的生态系统培植,以试图冲破英伟达的市场垄断。
面对英伟达的出牌,华为在发展自己的GPU技能时,须要更多地依赖自主研发的软件工具和开拓环境,而不是依赖于CUDA这样的成熟平台。这意味着华为须要投入更多的资源来构建自己的软件生态系统,包括开拓与CUDA性能相匹敌的编程工具、库和API。
可以预见,在未来较长一段韶光内,由于CUDA的广泛利用和对高性能打算、AI等领域的深远影响,英伟达的这一政策可能会限定华为GPU的市场接管度,特殊是在那些已经深度依赖于CUDA的领域。
这加强了华为构建自身AI打算架构和AI生态的紧迫性,就像当初安卓断供造诣了鸿蒙一样,CUDA的收紧会否成为华为达芬奇架构的神助攻呢?现在还不好评判,让子弹飞一会吧。







