AMD死战CUDA:我是一家软件公司
撰稿 | 言征
出品 | 51CTO技术栈(微信号:blog51cto)
两个月前,软件在巴塞罗那的公司一场圆桌会议中,AMD高管们向外界透露一项惊人的软件变革消息。
AMD正在进行一项重大改变 :重心将从硬件开发转向强调软件开发、公司API 和 AI 体验。软件
AMD执行副总裁兼首席商务官Phil Guido和计算和图形业务组高级副总裁兼总经理Jack Huynh没有拐弯抹角:
“AMD将软件工程团队规模扩大了三倍,公司并且全力以赴投入软件开发。软件”
1.49亿美元收购,公司3倍扩张研发团队
此前8月,软件我们报道了AMD豪掷49亿美元收购服务器制造商ZT的公司新闻,原因也是软件AMD亟需ZT的1100多名软件工程人员来为其接下来的发展战略来服务。亿华云AMD彼时只有500名左右的公司开发人员。从这一变化我们也可以看出一些端倪 ,软件硬件公司AMD不止满足于设计硬件了 。公司
这一场“软件团队大扩张” ,软件意味着AMD即将迎来一场员工的角色变革。
这不仅意味着引入更多人,更意味着接下来的人员工作内容的变动 :“我们将组织中的一些最优秀的人才调动到这些团队中来提供支持。”当这一转型完成后,该公司将更接近于同行 ,比如英伟达、服务器租用英特尔 。
具体如何转变 ?AMD领导层回应说,过去他们“首先是硅 ,然后才考虑软件开发工具包、工具链 ,最后是ISV(软件开发公司)。”
“我们战略上的转变是首先与ISV交谈……了解开发者希望实现什么功能 。”这是创建新处理器方式的根本性变化。
“过去的AMD只会追求速度和性能。云计算之后,AMD将首先关注AI软件 ,我们(已经)知道如何造硅 。”
从这些谈话可以看出:AMD相信他们现在已经拥有了完整的计算硬件堆栈,从 CPU 到 AI 加速器 ,到 GPU,到 FPGA ,再到数据处理 ,甚至服务器架构。目前在接下来的AI时代的“芯片角逐战”拼图中 ,AMD只剩下一块 :软件(及生态)。
2.架构二合一计算芯片置于游戏芯片之上
9月10日,Jack Huynh再次给外界一个意外的模板下载宣布 :AMD将自家已有5年历史的图形架构RDNA 、计算架构CDNA重新整合在一起 ,推出名为“UDNA”的全新GPU架构。
早在2019年,AMD大刀一挥 ,历史悠久的GCN GPU架构宣告终结,从此分为两条路线:RDNA架构面向图形与视频 ,也就是我们熟知的Radeon游戏显卡 ,而CDNA架构则面向AI、HPC,也就是建站模板Instinct计算卡,迄今都已经发展了三代。
但今时不同往日,游戏 、计算重新回到了二合一 。
Huynh解释道 :(当时)分为两种架构是为了更好地各自优化,包括架构优化 、开发优化,但现在统一架构对于开发者来说更轻松,不再需要做选择 ,尤其是当AMD的数据中心业务越做越大之时 。
这也是AMD也与开发者进行了充分的源码库交流的结果 ,开发者表示非常欢迎统一架构,减少了复杂性 。
此外,Huynh承认,RDNA架构发展过程中犯了一些错误 ,比如内存一致性、缓存子系统的不断改变,每次都需要重新优化,以后不会继续这样了 。
当Huynh并没有提及另一个重要的原因 :市场收入的表现。近期财务报告显示,AMD目前一半的销售额都来自数据中心产品。
在一场有关UDNA的采访中,Huynh透露,此番动作也是想追赶英伟达自家通用CUDA平台的成功 。因此 ,AMD推出新的架构,也是必然。
技术路线的改变背后则是两支研发队伍的整合。“这是一个从云侧到端侧的统一策略,两支队伍将合二为一 ,更加高效 ,或许会有一些曲折,但相信这是正确的方向 。”
也许会有人问 :难道未来的Radeon显卡 、Instinct计算卡都会使用同样的芯片 ?是否会存在功能性上的冗余和浪费 ?
比如计算卡并不需要图形与视频功能 ,游戏卡也不需要太多的计算功能。
这一点Huynh并没有给出明确的答案 。但从他透露的规划——接下来不仅会有RDNA 5、RDNA 6、RDNA 7 ,也会有UDNA 6、UDNA 7,至少已经规划好了未来三代,RDNA和UDNA至少还会同时存在。
这也不难理解,因为AMD的产品需要稳定、持续的优化,并保持完全的前后兼容性 。
但三代以后会怎样 ?小编猜测,未来极有可能只剩下UDNA了。因为未来的GPU显卡将成为图形、视频和计算的综合体 ,正如同AI的未来将是多模态一般。
“要确保AMD做正确的事 。”
3.死战CUDA ?AMD野心的胜算
AMD 唯一的前沿领域是软件,而对于AI领域而言,便是CUDA。
正如前文所述,AMD把以消费者为中心的 RDNA 和以数据中心为中心的 CDNA 架构统一到一个名为 UDNA 的微架构中 ,这一招醉翁之意直指气候大成的CUDA生态。
合并架构的影响很大 ,AMD通过降低高端游戏显卡的优先级,就可以达成两件目的——
一来 ,AMD对内可以集中力量共同攻坚AMD版的“CUDA”软件,二来 ,原来游戏显卡和计算显卡的开发者群体迎来大合并,这无疑可以加速其开发者市场份额的增长。
野心的獠牙已经亮出,那么背后的实力允许吗?
英伟达的CUDA 生态系统已经根深蒂固,但并非无懈可击。
首先,AMD只是没有将软件当成其主要产品,并非完全忽视了软件 。AMD暗暗留了一手:开源 。通过GPUOpen和ROCm等举措,AMD保持其大部分软件基础为开源 ,这对软件开发人员来说是极好的资源,开发者绝对支持开源 。
AMD完全可以借鉴开源的商业打法进一步抢占市场,比如开发出一种能让人们购买其硬件并给开发者带来收入的产品 。
AMD当然也意识到了这一点 ,并希望“在我们的CPU和RDNA之间创建一个统一的架构 ,这将使我们能够简化软件的开发”。这看起来与英特尔的OneAPI类似,很有意义 ,但也将是一个具有挑战性的项目。
英伟达则在这方面有着天然优势,因为这家公司只有一种加速器——运行CUDA的GPU,这是一个所有开发者都可以学习的单一API ,使英伟达能够在价格从200美元到30,000美元的硬件上解决大量的计算挑战。
其次,AMD同样也有一个英伟达不具备的优势 。AMD拥有丰富的计算解决方案知识产权组合,从经典的CPU和GPU,到XDNA FPGA芯片(通过收购赛灵思获得) 。现在,AMD只需要将这些组合在一起 ,展示一个统一的计算接口 ,使得在这些核心品类之间战略性地转移工作负载变得容易,从而最大限度地提高性能、成本效益或两者兼顾 。
这样的能力,将使AMD能够向客户销售由CPU、GPU和专用FPGA(们)等组件组成的单一产品组合加速器系统——就像你购买iPhone ,而不是分别购买屏幕、处理器、5G调制解调器和电池并自行组合一样 。
4.追上英伟达,AMD需要3到5年
AMD正在考虑一个三到五年的时间框架,建立自己的软件生态系统。
围绕这个目标,我们看到了AMD的一些动作。比如,AMD豪掷49亿美元,大幅增加了其软件工程师的人数 。
再比如 ,AMD还更新了加速硬件开发的计划:“我们打算每12个月推出一款新的[Radeon] Instinct产品”,这是一项艰巨的任务 ,但有助于更快地应对软件市场及其需求的变化。在CPU方面 ,AMD“现在专门设置了两个CPU团队,一个负责n+1(下一代),另一个负责n+2(两代之后)” 。
还有 ,今天将游戏GPU、计算GPU统一合并为一种架构UDNA,亦是其中的一环。
那么回到当下 ,AMD到底怎么想的?采访中记者问道 :游戏领域 ,AMD拥有领先地位,难道不会追求旗舰市场吗?Jack Huynh相当坦率:现在的目标是以较低的价格点建立规模和市场份额 ,而不是“山丘之王”旗舰 GPU ,以量取胜。
“我们现在的首要任务是为 AMD 建立规模 。因为现在没有规模 ,我就无法找到开发人员 。如果我告诉开发者 ,我只想争取 10% 的市场份额 ,他们只会说 ,Jack,我祝你一切顺利 ,但我们必须与 Nvidia 合作。所以,我必须向他们展示一个计划,说 ,嘿 ,我们可以通过这个策略获得 40% 的市场份额。然后他们说,我现在和你在一起了,Jack’ 。现在,我将在 AMD 上进行优化。一旦我们得到它,那么我们就可以追求Top。”
5.写在最后
对于昨天的芯片的巨头而言,角逐的焦点更多是光栅化、光线追踪和带宽的竞争 ,然而接下来,生成式AI的爆火已经打乱了原来的布局,下一代的挑战不止在于硬件,还在于软件支持 ,在于软件开发者生态是否足够紧密 。
AMD甚至认为,CPU和GPU之间永恒的拉锯战在未来会发生变化:“我们不能将AI视为像USB那样的复选框/花哨功能——AI有可能成为主角。”
有人士曾这样评价AMD和英伟达:
AMD 是一家硬件公司 ,它生产软件以支持其硬件;而 NVIDIA 是一家软件公司,设计硬件以加速其软件 。
不过,这种“刻板印象”即将改变。AMD正在蓄势转向自己的软件生态。诚如圆桌上AMD发言人所说——
过去的AMD只会追求速度和性能 ,新的AMD将首先关注AI软件。