文 | 半导体产业纵横女同 偷拍
在科技迅速发展的期间,半导体行业恒久是焦点处所。AI 芯片限度更是犹如战场,各大厂商你争我夺。
近日,AMD 推出新款芯片 MI325X,并随之更新了 AI 芯片蹊径图,这一举措在业内激勉了强烈反响。与此同期,东谈主们庸碌热议,AMD 是否能够向英伟达的陶冶地位发起有劲挑战?AMD 又能从这场强烈的竞争中篡夺些许胜利的果实?除了 AMD,英伟达需要濒临的挑战还有哪些?
在此之前,通盘了解一下 AMD 的新款芯片 MI325X 带来哪些亮点?以偏激最新的 AI 芯片蹊径图又表露了何种信息。
MI325X,能否与 B200 掰手腕?
AMD 最新推出的 Instinct MI325X AI 加快器,在大获收效的 MI300X 基础上再进一步,提防增强了 HBM 内存部分。
在 AMD 的表述中,主要将其与英伟达前代产物 H200 进行对比,而在本年 3 月,英伟达发布了其新款 AI 芯片 B200。至于 AMD 这款新品与英伟达的 H200 比拟有哪些亮点,这款产物有莫得才略与英伟达的最新 GPU B200 掰掰手腕?
为了对比更为详备,本文再次将这几款产物进行对比。
AMD 最新推出的 Instinct MI325X AI 加快器选择了 AMD CDNA 3 GPU 架构,内置 1530 亿个晶体管,配备 256GB 下一代 HBM3E 高带宽内存,提供 6TB/s 的内存带宽。此外,MI325X 在 FP8 和 FP16 精度下永诀达到 2.6 PF 和 1.3 PF 的峰值表面性能。
动作对比,英伟达 3 月发布的基于 Blackwell 架构的 B200 GPU 基于台积电的 N4P 制程工艺,领有高达 2080 亿的晶体管数目和 192GB 的 HBM3e 内存容量,提供了 8TB/s 的内存带宽,以及 20PF 的 FP8 峰值性能。
英伟达 B200 GPU 的 AI 运算性能在 FP8 及新的 FP6 上齐可达 20 PF,是前一代 Hopper 构架的 H100 运算性能 8 PF 的 2.5 倍。在新的 FP4 表率上更可达到 40 PF,是前一代 Hopper 构架 GPU 运算性能 8 PF 的 5 倍。
从工艺制程上来看,MI325X 未作流露,而 B200 选择上文所述的台积电 N4P 制程工艺。
从晶体管数目来看,英伟达 B200 此数值两倍于 AMD MI325X。
从内存角度来看,AMD MI325X 有着更高的内存容量,这可能使其在某些 AI 模子的推感性能上证据出色,但其带宽低于英伟达 B200 的 8 TB/s。
从 FP8 峰值性能来看,英伟达 B200 以 20 PF 的 FP8 峰值性能脱颖而出。诚然在浮点运算才略上,B200 全体上要优于 MI325,但 MI325 的性能也足以得志大多数东谈主工智能和高性能谋略的需求。
从量产时刻来看,两者的量产时刻较为接近。AMD MI325X 展望在 2024 年第四季度认真投产,2025 年一季度启动向客户托福。英伟达的 B200 芯片原操办于本年晚些时候认真出货,关联词由于 Blackwell 产能问题影响,其新款 Blackwell B200 芯片将延长发布三个月或更万古刻,批量出货或延长至来岁第一季度。
总体而言,AMD MI325X 与英伟达 B200 比拟,仍存在权贵差距。不外,与英伟达的前代产物 H200 比拟,MI325X 的数据参数已有了大幅进步。
AMD 数据炫夸,MI325X 与英伟达 H200 的集成平台 H200 HGX 对比,MI325X 平台提供 1.8 倍的内存量、1.3 倍的内存带宽和 1.3 倍的算力水平。苏姿丰还示意,在运行 Meta 的 Llama 3.1 大模子时,MI325X 的推感性能比 H200 高出 40%。
改日 AI 芯片蹊径图,再度更新
除了芯片的发布,AMD 还公布了最新的 AI 芯片蹊径图。
AMD 的 AI 芯片布局女同 偷拍
AMD Instinct MI350 系列首款产物即 Instinct MI355X,将引入新一代的 CDNA 4 架构,选择 3nm 工艺制造,搭配 HBM3E,总容量进一步进步到 288GB,对应带宽提高到 8TB/s,TDP 也高涨到 1000W,操办 2025 年下半年启动发货。
按照 AMD 的说法,Instinct MI355X 提供了 2.3PF 的 FP16 和 4.6PF 的 FP8 谋略性能,比拟前代产物的进步幅度约为 77%。此外,新产物还将支撑新的数据类型,性吧有你春暖花开包括 FP4 和 FP6。
另外,基于下一代 AMD CDNA " Next "架构的 AMD Instinct MI400 系列展望将于 2026 年上市。
英伟达的 AI 芯片布局
沿着议论的 AI 蓝图,英伟达加快前行,接下来将一年就更新一代产物,以平素常是两年更新一代。
本年 6 月,英伟达 CEO 黄仁勋带来了最新的 AI 芯片蹊径图。
脚下,Blackwell 架构的 GPU 产物正在分娩中,将成为 2024、2025 年的高大营收驱动。
接下来,英伟达操办发布一个增强版 Blackwell Ultra GPU ( 8S HBM3e 12H ) ,展望将于 2025 年推出。这款芯片将领有 8 堆叠 HBM3e 内存,每叠有 12 个 die 高。B100 中的叠层粗略是 8 堆叠,因此这应该代表 Blackwell Ultra 上的 HBM 内存容量至少增多 50%,以致可能更多,具体取决于所使用的 DRAM 容量。HBM3E 内存的时钟速率也可能更高。
下一代 Rubin GPU ( 8S HBM4 ) 和相应的平台将于 2026 年上市,这款芯片在此前的英伟达蹊径图中曾被称为 X100,Rubin GPU 将使用 HBM4 内存,并将有 8 个堆栈,粗略每个堆栈齐有 12 个 DRAM。
随后于 2027 年的 Rubin Ultra GPU 将有 12 个 HBM4 内存堆栈,而况可能还有更高的堆栈。
为了有更直不雅的对比,不错仔细查阅下图:
那么,从本理解线图的角度进行不雅察,AMD 与英伟达在发展进度上似乎并莫得太大的差距。关联词,在本色应用场景当中,这两家企业之间的较量究竟呈现出若何一番茂盛呢?当产物信得过参加到多样应用场景中时,不管是在游戏体验、专科图形处理,如故在东谈主工智能等关系限度,AMD 和英伟达的产物会各自愿挥出若何的性能?
较量之下,英伟达依旧是最大赢家
当年数年间,英伟达在数据中心 GPU 市辘集占据了主导地位,险些组成了把持,而 AMD 则持久稳居次席。
把柄本年年头富国银行的统计,英伟达面前在数据中心 AI 市集领有 98% 的市集份额,而 AMD 仅有 1.2% 的市集份额,英特尔则唯有不到 1%。
近日,把柄摩根士丹利分析师发布的阐发称,英伟达 Blackwell GPU 改日 12 个月的产能还是被预定一空。这意味着现不才订单的新买家必须比及来岁年底才气收到货。摩根士丹利的分析师 Joseph Moore 在给客户的一份阐发中指出,英伟达的传统客户(AWS、CoreWeave、Google、Meta、Microsoft 和 Oracle等)还是购买了英伟达偏激勾通伙伴台积电在改日几个季度将能够分娩的整个 Blackwell GPU。
如斯压倒性的需求可能标明,尽管来自 AMD、Intel、云职业提供商(自研 AI 芯片)和多样微型公司的竞争加重,但英伟达来岁的 AI 芯片市集份额将会进一步增长。
不外,AMD 并莫得因此悔过。AMD 在与英伟达的竞争中,持久将自身看作"市集的多一种选拔"。苏姿丰此前示意,AI 芯片市集迷漫大,容得下多家企业," AMD 不是必须要击败英伟达才气收效"。
市集商讨机构 Moor Insights&Strategy 首席分析师帕特里克 · 莫尔黑德(Patrick Moorhead)示意," AMD 濒临的最大挑战是赢得企业市集份额。AMD 需要在销售和营销方面参加更多资金,以加快其企业增长。"
从现时 AI 市集竞争姿首来看,尽管 AMD 新款 GPU 较以往有所越过,但业界分析师以为,AMD 的本领至少过期英伟达一年。
不外,把柄好意思国投资银行和金融职业公司 KeyBanc 分析师约翰・温(John Vinh)的分析,他以为本年AMD MI300X AI 加快卡的出货量将打破 50 万张。该分析师以为在数据中心限度,英伟达诚然一骑绝尘,AMD 难以望其肩背,可是 Instinct MI300X 凭借着不凡的实力,极高的性价比,成为行业客户的高大备选决议,包括联念念在内的部分公司齐招供 MI300X,这最终为 AMD 带来了更多的业务。
在近日的芯片发布会上,AMD 还强调了与甲骨文、谷歌、微软、Meta 等厂商的勾通关系,苏姿丰称,微软、OpenAI、Meta、Cohere 等多个厂商的生成式 AI 平台已选择 MI300 系列驱动。
至于英伟达究竟有何上风,以及基于哪些条目使其在 AI 盛行的期间脱颖而出,主要有以下几点。
两者对比,差距在那儿?
第一,英伟达的 AI 芯片自己性能就十分强悍。从架构设想上来看,英伟达的 AI 芯片选择了高度优化的架构;在浮点运算才略方面,英伟达的 AI 芯片证据不凡。浮点运算才略是揣摸芯片处理才略的要津议论之一;英伟达的芯片还具备出色的并行处理才略。AI 谋略任务常常具有高度并行化的秉性,英伟达的 AI 芯片通过集成大批的谋略单位,能够同期处理多个数据块。这种并行处理才略不错让芯片在处理 AI 任务时充分诈欺数据的并行性,进一步提高谋略效果;在内存带宽和善存设想上,英伟达也有独到的上风。
除了强悍的芯片性能,英伟达在以下几个方面的艰巨也多有裨益。
第二,在研发参加方面,英伟达向来不吝 "血本"。据悉,英伟达在截止七月份的季度中录得 30.90 亿好意思元的研发用度。将这一数字按年谋略,这家 GPU 制造商一年的累计研发用度约 123.6 亿好意思元。
比拟之下,AMD 在其截止 6 月底的季度中录得 15.93 亿好意思元的研发用度。将这一数字按年谋略,该公司一年的累计研发用度为 63.72 亿好意思元。换句话说,把柄面前的年化预测,英伟达面前的研发参加是 AMD 的 2 倍。
其确切发展初期,英伟达就相等醉心研发分娩力。2005 年,AMD 的研发用度为 11 亿好意思元,是英伟达的 3.2 倍傍边;而到了 2022 年,英伟达的研发用度就达到 73.4 亿好意思元,是 AMD 的 1.47 倍。截止整个 2024 财年(2023 年当然年),英伟达研发用度高达 86.75 亿好意思元,是 AMD 同期研发用度的 1.48 倍。
当年 10 年(2014-2023 当然年),英伟达累计参加用度高达 364 亿好意思元,高于苹果公司、微软公司等科技巨头。跟着研发参加的按捺增长,英伟达通过本领越过镌汰资本和产物价钱,按捺推出新的产物眩惑更多虚耗者,上风当然也冉冉突显。
第三,在生态布局方面,英伟达下手也颇早。英伟达推出 CUDA 平台,使得诈欺 GPU 来考试神经收罗等高算力模子的难度大大镌汰,将 GPU 的应用从 3D 游戏和图像处理拓展到科学谋略、大数据处理、机器学习等限度,这一世态系统的诞生让许多设备者依赖于 CUDA,进一步增多了英伟达的竞争壁垒。
大香蕉在线如今 AMD 在霸占市集份额时碰到的最浩劫题,就在于英伟达诈欺自家 CUDA 平台,已在 AI 软件设备限度诞生起一条护城河,把不少设备东谈主员紧紧绑定在了英伟达的生态系统里。动作卤莽,AMD 一直在按捺优假名为 ROCm 的软件,见识即是让 AI 设备东谈主员能更放肆地把更多 AI 模子"搬"到 AMD 的芯片上。面前,ROCm 的最新版块 6.2,相较于旧版在推理和考试上齐有了特出 2 倍的进步。
第四,英伟达凭借早期与台积电的精细勾通,得以在先进制程的获取上霸占先机。在芯片制造中,先进制程工艺能够权贵进步芯片的性能证据。英伟达与台积电持久安祥的勾通关系,使其在芯片分娩的供应链科罚上愈加进修。这种进修体当今分娩操办的精准安排、分娩周期的有用限度以及产物良率的保险上。英伟达不错把柄市集需求预测,合理安排芯片的分娩操办,确保产物能够实时供应市集,得志客户需求。同期,在分娩历程中,较高的产物良率意味着更低的分娩资本和更高的分娩效果。
比拟之下,AMD 在争取台积电先进制程产能时,频频受到英伟达订单的挤压,在分娩操办和良率限度方面可能濒临更多的不细则性,这在一定程度上影响了 AMD 产物的市集竞争力和供货安祥性,进而导致其在 AI 芯片市集份额争夺中处于舛错。
结语
要而言之,英伟达在研发参加、生态布局、分娩制造以及芯片性能等方面齐展现出刚毅的实力,这使其在现时的 AI 芯片市辘集占据了实足的主导地位。关联词,AMD 并非毫无契机。尽管面前 AMD 在这些要津限度相较于英伟达处于舛错,但它正在积极地作念出改换和追逐。
跟着 AI 市集的按捺扩大和本领的执续迭代,改日充满了变数。十年之后的 AI 芯片市集将呈现何种竞争姿首女同 偷拍,还未尝可知。