AI算力的ASIC之路--从以太坊矿机说起(附下载)
今天分享的是行业报告:《AI算力的ASIC之路--从以太坊矿机说起》
(内容出品方:国盛证券)
报告共计:26页
AI 算力的 ASIC 之路——从以太坊矿机说起
近期关于 AI 算力的 GPU 与 ASIC 路线讨论渐多,从推理角度看,ASIC 在成本端 优势明显,而 GPU 在通用性及生态上更胜一筹。若干年前,以太坊矿机也经历了从 GPU 到 ASIC 的迭代,从算力发展角度给我们诸多启发。
天下芯片,通久必专,专久必通。回望芯片发展历史,从 CPU,到图像与深度学习 时代大放异彩的 GPU,再到矿机 ASIC 的异军突起。芯片发展一直遵循着上述规律。 某类需求的爆发,推动通用芯片中的某一功能独立并形成 ASIC,来更好的满足需求。 通用芯片发现需求,专用芯片满足需求,这就是半导体行业面对人类需求时的解决之道,归根结底,客户的需求决定一切。
大模型算力需求急剧膨胀,推理 ASIC 路径逐渐明晰。在 GPT 的推动下,世界迅速 进入了大模型的新纪元。在 Transformer 算法下,算力大小成为了模型迭代的关键 因素,全球对于算力卡的需求迅速井喷,能够先一步满足算力需求的通用 GPU 变得 一卡难求。经过一年发展,大家对于 Transformer 认可度逐渐提升,同时算力的需 求持续加速,促使相关 ASIC 浮出水面。以谷歌 TPU,Groq 为代表的优秀 ASIC 作 品逐渐摸索出了以堆料矩阵乘法核构建“流水线”式处理流程的设计思路,在舍弃 通用 GPU 冗余小核提高性能的同时,也较好针对 Transformer 做了优化。
以矿机为鉴,需求和算法确定性是 ASIC 起量关键。复盘矿机 AISC 发展之路,受益 币价上涨,算力需求井喷,且算法固定的比特币在问世的 3 年内快速完成了矿机的 全面 ASIC 化。而币价前期走势较弱,算力需求不稳定,且一直存在转 POS(停止挖 矿)预期的 ETH 则在结束挖矿时仍未完成 ASIC 化。由此可见,稳定且大量的客户 需求、算法的确定性,是 ASIC 放量的关键。
软件有望成为算力构筑第三极。ASIC 时代,编译器成为了产品设计的壁垒,如何有 效的连接“流水线”中的计算单元与存储,如何在无小核辅助的情况下整理进入计 算核的数据,编译器的难度陡然提升。同时,如何在 CUDA 生态对第三方“兼容” 之路封锁加剧的情况下,做出好用的软件与生态,让用户较为舒适的进行切换,也 将成为新进入玩家需要面临的问题。
兼听则明,ASIC 是通往 AGI 中不可或缺的一环。“硬件的使用者和开发者往往对 立”,这一现象似乎正在 AI 芯片界再次出现,当下,AI 工程师们普遍希望停留在舒 适的 CUDA 生态,忽视通用芯片的冗余元件和低效。而芯片架构师们则在努力地创 造 ASIC 架构,降低最底层的计算成本。而最终决定双方胜负的,唯有需求,需求足 够大,算力的建设方终将为 ASIC 的性价比而买单,需求不明朗,客户则会先采购通 用的产品然后继续观望。全局来看,AI 的叙事足够宏大,与比特币的一轮完全替代 不同,AISC 与通用芯片将螺旋发展,通用芯片探索新算法与模型、ASIC 将通过降 本使得需求得以释放,繁荣的生态吸引更多用户与参与者,最终培育出新的、更强 的算法,循环往复,螺旋上升,最终达成 AGI 的宏伟目标。
展开全文