b体育新闻

b体育官网

当前位置: 首页 > b体育新闻

b体育新闻

首页 > b体育新闻

如何设计一颗AI芯片?来自Meta的实践!

作者:b体育发布时间:2024-12-30

  国内外的科技巨头都正争先恐后地要在AI领域大展拳脚:微软正在计划彻底打通Bing和ChatGPT之间的生态壁垒,谷歌也官宣了Bard全面开放,马斯克也表示推特和特斯拉未来有必要开展AI业务与谷歌和微软相抗衡。

  据悉,Meta之前发展AI业务时,一直没有接受使用GPU,相反,直到去年,Meta都在主要使用CPU队列运行人工智能工作负载,这也是Meta在AI进程上落后对手的关键原因之一。目前,Meta内部已开始计划开发一款新型芯片,类似GPU,既能训练AI模型,又能进行推理,该项目将于2025年左右完成。

  Meta Platforms今天分享了其数据中心项目的新细节,以更好地支持人工智能工作,包括内部开发的定制芯片“系列”。

如何设计一颗AI芯片?来自Meta的实践!

  以下是 MTIA v1 芯片的基本规格:基于一个双核 RISC-V 处理元件,包含25 瓦芯片和 35 瓦双 M.2 外围卡。

  因为它是低频率的,MTIA v1 芯片消耗的功率也相当低,并且采用 7 纳米工艺实现意味着该芯片足够小,可以运行得非常酷,而无需采用台积电最先进的工艺。台积电的从 5 纳米到 3 纳米不这些更昂贵的工艺,可以留到以后再使用。就像谷歌的TPU那样,当工艺更便宜时使用在新一代设备上进行训练和推理。b体育

  MTIA v1 推理芯片有一个由 64 个处理元件组成的网格,这些处理元件周围环绕着 128 MB 的 SRAM 内存,可用作主存储器或前端有 16 个低功耗 DDR5 (LPDDR5) 内存控制器的高速缓存。

  这种 LPDDR5 内存用于笔记本电脑,也用于 Nvidia 即将推出的 Grace Arm 服务器CPU。这 16 个 LPDDR5 内存通道可以提供高达 64 GB 的外部内存。

  这 64 个处理元素基于一对 RISC-V 内核,一个是普通的,另一个是带有矢量数学扩展的b体育官网入口。每个处理元件都有 128 KB 的本地内存和固定功能单元,用于执行 FP16 和 INT8 数学运算、处理非线性函数和移动数据b体育官网入口

  Meta 揭开了其为 AI 工作负载开发内部基础设施的努力的帷幕,包括支持其最近推出的广告设计和创作工具的生成 AI 类型。这是对 Meta 实力投射的一次尝试,Meta 在采用 AI 友好的硬件系统方面历来进展缓慢,这阻碍了其与谷歌和微软等竞争对手保持同步的能力。

  “构建我们自己的 [硬件] 功能使我们能够控制堆栈的每一层,从数据中心设计到训练框架,”Meta 基础设施副总裁 Alexis Bjorlin 告诉 TechCrunch。“需要这种水平的垂直整合才能大规模突破人工智能研究的界限。”bsport

  在过去十年左右的时间里,Meta 花费了数十亿美元来招募顶级数据科学家并构建新型人工智能,包括现在为发现引擎、审核过滤器和遍布其应用程序和服务的广告推荐器提供支持的人工智能。但该公司一直在努力将其许多雄心勃勃的 AI 研究创新转化为产品,尤其是在生成 AI 方面。

  直到 2022 年,Meta 主要使用 CPU 和专为加速 AI 算法而设计的定制芯片的组合来运行其 AI 工作负载——CPU 在处理这类任务时的效率往往低于 GPU。Meta 取消了计划于 2022 年大规模推出定制芯片的计划,转而订购了价值数十亿美元的 Nvidia GPU,这需要对其多个数据中心进行重大重新设计。

  为了扭转局面,Meta 计划开始开发更具雄心的内部芯片,该芯片将于 2025 年推出,能够训练 AI 模型并运行它们。

13244774814

168169@bsport.com