IBM的AI野心:用模拟芯片取代数字芯片
来源:半导体行业观察
尽管我们仍处于人工智能革命的边缘,但人工智能已经开始彻底改变我们的生活和工作方式。只有一个问题:人工智能技术非常耗电。据估计,运行大型人工智能模型在其生命周期内产生的排放量比普通美国汽车还要多。
(相关资料图)
人工智能的未来需要能源效率方面的新创新,从模型的设计方式到运行模型的硬件。在一个日益受到气候变化威胁的世界中,人工智能能源效率的任何进步对于跟上人工智能快速扩大的碳足迹都至关重要。
IBM 研究中心在人工智能效率方面的最新突破之一依赖于模拟芯片,即功耗低得多的芯片。在今天发表在《自然》杂志上的一篇论文中,来自世界各地 IBM 实验室的研究人员展示了他们的原型模拟 AI 芯片,用于节能语音识别和转录。他们的设计被用于两个人工智能推理实验,在这两种情况下,模拟芯片都像同类全数字设备一样可靠地执行这些任务,但完成任务的速度更快,消耗的能源更少。
为人工智能推理设计模拟芯片的概念并不新鲜——研究人员多年来一直在考虑这个想法。早在 2021 年,IBM 的一个团队就开发了使用当电脉冲施加到材料上时,相变存储器 (PCM) 就会工作,从而改变设备的电导率。该材料在非晶相和结晶相之间切换,较低的电脉冲将使器件更加结晶,提供较小的电阻,而足够高的电脉冲使器件非晶态,从而产生大电阻。PCM 设备不是记录数字系统中常见的 0 或 1,而是将其状态记录为非晶态和晶态之间的连续值。该值称为突触权重,可以存储在每个 PCM 设备的物理原子配置中。存储器是非易失性的,因此当电源关闭时重量仍会保留。相变存储器将神经网络的权重直接编码到物理芯片上。但该领域之前的研究尚未表明如何将此类芯片用于我们所看到的当今人工智能领域主导的大规模模型。例如,GPT-3 是较大的流行模型之一,拥有 1750 亿个参数或权重。
IBM 研究团队创建的设计可以在每个芯片上编码 3500 万个相变存储设备;换句话说,模型具有多达 1700 万个参数。虽然其规模尚未与当今最先进的生成式人工智能模型相媲美,但将这些芯片组合在一起使其能够像数字芯片一样有效地处理真实人工智能用例的实验。
团队采取的方法是优化在计算中,尤其是在数字信号处理中,MAC 运算是指计算两个数字的乘积并将其添加到累加器(CPU 中处理算术运算的部分)。MAC 是一个基本的计算单元。乘法累加 (MAC) 运算主导深度学习计算。通过读取电阻式非易失性存储器 (NVM) 器件阵列的行,然后沿列收集电流,该团队表明他们可以在存储器内执行 MAC。这样就无需在芯片的内存和计算区域之间或跨芯片移动权重。模拟芯片还可以并行执行许多MAC操作,从而节省时间和能源。
模拟概念具有巨大潜力,但芯片设计和制造也面临重大挑战:模拟计算本质上不精确,必须开发新工艺才能大规模生产高产量 NVM,并将模拟芯片连接到传统数字芯片。系统。但 IBM 的研究人员所做的工作表明,这些芯片在未来可能会像数字芯片一样有用。
测试模拟人工智能硬件
IBM 研究中心的团队设计了两个实验来测试其设计的有效性。第一个围绕关键字话语检测。就像您希望智能扬声器在您大声说“嘿 Siri”或“嘿 Google”时做出响应一样,该团队希望看到他们可以使用他们的芯片设计来识别特定的口语单词。他们构建了一个可监听 12 个单词的系统,在每种情况下,模拟芯片都能以与当今基于软件的系统相同的精度对每个单词做出反应,但速度要快得多。如今等待和侦听特定关键字的系统需要电源才能闲置等待,而团队创建的设计可以在不需要时关闭电源,因为模型权重存储在芯片上的非易失性存储器中。
使用上传到MLCommons(行业基准测试和协作网站)的模型,该团队可以将演示系统的功效与在数字硬件上运行的系统进行比较。由 MLCommons 开发的MLPerf 存储库基准数据显示,IBM 原型比同一网络类别中最佳 MLPerf 提交快七倍,同时保持高精度。该模型使用硬件感知训练在 GPU 上进行训练,然后部署在团队的模拟 AI 芯片上。
第二个实验规模相当大,暗示未来可以使用基于模拟芯片的生成人工智能系统来代替数字芯片。它的目标是使用团队的五个芯片缝合在一起来实现一个大型复杂的模型,并模拟片外数字计算,以展示模拟人工智能的可扩展性。研究人员运行了 MLPerf 上发现的循环神经网络转换器(RNNT)语音到文本模型,以逐个字母地转录一个人所说的内容。RNNT 在当今的许多现实应用中很受欢迎,包括虚拟助手、媒体内容搜索和字幕系统以及临床文档和听写。
该系统包含 5 个芯片上 1.4 亿个 PCM 设备的 4500 万个权重。它能够采集人们说话的音频并以非常接近数字硬件设置的精度进行转录。与第一个演示不同,这个演示并不完全是端到端的,这意味着它确实需要一些片外数字计算。然而,这里涉及的额外计算很少,如果在芯片上实现,最终的能源效率仍然高于当今市场上的产品。
该团队再次使用上传到 MLCommons 的数据,将其网络的功效与在数字硬件上运行的 RNNT 进行比较。MLPerf 数据显示,IBM 原型的每瓦性能(或效率)估计比同类系统高出大约 14 倍。这是 IBM 研究人员能够使用 MLPerf 进行实际测试的第一个模拟系统,因为过去的实验规模太小,无法进行比较。
模拟人工智能的下一步是什么
自然语言任务并不是模拟人工智能可以解决的唯一人工智能问题——IBM 研究人员正在研究许多其他用途。在本月早些时候发表在《自然电子》杂志上的一篇论文中,该团队展示了可以使用节能模拟芯片设计来实现可扩展的混合信号架构,该架构可以在计算机视觉图像识别的 CIFAR-10 图像数据集中实现高精度。
这些芯片由位于东京、苏黎世、纽约约克敦高地和加利福尼亚州阿尔马登实验室的 IBM 研究人员构思和设计,并由外部制造公司制造。相变存储器和金属层在位于奥尔巴尼纳米技术综合体的 IBM 研究实验室进行了处理和验证。
如果您将今天在《自然》杂志上发表的工作的优点(例如大型阵列和并行数据传输)与《自然电子》论文中展示的芯片的强大数字计算模块相结合,您会看到许多构建模块实现快速、低功耗模拟 AI 推理加速器的愿景所需。并将这些设计与硬件弹性训练算法相结合,该团队预计这些人工智能设备将来能为各种人工智能模型提供相当于神经网络精度的软件。
虽然这项工作对于模拟人工智能系统来说是向前迈出的一大步,但在我们在市场上看到包含此类设备的机器之前,还有很多工作要做。该团队在不久的将来的目标是将上述两个工作流整合到一个模拟混合信号芯片中。该团队还在研究如何在他们的芯片上实现基础模型。
模拟人工智能现在正在很大程度上解决当今数字系统正在解决的各种人工智能问题,并且具有功耗意识的模拟人工智能的愿景与我们今天使用的数字系统相结合,变得越来越清晰。
延伸阅读:IBM 用于深度学习推理的模拟 AI 芯片
我们正处于人工智能革命的开端,这场革命将重新定义我们的生活和工作方式。特别是,深度神经网络 (DNN) 彻底改变了人工智能领域,并随着基础模型和生成式人工智能的出现而日益受到重视。。但在传统数字计算架构上运行这些模型限制了它们可实现的性能和能源效率。专门用于人工智能推理的硬件开发已经取得了进展,但其中许多架构在物理上分割了内存和处理单元。这意味着人工智能模型通常存储在离散的内存位置,计算任务需要在内存和处理单元之间不断地整理数据。此过程会减慢计算速度并限制可实现的最大能源效率。
IBM 研究中心一直在研究重塑人工智能计算方式的方法。模拟内存计算,或者简称模拟人工智能,是一种很有前途的方法,可以借用神经网络在生物大脑中运行的关键特征来应对这一挑战。在我们的大脑以及许多其他动物的大脑中,突触的强度(在本例中是“权重”)决定了神经元之间的通信。对于模拟人工智能系统,我们将这些突触权重本地存储在纳米级电阻存储设备的电导值中,例如相变存储器(PCM) 并通过利用电路定律并减少在内存和处理器之间不断发送数据的需要来执行乘法累加 (MAC) 操作,这是 DNN 中的主要计算操作。
为了将模拟人工智能的概念变成现实,需要克服两个关键挑战:这些存储器阵列需要能够以与现有数字系统相当的精度进行计算,并且它们需要能够与其他数字计算单元,以及模拟人工智能芯片上的数字通信结构。
在早前发表在 Nature Electronics 上的一篇论文中,IBM Research 引入了最先进的混合信号模拟 AI 芯片来运行各种 DNN 推理任务,从而在应对这些挑战方面迈出了重要一步。它是第一款经过测试的模拟芯片,与数字芯片一样擅长计算机视觉人工智能任务,同时能效显着提高。
该芯片是在 IBM 的Albany NanoTech Complex中制造的,由 64 个模拟内存计算核心(或块)组成,每个核心包含 256×256 的突触单位单元交叉阵列。每个模块中都集成了紧凑的基于时间的模数转换器,以在模拟世界和数字世界之间进行转换。每个图块还集成了轻量级数字处理单元,执行简单的非线性神经元激活功能和缩放操作。
每个图块可以执行与 DNN 模型的一层相关的计算。突触权重被编码为 PCM 设备的模拟电导值。全局数字处理单元集成在芯片中间,可实现更复杂的操作,这些操作对于执行某些类型的神经网络至关重要。该芯片还在所有块和全局数字处理单元的芯片互连处具有数字通信路径。
使用该芯片,我们对模拟内存计算的计算精度进行了最全面的研究,并在CIFAR-10图像数据集上证明了 92.81% 的准确率。我们相信这是目前报道的使用类似技术的芯片中精度最高的。在本文中,我们还展示了如何将模拟内存计算与多个数字处理单元和数字通信结构无缝结合。测得的每个区域的吞吐量为400 GOPS/mm2 的 8 位输入输出矩阵乘法该芯片的功耗比之前基于电阻式存储器的多核内存计算芯片高出 15 倍以上,同时实现了可比的能源效率。
通过将这种 64 块芯片的面积和能源效率高的模数转换器 (ADC)、高度线性乘法累加计算和强大的数字计算块与我们展示的大规模并行数据传输相结合我们在 2021 年IEEE VLSI 研讨会上推出的 34 块芯片中,现在已经展示了实现快速、低功耗模拟 AI 推理加速器芯片架构愿景所需的许多构建模块。
利用我们的学习成果,我们设计了一个类似的加速器架构,该架构于今年早些时候发布在IEEE Transactions on VLSI systems上。我们的愿景将许多模拟内存计算块与与大规模并行 2D 网格连接的专用数字计算核心相结合。结合我们近年来开发的复杂的硬件感知训练,我们期望这些加速器在未来几年能够在各种模型中提供与软件等效的神经网络精度。
标签:
- IBM的AI野心:用模拟芯片取代数字芯片
- A股三大指数全线翻绿 下跌股票超过2400家
- 中国恒大(03333.HK)今早复牌
- 首都在线(300846):该股换手率大于8%(08-30)
- 女的说cd什么意思(网上女人说cd什么意思)
- 满秩矩阵 满秩
- 老郑说汇|就业数据不佳 美元走势有较大不确定性
- 新学期,上海将启动实施第二轮公办初中强校工程 79所学校入选
- 双枪科技:公司将为亚运会服务的餐厅提供宴会用筷
- 长鸿高科拟现金购买广西长科100%股权 进一步拓展产业链
- 2023年“全民健身挑战日”活动将在省内7个城市陆续开赛
- 落心伤情客(关于落心伤情客简述)
- 台风“苏拉”来袭,白云机场提醒旅客出行留意航班动态
- 2023东莞高中学考成绩合格是多少分?
- 焦点访谈:全力以赴保开学
- 樱花校园模拟器联机版怎么联机 樱花校园联机版最新版本如何联机
- 现烤现卖!今年中秋月饼流行“趁热吃”
- @蔡嵩松 你卸任还没多久的基金,今天涨幅第一了
- 超级工程,在水一方
- 智造河南“青”力相助②丨用好算力加速器 为良药研发贡献“她力量”
- 广东省中山市官宣执行“认房不认贷”,即日起施行
- 马斯克与钢铁侠到底有多相似?
- 西安轨交:2023年中报净利润发生亏损
- 国联股份半年报后这个涨停,属于分歧中的一致
- 中国制造业PMI连续三个月回升
- 未来8年,四大生肖自带高贵气场,运势爆发,同理心很强
- 中石化长治石油黄碾加能站暖心救助受伤路人
- 华侨城A:2023年上半年签约销售额同比下降16%
- 双枪科技:公司将为亚运会服务的餐厅提供宴会用筷
- 2023年中央专项彩票公益金支持青年社会组织服务社区青少年“伙伴计划”示范项目拟承接青年社会组织公示
- 聚焦旅博会 | 第十三届中国旅游产业博览会宣传短视频(4)
- 西部超导:上半年实现归母净利润4.21亿元,同比减少23.77%
- 小米2023年Q2经调净利润51.4亿元同比增147%,雷军之前再强调高端化
- 粮油优品出川,“天府菜油”亮相第五届粮交会
- CSGO:Tyloo内讧升级或将彻底重组!DanK1ng:有三人要坐我旁边了
- 队报:巴黎拒绝水晶宫对埃基蒂克的租借报价
- 就在明天!上海中小学幼儿园积极准备,迎接新学期~
- 科沃斯跌8.78%机构净卖出5亿 中信证券定目标价精准
- 电力先行,守护开学季
- 中国贸促会助企业减轻台风“杜苏芮”影响
- 赛为智能上半年净利润约2401万元,实现扭亏为盈
- 《赛马娘》同人志:あなたの隣で踊りたい
- 油价低位反弹 “转折点”来了?
- “天府菜油”领衔 川粮油优品在中原大地“吸金”展形象
- 为了让孩子们上好科学课 教师们暑期忙“充电”
- 答答星球今日正确答案最新(答答星球)
- 美国披露拟议新规 更多银行将面临长期债券发行要求
- 城投如何适应新发展格局?业界大咖这样说
- 首钢园升级打造 3.0版服贸会场馆
- 8月31日外汇市场行情走势分析:随着市场重新评估美联储的举措和对中国的担忧,美元暂停下跌。美元走低?
- 量化和但斌,吵起来了?又和好了?
- 学生在校保险是哪方面的保障?好处有哪些呢?
- 工信部:前7月我国软件业务收入64570亿元 同比增长13.6%
- 度亘核芯荣获 “维科杯·OFweek2023年度最佳半导体激光器技术创新奖”
- talkSPORT:富勒姆为拜仁目标帕利尼亚标价8000万英镑
- 人口净流入超100万的11个普通地级市:东莞苏州佛山位居前三
- 六大行上半年业绩“一升一降” 五家住房按揭贷款合计减少2360.62亿
- 济南十大整形医院排名 详情介绍
- 贵港覃塘区养老院有哪些?贵港覃塘区养老院一览表(2023年)
- 众安在线上半年净利润 2.21 亿扭亏为盈,总保费增逾 37%
- 喜天影视回应宋祖儿被举报偷税:合约已结束,未发现有内部员工实名举报的情况
- 昆明海关严防外来物种入侵 维护国门生物安全
- Ⅱ级应急响应 南方电网深圳供电局全力迎战台风“苏拉”
- 2023智博会倾力打造国际经贸科技合作平台
- 农夫山泉上半年净利逾57亿元 东方树叶带动茶饮料成第二增长曲线
- 9月追星日历丨中秋满月、最亮金星、水星西大距……9月将有这些天象点亮夜空
- 新青年丨影视特效化妆师:一个“毛孔”就可能露馅!
- 广东多地教育局通知,中小学开学时间推迟,家长要做好准备
- 长高电新:公司参股公司浙江富特科技股份有限公司目前正处于提交注册排队阶段
- 组图:体育文化双展杭州开展探寻中国三千年体育历史
- 算力互联 智领未来——第十九届CCF全国高性能计算学术年会在青岛举行
- 恒大财富:因资产处置进度不及预期,未获得资产处置资金,无法开展本月兑付
- 龙胜温泉在哪里 龙胜温泉在哪里?现在开放吗
- 欧元区通胀顽固,还加不加息?欧洲央行2位官员发表讲话
- 独立报:热刺寻求锋线补强,有意巴萨的法蒂和水晶宫的埃泽
- 顶端排位中的T1,全段位却只有T3,高端局公孙离玩法解析
- 春节的来历20字左右作业帮 春节的来历20字
- 民生银行房地产贷款占比持续下降
- 半场-萨里奇被换下双方均无建树 南通支云暂0-0青岛海牛
- 白眼狼?巴基斯坦公开歼10数据,向西方证明:解放军战机的核心
- 英国空管系统故障致大量航班取消或延误
- 明天,请提前出门!
- 人才层出不穷,成大器者却屈指可数,江苏球员为何“伤仲永”居多
- 中国财政政策展望:下半年重点工作有五项
- 临时闭馆,别跑空!昆明植物园发布最新通告
- 一个乡村的诗书相传
- 滚球大小球分析(滚球大小球看盘技巧)
- 未来一个月,锦鲤相伴,事业有进步,天天有钱赚的3星座
- 莫力达瓦达斡尔族自治旗教育局(关于莫力达瓦达斡尔族自治旗教育局简述)
- 受半球是什么意思啊(受半球)
- 江西省政协常委王培一行走访调研江西大强
- 强邦新材9月7日深交所首发上会 拟募资6.68亿元
- 宪友社_关于宪友社介绍
- 21健讯Daily|医保局要求高质量开展第四批高值医用耗材国采;颜宁石正丽成为院士候选人
- 师从著名声乐教育家马秋华,史倩独唱音乐会来了!(有福利)
- 90后作家王苏辛推出《再见,星群》:书写远离故土、独自生长的普通人
- 2023北京慕田峪长城夜游活动延长至十一黄金周
- 洪江区开展2023年文化科技卫生 “三下乡”暨新时代文明实践集中示范活动
- 屈原管理区应急救护培训走进军训课堂
- 伊朗召见瑞士驻伊朗代办 抗议美国扣押伊朗石油举措