12月3日,阿里巴巴达摩院(以下简称达摩院)宣布,该院已成功研发存算一体人工智能(AI)芯片。达摩院介绍,该存算一体芯片集成了多项创新技术,是全球首款使用“混合键合3D堆叠技术”实现存算一体的芯片。这一新型架构芯片的诞生,将有望助力存算一体技术从概念走向落地。
在摩尔定律逐渐放缓的背景下,存算一体被认为是解决计算机性能瓶颈的关键技术之一。形象地说,存算一体芯片近似人脑,通过将数据存储单元和计算单元融合,可大幅减少数据的传输和搬运,从而能极大地提高计算并行度和能效。然而,尽管存算一体技术早在20世纪90年代就被提出,但受限于技术的复杂度、高昂的设计成本以及应用场景的匮乏,过去几十年,业界对存算一体芯片的研究进展缓慢。
据介绍,达摩院存算一体芯片内存单元采用异质集成嵌入式DRAM(SeDRAM),拥有超大带宽、超大容量等特点;计算单元方面,达摩院研发设计了流式的定制化加速器架构,对推荐系统进行“端到端”的加速,包括匹配、粗排序、神经网络计算、细排序等任务。
“存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势,可以从底层架构上解决后摩尔定律时代的芯片性能和能耗问题。”达摩院计算技术实验室科学家郑宏忠介绍说,达摩院存算一体芯片可满足人工智能等场景对高带宽、高容量内存和极致算力的需求;在特定AI场景(如推荐系统应用)中,该芯片性能提升10倍以上,能效比提升高达300倍。
过去70年,计算机一直遵循冯·诺依曼架构设计,运行时数据需要在处理器和内存之间来回传输。随着时代发展,这一工作模式面临较大挑战:在人工智能等高并发计算场景中,数据来回传输会产生巨大的功耗。目前,内存系统的性能提升速度大幅落后于处理器的性能提升速度,有限的内存带宽无法保证数据高速传输。
达摩院该技术的研究成果已被芯片领域顶级会议ISSCC 2022收录,这一新型架构芯片未来有望广泛应用于VR/AR、无人驾驶、天文数据计算、遥感影像数据分析等场景。
阿里还同时提供展示了它的云芯片 (YoC) 的源代码、全栈技术开发物联网设备平台。
YoC采用RISC-V架构及其SIMD加速指令,它与2015年与杭州中天微系统共同开发,可用于蓝牙、Wi-Fi、音频、多媒体等多种应用。它还可以根据 AI 加速、音频处理、网状网络和电机控制的需求进行调整。
2021 年 10 月开源的玄铁核心代码出现在其芯片设计子公司 T-Head Semiconductor的GitHub 存储库中:
GitHub库地址:https://github.com/T-head-Semi
达摩院是创始人马云在 2017 年创建,将价值观定义致力于“发现、冒险、动力和展望”。
编译:场长
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/258531.html