北大本科生首次在国际计算机体系结构顶会发表论文
北京大学计算机学院张杰课题组长期从事存储系统和新型非易失性内存的研究。张杰课题组在存内计算(PIM)、近存储计算(In-storage processing)、AI for storage和新型闪存架构研究取得重要突破,在国际计算机体系结构顶级会议HPCA发表论文4篇(会议总计录用75篇,录用率18%)。其中,本科实习生安昱达和唐云潇共同发表一作论文1篇,是北京大学本科生首次在国际计算机体系结构顶级会议发表论文。该论文的简要介绍如下:
计算机领域中许多受到关注的新兴应用(如深度学习)属于内存敏感型应用,其性能受到内存墙问题的严重限制。构建在高存储密度、低能耗的赛道存储(RM)技术上的存内计算(PIM)系统有很大希望解决这一问题。然而,在现有RM存内计算方法中,内存存储单元与计算单元之间的松散耦合造成了很大的数据传输开销,严重限制了系统整体性能。为了解决这一问题,论文《StreamPIM: Streaming Matrix Computation in Racetrack Memory》(HPCA 2024)基于赛道存储,提出了一种新型的存内计算架构,即StreamPIM。StreamPIM采用物理学界的最新技术,基于赛道纳米线直接构建矩阵处理器,摆脱了对CMOS计算单元的依赖。同时基于赛道纳米线构建存内总线,进一步消除数据在存储单元和计算单元之间传输时的电磁转换开销。这两项技术使内存存储单元和计算单元紧密耦合。论文同时提出了一系列优化措施以提高存内计算的并行性,进一步提升整体性能。实验结果显示,与业内先进的赛道存储存内计算平台CORUSCANT相比,StreamPIM的性能提高了2.5倍,同时能耗减少到35%。
StreamPIM存内计算流程示例
该论文第一作者为元培学院2020级本科生安昱达和物理学院2019级本科生唐云潇(现已毕业),通讯作者为张杰助理教授,合作作者包括北京大学孙广宇副教授、罗昭初助理教授等。本文系首篇北京大学本科生在国际计算机体系结构顶级会议发表的论文。