在ACM SIGCOMM 2023上,北京大学计算机学院数据与工程所共有3篇高水平论文入选。作为计算机网络系统领域历史最为悠久也是最为权威的学术会议,SIGCOMM以其严苛的标准著称,对论文的质量和数量要求极高,要求所录用的论文具有基础性贡献、领导性影响和坚实系统背景。本年度ACM SIGCOMM共有323篇投稿,录用71篇。
以下是论文简要内容介绍:
一、 面向丢包检测和包累积测量的数据平面自适应网络测量方案
网络测量对于许多网络应用至关重要。在流量测量任务中,主要有两种任务需要处理:1) 包累积测量和 2) 丢包检测。然而,在现有的研究中,同时处理这两种任务的方法很少见。为此,论文《ChameleMon: Shifting Measurement Attention as Network State Changes》设计了测量系统ChameleMon。在兼顾两种任务的同时,ChameleMon更进一步地,通过两个维度的动态性支持测量注意力随着网络状态的变化而转移:1) 动态分配内存资源给这两种任务;2) 动态监测重要的流量。为了实现这一关键设计,ChameleMon利用费马小定理设计了一种灵活的数据结构,即FermatSketch。 FermatSketch具备可分割、可加和可减的特性,从而支持以上两种任务。 在一个Fat-tree拓扑结构的测试平台上部署的ChameleMon原型系统的实验结果显示,ChameleMon能以较低的内存和带宽开销地同时支持这两种任务,并且支持测量注意力的动态转移(在丢包多时倾向丢包检测,在丢包少时倾向包累积测量)。该论文第一作者为计算机学院2021级博士杨凯程同学(导师杨仝副教授),作者包括杨仝副教授、吴钰晗和缪瑞杰等。
二、 面向可编程数据面的LRU缓存替换机制设计与实现
数据面缓存是网络设备,如可编程交换机、智能网卡、DPU等的重要功能。然而,受限于数据面编程模型和内存访问模型,目前的数据面缓存常常采用简单但效率不高的缓存替换策略。因此,《P4LRU: Towards An LRU Cache Entirely in Programmable Data Plane》这篇论文致力于在数据面实现LRU,这是一种近似最优的缓存替换策略。论文分析了为何多种典型的LRU实现无法在当前的可编程数据面部署,并提出了P4LRU,一种专门为流水线模型设计的LRU实现方案。P4LRU将被缓存的键和值分别存储,并利用一个被称为缓存状态的自动机来描述键和值的实时映射关系,从而只需对每个数据执行单次内存访问。P4LRU通过将自动机的状态和转移逻辑编码到整数逻辑运算单元,在受限的数据面编程模型下实现了自动机的存储和实时转移。论文以P4LRU缓存单元为基础,设计了多种网络系统,包括网络地址转换系统、数据库查询加速系统和大规模网络测量系统,并在Tofino可编程交换机上完全实现了这些系统。该论文第一作者为计算机学院2020级博士生赵义凯(导师杨仝副教授),作者包括杨仝副教授、刘文睿和董丰豪等。
三、面向异构数据中心的在网计算应用开发框架
在网计算技术可以有效加速分布式系统的速度并减少其成本。但是,在异构数据中心中存在差异化的设备与应用和多径的网络拓扑,这导致应用开发者难以在不触及已有的网络功能的前提下开发在网计算应用,并有效利用设备资源。《ClickINC: In-network Computing as a Service in Heterogeneous Programmable Data-center Networks》设计了ClickINC框架,支持异构数据中心中的在网计算应用开发。ClickINC为开发者提供高级、模块化编程语言,并将用户程序编译到分布式的异构设备上;在此过程中,ClickINC在全网范围内合理分布程序片段,提升资源利用率;同时,ClickINC支持用户在运行时增量的添加和删除程序。我们开发ClickINC原型,并通过实验证明该系统的可行性、编程友好性、和资源利用高效性。该论文第一作者为清华大学徐文佺,通讯作者为北京大学吴文斐助理教授、清华大学刘斌和上海大学纽约分校刘古月。
SIGCOMM背景介绍:
第37届ACM数据通信专业组年度旗舰会议SIGCOMM 2023(37th Annual Conference of the ACM Special Interest Group on Data Communication)将于9月10日-14日在美国纽约举行。一年一度的ACM SIGCOMM重点关注计算机和数据通信网络领域,涵盖网络架构、设计、实现、运维、分析、度量和仿真等方面。SIGCOMM是计算机网络系统领域最权威的国际顶级学术会议之一,是CCF推荐的A类国际会议,每年吸引大量全球顶级学校和机构的投稿。