课题组情况介绍

清华大学高性能计算研究中心

“清华大学高性能计算研究中心”(以下简称为高性能计算中心)是根据学校战略发展部署建立的科研机构。其主要任务是:(1)落实清华大学与无锡市战略合作协议,共同建设运维国家超级计算无锡中心,满足国家气候、环境、生命、材料及无锡市地方经济等对高性能计算的重大需求;(2)开展高性能计算技术研究,推动高性能计算技术的发展,为下一代高性能计算机的研制奠定基础。(3)支持交叉学科发展,建设与运维清华大学高性能计算平台,支持高性能计算人才培养与技术推广。 高性能计算中心主要研究高性能计算核心技术,包括高性能芯片、网络、存储、操作系统、编译器、编程环境、应用支撑、应用等。课题组承担了多项国家项目的研制,包括基金委重点项目、863重点项目、973课题,如十一五863重点项目“面向地球系统模式研究的高性能计算支撑软件系统”, “大规模多模式多过程地球系统模式耦合平台研发”项目获得“全球变化及应对” 十三五重点专项的支持。在GMD、Geophysics、SC发表多篇高水平论文,“Accelerating solvers for global atmospheric equations through mixed-precision data flow engine”获25年FPL会议最具影响力论文奖和ACM “戈登贝尔”奖。

信息存储课题组链接Storage Research Group - Home (tsinghua.edu.cn)

信息存储课题组研究领域包括:网络(/云/大数据)存储系统、基于非易失存储器的存储系统与关键技术、数据存储可靠性与安全等。存储与计算、网络是信息基础设施的重要部分,存储系统是制约计算机系统性能和扩展性的主 要瓶颈。承担国家纵向课题,如国家重点研发计划项目“TB级持久性内存存储技术与系统”,863项目“面向大数据的先进存储结构及关键技术”,863课题“基于新型存储器件的存储体系结构与关键技术研究”,“海量存储系统软件和关键技术”及国家自然科学基 金重点项目“大规模网络存储系统的可靠性关键技术研究”等。研制出清华海量存储网络系统TH- MSNS 和相关分布式虚拟化系统TH-DVSM 、 带外虚拟化系统TH-VSM 、 并行文件系统Redbud、分级存储系统AIP、云存储安全系统Corslet等,已分别应用于审计、公安、油田、电信、教育等行业及部门, 近年来主要研究基于NVM的新型存储系统与技术。成果发表在FAST、USENIX ATC、EuroSys、SC、MICRO、ISCA、DSN、DAC等重要国际会议和IEEE TC、IEEE TPDS、ACM TOS等国际权威期刊上, 并获得2010 年IEEE TC期刊的Featured Article、MSST’2015和SRDS’2015重要国际会议的最佳论文提名奖。获国家科技进步奖1项和 国家技术发明奖1项。已有1人、3人分别获清华大学校级优秀博士学位论文一等奖、二等奖、8 人获校级优秀硕士学位论文奖。研究团队与华为、阿里巴巴、韩国三星、中兴、日本三菱等业 界公司保持良好合作关系,与欧美知名大学与国际知名公司保持良好交流,近年来接收国际访 问学者/学生4人次。

PACMAN课题组链接PACMAN Group (tsinghua.edu.cn)

PACMAN课题组研究大数据处理和高性能计算的系统软件和体系结构。包括编程系统、并行调试器、并行调优 工具。基于新型非易失存储的新型非冯体系结构研究。类脑计算的编程方法与体系结构。与华 为、中兴、Intel、微软、Google等公司有长期密切合作关系。近期主要研究成果包括:提出并 实现了性能国际领先的大数据分析系统Gemini,可以在8台双路服务器上分析十亿结点百亿条边的超大规模图数据。性能比业界流行的大数据分析系统Spark高两个数量级,所需内存仅为Spark的十分之一。在神威-太湖之光上实现世界首个大规模异构计算机上的Graph500算法, Graph 500性能居全球第二,“神图”入围2018年ACM“戈登·贝尔”奖。

MadSys课题组链接MadSys Group Hello Systems! (tsinghua.edu.cn)

MadSys系统课题组研究前沿的系统技术,包括分布式系统,存储系统,图计算系统,云计算,先进的内存系统,分布式系统的事务,系统的可靠性等具有挑战性的课题。课题组承担了 各项国家课题,包括自然科学基金重点项目,863/973项目,国家科技专项,国家重点研发计划项目等。在可扩展并行/分布式系统及其应用、大规模网络存储系统技术、虚拟化等方面取得 了丰硕的研究成果,在OSDI、ATC、ASPLOS、MICRO、FSE、TC、TPDS 等重要国际会议和期刊上发表论文80余篇,研制的云存储系统Corsair/MeePo。Corsair/MeePo 已在广东联通、华为、中兴、中石油等20 多家企事业单位和中科院、北京大学等50 所科研院所得到应用,服务的用户超过150 万,支持的社区超过6000 个。相关技术成果曾获2007 年国家科技进步奖二等奖和2015 年国家技术发明奖二等奖。

类脑计算系统课题组

类脑计算系统课题组专注于新型计算机体系结构、类脑计算芯片与基础软件等研究领域。长期承担国家自然科学基 金项目、国家重大专项课题/子课题、创新特区课题等研究任务,在新型处理器架构、类脑计算 芯片与基础软件等方面取得了丰硕的研究成果:提出“类脑计算完备性”并设计相应的系统结构,证明能够实现类脑计算系统的编程可移植性、硬件完备性与编译可行性,成果应用于世界 上首款异构融合类脑芯片(清华大学类脑计算中心的天机芯, NATURE封面文章),解决了天机芯支持异构融合网络等工具链方面的关键问题。在NATURE、ASPLOS、MICRO、NIPS、IEDM、DAC、LISA、ICPP、IEEE TC/TPDS/TSC等重要国际期刊与学术会议上发表论文80 余篇。

分布计算与智能加速技术课题组

分布计算与智能加速技术课题组以构建高效、安全和智能的硬件与系统为愿景和目标,主要从事分布式计算与存储,智能加速与应用、 安全硬件与安全系统等研究。团队一直 从事计算机体系结构、安全硬件与安全系统等领域研究工作。团队自成立以来,成功研制了当 时国内主频最高的具有自主知识产权的微处理器THUMP(2003年),并采用该处理器设计了视频编解码处理芯片、移动存储卡控制器、流量分配器、云终端等设备;2009年,获得核高基 重大专项“众核处理器关键技术及应用性研究”支持,成功研制了64+多核SoC仿真平台,在神舟 6载人飞船仿真测试中发挥重要作用;2012年与苏州云计算中心合作,研制了基于云存储的个人移动计算环境。2015年研制的高性能视频编码算法模块应用于海思半导体H.265编码芯片中。2018年,我们基于FPGA研制了深度神经网络加速平台。

高能效智能处理器设计课题组

处理器是计算机系统的核心,但受性能墙、存储墙和功耗墙等因素,传统处理器难以再遵循摩尔定律继续发展,无法满足人工智能领域系统的高能效计算需求。高能效智能处理器设计课题组长期从事处理器设计与神经拟态计算技术研究,采用可重构众核处理器技术实现深度神经网络DNN与脉冲神经网络SNN的性能与功耗优化,提出了多种面向众核流架构的高运算单元利用率编译优化技术和运算单元利用率感知的核心映射调度方法,以及多种面向嵌入式智能应用的功能优化与计算资源重构融合的众核处理器架构,相关研究成果发表在IEEE TVLSI、IEEE TPDS等学术期刊与重要国际会议上。

高性能计算应用课题组

高性能计算应用课题组研究(1)E级超级计算机达到极限性能的并行算法与软件设计方法、自动优化技术,,(2)科学计算与人工智能融合的新兴高性能计算应用构建方法和理论。近期主要研究成果包括:大气动力学全隐式模拟和非线性大地震模拟首次在神威太湖之光系统上实现千万核可扩展模拟,获评2016年和2017年ACM“戈登贝尔”奖;神威太湖之光部署的存储系统性能在线监测、诊断与动态优化系统,有效提升大规模应用数据访问性能,提高系统利用率;地球系统模式物理方案参数分析、参数优化与基于深度学习的集合融合方法和工具,为复杂应用的量化不确定性分析和工作流调度提供了新型工具。

存储系统与I/O性能优化课题组

存储系统与I/O性能优化课题组主要从事系统前沿技术研究,包括大数据计算、网络存储与分布 式处理等方面的研究工作。近年来主要集中在大数据存储及处理系统研究,通过分析并利用数 据访问模式特征、底层系统工作机理以及数据自身的演化规律,提出了高可扩展的大数据分布 式存储及处理系统的构建及优化方法,有效提高了大数据系统的性能、扩展性和可用性。课题 组已承担多项国家课题,包括自然科学基金项目、863课题、973课题等。在存储系统与I/O性能优化等方面取得了丰硕成果,在FAST、IPDPS、ACM TOS、IEEE TC、IEEE TPDS等顶级国际会议或期刊上发表论文20余篇。提出的存储关键技术已经集成到高性能所自主研发的网 络存储系统和自维护存储系统中,研究成果被国家审计署、北京市公安局、中兴通讯、国信安 办、国家气象局等多家单位使用,效果良好。