实现最快、最准、最全关系挖掘,以及知识推理、事件溯源 高性能图计算:尖端科技下一个前沿(创新故事)

警察把所有线索证据的物料贴到墙上,对它们的相互关系进行推导、演练,寻求破案方向,密密麻麻写满一墙……这个刑侦影视剧中常见的场景,本质上就是一种图计算。

图计算里的图,不是指图像,而是指一种抽象的数据结构,由顶点和边构成。人们在图之上进行个体分析、关系挖掘和复杂计算,实现知识推理和事件溯源及预判。世界是复杂关系的总和,图计算提供了从“关系”的角度去分析问题,发现问题的能力,能够更好地描摹世界真实存在的形态。

图达到一定规模后,对计算的要求随之提升。要想实现更快、更准、更高水平的图计算,就需要引入高性能计算。前不久,中国工程院院士郑纬民教授带领清华大学计算机科学与技术系团队,联合图计算企业海致科技,宣布筹备启动海致高性能图计算院士专家工作站,将致力于高性能计算、图计算的融合发展,满足人们对更大规模、更复杂数据的实时处理和存储需求。

在我国发展高性能图计算,具备良好的技术基础和现实条件。

首先,人们如今的日常生活离不开高性能计算。天气预报、新药研发、新型材料、安全系数更高的汽车、高铁和飞机等都需要高性能计算做支撑。从天河超级计算机开始,我国在全球超算领域大放异彩,多次夺得超算世界冠军。2016年郑纬民及其团队参与的项目斩获有着“世界超级计算应用领域诺贝尔奖”之称的“戈登·贝尔奖”,实现了我国高性能计算应用成果在该奖项创办30年来零的突破。

另一方面,由于图的优秀表达能力、可视化效果和坚实的数学基础,图计算也已在国家安全、金融安全等方面有很高的价值。在金融领域,能即时识别出欺诈、洗钱行为并给出风险预警或阻止;在电子商务领域,实现更为精准的商品在线实时推荐;在网络安全领域,实时识别出攻击流量,保护信息和服务安全。有研究报告显示,到2023年图技术将促进全球30%企业的快速决策场景化,图技术应用的年增长率超过100%。

高性能计算为图计算赋能,将释放出巨大的应用潜力。海致科技负责人杨娟表示,科技人员可以在图之上进行计算、分析和挖掘,包括关系的发现、群体的识别、个体的更高维度分析、事件的传导和隐性知识的推理,帮助用户实现最快、最准、最全关系挖掘,以及知识推理、事件溯源。比如,当某个企业发生信贷违规的风险,高性能图计算很快就能梳理清楚它的关系网络,第一时间判断风险传导的概率和范围,速度越快,损失有可能越小。又比如,去年武汉疫情防控大数据平台应用了海致自主研发的知识图谱和数据中台,为群体流调、防控开展做出积极贡献。借助高性能图计算的能力,人类在与病毒争分夺秒的过程中将更具优势。

作为计算机技术的集大成者,高性能图计算可以说是尖端科技下一个前沿。高性能图计算牵涉到计算机产业的整个产业链。在硬件方面,离不开芯片、高性能服务器以及大规模集群的支撑;在软件方面,涉及数据库系统、存储系统、分布式计算框架,并与应用相结合,渗透到众多的应用领域和行业,成为牵动未来整个IT计算形态和产业变迁的关键推动力。由此,高性能图计算成为全球科技竞争新的战场。

“依托高性能图计算,我们团队正在围绕海致科技的图数据库系统,进一步提高图的表达能力,追求更加极致的性能。”清华大学计算机科学与技术系武永卫教授表示,根据高性能图计算院士专家工作站工作规划,计划打造“云边端一体、软硬件协同”、自主可控的国际一流图技术产品体系和应用生态环境,实现从技术到产业的全面突破性发展,努力打造领先的图数据库,培育图计算软硬件生态体系。

《 人民日报 》( 2021年04月12日 19 版)