报告题目:大规模云平台故障诊断机制
报告嘉宾:张圣林 副教授 南开大学
时间:2022年6月28日 10:00-11:30
地点:腾讯会议ID:875 533 170
主持人:崔来中,教授
报告内容简介:
大规模云平台已成为关键基础设施。因其架构复杂、规模巨大,导致人工故障诊断(包括故障发现与根因定位)低效易错,严重影响国家行政、金融、医疗、交通等方面的安全与稳定。针对使用日志、流量、多维指标、拓扑等单一模态运维数据的故障诊断无法全面刻画大规模云平台故障传播机理的问题,本报告提出面向模式各异、动态变化、规模庞大多模态运维数据的云平台故障诊断机制。
报告嘉宾简介:
张圣林,南开大学软件学院副教授,博士生导师,CCF互联网专委、软件工程专委、服务计算专委执行委员,YOCSEF天津AC委员。主要研究方向为基于机器学习的智能运维,包括异常检测、故障定位、根因分析和故障预测等。获ISSRE 18最佳学术论文奖、清华大学优秀博士学位论文、天津市科技进步一等奖、南开大学第九届“良师益友”称号、华为计算产品线“最佳技术合作教授”,入选天津市“131”创新型人才培养工程(第三层次)。在ATC, WWW, VLDB, SIGMETRICS, CoNEXT, INFOCOM, IJCAI等国际会议和JSAC, TC, TSC, TNSM, JSS等国内外期刊发表高水平论文40余篇。 主持国家自然科学基金青年基金项目1项, 中国博士后科学基金项目1项,横向项目8项(与华为、字节跳动、网商银行、中兴等合作)。于2017年获清华大学工学博士学位(计算机科学与技术专业),2012年获西安电子科技大学工学学士学位(计算机学院网络工程专业)。在攻读博士学位期间,曾经赴佐治亚理工学院学习。于2018-2019年在阿里巴巴从事访问学者研究。担任WWW22, ICNP22, IWQoS22, ISSRE 19/20/21/22程序委员会委员,TON/JSAC/TDSC/IoTJ/ASUR/TNSM/JCST等期刊审稿人。