21

2021-12

202107期 大数据近似计算技术

来源:     浏览次数:

报告题目大数据近似计算技术

报告人:黄哲学,深圳大学,特聘教授

报告时间:2021年11月29日(星期一) 下午2:30

报告地点:深圳大学沧海校区计算机与软件学院624课室

报告摘要

大数据的显著特征是“大”,文件大小在TB级以上,这一特征给大数据的全量计算带来诸多挑战,例如:算法约束,内存约束,计算效率,计算成本等。面对这些挑战,采用样本对全量大数据做近似计算成为大数据计算的必然选择,但也带来了一系列新的理论和技术问题需要研究解决,例如,多大的数据样本能满足近似计算的要求?如何从大数据中抽取样本数据?如何评估近似计算的结果?采用什么样的分布式计算框架和算法?针对上述问题,本报告介绍一种新的大数据近似计算技术,具体内容包括:大数据多样本分析方法、大数据复杂度度量、样本集大小计算方法、随机样本划分数据模型、non-MapReduce计算框架、逼近式集成学习流程和大数据分析平台。这些创新可以为数字化转型和数字经济发展提供新的技术手段。

报告人简介:

深圳大学特聘教授、大数据技术与应用研究所所长、大数据系统计算技术国家工程实验室副主任,瑞典皇家理工大学博士,首批广东省领军人才,深圳孔雀计划高层次人才。符号值和混合值数据快速聚类算法研究的开拓者,发表了k-modes等一系列著名聚类算法,被纳入国内外教科书和专著,进入软件产品。荣获亚太地区知识发现和数据挖掘国际会议首个最有影响论文奖。发表学术论文200多篇,主要论文被引用超万次,单篇独立作者论文最高引用近3000次,入选斯坦福大学2020年全球前2%顶尖科学家“终身科学影响力排行榜”。近年来主要研究大数据并行与分布式计算技术,提出了随机样本划分(RSP)分布式大数据表达模型,创新性地融合了分布式计算、统计抽样和近似计算方法,有效地解决了超大数据计算的内存约束问题,研究成果荣获多个创新大赛奖,成功用于实际应用。


相关论文发表

博士生导师

  • 黄哲学

    黄哲学

    黄哲学 广东省领军人才 深圳大学特聘教授 国家信息中心大数据研究院院长 深圳大学大数据与应用研究所所长
  • 黄哲学

    PHILIPPE FOURNIER-VIGER

    I got my Ph.D from the U. of Quebec in Montreal (2010). Then, I worked at U. of Moncton, Canada (2011-2015) and Harbin Institute of Techn. (2015-2021). I am associate editor-in-chief of Applied Intelligence (SCI, Q1) and editor-in-chief of Data Science and Pattern Recognition. I have founded the SPMF data mining library, cited in more than 1,000 papers. Research interests:Data Mining, Big Data, Artificial Intelligence, Pattern Mining, Itemset Mining, Graph Mining, Sequence Prediction.
  • 黄哲学

    王熙照

    王熙照,博士,教授,博士生导师,IEEE Fellow,Springer杂志Machine Learning and Cybernetics主编。 1998年毕业于哈尔滨工业大学计算机系,获工学博士学位(计算机应用专业);1998年至2001年赴香港理工大学计算学系合作研究,任研究员(Research Fellow);2000年10月至2014年3月任河北大学数学与计算机学院院长,2007年10月至2014年3月任河北省机器学习与计算智能重点实验室主任;2013年9月至11月加拿大Simon Fraser大学访问教授(Visiting Professor),2013年12月至2014年1月加拿大Alberta大学访问教授;2014年7月至9月澳大利亚New South Wales大学访问教授;2014年3月至今任深圳大学计算机与软件学院教授、大数据研究所副所长。

科研项目

联系我们
0755-2653 0821