26

2022-05

202201期 资源高效的深度学习之规模化人工智能的民主化

来源:     浏览次数:

报告题目资源高效的深度学习之规模化人工智能的民主化

报告人:胥栋宽 北卡州立大学 (North Carolina State University) 工学院计算机系 助理教授

报告时间2022/05/27 10:30-11:30 (GMT+08:00)  腾讯会议:380-284-907

报告地点:腾讯会议:380-284-907

报告摘要

在过去的十年中,深度学习的惊人成功主要是由越来越大的深度神经网络模型的构建推动的。这些模型通常强加一个理想的假设,即有足够的资源,包括大规模的参数、足够的数据和大规模的计算,用于优化。然而,这个假设在现实世界的场景中通常会失败。例如,计算机内存可能是有限的,如在边缘设备中,大规模的数据由于昂贵的成本和隐私限制而难以获得,计算能力受到限制,如在大多数大学实验室。因此,这些资源差异问题阻碍了深度学习技术在许多人工智能应用中的民主化,开发能够适应不同资源约束的高效深度学习方法具有重要意义。


这次演讲中,我将介绍我最近的研究贡献,这些贡献围绕着资源高效的深度学习,将人工智能从“参数-数据-计算”的饥饿野兽中解放出来。首先,我将介绍我在pretrain-then-finetune范式下对神经网络修剪的贡献,它提高了大规模语言模型在推理阶段的参数效率,使修剪后的模型比原始模型的参数少一个数量级,同时达到相同或更好的预测精度。然后,我将谈论我的任务不可知的神经网络结构搜索框架,以减少训练阶段寻找最佳修剪模型的计算成本,这对提高推理阶段的参数效率是一种补充。最后,我将在演讲的最后简要介绍我正在进行的和未来的工作,作为未来几年新的和相关的问题和潜在合作的更广泛的研究议程的一部分。

报告人简介:

Dongkuan (DK) Xu (胥栋宽),将于2022年秋季加入北卡州立大学 (North Carolina State University) 工学院计算机系,担任助理教授。DK于2014年本科毕业于中国人民大学,2017年硕士毕业于中国科学院 (获中科院院长奖学金,国家奖学金), 2022年将博士毕业于美国宾州州立大学(Penn State University, PSU)。

DK致力于高效深度学习,主要探究如何提升深度神经网络模型的参数、数据、算力的效率,开发低功耗的算法-硬件协同设计解决方案。DK的论文多次发表在机器学习、自然语言处理、数据挖掘的顶级会议和期刊 (NeurIPS, AAAI, ACL, NAACL, IJCAI等),并拥有和提交8项美国专利/申请。DK在PSU担任过9门课程的客座讲师或助教 (获PSU杰出教学支持奖),在会议/大学/公司做过多次讲座和报告,指导过6名学生的研究工作,担任了超过28个顶级会议和14个研究领域期刊的 (高级) PC委员或常规期刊评审员,多次获得 IST学术旅行奖及各种学术会议的奖学金。

此外,作为创始学术委员会成员,DK还发起了国内外知名的MLNLP (机器学习算法与自然语言处理) 社区。DK与业界公司和高校有着丰富的合作经验,曾在Microsoft Research (Redmond)、AI芯片创业公司Moffett AI、和NEC美国实验室实习,并与Princeton University、UT Austin、Northeastern University、University of Connecticut、Texas A&M University等高校有紧密的合作。DK的长期研究目标是使人工智能民主化,以服务更广泛的人群和领域。

更多信息请参考主页: http://www.personal.psu.edu/dux19/






相关论文发表

博士生导师

  • 黄哲学

    黄哲学

    黄哲学,瑞典皇家理工学院博士、深圳大学特聘教授、博士生导师,深圳大学大数据技术与应用研究所所长、大数据系统计算技术国家工程实验室副主任,首批广东省领军人才、深圳孔雀计划高层次人才,斯坦福大学全球“终身科学影响力排行榜”前2%顶尖科学家。符号数据快速聚类算法研究的开拓者,发表了k-modes等一系列著名聚类算法,被纳入国内外教科书和专著,进入软件产品。发表学术论文250多篇,主要论文被引用超万次。领导开发了全球首个面向算力网络的多数据中心大数据协同计算系统Octopus,最近获深圳第二十五届中国国际高新技术成果交易会“优秀产品奖”和“华为杯”第五届中国研究生人工智能创新大赛“一等奖”。
  • 黄哲学

    崔来中

    2007年6月于吉林大学获工学学士学位,同年被免试推荐直接攻读博士研究生,2012年6月于清华大学获计算机科学与技术博士学位。研究领域包括:下一代互联网体系结构、软件定义网络、边缘计算、大数据分析、机器学习和智能计算。国际电子工程师学会高级会员(IEEE Senior Member),中国计算机学会高级会员(CCF Senior Member),人工智能学会(CAAI)会员,CCF互联网专委会常委,CCF大数据专家委员会委员、CCF区块链专委会委员,CAAI知识工程与分布智能委员会副秘书长。担任SCI期刊《International Journal of Machine Learning and Cybernetics》、《International Journal of Bio-Inspired Computation 》和《Ad Hoc and Sensor Wireless Networks》的副编辑/编委。已主持国家重点研发计划课题、国家自然科学基金,广东省自然科学基金,广东省育苗工程,深圳市基础研究计划项目等项目10多项。已在国内外重要期刊以及国际会议上发表SCI/EI检索论文80余篇。《计算机网络》课程负责人,课程入选广东省一流本科课程。入选广东省青年珠江学者,深圳市优青、深圳市高层次人才和深圳大学“荔园优青”人才培养计划。
  • 黄哲学

    陈梓楠

    陈梓楠(博士,国家海外优青,IEEE会员,ACM会员)现在担任深圳大学计算机与软件学院特聘教授。在研期间一共发表了顶级会议和期刊将近30篇论文,其中CCF A类论文有19篇(第一作者有12篇),主持了国家自然科学优秀青年(海外)项目1项和国家自然科学青年基金项目1项。此外,陈老师也是各大国际会议(包括:VLDB 2022 - 2024 (demo track)、VLDB 2025 (research track)、SIGKDD 2024 、ICDE 2022和2024、EDBT 2023、IJCAI 2020、DASFAA 2021 - 2024和WISE 2019 - 2024)和国际期刊(包括:VLDBJ、TKDE、AIJ、IEEE Transactions on Computers (TC)、WWWJ、 TSAS 、TNSE、PR Journal、DKE、JCST、The Journal of Supercomputing等等)的审稿人,并担任MDM 2021 - 2024的会议论文集主席 (proceedings chair)。

科研项目

联系我们
0755-2653 0821