24

2024-01

202307期 多模态开放域检测大模型及应用

来源:     浏览次数:

题目:多模态开放域检测大模型及应用

主讲人梁小丹 副教授中山大学

主持人:陈小军 副教授

时间:20236110:00-11:30

地址:致腾楼938会议室


报告人简介:

梁小丹,中山大学副教授,逸仙学者,青年拔尖人才,IEEE Senior Member。研究领域为多模态视觉语言理解,数字人生成和驱动,可解释AI和因果推断机器学习模型。Google学术引用超18000次。现担任Image and Vision Computing Neural Networks期刊的Associate Editor,曾担任CVPR/ ICML/ICCV/Neurips等会议领域主席和Ombud chair等,荣获ACM中国新星提名奖,阿里巴巴达摩院青橙奖 CSIG石青云青年女科学家奖,吴文俊人工智能优秀青年奖,中国科协青年人才托举计划获得者,中国图像图形学会科技技术一等奖,CCF 优秀博士论文奖和ACM China 优秀博士论文奖等。


报告摘要:

近期多模态预训练基础大模型如GPT4等在多个视觉语言跨模态任务下得到突出的性能,但是其无法做到细粒度的语义对齐和定位,如利用大量图文对进行开放域物体检测学习。本次报告介绍研究组利用大规模图文数据图进行细粒度物体和文本对齐模型,利用千万数据来训练大模型的模型设计。首先讲介绍一种新的针对开放域检测的端到端预训练模型DetCLIPv2, 其次介绍如何利用caption数据来增强开放域检测预训练模型。最后依托于开放域物体检测能力,设计了针对多模态机器人视觉语言导航的多模态决策模型,结合多模态预训练大模型和大规模语言模型如Chatgpt,在多个VLN任务得到明显的性能提升,并支持Zero-shot场景的泛化性。


相关论文发表

博士生导师

  • 黄哲学

    黄哲学

    黄哲学,瑞典皇家理工学院博士、深圳大学特聘教授、博士生导师,深圳大学大数据技术与应用研究所所长、大数据系统计算技术国家工程实验室副主任,首批广东省领军人才、深圳孔雀计划高层次人才,斯坦福大学全球“终身科学影响力排行榜”前2%顶尖科学家。符号数据快速聚类算法研究的开拓者,发表了k-modes等一系列著名聚类算法,被纳入国内外教科书和专著,进入软件产品。发表学术论文250多篇,主要论文被引用超万次。领导开发了全球首个面向算力网络的多数据中心大数据协同计算系统Octopus,最近获深圳第二十五届中国国际高新技术成果交易会“优秀产品奖”和“华为杯”第五届中国研究生人工智能创新大赛“一等奖”。
  • 黄哲学

    崔来中

    2007年6月于吉林大学获工学学士学位,同年被免试推荐直接攻读博士研究生,2012年6月于清华大学获计算机科学与技术博士学位。研究领域包括:下一代互联网体系结构、软件定义网络、边缘计算、大数据分析、机器学习和智能计算。国际电子工程师学会高级会员(IEEE Senior Member),中国计算机学会高级会员(CCF Senior Member),人工智能学会(CAAI)会员,CCF互联网专委会常委,CCF大数据专家委员会委员、CCF区块链专委会委员,CAAI知识工程与分布智能委员会副秘书长。担任SCI期刊《International Journal of Machine Learning and Cybernetics》、《International Journal of Bio-Inspired Computation 》和《Ad Hoc and Sensor Wireless Networks》的副编辑/编委。已主持国家重点研发计划课题、国家自然科学基金,广东省自然科学基金,广东省育苗工程,深圳市基础研究计划项目等项目10多项。已在国内外重要期刊以及国际会议上发表SCI/EI检索论文80余篇。《计算机网络》课程负责人,课程入选广东省一流本科课程。入选广东省青年珠江学者,深圳市优青、深圳市高层次人才和深圳大学“荔园优青”人才培养计划。
  • 黄哲学

    陈梓楠

    陈梓楠(博士,国家海外优青,IEEE会员,ACM会员)现在担任深圳大学计算机与软件学院特聘教授。在研期间一共发表了顶级会议和期刊将近30篇论文,其中CCF A类论文有19篇(第一作者有12篇),主持了国家自然科学优秀青年(海外)项目1项和国家自然科学青年基金项目1项。此外,陈老师也是各大国际会议(包括:VLDB 2022 - 2024 (demo track)、VLDB 2025 (research track)、SIGKDD 2024 、ICDE 2022和2024、EDBT 2023、IJCAI 2020、DASFAA 2021 - 2024和WISE 2019 - 2024)和国际期刊(包括:VLDBJ、TKDE、AIJ、IEEE Transactions on Computers (TC)、WWWJ、 TSAS 、TNSE、PR Journal、DKE、JCST、The Journal of Supercomputing等等)的审稿人,并担任MDM 2021 - 2024的会议论文集主席 (proceedings chair)。

科研项目

联系我们
0755-2653 0821