亿万先生MR

521期行健讲坛:视觉大模型钻研进展及发展趋向

2025.06.25

投稿:彭蕾部门:通讯与信息工程学院浏览次数:

活动信息

功夫: 2025年6月27日(周五)下午15:00-17:00

地址: 校本部东区翔英大楼808

讲座: 视觉大模型钻研进展及发展趋向

演讲者: 程建 教授 ,电子科技大学

演讲者简介:

程建 ,男 ,1978年8月生 ,教授 ,博士生导师 ,电子科技大学信息与通讯工程学院推算机视觉与机械智能尝试室掌管人 ,重要钻研方向为:人为智能、推算机视觉、机械进建等。2006年9月毕业于上海交通大学图像处置与模式鉴别钻研所 ,获模式鉴别与智能系统专业博士学位。2022年作为中组部、团中央第22批博士服务团成员援藏。主持承担国度及省部级项目10多项、企业横向科技合作项目近20项;参加国度及省部级项目近10项。在IEEE T Cybernetics、IEEE TIP、IEEE TMM、IEEE TAES、IEEE TVT、IEEE TCSVT、ISPRS、CVPR、AAAI、ACM MM、IGARSS、BMVC、ICIP、ICPR等国际学术期刊和会议上颁发论文150多篇 ,其中SCI收录50多篇 ,EI收录80多篇;获IEEE信号处置协会2023年最佳论文奖;申请国度发现专利80多项 ,其中已获得国度发现专利授权50多项。

讲座提要:

视觉大模型作为人为智能领域的沉要钻研方向 ,近年来在技术架构、利用场景与产业落处所面获得了显著进展;赥ransformer架构的视觉大模型通过自把稳力机造与多模态融合技术 ,显著提升了图像鉴别、指标检测与语义宰割等工作的机能 ,为推算机视觉领域带来了新的技术突破。然而 ,视觉大模型的发展仍面对推算资源亏损大、数据质量与对齐难、可诠释性不及等挑战。本次汇报将萦绕视觉大模型的技术演进、主题突破、利用场景及将来趋向发展 ,系统性地探求视觉大模型的钻研近况与发展趋向。

约请人:通讯与信息工程学院 刘志教员

欢迎宽大老师和学生参与!

【网站地图】