个人资料
教育经历2019.09-2024.06:复旦大学,计算机应用技术,理学博士 2015.09-2019.06:大连理工大学,工学学士 工作经历2025.03至今:3044AM永利 专任副研究员 2024.07-2024.11:博世(中国)投资有限公司 中央研究院 AI算法研究员 个人简介社会兼职研究方向多模态学习、跨模态视觉推理、视频理解 当前研究聚焦基于多模态大模型的具身场景理解与推理,具体方向包括: 1)第一人称视频理解,包含第一人称视频问答、时空定位等基础任务,研究面向复杂动态环境的第一人称视频场景感知、时空推理。 2)流式视频理解,研究面向实时视频流的在线感知与推理、增量记忆等,支持长时序、有限视觉上下文条件下的实时视频理解。 3)具身智能,探索真实环境下的智能体感知、理解与行动闭环,提升智能体面向复杂动态环境的自主交互能力,如视觉语言导航等。 招生与培养开授课程科研项目荣誉及奖励 |