头像

钱天文

副研究员

3044AM永利      

个人资料

  • 部门: 3044AM永利
  • 毕业院校: 复旦大学
  • 学位: 博士
  • 学历: 博士研究生
  • 邮编: 200062
  • 联系电话:
  • 传真:
  • 电子邮箱: twqian@cs.ecnu.edu.cn
  • 办公地址: 理科大楼913B
  • 通讯地址:

教育经历

2019.09-2024.06:复旦大学,计算机应用技术,理学博士

2015.09-2019.06:大连理工大学,工学学士

工作经历

2025.03至今:3044AM永利 专任副研究员

2024.07-2024.11:博世(中国)投资有限公司 中央研究院 AI算法研究员

个人简介

主要研究方向为视觉-语言多模态学习、视频理解、具身智能,围绕面向具身场景的第一人称视频理解、多模态大模型推理、视觉语言导航等具体任务开展技术探索。在多媒体、计算机视觉等领域国际知名会议和顶刊(IEEE TMM、CVPR、ICLR、AAAI、NuerIPS)发表论文 20 余篇,担任CVPR、ICCV、AAAI、ACM MM、IEEE TMM等审稿人。


更多内容请关注个人主页谷歌学术


团队长期招收硕士生和博士生,也期待对多模态视频理解和具身智能感兴趣的本科生参与科研,欢迎感兴趣的同学邮件咨询。

社会兼职

研究方向

多模态学习、跨模态视觉推理、视频理解


当前研究聚焦基于多模态大模型的具身场景理解与推理,具体方向包括:

1)第一人称视频理解,包含第一人称视频问答、时空定位等基础任务,研究面向复杂动态环境的第一人称视频场景感知、时空推理。

2)流式视频理解,研究面向实时视频流的在线感知与推理、增量记忆等,支持长时序、有限视觉上下文条件下的实时视频理解。

3)具身智能,探索真实环境下的智能体感知、理解与行动闭环,提升智能体面向复杂动态环境的自主交互能力,如视觉语言导航等。


招生与培养

开授课程

科研项目

荣誉及奖励

10 访问

相关教师