首页-->栏目-->研究生导师

余婷

时间:2022-03-22 10:22:18 文章来源 :学科 浏览量:5521

图片1

一、导师基本情况

姓名:余婷,副教授,硕导

邮箱:yut@hznu.edu.cn

指导专业:计算机科学与技术,电子信息硕士

课题组网站:https://github.com/OpenMICG

二、研究领域

主要研究方向为跨模态学习:运用人工智能、机器学习、深度学习算法对计算机视觉和自然语言进行跨媒体统一表达,包括但不仅限于视频问答、视觉描述生成,跨媒体检索、文生图像/视频/3D场景、机器视觉定位与导航等前沿课题。近年来尤其关注人工智能的最新前沿,如AI Agents、Code LLMs、LLMs Prompts以及视觉语言大模型在医学、遥感等交叉领域的研究与应用。

三、主讲课程

计算机网络、Python程序设计、移动应用开发等。

四、教育和工作经历

分别于2013年和2021年在浙江大学和杭州电子科技大学获得系统分析与集成专业硕士学位和计算机科学与技术专业博士学位,自2021年10月起任职于杭州师范大学信息科学与技术学院。

五、学术简介

主要从事跨模态学习、视觉问答、视觉描述、机器视觉定位与导航、跨媒体检索等研究,运用人工智能和机器学习算法对计算机视觉和自然语言进行跨媒体统一表达。目前担任CCF多媒体技术执行委员、CCF自然语言处理专委委员、CCF智能机器人专委委员以及CCF计算机视觉专委委员。发表高水平论文10余篇,包括IEEE TIP、TCSVT、IJCV等TOP期刊,CVPR、AAAI等CCF推荐A类会议。主持国家自然科学基金青年项目和浙江省自然科学基金面上项目,并以课题骨干参与多项国家自然科学基金重点、面上项目、教育部支撑计划、省“尖兵”“领雁”研发攻关计划项目等。

六、教学科研项目

1. 国家自然科学基金青年项目:基于跨媒体层次深度推理的视频问答技术研究。

2. 浙江省自然科学基金面上项目:跨媒体“数据-知识”联合增强的视频问答技术研究。

3. 浙江省尖兵”“领雁”研发攻关计划项目:核电厂电池组在线监测关键技术研发及产业化。

4. 国家自然科学基金青年项目:基于层次深度网络混合模型的图像识别技术研究。

5. 国家自然科学基金面上项目:基于跨模态推理的图像美学质量评价及增强。

6. 国家自然科学基金面上项目:基于分治策略与增量字典学习的图像超分辨重建方法研究。

7. 国家自然科学基金面上项目:基于用户反馈特征预测的细粒度图像分类研究。

8. 国家自然科学基金重点项目:基于大规模跨媒体知识网络的复杂视频问答方法研究。

七、代表性论著

1. A Comprehensive Survey of 3D Dense Captioning: Localizing and Describing Objects in 3D Scenes, IEEE Transactions on Circuits and Systems for Video Technology (TCSVT), 2023.(SCI,中科院一区,TOP期刊)

2. Long-Term Video Question Answering via Multimodal Hierarchical Memory Attentive Networks, IEEE Transactions on Circuits and Systems for Video Technology (TCSVT),2021,31(3):1051-8215.(SCI,中科院一区,TOP期刊)

3. Compositional Attention Networks with Two-Stream Fusion for Video Question Answering, IEEE Transactions on Image Processing (TIP), 2019, 29(1): 1204-1218.(CCF A , SCI,中科院一区,TOP期刊)

4. Multi-task Compositional Network for Visual Relationship Detection, International Journal of Computer Vision (IJCV), 2020,128:2146-2165.(SCI,中科院一区,TOP期刊)

5. On Exploring Undetermined Relationships for Visual Relationship Detection, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, CA, 2019. (CCF A)

6. ActivityNet-QA: A dataset for understanding complex Web videos via question answering, AAAI Conference on Artificial Intelligence (AAAI), Hawaii, USA, 2019. (CCF A)