
一、基本信息
郭文,博士,教授,硕士研究生导师。中国计算机学会多媒体专委会执委,山东省自动化学会理事,获校“凤凰人才”、“科研标兵”等荣誉称号,中国科学院自动化研究所模式识别与智能系统专业博士毕业。2011年在新加坡国立大学电子工程系做研究助理,2016年至2017年在美国德州州立大学计算机系做访问学者。
长期致力于解决基于视觉内容的视觉跟踪过程以及具身智能处理中的某些难点问题,从多模态信息融合的角度出发研究面向视觉的多模态数据融合方法的基础理论和关键技术,其中主要研究视觉领域的目标跟踪以及视觉语言动作及导航的多模态信息融合的方法,并且取得了一系列的创新研究成果。首位先后获批国家自然科学基金面上项目2项,山东省自然科学基金1项,模式识别国家重点实验室开放课题1项,山东省研究生教育创新计划项目2项,发表包括在《IEEE Transactions on Image Processing》、《中国科学·信息科学》、CVPR等国内外权威期刊会议相关论文四十余篇,授权发明专利4项,出版学术专著1部,获得山东省高等学校优秀科研成果叁等奖2项,参与完成国家及省部级以上课题多项。
联系方式:13791249588,wguo@sdtbu.edu.cn
二、研究领域
计算机视觉方向:
1.多模态单目标跟踪与检测
2.多模态多目标跟踪与数据关联
3.多模态行人再识别与行为分析
具身智能方向:
1.面向机器人的视觉语言动作、视觉语言导航
2.面向无人机视觉语言导航
多媒体计算方向:
1.微观表情识别
三、科研项目及获奖
[1]深度网络特征表达及结构融合的鲁棒视觉跟踪,国家自然科学基金面上项目(编号:62072286), 57万,2021.1-2024.12。项目负责人
[2]多特征融合的结构稀疏、低秩学习的鲁棒视觉跟踪,国家自然科学基金面上项目(编号:61572296), 63万,2016.1-2019.12。项目负责人
[3]多特征融合的结构稀疏鲁棒视觉跟踪,山东省自然科学基金(编号:ZR2015FL020), 3万,2016.7-2018.12。项目负责人
[4]模式识别国家重点实验室开放课题(编号:201600024),4万,2016.1-2016.12。项目负责人
[5]研究生教育创新计划(编号:SDYAL21211), 2万,2020.8-2022.12。项目负责人
[6]研究生教育创新计划(编号:SDYKC2025223), 2万, 2025.8-2027.12。项目负责人
[7]基于深度多示例学习的视频理解与内容安全分析,国家自然科学基金面上项目(编号:61876100),64万,2019.1-2022.12。项目参与人
[8]山东省高等学校优秀科研成果叁等奖,2016,第二位
[9]山东省高等学校优秀科研成果叁等奖,2020,第一位
四、科研学术经历
[1] 2016.12-2017.12美国德州州立大学,访问学者(Visiting Scholar)
[2] 2011.5-2011.12新加坡国立大学,研究助理(Research Assistant)
[3] 2007.9-至今 山东工商学院,教授
[4] 2009.09—2012.07中国科学院自动化研究所,模式识别与智能系统,工学博士
[5] 2004.09—2007.07山东大学,模式识别与智能系统,工学硕士
[6] 1997.09—2001.07中南大学,自动化,工学学士
五、代表性学术论文
[1]Dual-level Adaptation for Multi-Object Tracking: Building Test-Time Calibration from Experience and Intuition, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), CVPR2026.
[2]History-Guided Prompt Generation for Vision-and-Language Navigation, IEEE Transactions on Cybernetics (TYCB), 2025.10
[3]What Is in the Frequency: Wavelet-Guided Semantic Understanding for Infrared Small Target Detection,IEEE Transactions on Geoscience and Remote Sensing (TGRS), 2025.10
[4]带有深度特征重平衡网络的多目标跟踪方法,控制与决策,2024.8
[5]自适应IoU损失和层级关联的多目标跟踪,中国图象图形学报, 2024.7
[6]无锚双注意力孪生网络的视觉跟踪,控制与决策,2024.2
[7]Feature Disentanglement Network: Multi-Object Tracking Needs More Differentiated Features, ACM Transactions on Multimedia Computing Communications and Applications(TOMM), 2023.11
[8]DTEMPan: Dual Texture-Edge Maintaining Transformer for Pansharpening, IEEE Transactions on Geoscience and Remote Sensing (TGRS), 2023.11
[9]Multi-ViewRegionProposalNetworkPredictiveLearning forTracking,Multimedia Systems,2023.2
[10]Web Objectionable Video Recognition Based on Deep Multi-Instance Learning With Representative Prototypes Selection, IEEE Transactions on Circuits & Systems for Video Technology(TCSVT), 2021.3
[11]时间一致性保持的多任务稀疏深度表达视觉跟踪,计算机科学,2021.6.
[12]敏感视频判别性特征投影识别算法,计算机辅助设计与图形学学报,2020.5.
[13]应用深度光学应变特征图的人脸活体检测,中国图象图形学报,2020.3.
[14]深度相对度量学习的视觉跟踪,中国科学·信息科学,2018.4.
[15]低秩重检测的多特征时空上下文跟踪,软件学报,2018.1.
[16] Multi-Scale Fully Convolutional Network for Fast Face Detection,The British Computer Vision Conference,BMVC2016.
[17] Multi-Instance Multi-Label Learning Combining Hierarchical Context and its Application to Image Annotation, IEEE Transactions on Multimedia (TMM), 2016.
[18] Max-Confidence Boosting with Uncertainty for Visual Tracking, IEEE Transactions on Image Processing (TIP), 2015.
[19]基于多视角融合稀疏表示的恐怖视频识别,《电子学报》,2014.2.
[20]复杂场景的视觉目标跟踪方法,科学出版社2017.12.