講座主題:
圖像表示學習中的二階統計建模
主講人姓名及介紹:
武玉偉,北京理工大學計算機學院副研究員、博士生導師,中國計算機學會計算機視覺專委會委員,中國圖象圖形學會3DV三維視覺專委會委員、視覺大數據專委會委員。2014年7月于北京理工大學獲得計算機應用技術工學博士學位,并獲得北京理工大學優秀博士學位論文獎、中國人工智能學會優秀博士學位論文提名獎。2014年8月至2016年8月赴新加坡南洋理工大學電氣電子工程學院從事博士后研究。2016年10月加入北京理工大學計算機學院。主持國家自然科學基金、北京市自然科學基金等課題,在計算機科學國際權威期刊T-NNLS、T-IP、T-CSVT、T-ITS、T-MM和國際頂級會議CVPR、AAAI、ACM MM 等發表論文30余篇。主要從事計算機視覺、機器學習、信息檢索等方向的研究。
報告摘要:
近年來,圖像表示學習經歷了從手設計到深度神經網絡模型學習的快速發展,它是理解圖像語義的基本問題。許多計算機視覺任務的實現都遵循特征“提取+編碼+分類”的范式。本報告主要介紹基于二階統計建模的圖像表示學習方法,重點討論在非歐空間中如何編碼、度量、優化深度特征,并在圖像分類、視覺問答等計算機視覺任務上驗證所提出方法的有效性。