? ? ? ?近日,香港中文大學(深圳)理工學院2018級計算機與信息工程專業博士生馬暢翼為第一作者的論文被2020 ACM SIGIR信息檢索頂級國際會議收錄。論文由顧崇林博后、李文燁教授、崔曙光教授等老師指導完成。

?

會議簡介

? ? ? ?SIGIR (ACM International Conference on Research and Development in Information Retrieval)國際計算機協會信息檢索大會是一個展示信息檢索領域中各種新技術和新成果的重要國際論壇,專注于信息存儲、檢索和傳播的各個方面,同時也是中國計算機學會推薦的A類學術會議,享有很高的國際學術聲譽。

?

論文介紹

? ? ? ?論文題目:Large-scale Image Retrieval with Sparse Binary Projections

? ? ? ?論文摘要:受神經科學前沿技術啟發,李文燁博士及其團隊于2018年和2019年分別發表NeurIPS文章和技術報告,揭示了稀疏二值投影和競爭模型的諸多優良特性,為信息檢索等經典問題提供了新的研究思路。不同于傳統方法通過減少數據維度加快檢索速度,我們的模型首先將樣本投影到高維空間,然后利用WTA競爭對數據向量進行稀疏化和二值化重新表達。沿著該思路,本文借助一種新的算法,通過無監督訓練來獲得高質量的稀疏二值投影矩陣,并成功地應用于圖像檢索領域。實驗結果表明,該方法針對大規模圖像檢索任務除了具有良好的穩定性之外,更能夠有效提高檢索精度和速度,并有效降低數據的存儲需求,適合實際工業應用。

?

學生簡介

馬暢翼

理工學院,思廷書院

計算機與信息工程專業博士二年級

她的研究興趣主要在于機器學習基礎理論,包括圖像檢索等。

學生感言:該工作對我自己來說是一個很好的鍛煉,讓我對機器學習和圖像檢索有了更加深刻的了解。同時,很感謝各位老師的支持,他們的指導對該工作起到了很重要的作用。

?

指導老師簡介

顧崇林博士

理工學院博士后研究員

? ? ? ?他在2018年獲得哈爾濱工業大學(深圳)計算機科學與技術專業博士學位。在此之前,他于2008年獲得哈爾濱工程大學計算機科學與技術學士學位,于2011年獲得哈爾濱工業大學(深圳)計算機科學與技術專業碩士學位。2018年5月到2018年8月,他在深圳市大數據研究院做訪問學生,并于9月加入香港中文大學(深圳)崔曙光教授團隊開始博士后研究工作,研究方向為云計算、綠色數據中心調度。他將于2020年8月博士后出站,作為助理教授加盟哈爾濱工業大學(深圳)。

?

李文燁博士

理工學院研究助理教授

? ? ? ?李文燁博士于2016年8月加入香港中文大學(深圳)和深圳市大數據研究院,從事計算機和信息科學領域的教學科研工作。他的主要研究方向為機器學習和人工智能。李博士在NIPS/ICML等主要學術會議發表第一作者論文多篇,常年來擔任多個A類學術會議的程序委員會委員和高級委員。除理論研究外,李博士也是計算機系統和Java/數據庫技術專家,擔任國家E級超級計算機項目需求委員會評審委員。李博士早年負責設計開發的國家地球系統科學數據共享系統,入選首批國家科技基礎條件平臺。

?

崔曙光教授

理工學院代理院長

? ? ? ?崔曙光教授現任理工學院代理院長。他于2005年在美國斯坦福大學獲得博士學位,先后在美國德州農機大學和加州大學戴維斯分校任助理、副、正、和Child Family講席教授 。現任深圳市大數據研究院副院長和香港中文大學(深圳)校長講座教授。崔教授的當前科研方向主要集中在數據驅動的大規模系統控制和資源管理。已在國際一流期刊和會議上發表了兩百五十余篇論文。崔教授是IEEE信號處理協會2012年最佳論文獎獲得者, 并曾擔任多個IEEE國際會議的主席和程序委員會主席,多個國際期刊的編委(IEEE TBD, TSP, TWC, TVT, CL)和IEEE SPM的領域主編,是IEEE通信協會無線技術委員會(WTC)的主席 。崔教授在2013年當選IEEE Fellow(博士畢業后8年內當選,為IEEE歷史上最快之一),并在2014年和2016年被分別任命為IEEE Transactions on Big Data和IEEE Transactions on Cognitive Communications and Networking 的Steering Committee委員。崔教授在2014年入選IEEE ComSoc Distinguished Lecturer, Thomson Reuters全球高被引科學家名單, 和ScienceWatch的全球最具影響力科學家名單。在2017年10月,基于其在物聯網和數據分析領域的學術聲譽,崔教授應阿里巴巴集團的邀請到杭州,作為13名科學家之一為阿里巴巴達摩院的成立提供了戰略性意見。

?

導師點評

? ? ? ?利用稀疏二值矩陣來加速圖像檢索速度和精度具有新穎性和突破性。該方法的難點是如何設計這樣一個投影矩陣,在重新表達的同時保證檢索精度和速度。我們提出了一種利用WTA自身特點的迭代優化方法,并在ANN和IR的準確度上超過了現有的經典方法。該方法也獲得了評審者的一致好評,他們認為我們的SBP方法在檢索速度、準確度及通用性上具有一定的優越性。

? ? ? ?馬暢翼同學具有很好的編程能力,并且對機器學習有著不錯的理解。她在接近三個月的時間里嘗試了各種想法并最終形成了有效的方法,獲得了令人滿意的結果。希望她在未來的科研生涯中再接再厲,做出更好的工作!也歡迎對人工智能基礎理論感興趣的同學加入我們的團隊,共同探索人工智能時代下的前沿思想方法和應用。