在圖計算領(lǐng)域與人工智能的交匯處,方一向教授為計算機科學領(lǐng)域帶來了突破與革新。他與華為、字節(jié)跳動等科技巨頭合作,將研究成果應(yīng)用于實際產(chǎn)業(yè)中,助力大模型精準生成的新紀元;他在理論上革新了算法范式,實現(xiàn)了性能百萬倍的提升,贏得國際同行的廣泛贊譽。同時,方一向教授是香港中文大學(深圳)程序設(shè)計競賽隊的領(lǐng)航者,他指導的團隊在國內(nèi)外賽場上大放異彩,屢創(chuàng)輝煌,成功培養(yǎng)了一批批計算機科學領(lǐng)域的未來之星。

?

與華為同行??助力大模型精準生成新紀元

大語言模型已在眾多領(lǐng)域展現(xiàn)出令人矚目的能力,但它在處理特定領(lǐng)域查詢問題時仍存在生成內(nèi)容不正確或“幻覺”、信息過時、缺乏專業(yè)領(lǐng)域知識、更新訓練代價高等一系列問題。為此,檢索增強生成(Retrieval Augmented Generation,下稱 RAG)技術(shù)應(yīng)運而生,它通過引入外部知識圖譜檢索來指導大模型生成,從而大幅提升生成內(nèi)容的準確性、可靠性、即時性。在這一背景下,方一向教授提出將知識圖譜稠密子圖搜索引入RAG技術(shù),并做了大量的基準評測工作,提升了大模型回答問題的準確性、可靠性、時效性。

大模型檢索示例

方一向教授將這項研究成果應(yīng)用于解決國民經(jīng)濟和社會發(fā)展中的實際問題,他與華為云PaaS-DevAI Lab緊密合作,為企業(yè)的生產(chǎn)研發(fā)提供了創(chuàng)新性的解決方案。此外,方一向教授還提出了知識圖譜構(gòu)建技術(shù),他主持的“面向研發(fā)數(shù)據(jù)的知識圖譜建構(gòu)技術(shù)研究”榮獲2022年度CCF-華為胡楊林基金-軟件工程專項基金資助。該項目從20多所高校與研究所的47項有效項目中脫穎而出,最終成為8項獲批項目之一。項目針對結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等形式的研發(fā)數(shù)據(jù),通過實體和關(guān)系的識別、實體消歧和關(guān)系補全三個方面,為華為提供一整套的針對研發(fā)數(shù)據(jù)的知識圖譜構(gòu)建技術(shù)。

方一向教授團隊與華為討論技術(shù)細節(jié)

?

攜手字節(jié)跳動 探索社交網(wǎng)絡(luò)稠密子圖挖掘

使用圖建模業(yè)務(wù)場景并解決實際問題在工業(yè)界越來越普及。作為圖數(shù)據(jù)中的重要組成部分,稠密子圖由一些緊密相連的節(jié)點所構(gòu)成,可以廣泛應(yīng)用于社交領(lǐng)域的社群發(fā)現(xiàn)、推薦領(lǐng)域的興趣圈層挖掘、風控領(lǐng)域的異常團伙挖掘等領(lǐng)域。然而,目前大部分稠密子圖挖掘相關(guān)工作專注于靜態(tài)圖數(shù)據(jù),難以適用于動態(tài)網(wǎng)絡(luò),存在適用性差、準確率不高、效率低等一系列問題。在時序圖中,通過考慮數(shù)據(jù)的時序性,可以挖掘出更深層的動態(tài)稠密子圖,以幫助企業(yè)追蹤感興趣的子圖結(jié)構(gòu)隨時間的演化情況。該技術(shù)可用于社交網(wǎng)絡(luò)分析與營銷,如優(yōu)化個性化推薦和識別異常行為?;谶@一背景,方一向教授和字節(jié)跳動合作提出基于Leiden算法的高效動態(tài)社區(qū)挖掘算法,可以快速地處理工業(yè)級大規(guī)模動態(tài)圖數(shù)據(jù)(包含上億節(jié)點或邊的大規(guī)模圖),助力企業(yè)解決動態(tài)社區(qū)挖掘難題。

?

革新最密子圖挖掘算法 性能提升百萬倍

作為圖計算領(lǐng)域的經(jīng)典研究課題之一,最密子圖挖掘問題已歷經(jīng)了近40年的研究歷程,其在異常檢測、社區(qū)檢測、圖可視化、圖索引構(gòu)造、生物網(wǎng)絡(luò)分析等眾多領(lǐng)域的廣泛應(yīng)用,始終吸引著學術(shù)界的高度關(guān)注。然而,該問題的求解算法時間開銷非常大,自1984年后鮮有重大突破,嚴重制約了最密子圖在大規(guī)模圖數(shù)據(jù)上的應(yīng)用。

方一向教授的研究為這個困局帶來了突破性的進展,為提升最密子圖挖掘的效率,他創(chuàng)新性地提出一種基于k-core的全新求解范式。該范式通過推導k-core的密度理論上下界,把最密子圖鎖定在圖中特定的k-cores中,避免從全圖中求解最密子圖,大幅加速最密子圖挖掘的過程。基于這一新范式,方教授設(shè)計了針對有向圖的高效最密子圖挖掘算法,經(jīng)過大規(guī)模有向圖實驗驗證,新提出的算法較當時最優(yōu)算法的性能提升高達6個數(shù)量級。這項突破性研究成果在數(shù)據(jù)庫頂級會議SIGMOD 2020上進行發(fā)表,從458篇論文中脫穎而出,被評選為SIGMOD 2020會議的4篇最佳論文之一,并斬獲2021 ACM SIGMOD Research Highlight Award——數(shù)據(jù)庫領(lǐng)域的頂尖榮譽之一,代表了數(shù)據(jù)庫研究領(lǐng)域的最高水平。數(shù)據(jù)庫領(lǐng)域資深學者、ACM Fellow、IEEE Fellow、ACM杰出科學家陶宇飛教授高度評價此項成果,稱其為“一項理論與實踐完美融合的出色研究”。

方一向教授斬獲2021 ACM SIGMOD Research Highlight Award

?

領(lǐng)航程序設(shè)計競賽隊??全球賽場屢創(chuàng)輝煌

在精研學術(shù)與反哺產(chǎn)業(yè)之外,方一向教授作為港中大(深圳)程序設(shè)計競賽隊的指導老師,帶領(lǐng)團隊與全球頂尖高校的優(yōu)秀選手同場競技,在激烈的競爭中取得令人矚目的成績。2024年,方教授指導的團隊斬獲12金2銀5銅的驕人成績,并兩度入圍ICPC國際大學生程序設(shè)計競賽世界總決賽。在第48屆ICPC世界總決賽中,團隊以全球第40名、東亞區(qū)第8名的優(yōu)異成績刷新隊史成績,解題數(shù)量與斯坦福大學、香港中文大學、上海交通大學等國內(nèi)外知名高校并列。截止至2024年年底,競賽隊共計獲得31個金獎、27個銀獎、15個銅獎,充分體現(xiàn)了學校在培養(yǎng)國際化高素質(zhì)人才方面的卓越成果,彰顯了方教授及其團隊日益增強的國際競爭力。

港中大(深圳)3名隊員參加ICPC國際大學生程序設(shè)計競賽世界總決賽

方一向教授不僅在競賽指導上展現(xiàn)了卓越的能力,在競賽平臺搭建、人才梯隊建設(shè)、本科生招生、企業(yè)合作銜接及基礎(chǔ)教育服務(wù)等方面同樣傾注了大量心血,還講授本科生《數(shù)據(jù)結(jié)構(gòu)》和博士生《算法分析》等人工智能核心基礎(chǔ)課程,致力于為學生打下堅實的編程與算法基礎(chǔ),以培養(yǎng)其卓越的專業(yè)能力。方一向教授還帶領(lǐng)競賽隊成功舉辦了2023年、2024年兩屆港中大(深圳)程序設(shè)計競賽,積極推動了編程競賽在校園及附屬學校等大學輻射范圍內(nèi)的普及化和全民化,為人工智能領(lǐng)域的人才培養(yǎng)樹立了新的標桿。

港中大(深圳)2023年程序設(shè)計競賽隊員合影

?

競賽或許可以不是目的本身,但通過一系列校內(nèi)外編程活動,像“全民乒乓球運動”一樣吸引全校大學生積極參與編程,能夠?qū)崿F(xiàn)“以賽促學”、“以賽促研”,以競賽促進計算機和人工智能教育水平的提高,幫助學生在學術(shù)研究、科技創(chuàng)新等路徑探索更多的人生可能性,這是方教授作為一名學者對后輩青年人的關(guān)切與支持。

青年教授簡介

方一向,香港中文大學(深圳)數(shù)據(jù)科學學院副教授,香港中文大學(深圳)程序設(shè)計競賽隊伍指導老師,主要研究大數(shù)據(jù)管理、挖掘、人工智能等相關(guān)課題,具體包括面向大規(guī)模圖數(shù)據(jù)的數(shù)據(jù)管理、數(shù)據(jù)挖掘、圖神經(jīng)網(wǎng)絡(luò)、表達學習等,以及大模型和圖數(shù)據(jù)結(jié)合的相關(guān)研究課題。在數(shù)據(jù)庫、數(shù)據(jù)挖掘、人工智能等領(lǐng)域的國際頂級會議/期刊(如VLDB、SIGMOD、ICDE、NeurIPS、WWW、AAAI、IJCAI、TODS、VLDBJ、TKDE等)上累計發(fā)表論文100余篇,包括中國計算機學會認定的A類論文(即CCF-A)將近70篇,第一/通訊作者CCF-A論文將近50篇。其中一項代表性研究成果的論文被評為SIGMOD 2020會議的最佳論文之一(~4/458),并榮獲2021 ACM SIGMOD Research Highlight Award。目前擔任國際知名期刊《Information Processing & Management》(CCF-B類期刊)的編委,擔任多個數(shù)據(jù)庫和數(shù)據(jù)挖掘領(lǐng)域頂級會議(例如PVLDB、ICDE、KDD、AAAI、IJCAI等)的程序委員會成員以及頂級期刊(例如TKDE、VLDBJ等)的審稿人,中國計算機學會數(shù)據(jù)庫專業(yè)委員會的執(zhí)行委員。