AI新星系列報道之十四 | 賀品嘉:化身軟件工程師的人工智能
用AI賦能軟件工程:讓代碼更智能
軟件工程作為構建現(xiàn)代科技世界的基石,涉及從代碼編寫到測試、上線及維護的一系列復雜流程。“人工智能與軟件工程的結(jié)合,是技術進化的重要路徑之一。”在軟件工程領域的專家賀品嘉教授看來,將AI引入軟件工程,不僅是提升行業(yè)生產(chǎn)力的關鍵,更是行業(yè)未來發(fā)展的必然方向。賀教授目前是香港中文大學(深圳)數(shù)據(jù)科學學院的助理教授,他的研究聚焦于“AI for SE”(人工智能用于軟件工程)以及“SE for AI”(軟件工程支持人工智能)的雙向探索。
賀品嘉教授曾在2018年獲得香港中文大學計算機科學與工程博士學位,之后在蘇黎世聯(lián)邦理工學院(ETH Zurich)計算機科學系擔任博士后研究員。他的學術經(jīng)歷涵蓋了從軟件工程到自然語言處理的多個領域,這種多學科背景為他的研究注入了強大的跨領域創(chuàng)新能力。
賀教授認為,軟件工程與人工智能的融合可以從兩個方向展開:一是通過AI技術提升軟件開發(fā)、測試和運維的效率與質(zhì)量;二是通過軟件工程的方法和工具增強AI系統(tǒng)的可靠性與安全性。他提到,“AI for SE的目標是讓機器理解軟件數(shù)據(jù)(如代碼)與其背后的軟件運行邏輯,參與到開發(fā)、測試、與運維流程中,使得軟件開發(fā)全流程更高效、更智能。”他的團隊正在與微軟、華為、字節(jié)跳動等公司共同研究如何利用AI技術優(yōu)化代碼生成、故障檢測和性能調(diào)優(yōu)等環(huán)節(jié),從而大幅提高軟件開發(fā)的效率。
?
可信AI:為大模型筑起安全防線
近年來,隨著ChatGPT等大模型技術的迅速發(fā)展,其安全性問題也愈發(fā)凸顯。當前的先進模型例如GPT-4和LLaMA3-70b-Instruct仍然容易受到越獄攻擊,并被用于惡意用途。
針對這些問題,賀品嘉教授團隊和騰訊AI Lab聯(lián)合提出了“Decoupled Refusal Training(DeRTa)”,一個簡單新穎的安全微調(diào)方法,DeRTa通過調(diào)整模型的訓練策略,可以賦予大語言模型“迷途知返”的能力,從而在不影響模型有用性(helpfulness)的同時,大幅提升其安全性(safety)。
賀教授表示:“大模型的安全性是AI技術落地應用的前提,DeRTa的核心在于賦予模型‘自我拒絕’能力,確保模型在面對惡意輸入時能夠做出安全的響應。”這一方法為大模型的安全性提升提供了全新的思路。
?
LogPAI:自動化日志分析的開源典范
日志是軟件運維領域中十分重要且廣泛存在的一種數(shù)據(jù)模態(tài)。然而,對日志進行精準處理分析一直以來都是一個艱難的問題,日志難以被高效利用以協(xié)助運維。
當前,隨著人工智能的發(fā)展,這個情況得以改變。賀品嘉教授主導的開源項目LogPAI(Log Analytics Powered by AI)已成為業(yè)內(nèi)的標桿,LogPAI是一個開源的自動化日志分析框架,旨在為軟件日志的收集和分析提供端到端的智能化服務。
LogPAI主要包括四個開源軟件服務(日志語句生成、日志壓縮、日志解析、日志挖掘)與一系列日志分析數(shù)據(jù)集。LogPAI能夠高效處理大規(guī)模日志數(shù)據(jù)。LogPAI為微軟、華為等企業(yè)提供了高效的運維支持,成功應用于多個工業(yè)場景,提高系統(tǒng)的穩(wěn)定性和可靠性。

LogPAI在開源軟件平臺GitHub上受到廣泛認可
截至目前,LogPAI在開源軟件平臺GitHub上被收藏6000余次,并被超過450個學界業(yè)界知名組織下載8萬余次。2022年5月,LogPAI榮獲第一屆IEEE開源軟件服務獎(IEEE Open Software Services Award)。

賀品嘉教授獲獎郵件截圖
?
跨學科視角 培養(yǎng)AI時代的軟件工程人才
在教學中,賀教授注重將前沿研究融入課程。他所教授的《軟件工程》課程,不僅涵蓋傳統(tǒng)的軟件開發(fā)流程,還引入大模型相關內(nèi)容,培養(yǎng)學生的AI應用能力,通過案例教學讓學生接觸AI在軟件工程中的最新應用。他認為,未來的軟件工程師將不僅僅是代碼的編寫者,更是AI工具的駕馭者。他希望通過教學與科研的結(jié)合,培養(yǎng)出更多能夠推動AI與軟件工程交叉發(fā)展的創(chuàng)新型人才。
賀品嘉教授的團隊由博士生、碩士生及本科生組成,研究方向涵蓋軟件工程、LLM for DevOps、大模型安全等領域。在他的指導下,團隊成員多次在國際頂級會議上發(fā)表論文,分別進入微軟、華為、字節(jié)跳動、騰訊等企業(yè)進行實習,展現(xiàn)出強大的科研潛力。
?
青年教授簡介

賀品嘉
港中大(深圳)數(shù)據(jù)科學學院助理教授
賀品嘉教授現(xiàn)為香港中文大學(深圳)數(shù)據(jù)科學學院助理教授。賀品嘉教授于2018年從香港中文大學獲得博士學位,此后在蘇黎世聯(lián)邦理工學院從事學術研究工作三年。賀品嘉教授的研究方向為軟件工程、AI for SE、大模型、可信人工智能。
他在ICSE、FSE、ICLR、ACL、OSDI等頂級會議期刊發(fā)表論文60余篇。獲得IEEE TCSE Rising Star Award、IEEE開源軟件服務獎、ISSRE最有影響力論文獎等獎項。谷歌學術引用6000余次。主導的自動化日志分析開源項目LogPAI在GitHub上被收藏6000余次,并被450多個學界業(yè)界組織下載8萬余次。擔任頂刊TOSEM的Associate Editor,頂會FSE 2025的Social Media Co-Chair,四大軟件工程頂會的程序委員會成員。