理工學院成功舉辦統計學和數據科學研討會
2018年12月12日,來自世界知名大學的多位統計學教授參加了由香港中文大學(深圳)理工學院主辦的統計學和數據科學研討會,與會的教授從不同角度和研究領域講述了統計在研究層面的廣泛運用,幫助學生了解統計學家在研究層面可以解決的大量問題,并且鼓勵他們從事相關重要領域的工作。
?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
香港中文大學(深圳)數據與運籌科學研究院蔡卓軒教授主持開幕
?
內容回顧
?
遺傳風險的統計方法
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
Prof. Hongyu Zhao介紹遺傳風險的統計方法
?
? ? ? ? Prof. Hongyu Zhao來自耶魯大學生物統計學系,他為大家介紹了統計知識在遺傳學研究與精準醫學領域的運用。在過去的幾十年里,人類發現了數千種與基因相關的遺傳疾病,但是遺傳風險預測的準確性卻不高。這在很大程度上是由于在識別所有功能相關的變異和準確估計其影響大小方面都存在挑戰。在這場講座中,Prof. Zhao展示了近年來研究出的一些提高預測精確度的算法。把數據庫里儲存的大量遺傳病相關數據作為訓練數據,以此來建立模型,經過測試數據的測試之后,就可以進行遺傳風險預測。在這方面,國內外已有相關公司和機構將這項研究運用到市場。用戶進行基因檢測之后,會得到一份風險預測報告,該報告會以樣本中的數據為參照系,為用戶進行風險說明。
?
稀疏協調輔助學習的最優治療決策
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
Prof. Lan Wang介紹輔助算法
?
? ? ? ? 來自明尼蘇達大學統計學系的Prof. Lan Wang為聽眾帶來一場關于輔助學習算法的講座。其算法可以廣泛運用到各種決策場景中。Prof. Wang以公民投票為例,簡單說明了為了找到最優決策規則,2016年提出的一種基于最大秩相關估計的協和輔助學習算法。通過兩兩比較,可以更好地利用現有信息。然而目標函數的不連續性,使得計算難以優化。經過一定研究,這個問題可以通過一種凸代理損失函數得到解決。此外,該算法還使得決策的復雜性降低。王嵐講授詳細地講授了該算法的具體步驟,并且此算法已在抑郁癥治療的臨床試驗應用中呈現不錯效果。
?
人工智能,大數據和數據分析
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
Prof. Feifang Hu解析人工智能
?
? ? ? ? Prof. Feifang Hu 來自喬治·華盛頓大學統計學系,他從數據的角度解析人工智能。人類通過已有的信息進行決策,并且根據新產生的信息來優化決策。Prof. Hu從這個角度為人工智能下定義,他認為人工智能夠通過搜集的數據幫助人類做出決定。在這個過程中,有效數據極為重要。Prof. Hu 強調了有效數據的重要性,并且以曹沖稱象、不同度量衡下的物體質量為例,為聽眾概述了獲得有效數據的方式——設計合適的實驗,以往有很多人對數據進行錯誤的認識,卻以為是數據欺騙了他們。Prof. Hu認為學會如何獲得并且認識有效數據極其重要。
?
部分觀測Heston模型濾波方程的實時隨機波動率估計
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
Prof. Zeng Yong介紹貝葉斯估計
?
? ? ? ? 在其部分觀測Heston模型濾波方程的實時隨機波動率估計的講座中,Zeng Yong教授以追蹤股市交易記錄為例,通過最近提出的針對超高頻數據的標記點過程觀察,以及濾波方程進行貝葉斯估計( BEFE),簡單介紹了Markov過程的普遍框架。該講座涉及使用標記點過程觀察過濾模型,選擇歸一化方程以表征后驗,并使用遞歸算法進行貝葉斯推理以傳播和更新聯合后驗分布。Zeng Yong教授和他的同事B. Bundick,J. Yin表明了遞歸算法在GPU并行計算中的適用性,并提供了從超級計算機獲得的仿真和經驗結果以證明遞歸算法有效。最終,通過將遞歸與GPU計算和高效算法相結合,他們提出了基準SV或更復雜模型的實時統計推斷。在之后的提問環節中,Zeng Yong教授更證明了這一模型在可應用于時間序列數據的分析,例如風險管理和期權定價,表現了統計學模型與其他領域的有機結合。
?
過去氣候重建的統計發展與挑戰
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
Prof. Bo Li講述如何應用大數據進行氣候重建
?
? ? ? ? ?Prof. Bo Li 為我們帶來了一場關于應用大數據進行氣候重建,研究長期氣候動態變化的科普講座。要理解氣候動態變化需要與長溫度時間序列的相關知識,而長期的、廣泛分布的溫度觀測是難以獲得的。于是教授提出可以使用一些能用來推測過去溫度的“氣候代理”(如樹的年輪、花粉等)以及輻射驅動力(如火山作用,太陽射線等)作為數據來源,并使用這些數據進行回歸分析來推測長時間溫度變化。接著Prof. Bo Li說明了存在的問題,即如何量化溫度估計值的不確定性,然后提出了相應的解決辦法:找出在已知觀測的條件下,溫度的分布,并用一個可能的重建整體替代該分布。接著Prof. Bo Li解釋了如何生產溫度整體,并隨后展示了得出的統計模型,介紹了模型擬合方法以及如何解決過擬合問題和模型參數估計不確定性的方法,并使用多個圖像展示出了最后的擬合結果。然后Prof. Bo Li解釋了如何將以上提出的不同數據來源集合到一起的方法,并介紹了貝葉斯分層模型的方法。最后教授說明了從數值分析中所得出的信息,并提出目前仍然存在的問題及挑戰。
?
協變量網絡種群建模的網絡響應回歸
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
Prof. Jingfei Zhang 講述網絡響應回歸方法
?
? ? ? ? Prof. Jingfei Zhang 講述了有協變量的網絡建模和分析。首先教授提出了研究目標,即在群體層次上描述網絡連通性,并試圖了解這種連接模式是否以及如何受到主題協變的影響。教授先說明了已存在的方法,并在此基礎上提出了一種新的網絡響應回歸模型:將觀測到的網絡作為矩陣值的響應,將單個協變作為預測因子。隨后Prof. Jingfei Zhang 對該網絡響應回歸模型作出詳細的解釋,例如對模型的估計,以及優化算法等,然后給出了理論上的結果。 最后教授介紹了一般損失函數下的誤差邊界,并用該模型和其他模型進行模擬實驗,并給出了實驗結果。
?
密歇根大學統計學和數據科學項目?(含討論)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
Prof. Xuming He介紹密歇根大學研究生項目
?
? ? ? ? Prof. Xuming He 詳細地介紹了密歇根大學統計與數據科學研究生項目。首先教授講述了統計學以及數據科學專業在近幾年的發展狀況,并介紹了密歇根大學的統計學及數據科學專業等研究生項目情況。隨后教授說明了數據科學專業所需的知識內容框架,包括了數學、計算機科學、統計學以及其他領域科學。緊接著他還介紹了密歇根大學與香港中文大學(深圳)的AMDP研究生項目,包括項目具體內容、開設課程、申請要求及流程等信息。
?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
開幕式大合照
(醫學和健康科學創新研討會與統計學數據科學研討會參會教授)
?
? ? ? ? 本次研討會探究了統計學在不同領域中的運用,展現了統計學和數據在未來不同產業中的發展前景,為在座的同學們提供了未來就業和升學新方向。