近日,理工學院副院長、校長講座教授黃建偉教授團隊在ACM經濟學與計算會議上(ACM Conference on Economics and Computation 2021)發表了一篇題為“The Privacy Paradox and Optimal Bias-Variance Trade-offs in Data Acquisition”的論文。該論文主要探究了在數據關聯性下的數據采集機制設計問題,探究信息泄露會給數據交易帶來什么影響。

ACM經濟學與計算會議上(ACM Conference on Economics and Computation)是計算經濟學領域最權威的學術會議,由 ACM 特殊興趣學組 SIGecon 于 1999 年主辦,至今已經舉辦了 18 年。

點擊圖片,閱讀全文

研究背景

隱私保護是目前大數據時代每個個體的重要需求。然而,在現實生活中,“隱私悖論”的現象卻時有發生:一方面,大多數都希望自己的隱私得到有效的保護;而另一方面,人們又為了獲取便利而愿意貢獻自己的隱私數據。比如說,許多人為了使用一些app,允許該app采集自己的數據,這與他們保護隱私的需求相矛盾。那么問題來了:“隱私悖論”現象背后的原因是什么呢?

許多經濟學者和計算機學者對這個問題很有興趣,并給出了許多解釋。其中一個著名的解釋是數據關聯性帶來的信息泄露的存在。具體來說,由于數據關聯性的廣泛存在,人們即使不主動分享自己的數據,第三方能依據數據關聯性,從已有的數據或多或少推斷該個體數據。以收入數據為例,同家公司同級別的員工往往收入類似。就算你從未主動透露過自己的收入,第三方依舊可以依據已有的你同事的收入推測你的收入。這樣一來,意識到自己的信息或許已被泄露,人們便傾向于用數據換便利和效率。更一步來說,“隱私悖論”現象的存在及其潛在的信息泄露,給人們的隱私保護和第三方平臺的數據采集和交易帶來一定的影響。受到現實中“隱私悖論”現象的啟發,我們希望進一步探究在數據關聯性下的數據采集機制設計問題,探究信息泄露會給數據交易帶來什么影響。

?

研究方法

我們考慮一個數據采集者(平臺)和許多個體。數據采集者希望購買個體的數據,來進行均值估計。當個體參與數據采集并貢獻數據時,該個體會產生一定的成本。為了有效激勵個體參與數據采集并高效補償個體,數據采集者設計了一個調查機制。該調查機制能夠(1)激勵個體真實匯報成本(激勵相容性),(2)購買數據支出不超過既定的預算,(3)最優化估計的偏差-方差的權衡。

在該機制下,個體決定是否參與數據采集。正如前文所說,即使不參與數據采集,該個體依舊承受數據關聯性帶來的信息泄露。為了刻畫數據關聯的異構性,我們考慮各個的群組,即不同群組的個體的數據關聯性不同。因此,數據采集者會針對數據關聯性(群組)設計相應的機制。此外,考慮到并非所有個體都會參與數據采集,我們引入參與率(即參與個體數量除以總個體數量),且參與率進一步影響估計的偏差。數據采集者通過機制設計控制總體的參與率,進而調整估計的偏差水平以最優化目標函數。

研究結論

我們通過求解優化問題,得到了該調查機制的解析解,并獲得了一些有趣的結論:受到數據關聯性帶來的信息泄露的影響,數據采集者可以憑借較低的價格獲取數據,數據關聯性越強,價格越低。數據采集者的總購買支出并不一定隨著總體參與率的升高而升高。我們的工作進一步引出一個重要的研究:如何設計高效的經濟學機制來減少“隱私悖論”的現象和數據關聯性帶來的負面影響。

?

作者簡介

本文通訊作者為香港中文大學(深圳)校長講座教授、理工學院副院長黃建偉教授,他同時也是深圳市人工智能與機器人研究院(AIRS)的副院長,群體智能研究中心主任。黃教授是深圳市鵬城特聘教授、IEEE Fellow、IEEE通信學會杰出講者、湯森路透計算機科學領域全球高被引科學家。他長期專注于網絡通信、網絡經濟學和群體智能交叉領域的開創性研究。他已發表 7部學術專著、 125 篇 JCR一區論文和 170 余篇國際會議論文,被谷歌學術引用超過 13900 次, H-index為 59(位列全球計算機領域學者中前0.05%)。

黃建偉教授

本文第一作者為廖國成博士。現為中山大學軟件工程學院助理教授,2021年于香港中文大學獲得博士學位。研究方向為隱私保護和博弈論。

廖國成博士

其他幾位作者分別是:

蘇宇,2021年于加州理工學院獲得博士學位,現供職于麥肯錫。研究方向為云計算,網絡經濟學和機器學習。

Juba Ziani, 2019年于加州理工學院獲得博士學位,現為賓夕法尼亞大學博士后。研究方向為算法博弈論和機制設計。

Adam Wierman,2007年于卡耐基梅隆大學獲得博士學位,現為加州理工學院Department of Computing and Mathematical Sciences教授。研究方向為在線學習、在線優化和網絡經濟學。

?

文章轉自香港中文大學(深圳)理工學院微信公眾號,鏈接為https://mp.weixin.qq.com/s/iz3Zwjo7SQ3TYCIUTGWiTA