麻省理工學院 | 一種更快的保護網(wǎng)上隱私的方法
指南者留學
2022-12-07 15:52:03
閱讀量:1135
<p>在互聯(lián)網(wǎng)上搜索可以發(fā)現(xiàn)用戶寧愿保密的信息。例如,當有人在網(wǎng)上查詢醫(yī)療癥狀時,他們可以將自己的健康狀況透露給谷歌,一個像WebMD這樣的在線醫(yī)療數(shù)據(jù)庫,以及這些公司的數(shù)百個廣告商和商業(yè)合作伙伴。</p>
<p> </p>
<p>幾十年來,研究人員一直在開發(fā)使用戶能夠私下從數(shù)據(jù)庫中搜索和檢索信息的技術(shù),但這些方法仍然太慢,無法在實踐中有效使用。</p>
<p> </p>
<p>麻省理工學院的研究人員現(xiàn)在開發(fā)了一種私人信息檢索方案,比其他可比方法快30倍左右。他們的技術(shù)使用戶可以在不向服務(wù)器透露查詢的情況下搜索在線數(shù)據(jù)庫。此外,它是由一個簡單的算法驅(qū)動的,比以前工作中更復雜的方法更容易實現(xiàn)。</p>
<p>他們的技術(shù)可以通過防止消息應(yīng)用程序知道用戶在說什么或他們在和誰說話來實現(xiàn)私人通信。它還可以用來獲取相關(guān)的在線廣告,而無需廣告服務(wù)器了解用戶的興趣。</p>
<p> </p>
<p>“這項工作實際上是為了讓用戶對自己的數(shù)據(jù)有一些控制權(quán)。從長遠來看,我們希望瀏覽網(wǎng)頁能像瀏覽圖書館一樣私密。這項工作還沒有實現(xiàn)這一點,但它開始構(gòu)建工具,讓我們在實踐中快速有效地完成這類事情,”計算機科學研究生亞歷山德拉·亨辛格(Alexandra Henzinger)說,她是一篇介紹這項技術(shù)的論文的主要作者。</p>
<p> </p>
<p>合著者包括麻省理工學院計算機科學研究生Matthew Hong;麻省理工學院電氣工程與計算機科學系(EECS)道格拉斯·羅斯軟件技術(shù)職業(yè)發(fā)展教授、計算機科學與人工智能實驗室(CSAIL)成員Henry Corrigan-Gibbs;Sarah Meiklejohn,倫敦大學學院密碼學和安全教授,谷歌的研究人員;資深作者、EECS教授、CSAIL首席研究員Vinod Vaikuntanathan。這項研究將在2023年USENIX安全研討會上發(fā)表。</p>
<p> </p>
<p><strong>保護隱私</strong></p>
<p> </p>
<p>第一個私人信息檢索方案是在20世紀90年代開發(fā)的,部分是由麻省理工學院的研究人員開發(fā)的。這些技術(shù)使用戶能夠與擁有數(shù)據(jù)庫的遠程服務(wù)器通信,并從該數(shù)據(jù)庫讀取記錄,而服務(wù)器不知道用戶正在讀取什么。</p>
<p> </p>
<p>為了保護隱私,這些技術(shù)迫使服務(wù)器接觸數(shù)據(jù)庫中的每一個條目,因此它無法知道用戶正在搜索哪個條目。如果有一個區(qū)域沒有動,服務(wù)器就會知道客戶端對這個項目不感興趣。但是,當可能有數(shù)百萬個數(shù)據(jù)庫條目時,訪問每個條目會減慢查詢過程。</p>
<p> </p>
<p>為了加快速度,麻省理工學院的研究人員開發(fā)了一種名為Simple PIR的協(xié)議,在該協(xié)議中,服務(wù)器在客戶端發(fā)送查詢之前,就提前執(zhí)行了大部分底層加密工作。此預(yù)處理步驟生成一個數(shù)據(jù)結(jié)構(gòu),其中包含關(guān)于數(shù)據(jù)庫內(nèi)容的壓縮信息,客戶機在發(fā)送查詢之前下載該數(shù)據(jù)結(jié)構(gòu)。</p>
<p> </p>
<p>在某種意義上,這個數(shù)據(jù)結(jié)構(gòu)就像一個提示,提示客戶數(shù)據(jù)庫中有什么。</p>
<p> </p>
<p>“一旦客戶端得到這個提示,它可以進行無限數(shù)量的查詢,這些查詢在您發(fā)送的消息的大小和您需要服務(wù)器做的工作方面都要小得多。這就是簡單PIR速度如此之快的原因,”亨辛格解釋道。</p>
<p> </p>
<p>但提示可以相對較大。例如,要查詢1gb的數(shù)據(jù)庫,客戶機需要下載124m的提示。這增加了通信成本,這可能會使該技術(shù)難以在現(xiàn)實設(shè)備上實現(xiàn)。</p>
<p> </p>
<p>為了減少提示的大小,研究人員開發(fā)了第二種技術(shù),稱為雙PIR,基本上包括運行簡單PIR方案兩次。這將產(chǎn)生一個更緊湊的提示,對于任何數(shù)據(jù)庫都是固定大小的。</p>
<p> </p>
<p>使用Double PIR, 1gb數(shù)據(jù)庫的提示將只有16mb。</p>
<p> </p>
<p>“我們的雙PIR方案運行速度稍慢,但通信成本會低得多。對于某些應(yīng)用來說,這將是一個理想的權(quán)衡。</p>
<p> </p>
<p><strong>超速行駛</strong></p>
<p> </p>
<p>他們測試了簡單PIR和雙PIR方案,將它們應(yīng)用到一個任務(wù)中,在這個任務(wù)中,客戶試圖審計一個網(wǎng)站的特定信息,以確保該網(wǎng)站是安全的訪問。為了保護隱私,客戶端不能透露它正在審核的網(wǎng)站。</p>
<p> </p>
<p>研究人員最快的技術(shù)能夠在大約每秒10gb的速度運行時成功保護隱私。以前的方案只能實現(xiàn)大約每秒300兆字節(jié)的吞吐量。</p>
<p>Corrigan-Gibbs補充說,他們表明他們的方法接近私人信息檢索的理論速度極限——這幾乎是一個人可以建立的最快的方案,其中服務(wù)器接觸數(shù)據(jù)庫中的每一條記錄。</p>
<p> </p>
<p>此外,他們的方法只需要一臺服務(wù)器,這使得它比許多頂級技術(shù)要簡單得多,這些技術(shù)需要兩臺具有相同數(shù)據(jù)庫的獨立服務(wù)器。他們的方法優(yōu)于這些更復雜的協(xié)議。</p>
<p> </p>
<p>“我考慮這些計劃已經(jīng)有一段時間了,我從來沒有想過以這樣的速度可以實現(xiàn)。人們普遍認為任何單服務(wù)器方案都會非常慢。這項工作顛覆了整個觀念,”科里根-吉布斯說。</p>
<p> </p>
<p>Henzinger說,雖然研究人員已經(jīng)證明他們可以使PIR方案更快,但在他們能夠在現(xiàn)實場景中部署他們的技術(shù)之前,還有很多工作要做。他們希望在降低通信成本的同時,仍能實現(xiàn)高速。此外,他們還希望調(diào)整自己的技術(shù)來處理更復雜的查詢,比如一般的SQL查詢,以及要求更高的應(yīng)用程序,比如一般的Wikipedia搜索。從長遠來看,他們希望開發(fā)出更好的技術(shù)來保護隱私,而不需要服務(wù)器接觸每個數(shù)據(jù)庫項。</p>
<p> </p>
<p>“我聽到有人強調(diào)PIR永遠不現(xiàn)實。但我絕不會押注于科技。這是我們從這項工作中學到的一個樂觀的教訓。創(chuàng)新總有辦法。”Vaikuntanathan說。</p>
<p> </p>
<p>“這項工作對私人信息檢索的實際成本做出了重大改進。雖然眾所周知,低帶寬PIR方案意味著公鑰加密,這通常比私鑰加密慢幾個數(shù)量級,但這項工作開發(fā)了一種巧妙的方法來彌補差距。這是通過巧妙地利用Regev公鑰加密方案的特殊屬性來實現(xiàn)的,將絕大多數(shù)計算工作推到預(yù)計算步驟,在這個步驟中,服務(wù)器計算出關(guān)于數(shù)據(jù)庫的一個簡短的‘提示’,”以色列理工學院(以色列理工學院)的計算機科學教授Yuval Ishai說,他沒有參與這項研究。他們的方法特別吸引人的地方在于,相同的提示可以被任意數(shù)量的客戶無限次地使用。這使得計算提示的(中等)成本在同一個數(shù)據(jù)庫被多次訪問的典型場景中顯得微不足道。”</p>
<p> </p>
<p>這項工作部分由美國國家科學基金會、谷歌、Facebook、麻省理工學院Fintech@CSAIL倡議、美國國家科學基金會研究生研究獎學金、EECS偉大教育家獎學金、美國國立衛(wèi)生研究院、國防高級研究計劃局、麻省理工學院- ibm沃森人工智能實驗室、模擬設(shè)備、微軟和桑頓家族教師研究創(chuàng)新獎學金資助。</p>
<p> </p>
<blockquote>
<p>注:本文由院校官方新聞直譯,僅供參考,不代表指南者留學態(tài)度觀點。</p>
</blockquote>