麻省理工學院 | 打破模擬計算的擴展限制
指南者留學
2022-11-30 08:40:54
閱讀量:1166
<p>隨著機器學習模型變得越來越大、越來越復雜,它們需要更快、更節(jié)能的硬件來執(zhí)行計算。傳統(tǒng)的數字計算機正在奮力追趕。</p>
<p> </p>
<p>模擬光神經網絡可以執(zhí)行與數字神經網絡相同的任務,如圖像分類或語音識別,但由于計算是使用光而不是電信號進行的,光神經網絡可以在消耗更少的能量的情況下運行多倍。</p>
<p> </p>
<p>然而,這些模擬設備容易出現硬件錯誤,從而降低計算精度。硬件部件的微觀缺陷是造成這些錯誤的原因之一。在一個光神經網絡中,有許多相互連接的組件,誤差可以迅速積累。</p>
<p> </p>
<p>即使使用糾錯技術,由于組成光神經網絡的設備的基本特性,一些誤差是不可避免的。一個足夠大到可以在現實世界中實現的網絡將過于不精確而無效。</p>
<p> </p>
<p>麻省理工學院的研究人員已經克服了這一障礙,找到了一種有效擴展光學神經網絡的方法。通過在構成網絡架構的光交換機中添加一個微小的硬件組件,他們甚至可以減少在設備中積累的不可糾正的錯誤。</p>
<p> </p>
<p>他們的工作可能使一種超級快速、節(jié)能的模擬神經網絡成為可能,它的功能與數字神經網絡具有相同的準確性。有了這種技術,當一個光電路變得更大時,它的計算誤差實際上減少了。</p>
<p> </p>
<p>“這是值得注意的,因為它與模擬系統(tǒng)的直覺背道而馳,在模擬系統(tǒng)中,更大的電路應該有更高的誤差,因此誤差限制了可擴展性。這篇論文允許我們用一個明確的‘是’來解決這些系統(tǒng)的可擴展性問題,”首席作者Ryan Hamerly說,他是麻省理工學院電子研究實驗室(RLE)和量子光子實驗室的訪問科學家,NTT研究中心的高級科學家。</p>
<p> </p>
<p>Hamerly的共同作者是研究生Saumil Bandyopadhyay和資深作者Dirk Englund,他是麻省理工學院電氣工程和計算機科學系(EECS)的副教授,量子光子實驗室的負責人,以及RLE的成員。這項研究今天發(fā)表在《自然通訊》雜志上。</p>
<p> </p>
<p><span class="h1"><strong>與光相乘</strong></span></p>
<p> </p>
<p>一個光神經網絡是由許多相互連接的組件組成的,它們的功能就像可重編程、可調諧的鏡子。這些可調諧的鏡子被稱為馬赫-曾德爾測光儀(MZI)。神經網絡數據被編碼成光,光從激光發(fā)射到光神經網絡。</p>
<p> </p>
<p>一個典型的MZI包含兩個反射鏡和兩個分束器。光進入一個MZI的頂部,在那里被分裂成兩個相互干擾的部分,然后被第二個分束器重新組合,然后從底部反射到陣列中的下一個MZI。研究人員可以利用這些光信號的干擾進行復雜的線性代數運算,稱為矩陣乘法,這是神經網絡處理數據的方式。</p>
<p> </p>
<p>但是,當光從一個設備移動到另一個設備時,每個MZI中可能發(fā)生的錯誤會迅速累積起來。可以通過提前識別錯誤并調優(yōu)mzi來避免一些錯誤,這樣早期的錯誤就會被數組中稍后的設備抵消。</p>
<p> </p>
<p>“如果你知道錯誤是什么,這是一個非常簡單的算法。但眾所周知,這些錯誤很難確定,因為你只能訪問芯片的輸入和輸出。”“這促使我們研究是否有可能創(chuàng)建無校準誤差校正。”</p>
<p> </p>
<p>哈默利和他的合作者此前展示了一種數學技</p>
<p>“即使有了錯誤校正,芯片的性能也有一個基本的限制。mzi在物理上無法實現需要配置的某些設置,”他說。</p>
<p> </p>
<p>由于MZI的基本特性,在某些情況下,不可能調優(yōu)設備,使所有光都從底部端口流到下一個MZI。如果設備在每一步都損失一小部分光,而陣列非常大,到最后將只剩下一點點電力。</p>
<p> </p>
<p>“即使有了錯誤校正,芯片的性能也有一個基本的限制。mzi在物理上無法實現需要配置的某些設置,”他說。</p>
<p> </p>
<p>因此,該團隊開發(fā)了一種新型MZI。研究人員在設備的末端增加了一個額外的分束器,稱其為3-MZI,因為它有三個分束器而不是兩個。由于這種額外的分束器混合光線的方式,MZI更容易達到所需的設置,通過其底部端口發(fā)送所有光線。</p>
<p> </p>
<p>重要的是,額外的分束器只有幾微米大小,是一個無源組件,所以它不需要任何額外的布線。增加額外的分束器不會顯著改變芯片的尺寸。</p>
<p> </p>
<p><span class="h1"><strong>芯片越大,錯誤越少</strong></span></p>
<p> </p>
<p>當研究人員進行模擬測試他們的架構時,他們發(fā)現它可以消除許多影響準確性的不可糾正的錯誤。當光神經網絡變得更大時,設備中的誤差量實際上會下降——這與標準mzi設備的情況相反。</p>
<p> </p>
<p>哈默利說,使用3- mzi,他們有可能創(chuàng)造出一個足夠大的設備,可以用于商業(yè)用途,并且誤差已經減少了20倍。</p>
<p> </p>
<p>研究人員還專門針對相關誤差開發(fā)了MZI設計的變體。這些都是由于制造缺陷造成的——如果一個芯片的厚度有輕微的錯誤,那么mzi可能都有相同的誤差,所以誤差都是相同的。他們找到了一種方法來改變MZI的配置,使其對這些類型的錯誤具有健壯性。該技術還增加了光神經網絡的帶寬,使其運行速度提高了三倍。</p>
<p> </p>
<p>現在,他們已經通過模擬展示了這些技術,哈默利和他的合作者計劃在物理硬件上測試這些方法,并繼續(xù)朝著他們可以在現實世界中有效部署的光神經網絡前進。</p>
<p> </p>
<p>這項研究部分由國家科學基金會研究生研究獎學金和美國空軍科學研究辦公室資助。</p>
<p> </p>
<blockquote>
<p>注:本文由院校官方新聞直譯,僅供參考,不代表指南者留學態(tài)度觀點。</p>
</blockquote>