北京大學(xué)人工智能研究院孫仲研究員團(tuán)隊(duì)聯(lián)合集成電路學(xué)院研究團(tuán)隊(duì),成功研制出基于阻變存儲(chǔ)器的高精度、可擴(kuò)展模擬矩陣計(jì)算芯片,首次實(shí)現(xiàn)了在精度上可與數(shù)字計(jì)算媲美的模擬計(jì)算系統(tǒng)。該芯片在求解大規(guī)模MIMO信號檢測等關(guān)鍵科學(xué)問題時(shí),計(jì)算吞吐量與能效較當(dāng)前頂級數(shù)字處理器(GPU)提升百倍至千倍。相關(guān)論文于10月13日刊發(fā)于《自然·電子學(xué)》期刊。
對于大多數(shù)習(xí)慣了數(shù)字計(jì)算機(jī)(0和1)的公眾而言,“模擬計(jì)算”是一個(gè)既古老又新奇的概念。孫仲用生動(dòng)的比喻對其進(jìn)行解釋:現(xiàn)在的所有芯片都是數(shù)字計(jì)算,數(shù)據(jù)都需要先轉(zhuǎn)換成0和1的符號串。比如數(shù)字“十”,需要轉(zhuǎn)譯成“1”和“0”,計(jì)為“1010”。如果用二進(jìn)制來表示“1+1=2”,則應(yīng)該記作“1+1=10”。而模擬計(jì)算則無需這層“轉(zhuǎn)譯”,它是一種“類比計(jì)算”,可以直接用連續(xù)的物理量(如電壓、電流)來類比數(shù)學(xué)上的數(shù)字。比如,數(shù)學(xué)上的“十”,可以直接用十伏或十毫伏的電壓來表示。
模擬計(jì)算機(jī)在計(jì)算機(jī)發(fā)展早期曾被廣泛應(yīng)用,但隨著計(jì)算任務(wù)日益復(fù)雜,其精度瓶頸凸顯,逐漸被數(shù)字計(jì)算取代。此次研究的核心正是要解決模擬計(jì)算“算不準(zhǔn)”的痛點(diǎn)。
當(dāng)前市面上的主流CPU和GPU都是數(shù)字芯片,并都采用馮諾依曼結(jié)構(gòu),將計(jì)算和存儲(chǔ)功能分開,通過01數(shù)字流的編譯、計(jì)算、解碼實(shí)現(xiàn)信息計(jì)算和傳輸。基于阻變存儲(chǔ)器的模擬計(jì)算的優(yōu)勢之一在于取消了“將數(shù)據(jù)轉(zhuǎn)化為二進(jìn)制數(shù)字流”這一過程,同時(shí)不必進(jìn)行“過程性數(shù)據(jù)存儲(chǔ)”,進(jìn)而將數(shù)據(jù)計(jì)算過程與數(shù)據(jù)存儲(chǔ)合而為一,實(shí)現(xiàn)算力解放。
與其他“存算一體”方案對比,許多團(tuán)隊(duì)集中于研究矩陣乘法(AI推理的核心),而孫仲的團(tuán)隊(duì)特色在于專注于更具挑戰(zhàn)性的矩陣方程求解(AI二階訓(xùn)練的核心)。矩陣求逆操作要求的計(jì)算精度極高,時(shí)間復(fù)雜度達(dá)到了立方級。模擬計(jì)算憑借物理規(guī)律直接運(yùn)算的方式,具有低功耗、低延遲、高能效、高并行的天然優(yōu)勢,只要能夠不斷降低計(jì)算誤差,不斷提升計(jì)算精度,將為傳統(tǒng)GPU的算力解放帶來突破。