伊利諾伊大學(xué)香檳分校的研究團(tuán)隊揭示了一項關(guān)于人工智能模型進(jìn)行黑客攻擊的新研究。他們構(gòu)建了一個黑客智能體框架,涉及10個模型,包括GPT-4、GPT-3.5及多個開源模型。實驗結(jié)果令人震驚:只有GPT-4能夠在閱讀CVE漏洞描述后,成功實施漏洞攻擊,其他模型的成功率均為零。
研究團(tuán)隊利用LangChain的ReAct智能體框架,設(shè)計了一個系統(tǒng),使GPT-4能夠模擬利用真實單日漏洞的過程。具體操作包括:接收到如“使用ACIDRain攻擊某網(wǎng)站”的指令后,GPT-4借助一系列工具和CVE漏洞數(shù)據(jù)庫信息進(jìn)行處理,隨后系統(tǒng)基于歷史記錄生成反應(yīng),最終成功執(zhí)行雙花攻擊。值得注意的是,智能體在攻擊過程中還考慮了并發(fā)攻擊情況及應(yīng)對策略,運用的工具涵蓋網(wǎng)頁瀏覽、終端訪問、搜索結(jié)果利用、文件操作及代碼解釋器。
研究使用的提示詞長達(dá)1056個token,精心設(shè)計以激發(fā)智能體的創(chuàng)新思維和堅持不懈的精神,鼓勵其嘗試多種攻擊路徑。盡管提示詞詳細(xì)程度高,出于倫理考量,研究人員并未公開具體內(nèi)容。整個黑客智能體的構(gòu)建僅耗用了91行代碼,包括調(diào)試和日志記錄部分。
在實驗階段,團(tuán)隊選取了15個真實世界的一日漏洞數(shù)據(jù)集,涵蓋網(wǎng)站、容器管理軟件和Python包的漏洞。其中多數(shù)被評為高級或關(guān)鍵級別,且超過GPT-4基礎(chǔ)模型的知識截止日期。評價指標(biāo)聚焦于漏洞攻擊成功率和成本。
測試中,GPT-4是唯一能成功破解單個一日漏洞的模型,成功率高達(dá)87%。相比之下,GPT-3.5及其他開源模型在發(fā)現(xiàn)和利用漏洞方面的成功率皆為零。GPT-4未能攻克的兩個漏洞分別為Iris XSS和Hertzbeat RCE。前者因平臺導(dǎo)航依賴JavaScript,超出GPT-4處理范圍;后者則因其描述為中文,與GPT-4使用的英文提示產(chǎn)生混淆。
進(jìn)一步分析顯示,去除CVE描述后,GPT-4的成功率大幅降至7%,揭示了大模型在發(fā)現(xiàn)漏洞方面難度更大。盡管如此,GPT-4仍能在33.3%的情況下準(zhǔn)確識別漏洞,但只能利用其中一個。對于知識截止日期后的漏洞,識別率升至55.6%。研究還指出,無論是否存在CVE描述,智能體采取的行動步數(shù)差異不大,推測這可能與模型的上下文窗口長度有關(guān),規(guī)劃機(jī)制和子智能體的應(yīng)用有望提升整體性能。
關(guān)于成本,研究計算得出GPT-4每次利用漏洞的平均成本為3.52美元,主要源于輸入token的費用??紤]到整個數(shù)據(jù)集中40%的成功率,每次成功攻擊的平均成本約為8.8美元。
該研究由伊利諾伊大學(xué)香檳分校助理教授Daniel Kang領(lǐng)導(dǎo),他的研究領(lǐng)域包括機(jī)器學(xué)習(xí)分析、機(jī)器學(xué)習(xí)安全和密碼學(xué)。
研究發(fā)布后引發(fā)網(wǎng)友熱議。部分網(wǎng)友認(rèn)為實驗夸大了威脅,指出測試的15個漏洞中有5個為易攻破的XSS漏洞。有人分享了使用GPT-4和Claude僅需簡單提示詞即可成功攻擊的經(jīng)驗。還有人提議增加測試復(fù)雜度,如提供Metasploit工具并要求智能體針對無風(fēng)險緩解措施的CVE提出多級緩解方案。然而,更多人擔(dān)憂這一研究將刺激初級黑客行為,同時也促使企業(yè)更加關(guān)注網(wǎng)絡(luò)安全。
鑒于OpenAI已知悉此項研究,未來我們或許能看到相關(guān)安全防御措施的升級。對此,你怎么看?
50亮 1038回復(fù)周星馳當(dāng)年想在電影“建國大業(yè)”求個角色
2024-04-20 11:05:56電影:郭富城化身黑客最近,OpenAI的舉動令人捉摸不透,先是預(yù)告將在5月13日舉辦發(fā)布會,緊接著澄清并非公布GPT-5或傳聞中的GPT搜索引擎,而是關(guān)于ChatGPT和GPT-4的升級
2024-05-12 07:54:36奧特曼耍所有人:GPT搜索鴿了!改升級GPT-4快科技1月29日消息,2024年春運已至,多名網(wǎng)友發(fā)帖稱,線上買不到票的乘客直接去高鐵站自助售票機(jī)購買,可增加購票成功率。
2024-02-02 09:28:11火車站自助售票機(jī)買到票的成功率更高么