GPT-4化身黑客搞破壞，成功率87%！OpenAI要求保密提示詞 AI威脅引熱議

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-04-21 16:51:41 手機(jī)鳳凰網(wǎng)

伊利諾伊大學(xué)香檳分校的研究團(tuán)隊揭示了一項關(guān)于人工智能模型進(jìn)行黑客攻擊的新研究。他們構(gòu)建了一個黑客智能體框架，涉及10個模型，包括GPT-4、GPT-3.5及多個開源模型。實驗結(jié)果令人震驚：只有GPT-4能夠在閱讀CVE漏洞描述后，成功實施漏洞攻擊，其他模型的成功率均為零。

研究團(tuán)隊利用LangChain的ReAct智能體框架，設(shè)計了一個系統(tǒng)，使GPT-4能夠模擬利用真實單日漏洞的過程。具體操作包括：接收到如“使用ACIDRain攻擊某網(wǎng)站”的指令后，GPT-4借助一系列工具和CVE漏洞數(shù)據(jù)庫信息進(jìn)行處理，隨后系統(tǒng)基于歷史記錄生成反應(yīng)，最終成功執(zhí)行雙花攻擊。值得注意的是，智能體在攻擊過程中還考慮了并發(fā)攻擊情況及應(yīng)對策略，運用的工具涵蓋網(wǎng)頁瀏覽、終端訪問、搜索結(jié)果利用、文件操作及代碼解釋器。

研究使用的提示詞長達(dá)1056個token，精心設(shè)計以激發(fā)智能體的創(chuàng)新思維和堅持不懈的精神，鼓勵其嘗試多種攻擊路徑。盡管提示詞詳細(xì)程度高，出于倫理考量，研究人員并未公開具體內(nèi)容。整個黑客智能體的構(gòu)建僅耗用了91行代碼，包括調(diào)試和日志記錄部分。

在實驗階段，團(tuán)隊選取了15個真實世界的一日漏洞數(shù)據(jù)集，涵蓋網(wǎng)站、容器管理軟件和Python包的漏洞。其中多數(shù)被評為高級或關(guān)鍵級別，且超過GPT-4基礎(chǔ)模型的知識截止日期。評價指標(biāo)聚焦于漏洞攻擊成功率和成本。

測試中，GPT-4是唯一能成功破解單個一日漏洞的模型，成功率高達(dá)87%。相比之下，GPT-3.5及其他開源模型在發(fā)現(xiàn)和利用漏洞方面的成功率皆為零。GPT-4未能攻克的兩個漏洞分別為Iris XSS和Hertzbeat RCE。前者因平臺導(dǎo)航依賴JavaScript，超出GPT-4處理范圍；后者則因其描述為中文，與GPT-4使用的英文提示產(chǎn)生混淆。

進(jìn)一步分析顯示，去除CVE描述后，GPT-4的成功率大幅降至7%，揭示了大模型在發(fā)現(xiàn)漏洞方面難度更大。盡管如此，GPT-4仍能在33.3%的情況下準(zhǔn)確識別漏洞，但只能利用其中一個。對于知識截止日期后的漏洞，識別率升至55.6%。研究還指出，無論是否存在CVE描述，智能體采取的行動步數(shù)差異不大，推測這可能與模型的上下文窗口長度有關(guān)，規(guī)劃機(jī)制和子智能體的應(yīng)用有望提升整體性能。

關(guān)于成本，研究計算得出GPT-4每次利用漏洞的平均成本為3.52美元，主要源于輸入token的費用?？紤]到整個數(shù)據(jù)集中40%的成功率，每次成功攻擊的平均成本約為8.8美元。

該研究由伊利諾伊大學(xué)香檳分校助理教授Daniel Kang領(lǐng)導(dǎo)，他的研究領(lǐng)域包括機(jī)器學(xué)習(xí)分析、機(jī)器學(xué)習(xí)安全和密碼學(xué)。

研究發(fā)布后引發(fā)網(wǎng)友熱議。部分網(wǎng)友認(rèn)為實驗夸大了威脅，指出測試的15個漏洞中有5個為易攻破的XSS漏洞。有人分享了使用GPT-4和Claude僅需簡單提示詞即可成功攻擊的經(jīng)驗。還有人提議增加測試復(fù)雜度，如提供Metasploit工具并要求智能體針對無風(fēng)險緩解措施的CVE提出多級緩解方案。然而，更多人擔(dān)憂這一研究將刺激初級黑客行為，同時也促使企業(yè)更加關(guān)注網(wǎng)絡(luò)安全。

鑒于OpenAI已知悉此項研究，未來我們或許能看到相關(guān)安全防御措施的升級。對此，你怎么看？

(責(zé)任編輯：張蕾)

關(guān)閉

GPT-4化身黑客搞破壞，成功率87%！OpenAI要求保密提示詞 AI威脅引熱議

相關(guān)新聞

今日熱點

頻道熱點

GPT-4化身黑客搞破壞，成功率87%！OpenAI要求保密提示詞 AI威脅引熱議