警惕AIGC數(shù)據(jù)污染稀釋人類原創(chuàng) 海量AIGC“沖淡”原創(chuàng)數(shù)據(jù)(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-10-17 16:15:00 百家號

生成式模型的訓(xùn)練依賴于大量公開的網(wǎng)絡(luò)數(shù)據(jù)，而互聯(lián)網(wǎng)上的信息質(zhì)量良莠不齊，網(wǎng)友們的觀點通常帶有強烈的個人色彩。即使盡力清洗和過濾訓(xùn)練數(shù)據(jù)，也很難完全避免有害內(nèi)容的滲透。如果訓(xùn)練數(shù)據(jù)中含有偏見或錯誤信息，模型不僅會繼承這些信息，還可能通過生成新內(nèi)容的方式進一步放大這些問題。由于生成式人工智能模型可以高效地生成海量內(nèi)容，錯誤觀點和有害信息通過AIGC得以更廣泛、更快速地傳播，并且由于其逼真的表現(xiàn)形式，極易影響公眾判斷，污染網(wǎng)絡(luò)數(shù)據(jù)導(dǎo)向。

生成式人工智能可以根據(jù)人的指令生成不存在的內(nèi)容，極易被用于自動生成虛假新聞和謠言。深度偽造技術(shù)正快速發(fā)展，圖片偽造、音頻合成和視頻換臉在生成式AI的幫助下變得輕而易舉，這些虛假內(nèi)容能夠以逼真的形式迅速傳播，帶來嚴(yán)重的社會影響。

從全社會層面來看，倘若低質(zhì)量的生成內(nèi)容涌入公共數(shù)據(jù)源，將進一步污染全社會的數(shù)據(jù)來源。當(dāng)數(shù)據(jù)源被大量低質(zhì)量生成內(nèi)容占據(jù)，數(shù)據(jù)生態(tài)將逐步崩潰，構(gòu)建優(yōu)質(zhì)數(shù)據(jù)要素將無從談起。這不僅影響人工智能行業(yè)的發(fā)展，還會波及各個依賴數(shù)據(jù)要素進行生產(chǎn)活動的行業(yè)和領(lǐng)域，例如新聞、教育、公共安全等。

AIGC數(shù)據(jù)需要“清污”。現(xiàn)存的隱私保護、知識產(chǎn)權(quán)和數(shù)據(jù)信息相關(guān)的法律與大數(shù)據(jù)時代已經(jīng)不匹配。面對互聯(lián)網(wǎng)上新增的海量原始數(shù)據(jù)，我們亟須構(gòu)建完善的數(shù)據(jù)內(nèi)容維護、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全監(jiān)管體系。

聯(lián)合國大學(xué)關(guān)于AIGC數(shù)據(jù)利用與風(fēng)險的一份調(diào)研報告建議：全面推進AIGC相關(guān)立法，從源頭防范數(shù)據(jù)污染問題；構(gòu)建全面的AIGC數(shù)據(jù)質(zhì)量與安全評價體系，促進合成數(shù)據(jù)的合理利用；將AIGC數(shù)據(jù)管理納入全球AI治理合作，促成全球范圍內(nèi)全面解決合成數(shù)據(jù)帶來的風(fēng)險；加快明確生成式人工智能倫理與隱私準(zhǔn)則，增強生成式人工智能技術(shù)的透明性，防范有違全人類共同價值的AIGC內(nèi)容擴散，并解決用戶隱私和數(shù)據(jù)濫用等問題。

關(guān)閉

警惕AIGC數(shù)據(jù)污染稀釋人類原創(chuàng) 海量AIGC“沖淡”原創(chuàng)數(shù)據(jù)(2)

相關(guān)新聞

今日熱點

頻道熱點