生成式模型的訓(xùn)練依賴于大量公開的網(wǎng)絡(luò)數(shù)據(jù),而互聯(lián)網(wǎng)上的信息質(zhì)量良莠不齊,網(wǎng)友們的觀點通常帶有強烈的個人色彩。即使盡力清洗和過濾訓(xùn)練數(shù)據(jù),也很難完全避免有害內(nèi)容的滲透。如果訓(xùn)練數(shù)據(jù)中含有偏見或錯誤信息,模型不僅會繼承這些信息,還可能通過生成新內(nèi)容的方式進一步放大這些問題。由于生成式人工智能模型可以高效地生成海量內(nèi)容,錯誤觀點和有害信息通過AIGC得以更廣泛、更快速地傳播,并且由于其逼真的表現(xiàn)形式,極易影響公眾判斷,污染網(wǎng)絡(luò)數(shù)據(jù)導(dǎo)向。
生成式人工智能可以根據(jù)人的指令生成不存在的內(nèi)容,極易被用于自動生成虛假新聞和謠言。深度偽造技術(shù)正快速發(fā)展,圖片偽造、音頻合成和視頻換臉在生成式AI的幫助下變得輕而易舉,這些虛假內(nèi)容能夠以逼真的形式迅速傳播,帶來嚴(yán)重的社會影響。
從全社會層面來看,倘若低質(zhì)量的生成內(nèi)容涌入公共數(shù)據(jù)源,將進一步污染全社會的數(shù)據(jù)來源。當(dāng)數(shù)據(jù)源被大量低質(zhì)量生成內(nèi)容占據(jù),數(shù)據(jù)生態(tài)將逐步崩潰,構(gòu)建優(yōu)質(zhì)數(shù)據(jù)要素將無從談起。這不僅影響人工智能行業(yè)的發(fā)展,還會波及各個依賴數(shù)據(jù)要素進行生產(chǎn)活動的行業(yè)和領(lǐng)域,例如新聞、教育、公共安全等。
AIGC數(shù)據(jù)需要“清污”。現(xiàn)存的隱私保護、知識產(chǎn)權(quán)和數(shù)據(jù)信息相關(guān)的法律與大數(shù)據(jù)時代已經(jīng)不匹配。面對互聯(lián)網(wǎng)上新增的海量原始數(shù)據(jù),我們亟須構(gòu)建完善的數(shù)據(jù)內(nèi)容維護、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全監(jiān)管體系。
聯(lián)合國大學(xué)關(guān)于AIGC數(shù)據(jù)利用與風(fēng)險的一份調(diào)研報告建議:全面推進AIGC相關(guān)立法,從源頭防范數(shù)據(jù)污染問題;構(gòu)建全面的AIGC數(shù)據(jù)質(zhì)量與安全評價體系,促進合成數(shù)據(jù)的合理利用;將AIGC數(shù)據(jù)管理納入全球AI治理合作,促成全球范圍內(nèi)全面解決合成數(shù)據(jù)帶來的風(fēng)險;加快明確生成式人工智能倫理與隱私準(zhǔn)則,增強生成式人工智能技術(shù)的透明性,防范有違全人類共同價值的AIGC內(nèi)容擴散,并解決用戶隱私和數(shù)據(jù)濫用等問題。
生態(tài)安全對于文明的繁榮至關(guān)重要,它構(gòu)成了國家安全的基本組成元素,并保障著經(jīng)濟社會的持續(xù)健康發(fā)展
2024-05-13 11:02:31這些生態(tài)數(shù)據(jù)關(guān)乎國家安全切勿泄密