在過去一周里,Sora成為了全球關注的熱點,其熱議程度超越了ChatGPT,盡管它還未向公眾全面開放。Sora的出現(xiàn)不僅展示了視覺沖擊力超越文字的力量,也引發(fā)了人們對于AI發(fā)展深一層的思考:在2024年,以Sora為代表的生成式AI或將引領我們邁向更加不可思議的未來。
不同于單純的視頻生成工具,Sora被視作一種“世界模型”。盡管AI生成視頻并非新技術,但Sora在視頻的長度與質量上實現(xiàn)了飛躍,超越了現(xiàn)有的文生視頻模型,如Runway、Stability AI的產品,以及曾經引起轟動的Pika。
Sora的技術實力體現(xiàn)在六個關鍵方面: - 根據(jù)文本生成長達60秒的高質量視頻,忠實地呈現(xiàn)用戶指令。 - 能夠生成包含復雜場景、角色互動、特定運動及精細背景的視頻,增強敘事的真實感。 - 深入理解語言,準確把握提示內容的情感,使生成內容緊密貼合指令。 - 支持單個視頻中多個鏡頭的創(chuàng)作,保持風格統(tǒng)一,適用于多視角展示。 - 能夠基于靜態(tài)圖像生成動態(tài)視頻,或擴展已有視頻內容。 - 模擬物理世界運動,包括物體移動、相互作用等,體現(xiàn)了對現(xiàn)實世界的理解。
OpenAI在介紹Sora時,特別強調其“世界模型”的特性,這在以往模型發(fā)布中是首次。然而,這一提法也引起了科技界的廣泛討論,特別是圍繞Sora是否真正理解物理世界,以及“世界模型”的確切含義。
一些專家,如英偉達的Jim Fan,認為Sora是一個可學習的物理模擬器,即“世界模型”。但圖靈獎得主楊立昆則指出,僅憑生成逼真視頻并不意味著理解物理世界,強調真正的“世界模型”應具備基于當前狀態(tài)預測未來狀態(tài)的能力,而Sora目前的自回歸生成方式尚不足以完全達到這一標準。
Sora雖在文生視頻領域樹立了新的里程碑,但仍面臨挑戰(zhàn),如物理交互模擬不精確、對象狀態(tài)變化處理不當、長視頻連貫性不足及對象突兀出現(xiàn)等問題,顯示出在穩(wěn)定模擬物理世界方面的局限。
整體而言,盡管AI視頻生成技術在2023年取得顯著進步,但仍未完全解決場景控制、時間連貫性和視頻長度等核心問題。Sora的問世激發(fā)了人們對AI視頻未來的無限遐想,同時也提示我們,如同牛頓之前的物理學,AI領域仍有許多基礎科學問題等待破解。頂尖學者們,如李飛飛與吳恩達,均認為AI研究正處于一個類似“前牛頓時期”,強調智能科學的深層次探索與理論構建的迫切性。
隨著Sora的發(fā)布,人們對于生成式AI的潛力抱持樂觀態(tài)度,期待著未來AI能夠像人類一樣觀察、感知并理解這個世界。這不僅是技術的飛躍,更是對人類智能科學邊界的拓展,預示著一個激動人心的未來正逐步臨近。
AI操控的戰(zhàn)斗機與人類飛行員進行一對一空戰(zhàn)的場景,曾經只存在于電影情節(jié)中,而今正逐步邁入現(xiàn)實。3日,一項美軍AI戰(zhàn)斗機項目首度曝光于公眾視野中
2024-05-05 11:49:20美軍AI戰(zhàn)斗機首次公開施一公說AI能提供磚頭但還不會蓋房接受總臺采訪時,西湖大學校長施一公表示,AI的出現(xiàn)讓科學家的研究生命大大延展:“以前十個博士生五年才能解決一個大復合物的結構,現(xiàn)在借助于AI
2024-05-06 09:25:24施一公說AI能提供磚頭但還不會蓋房6月20日,一場以“樓市新引力”為主題的論壇在北京成功召開,吸引了二十多家房地產行業(yè)企業(yè)的市場與品牌代表參與
2024-06-24 14:59:23貝殼邢巖:消費者買房決策周期延長在遙遠的未來,地球會怎樣,取決于我們今天的選擇。地球是全人類賴以生存的唯一家園。珍愛地球,人與自然和諧共生。
2024-04-22 15:49:19AI科幻大片丨珍AI地球