將一段文字輸入,瞬間打造“大片”級別的視頻片段?近日,OpenAI震撼發布了首款視頻生成模型Sora. . .
將一段文字輸入,瞬間打造“大片”級別的視頻片段?近日,OpenAI震撼發布了首款視頻生成模型Sora,迅速引起業界熱議與廣泛關注。
這家以研發先進人工智能技術著稱的公司,在繼其對話式語言模型ChatGPT引發全球熱議之后,于2024年2月16日凌晨推出了全新的文生視頻模型——Sora。
Sora的核心能力在于能夠將文本輸入轉化為真實且連貫的視頻內容,這一壯舉顛覆了傳統的視頻制作流程。它能根據用戶提供的文本描述或指令生成長達一分鐘的高質量視頻片段,并確保視頻不僅在視覺效果上逼真,而且遵循物理世界的規律,實現動態場景的精確模擬。這意味著,無論是教育、娛樂、廣告還是影視制作等領域,都有望通過Sora極大地提高內容生產的效率與創新性。
OpenAI稱,Sora不僅能理解用戶在提示中提出的要求,還能理解這些事物在物理世界中是如何存在的。
根據Sora模型在AI視頻生成領域的創新,我們提煉出它的5大亮點:
顯著的時長突破:相較于其他文本到視頻轉換模型,Sora能夠生成長達一分鐘連續且高質量的視頻內容。
三維空間連貫性:具備動態鏡頭控制能力,即使攝像機視角發生變化(移動或旋轉),模型依然能確保場景中的人物和物體在三維空間中保持一致、流暢的動作和位置關系。
長期連續性和物體一致性:在單個視頻的不同鏡頭間,Sora可以保持同一物體或主題的持久不變性,即使它們在某些時刻未出現在畫面中,當再次出現時仍能保持之前的狀態。
視頻擴展與連接功能:Sora不僅能生成獨立的視頻片段,還能夠根據需要前后延伸已有的視頻內容,并能夠無縫地將兩個不同的視頻片段拼接起來,形成邏輯連貫的整體。
模擬與互動:Sora具有模擬復雜數字環境的能力,例如能夠模擬人工操作,在虛擬環境中如Minecraft游戲中控制玩家的行為,展示了其在游戲內容生成和交互式視頻制作方面的潛力。
Sora的突出表現引來了網友們的熱烈反響,紛紛喊話“太炸裂了”“現實不存在了”。
Open AI自稱Sora是“世界模擬器”。
360董事長周鴻祎公開表示:Sora 的出現,或意味著 AGI(通用人工智能)實現將從 10 年縮短到 1 年。Sora可能給廣告業、電影預告片、短視頻行業帶來巨大的顛覆。
前阿里VP、正在AI infra賽道創業的賈揚清在朋友圈發表觀點認為,首先“對標OpenAI的公司有一波被其他大廠fomo(害怕錯過)收購的機會”;其次“長線閉源寡頭,開源還需要一段時間才能catch up”;最后,算法小廠“要不就算法上媲美OpenAI,要不就垂直領域深耕應用,要不就開源”,并預言“infra的需求繼續會猛增”。
國盛證券認為,Sora相比此前其他文生視頻模型,已經跨越到實用生產力工具,1分鐘長度有望大規模應用在短視頻領域,擴展視頻的能力也有望制作長視頻。
對于日常生活而言,Sora的應用前景無比廣闊。在個人層面上,人們可以快速創建個性化的故事、家庭錄像,甚至是基于想象的概念可視化。而在專業工作環境中,Sora可為新聞編輯室提供即時的可視化新聞報道,為設計師提供創意原型,甚至在建筑設計、游戲開發等行業中輔助構思和預覽設計成果。
更深層次地看,Sora的出現可能對就業市場產生深遠影響。一方面,它將釋放創造力,使更多人能夠在不具備傳統視頻制作技能的情況下進行高質量的內容創作;另一方面,也可能促使相關行業從業者提升自身技術層次,轉向更具策略性和創造性的工作角色。
此外,OpenAI在發布Sora的同時還宣布了其擴張AI算力基礎建設的計劃,擬籌集數萬億美金用于構建更強大的計算平臺。這進一步凸顯了AI作為新工業革命核心技術的地位,以及在未來社會發展中所扮演的關鍵角色。
當然,隨著Sora模型的發布,也引發了關于AI創造內容版權、倫理等問題的討論。如何在保證創意自由的同時,保護原創作者的權益,是擺在全社會面前的一個重要課題。
Sora文生視頻模型不僅是一個技術創新的里程碑,也是人類探索智能工具如何重塑生產力和信息傳播方式的重要一步。隨著Sora及其后續迭代版本的廣泛應用,我們可以期待一個更加智能化、高效化的內容生產和消費新時代的到來。