OpenAI去年憑借ChatGPT的流行而進入主流,現在該公司正將其人工智慧技術應用到影片行業。
OpenAI於周四推出了其新的生成式AI模型Sora。Sora的工作方式類似OpenAI的圖像生成AI工具DALL-E。使用者輸入所需場景,Sora將返回一個高清影片片段。Sora還可以生成受靜態圖像啟發的影片片段,或擴展現有影片或填充缺失幀。
Sora是一個擴散式人工智慧模型,與ChatGPT一樣,它使用谷歌研究人員在2017年論文中提出的Transformer架構。OpenAI在其聲明中寫道:“Sora為能夠理解和模擬現實世界的模型奠定了基礎。”
Sora目前只能生成一分鐘或更短的影片。作為微軟支援的OpenAI,其發展目標之一是多模態——將文字、圖像和影片生成結合起來,從而提供更廣闊的人工智慧模型套件。
目前,Sora只提供給一小部分安全測試人員 (又稱“紅隊”)使用,他們負責測試模型在錯誤訊息和偏見等方面的漏洞。該公司表示,其配套的技術論文將在周四晚些時候發布。
OpenAI還表示,他們正在構建一個可以識別由Sora生成的影片的“檢測分類器”,並計劃在其輸出中包含某些元資料,以幫助識別人工智慧生成的內容。這與Meta在今年大選期間用來識別人工智慧生成圖像的元資料類型相同。
現在聊天機器人和圖像生成器已經進入消費和商業世界,影片可能是生成式AI的下一個前沿。
借助Sora,OpenAI正在尋求與Meta和谷歌等公司的影片生成AI工具競爭,後者於1月宣布了Lumiere。其他初創公司也提供了類似的人工智慧工具,例如Stability AI,其產品名為Stable VideoDiffusion。亞馬遜還發布了Create with Alexa,這是一個專門生成基於提示的短格式動畫兒童內容的模型。
OpenAI官網發布的Sora生成影片:
Tokyo in the snow
影片文字Prompt: “Beautiful, snowy Tokyo city is bustling. The camera movesthrough the bustling city street, following several people enjoying thebeautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petalsare flying through the wind along with snowflakes.”
“美麗、白雪皚皚的東京城很繁華。鏡頭穿過熙熙攘攘的城市街道,跟隨幾個人享受美麗的雪天並在附近的攤位購物。美麗的櫻花花瓣隨著雪花在風中飛舞。”
Gold Rush
Ships in coffee
Big Sur