新智元報道
編輯:David
【新智元導讀】特斯拉前AI總監點贊!這個開源AI藝術創作模型,想要開啟「人機合作」藝術創作新時代。
近日,由Emad Mostaque創立和資助的Stability.ai公司宣布公開發布AI創造的藝術作品。
你可能認為這只是AI在藝術領域的另一次嘗試,但實際上遠不止如此。
有兩個原因。
首先,與DALL-E 2不同的是,Stable Diffusion是開源的。這意味著任何人都可以利用它的骨干,免費建立針對特定文本到圖像創作任務的應用程序。
另外,Midjourney的開發者實施了一項功能,允許用戶將其與Stable Diffusion結合起來,這導致了一些驚人的結果。
試想一下,在接下來的幾個月里會出現什么。
第二,與DALL-E mini和Disco Diffusion不同,Stable Diffusion可以創造出驚人的逼真和藝術作品,對OpenAI或谷歌的模型沒有什么可羨慕的。人們甚至聲稱它是「生成式搜索引擎」中新的SOTA。
(除非另有說明,本文所有圖片都是通過Stable Diffusion創作的)。
Stable Diffusion 體現了人工智能藝術世界的最佳特征:它可以說是現有最好的人工智能藝術模型,而且是開源的。這簡直是聞所未聞,將產生巨大的影響。
更有趣的是,關于這些服務的消息可能會通過最意想不到的來源到達你的手中。你的父母、你的孩子、你的伴侶、你的朋友或你的同事。
這些人往往是人工智能領域發生的事情的局外人,他們即將發現這個領域的最新趨勢。藝術可能成為AI最終敲開那些對未來視而不見的人的大門的方式。這不是很有詩意嗎?
不只是開源的DALL·E 2
Stability.ai的誕生是為 了創造「開放的AI工具,讓我們發揮潛能」。 不僅僅是從未進入大多數人手中的研究模型,而是具有現實世界應用的工具,開放給我和你來使用和探索。
這是與其他科技公司不同的地方,比如OpenAI,它嫉妒地守護著它最好的系統(GPT-3和DALL-E 2)的秘密,或者谷歌,它甚至從未打算將自己的(PaLM、LaMDA、Imagen或Parti)作為私人測試版發布。
Stability.ai的這次公開發布不僅分享了模型權重和代碼——雖然這對科學和技術的健康發展很關鍵,但大多數人并不關心它們。而且還為我們這些不想或不知道如何編碼的人提供了一個無代碼的即用型網站。
網站名叫DreamStudio Lite,可以免費使用,最多可生成200張圖片。像DALL-E 2一樣,它采用付費訂閱模式,可以用10英鎊獲得1千張圖片(OpenAI每月補充15個積分,但要獲得更多的積分,你必須以15美元購買115個包)。
DALL-E的成本為0.03美元/圖,而Stable Diffusion的成本為0.01英鎊/圖。
此外,還可以通過API大規模地使用Stable Diffusion(成本呈線性增長,所以你可以用1000英鎊獲得100K代)。除了圖像生成,Stability.ai很快將宣布DreamStudio Pro(音頻/視頻)和Enterprise(工作室)。
DreamStudio可能很快會實現的另一個功能是,可以從其他圖像生成圖像,而不是通常的文本到圖像的設置。就像下面這樣:
在網站上,還有一個關于提示工程的資源,如果你是這方面的新手,你可能會用得上。 另外,與DALL-E 2不同,你可以控制參數來影響結果,并對其保留更多的代理權。
Stability.ai已經做了一切來促進人們對模型的訪問。OpenAI是第一個,必須走得更慢,以評估模型固有的潛在風險和偏見,但他們不需要將模型保持在封閉測試階段這么久,也不需要建立這樣一個限制創造力的商業模式。
Midjourney和Stable Diffusion都已經證明了這一點。
安全 開源 > 隱私和控制
開源技術有其自身的局限性。 開放性應該走在隱私和嚴格控制之前,但不應該走在安全之前。
正如該公司在公告中解釋的那樣,它是「一個允許商業和非商業使用的許可」,重點是模型的開放和負責任的下游使用。它還強制要求衍生作品至少要受到同樣的基于用戶的限制。
開源模型本身是很好的模式,但如果我們不希望這項技術最終傷害人們,或以錯誤信息的形式為互聯網增加更多的傲慢,建立合理的護欄也同樣重要。
「由于這些模型是在廣泛的互聯網搜刮的圖像-文本對上訓練出來的,模型可能會重現一些社會偏見,產生不安全的內容,所以開放的緩解策略以及對這些偏見的公開討論可以讓大家參與到這個對話中來?!?/p>
在任何情況下,開放性 安全性>隱私和控制。
開源力量改變世界
憑借道德價值和開放性的堅實基礎,Stable Diffusion承諾在現實世界的影響方面超越其競爭對手。
對于那些想下載它并在他們的電腦上運行它的人來說,你應該知道它需要6.9Gb的VRAM--這適合于高端消費級GPU,使它比DALL-E 2要輕,但對大多數用戶來說仍然是遙不可及的。其余的人,像我一樣,可以馬上開始使用Dream Studio。
Stable Diffusion 被普遍認為是目前最好的AI藝術模型,它將成為無數應用程序、網絡和服務的基礎,重新定義我們如何創造和與藝術互動。
但現在,專門為不同使用情況設計的應用程序將從頭開始建立,供所有人使用。人們正在增強兒童畫,用外畫 內畫制作拼貼畫,設計雜志封面,畫漫畫,創造變形和動畫視頻,從圖像中生成圖像,等等。
其中一些應用在DALL-E和Midjourney中已經成為可能,但Stable Diffusion可以推動當前的創意革命進入下一個階段。用前特斯拉AI總監、李飛飛高徒Andrej Karpathy的話說,就是讓「藝術創作進入了人類 AI合作的新時代。」
像Stable Diffusion這樣的AI藝術模型涉及到一類新工具,應該用我們所處的新現實的新思維框架來理解。我們不能簡單地與其他時代進行類比或平行對比,并期望能夠準確地解釋或預測未來。
有些事情會相似,有些則不會。我們必須把這個即將到來的未來當作未知的領域。
毫無疑問,Stable Diffusion的公開發布是人工智能藝術模型領域有史以來最重要和最有影響的事件,而這只是一個開始。
作者之一的Emad Mostaque在Twitter上說:'隨著我們發布更快、更好和具體的模型,預計質量將繼續全面上升。不僅僅是圖像,下個月是音頻,然后轉向3D、視頻。語言、代碼,以及更多訓練。
我們正處于一場為期數年的革命的邊緣,在我們互動、聯系和理解藝術,特別是一般的創造力的方式。而且不僅僅是在哲學、知識領域,而是作為現在每個人都分享和體驗的東西。
創意世界將永遠改變,我們必須進行開放和尊重的對話,為所有人創造一個更好的未來。只有負責任地使用開源技術,才能創造我們希望看到的變化。
參考資料:
https://thealgorithmicbridge.substack.com/p/stable-diffusion-is-the-most-important