亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app

成就了Sora和Stable diffusion 3的DiTs:究竟是啥

訪客 2年前 (2024-02-25) 閱讀數 339 #區塊鏈
文章標簽 前沿文章

作者|苗正

Sora才剛發布沒過多久,Stable AI就發布了Stable Diffusion 3。對于使用人工智能創意設計的人來說,無疑是過大年了。那么本篇文章就專門為這些用戶準備,用更直白的話講述Stable Diffusion 3的兩大特色“擴散transformers模型”以及“流匹配”,幫助你在模型發布后更好的使用它來創作。

擴散transformer模型(diffusion transformers),我們下文就簡稱它為DiTs。那看名字你也清楚了,這是一個基于transformer架構的圖像潛變量擴散模型。如果你讀過硅星人Pro的文章《揭秘Sora:用大語言模型的方法理解視頻,實現了對物理世界的“涌現”》,那么你對于接下來的內容來說已經算是“課代表”級別的了。DiTs跟Sora一樣,它也使用了“塊”(patches)這個概念,不過由于DiTs是用來生成圖片的,它不需要像Sora那樣保持不同幀圖片之間的邏輯關聯,所以它不必生成時間和空間的時空塊。

Stable diffusion 3生成

對于DiTs來說,它和4、5年前在計算機視覺領域掀起一場腥風血雨的Vision Transformer (ViT) 是相似的,圖像會被DiTs被分割成多個patches,并嵌入到連續向量空間中,形成序列輸入供transformer處理。不過這里要注意,因為DiTs是有業務在身的,所以對于條件圖像生成任務,DiTs就需要接收并融合外部條件信息,例如類別標簽或文本描述。通常通過提供額外的輸入標記或者跨注意力機制來實現,使得模型能夠根據給定的條件信息指導生成過程。

那么當這個塊抵達DiTs內部的時候呢,他就可以被DiTs內部的DiT block來加工成需要的內容了。DiT block是DiTs最核心的一環,它是一種設計用于擴散模型的特殊transformer結構,能夠處理圖像和條件信息。一般來說,block本身翻譯過來就是塊,但是為了和patches做區分,所以這里我直接用block。

Stable diffusion 3生成

DiT block又分為三個小block:交叉注意力、adaLN、adaLN-Zero。交叉注意力指的是在多頭自注意力層之后添加了一個額外的多頭交叉注意力層,它的作用是利用條件信息來指導圖像生成,使生成的圖片更符合提示詞,不過代價是增加了大約15%的計算量。

adaLN中的LN,指的是通過規范化每一層神經網絡內部單元的輸出,以減少內部協變量偏移(covariate shift)的問題,進而改善模型訓練過程中的收斂速度和性能。那adaLN就是對標準層歸一化的擴展,它允許層歸一化的參數根據輸入數據或附加條件信息動態調整。它就和汽車那個懸掛一樣,是用來增加模型穩定性和適應性的。

Stable diffusion 3生成

接下來,Stable AI在adaLN DiT block的基礎上進行了一項改進,除了回歸γ和β之外,還回歸維度級的縮放參數α,并在DiT block內的任何殘差連接之前立即應用這些參數。而這一個block就是adaLN-Zero,這樣做的目的是為了模仿殘差網絡中的有益初始化策略,以促進模型的有效訓練和優化。

經過DiT block后,token序列就會解碼為輸出噪聲預測和輸出對角協方差預測。通過標準線性解碼器,這兩個預測結果的大小和輸入圖像的空間維度相同。最后是將這些解碼后的令牌按照它們原有的空間布局重新排列,從而得到預測出的噪聲值和協方差值。

Stable diffusion 3生成

第二章,流匹配(Flow Matching,下文簡稱FM)。根據Stable AI的說法,是一種高效的、無需模擬的CNF模型訓練方法,允許利用通用概率路徑監督CNF訓練過程。尤為重要的是,FM打破了擴散模型之外的CNF可擴展訓練障礙,無需深入理解擴散過程即可直接操作概率路徑,從而繞過了傳統訓練中的難題。

所謂CNF,就是Continuous Normalizing Flows,連續歸一化流。這是一種深度學習中的概率模型和生成模型技術。在CNF中,通過一系列可逆且連續的變換將簡單的概率分布轉換為復雜的、高維數據的概率分布。這些變換通常由一個神經網絡來參數化,使得原始隨機變量經過連續變換后能夠模擬目標數據分布。翻譯成大白話,CNF像是搖骰子那樣生成數據的。

Stable diffusion 3生成

但是CNF在實際操作中需要大量的計算資源和時間,于是Stable AI就尋思了,那能不能又一個結果只要差不多和CNF一樣就行,但是流程要穩定,計算量要低的方法?于是FM就誕生了,FM的本質是一個用于訓練CNF模型以適應并模擬給定數據分布演化過程的技術,即使我們并不事先知道這個分布的具體數學表達式或對應的生成向量場。通過優化FM目標函數,也可以逐步讓模型學習到能夠生成與真實數據分布近似的概率分布的向量場。

相較于CNF而言,FM應該算是一種優化方法,它的目標是訓練CNF模型生成的向量場與理想的目標概率路徑上的向量場盡可能接近。

Stable diffusion 3生成

看完了Stable Diffusion 3的兩大核心技術特性你就會發現,其實它和Sora非常接近。倆模型都是transformer模型(stable diffusion此前采用的是U-Net)、都使用塊、都有著劃時代的穩定性和優化,而且出生日期還這么近,說他們有血緣關系,我認為并不過分。

不過“兄弟倆”有一個根源性的不同,那就是Sora閉源,Stable Diffusion 3開源。事實上,Midjourney也好,DALL·E也好,他們都是閉源的,唯有Stable Diffusion是開源的。如果你關注開源人工智能,那么你一定發現了,開源社區陷入困境已經有很長一段時間了,沒有明顯的突破,很多人都對此失去信心。Stable Diffusion 2和Stable Diffusion XL僅改進了生成圖片的美觀性,而Stable Diffusion 1.5已經可以做到這一點。看到Stable Diffusion 3的革命性改進,能讓很多人開源社區的開發者重燃信心。

Stable diffusion 3生成

再說個刺激的,Stable AI的CEO默罕默德艾馬德莫斯塔克(??????? ???? ??????)在推特中說到,盡管Stable AI在人工智能這個領域的資源比其他一些公司少了足足100倍,但是Stable Diffusion 3架構已經可以接受除了視頻和圖像以外的內容了,不過目前還不能公布太多。

你說圖片和視頻我還能理解,可啥叫“以外”的內容?其實我能想到的那就是音頻了,通過一段聲音來生成圖片。讓人摸不著頭腦,不過一旦Stable AI放出最新的研究成果,我們一定第一時間拿來解讀。

Stable diffusion 3生成

熱門
亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app
  • <strike id="ykeqq"><input id="ykeqq"></input></strike>
  • <strike id="ykeqq"><menu id="ykeqq"></menu></strike>
    <strike id="ykeqq"></strike>
    <fieldset id="ykeqq"></fieldset>
    <del id="ykeqq"><dfn id="ykeqq"></dfn></del>
    亚洲欧美视频一区二区三区| 久久精品一区二区三区中文字幕 | 久久久噜噜噜久久| 欧美激情网站在线观看| 国产麻豆精品视频| 午夜视频在线观看一区二区三区| 免费在线一区二区| 国产欧美一区二区在线观看| 亚洲欧美国产视频| 欧美巨乳在线| 这里只有精品视频| 欧美不卡视频一区| 国内免费精品永久在线视频| 久久国产视频网| 欧美视频在线免费| 亚洲一区二区在线观看视频| 蜜桃视频一区| 国产一区成人| 久久综合久久综合这里只有精品| 国产精品亚洲网站| 久久福利精品| 国产精品网站一区| 欧美一区二区三区四区视频| 欧美四级在线观看| 午夜精品久久久| 欧美亚洲第一页| 久久成人18免费观看| 欧美午夜宅男影院| 欧美一乱一性一交一视频| 欧美色道久久88综合亚洲精品| 亚洲午夜一区二区| 欧美日韩伦理在线| 欧美三级在线| 国产精品主播| 久久久久一区二区| 国产午夜精品一区理论片飘花| 久久免费午夜影院| 国产一区二区三区精品欧美日韩一区二区三区 | 久久黄色小说| 国产精品自在欧美一区| 久久久久久9| 国产一区视频网站| 欧美成人一二三| 亚洲视频999| 欧美日韩亚洲三区| 欧美一二三区精品| 国产精品性做久久久久久| 久久字幕精品一区| 亚洲色图综合久久| 欧美色区777第一页| 欧美一区二区高清| 国产午夜久久久久| 欧美国产精品一区| 亚洲欧美视频一区| 国产目拍亚洲精品99久久精品 | 欧美一区三区二区在线观看| 国产精品欧美在线| 另类春色校园亚洲| 亚洲视频电影图片偷拍一区| 欧美系列电影免费观看| 久久久在线视频| 在线观看视频亚洲| 国产精品美女久久久久久久| 久久综合国产精品| 亚洲一区激情| 国产日韩精品在线观看| 欧美精品久久久久a| 欧美综合国产精品久久丁香| 国产一区二区三区高清| 欧美日韩精品二区| 久久影院午夜论| 亚洲综合色激情五月| 国产酒店精品激情| 欧美啪啪一区| 久久嫩草精品久久久精品| 亚洲午夜久久久| 国产视频一区二区三区在线观看| 欧美精品一区二区视频| 久久久91精品| 亚洲欧美日韩国产综合| 国产综合色精品一区二区三区| 欧美日韩伊人| 欧美黄色aaaa| 久久久久久夜| 欧美一区二区久久久| 影音先锋成人资源站| 国产精品专区一| 欧美视频精品在线| 欧美风情在线观看| 久久亚洲春色中文字幕久久久| 亚洲欧美在线aaa| 亚洲深夜福利在线| 狠狠色狠狠色综合| 国产日韩欧美一区在线 | 欧美精品自拍| 免费久久久一本精品久久区| 欧美在线视屏| 亚洲一区二区在线| 精品二区久久| 国产日韩在线一区二区三区| 国产精品高清网站| 欧美日韩综合精品| 欧美精品一区在线播放| 欧美有码在线视频| 国产专区欧美精品| 欧美日韩精品一区二区| 久久亚洲不卡| 久久精品国产久精国产一老狼 | 老司机aⅴ在线精品导航| 欧美一区二区三区精品电影| 亚洲网站在线| 一区免费视频| 国外成人性视频| 国产一区二区福利| 国产视频亚洲精品| 国产日韩在线不卡| 国产欧美一区二区精品性| 欧美亚州韩日在线看免费版国语版| 欧美精品大片| 欧美久久成人| 欧美日韩精品二区第二页| 欧美日韩大片| 欧美日韩一区二区三区高清| 欧美日韩成人一区二区| 欧美日韩国产麻豆| 欧美日韩国产三区| 欧美日韩国产专区| 欧美视频日韩视频| 欧美性淫爽ww久久久久无| 欧美午夜精品久久久久久孕妇| 欧美视频精品一区| 国产精品老女人精品视频| 国产精品欧美久久| 国产亚洲va综合人人澡精品| 国产综合视频在线观看| 一区二区三区自拍| 亚洲无毛电影| 午夜精品短视频| 欧美在线观看一二区| 久久久www成人免费精品| 久久在线播放| 欧美国产激情二区三区| 欧美日韩国产成人高清视频| 欧美日韩亚洲一区二区三区在线 | 久久九九全国免费精品观看| 久久久欧美精品| 欧美99在线视频观看| 欧美伦理a级免费电影| 欧美日韩在线播| 国产精品亚洲第一区在线暖暖韩国| 国产偷久久久精品专区| 在线观看视频欧美| 性色av一区二区三区在线观看 | 国产精品久久久久久影视| 国产精品一区二区三区免费观看| 国产日韩欧美中文在线播放| 极品少妇一区二区| 午夜性色一区二区三区免费视频| 久久国产精品99精品国产| 欧美11—12娇小xxxx| 欧美三区在线| 国产一区二区三区在线观看免费视频| 伊人男人综合视频网| 欧美一级欧美一级在线播放| 久久综合999| 欧美日韩亚洲高清| 国产午夜久久久久| 亚洲欧美日韩直播| 免费国产一区二区| 国产精品久久精品日日| 激情六月婷婷综合| 欧美一区影院| 欧美成人午夜免费视在线看片 | 亚欧美中日韩视频| 欧美α欧美αv大片| 国产精品久久久| 中国亚洲黄色| 久久琪琪电影院| 欧美视频免费在线| 禁久久精品乱码| 久久久精品五月天| 欧美视频一二三区| 激情婷婷久久| 久久久99爱| 国产精品电影网站| 在线国产欧美| 久久综合成人精品亚洲另类欧美| 欧美性大战久久久久久久| 在线播放一区| 老司机一区二区三区| 国产精品永久免费| 亚洲欧美日韩国产| 欧美国产免费| 国产一区二区三区高清| 欧美中文字幕久久| 欧美午夜激情视频| 亚洲网站在线看| 欧美激情一区二区三区在线| 国产日本欧美在线观看| 久久经典综合|