<li id="wio2x"><abbr id="wio2x"></abbr></li>

<li id="wio2x"><ins id="wio2x"></ins></li>

hao86下載站：值得大家信賴的游戲下載站！

手機版
設為首頁
網(wǎng)站導航

熱門推薦

學習教育

占卜抽簽

周公解夢大全查詢
二十八星宿
觀音靈簽
黃大仙靈簽
國學六十四卦
諸葛神算
稱骨測算
指紋測算
吉兇預測
車公靈簽
關帝靈簽
呂祖靈簽

查看更多

首頁手游下載軟件下載行業(yè)資訊軟件教程專題合集區(qū)塊鏈

首頁 > 區(qū)塊鏈 > 8天狂收6100顆星，可商用！東京工業(yè)、麻省理工等開源Stream Diffusion

8天狂收6100顆星，可商用！東京工業(yè)、麻省理工等開源Stream Diffusion

時間：2023-12-29 09:41:49

來源：hao86下載

區(qū)塊鏈

【#區(qū)塊鏈# #8天狂收6100顆星，可商用！東京工業(yè)、麻省理工等開源Stream Diffusion#】

原文來源：AIGC開放社區(qū)

圖片來源：由無界 AI?生成

加州大學伯克利分校、東洋大學、東京工業(yè)大學、麻省理工學院和筑波大學等研究人員，聯(lián)合開源了一款創(chuàng)新性實時交互圖像生成框架——Stream Diffusion。

Stream Diffusion的技術創(chuàng)新點在于，將傳統(tǒng)的順序去噪變成流批處理去噪，消除了漫長的等待、交互生成方式，實現(xiàn)了流暢且吞吐量超高的圖像生成方法。

同時引入了“殘差無分類器指導”方法，進一步提升了流批處理的效率和圖像質量。

根據(jù)Stream Diffusion在Github上的項目提交歷史記錄顯示，僅用了8天的時間就收到6100顆星成為霸榜開源產(chǎn)品，其性能和歡迎程度可見一斑。允許開發(fā)者商用。

開源地址：https://github.com/cumulo-autumn/StreamDiffusion

論文地址：https://arxiv.org/abs/2312.12491

Demo展示：https://github.com/cumulo-autumn/StreamDiffusion/blob/main/assets/demo_03.gif

目前，擴散模型在圖像生成方面獲得了廣泛應用并成功實現(xiàn)商業(yè)化落地，例如，該領域的標桿產(chǎn)品Midjourney。

但在實時交互方面表現(xiàn)不佳需要漫長的等待，尤其是涉及連續(xù)輸入的場景中尤為明顯。

為了解決這些難題，研究人員設計了一種新穎的輸出、輸入方法，就是將原始的順序去噪轉化為批處理去噪過程。

簡單來說，Stream Diffusion相當于大模型領域的機械化流水作業(yè)，將單一、繁瑣的去噪、推理流程改成批量處理。

流批式去噪方法

流批式去噪是Stream Diffusion的核心功能之一，也是實現(xiàn)實時交互的關鍵所在。

傳統(tǒng)的交互式擴散模型都是順序執(zhí)行:一次輸入一張圖片,走完全部的去噪步驟后，再輸出一張結果圖像。然后不斷重復這個過程，生成完成更多的圖像處理。

這樣就造成一個很大的問題速度和質量難以同時得到保證。為了生成高質量的圖像,需要設置較多的去噪步驟,導致生成圖像的效率較慢，無法做到“魚與熊掌”兼得。

流批式去噪的核心思想是:當輸入第一張圖像開始去噪步時,不必等待它完成,就可以接收第二張圖像,以實現(xiàn)批量方式處理。

這樣,U-Net只需要不斷調用,處理一個批量的特征,就可以高效實現(xiàn)圖像生成流水線的批量推進。

此外，流批式去噪方法的好處在于,每次調用U-Net就可以使多個圖像同時推進一步,而U-Net的批量運算非常適合GPU并行計算,所以整體運算效率非常高。

最終可以在保證質量的同時,顯著縮短單張圖像的生成時間。

殘差無分類器指導

為了強化提示條件對結果的影響,擴散模型通常使用一種叫“無分類器指導”的策略。

在傳統(tǒng)方法中,計算負條件向量時需要對每個輸入潛向量配對負條件嵌入,每次推理都要調用U-Net算力消耗巨大。

為了解決這個問題，研究人員提出了“殘差無分類器指導”方法。其核心方法是，假定存在一個“虛擬殘差噪聲”向量,用來逼近負條件向量。

首先計算“正條件”向量,再用正條件向量反推這個虛擬負條件向量。這樣就避免了每次都要額外調用U-Net來計算真實的負條件向量,從而大幅減少了算力。

簡單來說，就是用原始的輸入圖像編碼作為負樣本,無需調用U-Net就可以計算。稍微復雜一點的“一次負條件”,是在第一步使用U-Net計算一次負向量,然后重復使用這個向量近似后面的所有負向量。

流水線作業(yè)

該模塊的功能是使整個系統(tǒng)的瓶頸不再是數(shù)據(jù)格式的轉換,而是基于模型本身的推理時間。

通常，輸入的圖片需要縮放、轉換格式等預處理才能成為模型可用的張量;輸出的張量也需要后處理恢復為圖片格式，整個流程消耗大量時間和算力。

流水線作業(yè)將預/后處理與模型推理完全分離開來,置于不同的線程中并行執(zhí)行。輸入圖像經(jīng)過預處理進入輸入隊列緩存;

輸出張量從輸出隊列發(fā)出,再后處理為圖片。這樣兩者就可以不互相等待,從而優(yōu)化了整體流程速度。

此外,該方法還起到平滑數(shù)據(jù)流的作用。當輸入源故障或通信錯誤導致暫時沒法傳入新圖像時,隊列可以繼續(xù)提供之前緩存的圖像,保證模型的流暢運行。

隨機相似度過濾

該模塊的功能是顯著減少GPU算力消耗。當輸入的圖片連續(xù)相同或高度相似時,反復推理是沒有任何意義的。

所以，相似度過濾模塊計算輸入圖片與歷史參考幀的相似度。如果高于設定閾值,則以一定概率跳過后續(xù)的模型推理;

如果低于閾值,則正常進行模型推理并更新參考幀。這種概率采樣機制使得過濾策略可以平滑自然地對系統(tǒng)進行節(jié)流,降低平均GPU使用率。

在靜態(tài)輸入下過濾效果明顯,動態(tài)變化大時自動降低過濾率,系統(tǒng)可以自適應場景動態(tài)性。

這樣,復雜度動態(tài)變化的連續(xù)流輸入下也可以自動調節(jié)系統(tǒng)推理負載,節(jié)約GPU算力消耗。

實驗數(shù)據(jù)

為了測試Stream Diffusion的性能，研究人員在RTX3060、RTX4090上進行了測試。

效率方面，實現(xiàn)了超過91 FPS的生成幀率,是當前最先進的AutoPipeline的近60倍，并極大減少去噪步驟。

功耗方面，靜態(tài)輸入下,RTX3060和RTX4090的平均功率分別降低了2.39倍和1.99倍。

小編推薦下載

北斗天星旅游出行
天喵星通訊交友
東京港生活實用
東京漂移體育競技
決戰(zhàn)東京角色扮演
東京衣柜生活實用
芝麻省錢購物優(yōu)惠
東京建筑模擬經(jīng)營

相關推薦

相關文章

更多>>

8天狂收6100顆星，可商用！東京工業(yè)、麻省理工等開源Stream Diffusion 12-29

原文來源：AIGC開放社區(qū) 圖片來源：由無界AI?生成加州大學伯克利分校、東洋大學、東京工業(yè)大學、麻省理工學院和筑波大學等研究人員，聯(lián)合開源了一款創(chuàng)新性實時交互圖像生成框架——StreamDiffusion。 StreamDiffusion的技術創(chuàng)新點在于，將傳統(tǒng)的順序去噪變成流批處理去噪，消除了漫長的等待、交互生成方式，實現(xiàn)了流暢且吞吐量超高的圖像生成...

魔改 Stable Diffusion，開源創(chuàng)新“單目深度估計”模型 01-02

文章來源：AIGC開放社區(qū) 圖片來源：由無界AI生成單目深度估計一直是計算機視覺領域的難點。僅憑一張RGB圖像，想要還原出場景的三維結構，在幾何結構上非常不確定，必須依賴復雜的場景理解能力。即便使用更強大的深度學習模型來實現(xiàn)，也面臨算力需求高、圖像數(shù)據(jù)注釋量大、泛化能力弱等缺點。為了解決這些難題，蘇黎世聯(lián)邦理工學院的研究人員開發(fā)了Marigold模型...

文本生成精準圖像字幕，谷歌等開源PixelLLM 12-20

原文來源：AIGC開放社區(qū) 圖片來源：由無界AI生成傳統(tǒng)的大語言模型可以描述、回答與圖像相關的問題，甚至進行復雜的圖像推理。但使用大型語言模型進行文本定位，或用圖像指代準確坐標卻不太行。為了進行該技術的探索，谷歌和加州大學圣地亞哥分校的研究人員開發(fā)了像素對齊大語言模型——PixelLLM。 PixelLLM可以將圖像位置信息作為輸入或輸出。當將位置作為...

天諭手游怎么收徒

天諭手游怎么收徒 01-28

天諭手游怎么收徒?天諭手游最近更新上線了師徒系統(tǒng)，玩家可以在游戲里面進行收徒，很多小伙伴們還不知道怎樣收徒，下面小編就給大家?guī)砹颂熘I手游收徒方法介紹，我們一起來看看吧!天諭手游收徒方法介紹玩家可以通過師徒系統(tǒng)找到優(yōu)秀的師傅或收徒。收徒級別沒有上限，玩家可以自由選擇收徒對象。師徒系統(tǒng)介紹1)成為了“師徒關系”，師傅就可以帶徒弟練習，也可以直接叫“徒弟”來“師...

生成超清分辨率視頻，南洋理工開源Upscale-A-Video 12-25

原文來源：AIGC開放社區(qū) 圖片來源：由無界AI生成大模型在生成高質量圖像方面表現(xiàn)出色,但在生成視頻任務中，經(jīng)常會面臨視頻不連貫、圖像模糊、掉幀等問題。這主要是因為生成式抽樣過程中的隨機性,會在視頻序列中引入無法預測的幀跳動。同時現(xiàn)有方法僅考慮了局部視頻片段的時空一致性,無法保證整個長視頻的整體連貫性。為了解決這些難題，新加坡南洋理工大學的研究人員開...

收趣app怎么用

收趣app怎么用 10-13

收趣app怎么用？我們在網(wǎng)上看到一些優(yōu)質文章時會想保存下來，收趣app為您提供文章收藏功能，管理優(yōu)化你的稍后閱讀，一些新用戶下載了收趣app不知道怎么用，收趣云書簽怎么用?收趣云書簽APP怎么刪除書簽?小編和您分享一下收趣app使用教程。收趣app軟件介紹收趣app是一款簡略好用的云筆記收藏軟件。你能夠經(jīng)過收趣app將看到的各渠道的文章收藏起來，便于管理和閱...

像飛書的開源軟件

像飛書的開源軟件 09-27

像飛書的開源軟件，所謂開源就是打開軟件的源代碼。每個人都可以看到源代碼，每個人都可以一起研究源代碼并優(yōu)化和改進軟件。越來越多的IT公司向開源開放。一方面，通過出色的開源項目，無需重新發(fā)明輪子，可以直接使用;另一方面，他們自己的公司擁有出色的自我研究開發(fā)項目。為了增長，您可以選擇開源項目，以便更多開發(fā)人員可以參與并共同努力，以改善軟件的功能! 近年來...

問卷星怎么創(chuàng)建考試

問卷星怎么創(chuàng)建考試 09-18

現(xiàn)在好多朋友發(fā)布各種考試卷都是在問卷星上面進行，可以說問卷星是一個非常實用的問卷發(fā)表軟件。軟件里的問卷類型是非常多樣的大家可以盡情挑選。但是很多新用戶表示不知道問卷星怎么創(chuàng)建考試，這難到了大家。大家不用急，下面就給大家解決這個讓人頭大的問題?！静僮鞑襟E】：1、首要翻開問卷星，進入軟件之后，點擊箭頭處創(chuàng)立選項;2、進入創(chuàng)立類型挑選頁面，點擊考試選項;3、在創(chuàng)立...

資訊排行

同類軟件下載

8天在線購物優(yōu)惠
狂神刑天益智休閑
第8天旅居生活實用
天星鏈金融理財
天星金融益智休閑
天星教育學習工具
開源漫畫購物優(yōu)惠
開源小說購物優(yōu)惠
天星傳奇角色扮演
天星傳說角色扮演

熱門標簽

熱門軟件推薦

熱門游戲推薦

回頂部

好86下載 - 手機版 - 網(wǎng)站首頁 - 最新更新

好86下載為玩家提供最新手游，熱門軟件下載，最全游戲攻略，最新行業(yè)資訊，盡在好86下載！

免責說明：本站內容全部由好86下載從互聯(lián)網(wǎng)搜集編輯整理而成，版權歸原作者所有，如有侵權，請聯(lián)系我們刪除。

Copyright ? 2005 - 2021 hao86.com All rights reserved. 好86 版權所有.湘ICP備2021020172號-1