更多AI前沿科技資訊,請關注我們:【closerAI ComfyUI】FLUX生態進入秒出時代!最強加速器nunchaku實測:秒級出圖+顯存狂降3倍!已成為生產力工具。大家好,我是Jimmy。这期介紹一個爆炸的項目,FLUX模型我們都知道很吃顯存,單單運行它文生圖、圖生圖加上一些加速優化後我8G顯卡基本要1.5~2分鐘左右,這還是沒加LORA、fill、redux以及其它控制的情況下。如下加上控制,需要的時間就更久。雖然整理生圖質量比其它模型好,但生成時間長是它的痛點。雖然有加速的方案,像teacha、sagettention等,但離作為生產力工具,在效率上還是有些欠缺。現在,已經出現了一個新技術方向,4位擴散模型推理引擎nunchaku。最近推出0.2版本,已經將FLUX推進到秒級的輸出速度,並且生圖質量與原生模型相差無幾。
comfyUI-nunchaku介紹
nunchaku是由MIT Han Lab研發的4位擴散模型推理引擎,專為優化Stable Diffusion、Flux等生成式AI模型設計。其核心技術突破包括:SVDQuant量化技術。通過低秩分解(Singular Value Decomposition)和核融合(Kernel Fusion),將模型權重與激活值壓縮至4位,顯存佔用減少3.6倍(如16GB顯存可運行原需50GB的Flux.1-dev模型)。解決傳統4位量化圖像模糊問題,LPIPS質量指標僅0.326(接近原版0.573),肉眼無差異。多模態生態兼容,完美支持Flux模型、LoRA、ControlNet及多顯卡架構(NVIDIA Ampere/Ada/A100)。文生圖、ControlNet重繪、修復等,速度提升8.7倍。硬體級優化,針對NVIDIA CUDA架構優化,支持FP16/FP8混合精度計算,16G顯卡實現3秒生成(原版需111秒)。
comfyui節點:https://github.com/mit-han-lab/ComfyUI-nunchaku
輪子地址:https://huggingface.co/mit-han-lab/nunchaku/tree/main
4月5日發布 v0.2.0!此版本引入了多LoRA和ControlNet支持,並使用FP 16 attention和First-Block Cache增強了性能。還為FLUX.1-redux添加了20系列GPU兼容性。安裝方面1、下載節點,放置comfyUI/custom_nodes下。2、安裝輪子。上面地址,直接PIP安裝。切記要pytorch2.5以上版本,版本不夠,升級就行,但注意要提前備份python包,防止意外發生。輪子下載要跟自己版本一致的。
3、下載模型。模型放置comfyUI/models/unet下。
重啟comfyUI體驗與優化方案,它的節點包中有工作流,但如果直接使用它的工作流生圖,生圖的質量會不穩定,你會感覺還是相對差那麼一點的。同時它加载模型是需要一定時間,相對是在可接受的時間範圍內,模型加載後再抽卡或者修改參數後生圖,生圖的速度就快到飛起。
我用優化後的工作流跑了23秒出圖。它的工作流沒什麼好說的,較FLUX出圖快4倍,質量相差無幾。但因為做了加速同時是4位量化後模型,損失不大,但還是有損失。這裡主要講講我們使用它的一些優化思路心得。僅供大家參考。前面我們推文介紹了FLUX的放大修復方案:【closerAI ComfyUI】強大!放大修復新思路!效率與質量並存的神器!FLUX生圖必備的高清放大方案,必須學習起來。重點來了:利用調度器kl_optimal高清修復思路與nunchaku相結合使用。我們closerAI基於此搭建了一個FLUX nunchaku超級加速生圖工作流,如下圖示:
以上是未進行一些放大以及LORA結合的生圖,僅是基於原圖尺寸及參考其風格進行生圖。我們工作流思路如下:1、nunchaku FLUX基礎的文生圖工作流作為第一次採樣生圖。這裡使用它SVDQ-int4-flux.1-dev模型,其它參考設置如下圖:
2、接入kl_optimal二次采樣生圖。
本地算力不夠怎麼辦?如果本地設備算力不好的小夥伴,推薦使用線上comfyUI來運行體驗:runninghub.cn
runninghub.cn nunchaku FLUX工作流體驗地址:https://www.runninghub.cn/ai-detail/1910201953526448130
註冊地址:https://www.runninghub.cn/?utm_source=kol01-RH151 通過這個鏈接第一次注册送1000點,每日登錄送100點。
最後幾句:nunchaku FLUX優點,超高速生圖,解決了FLUX的生圖速度慢的痛點。同時它的生態也逐漸完善,支持了FLUX的fill、redux、controlnet、多LORA等。在一定程度上可以替代FLUX進行生圖使用,強烈推薦大家使用。作為生產力,生產底圖完全夠用。以上是closerAI團隊製作的stable diffusion comfyUI closerAI開發的FLUX nunchaku超級加速生圖工作流介紹,大家可以根據工作流思路進行嘗試搭建。當然,也可以在我們closerAI會員站上獲取對應的工作流。
我們的精彩評測

OpenAI 最新 GPT-4.1 系列模型发布:最佳 AI 图像生成器与编程性能
OpenAI 推出三款新模型 GPT-4.1 系列,性能超越前作,并在多项基准测试中表现优异。