FLUX.2 是 Black Forest Labs 推出的AI圖像模型,專為實(shí)際創(chuàng)意工作流程設(shè)計。模型支持最多 10 張圖片的多圖參考,生成高達(dá) 4MP 分辨率的高質(zhì)量圖像,具備極強(qiáng)的細(xì)節(jié)表現(xiàn)力和文本渲染能力。FLUX.2 提供多種版本,包括高性能的FLUX.2 [pro]版、可自定義參數(shù)的FLUX.2 [flex]版、開源的FLUX.2 [dev]版和即將推出的FLUX.2 [klein]版。模型結(jié)合視覺語言模型與流變換器架構(gòu),顯著提升現(xiàn)實(shí)世界知識理解和圖像生成質(zhì)量,推動視覺智能技術(shù)的開放創(chuàng)新與廣泛應(yīng)用。
FLUX.2的主要功能多圖參考:模型支持同時參考多達(dá)10張圖片,保持角色、風(fēng)格和產(chǎn)品的一致性。高分辨率圖像生成:模型支持高達(dá)4MP的圖像編輯,適合產(chǎn)品拍攝、可視化和攝影級應(yīng)用。復(fù)雜文本渲染:模型能處理復(fù)雜排版、信息圖、表情包和UI設(shè)計,支持可讀的細(xì)小文字。指令遵循能力:改進(jìn)對復(fù)雜、結(jié)構(gòu)化指令的遵循,包括多部分提示和組合約束。現(xiàn)實(shí)世界知識:在光照、空間邏輯和場景連貫性方面表現(xiàn)更強(qiáng),生成更符合現(xiàn)實(shí)的圖像。FLUX.2的技術(shù)原理潛在流匹配架構(gòu)(Latent Flow Matching Architecture):FLUX.2 采用潛在流匹配架構(gòu),通過在潛在空間中進(jìn)行流匹配,模型能高效地處理圖像的生成和編輯任務(wù),同時保持生成圖像的連貫性和一致性。這種架構(gòu)的設(shè)計使 FLUX.2 在處理復(fù)雜的圖像合成任務(wù)時表現(xiàn)出色,尤其是在多圖參考和高分辨率生成方面。視覺語言模型與流變換器的耦合:FLUX.2 結(jié)合 Mistral-3 24B 參數(shù)的視覺語言模型(VLM)和流變換器(Transformer)。視覺語言模型為模型提供豐富的現(xiàn)實(shí)世界知識和語義理解能力,使 FLUX.2 能更好地理解復(fù)雜的提示詞和場景邏輯。流變換器專注于捕捉圖像中的空間關(guān)系、材質(zhì)屬性和組合邏輯,彌補(bǔ)了傳統(tǒng)架構(gòu)的不足。這種耦合使 FLUX.2 在生成復(fù)雜場景和細(xì)節(jié)方面表現(xiàn)出色,尤其是在處理多圖參考和復(fù)雜文本渲染時。變分自編碼器(VAE)的優(yōu)化:FLUX.2 引入新的變分自編碼器(VAE),用于優(yōu)化潛在表示。VAE 在可學(xué)習(xí)性、圖像質(zhì)量和壓縮率之間提供最佳的權(quán)衡。通過重新訓(xùn)練潛在空間,F(xiàn)LUX.2 解決了“可學(xué)習(xí)性-質(zhì)量-壓縮”三難困境,實(shí)現(xiàn)更高的圖像質(zhì)量和更好的生成效率。多圖參考與風(fēng)格一致性:FLUX.2 支持同時參考多達(dá) 10 張圖片,通過先進(jìn)的多圖融合算法,確保生成圖像在風(fēng)格、角色和產(chǎn)品細(xì)節(jié)上的一致性。多圖參考能力使 FLUX.2 特別適合需要保持品牌風(fēng)格或場景連貫性的創(chuàng)意工作流程,例如廣告設(shè)計、產(chǎn)品可視化和影視后期制作。FLUX.2的項目地址項目官網(wǎng):https://bfl.ai/blog/flux-2HuggingFace模型庫:https://huggingface.co/collections/black-forest-labs/flux2如何使用FLUX.2FLUX.2 [pro]:直接通過 BFL Playground 或 BFL API 使用,適合生產(chǎn)環(huán)境,無需本地部署。FLUX.2 [flex]:通過 bfl.ai/play 或 BFL API 使用,可調(diào)節(jié)生成參數(shù),適合需要精細(xì)控制的開發(fā)者。FLUX.2 [dev]:訪問Hugging Face模型庫,下載開放權(quán)重模型,結(jié)合參考推理代碼在本地運(yùn)行,適合開發(fā)者進(jìn)行定制化開發(fā)。FLUX.2 [klein](即將推出):FLUX.2 開源版本適合開發(fā)者,參與 Beta 測試 https://docs.google.com/forms/d/e/1FAIpQLScOIvOkHN2fPbD8cFsAf7MQJfqu2bnEmoNb0x1k3ismTLLm-Q/viewform,進(jìn)行本地實(shí)驗(yàn)和創(chuàng)新。FLUX.2 VAE:用于潛在表示的新型變分自編碼器,作為基礎(chǔ)組件,支持其他 FLUX.2 模型,Hugging Face模型庫即可使用。FLUX.2的應(yīng)用場景廣告制作:FLUX.2 能快速生成高質(zhì)量的產(chǎn)品廣告圖像,支持多圖參考以保持品牌風(fēng)格一致性,同時能根據(jù)復(fù)雜的提示詞生成創(chuàng)意廣告內(nèi)容。UI/UX 設(shè)計:,模型支持復(fù)雜排版和文本渲染,能生成用戶界面原型和設(shè)計稿,幫助設(shè)計師快速實(shí)現(xiàn)創(chuàng)意構(gòu)思。品牌宣傳:通過高分辨率圖像生成和編輯,為品牌創(chuàng)建視覺內(nèi)容,確保品牌形象在不同媒介上的一致性。影視特效:用于生成逼真的場景、道具和角色,支持多圖參考以保持視覺風(fēng)格的連貫性,減少特效制作的時間和成本。動畫制作:通過生成高質(zhì)量的動畫幀和背景,加速動畫制作流程,同時保持動畫風(fēng)格的一致性。 
