近日,阿里巴巴宣布開源其最新研發(fā)的圖像生成模型 Qwen2vl-Flux,該模型不僅具備編輯、融合和混合等多種功能,還能夠在用戶輸入圖像或文本的情況下,生成具有高度相似性的全新圖像。

Qwen2vl-Flux 提供了強大的圖像變化功能。用戶只需輸入一張圖像,無需任何文本提示,模型便能根據(jù)原圖生成多幅相似的圖像。例如,用戶上傳一張人物照片,模型便可以生成多個角度下的人物表現(xiàn),展現(xiàn)出不同的視角與情感。

模型還支持文本引導(dǎo)圖像混合。當(dāng)用戶輸入一張圖片并附加相關(guān)文本提示時,Qwen2vl-Flux 能夠?qū)⑤斎雸D像與文本內(nèi)容進行巧妙融合,創(chuàng)造出新的圖像效果。

除了上述功能,Qwen2vl-Flux 還具備圖像引導(dǎo)圖像混合的能力。用戶可以將兩張不同的圖像結(jié)合在一起,實現(xiàn)角色合體或場景轉(zhuǎn)換。例如,將一個角色與另一個背景相結(jié)合,模型能夠無縫融合兩者,形成新的視覺效果。

模型的網(wǎng)格風(fēng)格遷移功能使得用戶能夠?qū)D像進行細(xì)致的控制。用戶可以對圖像的特定部分進行修改,實現(xiàn)精細(xì)化創(chuàng)作。比如,在一幅展現(xiàn)高科技與自然環(huán)境結(jié)合的圖像中,用戶可以添加生物發(fā)光技術(shù)的細(xì)節(jié),或者森林晨霧的效果,展現(xiàn)出更加豐富的視覺體驗。

項目入口:https://huggingface.co/Djrango/Qwen2vl-Flux

劃重點:

?? Qwen2vl-Flux 開源,具備強大的圖像生成和編輯能力。

??? 支持圖像變化和文本引導(dǎo)圖像混合,創(chuàng)造出全新視覺效果。

?? 提供圖像引導(dǎo)圖像混合和網(wǎng)格風(fēng)格遷移,允許用戶進行精細(xì)控制。