Boow-VTON是阿里巴巴推出的一種先進的虛擬試衣技術(shù)。能在野外場景中實現(xiàn)高質(zhì)量的虛擬試衣效果,無需依賴精確的遮罩或修復工作。通過有效的數(shù)據(jù)增強方法,基于大規(guī)模未配對的訓練數(shù)據(jù),顯著提高模型的試穿性能。Boow-VTON只需參考布料圖像、源姿勢圖像和源人物圖像作為輸入,簡化試衣流程,更加用戶友好。Boow-VTON引入試穿定位損失,幫助模型準確識別試穿區(qū)域。Boow-VTON在保留人物特征和背景內(nèi)容的同時,處理復雜前景和姿勢,提供逼真的試衣效果,支持多件服裝試穿無需額外訓練。Boow-VTON在在線購物等領(lǐng)域具有廣泛的應(yīng)用潛力。
Boow-VTON的主要功能無遮罩試穿:用戶在不提供精確遮罩的情況下,實現(xiàn)服裝的虛擬試穿。數(shù)據(jù)增強:通過數(shù)據(jù)增強技術(shù),基于野外場景的未配對數(shù)據(jù)訓練模型,提高在復雜環(huán)境下的適應(yīng)性。試穿定位損失:引入特殊的損失函數(shù),幫助模型更準確地識別試穿區(qū)域。多服裝試穿:支持用戶同時試穿多件不同的服裝,無需對每件服裝單獨訓練模型。用戶友好:簡化試穿流程,只需提供人物圖像、服裝圖像和姿勢圖像即可進行試穿。Boow-VTON的技術(shù)原理圖像生成模型:基于強大的圖像生成模型,如擴散模型,合成逼真的試穿圖像。數(shù)據(jù)增強方法:通過合成更多樣化的背景和前景,增強模型對野外環(huán)境的適應(yīng)能力。試穿定位:通過設(shè)計的損失函數(shù),模型學習在圖像中定位服裝應(yīng)該試穿的正確區(qū)域。注意力機制:用注意力機制對齊服裝特征和人物姿勢,確保服裝在試穿時自然地貼合人體。訓練范式:提出一種新的訓練范式,通過構(gòu)建偽訓練對(如源人物圖像、服裝圖像和試穿結(jié)果圖像)訓練模型。Boow-VTON的項目地址GitHub倉庫:https://github.com/little-misfit/BooW-VTON(即將開源)arXiv技術(shù)論文:https://arxiv.org/pdf/2408.06047Boow-VTON的應(yīng)用場景在線購物:消費者在網(wǎng)上購買服裝時,通過Boow-VTON技術(shù)在模特或自己的圖片上虛擬試穿,更好地了解服裝的外觀和合身度。時尚零售:零售商提供店內(nèi)虛擬試衣間,讓顧客在不實際穿上衣服的情況下,嘗試不同的服裝款式和搭配。個性化推薦:結(jié)合用戶的身材、偏好和歷史購買數(shù)據(jù),Boow-VTON提供個性化的服裝推薦。社交媒體:用戶在社交媒體上用Boow-VTON技術(shù)分享虛擬試穿效果,增加互動性和娛樂性。時尚設(shè)計:服裝設(shè)計師預(yù)覽設(shè)計草圖的試穿效果,從而在制作實體樣品之前進行修改和優(yōu)化。廣告和營銷:品牌用Boow-VTON技術(shù)創(chuàng)建吸引人的廣告,展示模特或名人穿著品牌服裝的效果,提高吸引力。 
