libcom 是一個由上海交通大學 (BCMI) 實驗室推出的圖像合成工具箱。旨在解決前景和背景之間的不一致性問題,如外觀、幾何和語義上的不匹配,生成逼真的合成圖像。工具箱包含多種圖像合成相關的任務,例如圖像融合、圖像和諧化、陰影生成、對象放置、生成式合成以及質量評估等。libcom 提供一系列高效的算法實現,算法會不斷更新。目標是基于簡單的導入命令 import libcom 解決與圖像合成相關的問題,用戶能輕松地進行復雜的圖像合成操作。
libcom的主要功能圖像融合:生成合成圖像時,基于圖像融合技術平滑前景與背景之間的過渡,減少可見的接縫和不自然的邊界。圖像和諧化(Image Harmonization):調整前景的光照和顏色,與背景的光照和顏色匹配,提高合成圖像的真實感。陰影生成(Shadow Generation):為前景對象添加合適的陰影,增強前景與背景之間的相互作用和立體感。對象放置(Object Placement):確定前景對象在背景中的合理位置和大小,考慮遮擋、深度和場景的語義一致性。生成式合成(Generative Composition):基于生成模型直接從前景和背景圖像生成逼真的合成圖像,考慮前景的幾何和語義信息。libcom的技術原理傳統圖像處理:基于如 Poisson 編輯和拉普拉斯金字塔等技術平滑圖像邊界。深度學習:結余卷積神經網絡(CNN)學習圖像特征,進行像素級的顏色和光照調整。生成對抗網絡(GANs):在生成式合成中,用 GANs 生成與背景和諧且具有正確光照和陰影的前景。擴散模型:基于擴散模型在給定噪聲和少量前景信息的情況下生成高質量的合成圖像。數據集和預訓練模型:在多個公開數據集上訓練模型,確保算法在多樣化的場景中有效工作。特征提取與匹配:基于特征提取技術,如 BargainNet,評估合成圖像中前景與背景之間的和諧度。libcom的項目地址項目官網:https://pypi.org/project/libcom/GitHub倉庫:https://github.com/bcmi/libcomarXiv技術論文:https://arxiv.org/pdf/2106.14490在線體驗Demo:https://bcmi.sjtu.edu.cn/home/niuli/demo_image_composition/libcom的應用場景增強現實(AR):在增強現實應用中,圖像合成技術將虛擬對象無縫地融入到真實世界的場景中,為用戶提供更加沉浸式的體驗。藝術創作:藝術家和設計師用圖像合成技術將不同的視覺元素組合在一起,創造出全新的藝術作品或設計概念圖。電子商務:在線零售商展示產品在不同環境中的效果,例如將家具模型放置在家中的實景照片中,幫助顧客進行虛擬試裝。電影和視頻制作:在電影后期制作中,圖像合成技術創建復雜的場景,或者將演員放置于不可能實際拍攝的背景中。游戲開發:游戲設計師用圖像合成技術創建游戲環境,或者將游戲角色融入到真實世界的場景中,增加游戲的趣味性和真實感。 
