快手旗下Kling AI于Omni生態(tài)周首日發(fā)布2.6版本,首次內(nèi)置音頻生成,支持中英雙語(yǔ)對(duì)白、歌唱與音效同步輸出,實(shí)現(xiàn)“文本?視頻?音頻”一鍵閉環(huán)。官方口號(hào)“See the Sound, Hear the Visual”直指其多模態(tài)同步定位。

技術(shù)規(guī)格方面,2.6保持10秒1080P高清輸出,每5秒僅需25積分(較前版降30%)。擴(kuò)散變換器+3D時(shí)空聯(lián)合注意力架構(gòu)帶來(lái)三項(xiàng)提升:復(fù)雜指令遵守率提高15%、跨鏡頭角色一致性達(dá)SOTA、對(duì)標(biāo)Seedance1.0盲測(cè)勝率285%。

市場(chǎng)層面,Kling2.6將率先在Artlist等專(zhuān)業(yè)平臺(tái)上線,提供場(chǎng)景擴(kuò)展與多元素編輯API,面向影視、短劇、廣告及MV制作。快手表示,2026Q1將推出4K/60fps版本,并開(kāi)放自定義聲線庫(kù),繼續(xù)降低“AI制片”門(mén)檻。

行業(yè)觀察認(rèn)為,音頻同步補(bǔ)齊了AI視頻最后一塊短板,后期剪輯流程有望縮短50%以上。隨著Kling2.6落地,AI創(chuàng)作工具競(jìng)爭(zhēng)從“畫(huà)面”延伸至“聲音”,有聲短視頻或迎來(lái)新一輪供給爆發(fā)。