美團(tuán)LongCat Interaction團(tuán)隊(duì)發(fā)布WOWService大模型交互系統(tǒng)白皮書,披露已在美團(tuán)智能客服全量上線的技術(shù)細(xì)節(jié):通過“數(shù)據(jù)+知識(shí)雙驅(qū)動(dòng)”與四階段訓(xùn)練體系,復(fù)雜業(yè)務(wù)場景下客服解決率提升9%,用戶滿意度提升12%,訓(xùn)練標(biāo)注量僅為傳統(tǒng)方案的10%。

核心框架

1. 數(shù)據(jù)知識(shí)雙驅(qū)動(dòng):結(jié)構(gòu)化業(yè)務(wù)規(guī)則+真實(shí)對(duì)話日志聯(lián)合訓(xùn)練,模型在SKU、促銷、售后等知識(shí)點(diǎn)準(zhǔn)確率96%

2. 多智能體協(xié)同:主Agent負(fù)責(zé)任務(wù)分發(fā),子Agent專精退款、改地址、發(fā)票等場景,平均響應(yīng)時(shí)長下降27%

3. 自我優(yōu)化閉環(huán):每日抽取線上高評(píng)分對(duì)話,自動(dòng)標(biāo)注后回流訓(xùn)練,實(shí)現(xiàn)“7天一小迭代”

四階段訓(xùn)練流程

- 持續(xù)預(yù)訓(xùn)練:500億token領(lǐng)域語料,讓基座模型熟悉本地生活術(shù)語

- 有監(jiān)督微調(diào):10%標(biāo)注數(shù)據(jù)→達(dá)到傳統(tǒng)100%標(biāo)注效果,成本節(jié)省75%

- 直接偏好優(yōu)化(DPO):用正負(fù)樣本對(duì)校準(zhǔn)“禮貌+高效”風(fēng)格

- 強(qiáng)化學(xué)習(xí)(RL):線上實(shí)時(shí)獎(jiǎng)勵(lì)=解決率+用戶評(píng)分,模型自動(dòng)對(duì)齊商業(yè)目標(biāo)

業(yè)務(wù)成效

白皮書顯示,WOWService已在美團(tuán)外賣、到店、酒店、出行等六大業(yè)務(wù)線落地,大促高峰承壓>8,000QPS,整體客服人力節(jié)省18%,復(fù)雜場景一次性解決率達(dá)84%,顯著優(yōu)于原有基座模型。

開源與后續(xù)

團(tuán)隊(duì)計(jì)劃2026Q1開源輕量版本W(wǎng)OWService-Lite(<7B參數(shù))與多智能體框架,供社區(qū)二次開發(fā);同時(shí)聯(lián)合中國計(jì)算機(jī)學(xué)會(huì)發(fā)布“本地生活大模型Benchmark”,推動(dòng)行業(yè)標(biāo)準(zhǔn)化。