亞馬遜在 re:Invent2025推出第二代自研大模型家族 Nova2,含四款新品:輕量級(jí)多模態(tài)模型 Lite、復(fù)雜推理代理 Pro、語音對(duì)話 Sonic 與75萬字上下文 Omni;公司同時(shí)宣布與谷歌云達(dá)成互聯(lián)協(xié)議,方便客戶跨平臺(tái)調(diào)用 Gemini 等競對(duì)模型。
Nova2系列主打“行業(yè)領(lǐng)先性價(jià)比”,官方定價(jià)顯示,Lite 每百萬 token 輸入0.045美元、輸出0.09美元,約為同類模型50% 水平。AWS 首席執(zhí)行官 Matt Garman 表示,新增多模態(tài)、代碼生成與代理任務(wù)優(yōu)化,目標(biāo)在“成本而非參數(shù)”上取勝。
真正引發(fā)開發(fā)者關(guān)注的是同步發(fā)布的“Nova Forge”服務(wù):年費(fèi)10萬美元,客戶即可介入預(yù)訓(xùn)練、中期訓(xùn)練或后期訓(xùn)練階段,注入私有數(shù)據(jù)構(gòu)建專屬前沿模型。Garman 解釋,過早微調(diào)易削弱模型推理能力,“Forge 讓客戶像學(xué)語言一樣‘從小’開始定制”。
AWS 披露,內(nèi)部電商與 Alexa 團(tuán)隊(duì)已用 Forge 構(gòu)建業(yè)務(wù)大模型;外部客戶 Reddit 則通過該服務(wù)訓(xùn)練內(nèi)容審核模型,官方稱其在內(nèi)部評(píng)測中優(yōu)于市面可商用大模型。若需亞馬遜工程師全程協(xié)助,需額外支付咨詢費(fèi)用。
亞馬遜通用人工智能首席科學(xué)家 Rohit Prasad 稱,F(xiàn)orge 可將企業(yè)自建模型成本從“數(shù)億至數(shù)十億美元”降至百萬美元量級(jí),“相當(dāng)于用1% 預(yù)算獲得90% 性能”。該服務(wù)預(yù)計(jì)2026年一季度在北美、歐洲部分區(qū)域開放預(yù)覽。

