近日,Play AI 正式推出其最具雄心的產(chǎn)品 ——PlayDialog beta版本,能生成對(duì)話式的播客音頻。

這款端到端的 AI 語音模型,利用對(duì)話的歷史上下文,能夠調(diào)控語調(diào)、情感和語速,以實(shí)現(xiàn)更自然的語音合成,標(biāo)志著人機(jī)對(duì)話的新高度。PlayDialog 特別適合于制作真實(shí)的對(duì)話體驗(yàn),例如旁白、語音配音、合成播客等,也能在商業(yè)環(huán)境中提供沉浸式的一對(duì)一語音交流體驗(yàn),效果類似谷歌的NotebookLM

與此同時(shí),Play AI 還推出了 PlayNote,這是一款可以將多種媒體文件(如 PDF、文本、視頻等)轉(zhuǎn)化為對(duì)話體驗(yàn)的工具。用戶可以在幾分鐘內(nèi)生成播客、簡(jiǎn)報(bào)、旁白,甚至是兒童故事,并享受到 PlayDialog 所帶來的流暢、自然的語音效果。PlayNote 的獨(dú)特之處在于,它也提供 API 接口,使得用戶可以不依賴用戶界面,輕松實(shí)現(xiàn)音頻內(nèi)容的程序化生成。

PlayDialog beta 經(jīng)過數(shù)億次真實(shí)對(duì)話的訓(xùn)練,模型規(guī)模約為 Play AI3.0mini 的十倍,能夠在語調(diào)(如語音的抑揚(yáng)頓挫、語速)上與人類的語音表現(xiàn)相匹配。在盲測(cè)中,PlayDialog beta 的表現(xiàn)比市場(chǎng)上領(lǐng)先的競(jìng)爭(zhēng)模型高出兩倍,特別是在表達(dá)力方面得分最高。

不同于以往的語音模型,PlayDialog beta 可以理解整段對(duì)話的上下文,進(jìn)而影響語音生成的效果。Play AI構(gòu)建了一種被稱為 “自適應(yīng)語音上下文化器”(ASC)的新架構(gòu),使得模型能夠利用完整的對(duì)話歷史進(jìn)行回應(yīng),從而讓每一句話都不是孤立的輸出,而是豐富的具備合適的語調(diào)、情感和語氣,使得合成的播客仿佛讓聽眾感受到演講者在同一空間內(nèi)進(jìn)行交流。

無論是充滿活力的討論,還是需要同理心的敏感話題,PlayDialog 都能無縫適應(yīng),讓互動(dòng)顯得更加自然和人性化。

用戶可以通過 PlayNote 體驗(yàn)這一切,使用它制作強(qiáng)有力、自然的旁白、播客、簡(jiǎn)報(bào)等,只需幾分鐘就能完成。PlayNote 也可以通過 API 接口使用,允許開發(fā)者以大規(guī)模程序化方式生成引人入勝的內(nèi)容。

提亞入口:https://play.ai/playnote

官方博客介紹:https://blog.play.ai/blog/introducing-playdialog

劃重點(diǎn):

?? PlayDialog beta 是 Play AI 推出的新一代語音模型,能夠更自然地模擬人類對(duì)話。

?? PlayNote 工具使用戶能夠快速將各種媒體文件轉(zhuǎn)化為有聲內(nèi)容,并支持 API 接口。

?? PlayDialog beta 在盲測(cè)中表現(xiàn)出色,語音生成的流暢性和情感表達(dá)均獲得高分。