人工智能初創(chuàng)公司 ElevenLabs 于周三推出了一項(xiàng)新功能,名為 GenFM,該功能允許用戶上傳不同類型的內(nèi)容以生成多聲道播客,類似于谷歌的 NotebookLM。

這項(xiàng)功能已在 ElevenLabs Reader 的 iOS 應(yīng)用中上線,支持32種語(yǔ)言,包括英語(yǔ)、印地語(yǔ)、葡萄牙語(yǔ)、中文、西班牙語(yǔ)、法語(yǔ)、德語(yǔ)和日語(yǔ)等。

使用 GenFM 時(shí),用戶可以首先上傳 YouTube 視頻、文本或文檔,應(yīng)用程序會(huì)自動(dòng)選擇兩個(gè)聲音來(lái)創(chuàng)建播客。

ElevenLabs 提供了十多種聲音供用戶選擇。應(yīng)用程序在準(zhǔn)備 AI 生成的播客時(shí),用戶可能會(huì)看到一些有趣的提示,比如 “添加一些停頓” 和 “插入一些填充詞”。在當(dāng)前許多工具幫助人們?nèi)コ?“嗯” 和 “啊” 的背景下,ElevenLabs 卻選擇為其 AI 生成的播客添加一些人性化的元素。

ElevenLabs 的移動(dòng)增長(zhǎng)負(fù)責(zé)人 Jack McDermott 在接受 采訪時(shí)表示:“我們討論了在多大程度上引入‘嗯’、‘啊’、‘嗯哼’、笑聲和呼吸等類似人類對(duì)話的填充詞或覆蓋聲音。我們的目標(biāo)是在自然人類對(duì)話和內(nèi)容實(shí)用性之間找到適當(dāng)?shù)钠胶狻!?/p>

他還指出,優(yōu)秀的長(zhǎng)格式播客中往往干擾較少,更自然、更深入的對(duì)話流是他們追求的體驗(yàn),旨在使音頻敘事在不同聲音和語(yǔ)言中更易于訪問(wèn)。

未來(lái),ElevenLabs 計(jì)劃支持更多的自定義選項(xiàng),并允許用戶添加多個(gè)來(lái)源來(lái)創(chuàng)建生成式 AI 播客。9月份,谷歌推出了 NotebookLM 的 AI 生成對(duì)話功能,并在一個(gè)月后新增了用戶自定義播客輸出的能力。

本月初,ElevenLabs 還宣布將投資1100萬(wàn)美元到波蘭初創(chuàng)企業(yè)生態(tài)系統(tǒng),并在華沙開(kāi)設(shè)研發(fā)中心,以吸引當(dāng)?shù)?AI 人才。同時(shí),該公司正在擴(kuò)展到印度,已招聘了一名業(yè)務(wù)負(fù)責(zé)人并正在組建團(tuán)隊(duì)。此外,ElevenLabs 還為客戶推出了對(duì)話 AI 代理。

劃重點(diǎn):

?? ElevenLabs 推出 GenFM 功能,支持用戶上傳視頻或文本生成多聲道播客。

??? 該功能自動(dòng)選擇兩種聲音,并添加人性化的填充詞以增強(qiáng)自然對(duì)話體驗(yàn)。

?? ElevenLabs 計(jì)劃未來(lái)支持更多自定義選項(xiàng),并在波蘭和印度擴(kuò)展業(yè)務(wù)。