ElevenLabs 是一家專注于 AI 語音克隆和文本轉(zhuǎn)語音 API 的初創(chuàng)公司,近日宣布推出用戶可以構(gòu)建完整對話式AI智能體的新功能。

用戶現(xiàn)在可以在 ElevenLabs 的開發(fā)者平臺上,依據(jù)自己的需求,定制對話智能體的多種變量,比如語音語調(diào)和回復(fù)長度。

ElevenLabs 過去主要提供不同的語音和文本轉(zhuǎn)語音服務(wù)。公司增長主管 Sam Sklar 在接受 TechCrunch 采訪時表示,許多客戶早已在使用該平臺創(chuàng)建對話式AI智能體。但在集成知識庫和處理客戶中斷方面是最大的挑戰(zhàn)。因此,ElevenLabs 決定構(gòu)建一個完整的對話機(jī)器人管道,以便簡化這一過程。

用戶可以通過登錄 ElevenLabs 賬號,選擇模板或創(chuàng)建新項(xiàng)目來開始構(gòu)建對話智能體。他們可以選擇智能體的主要語言、首條消息和系統(tǒng)提示,以確定智能體的個性。

此外,開發(fā)者還需選擇大型語言模型(如 Gemini、GPT 或 Claude)、響應(yīng)的溫度(決定創(chuàng)意性)以及令牌使用限制。

用戶還可以根據(jù)自己的需求添加知識庫,如文件、URL 或文本塊,以增強(qiáng)對話機(jī)器人的能力。同時,他們可以將自己的自定義大型語言模型與該機(jī)器人集成。ElevenLabs 的 SDK 兼容 Python、JavaScript、React 和 Swift,此外,該公司還提供 WebSocket API,便于進(jìn)一步定制。

公司還允許用戶定義數(shù)據(jù)收集標(biāo)準(zhǔn),例如與智能體對話的客戶姓名和電子郵件,并使用自然語言定義通話的成功與否評估標(biāo)準(zhǔn)。

ElevenLabs 正在利用其現(xiàn)有的文本轉(zhuǎn)語音管道,同時也在為新對話式人工智能產(chǎn)品開發(fā)語音轉(zhuǎn)文本功能。目前,該公司并未單獨(dú)提供語音轉(zhuǎn)文本 API,但未來可能會推出,從而與谷歌、微軟和亞馬遜等公司的語音轉(zhuǎn)文本 API 競爭,以及與 OpenAI 的 Whisper、AssemblyAI、Deepgram、Speechmatics 和 Gladia 等專業(yè) API 展開競爭。

該公司計劃以超過30億美元的估值籌集新一輪資金,且正與其他語音 AI 初創(chuàng)企業(yè)如 Vapi 和 Retell 展開競爭,這些公司同樣在構(gòu)建對話智能體。更重要的是,ElevenLabs 將與 OpenAI 的實(shí)時對話 API 競爭。不過,ElevenLabs 相信其定制化能力和切換模型的靈活性,將使其在競爭中占據(jù)優(yōu)勢。

劃重點(diǎn):

?? ElevenLabs 推出了構(gòu)建對話式AI智能體的新功能,允許用戶自定義多種變量。

?? 用戶可以添加知識庫以增強(qiáng)智能體能力,并將自定義大型語言模型與之集成。

?? ElevenLabs 計劃以超過30億美元的估值籌集資金,并與 OpenAI 等競爭對手展開競爭。