近日,aiOla 宣布推出一款開源的 AI 音頻轉(zhuǎn)錄模型Whisper-NER,該模型在轉(zhuǎn)錄過(guò)程中能夠?qū)崟r(shí)遮蔽敏感信息。
aiOla 的新 Whisper-NER 構(gòu)建在 OpenAI 的行業(yè)標(biāo)準(zhǔn)開源模型 Whisper 之上,本身是完全開源的,現(xiàn)在可以在 Hugging Face 和 Github 上獲得,供企業(yè)、組織和個(gè)人使用、使用、適應(yīng)、修改和部署。
該音頻轉(zhuǎn)錄模型具備靈活的配置選項(xiàng),用戶可以根據(jù)需求選擇是否對(duì)敏感信息進(jìn)行遮蔽。當(dāng)用戶選擇遮蔽功能時(shí),模型會(huì)自動(dòng)識(shí)別并隱藏如個(gè)人姓名、地址、電話號(hào)碼等敏感信息,有效防止在轉(zhuǎn)錄文本中泄露隱私。這種能力使得該模型在法律、醫(yī)療、教育等領(lǐng)域的應(yīng)用場(chǎng)景中顯得尤為重要。
除了保護(hù)敏感信息,該模型還具備高效準(zhǔn)確的轉(zhuǎn)錄能力,能夠在多種語(yǔ)言和口音下正常工作。這使得它在多語(yǔ)言環(huán)境中的應(yīng)用變得更加廣泛。例如,企業(yè)在處理客戶反饋時(shí),能夠準(zhǔn)確記錄并分析來(lái)自不同地區(qū)的音頻信息,進(jìn)而改善服務(wù)質(zhì)量。
此外,aiOla 還鼓勵(lì)開發(fā)者和研究人員使用這一開源模型,進(jìn)一步提升其功能。用戶可以在開源平臺(tái)上獲取源代碼,并根據(jù)自身需求進(jìn)行修改和優(yōu)化。這一做法不僅提升了模型的可用性,也促進(jìn)了 AI 技術(shù)的創(chuàng)新和發(fā)展。
aiOla 的這一新產(chǎn)品展示了在音頻轉(zhuǎn)錄領(lǐng)域?qū)﹄[私保護(hù)的重視,也為未來(lái)的 AI 應(yīng)用開辟了更多可能性。隨著更多用戶和開發(fā)者的加入,期待這一開源模型能帶來(lái)更廣泛的應(yīng)用場(chǎng)景和影響力。
Whisper-NER 是完全開源的,可在 MIT 許可證下使用,允許用戶自由采用、修改和部署它,包括用于商業(yè)應(yīng)用程序。現(xiàn)在用戶還可以在 Hugging Face 上試用演示模型,允許他們錄制語(yǔ)音片段,并讓模型在生成的鍵入腳本中掩蓋他們鍵入的特定單詞。
huggingface:https://huggingface.co/aiola/whisper-ner-v1
github:https://github.com/aiola-lab/whisper-ner
劃重點(diǎn):
?? aiOla 推出的音頻轉(zhuǎn)錄模型可以實(shí)時(shí)遮蔽敏感信息,保護(hù)用戶隱私。
?? 模型支持多種語(yǔ)言和口音,適用于法律、醫(yī)療和教育等多個(gè)領(lǐng)域。
?? 開源特性允許用戶自定義和優(yōu)化模型,促進(jìn) AI 技術(shù)的創(chuàng)新。

