近日,aiOla 宣布推出一款开源的 AI 音频转录模型Whisper-NER ,该模型在转录过程中能够实时遮蔽敏感信息。

aiOla 的新 Whisper-NER 构建在 OpenAI 的行业标准开源模型 Whisper 之上,本身是完全开源的,现在可以在 Hugging Face 和 Github 上获得,供企业、组织和个人使用、使用、适应、修改和部署。

image

该音频转录模型具备灵活的配置选项,用户可以根据需求选择是否对敏感信息进行遮蔽。当用户选择遮蔽功能时,模型会自动识别并隐藏如个人姓名、地址、电话号码等敏感信息,有效防止在转录文本中泄露隐私。这种能力使得该模型在法律、医疗、教育等领域的应用场景中显得尤为重要。

除了保护敏感信息,该模型还具备高效准确的转录能力,能够在多种语言和口音下正常工作。这使得它在多语言环境中的应用变得更加广泛。例如,企业在处理客户反馈时,能够准确记录并分析来自不同地区的音频信息,进而改善服务质量。

此外,aiOla 还鼓励开发者和研究人员使用这一开源模型,进一步提升其功能。用户可以在开源平台上获取源代码,并根据自身需求进行修改和优化。这一做法不仅提升了模型的可用性,也促进了 AI 技术的创新和发展。

aiOla 的这一新产品展示了在音频转录领域对隐私保护的重视,也为未来的 AI 应用开辟了更多可能性。随着更多用户和开发者的加入,期待这一开源模型能带来更广泛的应用场景和影响力。

Whisper-NER 是完全开源的,可在 MIT 许可证下使用,允许用户自由采用、修改和部署它,包括用于商业应用程序。现在用户还可以在 Hugging Face 上试用演示模型,允许他们录制语音片段,并让模型在生成的键入脚本中掩盖他们键入的特定单词。

huggingface:https://huggingface.co/aiola/whisper-ner-v1

github:https://github.com/aiola-lab/whisper-ner

划重点:

📌 aiOla 推出的音频转录模型可以实时遮蔽敏感信息,保护用户隐私。

🔍 模型支持多种语言和口音,适用于法律、医疗和教育等多个领域。

💻 开源特性允许用户自定义和优化模型,促进 AI 技术的创新。