前几天工作中遇到需要把音频转为文字稿的任务,顺便学了个新词语:扒词。
扒词:根据视频信息获得文字信息,即根据录音或者台词,然后转字幕。
拿音频找导演联系扒词,结果导演居然说视频扒词可以,音频就算了吧,算了吧……!
……天下没有免费的午餐。
感谢万能的知乎!让我找到了IBM 爸爸的Speech to text!
第一步
点击首页紫色的那个「Star for free in IBM Cloud」按钮,注册IBM Cloud并登陆(注册不了的亲,记得科♂学上网)。
第二步
添加服务(因为我已经加了服务,没法给大家截图了,自己找找吧),添加后是这样的:
点击现有服务,找到已有的服务。
点击服务名称查看详情。
出现下面这行字说明装好了。
第四步
打开Jupyter Notebook开始写代码啦!
import speech_recognition as sr #加载包
r = sr.Recognizer() with sr.WavFile("E://1.mp3") as source: #请把引号内改成你自己的音频文件路径
audio = r.record(source)
运行这一步发现报错了。
原来要wav格式。推荐一个好用的神器:格式工厂。音频视频文件转格式我都用它,方便小巧。
嗯……虽然准确率没有100%,但也已经比较可观了!!
它支持多种语言,只需要把language变量改成以下这些就可以实现不同语言的转换:
- ar-AR 阿根廷语
- en-UK 英式英语
- en-US 美式英语
- es-ES 西班牙语
- fr-FR 法语
- ja-JP 日语
- pt-BR 巴西葡萄牙语
- zh-CN 中文
每个免费账户每个月可使用100分钟,30天不活跃服务将删除。
终于不用花冤枉钱了!进群:125240963 即可获取数十套PDF哦!私信小编需要源码即可获取源码!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。