大家好,超子能力有限,技术不高,有什么错误的地方,欢迎板砖。超子今天给大家介绍一下,如何使用腾讯云的录音文件识别功能,将mp3,wav等音频文件转成文字,我们需要4步走。
1.开通腾讯云录音文件识别功能,每月累计30小时的免费额度。
2.开通对象存储 COS 服务,开通后6个月免费。
3.音频文件上传到对象存储服务上,识别的时候,腾讯云会从对象存储获取音频文件。
4.使用腾讯云API调试助手,调用服务器接口,完成识别请求。
先看第1步,我们登录腾讯云官网,首页产品类目下,选择人工智能大类目下的语音技术,语音识别服务,音频录音文件识别就是这个服务下的功能。
接着进行第2步,还是官网首页产品下选择热门,然后选择对象存储。
我们开通服务,然后立即使用,首次开通后,6个月免费。
然后是第3步,我们进入对象存储服务管理后台,左侧导航栏选择存储桶列表,我们要创建存储桶。
存储桶名称我们自己起一个就行,要注意的地方就是红圈中所示的访问权限,选择公有读写。然后点击确定,创建存储桶。
创建好后,我们进入存储桶,上传我们的音频文件。
然后我们进行第4步,语音服务的主页,点击入门,我们要找到API调试小助手。
在新打开的页面,往下拉找到红圈中所示的录音文件识别API文档。
然后页面下拉,找到红圈中的API 3.0 Explorer,这个就是API在线调试小助手。
进入小助手后,先点击查看秘钥,把SecretId和SecretKey填写进来。
新打开的页面,我们可以看到SecretId和SecretKey,把它们复制过来就行。
然后我们需要设置5个参数,我们着重看第5个,这个url是从哪来的呢,就是第3步,对象存储服务中,我们建立了存储桶,然后上传了音频文件,这个url就是音频文件的位置,我们一起找一下。
我们来到存储桶中,文件上传完毕了,我们点击音频文件后面的详情。
点击详情后,会打开文件的基本信息,红圈中所示的内容,就是url。
然后我们选择在线调试,然后选择发送请求,接着腾讯云会返回一个ID,这个ID就是我们查询识别结果用的,这里补充一点,就是单次识别,音频文件的长度不能超过一个小时,如果超过了,就要截断,分两个识别。
然后我们看最左侧的红圈,我们选择录音文件识别结果查询,然后输入上一步获取的ID,然后发送请求,音频文件越大,识别越慢,如果查询没结果,就要等一会,如果成功后,就会显示识别后的文字,总体上看,识别效果还是不错的,当然这和每个人的发音有关,发音越清晰识别准确度越高。
本文发布于:2023-02-28 21:03:00,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/167772054797731.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:qq云语音(腾讯云语音聊天).doc
本文 PDF 下载地址:qq云语音(腾讯云语音聊天).pdf
留言与评论(共有 0 条评论) |