9
㊀文献引用格式:王家齐ꎬ郝文泽.基于语音识别技术的智慧讲台设计[J].电声技术ꎬ2019ꎬ43(5):9-11.
WANGJQꎬHAOWZ.Smartpodiumdesignbasedonspeechrecognitiontechnology[J].AudioEngineeringꎬ2019ꎬ
43(5):9-11.头皮止痒妙招
中图分类号:TN912.34㊀㊀㊀㊀文献标志码:A㊀㊀㊀㊀DOI:10.16311/j.audioe.2019.05.003
基于语音识别技术的智慧讲台设计
王家齐ꎬ郝文泽
(北京中电慧视科技有限公司ꎬ北京㊀100010)
我所看到的都是你
摘要:随着 人工智能+ 及智能化技术的普及ꎬ终将形成新一代的会议演讲模式ꎬ即 人工智能+演讲 模式ꎬ笔者就是利用基于语音识别技术实现会议演讲的信息化和自动化ꎮ针对传统会议讲台智能化和个性化程度不高的问题ꎬ本文提出设计一种基于语音识别技术的智慧讲台ꎬ它是由LCD显示屏来展示不同形式的信息内容ꎬ通过语音指令来控制讲台提词系统的运行ꎬ有效地提高了讲台提词控制的智能化和个性化水平ꎮ文中从智慧讲台硬件的设计㊁软件设计及语音识别提词系统设计3个方面阐述了智慧讲台的设计过程ꎮ关键词:智慧讲台ꎬ语音识别ꎬ提词系统ꎬLCD
Smartpodiumdesignbasedonspeechrecognitiontechnology
WANGJiaqiꎬHAOWenze
领导干部廉洁自律
(BeijingZhongdianIntelligentVisionTechnologyCo.ꎬLtd.ꎬBeijing100010ꎬChina)
Abstract:Withthepopularizationof"artificialintelligence+"andintelligenttechnologyꎬanewgenerationofconferencespeechmodewillbeformedꎬnamelythe"artificialintelligence+speech"mode.Thea
uthoristousethespeechrecogni ̄tiontechnologytorealizetheinformatizationandautomationofconferencespeech.InviewoftheproblemoftheintelligentandpersonalizeddegreeofthetraditionalconferenceplatformꎬthispaperproposestodesignasmartplatformbasedonspeechrecognitiontechnologyꎬwhichistodisplaydifferentformsofinformationcontentbyLCDdisplayꎬandcontrolthespeechbythevoicecommand.Theoperationofthesystemeffectivelyimprovesthelevelofintelligenceandpersonalization
oftheplatformcontrol.Thispaperexpoundsthedesignprocessofthewisdomplatformfromthreeaspects:thedesignofthewisdomplatformhardwareꎬthesoftwaredesignandthespeechrecognitionsystem.Keywords:smartplatformꎻspeechrecognitionꎻwordingsystemꎻLCD
㊀㊀随着信息技术的发展ꎬ人工智能技术在日常生活中的应用也越来越广泛ꎬ大到家用电器㊁小到儿童玩具ꎬ随处可见人工智能的影子ꎻ近年来ꎬ随着科技的飞速发展ꎬ语音识别技术也逐步从实验室走向市场[1]ꎮ语音识别技术就是将人类语音内容转换成可读的计算机文本或命令ꎬ通过与机器的 语音交流 ꎬ让其明白且去执行人的意图ꎮ它使人类解放了双手ꎬ摆脱了键盘或遥控器的束缚ꎬ这一独有的优势势必会使语音控制技术迎来更广阔的应用前景[2]ꎮ传统的木质或金属讲台越来越无法适应智慧化会议和高端场所演讲的应用需求[3]ꎬ基于语音识别技术的智慧讲台应运而生ꎮ
1㊀硬件方案设计
1.1㊀硬件电路设计
主电路板是一款基于Rockchip主芯片RK3288的多媒体网络播放-液晶驱动一体板ꎮ设计主板可以同时支持LVDS/EDP/MIPI点屏+HDMI双屏异显ꎻLVDS+EDP双屏异显或LVDS+MIPI双屏异显或EDP+MIPI双屏异显等多种双屏异显模式选择ꎮ可驱动7-100寸液晶显示屏ꎬ最大可支持4K全高清视频解码和3840ˑ2160(forVOP_BIG)ꎬ
2560ˑ1600(forVOP_LIT)的TFT液晶屏ꎬ主板包含2路RS232㊁2路UART㊁4路USBHOST㊁1路以太网等接口ꎬ具有强大的通讯功能ꎮ
本设计目前通过此液晶驱动一体板同时驱动
10㊀
三块LCD显示屏ꎬ结合安卓系统软件ꎬ可实现在上部条屏显示会议主题或演讲者个人信息ꎬ下部标屏显示会议内容㊁公司LOGO或视频信息ꎬ背部条屏搭载智能提词系统ꎬ可实时显示演讲者的演讲稿内容ꎮ
1.2㊀结构设计
智慧讲台包括以下几个主要部分:如图1所示ꎬ支撑架构-1ꎻ前脸-2ꎻ操作台面-3ꎮ其中
23.8吋液晶显示屏-4嵌于支撑架构-1前ꎻ提词器-6(28吋条形液晶显示屏)嵌于操作台面-3上ꎬ28吋条形液晶显示屏-5嵌于前脸-2上ꎬ硬件板卡安装在支撑机构内部
ꎮ
图1㊀智慧讲台结构示意图顺理成章
1.3㊀显示屏设计
智慧讲台共涉及3块LCD显示屏ꎬ包括28吋条形屏两块㊁23.8吋标准屏一块ꎮ其中所述28吋条形屏是由标准尺寸模组进行切割后得到ꎬ如图2所示ꎮLCD模组包括显示区㊁设置于显示区上方的PCB板以及设置于显示区与PCB板之间的COF(覆晶薄膜)ꎬ显示区包括设置于最前面的保护膜以及保护膜后面的偏光片ꎬ其特征在于:将显示区中完好的靠近COF的部分定义为保留区ꎬ其他不良区域定义为不良区[4]ꎮ先固定COFꎬ再去除不良区的保护膜与偏光片ꎬ然后切割显示区的不良区ꎬ再对切割后剩下的显示区下端进行封胶ꎬ最后对封胶后的产品进行分辨率的调整ꎬ如此ꎬ经过处理后的产品可以作为一个全新的小尺寸条形屏使用ꎬ从而达到新颖的显示效果ꎬ得到更加广泛的应用
ꎮ
图2㊀LCD条形屏样式
2㊀软件功能设计
智慧讲台控制软件包括对前端两块显示屏内容的信息发布及提词系统的内容展示ꎮ用户可通过软件顶部的显示屏状态来判断设备是否在线ꎮ用户可根据实际需求对两块显示屏内容进行个性化设置ꎬ包括显示图片㊁视频㊁文字的字体颜色大小ꎬ以及各素材切换的间隔时间ꎮ同时软件还支持信息发布前的预览功能ꎬ确保信息准确无误地传递给现场观众ꎬ大大提升了产品的智能化及个性化ꎬ能够使产品适用于各种不同演讲流程ꎬ操作界面如图3所示
ꎮ
图3㊀智慧讲台控制系统软件操作界面
智能提词系统软件通过讲台桌面的USB接口ꎬ通过自动读取优盘里的文档内容ꎬ用于演讲者脱稿演讲ꎮ讲稿内容的操作包括手动和自动两种模式ꎮ手动模式即演讲者通过操作鼠标来对讲稿进行点击翻页ꎻ自动模式又细化为两种ꎬ其一是设置自动滚屏ꎬ根据演讲者个人喜好及读稿速度进行个性化设置ꎬ其二是通过语音识别技术与提词系统联动ꎬ做到演讲稿不读不走ꎬ已读标注ꎬ严格与演讲人演讲进程同步ꎮ智能提词系统软件界面如图4所示
ꎮ
图4㊀智能提词系统软件界面
王者荣耀有挂吗3㊀语音识别系统设计
语音识别程序的主要功能是识别控制提词系
统文档进度的语音指令ꎮ语音识别技术分为在线语音识别技术和离线语音识别技术ꎮ考虑到智慧
11㊀
简单运动讲台的使用环境及成本ꎬ这里采用离线语音识别技术[5]ꎮ
在传统的会议演讲条件下ꎬ演讲者需要自带纸
质稿件或使用前文所描述方式进行自动翻页ꎬ但这种方式均无法实现自动识别演讲人实时演讲进度ꎮ当前人工智能和语音识别技术的不断发展和应用普及ꎬ针对连续语音的识别应用技术已经成熟ꎮ如何更充
分地将智能视音频技术与会议演讲需求相结合成为了应用重点ꎬ语音自动识别技术则成为了 人工智能+演讲 的突破口ꎮ语音识别系统分为平台能力服务㊁业务软件应
用㊁语音中间控制三层ꎮ
平台能力服务层提供系统所需的智能语音识别系统服务端程序㊁WEB服务器㊁语音能力平台服务引擎(语音识别平台)㊁数据库管理㊁系统资源管理等相关服务功能ꎬ在完成基础功能的前提下ꎬ可以根据系统运行实际情况对应用能力进行优化ꎬ提升应用水平ꎮ木兰船
业务软件应用层提供演讲者使用的智能语音识别系统信息显示功能ꎬ提供实时转写语音对应的文本展现及各种基础文档信息的处理功能ꎮ
菊花汤语音中间控制层主要提供语音识别中间件程序ꎬ同语音采集设备采口㊁语音识别SDK接口相互传送数据信息ꎬ完成语音数据的采集㊁处理㊁存储和网络传输等功能ꎬ与平台能力服务层中的语音能力平台服务引擎交互ꎮ系统逻辑架构图如图5所示
ꎮ
图5㊀语音识别逻辑架构图
智能语音识别系统包括语音识别服务器㊁实时识别终端㊁多路语音处理器㊁专业会议话筒㊁路由器等产品ꎬ其中语音识别服务器实现部署引擎等核心能力软件ꎬ做到了设备高度集成化ꎬ减少客户项目
资金投入ꎬ并提供录音服务处理㊁数据传递等能力ꎮ实时识别终端主要用于部署客户端软件ꎬ提供软件各个功能的操作ꎮ多路语音处理器通过专业的语音采集技术ꎬ将模拟话筒的音频数据转换为网络数据ꎬ作为整个系统语音的数据来源ꎮ系统拓扑图如图6所示
ꎮ
图6㊀语音识别系统拓扑图
4㊀结语
综上所述ꎬ本文所设计的基于语音识别技术的智慧讲台ꎬ是建立在RK3288嵌入式硬件设备的基础之上ꎬ采用了语音识别模块采集到语言数据信号ꎬ结合安卓系统的软件平台ꎬ对音频㊁视频㊁控制指令等基本数据条件做出分析ꎬ完成对于语言指令的客观判断ꎮ虽然本系统的语音识别准确度相对较高ꎬ适用性更强ꎮ但是在语音识别模块的开发上仍然存在较大空间ꎬ仍然需要进一步研讨其改进方向ꎬ以期达到对于智慧讲台领域更为良好的运行效果控制ꎮ
参考文献:[1]燕琴.基于人脸识别技术的智能讲台的设计[J].韶关学院学报ꎬ2017ꎬ38(3):25-28.
[2]娄德成ꎬ陈沂ꎬ陈文博ꎬ等.基于语音识别的智能家电控制系统的设计[J].机电信息ꎬ2019(15):107
-108.
[3]
胡娅楠ꎬ陈永芝ꎬ宋煜霄ꎬ等.新型多功能演讲桌设计[J].通信电源技术ꎬ2017ꎬ34(2):64-66.[4]官毅.一种条形屏的处理方法[P].中国专利:CN105788465Bꎬ2018.[5]
潘刚ꎬ伍世云ꎬ孙林平ꎬ等.基于语音识别技术的智能
小车控制系统研究[J].电子设计工程ꎬ2019ꎬ27(7):
118-123+127.
责任编辑:辛美玉
收稿日期:2019-04-12