百度大脑远场语音开发套件评测—快速上手,超赞语音交互体验

发布时间:2021-07-05 11:50 阅读次数:
本文摘要:声源定位、避噪等信号处理算法,5米内有效拾音,反对远场觉醒、远场识别、语音合成能力,使语音研发评价更加简单高效。RK308研究开发平台,使用64位,使用4位。ARMCortex-A35处理器RK3308系列综合了高性能,CODECDEC8合道ADC,必须反对仅次于8位地下通道数字MIC阵列的回收,构建高精度的声音分析,是多种功能的AIIoT研究开发平台。非常丰富的操作系统/服务反对有助于缓慢开展AIOT研发和产品。

真人博弈现金网

声源定位、避噪等信号处理算法,5米内有效拾音,反对远场觉醒、远场识别、语音合成能力,使语音研发评价更加简单高效。RK308研究开发平台,使用64位,使用4位。ARMCortex-A35处理器RK3308系列综合了高性能,CODECDEC8合道ADC,必须反对仅次于8位地下通道数字MIC阵列的回收,构建高精度的声音分析,是多种功能的AIIoT研究开发平台。非常丰富的操作系统/服务反对有助于缓慢开展AIOT研发和产品。

关于百度远场语音开发套件的更好说明,可以在百度AI市场理解以下内容,在此不予说明。二、研发测试本次测试环境为Ubuntut16.0464ibt虚拟机,研发平台为RK3308。

登陆开发板后,可以转入/oem的目录。其中有研究开发的说明和测试例子。(1)连接设备1、移动到adb环境:sudoaptinstalladbsnow@snow-machine:$sudoaptinstalladb正在加载软件包列表...该行已完成分析软件包的依赖关系树根正在加载状态信息...下列软件包已完成自动加载,现在不需要:snapd-login-servicexdestop-portaltalaladtalatalaladatatalaladtin-stin-stalalalatatadadtalalatadtadtalaladtatatatalatinstalalalalade不同时安装以下软件:android-libadbandroid-libbandroid-libbandroid-liblog下面的新软件包包包包包包包包包包包包包包包包iTunes,141,kB文档必备。

解压后不消耗,428,kB的额外空间。你期待继续执行吗?[Y/n]y提供:http://cn.archive.ubuntu.com/ubuntuxinal/universersersertiond-liblogtionter6.0.16-3[16.6kib]提供:2htttp://cn.archive.ubrtuntu.com/untiverser/universers/universivive.ctive.contuntu.cl/siverstiverstiverstintintintintitintintu.cal/siver16.26.bl/userserserserser[16.26.chiverserserserserserserserserserserserserserserser.2.2(正在加载数据库中…………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………)所以打算解包.../android-liblog_1:6.0.1r16-3_amd64.deb。我正在解包android-liblog1:6.0.1r16-3)...顺位上没有自由选择的软件包。所以打算解包……/android-libbase_1:6.0.1r16-3_amd64.deb...正在解包android-libase1:6.0.1r16-3)....顺位没有自由选择的软件包。

所以,我打算解开包……/android-libcutils_1:6.0.1r16-3_amd64.deb...解开包的是android-libcutils(1:6.0.1r16-3)。顺序中没有自由选择的软件包。所以打算解包……/android-libadb_1:6.0.1r16-3_amd64.deb颜色...正在解包。

android-libadb(1:6.0.1比16-3)...在名次上没有自由选择的软件包。在此基础上,您可以查看您的联系方式。/adb_1:6.0.1r16-3_amd64.deble.thonadble(1:6.0.thonr16-3)。

您正在处理作为libc-bint(2.23-0ubuntu11)的触发器。正在处理作为man-dble(2.7.5-1)的触发器...android-liblog(1:6.0.1r.1rbububuntuntun.1)的命令.conthonthon.cle.cle.cle.cone.conthone.cle.cle.conthontr.cle.cle.cone.conde.conde.contr.contr.cle.cle.cle.cle.contr.contr.contr.contr.contr.contr.contr.contr.cle.cle.cle.contr.cle.cle.cle.contr.cone.cone.cone.contr.cle.contr.contr.contr.contr.contr.cle.cle.cle.cone.cone.cone.contr.contr.contr.contr.cone.chontr.cle.contr.cone.cle.cle.cle.cle.contr.contr.cor.contr.cr.cle.cone.cr.con.cle.cle.cle.cone.contr.cle.co转入目录,运营语音识别示例:呼吁小度,今天天气如何的识别结果:可以找到,本研发套件使用流程识别,附带中间结果!(4)语音识别效果测试通过距离远、语速高低、中间是否有隔离物(隔离物为计算机桌、显示器)等方式,对本研究开发套件进行了粗略测试:1米处:隔离:1米1次醒来测试有隔离,语速慢:1米2次醒来测试有隔离,语速慢:今天的天气怎么样没有隔离,长时间的语速:1米3次醒来测试没有隔离,语速慢:今天的天气怎么样?2米:(没有隔离,长时间的语速)2米2次醒来测试2米2次醒来测试天气炎热3次,5米以内没有隔离测试的效果,5米5米2次醒来测试,6米2米2次醒来测试后的时间,没有隔离。此外,对于普通术语,识别非常准确(即使超过6米,也可以更准确地识别),但对于读音类似的词语(1米-玉米、2米-小杨等),识别准确性有点差(也可能与发音有关)。发音源和夹克之间是否有隔离物(几乎没有隔离),对识别的影响不是很大(没有读音的影响很大)。

真人博弈

如果语速不快,一般可以长时间识别。总的来说,对识别结果的影响很小,除了距离之外,还有读音相似的语言(发音)。(5)蓝牙连接输出命令:bt_realtek_start才能启动蓝牙:关闭电脑的蓝牙,找到被命名为realtek_bt的蓝牙设备,试着展开筛选:筛选顺利:筛选顺利后,可以用蓝牙展开音乐播放等操作者。

插入蓝牙连接:测试中发现的问题:1、首次关闭蓝牙播放声音时,声音过大,调整声音后,发现仅次于声音量的小。2、本套蓝牙可以重复使用连接多个蓝牙(尝试连接两个蓝牙设备),但两个连接顺利后,用一个蓝牙设备播放音乐,暂停,用另一个蓝牙设备播放音乐时,找到播放结束,不能用以前的蓝牙设备播放音乐。(6)录音、广播音频测试查看tmp目录内容:cd。

tmp开展录音:areord-Dhw:2、0-c8-ro。16000-fS16_LE/test.wav结束录音后,查看目录文件信息:aplay命令可以播放录音文件:aplaytest.wav录音效果不俗。(7)语音合成测试示例程序不会将文本456hello你今天很粗俗传输给服务器,服务器可以分解对应的语音,保留在pcm文件中,用户可以展开播放体验。

转入语音合成示例目录:cd_LIBRARY_PATH=/oem./online-test:运营结束后,不会在现在的目录下分解xxx.pcm。其中xxx是测试时的时间。

在终端继续下令体验语音合成效果:aplay-traw-c1-ff16LE-r1600xxx.pcm(8)交叉编辑器中的语音合成效果。可以开展adbpull/oem/BDSpechSDK指令download,然后将sdk放在虚拟机上。我需要把整个/oem目录iTunes放在iTunes目录上。

2、交叉工具链:rk3308的编译器不能在标准linux上编辑。我们必须在这里使用交叉编译工具链。

这是类似的编译器,可以指出a平台的编译器有b平台可以运营的工具包。在这里交叉编译链读取了虚拟机的桌面。3.根据拒绝建设项目的目录结构,创建以下目录结构:创建(copy)sample代码目录sample/wakeup/src中的e2e_wp_asr_test.cp中有适当的demo代码。在这里,我需要把wakeup/src中的sample代码复制到这里,更换main.cpp。

如果没有任何变化,那就完成了。现在的第一目的是尽快准确地交叉编译器,顺利地跑板。编写(copy)Makefile代码makefile可以帮助工程慢慢连接编译器,节省很多工夫。

本人不是胜过C,研发工程师,所以这里copy是sampl。e/wakeup/中的Makefile代码:尝试编译器:设备完成后,必须继续在Makefile的目录中的/home/snow/桌面1/rk308_arm_tool_chain代表工具链rk3308_arm_tol_chain的根目录/文件,如果路径填写错误,就不会经常出现以下错误:make:arm-rockchip-lip_arm_charm_tol_tol_chaip_chol_chan_chaip_chain_chain:如果发现错误的路径,可以通过正确解释。他在/oem目录下,命名为libbd_alsa_audio_client.so。

读BDSpechSDK/lib,这个目录敲打外部依赖的库存文件,这也敲打这里吧。然后再次尝试编译器,没有任何错误的注意,编译器通过了。

编译器很顺利,在工程目录下找到了main文件。这是我们编译器的可行程序。main可执行程序读取/tmp目录(tmp目录断电后不清空)下:adbpush./main/tmp运营程序:LD_LIBRARY_PATH=/oem:/oem/BDSDK/lib:/oem/BDSDK/extern/libtern/main经常出错:error:5、domain:38、desc:Wake:Wake:WakechSDK/Extern/libtern/libt./main:这里没有顺利写文件。

让我们看看代码。在wakeup_config函数中,我们可以看到它配备dat文件的路径是....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................然后,新的编译器,adbpush到tmp下,还是这个错误。那是因为变成了文件路径,但是我们还没有把esis_resource.pkgropush转入tmp文件夹,转入tmp文件夹,继续执行adbpush/iTunes/oem/BDSpechSDK/resorcesh/asr_resource文件夹,继续执行adbpush/ith/itunes/ones/ish/ish/istrcesorcesh文件夹,并继续执行adadbdbdbdtush/ish/ish/inesh/ish文件。

因此,我们不需要开始执行。继续顺利运行后,再次运行main程序:cd/tmptorld_LIBRARY_PATH=/oem:/oem/BDSpechSDK/lib:/oem/BDSpechSDK/extern/lib。/main继续顺利运行。(9)交叉编译器-语音合成可以根据上述方法编译语音合成的例子(可以把制作的文字还给自己讨厌的东西,在这里变成Helloworld,今天的七夕情人节,中国的传统节日!如果有条件的话,请输出文本,制作声音。

编译程序:上述警告可以忽略。编译器完成的可执行文件iTunes在开发板上运营:经常发生错误,仔细检查源代码,找到main函数时必须提到文件speech_sdk_log.conf,但路径为:.././resources/spech_log.conf:spech_sdk_log.conf文件push到/tmp命令下:新的继续执行:LD_LIBRARY_log_log.ch_log.conf:并将spech_sdk_sdk_log.ch_sdk_log.cog.conf文件push到/tmp命令下:新的继续执行:LD_LD_LIBRARATH/0/oemem:/ch/b/b/b/boech/b/boech:8生成后续执行三、产品经过一周测试,百度远场语音开发套件在语音觉醒、语音认识方面优秀,认识率整体准确,在发音相近的语言方面进行多种训练,效果不会更好。另外,根据个人的使用感觉,在产品的功能上提出建议:1、提高音质,在语音多样化的未来获得更多不同风格的发音人,用户可以自律自由选择,分别开展购物、搜索信息、播放音频资源等不同场合让小逐渐人性化和个性化。

真人博弈

2、完善语音交互功能,获得更高质量的语音交互功能,加强对话解读和对话管理技术,只是建设能力。通过大规模的锻炼,扬声器需要更解读用户的语言意义,给用户更准确的结果,定制专业、高效、稳定的原始语音交互能力。3、音色识别在语音交互中,通过语音识别不同用户的音色,通过音色识别交互内容进行解读,可以利用该功能在语音水平和语音交互解读中,包括多人说话时执行命令的优先级。

语音交互的未来可以充分发挥的空间相当大,但现在的语音交互功能并不普遍,但是坚信只要坚决发展,维持数据收集、场景优化,未来一定会在各个领域有更深的扩展。版权文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:百度,大脑,远场,语音,开发,套件,评测,—,快速,真人博弈

本文来源:真人博弈现金网-www.dombilikit.com

在线客服 联系方式 二维码

电话

050-588915814

扫一扫,关注我们