语音识别芯片的发展历史已经有很长了,但是要具体说哪个更好,这要从不同的维度来评判,因为不同的产品对于语音识别芯片的需求是不同的,不同的产品的预算也是不同的,芯片和产品只有匹配度最佳而没有说哪个最好的这个说法。
语音识别芯片型号特性一览
WTK6900 系列:其中,WTK6900G-24SS 是本地语音触发引擎的辨识芯片,具有低成本、高可靠性等特点,拥有高性能 32 位 RISC 内核,主频 200MHz,支持浮点运算。WTK6900H-24SS 采用神经网络算法,识别精准、误判率低,5 米远场可靠识别,支持 MP3、WAV 音频解码。WTK6900HM01 接口简单,支持识别词条丰富,可达 50-300 条且可定制,内置降噪算法。
WT2605C:集成双模蓝牙,阵列麦克风,支持4G/WIFI链接,支持 BLE 低功耗连接,可接入云端实现复杂语义交互。升级后支持全球 51 国语言及 22 种国内方言,信噪比达 95dB,支持流媒体播放与远程控制,适用于跨境智能设备和可穿戴设备等。
AM5728:由德州仪器公司推出,采用双 ARM Cortex-A15 内核和两个 4 通道的超大读写数据存储器,集成了多个音频和视频接口,支持各类标准和主流的操作系统,具有多种实时通信接口,在语音识别领域性能卓越。
MT8516:是联发科技公司推出的语音智能处理器芯片,采用四核 ARM Cortex-A35 处理器,最高时钟速度可达 1.3GHz,内置 2GB LPDDR3 与 8GB eMMC 存储器,支持 H.264 编码处理,特别适用于入门级 AI 语音设备,且与 Alexa Voice Service 系统兼容。
其实通过以上几个经典语音识别的型号对比,你可以发现语音识别芯片有两极分化,一部分端侧能力很强,主打高性能,但是成本也很高只适合做一些高端产品,还有一部分端侧能力没有那么强只能满足一些基本指令,但是价格实惠,普遍适合搭载常规的设备上。
这其实是市场选择的结果,语音识别目前就是本地+云端的方式,本地算力强模型强,那么本地的效果就堪比在线的效果连不联网都无所谓,但是很重要的一点是这种方式的成本就飙升。反之本地的算力差一些但是可以完成识别功能转换成文字以后和云端大模型交流后再返回到本地通过语音播报功能来实现对话。
语音识别芯片选型是可以根据自己产品的定位和需求来进行的 ,目前市场上有比较丰富的产品型号可以选择,以WTK6900系列为例,这款芯片可以支持自定义指令,多个版本分别支持本都10-300条的命令词,联网状态下命令词就无限了。WT2606则是可以做到连续多轮语音对话。
以上“语音识别芯片哪个最好?”的说明,希望可以帮助到大家,产品适配语音芯片没有最好,只有最合适,合适的预算配上合适的芯片,那就是一个合适的产品。
Copyright (©) 2020 深圳唯创知音电子有限公司 版权所有 地址:深圳市宝安区福永街道大洋路90号中粮福安机器人智造产业园6栋2/3层 备案号:粤ICP备15026214号