搜索
bottom↓
回复: 14

求语音交互控制方案【标题不合格】

[复制链接]

出0入0汤圆

发表于 2024-1-14 14:22:46 | 显示全部楼层 |阅读模式
就是产品用语音实现交互控制硬件产品的动作。请问一般用什么软硬件方案,谢谢。

阿莫论坛20周年了!感谢大家的支持与爱护!!

月入3000的是反美的。收入3万是亲美的。收入30万是移民美国的。收入300万是取得绿卡后回国,教唆那些3000来反美的!

出350入8汤圆

发表于 2024-1-14 18:50:16 | 显示全部楼层
硬件方案是次要的,主要是软件,目前用得比较多的是思必驰和科大讯飞。

出0入148汤圆

发表于 2024-1-14 18:59:38 来自手机 | 显示全部楼层
交互感觉离线做不好,应该是本地语音识别与合成输出,交互功能发送给服务端大模型来响应,甚至本地只支持唤醒指令响应,其他直接音频数据与后端交互

出0入0汤圆

发表于 2024-1-14 21:34:41 | 显示全部楼层
你搜一下聆思这家公司。

出0入8汤圆

发表于 2024-1-14 22:28:20 | 显示全部楼层
你是需要离线的还是在线的?

出0入0汤圆

 楼主| 发表于 2024-1-15 00:40:32 | 显示全部楼层
kebaojun305 发表于 2024-1-14 22:28
你是需要离线的还是在线的?
(引用自5楼)

都可以,设备是4G一直在线的

出16170入6148汤圆

发表于 2024-1-15 03:09:33 来自手机 | 显示全部楼层
“求语音交互控制方案”标题不合格。请自行修正。(注意:主题发出24小时后就不能修改帖子

帖子标题必须能充分说明帖子的内容。如你要问AVR的ADC如何才能测量得比较准确,“AVR的ADC如何消除干扰测量得比较准确?”是合格的标题。不合格举例:
    1:小女子冰天雪地裸体跪求解决方法
    2:救命啊...
    3:高手请出招,一个无法解决的AVR问题
    4:一个困扰学习单片机初学者,惊动单片机开发者的难题
    5:AVR的ADC测量   (点评:你到底是问问题,或是有技术心得与大家分享?)

出20入67汤圆

发表于 2024-1-15 08:21:04 来自手机 | 显示全部楼层
本帖最后由 autolog 于 2024-1-15 08:31 编辑

你具体需求都没搞明白,就相当于求个流水灯控制方案。那我是说用8051还是32还是英特尔i7?
语音有在线有离线,有单麦有双麦甚至四麦,技术指标比如是否要求环境噪音,一堆要求。一分钱一分货,用了就知道,没什么好推荐的。

出0入10汤圆

发表于 2024-1-15 09:10:49 | 显示全部楼层
   固定的几个动作, 离线语音方案,可以考虑 云之声的 芯片(性价比高)。    很多小家电类,   如 “开灯”,“关灯”,  开风机,  这些指令,都用这个公司的芯片。

出100入312汤圆

发表于 2024-1-15 09:17:34 | 显示全部楼层
widesoft2 发表于 2024-1-15 09:10
固定的几个动作, 离线语音方案,可以考虑 云之声的 芯片(性价比高)。    很多小家电类,   如 “开灯 ...
(引用自9楼)

开灯之类,应该很容易误识别

出0入0汤圆

 楼主| 发表于 2024-1-15 10:06:36 | 显示全部楼层
widesoft2 发表于 2024-1-15 09:10
固定的几个动作, 离线语音方案,可以考虑 云之声的 芯片(性价比高)。    很多小家电类,   如 “开灯 ...
(引用自9楼)

自由语言控制,机器的各种动作哦。不是简单的开灯关灯指令

出100入312汤圆

发表于 2024-1-15 10:18:10 | 显示全部楼层
tingfengqilang 发表于 2024-1-15 10:06
自由语言控制,机器的各种动作哦。不是简单的开灯关灯指令
(引用自11楼)

你可能没有搞过语音控制,不管是离线语音,还是在线语音,做不到完全自由语言。在线语音的话,服务器端也是需要预定义“词条”的

出610入42汤圆

发表于 2024-1-15 13:44:50 来自手机 | 显示全部楼层
离线也可试试好好搭搭的asrpro,虽然公司不大,编程环境中文图形化,基乎不用学习

出16170入6148汤圆

发表于 2024-1-15 13:58:42 来自手机 | 显示全部楼层
armok. 发表于 2024-1-15 03:09
“求语音交互控制方案”标题不合格。请自行修正。(注意:主题发出24小时后就不能修改帖子

帖子标题必须能 ...

(引用自7楼)

已经强制通知楼主,楼主也留言表示已经知晓。但去没有修改标题。

楼主位发出24小时后,楼主将失去修改权限,会被封锁ID 2星期处理。

出0入8汤圆

发表于 2024-1-15 15:10:08 | 显示全部楼层

离线最强语音识别模块。
https://club.autohome.com.cn/bbs ... ml#pvareaid=6830285
自己做的语音方控。目前使用时,识别率100%.

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-4-28 14:46

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表