搜索
bottom↓
回复: 46

【esp32 机器人 AI小智对话 演示视频】对话非常智能、反应非常快

[复制链接]

出0入10汤圆

发表于 2025-2-14 21:50:19 | 显示全部楼层 |阅读模式
1、今天给我们的硬件加入小智的AI;比该项目原作者的那个智能和方便了很多;原作者AI对话采用  wifi sta模式;wifi名称、密码等大模型参数都是固定的;所以个人想要使用需要手动修改源码中的wifi名称、密码还有大模型的参数等;

2、小智AI 采用的 wifi sta+ap 模式;先ap建立一个热点,手机连上该热点后 进入web端,通过web端输入你家的wifi名称和密码实现配网;非常的方便;AI也比百度那个智能很多很多;

我问了我所在地的天气、讲笑话、唱歌等都是瞬间反应;视频后面有关于论坛的彩蛋

真的好智能;不是一问一答那种;更像是和一个人在对话;情绪价值拉满啊

打开链接直接可以看视频、无需下载;

视频链接:【超级会员V7】通过百度网盘分享的文件:ESP_AI.m…
链接:https://pan.baidu.com/s/1LmFlPxRknM4uS1abXkY68g 
提取码:e633
复制这段内容打开「百度网盘APP 即可获取」
(26mb)

阿莫论坛21周年了!感谢大家的支持与爱护!!

“战争只是一群老头的政治游戏,可冲上去的却是一群年轻人,战争结束后,资本家满载而归,政客握手言和,只有母亲抱着墓碑哭泣!”

出18225入7301汤圆

发表于 2025-2-14 22:08:15 来自手机 | 显示全部楼层
好!速度果然好快!

出0入0汤圆

发表于 2025-2-14 22:11:11 来自手机 | 显示全部楼层
挺棒的!很流畅

出18225入7301汤圆

发表于 2025-2-14 22:13:54 来自手机 | 显示全部楼层
小智是哪一家AI提供的?

出0入233汤圆

发表于 2025-2-14 22:22:59 | 显示全部楼层
armok. 发表于 2025-2-14 22:13
小智是哪一家AI提供的?
(引用自4楼)

一个  个人 提供的。

出18225入7301汤圆

发表于 2025-2-14 22:53:02 来自手机 | 显示全部楼层
yyts 发表于 2025-2-14 22:22
一个  个人 提供的。
(引用自5楼)

小智AI是一款基于ESP32开发板的开源智能语音助手项目,旨在帮助用户通过简单的硬件和软件组合,构建属于自己的AI聊天机器人。以下是关于小智AI的详细介绍:


项目特点

• 开源与低成本:小智AI完全开源,用户可以根据自己的需求进行定制化开发。其硬件成本较低,主要依赖ESP32开发板,适合个人开发者和学习者。

• 强大的语音交互能力:

• 支持多语言语音识别,包括国语、粤语、英语等。

• 集成大语言模型(如Qwen 2.5)和语音合成技术,支持上下文理解和对话记忆。

• 支持声纹识别,可识别不同说话者。

• 硬件功能丰富:

• 支持Wi-Fi和4G网络接入。

• 配备OLED/LCD屏幕,可显示交互内容。

• 支持按键唤醒和打断功能。

• 高度可扩展性:

• 开放的插件系统,支持功能扩展。

• 可自定义对话风格、角色和提示词。

• 支持脚本化任务处理。


应用场景

• 智能家居控制:通过语音指令控制家电设备。

• 学习工具:帮助学生进行语言学习。

• 家庭助手:提供天气、新闻等信息。

• 娱乐伙伴:进行趣味对话和互动。


开发与使用

• 用户可以通过简单的硬件连接和固件烧录,快速搭建一个功能丰富的语音助手系统。

• 项目提供了完整的硬件方案和软件方案,包括原理图、PCB、BOM和源码。

小智AI项目不仅适合对AI感兴趣的学生,也为想要探索新技术的开发者提供了丰富的学习资源和实践机会。

出0入233汤圆

发表于 2025-2-14 23:36:08 | 显示全部楼层
本帖最后由 yyts 于 2025-2-14 23:37 编辑
armok. 发表于 2025-2-14 22:53
小智AI是一款基于ESP32开发板的开源智能语音助手项目,旨在帮助用户通过简单的硬件和软件组合,构建属于 ...
(引用自6楼)


嗯,不过他服务器端软件没有开源,有没有大神能评估下,自己开发一套这样的服务端软件(或者算中间件?)工作量大不大,这样就可以不用受制于他这个个人的服务器了。

出0入10汤圆

 楼主| 发表于 2025-2-14 23:56:48 | 显示全部楼层
yyts 发表于 2025-2-14 23:36
嗯,不过他服务器端软件没有开源,有没有大神能评估下,自己开发一套这样的服务端软件(或者算中间件?) ...
(引用自7楼)

要花不少钱的

出110入0汤圆

发表于 2025-2-15 00:01:11 来自手机 | 显示全部楼层
小智,就是咱论坛里面另一位坛友发的那个众筹吧?

出0入10汤圆

 楼主| 发表于 2025-2-15 00:04:16 | 显示全部楼层
dgtg 发表于 2025-2-15 00:01
小智,就是咱论坛里面另一位坛友发的那个众筹吧?
(引用自9楼)

是的  我们这个团购的机器人也可以用这个。只是我们这个更复杂。还可以控制坦克、摄像头啥的

出0入0汤圆

发表于 2025-2-15 00:08:53 来自手机 | 显示全部楼层
AI有些回复,感觉挺公式化的

出0入233汤圆

发表于 2025-2-15 00:13:16 | 显示全部楼层

只是个中间件,服务器性能就不需要太强,全部调用其它第三方api,我看好多可以用阿里的。用多久收多久,应该费用也不会太高。

出0入16汤圆

发表于 2025-2-15 08:47:22 | 显示全部楼层
支持几种语言?

出0入10汤圆

 楼主| 发表于 2025-2-15 09:47:14 | 显示全部楼层

常见的语音好像都没问题;日语 英语 应该是没问题的其他的我没细看。毕竟咱也不会其他语种啊

出0入0汤圆

发表于 2025-2-15 11:16:58 来自手机 | 显示全部楼层
可否这样理解:小智有可能可以替代外教教小孩学英语?

出0入10汤圆

 楼主| 发表于 2025-2-15 14:18:43 | 显示全部楼层
mcuz195 发表于 2025-2-15 11:16
可否这样理解:小智有可能可以替代外教教小孩学英语?
(引用自15楼)

完全可以的

出0入50汤圆

发表于 2025-2-15 15:11:52 来自手机 | 显示全部楼层
哈哈,已经体验过了
确实厉害,响应速度快,可以聊天,唱歌,讲故事
比咱硬件原APP的对话功能强太多
只是小智的UI比较简单,就一个聊天窗口

网上也已经有人开源了服务端ws服务的代码
但好像授权配置功能没有。感觉这后边是有技术公司在支撑的

出0入0汤圆

发表于 2025-2-16 16:39:26 | 显示全部楼层
本帖最后由 roc. 于 2025-2-16 16:42 编辑

如果说
暂时没硬件在手上,也想体验下小智AI的话,
可以参考B站这UP主, 在电脑端利用python连接小智服务器
https://www.bilibili.com/video/B ... arch-card.all.click


https://github.com/zhh827/py-xiaozhi

前两天我测试过可用
并且反应很快,
我之前调用百度API做STT-> 讯飞星火(GPT)->TTS,实现的效果就是个二愣子


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出18225入7301汤圆

发表于 2025-2-16 16:54:53 来自手机 | 显示全部楼层
mcuz195 发表于 2025-2-15 11:16
可否这样理解:小智有可能可以替代外教教小孩学英语?
(引用自15楼)

手机安装kimi ,使用电话功能,设置场景“英语口语练习”

出0入0汤圆

发表于 2025-2-16 23:33:17 来自手机 | 显示全部楼层
armok. 发表于 2025-2-16 16:54
手机安装kimi ,使用电话功能,设置场景“英语口语练习”
(引用自19楼)

前面几年都是用罗塔石碑,但没有充值真人教学,效果不理想,装一个Kimi对话试试看。

出0入0汤圆

发表于 2025-2-17 11:50:43 | 显示全部楼层
希望能自主更改模型,我有自己搭建的ai聚合平台,主流ai都汇总在一起了。现在的ai的api都兼容chatgpt,只要改api地址和key就行了

出0入10汤圆

 楼主| 发表于 2025-2-17 13:01:33 | 显示全部楼层
cqrg 发表于 2025-2-17 11:50
希望能自主更改模型,我有自己搭建的ai聚合平台,主流ai都汇总在一起了。现在的ai的api都兼容chatgpt,只要 ...
(引用自21楼)

可以改的 当然可以改  有源代码的

出0入0汤圆

发表于 2025-2-18 09:34:44 | 显示全部楼层
小智 AI 让我登录到控制面板,输入验证码。控制面板在哪儿?

出0入0汤圆

发表于 2025-2-18 09:39:01 | 显示全部楼层
yangwc 发表于 2025-2-18 09:34
小智 AI 让我登录到控制面板,输入验证码。控制面板在哪儿?
(引用自23楼)

找到了:https://xiaozhi.me/

出0入0汤圆

发表于 2025-2-18 10:04:55 | 显示全部楼层
span42 发表于 2025-2-15 15:11
哈哈,已经体验过了
确实厉害,响应速度快,可以聊天,唱歌,讲故事
比咱硬件原APP的对话功能强太多
(引用自17楼)

短信验证码:十方科技

出0入0汤圆

发表于 2025-2-18 13:45:43 | 显示全部楼层
这是小智AI各个开发板的固件下载地址:https://github.com/78/xiaozhi-esp32/releases

出0入0汤圆

发表于 2025-2-18 13:49:02 | 显示全部楼层
yyts 发表于 2025-2-14 22:22
一个  个人 提供的。
(引用自5楼)

如果是个人做的,那这个人有好多开发板。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出10入95汤圆

发表于 2025-2-18 14:21:40 | 显示全部楼层
语音很台湾

出0入233汤圆

发表于 2025-2-18 14:53:19 来自手机 | 显示全部楼层
yangwc 发表于 2025-2-18 13:49
如果是个人做的,那这个人有好多开发板。
(引用自27楼)


板子只是硬件,固件是开源的,你也可以复刻一个,把自己适配的板型加进去,但是,用的都是他提供的服务器接口。

我也用我手上现有的硬件,复刻了一个。

趁着周末,也来玩玩DeepSeek的Ai聊天机器人 https://www.amobbs.com/forum.php?mod=viewthread&tid=5801975

出0入0汤圆

发表于 2025-2-18 22:37:51 | 显示全部楼层
yyts 发表于 2025-2-18 14:53
板子只是硬件,固件是开源的,你也可以复刻一个,把自己适配的板型加进去,但是,用的都是他提供的服务器 ...
(引用自29楼)

从 release note 来看。对所列出的开发板的支持都是他自己做的。

出0入0汤圆

发表于 2025-2-18 22:47:37 | 显示全部楼层
span42 发表于 2025-2-15 15:11
哈哈,已经体验过了
确实厉害,响应速度快,可以聊天,唱歌,讲故事
比咱硬件原APP的对话功能强太多
(引用自17楼)

https://github.com/78/xiaozhi

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入233汤圆

发表于 2025-2-18 23:27:19 | 显示全部楼层
yangwc 发表于 2025-2-18 22:37
从 release note 来看。对所列出的开发板的支持都是他自己做的。
(引用自30楼)

你自己去看git的log吧。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

发表于 2025-2-19 09:56:10 | 显示全部楼层
yyts 发表于 2025-2-18 23:27
你自己去看git的log吧。
(引用自32楼)

看到了。确实是很多人一起做的。

出0入0汤圆

发表于 2025-2-19 13:17:09 来自手机 | 显示全部楼层
我又自定义唤醒词如何实现?开源代码列表里的唤醒词没有我要的。是要让乐鑫训练吗?

出0入233汤圆

发表于 2025-2-19 13:20:31 | 显示全部楼层
lnso 发表于 2025-2-19 13:17
我又自定义唤醒词如何实现?开源代码列表里的唤醒词没有我要的。是要让乐鑫训练吗? ...
(引用自34楼)

是的。

出0入0汤圆

发表于 2025-2-20 22:31:22 来自手机 | 显示全部楼层
yyts 发表于 2025-2-18 14:53
板子只是硬件,固件是开源的,你也可以复刻一个,把自己适配的板型加进去,但是,用的都是他提供的服务器 ...
(引用自29楼)

服务器接口要怎么改?

出0入233汤圆

发表于 2025-2-20 23:35:18 | 显示全部楼层
lnso 发表于 2025-2-20 22:31
服务器接口要怎么改?
(引用自36楼)

改简单,直接在menuconfig里面就可改,但是前提 你得自己搭服务器。

出0入0汤圆

发表于 2025-2-21 14:23:38 | 显示全部楼层
yyts 发表于 2025-2-20 23:35
改简单,直接在menuconfig里面就可改,但是前提 你得自己搭服务器。
(引用自37楼)

如果我要接入另外一个公司提供的语音平台,需要在哪里修改

出0入0汤圆

发表于 2025-2-21 14:24:58 | 显示全部楼层
roc. 发表于 2025-2-16 16:39
如果说
暂时没硬件在手上,也想体验下小智AI的话,
可以参考B站这UP主, 在电脑端利用python连接小智服务器
(引用自18楼)

怎么调用别的公司的API?小智的C++的源码看不懂

出0入233汤圆

发表于 2025-2-21 16:37:26 来自手机 | 显示全部楼层
lnso 发表于 2025-2-21 14:23
如果我要接入另外一个公司提供的语音平台,需要在哪里修改
(引用自38楼)

没办法改,除非你自己实现他这个服务端软件

出0入0汤圆

发表于 2025-2-21 19:03:22 | 显示全部楼层
yyts 发表于 2025-2-21 16:37
没办法改,除非你自己实现他这个服务端软件
(引用自40楼)

xiaozhi-esp32-server-main  修改这个服务器代码码?

出0入233汤圆

发表于 2025-2-21 19:57:23 | 显示全部楼层
本帖最后由 yyts 于 2025-2-21 20:01 编辑
lnso 发表于 2025-2-21 19:03
xiaozhi-esp32-server-main  修改这个服务器代码码?
(引用自41楼)


嗯,这是一个开源的替代方案,你可以自己修改和部署到自己服务器,和虾哥的服务器相比,功能,性能,速度,都要差一些。

出0入0汤圆

发表于 2025-2-22 13:19:27 | 显示全部楼层
他这个可以控制硬件,不知道服务器端是怎么处理的

出0入0汤圆

发表于 2025-3-26 12:32:02 来自手机 | 显示全部楼层
小智的设备id可以随意生成吗,应该受乐鑫控制吧

出0入10汤圆

 楼主| 发表于 2025-3-28 11:39:19 | 显示全部楼层
罗小蘑菇 发表于 2025-3-26 12:32
小智的设备id可以随意生成吗,应该受乐鑫控制吧
(引用自44楼)

就是硬件mac地址 唯一的

出0入1208汤圆

发表于 2025-3-28 12:06:09 来自手机 | 显示全部楼层
本帖最后由 Bunny_Girl 于 2025-3-28 12:07 编辑
armok. 发表于 2025-2-14 22:13
小智是哪一家AI提供的?
(引用自4楼)


小智的男朋友做的,她男朋友是程序员
她好几次跟我女儿提前自己的程序员男友

出0入233汤圆

发表于 2025-3-28 12:11:07 | 显示全部楼层
罗小蘑菇 发表于 2025-3-26 12:32
小智的设备id可以随意生成吗,应该受乐鑫控制吧
(引用自44楼)


可以随意生成,除了芯片是用的乐鑫的以外,其它和乐鑫没任何关系。
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2026-3-16 02:03

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表