社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

5分钟搞定!手把手教你将ChatGPT 免费接入到小米音箱,无需代码,小白轻松实现 AI 实时对话!

AI变现研习社 • 1 周前 • 187 次点击  

你还在花 2000 元买 AI 音箱?太亏了!

这篇教程手把手教你如何在 5 分钟内,将家里的小米音箱接入 ChatGPT,免费搞定连续实时语音聊天,无需任何代码基础!

AI 时代已经来临,AI 语音助手能做什么?

  • 陪伴聊天:随时随地进行轻松对话

  • 英语学习:帮助练习口语,提升发音 知识问答:

  • 解答各类问题,扩展认知

  • 亲子互动:为孩子提供有趣的交流体验

全球最好的实时语音 AI,包括 ChatGPT 的高级语音、OpenAI 的 Realtime Voice、微软的 Azure TTS 等,都支持实时语音和连续对话

实时语音 连续对话= 互动无缝对接

很多朋友希望家里能有一个集成了 AI 语音的音箱,随时进行对话,还要防止小孩玩手机用眼过度

目前市面上确实有一些方案(如 mi-gpt)可以实现小米音箱与 AI 对话,但往往存在这些问题:

  • 配置步骤繁琐复杂 

  • 需要长期开着电脑 

  • 成功率较低,容易出错

兄弟们,今天,我将教你一个简单的免费方案,5 分钟搞定实时语音聊天,你可以通过简单的步骤将 ChatGPT 接入小米音箱,轻松实现连续语音对话

而本教程提供的方案优势在于:

  • 5 分钟即可完成配置 

  • 手机就能搞定,无需电脑 零代码,人人都能上手 

  • 除小米音箱需要自备外,目前可免费使用

没有任何的计算机或代码基础的小伙伴,看完这篇教程,就可以独立完成整个接入流程。

熟练操作后仅需 5 分钟,但前期步骤较多,建议先关注和收藏,以防丢失。

大家好,我是清风徐来,本公众号分享了很多AI教育、AI语音的方法、工具,建议您关注、收藏,点一个“在看”,以免失联。国际惯例,先赞后看

准备工作

首先,你需要一台支持连续对话的小米音箱,用户以通过音箱输入口语指令。以下是支持该功能的小米音箱型号:

我使用的是一个 50 元左右的小米随身蓝牙音箱,同样可以实现这个功能。

我昨天在微信“小米Lite”商城购买记录如下,这个音箱蓝牙距离是10米:

有了这个 音箱,有ChatGPT plus会员 就可以利用它来与 ChatGPT 对话了,如下

你会说,这不是搞笑吗?

我有 ChatGPT 官方付费 Plus 我还折腾啥?

别急,我只是提醒有Plus的同学可以这样用,给大家多一种选择,☺

下面演示是今天的主菜:手机连接chatgpt后放在一边,用户拿着蓝牙音箱在10米范围内任意使用。

我们利用一个叫 TEN-Agent 的开源软件,将语音 AI 接入小米音响

TEN-Agent 官网如下:

https://github.com/TEN-framework/TEN-Agent

TEN Agent 的口号是:“The World's First Multimodal AI Agent with the OpenAI Realtime API ”。

它兼容了 OpenAI 10 月发布的 Realtime API 和 RTC 技术

虽然与自家尚未开放 API 的 ChatGPT 高级语音模式相比略有差距,但 OpenAI 的 Realtime API 提供超低延迟,而 RTC 技术则实现了 AI 噪声抑制,TEN Agent 将这两者优势结合在一起。

我们不需要部署这个开源软件 TEN Agent,而是利用官方提供的 Demo 网站来使用

这个网站是国内直联的!非常难得,使用不需要注册

建议使用谷歌 chrome 浏览器

先使用电脑,登录 https://agent.theten.ai

点击左下角“阅读原文”直达

浏览器会提示你是否允许这个网站使用摄像头和麦克风

摄像头可以不开,但麦克风要打开

有如下提示,点允许

如果没这个提示,也可以按如下方法打开麦克风

网站界面如下:

配置演示视频如下,我们点击“connect”随便和它聊聊。

这几个模型中,第三个就是 OpenAI 10 月 2 日在他们的第二次 DevDay(开发者日)发布的实时 API(Realtime API)

TEN Agent 还给它加了联网功能

下一步我们要设置电脑蓝牙和小米音箱连接

点击蓝牙的查找,找到小米音箱后点连接

现在我们就可以利用笔记本,通过小米音箱与 chatgpt 对话了

你可以开着笔记本做其他事情,语音调用chatgpt,或者音箱给一边的家人使用,互不影响。AI会把对话记录实时翻译成文字到屏幕上。

实测下来,GPT+微软 TTS 比较稳定,但 GPT Realtime 语音质量较高

看到这里,你肯定会骂人了

“还要开电脑?这和文章开头提到的 migpt 有啥区别”

我们扩展下思路,你可以在手机上开 TEN Agent 网站啊

我已经给你测试过了

打开手机,使用 chrome 浏览器

切记!chrome 浏览器要升级到最新版

登录登录 https://agent.theten.ai

浏览器还是会询问你是否允许这个网站使用麦克风

你要在手机的浏览器,点“允许”

不需要登录。进入后界面如下:

设置和电脑一样

当手机蓝牙连上小爱音箱,网站启动正常,你就可以和小爱对话了

手机谷歌浏览器详细设置方式:

打开谷歌浏览器,进入你需要启用麦克风的网站。点击地址栏右侧的三个点,打开“设置”菜单,然后向下滑动,找到“网站设置”或“权限”选项。在“网站设置”中,找到“麦克风”选项,确保麦克风权限是开启的。设置完成后,回到网站,如果看到弹出请求麦克风权限的提示,记得点击“允许”。

如果不行,按如下方式处理

这样就可以了,效果如下:

你可能会奇怪,手机可以对话就 OK 了啊,为啥还要接个音箱?

首先,小爱音箱支持 10 米内的蓝牙,而且声音比手机大一些;另外,一个小巧的音箱给小孩用,既不伤眼睛也减少误操作

我在各种环境下实测,最稳定的还是微软的 Azure TTS ,OpenAI 的 Realtime Voice 偶有不稳定的情况

这个时候,点击disconnect,再连一次基本可以解决

以上就是今天的分享,让我来总结一下这个有趣的方案:

TEN Agent 实际是给开发者二次开发的开源模型,个人或公司开发团队可以基于它来开发很多 APP 应用。(当然,这个是免费软件,你会技术也可以利用 TEN Agent 自行部署到本地使用)

我今天是“借力打力”,利用它官方的免费测试网站,用一个取巧的方法给大家构建了快速调用 chatgpt 等语音的方法

只要买个 50 块钱的小米音箱,就能实现和昂贵 AI 音箱一样的功能,是不是很划算?

不过这是一个过渡方案,随着 AI 技术的发展,我们可以期待:

  • 国产 AI(如豆包耳机)推出更成熟的软件+硬件结合的实时对话功能 

  • 基于 TEN Agent 的更多便捷应用 

  • 小米音箱内置 AI 助手的进一步升级

希望今天的方案可以帮助到大家

如果您觉得有用,麻烦给我点赞加关注、收藏,点一个“在看”,以免失联。

有问题可以后台留言或加入VIP群咨询!

下期继续为大家带来更多 AI 实用干货!

清华 AI 团队用 ChatGPT 开医院,即将上线
人傻钱多?字节跳动发布豆包AI耳机
一夜之间,人工智能进中小学课表了!
学霸养成神器!AI 真的要改变教育了
AI时代,“鸡娃”还有必要吗?GPT-4o 轻松拿下丘成桐少年班 2024 年选拔试题
虎妈变慈母,这个顶流AI做家教也太哇塞了吧?关键还免费!
手把手教你用免费软件做AI版行尸走肉
做图神器 Napkin AI 案例及答疑视频号带货搞钱!
《ChatGPT常识手册》 2024年10月版
突发!AI 泰斗Hinton 获得 2024 年诺贝尔物理学奖
ChatGPT Canvas横空出世!AI 写作+编码满级神器,颠覆传统人机交互
保姆级教程!支付宝+WildCard 海外虚拟万事达卡,轻松开通ChatGPT Plus
 Kimi+ WPS,5 分钟做行研 PPT


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/176260
 
187 次点击