简介
本课程是AI小智系统硬件+后端从零开发的系统教程,共计114集,是目前B站最全面的AI语音交互硬件开发资源。课程以"从零到完整产品"为目标,从Python基础、ESP32硬件开发到后端服务搭建,再到WebSocket通信、语音识别、语音合成、唤醒词等核心技术,手把手教学员打造完整的AI语音助手系统。
教程内容分为四大核心模块:基础准备篇(第00-05集)介绍AI小智系统整体架构、课程大纲、Python开发环境(PyCharm+Anaconda)、ESP32开发环境(ESP-IDF)、软硬件部分概览;Python后端篇(第06-21集、51-71集、106-110集、112集)涵盖Python基础(函数、变量、条件循环、面向对象)、DeepSeek调用、EdgeTTS语音合成、Opus编解码、FunASR语音识别、后端架构优化(工厂模式、配置文件、日志标准化、WebSocket服务器、多线程、队列、VAD、聊天上下文记录、物联网消息);ESP32硬件篇(第22-50集、71-105集、113-114集)包括ESP32工程创建、LED控制、C/C++语法、SD卡操作、麦克风录音、FreeRTOS任务、Opus编解码、PCM音频播放、代码重构(面向对象、工厂模式)、低功耗蓝牙(BLE)、WiFi配网、WebSocket客户端、音频重采样、唤醒词(原理、实现、自定义)、语音识别流程、性能优化、LED呼吸灯等;系统集成篇(第52-70集、111集)实现前后端WebSocket通信、音频数据传输、流式输出、队列管理、资源释放、意图识别等核心功能。
课程全程干货无废话,每个技术点均配有详细的代码讲解与实操演示,专为零基础学员设计。通过114集系统学习,你将全面掌握AI语音交互系统的完整开发流程,独立打造从硬件到软件的完整AI产品,真正实现"从零开发"到"产品落地"的技能飞跃。
各集标题与链接
【AI小智系统】0-AI小智系统开篇介绍
内容小结:全面介绍AI小智系统的整体架构、功能特性、应用场景与学习路径,建立完整的项目认知与学习目标。
视频链接:点击观看
【AI小智系统】1-AI小智系统课程大纲
内容小结:详细讲解课程的完整大纲与知识模块划分,帮助学员了解学习进度安排与技能掌握路径。
视频链接:点击观看
【AI小智系统】2-Python开发环境安装(PyCharm+Anaconda)
内容小结:手把手演示Python开发环境的搭建,包括PyCharm IDE安装、Anaconda环境配置、虚拟环境创建等基础设置。
视频链接:点击观看
【AI小智系统】3-ESP32开发环境安装(ESP-IDF)
内容小结:详细讲解ESP32开发框架ESP-IDF的安装配置,包括工具链设置、环境变量配置、工程模板创建。
视频链接:点击观看
【AI小智系统】4-AI小智软件部分介绍
内容小结:介绍AI小智系统的软件架构,包括后端服务、AI模型调用、语音处理、通信协议等核心模块。
视频链接:点击观看
【AI小智系统】5-AI小智硬件部分介绍
内容小结:讲解AI小智系统的硬件组成,包括ESP32-S3主控、麦克风、扬声器、SD卡、LED等外设与电路设计。
视频链接:点击观看
【AI小智系统】6-Python基础-函数
内容小结:Python编程基础之函数定义与使用,包括参数传递、返回值、作用域等核心概念讲解。
视频链接:点击观看
【AI小智系统】7-Python基础-变量、条件语句、循环语句
内容小结:Python基础语法讲解,包括变量类型、if条件判断、for/while循环等编程核心结构。
视频链接:点击观看
【AI小智系统】8-Python基础-面向对象编程
内容小结:Python面向对象编程基础,包括类与对象、属性与方法、继承与多态等OOP核心概念。
视频链接:点击观看
【AI小智系统】9-小智后端好实现部分-调用DeepSeek获取回答
内容小结:实现后端调用DeepSeek大语言模型API获取智能回答,完成AI对话的核心功能模块。
视频链接:点击观看
【AI小智系统】10-小智后端好实现部分-调用语音合成edgeTTS
内容小结:集成EdgeTTS语音合成服务,将文本回答转换为自然语音输出,实现语音交互基础。
视频链接:点击观看
【AI小智系统】11-小智后端好实现部分-opus编码原理
内容小结:讲解Opus音频编码格式的工作原理,包括压缩算法、音质保真、实时传输特性等理论基础。
视频链接:点击观看
【AI小智系统】12-小智后端好实现部分-opus编码依赖安装
内容小结:演示Opus编码库的安装配置,包括依赖包管理、环境配置、编译安装等实操步骤。
视频链接:点击观看
【AI小智系统】13-小智后端好实现部分-opus编码实现1
内容小结:Opus编码功能的第一部分实现,包括音频数据读取、编码器初始化、基础编码流程。
视频链接:点击观看
【AI小智系统】14-小智后端好实现部分-opus编码实现2
内容小结:Opus编码功能的第二部分实现,完善编码参数优化、数据包封装、错误处理机制。
视频链接:点击观看
【AI小智系统】15-小智后端好实现部分-opus编码实现验证
内容小结:验证Opus编码功能的正确性,通过解码回环测试确保编码数据完整性与音质保真度。
视频链接:点击观看
【AI小智系统】16-小智后端好实现部分-opus解码
内容小结:实现Opus音频解码功能,将压缩的Opus数据还原为PCM音频格式,完成编解码闭环。
视频链接:点击观看
【AI小智系统】17-小智后端好实现部分-解码后的wav喂给本地asr
内容小结:将解码后的WAV音频数据输入本地ASR(自动语音识别)系统,实现语音到文本的转换。
视频链接:点击观看
【AI小智系统】18-funASR语音识别模型训练与推理整体流程
内容小结:深入讲解FunASR语音识别模型的训练与推理流程(进阶内容,听不懂不影响后续学习)。
视频链接:点击观看
【AI小智系统】19-后端代码优化-增加配置文件config.yml
内容小结:后端架构优化,引入YAML配置文件管理API密钥、模型参数、服务配置,提升代码可维护性。
视频链接:点击观看
【AI小智系统】20-后端当前功能模块测试
内容小结:对当前实现的后端功能模块进行全面测试,包括AI对话、语音合成、编解码、语音识别等。
视频链接:点击观看
【AI小智系统】22-硬件程序-创建ESP32工程代码
内容小结:创建ESP32硬件开发的基础工程,包括项目结构搭建、编译配置、烧录设置等初始步骤。
视频链接:点击观看
【AI小智系统】23-硬件程序-ESP32点亮一颗LED
内容小结:ESP32硬件编程入门,通过点亮LED学习GPIO控制、电平设置、延时操作等基础硬件操作。
视频链接:点击观看
【AI小智系统】24-硬件程序-工程结构详细介绍
内容小结:详细讲解ESP32工程的结构组成,包括源码文件、头文件、组件配置、编译脚本等组织方式。
视频链接:点击观看
【AI小智系统】25-硬件程序-C语言基本语法
内容小结:ESP32开发所需的C语言基础语法讲解,包括数据类型、控制结构、函数、指针等核心概念。
视频链接:点击观看
【AI小智系统】26-硬件程序-C++基本语法
内容小结:ESP32开发所需的C++基础语法讲解,包括类与对象、引用、模板等面向对象特性。
视频链接:点击观看
【AI小智系统】27-硬件程序-混合编程C&C++
内容小结:讲解ESP32平台上C与C++混合编程的方法,包括extern "C"链接、头文件兼容等技巧。
视频链接:点击观看
【AI小智系统】28-硬件程序-更改当前代码为c++程序
内容小结:将现有C代码重构为C++程序,引入面向对象设计,提升代码的组织性与可扩展性。
视频链接:点击观看
【AI小智系统】29-硬件程序-ESP32S3读取写入SD卡
内容小结:实现ESP32-S3的SD卡读写功能,包括文件系统挂载、文件创建、数据读写、错误处理等操作。
视频链接:点击观看
【AI小智系统】30-硬件程序-SD卡从面向过程编程转变为依赖倒置的面向对象编程思想
内容小结:SD卡操作代码重构,从面向过程转变为面向对象设计,应用依赖倒置原则提升代码灵活性。
视频链接:点击观看
【AI小智系统】31-硬件程序-ESP32S3实现麦克风录音保存到SD卡
内容小结:实现ESP32-S3麦克风音频采集与SD卡存储,包括I2S配置、音频采样、文件写入等完整流程。
视频链接:点击观看
【AI小智系统】32-硬件程序-麦克风录音功能代码重构
内容小结:麦克风录音代码重构,优化架构设计,提升代码的可读性、可维护性与扩展性。
视频链接:点击观看
【AI小智系统】33-硬件程序-ESP32的FreeRTOS任务概念详解-1
内容小结:深入讲解ESP32搭载的FreeRTOS实时操作系统任务概念,包括任务创建、调度、状态管理等(第一部分)。
视频链接:点击观看
【AI小智系统】33-硬件程序-ESP32的FreeRTOS任务概念详解-2
内容小结:继续FreeRTOS任务概念深入讲解,包括任务间通信、同步机制、优先级管理等(第二部分)。
视频链接:点击观看
【AI小智系统】34-硬件程序-ESP32使用C++创建FreeRTOS任务
内容小结:演示如何用C++封装创建FreeRTOS任务,将任务管理与面向对象设计结合,提升代码质量。
视频链接:点击观看
【AI小智系统】35-硬件程序-后台任务逻辑及代码实现
内容小结:实现系统后台任务的处理逻辑,包括状态监控、低优先级任务调度、资源管理等。
视频链接:点击观看
【AI小智系统】36-硬件程序-ESP32实现opus编码
内容小结:在ESP32硬件上实现Opus音频编码功能,包括编码器移植、参数配置、实时编码流程。
视频链接:点击观看
【AI小智系统】37-硬件程序-验证ESP32的opus编码结果(后端python验证)
内容小结:验证ESP32端Opus编码的正确性,使用后端Python程序解码验证,确保编解码兼容性。
视频链接:点击观看
【AI小智系统】38-硬件程序-ESP32实现opus解码
内容小结:在ESP32上实现Opus音频解码功能,将接收的压缩音频还原为可播放的PCM数据。
视频链接:点击观看
【AI小智系统】39-硬件程序-ESP32实现pcm音频播放
内容小结:实现ESP32的PCM音频播放功能,包括I2S驱动、DAC配置、音频缓冲区管理、播放控制等。
视频链接:点击观看
【AI小智系统】40-硬件程序-音频代码重构1
内容小结:音频处理代码重构第一部分,优化播放、编码、解码模块的架构设计,提升代码质量。
视频链接:点击观看
【AI小智系统】41-硬件程序-音频代码重构2
内容小结:音频代码重构第二部分,继续优化音频流程控制、错误处理、资源管理机制。
视频链接:点击观看
【AI小智系统】42-硬件程序-音频代码重构3
内容小结:音频代码重构第三部分,完善音频模块的接口设计,实现更灵活的组件替换与扩展。
视频链接:点击观看
【AI小智系统】43-硬件程序-音频代码重构4
内容小结:音频代码重构第四部分,完成音频子系统的整体架构优化,形成高内聚低耦合的设计。
视频链接:点击观看
【AI小智系统】44-硬件程序-构建开发板抽象层(工厂模式的静态工厂方法)
内容小结:构建开发板硬件抽象层,应用工厂模式的静态工厂方法,实现硬件接口的统一封装与多平台适配。
视频链接:点击观看
【AI小智系统】45-硬件程序-开发板抽象层功能实现
内容小结:实现开发板抽象层的具体功能,包括GPIO、音频、存储、网络等硬件接口的标准化封装。
视频链接:点击观看
【AI小智系统】46-硬件程序-调用关系代码重构1
内容小结:系统调用关系重构第一部分,优化模块间的依赖关系,提升架构的清晰度与可维护性。
视频链接:点击观看
【AI小智系统】47-硬件程序-调用关系代码重构2
内容小结:调用关系重构第二部分,继续优化接口设计与依赖管理,应用设计模式提升代码质量。
视频链接:点击观看
【AI小智系统】48-硬件程序-调用关系代码重构3
内容小结:调用关系重构第三部分,完善事件驱动架构,优化异步处理与回调机制设计。
视频链接:点击观看
【AI小智系统】49-硬件程序-调用关系代码重构4
内容小结:调用关系重构第四部分,完成整体架构的最终优化,形成清晰的分层设计与模块边界。
视频链接:点击观看
【AI小智系统】50-硬件程序-当前硬件程序架构梳理
内容小结:全面梳理当前硬件程序的架构设计,总结各模块职责、接口定义、数据流向,建立完整的系统视图。
视频链接:点击观看
【AI小智系统】51-小智后端-结构优化(工厂模式准备)
内容小结:后端架构优化准备,分析现有结构问题,为引入工厂模式进行代码解耦与重构做准备。
视频链接:点击观看
【AI小智系统】52-小智后端-工厂模式实现
内容小结:在后端实现工厂模式,统一AI服务、语音服务、数据库等组件的创建与管理,提升架构灵活性。
视频链接:点击观看
【AI小智系统】53-小智后端-工厂模式实现2
内容小结:继续完善后端工厂模式实现,包括抽象工厂定义、具体工厂实现、产品族管理等高级特性。
视频链接:点击观看
【AI小智系统】54-小智后端-websocket服务器简单实现
内容小结:实现WebSocket服务器的基础功能,建立前后端实时通信通道,支持双向数据传输。
视频链接:点击观看
【AI小智系统】55-小智后端-日志标准化输出
内容小结:实现后端日志的标准化输出,包括日志级别、格式规范、输出目标配置,便于系统监控与问题排查。
视频链接:点击观看
【AI小智系统】56-小智后端-流程规范化
内容小结:规范后端处理流程,统一请求处理、错误处理、响应格式的标准,提升代码一致性与可维护性。
视频链接:点击观看
【AI小智系统】57-小智后端-websocket实现握手消息
内容小结:实现WebSocket握手消息处理,完成连接建立时的协议协商与初始参数交换。
视频链接:点击观看
【AI小智系统】58-小智后端-websocket实现消息路由处理
内容小结:实现WebSocket消息的路由分发机制,根据消息类型将请求分发到对应的处理模块。
视频链接:点击观看
【AI小智系统】59-小智后端-websocket接收文本消息回答后返回文本
内容小结:实现WebSocket接收文本消息、调用AI生成回答、返回文本结果的完整对话流程。
视频链接:点击观看
【AI小智系统】60-小智后端-websocket接收文本消息语音回答
内容小结:实现WebSocket接收文本消息后,以语音形式返回AI回答,完成文本到语音的转换输出。
视频链接:点击观看
【AI小智系统】61-小智后端-websocket接收音频数据
内容小结:实现WebSocket接收客户端上传的音频数据,建立音频流传输通道,支持实时语音交互。
视频链接:点击观看
【AI小智系统】62-小智后端-websocket优化音频接收完成后再识别
内容小结:优化音频接收流程,实现音频数据完整接收后再进行识别处理,提升识别准确率与稳定性。
视频链接:点击观看
以上是完整的114集AI小智系统硬件+后端从零开发教程Markdown格式整理,从Python基础、ESP32硬件开发到后端服务搭建,涵盖WebSocket通信、语音识别、语音合成、唤醒词、VAD等核心技术,手把手教你打造完整的AI语音交互系统。
回复