ESP32 / ESP32-S3 / ESP32-C3 / ESP32-S2 怎么选(型号对比)
- 看懂 ESP32 主流型号(原版/S3/C3/S2/C6)的核心差异
- 按你的项目类型(AI语音/摄像头/低成本/电池)选对芯片
- 知道买开发板还要看哪些参数(Flash/PSRAM/USB)
在某宝搜「ESP32」,结果一屏全是后缀:ESP32、ESP32-S3、ESP32-C3、ESP32-S2、ESP32-C6,价格从 9 块到 40 块不等,标题里还塞满了「WROOM」「WROVER」「N16R8」这种看不懂的编号。你刚跟着 AI 写完第一段点灯代码,信心满满想买块板子,结果卡在选型这一步——它们到底有啥区别?买错了会不会代码跑不起来?
先给一句定心丸:这几个型号都属于乐鑫(Espressif)的 ESP32 家族,用的是同一套开发框架(Arduino / ESP-IDF),同一套代码在大部分型号上能直接编译跑通。点灯、连 WiFi、读传感器这些基础操作,买哪款都行。型号差异主要体现在「能不能干重活」——比如跑 AI 语音、接摄像头、要不要省电、要不要便宜到能批量做产品。
这篇专门讲 ESP32 家族内部怎么挑。如果你还在纠结「该上 ESP32 还是 Arduino 还是树莓派」这种大类问题,去看 /guide/l1-board-choice/;那篇讲三大平台怎么分,这篇只钻进 ESP32 内部,把五个常见型号一个个拆开。
五个型号,逐个讲透
ESP32 原版——生态最全的通用首选
最老、卖得最久、资料最多的就是它。双核 240MHz,自带蓝牙经典(Classic BT)+ 低功耗蓝牙(BLE)+ WiFi,2.4G 全套通信都有。你在网上随便搜个教程、找个开源项目,十有八九用的就是原版 ESP32,遇到报错也最容易搜到答案。
它最大的优势不是性能,是生态。库最全、踩坑帖最多、AI 也最熟(你让 AI 写 ESP32 代码,它默认脑子里想的就是原版)。对纯学习、做毕设、跟教程的人来说,原版就是省心的代名词。
唯一要注意:原版没有原生 USB,烧录要靠板载的 CH340 / CP2102 串口芯片,这点在量产或调试 USB 设备时会有限制——但对学习完全无所谓。模组常见 WROOM(无 PSRAM)和 WROVER(带 PSRAM)两种,要接摄像头就得选 WROVER 或带 PSRAM 的版本。
价格档:约 15-25 元。
ESP32-S3——AI 语音和摄像头的主力
如果你冲着「做个能对话的 AI 小玩意」来的,直接看 S3。它是这家族里最适合跑 AI 的型号:
- 双核 + 向量指令扩展,专门优化了神经网络和语音处理的运算,跑关键词唤醒、本地语音识别这类轻量 AI 任务比原版快不少;
- 大容量 PSRAM(常见 N8R8 = 8MB Flash + 8MB PSRAM、N16R8 = 16MB Flash + 8MB PSRAM),跑大模型对接、缓存音频、处理图像都需要这块内存撑着;
- 原生 USB-OTG,可以直接当 USB 设备/主机用,烧录调试也更顺。
现在火爆的「小智 AI 聊天机器人」就是跑在 S3 上的(详见 /project/xiaozhi-overview/)。它接麦克风、喇叭,把语音传到云端大模型,再把回答读出来——这套流程对内存和算力都有要求,S3 是性价比最高的选择。要自己搞语音输入输出,I2S 接口怎么接麦克风和功放,看 /guide/l4-i2s-audio/。
价格档:约 20-35 元(带大 PSRAM 的偏贵)。
ESP32-C3——便宜小巧的低成本之王
C3 走的是「够用就好、便宜量产」路线。单核 RISC-V 架构、160MHz,只有 BLE(没有蓝牙经典)+ WiFi,体积小、功耗低、价格能压到很低。
它适合什么?做产品、批量铺货的简单联网设备——智能开关、温湿度上报、小型物联网节点。这类东西不需要双核也不需要跑 AI,C3 的成本优势直接拉满,几块钱一颗的模组很常见。它也有原生 USB,烧录方便。
要注意两点:一是只有 BLE,没有蓝牙经典(连不了传统蓝牙音箱、蓝牙串口那种老设备);二是单核,跑复杂多任务会比双核吃力。但对「联网+上报数据」这种典型 IoT 场景,单核完全够用。
价格档:约 9-18 元,是这几款里最便宜的。
ESP32-S2——有 USB 但没蓝牙的偏门款
S2 比较尴尬:单核、有原生 USB、只有 WiFi、完全没有蓝牙。当年是为了补 USB 功能出的,但后来 S3 和 C3 都带了 USB,还各有所长,S2 就被夹在中间,存在感越来越弱。
什么时候会用到它?项目明确不需要蓝牙、想要 USB、又想比 S3 省点钱的时候。但说实话,新手没必要专门挑 S2——除非有现成项目指定用它,否则在原版、S3、C3 里选就够了。
价格档:约 15-25 元。
ESP32-C6——面向 Matter 智能家居的新生代
C6 是较新的型号,亮点在通信:带 WiFi 6(802.11ax)+ BLE + IEEE 802.15.4(Thread / Zigbee)。前面那串的意思是——它能直接接入 Matter 智能家居生态。
Matter 是苹果、谷歌、亚马逊联合推的智能家居统一标准,底层用 Thread 组网。如果你想做能被 HomeKit / 米家 / Google Home 直接识别的智能设备,C6 是目前 ESP32 家族里最对口的。它也是单核 RISC-V,性能定位偏中端,重点不在算力而在「连得进智能家居网络」。
价格档:约 18-30 元,比 C3 贵一截,但换来 Thread/Zigbee 能力。
一张表对号入座
| 型号 | 核心 | 蓝牙 | AI 能力 | 原生 USB | 典型用途 | 价格档 |
|---|---|---|---|---|---|---|
| ESP32 原版 | 双核 Xtensa | 经典 + BLE | 一般 | 无 | 通用学习、跟教程、毕设 | 15-25 元 |
| ESP32-S3 | 双核 + 向量指令 | BLE | 强(语音/图像) | 有 | AI 语音、摄像头、小智 | 20-35 元 |
| ESP32-C3 | 单核 RISC-V | 仅 BLE | 弱 | 有 | 低成本联网、IoT 量产 | 9-18 元 |
| ESP32-S2 | 单核 Xtensa | 无 | 弱 | 有 | 要 USB 不要蓝牙的偏门场景 | 15-25 元 |
| ESP32-C6 | 单核 RISC-V | BLE | 弱 | 有 | Matter / Thread 智能家居 | 18-30 元 |
选型决策路径
不想看表,就照这条路走,三秒定型号:
- 做 AI 语音 / 对话机器人(小智那类)→ 选 S3,要带大 PSRAM 的(N16R8 或 N8R8)。
- 做低成本联网设备、想量产 → 选 C3,便宜小巧够用。
- 纯学习、跟教程、做毕设 → 选原版,资料最全最不容易卡。
- 做 Matter 智能家居、要接入米家/HomeKit → 选 C6,看中它的 Thread/Zigbee。
- 要接摄像头做图像 → 选 ESP32(WROVER 带 PSRAM)或 S3,没 PSRAM 跑不了摄像头缓存。摄像头怎么接看 /guide/l4-esp32cam/。
90% 的新手项目,落点不是 S3 就是原版。先别纠结,按主要需求选一款下单,跑通一个项目比纠结半天有意义。
买开发板还要看这三个参数
选定型号只是第一步,同一个型号还有不同配置,下单前再扫一眼这三项:
1. Flash 容量(4 / 8 / 16MB)。 Flash 存你的程序代码和文件。点灯、连 WiFi 这种小程序 4MB 够;但要跑 AI、存网页界面、放音频文件,至少 8MB,跑小智建议 16MB。编号里的「N16」就是 16MB Flash。
2. 有没有 PSRAM。 PSRAM 是额外的运行内存,平时不用,但接摄像头、跑 AI、处理大块数据时是刚需。原版要选 WROVER 模组才有;S3 看编号「R8」就是带 8MB PSRAM。没 PSRAM 的板子接摄像头会直接报内存不足。
3. USB 口类型。 现在的板子多是 Type-C,老板子还有 Micro-USB。另外注意板上是「原生 USB」还是「串口芯片转的 USB」——S3/C3/S2/C6 有原生 USB,原版是靠 CH340/CP2102 转的。对学习没区别,但做 USB 设备项目要分清。
一句话记法:编号里 N 后面的数字是 Flash(MB),R 后面的数字是 PSRAM(MB)。看到 N16R8,就知道是 16MB Flash + 8MB PSRAM 的高配,适合跑 AI。想搞清这些片上资源到底是干嘛的,可以补一下 /guide/l1-what-is-mcu/。
用 AI 辅助选型,但参数一定自核
选型这事特别适合丢给 AI:把你的需求(「我想做个能语音对话的桌面摆件,预算 30 以内」)描述清楚,让 AI 给你推荐型号和理由。它对 ESP32 家族很熟,给的方向通常靠谱。
但有个坑必须防:AI 给的具体参数和价格经常过时或张冠李戴。比如它可能把某型号的 PSRAM 容量说错,或者推荐一个已经停产的模组。乐鑫的型号更新很快,AI 训练数据未必跟得上。
正确姿势是:让 AI 帮你缩小范围、解释取舍,但最终的 Flash/PSRAM/价格/库支持,自己去乐鑫官网或商品页核一遍。这套「AI 出方案、人核事实」的工作流,专门有篇讲怎么落地:/article/aiwf-fact-check/。选型买错一块板子事小,养成「AI 说的硬件参数必复核」的习惯,后面避免的坑事大。
常见误区表
| 误区 | 真相 |
|---|---|
| 「S3 最贵所以最好,闭眼买 S3」 | 不做 AI/摄像头,S3 的性能用不上,纯浪费钱。简单联网 C3 更划算。 |
| 「C3 便宜,拿来跑小智 AI」 | 单核+无 PSRAM,跑不动语音 AI,会卡死或编译报内存错。 |
| 「随便买个 ESP32 就能接摄像头」 | 没 PSRAM 接不了摄像头,必须选 WROVER 或带 R8 的型号。 |
| 「型号不同代码要重写」 | 大部分代码通用,换型号一般只改引脚定义和编译目标,不用重写。 |
| 「C6 性能强(因为型号新)」 | C6 是单核,强在 WiFi6 和 Thread 组网,算力不如双核 S3。 |
| 「Flash 越大跑得越快」 | Flash 是存储不是算力,影响能装多少东西,不影响运行速度。 |
动手挑战
别光看,落到自己的项目上:
- 用一句话写下你想做的东西(例:「一个能查天气并语音播报的小盒子」)。
- 按上面的决策路径,写出你该买哪个型号。
- 写出三个配置参数:Flash 多大、要不要 PSRAM、USB 什么口。
- 写一句为什么选它的理由(例:「要语音播报所以选 S3,要存音频和界面所以 16MB Flash,跑 AI 所以要 8MB PSRAM」)。
写完这四条,你就有了一份能直接拿去下单的选型单。如果卡在第 2 步,回去看决策路径那段对号入座。
小结
ESP32 家族选型,记住三个落点就够:通用学习选原版、AI 语音选 S3、低成本量产选 C3,智能家居补 C6、特殊场景才碰 S2。下单前再核 Flash / PSRAM / USB 三项,看懂 N16R8 这种编号。
型号定了,接下来就是动手。想看从零到上手的完整路线,回到 /roadmap/ 找你当前阶段;想系统补开发板和平台的基础知识,从 /guide/l1-board-choice/ 开始。选型不是终点,跑通第一个项目才是。