量产测试与老化:怎么保证出厂的每一台都能用
- 看懂产线逐台要测哪些项(功能 / 电流 / 射频 / 外设自检),以及产测固件和工装是干嘛的
- 知道老化测试(burn-in)为什么要做、几种做法、时长怎么和成本权衡
- 看懂直通率 / 良率怎么统计、不良怎么分类、失效分析怎么反哺设计
- 知道哪些环节该找第三方(测试、老化房、产测治具厂),心里有张对接地图
你的样机在桌上跑了一个月,稳得很。于是你下了第一批 500 台的单,板子焊好回来,你随手抽了几台一插——有两台死活连不上 WiFi,有一台一上电就烫,还有一台射频弱得离两米就掉线。你慌了:剩下 490 多台里,到底还藏着多少颗雷?
这就是量产和打样最大的区别。打样阶段你关心的是「这个设计能不能跑」,量产阶段你关心的是「这一批 500 台里,怎么保证发出去的每一台都能跑」。 这两件事用的方法、花的钱、要碰的服务商,完全是两回事。
逐台测、用老化筛掉早期会坏的、统计良率反过来追不良——这套东西连起来,就是「规模量产质量」这道坎。这一节不教代码(量产是一套流程,不是一段 sketch),而是把这片地图画给你看:产线下线每台要测什么、老化怎么做、良率怎么统计、哪几步该花钱找人。
为什么样机能跑,量产还要逐台测
新手最容易犯的错,是拿样机的表现去推断整批的命运。「我那台跑得好好的,工厂照着做 500 台,能差到哪去?」——会差很多,而且差在你看不见的地方。
同一份设计、同一批料、同一条产线,出来的板子也不会完全一样。差异藏在这几处:
- 焊接:自动贴片也有概率出虚焊、连锡、立碑(元件一头翘起)。500 台里出几台焊接缺陷是常态,不是意外。
- 元件:同一卷电阻电容里也有个体差异,偶尔混进一颗超规甚至坏件;芯片批次之间也可能有细微不同。
- 来料与板厂波动:PCB 本身、连接器、外壳,每一项都有自己的不良率,叠加起来就放大了。
所以**「设计验证 OK」和「这一台 OK」是两个独立的问题**。设计验证你在打样阶段做完了;这一台 OK,只能靠下线时逐台实测来保证——这就是产测(产线测试)存在的全部理由:把焊坏的、料坏的、装错的,在出厂前一台一台地筛出来。
本节给的所有测试项、判据、老化参数、良率数字,都是帮你建立概念的「指路牌」,不是可以照抄执行的产测规范。产测项怎么设、判据卡多少、老化多久,强烈依赖你的具体产品、品类、目标市场和合规要求,且常随设计迭代而变。任何涉及通断电、射频发射、锂电池老化的实际方案,请以你产品的实际工况、设备厂商手册,以及有资质的检测/可靠性服务商针对你产品的实测口径为准——本文不构成产测或可靠性测试建议。涉及投入与风险的判断,先读一遍 免责声明。
产测:每台下线要测哪几项
产测的核心思想就一句话:给每台板子跑一套固定的「体检」,结果只有 PASS / FAIL 两种,FAIL 的不许往下走。 至于体检测哪几项,按你的产品裁剪,但常见的就这么几大类:
功能测试:核心功能跑一遍
把产品「最该工作的那件事」自动跑一遍。温湿度计就读一次温湿度、看值合不合理;能联网的就连一次测试热点、回报成功;带屏的就点亮跑一屏自检图案。目的是抓「整体不工作」的硬伤——程序没烧进去、主芯片没起来、关键外设没焊上,这类一测就露馅。
电流 / 功耗测试:抓虚焊与短路的利器
这一项常被新手忽略,其实性价比极高。给板子上电,量它的电流:
- 静态电流明显偏大 → 大概率有短路、连锡,或某颗元件装反。
- 静态电流为零或偏小 → 可能根本没上电、电源没焊通。
- 工作电流异常 → 某个模块没正常进入工作状态。
电流是个特别诚实的指标,很多焊接和元件问题,肉眼看不出、功能测试也未必触发,但电流一量就异常。在产测里加一道电流窗口判据(落在 X~Y 区间才算 PASS),能拦下相当一部分隐患。具体的电流窗口要按你的设计实测标定,别套别人产品的数。
射频测试:带无线的躲不过
只要你的产品带 WiFi / 蓝牙 / 2.4G(ESP32-S3 这类主控天然带),就多一道射频测试:测发射功率、频率偏移有没有跑偏。射频不良往往不是「完全不通」,而是「能连但信号弱、距离短、偶尔掉线」——这种最难靠功能测试抓,因为在产线一米内它「看起来能用」。
射频测试通常要专门的仪器(综测仪等),或者用射频耦合的方式把信号引到测试设备。这一项门槛较高,很多团队会外包给有射频测试能力的产测服务商或实验室,不自己硬上。具体测哪些指标、判据卡多少,以你模组厂商手册和检测机构口径为准。
外设自检:把接口挨个点一遍
按键、传感器、接口、指示灯——凡是会单独焊坏的外设,都该在产测里被点到一次。能自动测的自动测(比如读传感器 ID 确认通信正常),实在要人工的(比如按一下按键、看一眼灯)就排进作业指导书,让产线工人按步骤确认。
产测固件 + 工装:让产线工人一键测
上面这些不可能让工人拿万用表一项项量——靠的是产测固件和**产测工装(治具)**这套组合:
- 产测固件:一套专门用于测试的固件(和量产正式固件不同),上电后自动把上面几项跑一遍,把结果判成 PASS / FAIL 直接显示。理想状态是工人把板子往治具上一卡、按一下、看灯/看屏,绿了过、红了挑出来。
- 产测工装/治具:把板子的测试点、接口、供电、按键一次性接触上的夹具(行话「针床」「飞针」),让一次接触就能测完所有点。治具是量产效率和一致性的关键,本身也是一门手艺。
产测固件的思路,粗看就是一段「上电 → 自检各项 → 汇总判定 → 输出结果」的逻辑:
// 产测固件的骨架思路(示意,不是可直接用的产测程序)
// 真实产测固件需结合你的治具接线、判据、上位机协议来写
void factory_test_main(void) {
bool pass = true;
pass &= test_power_current(); // 量静态/工作电流是否落在标定窗口
pass &= test_core_function(); // 核心功能跑一遍(读传感器/点屏/...)
pass &= test_peripherals(); // 外设挨个自检(按键/接口/灯)
pass &= test_rf(); // 带无线则测发射功率/频偏(常需仪器)
report_result(pass); // 输出 PASS/FAIL,亮绿/红灯或回报上位机
}
这段只是让你看清产测固件「长什么样」——一条龙跑完、汇总成一个 PASS/FAIL。真要落地,电流判据要实测标定、射频要接仪器、治具接线和上位机协议都得对着你的产品定。产测固件和治具的工程细节,见 量产测试治具 那一节专门展开。
老化测试:让会坏的在出厂前坏掉
逐台产测能筛掉「现在就不工作」的,但筛不掉一类更阴险的货:现在能用、装到用户手里没几天就坏的。这就要靠老化测试(burn-in)。
为什么要老化:浴盆曲线的前段
电子产品的失效率随时间画出来,是一条像浴盆的曲线(bathtub curve):一头一尾高、中间低。
- 早期失效(浴盆的前段陡坡):出厂头几天到几周内坏的,多半是先天缺陷——焊接微裂、元件个体弱、来料隐患。这部分坏件占比不高,但全砸在用户手里,退货、差评、维修成本极重。
- 偶发失效(浴盆中段平底):正常使用期,失效率低而平稳。
- 损耗失效(浴盆末段上翘):用了很久之后元件自然老化,这是寿命问题,不是质量问题。
老化测试的全部目的,就是用一段加严的通电运行,把「早期失效」这段提前在工厂里跑完——会在头几天坏的,让它在你的老化房里坏,而不是在用户家里坏。挑出来报废或返修,剩下的就跨过了那道陡坡,进入平稳期再出厂。
几种常见做法
- 长时间通电老化:让板子通电连续运行一段时间(行话「跑机」),期间持续或定时自检。最朴素,但能逼出一部分早期失效。
- 高低温循环:在温箱里反复升温降温,用热胀冷缩去逼焊点微裂、虚焊这类对温度敏感的缺陷现形。
- 带载老化:让产品在接近真实工况(甚至加严)的负载下运行,更贴近用户实际使用。
具体用哪几种、温度区间多少、循环多少次,强依赖你的品类和目标市场,必须以你产品的工况和可靠性服务商的方案为准——尤其涉及锂电池的老化,温度和充放电控制有专门的安全规范,别自己拍脑袋设参数。
时长 vs 成本:这是个权衡,不是越久越好
老化最大的纠结是时长。老化时间越长,越能逼出早期失效,但代价实打实:
| 老化时长 | 能逼出的早期失效 | 代价 |
|---|---|---|
| 几乎不老化 | 几乎逼不出,全靠用户「帮你老化」 | 早期失效全变退货/差评 |
| 短时通电(几小时) | 逼出一部分明显的 | 占产线/老化位时间、增加成本 |
| 长时+温循 | 逼出更多,更接近浴盆陡坡跑完 | 设备、电费、场地、时间成本显著上升 |
上表只是帮你理解「时长和效果、成本三者要权衡」这件事,绝不是叫你照某一档去设。老化方案没有放之四海的标准答案,它取决于你的产品可靠性要求、品类、成本结构和市场。带锂电池、带发热件的产品老化,请务必交给有资质的可靠性测试服务商按你的产品制定方案,数值以其实测口径为准。
老化的隐性好处常被忽略:它顺手也能再抓一批产测漏掉的早期问题,相当于给质量上了第二道保险。
良率与不良分析:把坏的变成改设计的依据
产测和老化把坏的挑出来了,但如果你只是「挑出来扔掉」,那等于白白浪费了最值钱的信息。每一台 FAIL 的板子,都是在告诉你设计或产线哪里有问题。
几个该盯的数字
- 直通率(FPY, First Pass Yield):第一次过产测就 PASS 的比例。这是最该盯的指标——它直接反映你的设计可制造性和产线稳定度。
- 良率 / 不良率:经过返修后最终合格的比例 / 报废比例。
- 老化失效率:老化阶段坏掉的比例,反映早期失效的严重程度。
举个统计示意(数字仅为说明算法,不代表任何真实产品的预期):500 台下线,产测一次过 470 台 → 直通率 94%;FAIL 的 30 台返修救回 22 台、报废 8 台 → 最终良率 (470+22)/500 ≈ 98.4%。重点不是这两个数本身,而是你能不能算出来、并且持续盯着它的趋势。
上面这组数纯属演示「直通率/良率怎么算」,不是任何产品的实际良率预期。新产品首批小批量良率普遍偏低、随迭代逐步爬升是行业常见现象,但具体能到多少、爬多快,因产品、产线、团队而异——没有任何一篇文章能替你预测你产品的良率。任何「照我做就能到 X% 良率」的说法,都该让你警惕。
不良分类:坏在哪比坏了多少更重要
把 FAIL 的板子按原因归类,通常逃不出三大类:
| 不良大类 | 典型表现 | 该追到哪 |
|---|---|---|
| 工艺/焊接 | 虚焊、连锡、立碑、漏件 | 产线 SMT 工艺、炉温、钢网 |
| 物料 | 元件本身坏、超规、上错料 | 来料检验、供应商、BOM |
| 设计 | 某个位置反复同样地坏、对工艺太敏感 | 你的原理图/PCB,要改设计 |
最该警惕的是第三类:如果某个不良在很多台上重复出现、总是同一个位置同一种坏法,那十有八九不是工人手抖,而是你的设计本身有问题(布局太挤、判据太苛、对某种工艺偏差没余量)。
FA:让坏板子反哺设计
对那些查不清、或反复出现的不良,做失效分析(FA, Failure Analysis)——把坏的板子拆开/切片/上仪器,查到底是哪一颗、哪一处、为什么坏。FA 的结论不是为了甩锅,而是反过来改你的设计或产线参数,让下一批的直通率往上走。
这就形成了量产质量的闭环:产测+老化挑出坏的 → 统计良率看趋势 → 不良分类找规律 → FA 查根因 → 改设计/调产线 → 下一批更好。一次性的产测只是筛子,这个闭环才是让良率真正爬升的引擎。 这一点很多新手完全没意识到——他们把不良当垃圾扔了,而不是当数据用。
这些环节,该找谁:服务商对接地图
量产质量这摊事,没必要也不可能全自己扛。哪些自己做、哪些外包,心里要有张地图:
| 环节 | 自己做还是外包 | 找谁 / 怎么对接 |
|---|---|---|
| 产测固件 | 通常自己写(最懂自己产品) | 你或外协固件工程师;治具厂可协助对接 |
| 产测治具 | 多数外包 | 专业产测治具厂,把测试点/接口给他们定制(详见 测试治具) |
| 产线产测执行 | 跟工厂谈 | 代工厂(EMS)产线;在合同里写清产测标准与判据 |
| 老化(长时/温循) | 多数外包或租用 | 第三方老化房/可靠性实验室,或工厂自有老化区 |
| 射频/合规测试 | 几乎必外包 | 有资质的第三方检测机构(与 合规认证 联动) |
| 失效分析 FA | 视情况外包 | 检测机构或有 FA 能力的实验室 |
对接这些服务商时,有几条经验值得提前知道:
- 把产测标准写进代工合同。别只口头说「测一下」——测哪几项、判据卡多少、FAIL 怎么处理、良率怎么报,都该白纸黑字写清,否则扯皮没完。
- 治具要趁早。治具设计、打样、调试要时间,等板子回来才想起做治具,整个量产节奏会被拖。
- 老化和合规测试可能要排期。第三方实验室、老化房不是随到随做,提前问周期。
- 国内打样/小批量代工和治具资源,可以从 嘉立创 这类平台起步了解;射频与可靠性这类需资质的测试,以你联系的检测机构(如 Intertek 这类第三方)针对你产品的口径为准。
避坑:量产质量上最容易栽的几个跟头
- 拿样机良率推全批:「我那台好好的」推不出「500 台都好」,详见上文。逐台测不是麻烦,是底线。
- 只做功能测试、不量电流:电流测试成本极低、抓虚焊短路极准,漏掉它等于白瞎一个最好用的探针。
- 完全不老化:省下老化的钱和时间,早期失效就全砸用户手里变退货差评,算总账往往更贵。但老化方案务必交给有资质服务商定,别自己拍参数——尤其带电池/发热件。
- 把坏板子当垃圾扔:不分类、不做 FA,等于把最值钱的改进依据扔了。良率永远爬不上去的团队,多半都在这里偷懒。
- 产测标准没写进合同:口头约定,量产时必扯皮。判据、流程、责任,落到纸面。
- 治具临时抱佛脚:板子都回来了才做治具,产线干等。治具与产测固件应和量产排程并行准备。
动手挑战
这一节没有代码可跑,但有一份现在就能列、只有你能列的功课:
- 给你的产品列一张产测项清单:核心功能测哪一项?要不要量电流(几乎都该量)?带不带无线、要不要射频测试?有哪些外设要点一遍?把它写成一张「下线每台要过的体检表」。
- 画一遍你的质量闭环:产测筛出坏的 → 怎么统计良率 → 怎么分类不良 → 怎么把结论喂回设计。哪怕首批就 50 台,这个闭环也该跑起来。
- 列出你要对接的服务商:治具找谁、老化在哪做、射频/合规测试找哪家。对照上面的地图,把空格填上,标出哪些要提前排期。
做完这三件,你对「量产质量这道坎到底要干什么」就从「抽几台试试」的侥幸,变成一套能推进的方案。
小结 · 下一步
- 样机能跑 ≠ 量产每台能跑:焊接、物料、来料都有波动,所以必须逐台产测——功能 / 电流 / 射频 / 外设自检,用产测固件+治具一键测出 PASS/FAIL。
- 老化(burn-in)筛早期失效:照着浴盆曲线,把会在头几天坏的提前在工厂跑出来;长时通电、温循、带载几种做法,时长是和成本的权衡,方案交给有资质服务商定,别自己拍参数。
- 良率不是用来看的,是用来改的:盯直通率,把不良分成工艺/物料/设计三类,对反复出现的做 FA,反哺设计——这个闭环才是良率爬升的引擎。
- 服务商地图:产测固件自己写、治具/老化/射频测试多外包,产测标准写进代工合同,治具与排期趁早。
- 本文所有测试项、参数、良率数字都是概念地图,不是可照抄的规范;真正要测什么、卡多少、老化多久,以你产品工况和有资质服务商的实测口径为准——本文不构成产测/可靠性建议。
下一步:产测离不开治具,治具怎么设计、怎么和产测固件配合,看 量产测试治具;测试老化只是规模量产的一环,整条量产线还有备料、产线、品控,回 L5 产品化全景 看清这一关的位置,或回 总路线图 看全局。涉及通断电、射频、锂电池老化与任何投入风险的判断,务必先读一遍 免责声明。