第1425集:新机遇成果再验(1/1)

刘好仃早上六点四十就到了车间,比平时早了二十分钟。他没去打卡机那儿露脸,直接拐进角落的操作间,工装外套还没完全扣好,手里 already 捧着那个磨了边的U盘。

小李正蹲在旧电脑前换电源线,听见动静扭头:“刘哥,你这比闹钟还准。”

“不是我准,是活儿催人。”刘好仃把U盘往桌上一拍,“昨天那五张图,尤其是最后一张自爆片,得拉出来单练。咱们不能光看它对了一次就乐呵,得看它能不能次次都对。”

老张端着搪瓷缸子进来,听见这话,吹了口热气:“你这是要给AI搞‘体能测试’?”

“差不多。”刘好仃拉开椅子坐下,“人上岗要体检,机器上线也得过筛子。咱们现在这套流程——三通道增强、反例归档、自动预处理,听着挺全乎,可它到底稳不稳,得拿真家伙试。”

小李插上U盘,打开文件夹,那张边缘发暗的报废图立刻弹了出来,灰蒙蒙的一片,像蒙了层雾。

“就它当考官?”小李点了点屏幕,“它自己都快看不清,还能考别人?”

“正因为它难,才要考。”刘好仃指着图,“产线上哪天不碰上这种拍得糊、光打得偏的?咱们不能光拿标准图喂它,得让它学会在泥地里走路。”

老张把缸子搁在一边,凑近看:“那你打算怎么测?”

“三原则。”刘好仃竖起三根手指,“第一,缺陷类型全覆盖,裂纹、气泡、杂质、划痕,一个不落;第二,模拟不同光照条件,高光刺眼、侧光拉影、背光藏形,全得试一遍;第三,加点‘人为干扰’——拍虚了的、手抖的、对焦不准的,也扔进去,看它扛不扛得住。”

小李眨眨眼:“你是想让它成‘全能选手’?”

“不是想,是必须。”刘好仃打开测试日志模板,“咱们的目标不是让它在实验室里拿满分,是让它在真实车间里不掉链子。”

老张点点头:“有道理。但你这测试量不小,样本够吗?”

“不够就造。”刘好仃调出历史库,“我昨晚翻了三年内的报废记录,挑出四十七张边缘可疑但标注模糊的图,全导入‘压力测试池’。再加上质检组新拍的五张,凑够五十二张,够它忙一上午。”

小李敲着键盘建目录:“要不要分批?一次全上,怕它崩。”

“分三轮。”刘好仃说,“第一轮,纯增强图,看基础识别力;第二轮,加模糊、抖动、低对比,看抗干扰;第三轮,混入易混淆案例,比如气泡挨着裂纹、杂质藏在反光里,看它会不会乱点鸳鸯谱。”

老张掏出小本子记下流程,忽然问:“那万一它中间卡了呢?比如算不动,或者标错了?”

“卡了就停,错了就记。”刘好仃点开反例归档路径,“每一轮测试,只要出问题,立刻截留,打标‘待复核’,回头一张张拆开看。问题不是终点,是下一次的起点。”

小李启动第一轮测试,五十二张图开始排队加载。屏幕右下角跳出进度条,GPU占用率缓缓爬升。

“开始了。”小李说。

“别光看结果。”刘好仃盯着日志窗口,“重点看它怎么想——中间层输出、特征激活区域、响应时间,全都记下来。咱们不只要知道它对不对,还得知道它为什么这么判。”

老张看着跳动的数据,嘀咕:“这阵仗,比我们当年考技师还严。”

“那当然。”刘好仃笑了笑,“技师错了,顶多返工;它要是学歪了,整个流程都得重来。”

第一轮测试跑了四十分钟,结束时识别率显示71.3%,三张漏判,两张误判。

“还行。”小李松了口气。

“不急着下结论。”刘好仃调出那三张漏判图,“看看它卡在哪儿。”

其中一张是连续微裂,裂纹细得像针尖划过,分布在玻璃边缘的应力集中区。模型在三通道增强后,GPU内存瞬间飙到94%,响应延迟0.83秒,最终判定失败。

“内存溢出?”小李皱眉。

“不是溢出,是冗余。”刘好仃放大计算日志,“三通道融合时,梯度增强做了三次重复卷积,算力浪费了。它不是算不动,是被自己绕晕了。”

老张盯着图看了一会儿,忽然说:“要不,先单通道测?高光、侧光、背光分开跑,看哪个最管用,再决定要不要合。”

“分段验证。”刘好仃眼睛一亮,“好主意。别一股脑全上,先拆开看。”

第二轮测试调整方案,三类光源增强图分别独立输入。结果显示,侧光增强对微裂识别贡献最大,准确率提升12%,响应时间回落至0.5秒以内。

“找到主心骨了。”小李重新写脚本,把侧光通道设为优先处理路径。

第三轮测试加入干扰项:十张人为拍虚的图、八张低对比度图、五张气泡与裂纹相邻的混淆图。

测试进行到第十六张,那张曾被AI提前预警的“自爆片”再次出现。

“来了。”小李放慢语速。

第一遍运行,红框精准压在边缘暗区,判定A类裂纹。

第二遍,同样结果。

第三遍,进度条走到85%,红框闪了一下,随即消失,系统标注“无缺陷”。

“漏了?”老张凑近屏幕,“刚才还对的好好的。”

刘好仃没动,调出三次运行的中间层特征图。第一、二次,边缘梯度变化被明显激活;第三次,同一区域的神经响应强度下降了近四成。

“它不是看不见,是信心不足。”刘好仃指着数据,“同样的图,三次输入,输出不一致,说明模型对这类边缘特征的判断还不够稳定。”

小李盯着屏幕:“那怎么办?重训?”

“不急。”刘好仃新建一个比对窗口,“咱们加一道保险——双轨并行。原始图走一遍,增强图走一遍,只有两边都触发警报,才算最终判定。”

“相当于双重确认?”老张问。

“对。”刘好仃点头,“宁可慢一点,也不能让漏判溜过去。尤其是这种自爆前兆,早发现一分钟,就能少一块报废。”

小李立刻改逻辑,设置双轨判定条件。重新跑那张自爆片,三次测试全部标出裂纹,响应时间平均0.61秒,无漏判。

“稳了。”小李长出一口气。

“暂时稳了。”刘好仃保存测试日志,“但这五十二张只是开始。产线上每天出上百块玻璃,咱们得让它适应更多面孔。”

老张合上本子:“要不,从明天起,把所有新报废的边角料图,不管清不清楚,全塞进测试池?”

“正有此意。”刘好仃把最终日志打包,存进U盘,“咱们不靠运气,靠积累。每一张图都是它的老师,每一次错误都是它的台阶。”

小李看着屏幕上密密麻麻的日志记录,忽然问:“你说……它什么时候能自己发现问题,不用咱们一次次教?”