第1429集:再评改进优化效(1/1)
刘好仃把茶杯往桌上一搁,水纹晃了三晃才停。小李正往系统里导数据,老张坐在旁边,手里捏着张打印出来的图表,眉头松了半截。
“昨儿那张#001,我翻了三遍日志。”刘好仃开口,“三次运行,两次报警一次漏,系统记了预警,留了痕,流程走通了。”
小李头也不抬:“不止那张。从昨天下午一点四十七分起,新规则上线,一共捕获了十三次识别分歧,全进了模糊库。人工复核后,八次确认是高风险,五次是误扰。”
老张把图表推过去:“你看这儿,改进前,AI对边缘裂的漏检,差不多三成。现在回测七天数据,同样的图,漏的只剩九个点。”
“不是运气。”小李调出对比图,“我们补了二百一十七张标注图,全是带气泡、磨砂干扰的边缘裂。模型现在见得多,心里有数了。”
刘好仃凑近屏幕:“以前是看一眼就下结论,现在是犹豫了,反而对了路。”
“犹豫是好事。”小李笑了,“以前它瞎自信,现在知道哪块儿虚,先喊人。”
老张哼了一声:“我倒不怕它犹豫,就怕它以后光喊人,自己不动脑。”
“它本来就不该动脑。”刘好仃说,“它干的是‘筛’,咱们干的是‘判’。筛子眼细了,活儿才轻。”
小李把两组数据并排打开。左边是改进前的测试记录,红色警报密密麻麻,像被戳了一排洞的纸;右边是启用新规则后的结果,警报少了,但每一条都带着“已标记”“已归档”“已复核”的戳。
“漏检率从31%压到9%,提升明显。”小李指着曲线,“更关键的是,分歧预警率从18%涨到44%。说明系统对模糊案例更敏感了,风险提前暴露,不是藏起来。”
老张盯着那根上扬的黄线,看了足足半分钟,才点头:“这数,站得住。”
“不止数。”刘好仃拉开抽屉,取出一个硬皮本,翻开,“这是我昨天下车间记的。B线今天上午跑了四百块玻璃,AI自动放行三百一十二块,剩下八十八块进了复核区。老张带人看了一个多小时,最终挑出七块真问题,全是边缘微裂,两块还带自爆前兆。”
他合上本子:“零漏。”
老张没说话,伸手摸了摸显示器边框,像是在确认什么还在原位。
“咱们得写个东西。”刘好仃说,“不能光靠嘴说稳了。”
小李立刻新建文档,标题打了一半,又删掉,重新输入:“边缘缺陷识别优化效果评估报告”。
“第一条写清楚。”老张说,“不是系统替人做决定,是帮人把眼睛擦亮。”
“记上了。”小李敲字,“‘预警机制不替代人工终审,所有高风险案例须经三人会审确认’。”
刘好仃靠在椅背上:“还得把数据列全。改进前漏检率、改进后漏检率、预警触发频次、人工修正比例,一条不落。”
“要不要加个备注?”小李问,“说明这些数据基于过去七天137张模糊案例的回测结果,样本覆盖典型干扰场景三类,光照条件四种。”
“加。”刘好仃点头,“让人挑不出刺。”
老张忽然起身,走到白板前,拿起笔,在“判定可靠性”那行字下面,画了条横线,写下:“经验证,当前方案可防漏、可追溯、可复制。”
他放下笔:“这三条,够用了。”
小李把报告拉到最后,插入三人电子签名区。鼠标悬在“保存”按钮上,回头问:“真这么交?”
“不然呢?”刘好仃说,“干了这么多天,总不能最后自己不信。”
小李点了保存。文件版本跳成V1.0,时间戳定格在十四点零七分。
“发出去?”小李问。
“先不急。”刘好仃摇头,“等我们自己再过一遍。数据不能只看结果,还得看过程。”
小李立刻调出日志后台。系统记录显示,每一张进入模糊库的图像,都有完整的操作轨迹:谁触发、哪次运行出现分歧、置信度变化、最终归档路径。
“你看这张。”刘好仃指着一条记录,“早上九点十八分,同一张图连续三次输入,第一次判裂纹,第二次判划痕,第三次建议复核。系统没放行,直接标黄进库。十分钟后,老张登录,确认高危,打标,归档。”
“全程七分钟。”小李说,“比人工全检快一半。”
“关键是,它知道自己拿不准。”刘好仃说,“以前是硬判,现在是认怂。认怂比硬扛靠谱。”
老张忽然笑了:“我带徒弟那会儿,总说‘看不出就别瞎说’。现在倒好,教AI学会闭嘴了。”
“它不是闭嘴。”小李纠正,“是学会举手了。”
三人静了片刻。报告静静躺在共享目录里,标题清晰,数据完整,结论明确。
“接下来呢?”小李问。
“再跑三天。”刘好仃说,“看看数据是不是还能稳住。如果连续七十二小时预警率不掉,漏检率不反弹,咱们就真能松口气。”
小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!
老张站起身,拍了拍裤子:“我去车间转转。看看人跟机器,配合得顺不顺。”
门关上后,小李低声问:“您真觉得它现在‘敢下嘴’了?”
刘好仃没直接回答,而是调出#001号图的最新一次测试记录。同一张边缘带泡的裂纹图,三次运行结果如下:
第一次:“检测到边缘微裂,置信度81%。”
第二次:“检测到边缘微裂,置信度79%。”
第三次:“检测到边缘微裂,置信度83%,建议人工复核。”
系统没有放行,但也没有犹豫。三次结果高度一致,只是依然选择上报。
刘好仃指着屏幕:“它现在不是不敢下嘴,是知道嘴下的是大事,得喊人一起看。”
小李点点头,正要说话,刘好仃忽然抬手。
“等等。”
他放大第三次运行的热力图。模型聚焦的区域,和人工标注的裂纹走向几乎完全重合,但在裂纹末端,有一小块区域,颜色略浅。
“这儿。”刘好仃用笔尖点着,“它盯得准,但尾端信心不足。”
小李立刻调出参数记录:“最后一次训练,边缘断裂样本只加了三十七张,其中带末端分叉的,只有八张。”
“不够。”刘好仃说,“它认得清开头,但对‘收尾’还不熟。”
“那怎么办?”
“再补数据。”刘好仃合上显示器,“让老张翻翻老图库,专找那种裂到一半突然分叉的,我们再喂它一顿。”
小李打开新文件夹,命名:“边缘断裂末端专项训练集——待采集”。
刘好仃起身,走到窗边。楼下B线的传送带正匀速前进,机械臂精准抓取,检测灯绿光频闪。每一块玻璃通过时,系统都会快速扫描,大多数直接放行,少数被拦下,贴上黄标,送往复核台。
一个质检员拿起放大镜,对着一块玻璃边缘看了几秒,点头,挥手放行。
刘好仃看了会儿,转身说:“不是机器变聪明了,是咱们让它学会了‘不知道的时候别装知道’。”
小李把新任务记进待办清单,抬头问:“那它什么时候才算真‘会了’?”
刘好仃刚要开口,手机震了一下。是系统后台的自动提醒:
“模糊案例库新增条目:#138,图像ID-G7721,三次识别结果一致,均标记‘高风险边缘裂’,置信度平均82.3%,已触发人工复核流程。”
他点开图。一块普通磨砂玻璃,边缘一道细纹,弯弯曲曲,像冬天窗上的冰裂。但裂纹末端,分出两道极细的叉,像树根扎进土里。
老张的手写批注已经附在旁边:“典型疲劳扩展,三个月内必爆。留。”
刘好仃把手机转过去,小李看了一眼,笑了。
“它这次,自己先认出来了。”