大話智慧製造 #1 錘子與場景

傳說中,在雷神索爾眼裏,這是個由釘子構成的世界,「如果一鎚不夠,那就兩鎚吧。」人們也普遍相信資料科學家擁有類似的神力,「如果一套模型不夠的話,那就再來一套吧?」但是,真正在產業現場,經常看到客戶皺着臉,資料科學家抱着頭,爲什麼?別問,說了你會怕。

「怕什麼,你就說吧!」科學家拍着胸脯自信滿滿地說,「我的模型隨便也是幾十億個參數上下,什麼看不出來?沒什麼在怕的,」殊不知,這正是問題所在。在實驗室裡,數據開口就有,別說正負數據,imageNet裡面手工標示了上萬個類別,加上遷移學習跟微調(fine-tune),真是很容易就建立起最基本的示範案例,也總能讓初識神經網路的產業人士目眩神迷,覺得看到了久違的曙光。但到了實戰現場,可就不是這麼一回事了。

「給我完整的缺陷數據,我就給你全世界,」科學家到了現場信心爆棚說道。「你想多了,我什麼都沒有,」產業人士輕描淡寫地說,「我只有OK數據,你也不要搞得太複雜,只要把不一樣的挑出來就好了,這麼簡單,AI 應該很厲害,十分鐘就可以搞定了吧?拜拜,我要去拿訂單了。」

過了三個月回來,你會看見兩個生悶氣的人,相對無言唯有淚千行,「你說,我怎麼對老闆交代?」「沒有數據,要我做個鬼?你殘酷,你無情,你無理取鬧!」以下重複 65536次,暫且按下不表。

產業人士確實沒藏數據,現場幾乎沒有缺陷數據,至少沒有科學家要的那麼多,「我們的良率都在98%以上,不然我們早倒了,」產業人士苦着臉說。以電子代工業而言,每個工廠都在想盡辦法壓低原物料價格,因爲天殺的客人今年又威脅要降價5%,不然要轉單,「而且,我只接受良品喔,啾咪,愛你喔,」大客戶露出無辜的笑容。缺陷越多成本越重,所以台廠早就練出一身低成本高良率的本事,但恰恰就是這一點讓科學家撞牆。

學校實驗室裡關注的是 SOTA(最優最新),衡量實力的指標是在什麼期刊上發表多少論文。模型也是一個比一個大,就以卷積網路來說,1998年的 LeNet 有4萬多個參數(44,426),才二十年不到,2016年 resnet 的參數有 2千多萬個,成長了 600倍。這樣的參數規模,放在台灣,每個人平均可以分到一個多。這還是6年前。openAI在2020發表 GPT-3 有 1750億個參數,又還比 resnet 大上 7000多倍。儘管 GPT-3 和 resnet 處理的對象不一樣,但還是可以看到模型規模的成長速度已經像是傑克的豌豆一樣,一夜之間就可以長到天上去了。

產業人士當然也覺得印象深刻,但接下來三句話就讓科學家口吐白沫,「一個多少錢?我要準備多大的電腦?什麼時候可以回收投資?」「你不懂啦,模型如此美妙,怎麼可以用錢衡量?」「好吧,我不懂,你自己美妙去吧。」然後?然後就死了。

凡存在必合理,就算還在工業 2.0階段,經過數十年發展,產業已經有自己的生存之道。正是這樣的生存能力才能支持科技繼續前進,換句話說,科技不能脫離產業而存在,更別說 AI。產業真正關心的是什麼技術或工具,可以在自己的場景裡面發揮作用,解決問題。

以我自己的經驗,數據其實都在,而且就在場景裡,只是連客戶自己都不知道,到底是什麼?我們現在也不可能知道,但只要我們走進現場,看到就知道了,所以我們唯一要做的就是「走進群衆、實踐為先」、「擼起袖子加油幹」(嗶嗶,不良語言警告,扣三分)。

錘子說,「你在哪裡?我看不見?」

釘子對錘子說,「你看不見我,因爲我就在你的心裡。」

數據也是。