看到有個搞工業視覺大模型的程序員在那吹,說自己公司所使用的工業視覺大模型都是經過百萬、千萬甚至是上億數據訓練的,識別準確率超過99.3%,我看了笑了笑,別說99.3%了,就算是99.8%,在我們公司都是不合格的!
![]()
而他另一套純技術思維的說法就更讓我無語了,說什么:“準確率高的,大概率都是小模型!”
咱拋開使用場景,只看訓練的數據集,不看準確率,這不是妥妥得耍流氓嘛!況且,工業視覺基本上都是非標視覺,恰恰是很看使用場景的東西,所以,為什么很多大的工業視覺項目都看不到通用工業視覺大模型的身影?是我們做不出來嗎?是那套通用視覺大模型沒用,或者準確率不高,好吧!
的確,現在工業視覺行業內有很多通用型產品,比如說檢個小螺絲,貼個標簽什么的,這都是簡單的工業視覺場景,遇到復雜的檢測場景,即使是上億數據集的工業視覺大模型,它也得針對單個場景單獨訓練,該花多長時間就得花多長時間,本來應該訓練多少數據集,它就應該訓練多少數據集!
比如說,你是上億級工業視覺大模型,我是從0開始訓練的工業視覺大模型,甲方生產時需要檢測一個叫作“螺母”的東西,那大概率是上億級的工業視覺大模型省時間,前提是它訓練過“螺母”這個東西,如果沒有,那其實它和我這個從0開始訓練的大模型其實是一樣的!我需要訓練幾十萬次,那它同樣也得訓練幾十萬次,沒有什么捷徑可走。
這時候,如果我訓練后的準確率控制在99.8%以上,而這個號稱用了上億數據集訓練的工業大模型的識別準確率最高只有99.3%,您認為客戶會使用哪個?您跟他吹自己上億數據集,他不需要又有什么用?
對于客戶來說,拋開“螺母”這個東西,其他的訓練對他都沒用,在代碼的世界里,我們管這個叫作“冗余”!
換個角度說,別說99.3%了,哪怕是99.9%,工業視覺項目能順利通過驗收都是很難的,因為客戶要的,其實是100%!但是,大家都知道,只要是視覺,不管是工業視覺還是消費市場的視覺,沒有誰能夠保證檢測100%的準確率。
我做過的幾乎所有工業視覺項目,基本上合同上寫的識別準確率就沒有低于千分之一的即99.9%,最夸張的一次,客戶直接要求識別準確率要在萬分之一即99.99%,這個項目四年了,還沒有通過驗收!我想未來只要客戶堅持這個數字,估計大概率也是驗收不掉了!
所以,工業視覺模型數據集大小其實并不重要,客戶看的,只是能給他節省多少事,客戶的要求其實就是替代人工或者極少數的人工干預。
假設甲方是一個生產螺絲的工廠,引進了一臺視覺設備,檢測準確率這里假設是90%,要求很低,對于生產的螺絲,只要檢測不合格,直接吹走或者推到瑕疵品區域即可,只要瑕疵品區域足夠大,即使是識別準確率不高,那么產線在完全沒有人工干預的情況下,跑個個把小時甚至是一天都沒有問題。
但是,如果甲方是一個生產輪胎的工廠呢?同樣是90%的話,意味著每生產10個輪胎就有一個輪胎檢測不到,那視覺設備基本上就離不開人工了!
那假設如果我們的視覺設備能夠把識別準確率提高到99.9%呢?對于生產螺絲的企業來說,其實影響不大,因為即使是90%,人工干預的情況也很少,但是,對于生產輪胎的企業來說,作用就大了,假設3分鐘檢測一個輪胎,那么原來90%的識別率,每30分鐘就得人工干預一下,現在變成了2天!
所以,拋開使用場景光談模型數據集大小那就是本末倒置!工業視覺的本其實就是準確率,而不是所謂的通用性!
結語
為什么現在很多通用型的工業視覺軟件產品價格卷到了幾乎沒利潤,很多價格都卷到了千元以內,原因也是在這,過分講究模型的多樣性,實際上看似訓練的數據集很大,但是解決不了客戶的實際問題,自然賣不動!不管工業視覺產品怎么吹上天,終究還是以解決客戶問題為主,你解決不了客戶的問題或者解決的不夠徹底,自然不會被市場所接受!
包括我在內的很多程序員,其實都有一個通病,那就是很喜歡搞通用的東西,這個本身沒錯,通用,意味著低耦合,拿來即用,不用即拋,這在代碼的世界里面其實是個好東西,但是,拋開業務只看代碼,難怪你做不好!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.