破除對 AI 的迷思:縮小認知斷層,從工站上的一顆鏡頭開始

ai, powertalk, smart manufacturing, smartfactory

在工站裝上一顆鏡頭,錄製下來的影像資訊,即是 AI 學習辨認產線的基礎,透過不斷提供 AI 大量的影像資訊,讓它「看」得越多,AI 模型能訓練得越好,但是,能建立出一個適合產線管理的 AI 模型、並持續優化,包含了幾個前提:

  • 衡量建置成本,期待與現實考量間的拉扯
  • 訓練 AI,跨領域知識的合作
  • 認識 AI 感知限制,建立合適的學習環境

AI 視覺擁有極大的動能,幫助工廠數位化產線資訊,達到智慧製造,但需要保有對 AI 正確的認知,以及適當的基礎建設準備,才有可能發揮 AI 潛能。

AI 總監 Kuei 揭示 AI 智造的關鍵核心,暢談智慧製造必知的 AI 應用實踐。

今天很開心可以邀請 Kuei 來到 PowerTalk 第 4 集,Kuei 是 PowerArena 的 AI 總監,從過去在碩博士的研究開始,就非常專注在電腦視覺、影像處理領域上。對於如何透過有限的影像資訊,去重建物體、重建空間,排除光線、陰影等影像上的限制,以便達到更精確的物體識別、物體追蹤等等,Kuei 在學術領域上面,有非常深厚的知識研究基礎。再後來到業界的產業應用,不管是電子製造產業,或者是以人工智慧為基礎的車載軟體,具備很深的電腦運算知識,讓他成為我們這一集 PowerTalk 最適合對談的對象。

我們一直都很希望談談的一題就是 AI 人工智慧,這是一個很廣的概念,搭配前陣子 OpenAI 掀起的熱潮,大家對這個詞彙又賦予了不一樣的期待還,所以想要請 Kuei 幫我們說說 AI 這個概念,我們要怎麼著手去認識?常常聽到跟 AI 配在一起的機器視覺、深度學習,這些到底是什麼?

Kuei:我們先從 AI 開始聊,人工智慧在 computer science 領域裡已經研究超過 50 年以上,如果照教科二書,最早大概已經是從 70 年前開始,我們知道人工智慧已經走了這麼久,那走這麼久的東西,似乎你還覺得他非常的 stupid,大家覺得他還是沒有想像中那麼聰明,就是當客戶發現,哎為什麼這個也不行那個也不行?**目前的發展跟大家對人工智慧的期待,其實還是有一些落差的。**早期給人工智慧的概念,它是一個完整的智慧題,應該叫智慧還是一個智慧的東西,他可以自己做感知做判斷做決策,當然在這裡不容易達成,在 CS 領域的話,我們在做一個判斷,有一個最有名的叫 Turing test 吧,那就是我們測驗證一下,說你能不能判斷出來說,目前跟你對話的這個人,到底是真人還是是機器人?那是最有名的一個測試啊,這個東西也玩了非常多年了,但這幾年拜所謂的深度學習知識,深度學習背後其實有所謂的類神經網路,那類神經網路顧名思義,就是他是一個模擬人類神經在運作的方式,去設計出來的一個網路架構,他的角色方式,也是在學習人的神經網絡的方式在做,那類神經網路其實這個概念被提出來,然後開始有很長的嘗試,他已經非常非常多非常多年之前了,至少就我的了解,也是三四十年以上的歷史。現在所謂的 AI 之父,三個人裡面,其實他們是在早年的時候,最早開始做這些事情的人,在當年在一體限制之下,他們做完一次神經網路的訓練大概是 1 個月以上,所以這東西變得非常難做,因為你一個月訓練完之後,才能驗證出你的時間設計是不是錯的、東西有沒有問題,那硬體的限制導致於這條路線一直被放在學術領域上面,無法真的落實到應用上面去。這幾年拜顯卡 graphics 卡,這硬體的突破,所以這個東西大幅度的成長了,以往訓練一個月以上,你可能可以在一個禮拜內就把它做完了,所以整個研究跟進展會大幅度的突破,他真的有機會應用在我們實際上的環境裡面。因為如果你訓練很久,代表說他在做決策過程當中,以以往的硬體來講,他也會非常的久,你就不可能說我看到一個東西之後,過一天再做反應吧,那實際上不可能利用的,所以這個硬體限制就變成是這個發展的一個很關鍵的突破。在所謂的computer這個領域裡面,軟體跟硬體是交錯的,硬體出來之後會大幅度的讓軟體發展,但是發展到一段時間,又被硬體限制住,他就會挺住了,等到硬體再突破的時候,軟體就會再上去。很多概念其實已經出來非常獨立,跟人工智慧一樣,他出來很久,但是我們受限於硬體,所以他無法被突破。

Kuei:我們再來提到一下人工智慧的發展歷程,這幾年透過顯卡的進步之後,已經大幅度突破,但是跟傳說中想像中的人工智慧,還有一段距離,如果想像中人工智慧是包含了這個決策的過程,那目前我們能做到的,其實做的比較好就是感知的部分,這段時間有在提 generative AI 生成式的AI ,但是即便是生成式,他也還不到所謂的創造力這個程度,他某種程度像是累積了大量過往的東西,然後長出一個類似根據過往經驗而生存出來的東西,但是這個東西,對以往來講,已經是一個非常大的技術突破了。 這個是這幾年的AI的情況,顯卡突破是一個突破,對硬體要求非常大,你希望他做越複雜的事情,硬體的需求也是越大,這個就是很明顯 AI 目前的情況,在我們應用在各個領域上面的話,可以想像是,以往 AI 還沒有起來之前,這個判斷的定義都是來自於人給他的,傳統機器學習就是你定義說我要認識一個蘋果,那我定義了形狀顏色,因為你只有鏡頭,所以沒有法定義香味或觸覺,但是你可以定義形狀顏色,甚至再更進一步定義輪廓這些特徵。 你進去做學習,學習完之後,給他看大量蘋果圖片,他就會決定說OK,我看到什麼樣的顏色,什麼樣的形狀,他就有多少的機會是蘋果,接下來你餵給他一個東西,他就可以告訴你這是不是蘋果。

Kuei:他要根據什麼東西做判斷,那是人決定的,進入深度學習之後,因為我們人也不是只靠這個東西來判斷他是不是蘋果,但其他的判斷方式我們無法描述,太抽象了,但是深度學習的改變就是在於說,我們已經可以用類神經網絡的方式,讓電腦自己去尋找它的抽象。

Kuei:這幾年在發展一個東西叫做可解釋 AI,explainable 的 AI,這個還在比較像是 2D stage,對我們來講就是電腦理解什麼抽象的概念,那個我們拿出來看不見看得懂,這個其實也跟人的行為有點像,我們有時候很難描述說,為什麼我認為這種叫做蘋果,所以這幾年發展,託一下前輩,英業達的陳維超老師,他講說當你可以明確定義東西的話,你不一定要 AI 來做,但是當你今天的目標越抽象的時候,那你就越適合用 AI 做。我們環境有很多變化,這些變化其實你很難給他完整的定義,比如說這個物體在光照、幾度之下,反應出來什麼顏色,定的很死你才會準確的抓,但是這個東西往往很難控制,所以如果通過深度學習的話,這些難控制的東西,還有很大的變異,這些透過機器學習讓電腦去學起來,我們某種程度上就可以掌握,可以比較比之前更好的掌握說,這個東西到底是不是你認知的那個東西,可以控制很多環境變化。

建置成本

從過去與工廠低、中、高層級產線管理者的交流中,我們發現了一個普遍的現象,那就是很大一部分的溝通成本,花在期待與現實考量間的拉扯,管理者期待 AI 的加入可以一次解決多樣產線問題,但要求越高,建構 AI 所需付出的金錢、人力、時間成本都需翻倍增加,這是在打造 AI 模型前,必要的衡量過程。時常,管理者像是火力全開準備將熱氣球昇天的乘客,資料科學家則是調節燃燒器的幫手,確保熱氣球升起後不會高得不切實際。

剛講到 AI 人工智慧的感知,其實是現在發展很重要一塊,但這感知很受限,因為沒有人的觸覺沒有人的味覺或是嗅覺,去補足我們對某個物體的建構。回歸到 AI 視覺,AI 視覺在製造領域,在工廠產線上面的部署會長什麼樣子?剛剛講到因為有很多抽象的變因在,那這些變因對工廠來說會是什麼?

Kuei:工業4.0的概念提出來的時候,其實是想要對整個工廠做數位化,那包含你的鏡頭可以捕捉整個工廠,在發生的事情、所有微小的變化,這是個理想狀態。我們如果可以舖一個全景的鏡頭的話 ,不止生產的狀況可以控制,包含工廠的安全、整個工廠的運輸流程。你設計的路線是不是今天被料卡住了,或是傳遞的路線卡住了,導致生產效率沒那麼好,這個東西如果在完整的數位化架構起來,這東西都是想像中可以被控制的,可以讓他效能增加。

Kuei:比如說我不是產線有問題,不是動線有問題,理想狀態是可以透過視覺來做到好,但是實際上我們面臨什麼問題呢?你可以想像一個鏡頭,現在大部分情況是固定鏡頭,很難 zoom in、zoom out,所以可以看大就不能看小,看小的東西就看不到全局,導致說,如果你為了看到整個生產情況,你就要佈有大大小小的鏡頭。 我們可以對照一下之前的 Amazon 的無人商店,你可以看看放了多少鏡頭在裡面,對照起來,工廠可能比無人商店要看的東西更多,你要佈多少鏡頭在裡面,這個東西就會牽扯到工廠的基礎工程能不能負荷,工廠裡面的網路、storage,甚至包含 AI 要用的 server、顯卡有多少,這些東西都是成本。以目前工廠生產來講,每年的預算有限,能不能做這件事情,要架構這些基礎建設需要花多久,這就是工廠目前遇到的限制情況。

Kuei:那不可能全部做,哪些事情是要優先做的,就我來看的話,看到蠻多現場最大的問題就是,基礎建設準備好了沒,很多工廠都告訴我們,今天網絡有問題。你有沒有準備好這麼大的位置,來存過往的資料,其實很多時候你還不見得要 AI,就可以發現以往的問題了,然後這個東西叫做生產履歷,東西要錄下來,回去看就發現,現場情況跟我理解的不一樣,因為只要是人,就有人的智慧,人的智慧就會覺得說你告訴我要做那麼多步驟,真的有必要嗎?我這樣做不是快很多嗎?我就可以有時間休息,或者說才能提高,就可以得到獎金。結果這導致什麼,就是你告訴他,你做這些事情你要完整的12345全部做,但是讓他可能就是跳著做135或者是145,2跟3這東西我不做也可以把東西做好啊。這個東西其實不透過鏡頭長時間錄影,你看不到的。 光這個東西其實工廠就能判斷,為什麼今天生產效能上不去,為什麼良率上不去,光生產履歷錄影下來可以回放可以追溯,就可以看到很多你以前不知道的事情。當累積了這時候你會發現說 OK,因為 AI 成本很高,但是他還可以幫你做很多 routine 的事情,比如說一天錄下裡面有這麼多,那當你今天發現有幾件事情是關鍵需要看的,那我們把這些東西透過 AI 學習,你就等於是請一個機器人,幫你 24 小時看工人到底有沒有做這件事,比如說他就是喜歡偷2 這個步驟,80%的工人熟練了之後就把 2 工作省掉了,你就希望看這件事情,那我就幫你訓練,以後所有的生產裡面他有沒有 2,你沒做 2 這件事情,我們就可以用 AI detector 去偵測說他到底有沒有做這件事情,如果沒有,我們就把它標起來,你回去可以看歷程,你的生產履歷,他到底有沒有做。

產業知識的傳授過程

除了成本上的認知斷層外,另一個對 AI 保有的迷思,源自於忽略了訓練 AI 的這一段經過。我們可以把 AI 視為一位新進員工,它需要時間學習產線管理者經年累月的 domain know-how,每個 AI 模型的背後,都隱藏著大量的產業知識作為訓練基礎,這個傳授知識給 AI 的過程,需要產線專家和資料科學家共同投入心力,才能將模型訓練完整,並且藉由更新和維護,讓 AI 模型能持續理解產線上的變化。

剛講到是一個很理想的狀態,如果是有預算的工廠,有足夠硬體設備的工廠,他們在前期的佈置都完善的話,AI 可以幫忙做到的是很多的,但在大部分現在有的產線狀態,都是受限於這些前期的前置工程,生產履歷的前置工程。剛還講到說標註這個部分可以去做優化,常常聽到 AI 訓練要配合標註,標註到底是什麼?然後這個標註跟剛剛講到的,人有很大的變因,人的聰明我們要去做管理,標註跟這個又有什麼樣的關聯?

Kuei:成熟的AI是所謂的監督式學習,監督式學習像是老師教學生,我教什麼你學什麼。標註的話就是,目常在製作一個教材,你在教 AI 這個學生怎麼學那個東西,比如今天我把蘋果標起來,你就學的這個叫做蘋果。我們在各種不同環境裡面的蘋果,都叫做蘋果,但是一開始給他,他不認得,所以你一定要把它標起來,告訴他這個叫蘋果。標註這件事情其實很重要,因為在類神經網絡的設計上,每一個方法設計都有它的原因在,那這原因會先找到標註是怎麼樣標它,就是我要怎麼樣標它,它才能學的起來,這跟方法的設計有很大的關係,所以標註這件事情變得很重要,再來是所有的變化,都希望透過標註,讓 AI 去學習,不管是標白天、晚上的蘋果,黃燈、白燈底下的蘋果,甚至雨天放在外面的蘋果,他都是蘋果,不會變別的東西,但是他沒有看過就學不起來。可以把 AI 當成一個 3 歲的小孩,正在學習,你要告訴他為什麼,像這樣子,所以標註的過程,就是把這東西標起來告訴他說,你要認識這個東西。那現場環境也是這個樣子,我們經常遇到情況是,今天已經開始做了,他先用這一批白色的料,他跟你說這個白色東西就叫什麼,你就學起來就好了,但是等我們開發了一個月上線之後,可能校料的時候換成橘色了,AI 不認識了,因為他過去就只看過白色,這就是個大的問題。

Kuei:這幾年的 AI 技術,其實是我們可以針對這些東西做一些變化,讓 AI 去學到這個東西,紅蘋果也是蘋果,青蘋果也是蘋果,像這樣的事情學的起來,但是最好是你可以提供,馬上提供這些,有多少變化都提供出來,那當然還是可以快速的學到。這個東西可能比較不切實際,變成是未來我們會有迭代的過程,這個在專業來講是稱為 MLOps,他是一個 AI 學習東西的歷程。他有點像是非常年輕的新手上路,一個新人進工廠,只認得這工廠的情況,但是過了50年升到廠長,他看過的東西就很多,你給他看,他就告訴你這裡面有 10 種 100 種的變化,他都了解。但是一個新人進來之後他一定不知道,這二三十年的工作過程是他的學習過程,對AI來講一樣有學習過程,東西更新了之後他不認得了,你就要重新再標註他,讓他再學起來,這就是他的一個學習過程,學習之後,他的經歷也是會累積的,模型也是會變好的,他學到更多之後,就可以掌握這些變化。像自駕車這個領域,甚至一些比較所謂泛用性的物件偵測,我們發現他的學習能力是不錯的,他可以掌握非常多的變化和情況,但是這些變化情況,是你要讓他學起來的,他如果沒有看過沒有學過,他當然不會知道,就跟一個新人一樣,他剛進來的時候沒看過沒學過,他不會知道,對他可能只有一些教科書上面的知識,那不見得可以實際運用。

所以其實工廠要導入AI視覺的時候,我們要給這個 3 歲小孩足夠時間,去學產線上面的知識,才有辦法達到預期的目標成果。

Kuei:是,這個其實有一個比較困難的東西,叫做跨領域的合作,跨領域的合作一直是一件很困難的事情,AI 是屬於 computer science 的領域,工廠有 IE 的領域,還是一個工廠製造的領域,領域之間本身就會存在一些 gap,認知會存在一些落差。跨領域合作就是要怎麼樣彌補這個落差,彼此用不同領域的語言來講話,但我們要怎麼樣把這東西合在一起,才有辦法透過 AI 來做智慧製造,跨領域合作最困難的是溝通,這件事情是很重要的。

身為一個AI總監,面對過去有接觸到的導入案例,你會給下一個準備要導入 AI 視覺的管理者什麼樣的建議?在導入前期,他們應該要保持什麼樣的態度?

Kuei:其實最重要的是發現問題是什麼,這件事情很重要,因為客戶有客戶的想像,那 AI 變成一個通用語言的時候,其實有很多正確或錯誤的認知,在一般人的腦袋裡面,所以客戶用他的認知來講,告訴你說我要什麼東西,那是他想像有的問題,然後他想像怎麼解決,告訴你說幫我做這個,但是他可能對 AI 有一些誤會,有些超過預期的想像,甚至是目前你要做到成本是非常之高的。你說我有 2,000 萬,但是實際上,這個東西的成本可能是 2,000 萬美金,你說你有 2,000 萬台幣,那當然就不太可能,沒有人可以願意幫你做嘛。回頭過來我們在探索,我們有正確的 AI 認知,我們要了解出真正的問題是什麼,有時候客戶的問題不見得要走他想像的路線去解決,而是你用專業認知告訴他說,如果你要解決這個問題,我有哪些選項,成本格是多少,我們怎麼做。甚至他想解決整個問題,但就像冰山一樣,你露出來問題的角落而已,那你真的問題要問什麼呢,肯定要找到那個關鍵的問題,搞不好只要解決那一個問題,就可以解決80%的問題,這個東西變成是非常有價值,成本沒有高到要用整個成本來做這件事情,可能只用20%的成本,就可以解決80%的問題,所以最重要是你要能理解客戶,他到底基本存在的問題是什麼?這個才是最重要的。

Kuei:知道問題才有辦法解決問題,那就變成說,管理者需要非常了解自己產線遇到的挑戰到底什麼,並不是所有的問題都需要透過比較高智慧的AI視覺去做處理,其實有時候,會更推薦客戶去用其他方式,去處理去處理掉這個問題,讓AI視覺在比較關鍵的地方去做部署,會是成本效益最大,用一個漸進的方式去做優化最適合。

Kuei:是,以往的經驗來講,客戶想要做SOP,想看完整的生產流程,每一個步驟有沒有做對,但是這件事情真的需要每個步驟看嗎?因為其實我們知道,在工廠生產過程當中,會做非常多的防呆措施,他只要可以防呆,那你為什麼需要看他?你要看的是那些你用防呆措施做不了的,或者是很關鍵的東西,即便你有防呆,他做錯了你的損失就很大,這東西對營運還是相對重要的,有一些很細微的步驟,基本上不會做錯,去看他或者他做錯了損失也不大,那你花了很大成本看他,以有限的預算的工廠來講的話,這件事情其實非常沒有價值,成本效益太低了。

回到剛剛的問題,很多工廠產線模式會是勞力密集、少量多樣生產,面對這樣的產線的時候,你會給這些製造商什麼建議?不管是在 AI 模型的訓練、更新跟維護上面,這可能都跟他們產線當下的狀態非常有關係。

Kuei:其實要看所謂多樣的定義是什麼,有時候其實他出口不同客戶,只是差在外形上面,差在一些關鍵的小東西,比如說出到各個國家不同的電壓,或者是不同的插座外形,有些東西差異其實沒有到很大,那對於 AI 來講,本身就是一個 clone 的變化了,只是說,你能不能在我們訓練的初期,把這些變化都提供給我們來做訓練,那我們可以判斷說這個東西到底是叫,教 AI 認識他是一個東西還是兩個東西,這個是由 AI 的領域來做一些專業的判斷,data scientist也可以做一些專業判斷,說 AI 能不能選擇起來,你也可以說疊加的過程,讓他越來越認識你越來越多的產品,但一樣,你訓練一個人需要時間,你訓練一個 AI 也要時間。我們遇到問題是,第一個月看起來效果不錯,第二個月效果不行,之後他也沒有預算去維護了,第三個月之後就放著不用了,那是很可惜的狀態。我們會希望說,看到他是長時間運行的,長時間運行工廠一直會有變化,那少量多樣也是,有些工廠早上跟下午做不一樣的事情,那你可能要 AI 看,就不符合你的成本。你會做這麼大的變化,也是本身東西單價就低,也不見得需要這麼在意,這些需要 AI monitor 的事情。自己要評估說你的東西、你的生產,甚至你在未來一年的規劃,是希望AI幫你做什麼樣的事情。 那少量多樣,在某些情況底下並不是太大的問題,而是說在我們做規劃的階段,你有沒有讓 AI 專家足夠了解你要看的是東西是什麼、在工廠有多少的變化,那這些東西考量下去之後,才能做一個比較完善的評估,也可以讓 AI 在產線做長期的應用。

所以管理者其實要讓 AI 部署更順暢,在導入初期,盡可能把所有產線上面的變數、最完整的資訊,都提供給資料科學家,讓資料的值跟量是最大的,可以訓練 AI 更順暢。

Kuei:或者是說,要有一個比較長期的規劃,就是說這疊加過程是可以一直更新的,我們讓他先上線,有問題就更新,甚至你產線有可能改變,改變完之後,他就再也不會回到舊的東西上面去了,那舊的資料某種程度來講對模型是沒有意義的,我們可以把他淘汰掉。因為他本身要學習很多東西,所以有點像是你在訓練一個員工的過程,你要培養員工,不是做短期的訓練就希望他可以發揮 200% 的實力對不對?是一個培養的過程,AI 也是一樣,它是一個培養的過程,所以如果想要做 AI,我們會希望它是一個長期的事情,不見得需要一開始就投入大量成本看整個工廠,可以從一條長線開始,長時間的來運作,看看它的成本效率是怎麼樣,AI是會一直進步的,如果我們長時間餵它產線,需要更新頻率就開始慢慢下降,一開始可能一個禮拜更新一次,慢慢他看的越來越多,變成能一個月更新一次、三個月更新一次,甚至到未來,只有當你進了新的、不同的產品,才需要更新。

所以其實只要工廠管理端願意做一個夠長的規劃,願意投入一定金錢跟精力下去,AI 的優化可以幫助他們在產生上面發揮價值,越長時間會看到越大的成效。

AI 感知限制

不像人能靈活地運用五感協助判斷,AI 存在著感知限制。對 AI 視覺來說,它辨認生產狀態的基礎,全來自於工站攝影機錄製下來的畫面,它無法對畫面外,或是受限於角度而無法檢視的地方進行識別,管理者期望 AI 幫忙檢視的工序,勢必要透過清楚的影像提供給 AI 分析。簡單來說,包含完整資訊的畫面,方便 AI 做判斷,人眼無法辨識的影像資訊,AI 也難以有對策。

Kuei:是,AI 突破了以往傳統的電腦視覺的限制,最主要是它可以很懂變化這件事情,但是他要很懂 ,還要控制變化,這件事情讓他看過,我們目前覺得 AI 學的不夠好,大部分的問題都在於他沒有看過,除了沒看過之外,還有情況是你不給他看,你把他遮住了,他看不到那樣就不會有反應,那我們透過鏡頭,不管透過哪種 sensor,你要讓目標東西出現在 sensor 底下,他才有辦法感受的到,這是一個非常直接的限制,也是我們其實最常遇到的情況。我們希望他長時間部署在環境裡面,可以看到這個東西,那他就會發揮他的效果。

很實際的例子就是,大家的手可能會遮住鏡頭、遮住物體,那這只要人看不到,AI 就看不到,我們就沒有辦法幫你偵測到。

Kuei:是,如說現場的管理員希望看到工人有沒有做事情的時候,第一個你會靠近看,第二個你真的看不到之後,就請他把手拿開,先把東西拿開或者是把在做的東西扳開,但AI他沒有那隻手,他無法靠近,所以你只好幫他做這件事情,你幫他做一件事情他就幫你做判斷。

等於說我們在建制整個生產線的工作流程時,必須要給 AI 足夠好的環境,讓他去做辨別,所以大家今天常常會有的錯誤認知就是,為什麼他做不到?人平常在旁邊做的到,但我們忘記人可以有不同角度去看,或者是用說話方式去請上面的作業員把手部動作移開。

Kuei:是,這些 AI 做不到所以你要幫他做,或者是說你要把這個空間騰出來讓他去看。

我很好奇 Kuei 覺得 AI 視覺在製造領域接下來未來會怎麼發展?我們可以有什麼樣正確的期待?

Kuei:這個問題其實我也還在了解當中,畢竟碰這一塊時間還有限。其實我們知道現在應用很多了,除了工廠的生產效率跟生產品質之外,我知道很多人也拿來做,比如說做 AOI、錯誤的偵測。基本上目前做的事情,大部分都屬於傳統電腦視覺應用在工廠領域在做的事情,只是以前做不好或以前的限制很大,現在透過 AI 的方式,讓他的能力更強了,他真的可以上線應用了。那未來我覺得大家要思考的是說,當我可以控制的資料量變大的時候,我有大資料的時候,以未來整個工廠全局的觀點,我應該做什麼樣的判斷?應該做什麼樣的事情?有時候在意一兩個小細節,第一個難做,第二不見得是你真的可以掌握 80% 問題的地方,有時候你看全局,比如說看一下今天工廠為什麼員工 30% 都集中在這個地方?代表說這地方是不是這條產線設計有問題?所以人都集中到這邊來,或是線上的產品怎麼都固定累積在那幾個點?這個可能就是瓶頸。不見得需要看到每一個,而只是透過一些數量的統計,透過一些物品的追踪,就可以讓你產線流向的情況呈現。

Kuei:遇到最大問題是,客戶說我幫你錄下來了,一天有 1,000 筆異常,但是你有沒有時間看 1,000 筆異常,看每一筆異常到底是不是工廠要在意的事情,還是說透過大量的分析,我可以幫你規劃成什麼,這個又是不同領域的知識衝擊。工廠習慣是用 sample 的方式,看小資料不看大資料,當你給他一個大資料的時候,也無法告訴你怎麼看他,那這個就必須說彼此雙方要坐下來,看我出來的是什麼東西,你就可以通過專業知識來想像說,我要怎麼用這個東西?這個變成是一個創造過程,以往這些東西,這些知識還不能應用的時候,我們當然不會創造出這些管理工具出來,那現在在 AI 已經是一個時機點了,只是說,未來大家怎麼合作才有辦法突破?

剛講到很多 AI 視覺的未來發展,還有他可以做到的事情,那身為 IE 工程師,他需要擔心被 AI 視覺給取代嗎?對工廠管理者來說,他們又可以怎麼去期待 AI 視覺幫助他們達成智慧製造?

Kuei:我還是偷一下陳維超老師講過的事情,他說那時候進去英業達,遇到第一個需要溝通的是,工廠他們很擔心你是來取代我的工作。這件事情是很有趣,就現在來看,至少從我的角度來看,未來5到10年主動型的AI,它並不是一個可以上線的東西。我們以自駕車來看,目前的自駕車以 level 2 為主,那 level 3 以上,其實大家都只敢規劃還不敢實作。**所以所謂的輔助性AI,它以後是一個很重要的生產力工具,至少在未來的 5 到 10 年,它是一個很好的幫手。**我會希望現場的 IE 是把 AI 當成好幫手,以往只有兩個眼睛可以看,只能看一部分的東西,但是當 AI 視覺進入工廠之後,你就有幾十個上百個眼睛來幫你看,但是當然你還是只有一個腦袋,所以你要幫忙去想,如果我有上百個眼睛的時候,我要看什麼東西?這個東西是討論出來的,這東西如果對你有幫助,我們就可以來思考說,如果你想看這個東西,那 AI 要怎麼看?輔助性的意思是說,我可以節省你去找這東西的時間,但是判斷這件事情,還是希望有專業的 IE 來做判斷。以往你覺得這場有問題,要花 10 分鍾站在產線前,拿個碼表去算是不是做錯了,未來你就是一定的資料累積下來,發現有問題的地方,你可以回去找,透過 AI 先幫你把關鍵的東西找出來,你可能坐在電腦前就可以完成。

Kuei:如果AI訓練的越久,我們越知道做什麼,省下的時間也會越多,那輔助性的東西,重點還是使用的一個人,使用的人需要告訴開發者說,你到底需要怎麼看這個東西?你自己怎麼看的?你需要看到什麼?這就是一個很重要開發過程。我們當然會期待這個東西是可以進步,越做越好,這也是我們在做這一行最主要的目的。

常常會聽到說,AI模型會搭配一個標準是準確度, 這個準確度,身為工廠管理者還有 data scientist 來說,它有多大的重要性?是準確度越高,就代表這個模型越好嗎?

Kuei:準確度這個東西分兩個層面來講,一個是做 AI 的開發者用的專業術語,accuracy、position、recall 都是我們在判斷模型準不準確的一些標準,實際上這些東西並不是直接代表應用上面的效果。我們做一般的物件偵測,是針對 image,是每個 frame 在看,假如一秒可以看 30 個 frame,那判斷錯,其中有一半的 frame,15 個 frame看不到,還有 15 個 frame 看得到,我們做完產品設計的時候,我就根據模型的準確度做一個設計,比如說我夠相信我的模型,這 30 個 frame 裡面,只要有 5 個 frame 看到,我就認為你是這個東西了,即便看起來好像只有 5 個,放到 30 個 frame,準確度沒有很高,但是作為應用,它已經夠用了效果夠好了。 所以其實邏輯不會只有 AI 那一層,一般設計的話,AI 上面有一個邏輯,上層邏輯,是根據現在環境去做一些設定,然後根據你要看什麼做一些設定,這些東西才是產品的準確度。這一整套設計下來,都會跟你真的想要看什麼東西有關係,準確度這個東西,更重要的是在應用層面上,應用上的準確度是什麼樣子。

回到底,還是要知道今天問題在哪裡?今天模型有沒有成功解答到這個問題?準確度這些其實沒有那麼重要,所以大家不應該以準確度來全權定義。

Kuei:不應該以單一模型的準確度來定義,尤其是這也會跟效能有關,你希望模型做到越準,模型就越龐大,所以他會有邊際效應,就是你用小型的模型就可以做到 90% 了,但是你要到 99%,可能是上千倍上萬倍以上的大模型才能做到,這個東西代表說運算成本很高,運算成本很高情況下,預算可能就不夠,人力訓練能力可能也不夠,訓練設備可能非常大,但是實際上你不見得需要這樣子,90% 的時候有 90% 可以做的事情,我們可以透過其他的設計,包含是 UI/UX 的設計,軟體的設計,通過這些設計,即便是 80%90% 的模型,也可以給你想要的東西。

今天很謝謝 Kuei 的時間,用非常平易近人的方式幫我們解說也解惑,不管是把 AI 視覺、AI 模型比喻成 3 歲小孩,我們就是需要時間去訓練他們,去餵給他們資訊,教導他們要怎麼看到產線上面的物件去辨別之外,其實現在我們卡住的一塊,還是會回歸到硬體設備,在預算上面的考量,這些其實都是要達成智慧工廠、數位轉型中,很常忽略一塊,但是大家會面對到的挑戰。

464