top of page
Writer's pictureMolly

「數據標註」與「機器學習」的關係是什麼?從監督學習、無監督學習與半監督學習說起

Updated: Jan 7, 2021


機器學習依照「數據有無標註」分為監督學習、無監督學習和半監督學習三種。

  • 監督學習(Supervised Learning):使用有標註的數據(Labeled)

  • 無監督學習(Unsupervised Learning):使用無標註的數據(Unlabeled)

  • 半監督學習(Semi-Supervised Learning):使用部分有標註、部分沒有標註的數據


如今較知名的AI應用技術大多有賴於監督學習,例如圖像識別(Computer Vision, CV)、自然語言處理(Natural Language Processing, NLP)兩大領域即是。也因為監督學習屬於相對成熟的領域,因此目前數據標註仍是在做機器學習時無法省略的關鍵環節。


監督學習(Supervised Learning)

首先,需要先理解數據標註到底是什麼。想像一下,AI學習跟人類學習的過程很相似,我們小時候在學習辨別不同事物時,大人會指著可愛的狗狗說到:「你看,是狗狗耶!」而且每次看到總會再說一遍,於是久而久之我們就學習到「原來長這樣的是狗狗啊」;回到機器學習的情境,我們也必須教導機器「長這樣的都是狗狗喔」,所以我們不但需要大量的狗狗圖片,還得幫每張圖片都標註上「狗狗」,機器便會在每張圖片中反覆學習「狗狗」的特徵,待機器完成學習後,再給機器一張狗狗的圖片,此時它就可以認出來了,當然最後的結果通常是以百分比的方式呈現,譬如96%認為這是一隻狗、4%認為不是,這當然就得看模型訓練的有多好了。以上就是監督學習最簡單的樣貌,使用的是擁有「狗狗」標籤的數據集。

無監督學習(Unsupervised Learning)

但這不代表無監督學習就沒有它的意義。在真實世界中,數據時常是未標註的,但它們仍可以發揮極大的功效,這裡舉個較知名的例子:銀行在觀測可能的金融犯罪行為時(例如洗錢),就時常會利用無監督學習的聚類,其演算結果會把所有用戶大致分成幾類,雖然看不出這些分類的實際意義(因為沒有標籤),但卻可以順利找出不符合這些聚類的異常用戶,銀行便可再去深入分析這些異常用戶是否真的存在違法行為,否則要針對用戶全部逐一審查絕對是一個過度昂貴的觀測方式。

半監督學習(Semi-Supervised Learning)

半監督學習則通常呈現未標註樣本多、有標註樣本少的狀態,這很符合現實中的實務情況。想像一下,僅有部分已標註部分數據,也許是因為專家人力有限,也許是因為標註員的成本太高,也許是因為近期開始養數據,終於開始好好標註了,總之通常有標註的數據總佔少數,無標註數據仍是佔大多數的,在沒有資源/ 時間的情況下,我們仍然期待這樣的數據也能訓練出良好的模型。但事實是半監督學習的成效一直差強人意(如果已經相當良好了,早就不需要糾結於標註數據了,是吧?)雖在實驗中有還可以的結果,但如要直接落地,仍讓人有些疑慮。雖然本篇沒辦法著墨更多改良半監督學習的討論,但十分期待它未來的突破。

 

如果你是剛入門AI領域,也許一大堆有著「OO學習」的名詞很困擾你,它們彼此間是什麼關係?現階段我應該先知道什麼就好了?哪些是我要特別注意的趨勢?因此,以下雖和數據標註無關,但一併放在此篇作為補充。

強化學習(Reinforcement Learning)

  • 談到機器學習的分類時,很多文章會將強化學習一併放入,但並沒有說明清楚分類的基準。總地來說,如果以「數據有無標註」來分類,多著重於討論監督/ 無監督/ 半監督學習;但如果以「學習方式」來分類,則可以從監督/ 無監督/ 強化學習來劃分。

  • 機器學習以「學習方式」來分類

  1. 監督學習:從已知的經驗來學習。像是一個孩子從不同的物件中了解到各自的特徵,進而學會判斷什麼是什麼。

  2. 無監督學習:在未知中藉由觀察來學習。這個孩子雖然不清楚各個物件是什麼,卻可以透過自己的觀察基礎來分類或描述事物。譬如Big Data經典案例:星期五、尿布與啤酒,就說到週末前幫孩子買尿布的爸爸們,也會記得幫自己買啤酒,尿布和啤酒就成了一種獨特眼光下出現的分類方式。不過據說這個案例只是一個都市傳說,但用於理解仍是不錯的例子。

  3. 強化學習:在實際互動裡錯中學、學中錯,不斷尋求進步。這也是個不清楚手上這些物件到底是什麼的孩子,但比起觀察解析,他傾向先做了再說,錯了就改,自然慢慢會越來越正確。許多遊戲AI都是強化學習的應用。

  • 此外,因為強化學習也是使用沒有標註的數據,因此也有人把強化學習看作是突破無監督學習癥結點的一種解決方式。


遷移學習(Transfer Learning)

另外常聽到的還有遷移學習,它的目標是將從前任務中學習到的知識用於當前這個新的任務。有人可能會誤會它和深度學習是等號,但其實只是因為深度學習使用遷移學習的效果很好,導致他倆常常一塊兒出現,進而造成的誤會。因此也將獨立來討論。

深度學習(Deep Learning)

深度學習是機器學習的一支,起源於神經網絡模型,其中反向傳播算法奠定了其發展基礎。常見的架構有深度神經網絡(Deep Neural Network, DNN)、卷積神經網絡(Convolutional Neural Network, CNN)、遞歸神經網絡(Recurrent Neural Network, RNN)及生成對抗網路(Generative Adversarial Network, GAN)。前三者屬於監督學習的範疇,GAN則帶領深度學習進入無監督學習,這一大突破也是它近年為何如此火紅的原因。深度學習的蓬勃發展,也讓它幾乎成了AI的代名詞,但其實它們的關係是層層包含的:Artificial Intelligence (AI) > Machine Learning (ML) > Deep Learning (DL),在一頭栽進深度學習之前,最好還是能對整體樣貌有更全面的認識。


 

本文劃重點

  • 了解什麼是數據標註、為何要做數據標註。

  • 對於各種「OO學習」有初步的了解,能大致說出其重點和它在AI整體架構中的位置。


進階思考

  • 強化學習(RL)、生成對抗網路(GAN)這類對於「無監督學習」的探討與突破,無疑是目前關注的焦點。敏感的人可能到這裡會發現RL跟GAN都是「從錯誤中學習」的概念,那它們之間有什麼關係呢?

RL是一個理論框架,GAN是在RL理論上開發的一種模型訓練方法,但GAN更高明的一點是,生成式的網絡和判別網絡互為Environment,而RL則定義了機器根據環境的獎勵後改變模型,然後來決定下一步action,再得到獎勵來改變模型。所以GAN可以看成是一種雙向強化學習。楊三豐
  • 生成模型的發展趨勢:GAN是生成模型的一種,即便已是一個莫大的突破,但它的不穩定性讓從業人員仍在尋求更好的生成模型的結構。即使如此,該領域的發展依舊是目前AI上聚焦的熱點,直至2020仍有許多關於GAN的論文誕生,值得一讀。



#數據標註 #人工智慧 #機器學習 #監督學習 #無監督學習 #半監督學習 #強化學習 #遷移學習 #深度學習 #生成模型

Comments


bottom of page