Chris - Chris3Keys

機器學習, 神經網路

神經網路是什麼？結構為何？

神經網路是一段透過數學運算，能預測得越來越準的程式碼。你知道嗎？你用人臉辨識或是指紋解鎖手機，這功能的背後，都藏著一個聰明的幫手——神經網路。它就像一個模仿人腦的超級計算機，能從數據中學習，幫我們做判斷，例如，從辨認照片裡的貓狗到預測房價，都能利用神經網路。本篇文章克里斯會介紹神經網路是什麼，尤其它的結構是什麼，神經網路的學習力從何而來。雖然神經網路聽起來高深，但其實可以分成三個部分來認識：資料輸入、輸出預測、經驗累積。第一鑰：資料輸入——給神經網路準備好食材想要讓神經網路學好預測嗎？第一步得「餵」好的數據，就像廚師需要新鮮食材才能做出美味料理。這些數據可以是圖片、文字、數字，只要能轉成數值，就能成為神經網路的「食材」。但怎麼準備這些數據？有三個重點：資料清理、資料預處理、資料拆分。資料清理：把壞掉的食材丟掉現實中的數據常常有點亂，例如照片裡模糊的像素，或是 Excel 表格裡少了數字。這些「壞掉的食材」會讓神經網路學得不好。資料清理就像整理冰箱：把缺失的數據補上（例如用平均值填空）、把異常值丟掉（例如一個離譜的數字），確保數據乾淨整齊。資料預處理：把食材切好、調好味道資料清理完成後，還需進一步預處理，讓神經網路更容易「消化」這些資料。例如，一張圖片需要被轉換成數值陣列（像一張 4×4 的圖片會變成 16 個像素值）。如果要同時處理多張解析度不同的圖片，預處理階段通常會把它們統一調整成相同的尺寸（如縮成 64×64 像素），像把食材切成統一大小，方便烹飪。此外，如果任務是文字辨識或圖像分類（例如辨識圖片中是「貓」還是「狗」），而且採用監督式學習方法，就必須為每張圖片提供正確的「標籤」。這些標籤告訴模型正確答案是什麼，讓神經網路能學會如何對應輸入與輸出。資料拆分：分出練習和考試的題目準備好乾淨整齊的數據後，為了看看神經網路學得怎麼樣，我們通常會把資料分成三份：訓練集（70%）讓神經網路練習，驗證集（15%）幫我們調整學習方式，測試集（15%）用來考試。這樣將資料分清楚，能確保神經網路不只會背答案，還能應付沒看過的問題。第二鑰：輸出預測——神經網路端出成品神經網路的終極目標是學會預測，例如「這張照片到底是貓還是狗？」或者「這棟房子一年後值多少錢？」。這部分預測工作是由輸出層負責，就像廚師做菜，最後要把做好的菜端上桌。輸出層是什麼？功能是什麼？其實，輸出層的功能會因為交給神經網路的「任務」而有所不同。我們先來理解，輸出層是什麼？輸出層可以分為三個「什麼」來理解：給神經網路的任務是什麼、預測出來的數值代表什麼、預測轉變成什麼決策。任務是什麼：端什麼菜用什麼盤子有哪些預測任務？神經網路的任務有很多種，常見的任務：簡單說，不同任務需要不同的輸出層設計。現實中，分類任務的輸出層可能有多個神經元，可搭配 Softmax 輸出每個類別的機率（例如「 80% 是貓」）；回歸任務則可以只用一個神經元，直接吐出數字（例如「房價預測一年後是 1500 萬」）。預測出來的數值代表什麼意義：這道菜是什麼味道？輸出層吐出來的永遠是數值，但這些數值的意義取決於神經網路面對的是什麼「任務」。…

Chris
May 24, 2025

其他

為什麼創立 Chris3Keys？

身為一個熱愛自學的人，日常就是在網路上尋找學習資源，但一直沒找到一個讓我特別喜歡的網站。有些網站有架構，但內容過於繁雜，一次丟出過多資訊，沒有明確的主次之分；也有些網站，文章冷冰冰的，像在讀說明書，讓人看了毫無共鳴。

在自學初期，我覺得學習最重要的不是把所有資訊一口氣塞進大腦，而是懂得適時捨棄、聚焦重點，沿著清楚的方向前進、建立知識之間的連結。這正是我想創立 Chris3Keys 的初衷。

Chris
April 12, 2025