Chris

Chris

神經網路是什麼?結構為何?

神經網路是什麼?結構為何?

神經網路是一段透過數學運算,能預測得越來越準的程式碼。 你知道嗎?你用人臉辨識或是指紋解鎖手機,這功能的背後,都藏著一個聰明的幫手——神經網路。它就像一個模仿人腦的超級計算機,能從數據中學習,幫我們做判斷,例如,從辨認照片裡的貓狗到預測房價,都能利用神經網路。 本篇文章克里斯會介紹神經網路是什麼,尤其它的結構是什麼,神經網路的學習力從何而來。 雖然神經網路聽起來高深,但其實可以分成三個部分來認識:資料輸入、輸出預測、經驗累積。 第一鑰:資料輸入——給神經網路準備好食材 想要讓神經網路學好預測嗎?第一步得「餵」好的數據,就像廚師需要新鮮食材才能做出美味料理。 這些數據可以是圖片、文字、數字,只要能轉成數值,就能成為神經網路的「食材」。但怎麼準備這些數據?有三個重點:資料清理、資料預處理、資料拆分。 資料清理:把壞掉的食材丟掉 現實中的數據常常有點亂,例如照片裡模糊的像素,或是 Excel 表格裡少了數字。這些「壞掉的食材」會讓神經網路學得不好。 資料清理就像整理冰箱:把缺失的數據補上(例如用平均值填空)、把異常值丟掉(例如一個離譜的數字),確保數據乾淨整齊。 資料預處理:把食材切好、調好味道 資料清理完成後,還需進一步預處理,讓神經網路更容易「消化」這些資料。例如,一張圖片需要被轉換成數值陣列(像一張 4×4 的圖片會變成 16 個像素值)。如果要同時處理多張解析度不同的圖片,預處理階段通常會把它們統一調整成相同的尺寸(如縮成 64×64 像素),像把食材切成統一大小,方便烹飪。 此外,如果任務是文字辨識或圖像分類(例如辨識圖片中是「貓」還是「狗」),而且採用監督式學習方法,就必須為每張圖片提供正確的「標籤」。這些標籤告訴模型正確答案是什麼,讓神經網路能學會如何對應輸入與輸出。 資料拆分:分出練習和考試的題目 準備好乾淨整齊的數據後,為了看看神經網路學得怎麼樣,我們通常會把資料分成三份:訓練集(70%)讓神經網路練習,驗證集(15%)幫我們調整學習方式,測試集(15%)用來考試。 這樣將資料分清楚,能確保神經網路不只會背答案,還能應付沒看過的問題。 第二鑰:輸出預測——神經網路端出成品 神經網路的終極目標是學會預測,例如「這張照片到底是貓還是狗?」或者「這棟房子一年後值多少錢?」。這部分預測工作是由輸出層負責,就像廚師做菜,最後要把做好的菜端上桌。 輸出層是什麼?功能是什麼?其實,輸出層的功能會因為交給神經網路的「任務」而有所不同。 我們先來理解,輸出層是什麼?輸出層可以分為三個「什麼」來理解:給神經網路的任務是什麼、預測出來的數值代表什麼、預測轉變成什麼決策。 任務是什麼:端什麼菜用什麼盤子 有哪些預測任務?神經網路的任務有很多種,常見的任務: 簡單說,不同任務需要不同的輸出層設計。 現實中,分類任務的輸出層可能有多個神經元,可搭配 Softmax 輸出每個類別的機率(例如「 80% 是貓」);回歸任務則可以只用一個神經元,直接吐出數字(例如「房價預測一年後是 1500 萬」)。 預測出來的數值代表什麼意義:這道菜是什麼味道? 輸出層吐出來的永遠是數值,但這些數值的意義取決於神經網路面對的是什麼「任務」。…

為什麼創立 Chris3Keys?

為什麼創立 Chris3Keys?

身為一個熱愛自學的人,日常就是在網路上尋找學習資源,但一直沒找到一個讓我特別喜歡的網站。有些網站有架構,但內容過於繁雜,一次丟出過多資訊,沒有明確的主次之分;也有些網站,文章冷冰冰的,像在讀說明書,讓人看了毫無共鳴。

在自學初期,我覺得學習最重要的不是把所有資訊一口氣塞進大腦,而是懂得適時捨棄、聚焦重點,沿著清楚的方向前進、建立知識之間的連結。這正是我想創立 Chris3Keys 的初衷。