蔡憶佳 ISAAC YIHJIA TSAI | 深度學習影像處理

研究報告

學年	110
學期	2
出版（發表）日期	2022-04-22
作品名稱	深度學習影像處理
作品名稱（其他語言）
著者	蔡憶佳
單位
描述
委託單位
摘要	Unet 是由 Ronneberger,Fischer 和 Brox 三人於 2015 年發表的網路模型 [18]，用於醫學影像的語意分割。其名稱是由整體的結構形狀類似英文字母 U 而命名，如圖一。圖一. Unet架構原始 Unet 的架構來自一些前期的相關研究，例如在 2012 年，Ciresan et al.[3] 提出使用「滑動視窗」(sliding window) 方式進行辨識細胞膜構造，經由如此運算，因為有重疊區域，會增加計算量，也算是一種資料擴增方式。視窗的大小也影響計算量與位置精確度，視窗太小則包含的資訊量太少，太大的視窗則需要經過聚合池化降低位置精確度。在 2015 年提出的「躍級欄」(hypercolumn) 概念 [5]，這是輸入影像的某一像素與相對應位置在各特徵圖上的像素値整體構成一個向量的名稱。這組向量稱為相對應像素的「躍級欄」(hypercolumn)。因在卷積網路中的最後一層，是包含類別的語意信息，而較少有輸入影像的動態資訊。若是語意資訊的細膩度包括目標分割與姿態分析等，直接使用最後一層特徵圖資訊並不是最佳的選擇。因此有跨越不同層的「跨層欄」(hypercolumn) 概念，參考圖二，結合各層資訊到最後的特徵圖中。
關鍵字	深度學習;影像處理
語言	zh_TW
相關連結	機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/123987 )