以螞蟻、塔布基因為基礎的混合式雞尾酒分群法之探討
學年 97
學期 2
發表日期 2009-05-23
作品名稱 以螞蟻、塔布基因為基礎的混合式雞尾酒分群法之探討
作品名稱(其他語言)
著者 李鴻璋; 朱芳儀
作品所屬單位 淡江大學資訊管理學系
出版者 資訊管理學會
會議名稱 第二十屆國際資訊管理學術研討會=The 20th International Conference Information Management
會議地點 臺北市, 臺灣
摘要 分群是將物件分類成群,在分群的許多方法中,包含階層式分群法、分割式分群法、密度分群法,近來更有啟發式演算法在分群上的應用。而對於傳統的分割式分群法,例如常見的K-means,使用者往往必須先決定群數,才能進行分群。本研究目的是建立一個不需事先輸入群數的分群法,並利用此方法探討使用各種分群效度指標作為目標函數的分群效果。提出一個能自動決定適合群數的演算法AGKT,混合了螞蟻分群、基因演算法、塔布搜尋法及K-means。演算法分為兩階段:第一階段由螞蟻分群法(ASCA)產生初始群組;第二階段使用基因、塔布的概念找出最適合的群數,並使用K-means分群,並以分群效度作為指標,找出最佳的分群數與分群結構。 使用UCI Machine Learning Repository和Gerrild and Lantz所提供的4個資料集,和其它七個分群方法進行比較。此外亦利用該資料集,探討目前提出之分群效度指標,並提出一種新的效度指標PBM+ index。實驗結果顯示,相較於其它7個分群方法,本方法AGKT能非常快速且正確分群,第一階段的初始分群配合第二階段基因遮罩,決定K-means的起始重心點,相較於ESTA分群法,AGKT平均約快40倍且在分群效度表現上差不多。此外利用UCI Machine Learning Repository和Gerrild and Lantz所提供的4個資料集,探討4種不同的分群效度指標,分別為:Dunn's index、Davies Boundin index、PBM index及我們所提出的PBM+ index。而實驗證實,4種分群效度指標中,以PBM+ index作為目標函數,得到了較好的分群結果。
關鍵字 螞蟻分群法;基因演算法;塔布搜尋法;K均值法;分群效度指標
語言 zh_TW
收錄於
會議性質 國際
校內研討會地點
研討會時間 20090523~20090523
通訊作者
國別 TWN
公開徵稿
出版型式 紙本
出處 第二十屆國際資訊管理學術研討會論文集=Proceedings of the 20th International Conference Information Management,11頁
相關連結

機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/63288 )

機構典藏連結