以螞蟻、塔布基因為基礎的混合式雞尾酒分群法之探討 | |
---|---|
學年 | 97 |
學期 | 2 |
發表日期 | 2009-05-23 |
作品名稱 | 以螞蟻、塔布基因為基礎的混合式雞尾酒分群法之探討 |
作品名稱(其他語言) | |
著者 | 李鴻璋; 朱芳儀 |
作品所屬單位 | 淡江大學資訊管理學系 |
出版者 | 資訊管理學會 |
會議名稱 | 第二十屆國際資訊管理學術研討會=The 20th International Conference Information Management |
會議地點 | 臺北市, 臺灣 |
摘要 | 分群是將物件分類成群,在分群的許多方法中,包含階層式分群法、分割式分群法、密度分群法,近來更有啟發式演算法在分群上的應用。而對於傳統的分割式分群法,例如常見的K-means,使用者往往必須先決定群數,才能進行分群。本研究目的是建立一個不需事先輸入群數的分群法,並利用此方法探討使用各種分群效度指標作為目標函數的分群效果。提出一個能自動決定適合群數的演算法AGKT,混合了螞蟻分群、基因演算法、塔布搜尋法及K-means。演算法分為兩階段:第一階段由螞蟻分群法(ASCA)產生初始群組;第二階段使用基因、塔布的概念找出最適合的群數,並使用K-means分群,並以分群效度作為指標,找出最佳的分群數與分群結構。 使用UCI Machine Learning Repository和Gerrild and Lantz所提供的4個資料集,和其它七個分群方法進行比較。此外亦利用該資料集,探討目前提出之分群效度指標,並提出一種新的效度指標PBM+ index。實驗結果顯示,相較於其它7個分群方法,本方法AGKT能非常快速且正確分群,第一階段的初始分群配合第二階段基因遮罩,決定K-means的起始重心點,相較於ESTA分群法,AGKT平均約快40倍且在分群效度表現上差不多。此外利用UCI Machine Learning Repository和Gerrild and Lantz所提供的4個資料集,探討4種不同的分群效度指標,分別為:Dunn's index、Davies Boundin index、PBM index及我們所提出的PBM+ index。而實驗證實,4種分群效度指標中,以PBM+ index作為目標函數,得到了較好的分群結果。 |
關鍵字 | 螞蟻分群法;基因演算法;塔布搜尋法;K均值法;分群效度指標 |
語言 | zh_TW |
收錄於 | |
會議性質 | 國際 |
校內研討會地點 | |
研討會時間 | 20090523~20090523 |
通訊作者 | |
國別 | TWN |
公開徵稿 | |
出版型式 | 紙本 |
出處 | 第二十屆國際資訊管理學術研討會論文集=Proceedings of the 20th International Conference Information Management,11頁 |
相關連結 |
機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/63288 ) |