教師資料查詢 | 類別: 會議論文 | 教師: 林丕靜 NANCY PEI-CHING LIN (瀏覽個人網頁)

標題:以FAT演算法挖掘頻繁學習序列
學年95
學期1
發表日期2006/10/27
作品名稱以FAT演算法挖掘頻繁學習序列
作品名稱(其他語言)
著者郝維華; 林丕靜; 陳宏任; 闕豪恩; 張忠義; 廖珮妤; 邱展逢
作品所屬單位淡江大學資訊工程學系
出版者
會議名稱2006數位落差與數位學習研討會=Divide and Digital Learning Conference 2006
會議地點臺中, 臺灣
摘要序列模式(Sequential Pattern)的運用層面很廣泛,是資料挖掘的重要研究領域之一。研究這類型主題的主要問題之一就是在挖掘的過程中產生太多的候選序列(candidates),增加記憶體需求的負擔以及處理這些序列的時間以及CPU資源。本研究提出快速累計樹(Fast Accumulation Tree,FAT)演算法,僅需掃描序列資料庫一次,以序列資料庫內之序列為累計樹之節點(node),建立準壓縮之累計樹狀結構。FAT的優點有:可以減少掃描資料庫的次數,降低累計樹的累計次數及搜尋次數,減小演算法對於記憶體的需求,而有效的尋找頻繁序列(Frequent Sequence)及最大頻繁序列(Maximal Frequent Sequence)。FAT分為三個階段:產生累計樹階段(Generation Phrase)、修剪階段(Pruning Phrase)及最大序列階段(Maximal Phrase)。FAT掃描資料庫一次即可建立累計樹ATree,過程中無須產生過多的候選序列(Candidates),因此FAT演算法可以在記憶體中執行,可迅速、有效率的從學習歷程中尋找頻繁序列。不同於AprioriALL方法,須要多次掃描資料庫,產生大量的候選序列(candidates)降低執行效率,而且比較不受到最小支持率(minimum support)變化的影響,越低的最小支持率產生越多的候選序列,需要更多的記憶體,及更長的運算時間。數位學習系統記錄學員(Learner)之學習歷程(Portfolio),包括學習成績、修習課程、以及修習課程的學習序列(Learning Sequence) ,又稱為學習路徑。根據英雄所見略同(Great mind think alike),成功族群的學習序列值得作為新學員的參考,亦可以預測學生學習狀況。從學生學習歷程(Portfolio)挖掘出頻繁序列(Frequent Sequences) 。數位學習標準如SCORM2004讓教學設計者可以依據學生狀況及教材內容編定學生學習路徑,不過這過於偏重於教學設計者的主觀想法,若以成功族群的學習序列編定的學習路徑及教材單元(SCO)之組合,稱為活動樹(Activity Tree),將會提供新學員更客觀的成功學習路徑。
關鍵字資料挖掘;序列;數位學習
語言中文
收錄於
會議性質國內
校內研討會地點
研討會時間20061027~20061027
通訊作者
國別中華民國
公開徵稿Y
出版型式紙本
出處2006數位落差與數位學習研討會論文集=Proceedings of Divide and Digital Learning Conference 200610頁
相關連結
Google+ 推薦功能,讓全世界都能看到您的推薦!