教師資料查詢 | 類別: 會議論文 | 教師: 魏世杰 Wei Shih-chieh (瀏覽個人網頁)

標題:運甪重複句排除技術於中文文件自動摘要之研究
學年95
學期2
發表日期2007/05/26
作品名稱運甪重複句排除技術於中文文件自動摘要之研究
作品名稱(其他語言)
著者魏世杰; 陳姿妤
作品所屬單位淡江大學資訊管理學系
出版者桃園縣銘傳大學資訊管理學系
會議名稱第十八屆國際資訊管理學術研討會=The 18th International Conference on Information Management
會議地點臺北市, 臺灣
摘要本研究針對中文文件,以TFIDF 法為基礎,同時考量句子與文章標題句之間的相似度,作為選取文章內重要句子的方法;並基於Hownet計算詞彙之間的同義詞相似度,結合Jaccard 概念詞相似度函數,過濾摘要中資訊重複的句子,以期提升自動摘要結果的精確度。
實驗結果發現,使用TFIDF 為基礎的詞彙權重計算,若配合句子與文章標題句之間的相似度特徵,可提升摘要結果的平均精確度約7% 。而摘要結果中結合Jaccard概念詞相似度函數與基於Hownet 所求得的同義詞相似度,用於重複句排除的計算上,可達到提升摘要精確度的效果。
關鍵字自動摘要;TFIDF;相似度;Hownet;重複句排除
語言中文
收錄於
會議性質國際
校內研討會地點
研討會時間20070526~20070526
通訊作者
國別中華民國
公開徵稿Y
出版型式紙本
出處第十八屆國際資訊管理學術研討會論文集=Proceedings of 18th International Conference on Information Management
相關連結
Google+ 推薦功能,讓全世界都能看到您的推薦!