運甪重複句排除技術於中文文件自動摘要之研究
學年 95
學期 2
發表日期 2007-05-26
作品名稱 運甪重複句排除技術於中文文件自動摘要之研究
作品名稱(其他語言)
著者 魏世杰; 陳姿妤
作品所屬單位 淡江大學資訊管理學系
出版者 桃園縣:銘傳大學資訊管理學系
會議名稱 第十八屆國際資訊管理學術研討會=The 18th International Conference on Information Management
會議地點 臺北市, 臺灣
摘要 本研究針對中文文件,以TFIDF 法為基礎,同時考量句子與文章標題句之間的相似度,作為選取文章內重要句子的方法;並基於Hownet計算詞彙之間的同義詞相似度,結合Jaccard 概念詞相似度函數,過濾摘要中資訊重複的句子,以期提升自動摘要結果的精確度。 實驗結果發現,使用TFIDF 為基礎的詞彙權重計算,若配合句子與文章標題句之間的相似度特徵,可提升摘要結果的平均精確度約7% 。而摘要結果中結合Jaccard概念詞相似度函數與基於Hownet 所求得的同義詞相似度,用於重複句排除的計算上,可達到提升摘要精確度的效果。
關鍵字 自動摘要;TFIDF;相似度;Hownet;重複句排除
語言 zh_TW
收錄於
會議性質 國際
校內研討會地點
研討會時間 20070526~20070526
通訊作者
國別 TWN
公開徵稿 Y
出版型式 紙本
出處 第十八屆國際資訊管理學術研討會論文集=Proceedings of 18th International Conference on Information Management
相關連結

機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/22960 )

機構典藏連結