TANET2022-夏肇毅-以相似度為基礎之CubicPower即時主題寫作知識庫系統設計
學年 111
學期 1
發表日期 2022-12-15
作品名稱 TANET2022-夏肇毅-以相似度為基礎之CubicPower即時主題寫作知識庫系統設計
作品名稱(其他語言)
著者 夏肇毅
作品所屬單位
出版者
會議名稱 TANET2022臺灣網際網路研討會
會議地點 桃園市,台灣
摘要 即時主題寫作知識庫系統包括六法全書,觀光景點餐廳美食遊記,新聞,Wiki,新聞人名,論文摘要,國考檢定考題,辭典等。希望提供使用者在寫作的時候,能有許多參考的資料來輔助思緒。我們採用CubicPower的高速大數據引擎,來實現即時回應的目標。CubicPower大數據引擎開發平台是基於多開發語言的平台,使用簡單獨特的CubicPower共通運算代碼來開發系統。知識庫整體的結構為全文,段落,句子與詞這四個階層。不同主題的深度語料先經過分詞與全文檢索的連結處理,再建成多階層的結構以便利查詢。整個產品就像是架構在一個搜索引擎內的飛機,可以先由一個字詞的出發點出發,然後在句子間遊走,或是進入段落間穿梭。它可以以詞找句後,再以句找句,或以詞找段落後,再以段落找段落。各個知識庫的語料是由網路中蒐集而來,所以不是用來複製貼上,而是能提供許多相似概念的句子和段落,來啟發寫作靈感,以幫助作者在不同的意念中遊走。整個設計的重點在於即時性,所以性能是設計的關鍵。
關鍵字 知識庫;CubicPower;大數據引擎;即時;詞找句;句找句
語言 zh_TW
收錄於
會議性質 國內
校內研討會地點
研討會時間 20221215~20221215
通訊作者 夏肇毅
國別 TWN
公開徵稿
出版型式
出處 2022年臺灣網際網路研討會TANET暨資訊工程學門、智慧計算學門成果發表會論文集