以相似度為基礎之CubicPower即時主題寫作知識庫系統設計 | |
---|---|
學年 | 111 |
學期 | 1 |
發表日期 | 2022-12-15 |
作品名稱 | 以相似度為基礎之CubicPower即時主題寫作知識庫系統設計 |
作品名稱(其他語言) | |
著者 | 夏肇毅 |
作品所屬單位 | |
出版者 | |
會議名稱 | TANET2022臺灣網際網路研討會 |
會議地點 | 桃園市,台灣 |
摘要 | 即時主題寫作知識庫系統包括六法全書,觀光景點餐廳美食遊記,新聞,Wiki,新聞人名,論文摘要,國考檢定考題,辭典等。希望提供使用者在寫作的時候,能有許多參考的資料來輔助思緒。我們採用CubicPower的高速大數據引擎,來實現即時回應的目標。CubicPower大數據引擎開發平台是基於多開發語言的平台,使用簡單獨特的CubicPower共通運算代碼來開發系統。知識庫整體的結構為全文,段落,句子與詞這四個階層。不同主題的深度語料先經過分詞與全文檢索的連結處理,再建成多階層的結構以便利查詢。整個產品就像是架構在一個搜索引擎內的飛機,可以先由一個字詞的出發點出發,然後在句子間遊走,或是進入段落間穿梭。它可以以詞找句後,再以句找句,或以詞找段落後,再以段落找段落。各個知識庫的語料是由網路中蒐集而來,所以不是用來複製貼上,而是能提供許多相似概念的句子和段落,來啟發寫作靈感,以幫助作者在不同的意念中遊走。整個設計的重點在於即時性,所以性能是設計的關鍵。 |
關鍵字 | 知識庫;CubicPower;大數據引擎;即時;詞找句;句找句 |
語言 | zh_TW |
收錄於 | |
會議性質 | 國內 |
校內研討會地點 | 無 |
研討會時間 | 20221215~20221215 |
通訊作者 | 夏肇毅 |
國別 | TWN |
公開徵稿 | |
出版型式 | |
出處 | |
相關連結 |
機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/124151 ) |