學年
|
111 |
學期
|
1 |
發表日期
|
2022-12-15 |
作品名稱
|
TANET2022-夏肇毅-以相似度為基礎之CubicPower即時主題寫作知識庫系統設計 |
作品名稱(其他語言)
|
|
著者
|
夏肇毅 |
作品所屬單位
|
|
出版者
|
|
會議名稱
|
TANET2022臺灣網際網路研討會 |
會議地點
|
桃園市,台灣 |
摘要
|
即時主題寫作知識庫系統包括六法全書,觀光景點餐廳美食遊記,新聞,Wiki,新聞人名,論文摘要,國考檢定考題,辭典等。希望提供使用者在寫作的時候,能有許多參考的資料來輔助思緒。我們採用CubicPower的高速大數據引擎,來實現即時回應的目標。CubicPower大數據引擎開發平台是基於多開發語言的平台,使用簡單獨特的CubicPower共通運算代碼來開發系統。知識庫整體的結構為全文,段落,句子與詞這四個階層。不同主題的深度語料先經過分詞與全文檢索的連結處理,再建成多階層的結構以便利查詢。整個產品就像是架構在一個搜索引擎內的飛機,可以先由一個字詞的出發點出發,然後在句子間遊走,或是進入段落間穿梭。它可以以詞找句後,再以句找句,或以詞找段落後,再以段落找段落。各個知識庫的語料是由網路中蒐集而來,所以不是用來複製貼上,而是能提供許多相似概念的句子和段落,來啟發寫作靈感,以幫助作者在不同的意念中遊走。整個設計的重點在於即時性,所以性能是設計的關鍵。 |
關鍵字
|
知識庫;CubicPower;大數據引擎;即時;詞找句;句找句 |
語言
|
zh_TW |
收錄於
|
|
會議性質
|
國內 |
校內研討會地點
|
無 |
研討會時間
|
20221215~20221215 |
通訊作者
|
夏肇毅 |
國別
|
TWN |
公開徵稿
|
|
出版型式
|
|
出處
|
2022年臺灣網際網路研討會TANET暨資訊工程學門、智慧計算學門成果發表會論文集 |