中文詞彙與跨語詞彙抽取技術在數位佛典上的研發與應用

本計畫為國科會數位典藏技術分項計畫的其中一項。其目標及成果是要支援建立一個方便佛教學者研究工作的環境與平台。

抽詞及建立跨語詞彙集,是達成上述研究平台目標的重要基礎工作。以各種不同版本及語言的佛經來說,抽詞及建立跨語詞彙表的工作,也可以應用在工具書的整理、文獻學與考證學的研究上。並且還能衍伸出多項資料統計議題上的研究與探討。

特色:

資訊檢索技術結合佛學資源初步研究,索引技術、演算法、跨語統計等。

簡介:

本計畫為國科會數位典藏技術分項計畫的其中一項。其目標及成果是要支援建立一個方便佛教學者研究工作的環境與平台。

抽詞及建立跨語詞彙集,是達成上述研究平台目標的重要基礎工作。以各種不同版本及語言的佛經來說,抽詞及建立跨語詞彙表的工作,也可以應用在工具書的整理、文獻學與考證學的研究上。並且還能衍伸出多項資料統計議題上的研究與探討。

內容:

  • 抽辭演算法 / Indices and Algorithms
  • 多語言佛學語料庫 / Cross-Language Corpora
  • CBETA 全文資源分析統計 / CBETA Statitstics
  • 語用索引檢索系統 / Concordance Search