中文詞彙與跨語詞彙研究

中文詞彙與跨語詞彙抽取技術在數位佛典上的研發與應用

本計畫為國科會數位典藏技術分項計畫的其中一項。其目標及成果是要支援建立一個方便佛教學者研究工作的環境與平台。

抽詞及建立跨語詞彙集,是達成上述研究平台目標的重要基礎工作。以各種不同版本及語言的佛經來說,抽詞及建立跨語詞彙表的工作,也可以應用在工具書的整理、文獻學與考證學的研究上。並且還能衍伸出多項資料統計議題上的研究與探討。

特色:

資訊檢索技術結合佛學資源初步研究,索引技術、演算法、跨語統計等。

簡介:

本計畫為國科會數位典藏技術分項計畫的其中一項。其目標及成果是要支援建立一個方便佛教學者研究工作的環境與平台。

抽詞及建立跨語詞彙集,是達成上述研究平台目標的重要基礎工作。以各種不同版本及語言的佛經來說,抽詞及建立跨語詞彙表的工作,也可以應用在工具書的整理、文獻學與考證學的研究上。並且還能衍伸出多項資料統計議題上的研究與探討。

內容:

  • 抽辭演算法 / Indices and Algorithms
  • 多語言佛學語料庫 / Cross-Language Corpora
  • CBETA 全文資源分析統計 / CBETA Statitstics
  • 語用索引檢索系統 / Concordance Search

佛典研究平台建置

漢籍文獻數位研究環境之建立--以佛典研究平台的建置為例

本整合型總計畫共分為三個子計畫,其主要目的是擬以數位時代的新技術,建立適合「人文研究的數位研究環境」,以人文研究為主體,設計出具有高品質的數位內容,且適合不同的研究主題及需求,研發所需的資訊工具與平台。

計畫簡介:

佛教傳入中國後,留下大量珍貴的佛典文獻。經過長時間的翻譯、語言本身的變化、佛教義理的複雜性,及中國經典傳譯之史實等諸多問題,造成許多文獻研究上的謎團。為解決這些謎團,研究者可能必須進行大範圍的經典比對。傳統方式多依賴人工進行閱讀與比對,通常只能進行小範圍的研究。對於需要大範圍資料處理的問題,多半束手無策。為突破此限制,此計畫預計建立一個數位研究整合平台,用以整合佛典資料與現有的各式數位工具,使佛學研究者能容易取用相關的數位資源,以便真正克服研究上的障礙。在兩年的計畫中,我們預計以此數位平台,完成以下功能:

  • 提供完整的數位化經文內容,以供研究者進行閱讀與比對。
  • 整合歷代經錄內容,以提供經文完整的背景資料,並可透過經錄資料內容,進行分類與比對。
  • 提供快速的文字內容參考訊息,例如:字典查找、人名地名資料查找。
  • 能提供相關的文字統計訊息以便進行深入分析。
  • 分析因歷經多個朝代翻譯的經文,受到人、地、時的影響,所造成的錯誤,如:錯字、缺漏字、及讀音……等方面的問題。

計畫內容:

本整合型總計畫共分為三個子計畫,其主要目的是擬以數位時代的新技術,建立適合「人文研究的數位研究環境」,以人文研究為主體,設計出具有高品質的數位內容,且適合不同的研究主題及需求,研發所需的資訊工具與平台。

《現代語訳長阿含經》

《現代語訳長阿含經》註解索引

這個大型翻譯專案是受過漢學訓練的語言學家、印度學訓練的文獻學者和佛教學者的共同努力。他們專業知識的結合產生了豐富的研究註解,這些註解處理了阿含典籍不論從語言學或內容觀點來看都很重要的術語和異寫問題。這使得針對這些註解所討論到的字詞和段落所製作的索引,對於早期阿含佛教的學者以及漢譯佛典的研究學者特別有用。

特色:

六冊日譯長阿含經的註解索引

簡介:

六冊日譯長阿含經《現代語訳長阿含經》有一份未發行的註解索引,本校「阿含研究小組」對其校對、修訂、增補,提供 XML、PDF、HTML等格式的數位化版本。

內容:

《現代語訳長阿含經》參考書目如下:
Karashima Seishi (辛嶋静志)、Okayama Hajime (丘山新)、Kamitsuka Yoshiko (神塚淑子)、Kanno Hiroshi (菅野博史)、Sueki Fumihiko (末木文美士)、Hikita Hiromichi (引田弘道) 以及 Matsumura Takumi (松村巧),Gendaigo yaku agon kyōten: Jōagongyō. 現代語訳「阿含経典」, Tokyo: Hirakawa Shuppansha (平河出版社),1996-2005,六冊。

這個大型翻譯專案是受過漢學訓練的語言學家、印度學訓練的文獻學者和佛教學者的共同努力。他們專業知識的結合產生了豐富的研究註解,這些註解處理了阿含典籍不論從語言學或內容觀點來看都很重要的術語和異寫問題。這使得針對這些註解所討論到的字詞和段落所製作的索引,對於早期阿含佛教的學者以及漢譯佛典的研究學者特別有用。

此六冊譯本是基於首度發表於阿含月刊(月刊アーガマ)的一系列早期翻譯。 在此系列翻譯的基礎上,一份不完整的、未公佈的索引首度被製作。原始索引是由一群日本學生編譯,平河出版社(Hirakawa Shuppansha)前編輯榎本榮一(Eiichi Enomoto)負責彙編此原始索引。出版者平河出版社(Hirakawa Shuppansha)授權使用、修改並使此索引可被自由地使用。

此索引草稿經本校數位化,然後與六冊譯本對照,必要時補充和訂正。現在本索引涵蓋六冊譯本註解中所討論到的所有重要單詞和片語。

緬甸聖典寫本簡明目錄

緬甸聖典寫本簡明目錄

本緬甸寫本典藏簡明目錄,由中華佛學研究所與法國遠多學院(Ecole Francaise d’Extreme-Orient)合作編目。共整理二百四十五函貝葉寫本,文字雖只用一種緬甸當地文字刻在貝葉上,語言則有巴 利、緬甸二種。有些本子全是巴利語,諸如上座部三藏裡的文獻及其疏、鈔以及單行的佛學論著或作品。有些全是緬甸語,有些部分為巴利文,巴利典籍逐詞的翻譯、註釋,則巴緬二語並用。典藏中最早的年代是西元1724年,最晚的是西元1930年。

特色:

二百四十五函貝葉寫本圖檔、巴緬雙語註釋,涵蓋各層面歷 史、語法等重要學科。

簡介:

本緬甸寫本典藏簡明目錄,由中華佛學研究所與法國遠多學院(Ecole Francaise d’Extreme-Orient)合作編目。共整理二百四十五函貝葉寫本,文字雖只用一種緬甸當地文字刻在貝葉上,語言則有巴 利、緬甸二種。有些本子全是巴利語,諸如上座部三藏裡的文獻及其疏、鈔以及單行的佛學論著或作品。有些全是緬甸語,有些部分為巴利文,巴利典籍逐詞的翻譯、註釋,則巴緬二語並用。典藏中最早的年代是西元1724年,最晚的是西元1930年。

內容:

含律藏 127 部,經藏 66 部,論藏 67 部,以及 49 部語法書和辭典。典藏除佛教律、經、論之外 ,尚有故事集(如Sīhalavattu)、詩集(如Jinālaṅkāra)、佛學論著(如Sāratthasaṅgaha)、錫蘭佛 教史(包括罕見且未經斠勘的《佛額舍利史》Nalāṭadhātubvaṃ-sa)、未見他錄的巴緬逐詞對照譯 本(nissaya)以及多達四十九部的語法書和辭典(如Abhidhānappadīpikā、Kaccāyanapakaraṇa、 Kaccāyanavutti、Saddanīti)涵蓋各層面及歷史、語法等重要學科。

公告

已結案。專輯光碟於 2002年發行,請洽「數位典藏組 da@dila.edu.tw」。

佛教藏經目錄資料庫

佛教藏經目錄數位資料庫

以CBETA現有的數位典藏基礎,及歷代佛典經錄、法寶總目錄、《法寶義林–大正大藏經總索引 》等CBETA所建置或未列入的作業規劃等文獻資料為基礎,配合當代資訊科技,與TEI Markup等 標準規範,建構佛典知識管理系統,提綱挈領掌握浩瀚佛典整體內容。

特色:

古今中外完整的經錄整理、檢索、與經文知識內容管理。

簡介:

以CBETA現有的數位典藏基礎,及歷代佛典經錄、法寶總目錄、《法寶義林–大正大藏經總索引 》等CBETA所建置或未列入的作業規劃等文獻資料為基礎,配合當代資訊科技,與TEI Markup等 標準規範,建構佛典知識管理系統,提綱挈領掌握浩瀚佛典整體內容。

內容:

  • 古今中外完整的經錄
  • 提供檢索等資訊功能
  • 連結至各項相關內容
  • 經文知識內容的管理

民國佛教期刊書目資料庫

民國佛教期刊書目資料庫

為了提供國內外學術界和宗教界人士研究「漢傳佛教」中「民國佛教」資料的方便性,特建置《民國佛教文獻期刊集成》目錄,以幫助學界與教界一窺「民國佛教」的全貌。《民國佛教文獻期刊集成》收錄了152種民國佛教期刊,內容包含重要的佛教學術論文、珍貴圖片、佛教消息新聞以及相關的出版品,若要通盤了解民國佛教的重要人物、歷史以及當時世界各地的佛教交流,便可透過民國佛教文獻期刊集成目錄更快速、更精確的檢索到相關的研究資料。

特色:

《民國佛教文獻期刊集成》收錄了152種民國佛教期刊。

簡介:

為了提供國內外學術界和宗教界人士研究「漢傳佛教」中「民國佛教」資料的方便性,特建置《民國佛教文獻期刊集成》目錄,以幫助學界與教界一窺「民國佛教」的全貌。《民國佛教文獻期刊集成》收錄了152種民國佛教期刊,內容包含重要的佛教學術論文、珍貴圖片、佛教消息新聞以及相關的出版品,若要通盤了解民國佛教的重要人物、歷史以及當時世界各地的佛教交流,便可透過民國佛教文獻期刊集成目錄更快速、更精確的檢索到相關的研究資料。

佛學詞彙研究資源

佛教文獻詞彙數位資源之建置與研究—數位時代的佛學工具書與整合服務

本計畫為國科會數位典藏技術分項計畫的其中一項。其目標及成果是要支援建立一個方便佛教學者研究工作的環境與平台。
抽詞及建立跨語詞彙集,是達成上述研究平台目標的重要基礎工作。以各種不同版本及語言的佛經來說,抽詞及建立跨語詞彙表的工作,也可以應用在工具書的整理、文獻學與考證學的研究上。並且還能衍伸出多項資料統計議題上的研究與探討。

特色:

以國際文獻標準規範TEI Markup,將文獻典藏內容化為資料庫,應用資訊技術轉換成數位工具書的型態。本資料庫除具備傳統工具書的功能外,亦提供跨資料庫連結查詢、資料比對、統計、引用等多項功能。

簡介:

本計畫為國科會數位典藏技術分項計畫的其中一項。其目標及成果是要支援建立一個方便佛教學者研究工作的環境與平台。
抽詞及建立跨語詞彙集,是達成上述研究平台目標的重要基礎工作。以各種不同版本及語言的佛經來說,抽詞及建立跨語詞彙表的工作,也可以應用在工具書的整理、文獻學與考證學的研究上。並且還能衍伸出多項資料統計議題上的研究與探討。

內容:

  • 抽辭演算法 / Indices and Algorithms
  • 多語言佛學語料庫 / Cross-Language Corpora
  • CBETA 全文資源分析統計 / CBETA Statitstics
  • 語用索引檢索系統 / Concordance Search

佛學詞典

佛學詞典

以開放式軟體及公開標準製作、發行各種佛學辭典。目前已收錄11部佛學辭典,語文涵蓋中文、英文、梵文、巴利文、藏文、滿文、蒙古文,總計超過十萬筆詞條。以TEI XML、HTML、PDF、Babylon、Stardict、ePub、Dr.eye等格式公開免費下載。

特色:

持續收錄各種佛學詞典, 提供 XML-TEI、HTML、PDF、ePub 等格式。

簡介:

以開放式軟體及公開標準製作、發行各種佛學辭典。目前已收錄11部佛學辭典,語文涵蓋中文、英文、梵文、巴利文、藏文、滿文、蒙古文,總計超過十萬筆詞條。以TEI XML、HTML、PDF、Babylon、Stardict、ePub、Dr.eye等格式公開免費下載。

佛學規範資料庫

佛學規範資料庫

本專案目的為整合本組已完成與進行中之各專案的人物與地點資料,並建立歷史對照年表,以利日後數位佛學專案之資源共享與未來可能之跨專案搜尋應用,因此建立時間、地點及佛典人物等三個規範資料庫。

特色:

提供時間對照檢索,人名檢索,地名檢索功能。

簡介:

本專案目的為整合本組已完成與進行中之各專案的人物與地點資料,並建立歷史對照年表,以利日後數位佛學專案之資源共享與未來可能之跨專案搜尋應用,因此建立時間、地點及佛典人物等三個規範資料庫。

《印順法師著作集》數位化

《印順法師著作集》數位化

為了永續典藏印順法師之著作,使《印順法師佛學著作集》光碟能更廣泛長遠地被運用,並且能符合各種不同裝置平臺運行系統的使用需求,印順文教基金會與圖書資訊館數位典藏組合作,將原有所製作的「導師光碟」電子檔案重新採用國際文獻標準規範TEI(Text Encoding Initiative)「標記」(XML Marcup),並且新增《大乘廣五蘊論講記》一書。全集著作進行嚴謹的勘誤、引文出處查證與訛誤修訂、新式標點符號等修正,以增進佛學文獻數位化、法義學習及學術研究之品質。此成果將助於印順法師思想學說之弘揚,進而推廣佛法之正知見,淨化社會人心。

  • 網址:開發中,尚未公開。

特色:

收錄印順法師著作45冊。提供全文檢索,引用複製等功能。

簡介:

為了永續典藏印順法師之著作,使《印順法師佛學著作集》光碟能更廣泛長遠地被運用,並且能符合各種不同裝置平臺運行系統的使用需求,印順文教基金會與圖書資訊館數位典藏組合作,將原有所製作的「導師光碟」電子檔案重新採用國際文獻標準規範TEI(Text Encoding Initiative)「標記」(XML Marcup),並且新增《大乘廣五蘊論講記》一書。全集著作進行嚴謹的勘誤、引文出處查證與訛誤修訂、新式標點符號等修正,以增進佛學文獻數位化、法義學習及學術研究之品質。此成果將助於印順法師思想學說之弘揚,進而推廣佛法之正知見,淨化社會人心。