loader

中研院啟用東亞最大規模文字圖像資料庫

「簡牘文書」是昔人以墨筆書寫於竹木片上的紀錄,在歷史研究、藝術表現都具有極高價值,對專家或業餘人士都同樣苦於缺乏妥善的檢索工具,中央研院究今(13)日正式啟用「歷史文字資料庫統合檢索系統」,整合的5個資料庫約有150萬件高解析度文字圖像,均依創用CC條款釋出,為東亞規模最大的文字圖像資料庫,且可免費下載,便利各方進行加值利用。

「歷史文字資料庫統合檢索系統」源自中研院院歷史語言研究所與數位文化中心自2019年起開發的「簡牘字典—史語所藏居延漢簡資料庫」,今年進一步與日本奈良文化財研究所、東京大學史料編纂所、國文學研究資料館、國立國語研究所、京都大學人文科學研究所等五大學研機構合作,建置起便利入口網站,使用者可因此進行跨國、跨機構檢索橫跨千年的高畫質歷史文字圖像。

該資料庫內容的大整合,源自中國與日本的簡牘與紙本、文書與典籍、抄本與刻本等紀元前至19世紀的文字圖像數位資源。數位文化中心陳淑君執行秘書表示,與日本學研機構共同確立了文字圖像數位資源共享與流通的體制,並議定一致的國際圖像互通架構(International Image Interoperability Framework, IIIF)規範,相同的語法規範,可供多方共同遵循,如此一來,便可從彼此的資料庫中檢索出指定的單字圖像。

計畫主持人、中研院史語所劉欣寧助研究員亦表示,此檢索系統是文字圖像典藏機構間首次創新合作模式,這次系統的公開上線只是起點,未來將持續號召其他典藏機構加入,並嘗試深化技術。期許在文字圖像資源共享的理念下,突破時空的限制,重現東亞漢字文化圈的源流與歷史脈絡。

相關連結:歷史文字資料庫統合檢索系統:https://wcd-ihp.ascdc.sinica.edu.tw/union/search.php開放性資料庫—簡牘字典https://openmuseum.tw/muse/exhibition/332ff29e0082d9f490ae3415da259b7b簡牘字典—史語所藏居延漢簡資料庫:https://wcd-ihp.ascdc.sinica.edu.tw/woodslip/index.php