這堂課介紹 TEI (Text Encoding Initiative) ── 一種標記文本的方法,標記的目的是讓電腦能讀懂文本 (machine-readable),以開啟用電腦分析文本的可能性。祝平次老師將介紹 TEI 的架構,並以他的研究資料為例,讓大家看看用 TEI 標記後的歷史文本長什麼樣,以及標記之後能有什麼樣的應用。
講者:祝平次(清華大學中文系副教授)
課程錄影:
講解示範大綱:(請參考課程投影片)
課程測試資料下載:
課程投影片下載:
參考網路資源:
課程錄影:
講解示範大綱:(請參考課程投影片)
- 關於TEI
- Text Encoding Initiative
- TEI是西方人文學界用來標註文本的一套標準系統。
- 給的越多,就得到越多;標越多東西,就有越多操作的可能性。
- 客制化的檢索瀏覽系統(TEI+eXist):以部分《全宋文.朱熹》為例。
- 示範網站(因為掛在個人電腦,常常掛掉;如有這種現象,敬請原諒;講解當天會把資料掛在電腦裏,以防萬一):
- http://140.114.113.168:8080/exist/rest//db/china/qsw/index.html (使用者名稱:guest,密碼保持空白)
- http://140.114.113.168:8080/exist/rest//db/china/qss/index.html
- 串聯檔案
- 線上編輯
- TEI能做什麼?以《全宋詩.邵雍》為例。
- 示範網站(因為掛在個人電腦,常常掛掉;如有這種現象,敬請原諒;講解當天會把資料掛在電腦裏,以防萬一):
- 包含詩題中人名的前一個字是什麼?
- 邵雍好以「吟」做為詩題,在他的詩中有幾首以吟為題目最後一個字的詩?
- TEI和人文研究
- 資料的結構性
- 迅速集聚資料
- 分類研究
課程測試資料下載:
- 部分全宋詩(邵雍)、部分全宋文(朱熹): http://tinyurl.com/tei-samples
課程投影片下載:
- PDF格式:http://tinyurl.com/tei-ppt-pdf
- MSPowerPoint(2010)格式:http://tinyurl.com/tei-ppt
- 示範影片段落:http://tinyurl.com/tei-swf
參考網路資源:
- TEI 官網:http://www.tei-c.org
- eXist db 官網:http://exist-db.org/exist/index.xml
- oXygen XML編輯器(教育版權只要64美金):http://www.oxygenxml.com/
當日課程錄影:
沒有留言:
張貼留言