華人流行音樂史上重要的二十年:上海灘之後的發展
趙明誠與他的收藏家朋友們:數位人文方法初探

「為而不有」的志業

 

林富士(中央研究院歷史語言研究所研究員)

 

  • 1942年第一部電子電腦ABC電腦(Atanasoff–Berry Computer)誕生。
  • 1946年第一部通用型的巨型電腦ENIAC成功展示。
  • 1968年7月18日Intel半導體公司正式成立。
  • 1975年4月4日Microsoft軟體公司正式成立。
  • 1981年8月12日IBM 5150個人電腦問世。
  • 1983年1月1日TCP/IP協定奠定網際網路基石。
  • 1984年1月24日首台Macintosh電腦開啟蘋果(Apple)風潮。
  • 1985年Qualcomm無線電通訊技術研發公司正式成立。
  • 1986年IBM首部筆記本電腦PC Convertible問世。
  • 1995年Amazon.com電子商務網站上線。
  • 1999年Google啟動搜索引擎。
  • 2001年1月15日Wikipedia網路百科全書正式推出。
  • 2004年2月4日Facebook社群媒體上線。
  • 2005年2月YouTube影片分享網站倡議「廣播你自己」(Broadcast Yourself)。
  • 2007年首支iPhone問世,帶動「移動」(mobile)通訊與運算模式。



螢幕快照 2017-11-09 下午12.21.20

圖1  1942年誕生的第一部電子電腦ABC電腦(Atanasoff–Berry Computer)
(圖片來源:http://www.computerhistory.org/revolution/birth-of-the-computer/4/99)


上述這些年代,不僅標示了一些重要資通訊技術(ICT)與企業的誕生,也記錄了人類邁向「數位時代」(Digital Era)的幾個關鍵點。

就在這最近七十五年間,這一類的數位科技以蠶食鯨吞的方式,逐步攻佔人類社會的各個角落和各個層面;舉凡政治、經濟、軍事、宗教、藝術、學術、教育、生活等,無不有其蹤影。任何人都無法逃避「數位革命」(Digital Revolution)的洗禮。

而從知識生產、訊息傳播、文化傳承的方式來看,在歷經口語、文字書寫、文字印刷這三個階段的演進之後,人類文明開始進入數位多媒體時代。因此,以語言、文字為主要研究文本和傳播媒介的人文學者,也面臨了研究範式轉移的挑戰。

面對這樣的發展趨勢,西方的人文學者其實很快就作出回應。早在1949-1970年代便興起「人文計算學」(Humanities Computing),開始運用電腦來處理古代文獻的詞彙,並進行量化統計、分析。其後,在1980-1990年代,更進一步發展以建立「電子文本」(e-text)和「數位典藏」(digital archives)為核心工作的人文學研究。到了二十一世紀,結合數位科技與人文研究的「數位人文學」(Digital Humanities)更是大張旗鼓,逐漸蔚為風潮。這個新興的領域,無論是研究的材料、工具、方法、對象、課題,還是研究成果的呈現與傳播方式,都和傳統人文學有所差異。

而在台灣,受限於特殊的「語文」,我們的人文學進入「數位時代」的時間落後了西方將近三十年。一直到1980年前後,「中文電腦化」所需的三大基礎工作,亦即中文字編碼(標準交換碼)、中文字型數位檔、中文輸入法,才全告完成,人文學者也才能運用電腦從事研究工作。總之,到了1980年代,電腦的中文化已具備雛形,也為台灣的「人文計算學」或數位人文研究提供了基礎設施,而真正揭開序幕的則是兩個重要的「自動化」計畫。

首先是由中國圖書館學會與國立中央圖書館所主導、推動的「全國圖書館自動化作業系統計畫」(1980-1982),其次是由中央研究院(以下簡稱「中研院」)歷史語言研究所(以下簡稱「史語所」)和資訊科學研究所、計算中心合作推動的「史籍自動化計畫」(1984-1990)。這兩個「自動化」計畫影響極為深遠。以「圖書館自動化」計畫來說,雖然執行期間只有三年,但所規畫的目標及工作項目,在1980年代仍持續被各大圖書館深化、落實,從1990年起,還進一步配合網際網路的發展,整合各級圖書館,推動「圖書館自動化及網路系統整合」計畫,並陸續建置各種電子資料庫。

至於「史籍自動化」計畫,在執行過程中,從1986年起,中研院即有語言學家與資訊科學家以此為基礎,開發出「中文詞知識庫」和「語料庫」,開啟了中文自然語言處理(natural language processing)和計算語言學(computational linguistics)的研究。而在「史籍資料庫」完成之後,史語所隨即展開二十五史之外的各種經、史、子、集的傳統文獻全文資料庫建置工作,並在1993年將資料庫更名為「漢籍全文資料庫」。中研院其他研究單位(包括文哲所、近史所、台史所)也陸續參與建置漢籍全文資料庫的工作。這不僅讓台灣在1990年代初期成為全世界「漢籍」資料庫的領導者,也讓台灣文史學界及世界漢學界在檢索、運用傳統文獻的方式及速度有了革命性的變化。

  螢幕快照 2017-11-09 下午12.37.040
                                  圖2 漢籍資料庫(圖片來源:http://hanchi.ihp.sinica.edu.tw/ihp/hanji.html               

不過,這個階段仍偏重於文字(語言)與文獻的處理,一直到1990年代末期,大家才逐漸將目光及心力轉向非文字性的「物件」。最具指標性的發展是1998年由中研院與國立台灣大學負責規畫、推動的「數位博物館專案計畫」(1998-2001),其目的在於結合各典藏、研究單位「整合建置適合國情並且具有本土特色的『數位化博物館』,以發展教育性網際網路內涵」。當時已朝向知識傳播的方向前進,至於數位內容,除了文字性的材料之外,已擴及動物、植物、檔案、地圖、考古出土的文物與圖像、人類學的影音資料等。在技術方面,則開始強調各種文本與物件的數位化規格與標準、後設資料(metadata)的設計與建置規範、3D與GIS系統、資料庫的建立與管理,以及資訊系統的整體設計與建置。

以這個計畫為基礎,中研院又於2001年邀集七個重要的文物、檔案典藏機構共同推動「國家典藏數位化專案計畫」,並於2002年整合先前的「數位博物館計畫」和「國際數位圖書館計畫」(International Digital Library Project, IDLP)(2000-2001),開展第一期的「數位典藏國家型科技計畫」(National Digital Archives Program, NDAP)(2002-2007)。這是第一個人文與科技並重,並由人文學者主導的「國家型」計畫,其目標在於推動國家重要文物典藏的數位化,以建立「國家數位典藏」,並利用此一數位化的文化資產,促進人文、社會、產業、經濟的發展。

NDAP代表台灣人文界在二十一世紀初正面回應數位科技所帶來的衝擊。就各典藏機構的類型來說,含蓋了博物館(自然、藝術與人文兼具)、檔案館、美術館、圖書館等四大類。就文物資料的內容屬性來說,包括了古籍、檔案、報紙、期刊、文書、照片、拓片、書法、圖像、影音、地圖、器物、標本、建築等。就涉及的知識領域而言,則廣及歷史、文學、藝術、音樂、戲劇、電影、民俗、宗教、考古、人類學、動物、植物、礦物、地質、醫學等。而在資訊技術方面,包括後設資料、聯合目錄、命名系統、檢索系統、數位化規範及數位典藏管理系統等,也都在這個階段逐步完成建置。

圖三
                      圖3  數位典藏與數位學習聯合目錄:典藏臺灣(圖片來源:http://catalog.digitalarchives.tw/ 
               

這種具有高度整合性及全國性的數位典藏計畫,在當時可以說是獨步全球。而在2003年,國家科學委員會(以下簡稱「國科會」,即目前的科技部)又主導、推動另一個跨部會署的「數位學習國家型計畫」(2003-2007),主要目標是要建立「數位學習產業」,以「數位學習」(e-Learning)強化國家的競爭力、增進社會服務。此一計畫是以發展產業為導向,核心工作也較偏向技術、政策和人才培育,但也推動「全民數位學習」與「縮減數位落差」的工作。

「數位典藏」第一期計畫結束之後,隨即在2007年展開第二期計畫,但在2008年,因整併前述的「數位學習」計畫,故重整、更名為「數位典藏與數位學習國家型計畫」(Taiwan e-Learning and Digital Archives Program, TELDAP)(2008-2012),核心目標為「呈現台灣多樣性,深化數位學習」,具體而言,是要藉由數位典藏的內容呈現台灣文化與自然的多樣性,並促進產業、教育、研究、社會的發展,建立國際合作網絡。

TELDAP的參與機構、工作內容和運作模式雖然和NDAP、e-Learning的第一期計畫大同小異,但仍有若干重大的差異。首先,在內容建置方面,第一期著重於珍貴文物和資料的數位化保存與管理,第二期則強調以「應用」和傳播為導向。其次,在技術方面,經過多年摸索與討論,終於針對各種物件的數位化工作流程建立統一的參考標準和工作程序。再者,除了早先的數位化、數位保存(digital preservation)、資訊安全(information security)、自然語言處理之外,在資料探勘(data mining)、語意網(semantic web)、知識本體(Ontology)領域的研究、應用技術與工具,更加受到重視。此外,在第一期完成雛形架構的《聯合目錄》,在這個階段有了更完整的展示、檢索和管理功能,可以源源不斷的收納各單位的數位內容,並建立連結。至於「數位學習」方面,與「數位典藏」有了更好的結合,並強化社會連結與國際交流。

總之,在十二年間(2001-2012),參與這項文化工程的公、私立機構、單位共計超過百個,其中不少是中央政府的部會及其所轄的單位。動員的人力至少也有千人以上,其中不乏學術界與教育界的精英。最後共完成560萬筆以上的數位資料,750個左右的資料庫及網站。相關的出版品、工作報告、技術報告以及衍生的論著、產品等,則難以計數。

在TELDAP結束之後,中研院隨即於2013年成立「數位文化中心」,除了承繼、營運TELDAP的成果之外,也持續拓展數位典藏內容、研發數位技術,並推動數位人文研究、連結國際相關研究社群。期能以數位方式保存、傳播、創造文化,運用數位科技豐富研究材料、改善研究環境、促進人文研究,並探索數位科技與人類文明發展的關係。

圖四
                              圖4 中研院數位文化中心(圖片來源:http://ascdc.sinica.edu.tw/

回顧這一段歷史可以知道,台灣在人類文明的「數位轉化」過程中,雖然遲到,但未缺席,目前也已躋身「數位人文學」的先進之列。這是集眾人之力所開創的格局,是公私單位、各行各業、成千上萬的人共同耕耘才有的果實。但是,中研院的倡議、實踐、組織和領導也發揮了關鍵性的作用,而這必須歸功於中研院歷任院長、副院長、學術行政主管、研究人員的遠見和承擔,以及眾多行政、技術、助理人員的智慧和辛勤。為了彰顯這項「為而不有」的志業,「數位文化中心」特別組成工作小組,委請曹銘宗先生帶領採訪小組,走訪這段歷史的開創者和見證者,並書寫簡史,記錄即將年滿九十的中研院(1928-)晚近的數位貢獻!

附記:

此為《遠見與承擔:中央研究院數位人文發展史》(台北:中央研究院數位文化中心,2017)序文。

 


 

 

本文採用 創用CC 姓名標示-非商業使用-禁止改作 3.0 台灣版條款 授權。歡迎轉載與引用,但不得為商業目的之使用,亦不得修改本文。轉載、引用本文請標示網址與作者,如:

林富士/「為而不有」的志業
(http://kam-a-tiam.typepad.com/blog/2017/11/為而不有的志業.html

 


 

Print Friendly Version of this pagePrint Get a PDF version of this webpagePDF

Comments