一、內(nèi)容管理的概念
隨著數(shù)字出版技術(shù)的迅猛發(fā)展,繼ERP之后,與出版行業(yè)關(guān)系更為密切、也更被出版行業(yè)所關(guān)注的是CM,即內(nèi)容管理(Content Management),也叫數(shù)字內(nèi)容管理。歐盟“Info2000計(jì)劃”中把內(nèi)容產(chǎn)業(yè)的主體定義為“那些制造、開發(fā)、包裝和銷售信息產(chǎn)品及其服務(wù)的產(chǎn)業(yè)?!眱?nèi)容產(chǎn)業(yè)的范圍包括各種媒介上所傳播的印刷品內(nèi)容(報(bào)紙、書籍、雜志等),音像電子出版物內(nèi)容(聯(lián)機(jī)數(shù)據(jù)庫、音像制品、電子游戲等)、影視傳播內(nèi)容 (電視、錄像、廣播和影院)等。
對(duì)于內(nèi)容管理,目前尚無統(tǒng)一定義。一般認(rèn)為它包括這樣幾個(gè)方面:網(wǎng)站內(nèi)容管理、出版(或媒體)內(nèi)容管理、企業(yè)內(nèi)容管理等。同時(shí),內(nèi)容管理還廣泛應(yīng)用于數(shù)字資產(chǎn)管理(DAM)、電子政務(wù)、數(shù)字圖書館、企業(yè)信息門戶(EIP)等。鑒于本文的研究領(lǐng)域,本文所說的內(nèi)容管理是指出版物的內(nèi)容管理,也可以稱為狹義的“知識(shí)管理”。
由于出版物不同與其他產(chǎn)品,出版物具有知識(shí)內(nèi)容,是純粹的內(nèi)容產(chǎn)品,因此內(nèi)容管理在出版業(yè),意味著對(duì)產(chǎn)品內(nèi)容的統(tǒng)一管理。包括對(duì)圖書、雜志、報(bào)紙、音像、電子產(chǎn)品內(nèi)容的管理。隨著跨媒體出版的日益臨近,內(nèi)容管理對(duì)出版單位變得尤為重要。今后的出版,肯定要突破單一媒體形式,出版社將演變?yōu)閮?nèi)容提供商(Content Providers),對(duì)內(nèi)容一次加工完成,以不同媒體形式出版――紙質(zhì)媒體、光介質(zhì)媒體、網(wǎng)絡(luò)媒體、移動(dòng)媒體等,這是一個(gè)方向,這也就是所謂的跨媒體出版。
因此可以說,內(nèi)容管理的目的是把非結(jié)構(gòu)化的出版信息,制作成圖書、報(bào)刊、光盤、網(wǎng)頁等產(chǎn)品,供用戶以各種媒體形式進(jìn)行閱讀、檢索、查詢、分析和共享。在這種形式下,傳統(tǒng)的讀者(Readers)或受眾(audience),逐漸演變?yōu)閮?nèi)容消費(fèi)者(Content Consumers) ,因此內(nèi)容管理解決方案必須為出版社的知識(shí)產(chǎn)品提供從原創(chuàng),到編輯加工,到生產(chǎn)制作,到傳輸發(fā)布,再到閱讀消費(fèi)等的一體化服務(wù)。
內(nèi)容管理不是某種單獨(dú)技術(shù)的創(chuàng)新,而是許多先進(jìn)技術(shù)的綜合應(yīng)用。套用現(xiàn)在流行的用語,就叫“集成創(chuàng)新”。內(nèi)容管理解決方案重點(diǎn)解決各種非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)字資源的采集、管理、利用、傳遞和增值,并能有機(jī)集成到結(jié)構(gòu)化數(shù)據(jù)的商業(yè)智能(BI)環(huán)境中,如ERP,CRM等。
二、內(nèi)容管理的幾個(gè)關(guān)鍵技術(shù)
1.信息檢索技術(shù):信息檢索技術(shù)包括信息的分類、標(biāo)引、檢索、評(píng)價(jià)、反饋等過程。從歷史上看,信息檢索經(jīng)歷了手工檢索、計(jì)算機(jī)檢索到目前網(wǎng)絡(luò)化、智能化檢索等多個(gè)發(fā)展階段。隨著互聯(lián)網(wǎng)的發(fā)展,信息檢索技術(shù)向3W的搜索引擎方向發(fā)展。目前最前沿的信息檢索技術(shù)包括以下幾個(gè)方面:關(guān)鍵詞檢索(全文檢索)、分類導(dǎo)航檢索、同義詞(異構(gòu)詞)檢索、聚類信息檢索、截詞檢索、精確檢索、字段檢索、網(wǎng)站超鏈檢索、庫間跳轉(zhuǎn)檢索、多庫同時(shí)檢索、布爾檢索、數(shù)字檢索、二次檢索(多次逼近檢索)、自動(dòng)分詞、自然語言檢索、定題檢索、手機(jī)檢索等。出版物內(nèi)容管理面對(duì)的是出版單位的大量文稿數(shù)據(jù),在文稿的整理入庫過程中,必須使用先進(jìn)的信息檢索技術(shù)對(duì)文稿進(jìn)行分類、標(biāo)引、重組,進(jìn)而建立出版物內(nèi)容的知識(shí)庫體系。
2.數(shù)據(jù)庫技術(shù):目前市場(chǎng)上流行的大型數(shù)據(jù)庫產(chǎn)品有:DB2、Informix、SQL Server、Oracle、Sybase、MySql等。有別于小型數(shù)據(jù)庫,大型數(shù)據(jù)庫系統(tǒng)在功能、安全性和擴(kuò)展性方面提供了更好的解決方案。以O(shè)racle數(shù)據(jù)庫為例,目前的Oracle數(shù)據(jù)庫,在合理規(guī)劃下, 數(shù)據(jù)大小理論上可以無限。所謂合理規(guī)劃包括:數(shù)據(jù)文件限制與操作系統(tǒng)的文件大小、數(shù)據(jù)庫的表容量、每個(gè)表的最大數(shù)據(jù)量等的設(shè)