什么是大數(shù)據(jù)?這是我們認(rèn)識(shí)大數(shù)據(jù)、應(yīng)對(duì)大數(shù)據(jù)發(fā)展需要回答的首要問(wèn)題。從一般意義上說(shuō),大數(shù)據(jù)是指那些超過(guò)傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)處理能力的數(shù)據(jù),數(shù)據(jù)量通常在10TB(1TB=1024GB,為1萬(wàn)億字節(jié))以上。具體來(lái)說(shuō),大數(shù)據(jù)具有4個(gè)基本特征:一是數(shù)據(jù)體量巨大。百度資料表明,其新首頁(yè)導(dǎo)航每天需要提供的數(shù)據(jù)超過(guò)1.5PB(1PB=1024TB),這些數(shù)據(jù)如果打印出來(lái)將超過(guò)5千億張A4紙。有資料證實(shí),到目前為止,人類(lèi)生產(chǎn)的所有印刷材料的數(shù)據(jù)量?jī)H為200PB。二是數(shù)據(jù)類(lèi)型多樣?,F(xiàn)在的數(shù)據(jù)類(lèi)型不僅是文本形式,更多的是圖片、視頻、音頻、地理位置信息等多類(lèi)型的數(shù)據(jù),個(gè)性化數(shù)據(jù)占絕對(duì)多數(shù)。三是處理速度快。數(shù)據(jù)處理遵循“1秒定律”,可從各種類(lèi)型的數(shù)據(jù)中快速獲得高價(jià)值的信息。四是價(jià)值密度低。以視頻為例,一小時(shí)的視頻,在不間斷的監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅只有一兩秒。
大數(shù)據(jù)時(shí)代來(lái)啦!
大數(shù)據(jù)是與智能制造、無(wú)線(xiàn)網(wǎng)絡(luò)革命并行的又一次顛覆性的技術(shù)變革。其具體內(nèi)容包括:海量數(shù)據(jù)分析技術(shù)、大數(shù)據(jù)處理技術(shù)、分布式計(jì)算技術(shù)、數(shù)據(jù)可視化技術(shù)。其中的分布式計(jì)算技術(shù),也稱(chēng)云計(jì)算技術(shù),可以同時(shí)滿(mǎn)足海量數(shù)據(jù)處理需求,比如1000萬(wàn)人同時(shí)搜索某一數(shù)據(jù),它會(huì)將這些數(shù)據(jù)交給分布于全世界的服務(wù)器并通過(guò)它們來(lái)進(jìn)行處理,結(jié)果與1萬(wàn)人同時(shí)搜索這一數(shù)據(jù)沒(méi)什么兩樣。
大數(shù)據(jù)發(fā)展之快,已遠(yuǎn)遠(yuǎn)超出人們的想象。特別值得關(guān)注的是,2012年3月,奧巴馬政府發(fā)布了“大數(shù)據(jù)研究與開(kāi)發(fā)計(jì)劃”,并宣布先期投資超過(guò)2億美元的資金,用于研發(fā)大數(shù)據(jù)關(guān)鍵技術(shù),以搶占數(shù)據(jù)資源開(kāi)發(fā)利用的制高點(diǎn)。2012年5月,聯(lián)合國(guó)“全球脈動(dòng)”計(jì)劃發(fā)布了《大數(shù)據(jù)開(kāi)發(fā):機(jī)遇與挑戰(zhàn)》報(bào)告,英國(guó)、德國(guó)、法國(guó)、日本、加拿大等發(fā)達(dá)國(guó)家積極響應(yīng)。我國(guó)也于2012年10月成立了中國(guó)通信學(xué)會(huì)大數(shù)據(jù)專(zhuān)家委員會(huì)。種種跡象表明,世界各國(guó)特別是發(fā)達(dá)國(guó)家都把大數(shù)據(jù)的發(fā)展擺到國(guó)家戰(zhàn)略層面加以推動(dòng),使大數(shù)據(jù)正在成為世界新的戰(zhàn)略資源爭(zhēng)奪的一個(gè)新焦點(diǎn)。
對(duì)于大數(shù)據(jù)的發(fā)展,全球知名咨詢(xún)公司麥肯錫研究認(rèn)為,數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對(duì)于海量數(shù)據(jù)的運(yùn)用將預(yù)示著新一波生產(chǎn)率增長(zhǎng)浪潮的到來(lái),在政府公共服務(wù)、民生醫(yī)療服務(wù)、維護(hù)社會(huì)安定、動(dòng)態(tài)安全監(jiān)管等領(lǐng)域的廣泛應(yīng)用,將產(chǎn)生巨大的社會(huì)價(jià)值和產(chǎn)業(yè)空間。有機(jī)構(gòu)預(yù)測(cè),大數(shù)據(jù)應(yīng)用將使美國(guó)零售業(yè)凈利潤(rùn)增長(zhǎng)實(shí)現(xiàn)60%,可使制造業(yè)的產(chǎn)品開(kāi)發(fā)和組裝成本降低50%。這種影響和變化是革命性的,說(shuō)明大數(shù)據(jù)蘊(yùn)含著大價(jià)值。
數(shù)字出版向大數(shù)據(jù)進(jìn)化
以閱讀為起點(diǎn),在數(shù)字技術(shù)的支撐下,一本書(shū)的數(shù)據(jù)究竟會(huì)有多大?從當(dāng)前數(shù)字出版產(chǎn)品的形態(tài)看,讀一篇小說(shuō),或許5M綽綽有余;查閱學(xué)習(xí)資料,也許涉及300M文獻(xiàn);享受一段聲光電多媒體讀物,可能總計(jì)不足1G……因此,數(shù)字出版目前典型的特點(diǎn)是“小數(shù)據(jù)”生產(chǎn)與制作,數(shù)字出版產(chǎn)品能夠帶給讀者更多的是碎片化的知識(shí)、相關(guān)的興趣點(diǎn)以及多姿多彩的閱讀體驗(yàn)。至于閱讀的深度挖掘、知識(shí)的重新組織,乃至閱讀信息本身的智能型分析與匹配、數(shù)據(jù)之間的關(guān)系,讀者閱讀興趣產(chǎn)生的數(shù)據(jù),則正是大數(shù)據(jù)浪潮下,數(shù)字出版開(kāi)啟的瑰麗想象。
在不遠(yuǎn)的將來(lái),數(shù)字出版或許應(yīng)該首先是數(shù)據(jù)出版,它整合、梳理大量?jī)?nèi)容資料,全面、細(xì)致囊括相關(guān)知識(shí),是海量數(shù)據(jù)、龐大數(shù)據(jù)庫(kù)的有效管理。其次,它將是數(shù)據(jù)關(guān)系的智能服務(wù),它能夠智能挖掘、匹配一切閱讀興趣,為讀者的沉浸閱讀、深入學(xué)習(xí)提供內(nèi)容和工具,是滿(mǎn)足閱讀需求的數(shù)據(jù)綜合服務(wù)。最后,數(shù)字出版必將成為大數(shù)據(jù)出版,即以?xún)?nèi)容為基準(zhǔn),包含各種服務(wù)的PB級(jí)大數(shù)據(jù);處理速度迅速、涵蓋多種類(lèi)型以及信息感知無(wú)處不在、隨機(jī)變化但智慧關(guān)聯(lián)。
印刷業(yè)如何敲開(kāi)大數(shù)據(jù)之門(mén)
數(shù)碼印刷的出現(xiàn),成為了處在困境中的傳統(tǒng)印刷行業(yè)的救世主,它由于無(wú)需傳統(tǒng)膠印繁雜的工序,只需由計(jì)算機(jī)發(fā)往印刷機(jī)即出成品,準(zhǔn)確又即使,成為當(dāng)今印刷的偏愛(ài)。數(shù)碼印刷具有快速及時(shí)、成本節(jié)約、無(wú)版印刷、信息可變等等一系列優(yōu)點(diǎn)。
按需印刷指按照用戶(hù)的要求,依指定的地點(diǎn)和時(shí)間予以提供為目的,直接將所需資料的檔數(shù)據(jù)進(jìn)行數(shù)碼印刷、裝訂。按需印刷又稱(chēng)“實(shí)時(shí)印刷”和“閃電印刷”,是數(shù)字技術(shù)在印刷環(huán)節(jié)的極好實(shí)踐,即“按當(dāng)天的訂數(shù)印刷,第二天發(fā)貨”。它始于20世紀(jì)80年代,能滿(mǎn)足個(gè)性印刷、減少浪費(fèi)及印刷品一步到位的要求,實(shí)現(xiàn)零庫(kù)存、實(shí)時(shí)出書(shū)和可選擇的個(gè)性印書(shū)。
不論是數(shù)碼印刷還是按需印刷,它使得傳統(tǒng)印刷走向了高速與及時(shí)。這為數(shù)據(jù)處理提供了保證與可能。
傳統(tǒng)印刷業(yè)在不斷轉(zhuǎn)型與升級(jí),大數(shù)據(jù)是一種趨勢(shì),如果傳統(tǒng)印刷業(yè)抓住了它,也就等于抓住了市場(chǎng)。



滬公網(wǎng)安備 31011702001106號(hào)