前言
將數(shù)字化列入近百年來最重要的關(guān)鍵詞之一,應無疑義。數(shù)字化的內(nèi)涵不斷深化,范圍無限延展,形成現(xiàn)在蓬勃旺盛的數(shù)字化生態(tài),將眾生裹挾其中。這中間,傳統(tǒng)的媒體與調(diào)研機構(gòu)難免被波及,需在新環(huán)境中奮力探索存續(xù)之道。對眾生而言,數(shù)字化生存絕非一時的命題,也無固定答案,在無遠弗屆的數(shù)字化時代,常變常新才可長存。
本文為本期封面主題文章的第一篇,通過對大數(shù)據(jù)發(fā)展階段的回溯,幫助我們更加深刻地理解大數(shù)據(jù)的內(nèi)涵、所涉及的技術(shù)、與新媒體的關(guān)聯(lián)。
今日內(nèi)容:
🔘大數(shù)據(jù)發(fā)展的四個階段
🔘大數(shù)據(jù)發(fā)展中的三點思考
大數(shù)據(jù)從何而來?與新媒體的發(fā)展有什么關(guān)系?為什么今天的大數(shù)據(jù)在新媒體乃至于更寬廣的應用場景中表現(xiàn)出很高的價值?
如果依據(jù)對大數(shù)據(jù)的定義——大數(shù)據(jù)是指超出了過去處理能力的大量的數(shù)據(jù)和與此相適配的技術(shù)體系,那么我們就應該有所思考。大數(shù)據(jù)能夠發(fā)揮價值是因為處理技術(shù)的同步演進,但數(shù)據(jù)并非憑空而來,技術(shù)的進化也非一日之功。
今天大數(shù)據(jù)已經(jīng)成為一門跨學科的綜合性研究領(lǐng)域:能夠處理數(shù)值、文本、圖片、音頻、視頻等多種類型的數(shù)據(jù),能夠應對大量數(shù)據(jù)的處理需求,能夠進行全局的描繪和適當?shù)念A測,并能夠解決多個場景的問題。這其中牽涉到包括統(tǒng)計學、網(wǎng)絡科學、分布式、數(shù)據(jù)庫、數(shù)據(jù)挖掘、自然語言處理、計算機圖形學等多種技術(shù),經(jīng)歷了漫長的發(fā)展歷程。
當下對大數(shù)據(jù)的研究多聚焦于大數(shù)據(jù)概念提出以后,從2008年開始,并提出大數(shù)據(jù)的若干價值。筆者認為,應該往回追溯,看到大數(shù)據(jù)早在2008年以前就已經(jīng)存在,與其相關(guān)的技術(shù)亦在多個路線的推動下,不斷積累、形成體系,2008年以后進入到了較為高速的成長期。通過這樣的回溯,我們對于大數(shù)據(jù)的內(nèi)涵、所涉及的技術(shù)、與新媒體的關(guān)聯(lián)會有更加深刻的理解。
大數(shù)據(jù)發(fā)展的4個階段
大數(shù)據(jù)的發(fā)展與現(xiàn)代信息技術(shù)的演進息息相關(guān),不妨將大數(shù)據(jù)的發(fā)展分為儲備期、萌芽期、概念期和發(fā)展期4個階段。
儲備期:1950—1980
從大型機、數(shù)據(jù)庫開始,解決商業(yè)、科學、軍事、民調(diào)等領(lǐng)域大量數(shù)據(jù)的管理和計算問題
大數(shù)據(jù)的發(fā)生、發(fā)展,有必要追溯到大型機和數(shù)據(jù)庫的早期階段。之所以如此,乃是因為大數(shù)據(jù)指向數(shù)據(jù)以及相應的處理系統(tǒng),總歸無法脫離計算所需的硬件和軟件。今天相當比例的數(shù)據(jù)采集、管理、挖掘的體系、思路,都要往回探尋到互聯(lián)網(wǎng)發(fā)生以前、計算機誕生的早期。
計算機技術(shù)起源后,在政府、銀行等需要大量算力、應對大量數(shù)據(jù)處理的機構(gòu)的推動下,硬件技術(shù)、數(shù)據(jù)管理技術(shù)、數(shù)據(jù)挖掘和分析等的技術(shù)都逐漸得到發(fā)展,很多技術(shù)——包括關(guān)系型數(shù)據(jù)庫、經(jīng)典數(shù)據(jù)挖掘算法、自然語言處理算法等被提出和探討,為今后的發(fā)展奠定了堅實的基礎(chǔ),并在當下的大數(shù)據(jù)應用場景中依然默默存在并發(fā)揮著作用。
上篇:
下篇: