視頻加載中...
摘 要:大數(shù)據(jù)時代來臨之后,傳媒作為信息產(chǎn)業(yè)也不可避免的收到了沖擊。本文分析了大數(shù)據(jù)的四個特點,分別從傳播效果、新聞價值、新聞業(yè)務(wù)、傳媒數(shù)據(jù)庫、媒體的功能和媒體從業(yè)人員探討了大數(shù)據(jù)帶來的沖擊和影響。最后分析了大數(shù)據(jù)帶來的負面影響:泄露隱私的危險。 關(guān)鍵詞:大數(shù)據(jù);傳媒業(yè);變革;隱私 2002年,有一部上映的科幻片——《少數(shù)派報告》,講述的是在2054年的美國,謀殺已經(jīng)消失,犯罪可以被預(yù)知。有三個具有感知未來超能力的人——先知,可以在事前得到犯罪的信息,經(jīng)過司法部的預(yù)防犯罪小組破譯犯罪證據(jù)之后,罪犯在實施犯罪之前就會得到懲罰。而這一切似乎將要變?yōu)楝F(xiàn)實,只不過電影中用的是超能力,而今運用大數(shù)據(jù)。 2009年,在甲型H1N1流感爆發(fā)的前幾周,谷歌通過觀察人們在網(wǎng)上的搜索記錄就提前預(yù)測了流感的傳播。谷歌保存了多年來所有的搜索記錄,每天收到來自全球超過30億條的搜索指令,通過分析這些龐大的數(shù)據(jù)資源,而得出了這個結(jié)論。 世界著名咨詢機構(gòu)麥肯錫公司于 2011年5月發(fā)布了《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)力的前沿》報告,掀開了大數(shù)據(jù)研究的序幕。作為從經(jīng)濟和商業(yè)維度詮釋大數(shù)據(jù)發(fā)展?jié)摿Φ牡谝环輰n}研究成果,該報告系統(tǒng)闡述了大數(shù)據(jù)概念,詳細列舉了大數(shù)據(jù)的核心技術(shù),深入分析了大數(shù)據(jù)在不同行業(yè)的應(yīng)用,明確提出了政府和企業(yè)決策者應(yīng)對大數(shù)據(jù)發(fā)展的策略。 一、大數(shù)據(jù)簡介 麥肯錫認為,“大數(shù)據(jù)”是指其大小超出了典型數(shù)據(jù)庫軟件的采集、儲存、管理和分析等能力的數(shù)據(jù)集。該定義有兩方面內(nèi)涵:一是符合大數(shù)據(jù)標準的數(shù)據(jù)集大小是變化的,會隨著時間推移、技術(shù)進步而增長;二是不同部門符合大數(shù)據(jù)標準的數(shù)據(jù)集大小會存在差別。目前,大數(shù)據(jù)的一般范圍是從幾個TB到數(shù)個PB。 大數(shù)據(jù)(big data),究竟這個數(shù)據(jù)有多大。很多人試圖測量出一個確切的數(shù)字。南加利福尼亞大學的馬丁?希爾伯特(Martin Hilbert)試圖得出人類所創(chuàng)造的、存儲和傳播的一切信息的確切數(shù)目。據(jù)他估算,2007年,人類大約存儲了超過300艾字節(jié)的數(shù)據(jù)[1]。他預(yù)測,到2013年,世界上存儲的數(shù)據(jù)能達到約1.2澤字節(jié)。這意味著:如果把這些數(shù)據(jù)全部記在書中,可以覆蓋整個美國52次,如果將其存儲在只讀光盤上,這些光盤可以堆成五堆,每一堆都可以延伸到月球[2]。 IBM將大數(shù)據(jù)的特點總結(jié)為4個V: (一) Volume 數(shù)據(jù)體積巨大,在我們需要處理數(shù)據(jù)的時候,不再需要隨機樣本,而是全體數(shù)據(jù)。即樣本=全體。小數(shù)據(jù)時代隨機抽樣,我們用最少的數(shù)據(jù)獲得最多的信息。因為技術(shù)的限制,取得過多的樣本會消耗大量的成本和精力?,F(xiàn)在,技術(shù)環(huán)境已經(jīng)有了很大的改善,依然進行抽樣分析就類似于在汽車時代依然騎馬一樣。大數(shù)據(jù)注定對社會科學有最大的撼動,因為我們再也不用依賴抽樣調(diào)查了。 (二)Variety 數(shù)據(jù)的類型及來源繁多并且包含越來越多的非結(jié)構(gòu)化數(shù)據(jù)(如圖像、聲音等信息);大數(shù)據(jù)的來源主要有這樣幾個方面[3]: 一是媒體數(shù)據(jù),特別是互聯(lián)網(wǎng)、社交媒體產(chǎn)生的數(shù)據(jù),包括人們?yōu)g覽網(wǎng)頁的數(shù)字化記錄等; 二是各類企業(yè)的生產(chǎn)、銷售、管理等等數(shù)據(jù); 三是政府部門的數(shù)據(jù); 四是物聯(lián)網(wǎng)、各種傳感器產(chǎn)生的數(shù)據(jù),以及未聯(lián)網(wǎng)的各種攝像頭拍攝的數(shù)據(jù); 五是民眾個人留存的數(shù)據(jù),包括個人、家庭文字及音像數(shù)據(jù)。 數(shù)據(jù)類型和數(shù)量的繁多,各種數(shù)據(jù)魚龍混雜,直接帶來的結(jié)果就是錯誤數(shù)據(jù)的增多,精確度的下降。在小數(shù)據(jù)時代,在抽樣調(diào)查的時候我們要對我們的調(diào)查的信度和效度負責,所以數(shù)據(jù)越精確越好。但是現(xiàn)在不是這樣了,在大數(shù)據(jù)時代,我們掌握的數(shù)據(jù)越來越全面,它不僅包括現(xiàn)象的一點點數(shù)據(jù),而是包括了與這些現(xiàn)象相關(guān)的大量甚至全部的數(shù)據(jù)。我們要做的就是接受這些紛繁的數(shù)據(jù)并從中獲益,而不是以高昂的代價消除所有的不確定性。 |