《大数据时代》导读
近年来,随着互联网信息产业的快速发展,一个曾经的专业术语“大数据(big data)”日渐流行,耳熟能详的,并屡屡成为社会热点。在教育行业,自2016年我国高校首次设置“大数据”本科专业以来,先后有608所高校开设了《数据科学与大数据技术》(专业代码080910T)本科专业。在IT行业,每年InformationWeek公布的IT从业人员薪金调查中可以看出“大数据”从业人员面临巨大的缺口。“大数据”不光渗透了我们的生活、工作和学习,也日渐成为了国民经济的重要支柱。在《国民经济和社会发展第十三个五年规划纲要》(2016年)中,第二十七章“实施国家大数据战略”提出:“把大数据作为基础性战略资源,全面实施促进大数据发展行动”。近几年来,国务院和相关部委先后发布了《促进大数据发展行动纲要》(2015年)、《大数据产业发展规划(2016-2020年)》(2017年)、《关于工业大数据发展的指导意见》(2020年)等20多个文件,着力打造推动大数据产业化。“大数据时代”真正来到了我们身边。
“大数据”概念越来越“火”,无论是行业内还是行业外,聊八卦写文章,不涉及几句“大数据”,都不好意思和人打招呼。于是乎大江南北,行业内外,一时间到处都是“大数据”的影子。在我们熟悉的教育领域,各种学生大数据、校园大数据、科研大数据、学术大数据在新媒体、排行榜助推之下,“你方唱罢我登场”,好不热闹。学术、媒体、IM、娱乐,各行各业、各种各样的“大数据”,沸沸扬扬,铺天盖地,甚至于“乱花渐欲迷人眼”而致“不识庐山真面目”。热闹之余,静心细想,不禁要问,到底什么是“真正的大数据”?
“真正的大数据”到何处寻找?追本溯源,维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》(2012年),被认为是国外大数据研究的开山之作。作者维克托•迈尔-舍恩伯格被誉为“大数据商业应用第一人”。在《大数据时代》书中,作者以风趣幽默笔法,通过列举大量的应用事例,简洁有力的说明了大数据对于生活、工作和思维的冲击与变革,并高屋建瓴,条理清晰的指明了发生在“大数据时代”下的思维变革、商业变革和管理变革。书中对商业变革、管理变革的观察敏锐而细致、对“大数据”的冲击带来的隐忧更具有先见之明,而最精彩之处,是作者对于“大数据”带来的思维变革的剖析。在这部分,作者理清了对于“大数据”的认识:即“更多:不是随机样本,而是所有数据;更杂:不是精确性,而是混杂性;更好:不是因果关系,而是相关关系。”这三个理念是“大数据”的精髓之处,值得反复的揣摩和体会,也深刻的指出了“大数据”和传统的数据分析的根本不同。通过对“大数据”本质的界定,提出“大数据”的思维方法,更新读者在“大数据时代”下的思维方式,迎接“生活、工作与思维的大变革”。作为社会科学著作,作者在书中并没有具体的探讨处理“大数据”所使用的计算机技术。引申一下,大数据时代的计算机技术基础,其实起源于Google在2004年前后发表的三篇论文,也就是我们经常听到的“三驾马车”,分别是分布式文件系统GFS、大数据分布式计算框架MapReduce和NoSQL数据库系统BigTable。这些技术是大数据处理运算的技术基础,使用这些技术所处理的数据体量一般是PB级起步的(1000TB,通常是PC计算机装不下的存储容量),这个级别才能称之为“大”的数据。
那么,我们常见的XX大数据是“大数据”吗?看完本书你自会有答案。
维克托•迈尔-舍恩伯格,是十余年潜心研究数据科学的技术权威,他是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。
作者:图书馆 王傲镭