五分钟 读完一本书。面对当下社会 如何抓住大数据带来的机会?
今天为大家带来这本书,叫《大数据时代》。
推荐语
可能大多数人都听过“大数据”这个概念,但大多数人对这个概念也是熟悉又陌生。因为大家都能感受到大数据在我们生活和工作中的应用,但你知道它是如何运作的吗?你知道大数据并只不是一个庞大的数据库吗?
《大数据时代》作者维克托·迈尔-舍恩伯格,被誉为“大数据商业应用第一人”。在这本书里,他打破了不少人对大数据的误解,让我们一窥大数据在我们生活中的应用。
本书精华
在迈尔-舍恩伯格看来,大数据的核心就是预测,它代表着我们分析信息时的三大转变:首先,我们不再依赖于随机采样;其次,我们不再追求精确度;前两点加起来也就导致了最后一个转变,不再追求因果关系。也就是说,大数据带来了思维的变革,能让我们获得全新的知识和视角。
数据更多:用全体数据取代随机样本
大数据引领的第一个思维变革,是利用全体数据取代随机样本。这个方式大家应该都了解,因为全体太多了,随机采样能简化问题、节省时间,可抽样过程的随机性没法百分之百保证。但电脑和互联网可能让数据的收集和处理都变得轻而易举。
数据更杂:用混杂性取代精确性
虽然在现代科技的帮助下,获得全体数据已经不是难事,但数据越多、越杂,里面的错误数据必定也会增加,导致结果的准确性下降。本书作者告诉我们,错误的数据不仅能用,还很好用,但要有个前提,那就是接纳数据的混杂性,而不追求精确性,这就是大数据带来的第二个思维变革。
那么,我们为什么要用混杂数据替代精确数据呢?首先,要了解事物发展的全貌,当然要获取尽量广泛的信息。另外,要想获取最新的即时数据,也应该放弃追求数据的精确性。
数据更好:用相关关系取代因果关系
在以前,如果我们想搞清某件事情是怎么回事,往往会去寻找它背后的原因,也就是因果关系。而在大数据时代,我们很多时候不需要知道原因,而只要找出和利用数据之间的联系就足够了,也就是用相关关系取代因果关系,这就是大数据引领的第三个思维变革。
【案例】
美国著名折扣零售商塔吉特能根据顾客的购物方式,预测她是否已经怀孕。这是怎么做到的呢?原来啊,公司通过分析过往孕妇的购物记录,发现了20多种与怀孕相关的产品,包括无香乳液、营养补充剂等等。通过分析这些相关关系,公司甚至能推算出孕妇的预产期,这样一来,就能提前给她们寄去相应产品的优惠券,达到精准促销的目的。
大数据的来源:一切皆可量化
大数据带来的三大思维变革蕴含着巨大价值,那么为了更好地挖掘这些价值,我们首先当然要获取大数据。怎么做呢?答案就是数据化。
首先,是将文字变成数据。第二,是将方位变成数据。第三种方式是将沟通变成数据。随着智能手机和计算机的普及,可以量化的数据只会越来越多,覆盖面越来越广。
数据创新:取之不尽,用之不竭
我们只看到了数据价值的冰山一角,而很多创新型的企业会从旧数据中发掘出新用途。
【案例】
2012年,IBM公司跟本田合作,收集了大量关于电动汽车电池电量、汽车位置和电网电流消耗的原始数据。通过分析这些数据,最基本的作用是可以提示司机充电的最佳时间,以及如何让电网更稳定。在此之上,还能帮助电力供应商确定在哪儿设置服务站。这些数据会反复被使用,带来新的价值。
那么,如何把数据的潜在价值释放出来呢?第一种是数据的再利用,其实上面的例子就属于这种。第二种是数据的重组。有的时候,通过把不同的数据组合在一起,才能激发出更大的价值。比如美国一个房地产网站把房地产信息和价格添加在社区地图上,再加上社区近期的交易等信息,来预测具体每套房的价值。第三种叫做可扩展数据,也就是一套数据,多种用途。比如谷歌街景汽车收集的不仅是房屋和道路的照片,还有GPS数据、WiFi名称等信息,整合出来的数据不仅可以用于谷歌地图,还能用于自动驾驶汽车系统。
还有一些更独特的方式,比如有一种叫“数据废气”。就是人们在网上留下的数字轨迹,这类数据表面上很零碎,就像废气一样,但实际上也很有价值。
大数据的价值链:数据、技术与思维
大数据可以提供三种价值,分别是数据本身、大数据技术和大数据思维。与之对应,也就有了三类大数据公司:第一类是掌握基础数据的公司。第二类是拥有大数据技术的公司。第三类是运用大数据思维的公司。
当然了,也有公司特别厉害,同时兼顾了三个方面,他们既能收集用户的数据,又有挖掘价值的技术,还有利用这些数据的好点子。最典型的当然就是谷歌和亚马逊了。
在大数据时代,灵活机动的小公司可以把大数据变为核心竞争力,用很低的成本传播创新成果,赚得盆满钵满。而对于老牌的大企业来说,也应该与时俱进,有策略地进行数据收集和分析。不过,大数据并不只是公司的专利,它也可以成为个人竞争力的来源。拥有大数据思维的人会基于最新数据做出判断,因此能克服偏见的影响,做出更合理的决策。
大数据的风险与管理
虽然大数据给我们带来了更多便利和价值,但与此同时,它也带来了不少风险。首当其冲的就是人们的隐私。除了隐私,受到大数据威胁的还有自由。此外,大数据还加剧了一个老问题,那就是数据滥用。对应上面几个问题,本书作者提出了下面几条思路:
在保护个人隐私方面,使用数据的企业主动承担责任。在保障自由权利方面,我们应该拓宽对公正的定义,保护个人动因。在滥用数据方面,未来将需要一个新的职业来监管大数据的使用,我们就管他们叫“算法师”吧,算法师的角色是评估大数据的分析和预测,让它符合大众的利益。
结语
总而言之,大数据确实能带来思维、商业和管理等等方面的巨大变革,但由于大数据是一种资源和工具,它的价值还需要我们去发现和利用,大数据给我们提供的只是参考答案,而不是最终答案。正如本书作者所说,我们在使用大数据的时候,“应当怀有谦恭之心,铭记人性之本。”