新华网北京11月2日电(记者谭浩)不少人可能会奇怪地发现,自己在购物网站关注过某类商品后转去另一个门户网站看新闻时,旁边播放的居然是他刚刚表达过兴趣的商品介绍!
这并非偶然,随着社会的日益数字化,大数据正在闯入每个人的日常生活。
处处皆有大数据
今天,我们正处于一个大数据时代。
新浪微博在晚上高峰期一秒钟接受100万以上的响应请求;百度每天要处理约60亿次搜索需求;中国联通用户上网记录一秒钟就能收集83万条……
在巨量信息中,可以明显感受到大数据的来势凶猛。而每一个受众同时也是这巨量信息的制造者。不知不觉中,人们在电子操作时留下的“数据碎片”实时地向大众日常生活的所有角落渗透。
在数字化社会中,当人们在网上购物、下载音乐、发送电邮、检索词条、发微博时,都会在不经意间留下一串串数字足迹。有统计表明,自人类文明开始到2003年,人类共创造了5TB(兆亿字节)的信息。而现在,这样的数据量仅需两天就能够被创造出来,且速度仍在加快。
当研究者把人们购买商品前的浏览价格、观看电影前搜索影评等数据搜集进一步分析后,便能够获得人们行为习惯的有效信息。
例如,商家通过分析客户的购买行为了解客户消费取向和习惯后,即可进行有针对的营销以提升业务;警方通过分析几十年的犯罪记录,可以预测犯罪行为模式与频率,从而有针对地安排警力……
“100多年来,统计学家们一直依赖小规模数据样本,因为他们没有能力收集更多数据。”武汉大学信息管理学院教授沈阳介绍说,电子网络技术意味着我们可以“收集到大量数据,而不是满足于样本”,“借助大数据,分析者可以比以往任何时候都更加了解研究对象。”