蒋洪波:大数据时代挑战与机遇并行

来源:发布者:系统管理员发布时间:2014-09-01

  本网讯(记者许杨杨)全球信息化飞速发展的背景下,大数据时代悄然来临。6月5日,华中科技大学蒋洪波教授就大数据时代背景下的挑战与机遇,与我校师生深入交流。
  
  蒋洪波以全球第一大搜索引擎谷歌为例,揭示神秘的大数据。谷歌共有36个数据中心,美国有19个、欧洲12个、俄罗斯1个、南美1个和亚洲3个。正是因为这些遍布全球的数据中心,谷歌才能为用户提供最为全面的资料。2009年,甲型H1N1流感病毒爆发之前,谷歌通过观察人们在网上的搜索记录,把其中5000万条美国人最频繁检索的词汇和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行比较,并通过分析人们的搜索记录,来判断这些人是否患上流感。其间,谷歌共处理了4.5亿个不同的数字模型,最后的预测与官方数据的相关性高达97%,不仅能判断出流感是从哪里传播的,而且判断得非常及时。而疾控中心需要在流感爆发一两周之后才能做到较为准确的预测。“这就是大数据的特点,人们在大规模数据的基础上可以做到那些在小规模数据的基础上根本无法完成的事情。”蒋洪波说,大数据的核心是预测,它把数学算法运用到海量的数据上来预测事情发生的可能性。
  
  基于大数据特点,时代面临巨大挑战,如何应对挑战?蒋洪波从统计学角度提出了大数据的三个思维变革。样本 =0总体———利用所有数据,而不是一小部分数据,大数据时代允许处理和某个特别现象相关的所有数据,而不再依赖于随机采样;20+020=03.9———允许不精确,接受混乱性,拥有海量及时数据时,绝对的精准已经不再是主要目标;“是什么”,而不是“为什么”———关注相关关系而非因果关系,有更多的数据以及更好的工具后,要找到相关关系就变得很快,同时这也成为找到因果关系的基础。
  
  挑战与机遇并存。蒋洪波说:“大数据有着取之不尽用之不竭的价值,如数据的折旧值和可再利用。”谷歌在这方面做得最好,它拒绝将互联网协议地址从旧的搜索查询中完全删除,因为它希望得到每年的同比数据,如假日购物搜索等。充分利用大数据价值的同时从自己最适合最擅长的角度出发,才能为大数据时代的发展贡献自己的力量,蒋洪波说。