凯特家的后花园吧 关注:38贴子:290
  • 5回复贴,共1

据说“大数据”会带来的3个变化

只看楼主收藏回复

1 企业越来越关注“相关性”而非“因果关系”。
2 样本不再是“抽样”而是“全部”。
3 数据统计会倾向于“混杂性”而非传统的“精确性”。大样本的简单计算>小样本的复杂计算。
顺便摘录一段未来数据的使用方式:
1、数据再利用。数据的运用者常常不是那些拥有大量数据的机构,却是那些恰好可以用这些数据来支持其商业模式的机构,这就是“再利用”
  2、重组数据:将多个数据集的总和重组在一起时,充足总和本身的价值也比单个的总更大。丹麦的癌症研究就是将所有的癌症患者和手机用户的数据结合起来,从而揭示两者是否有关联性——幸运的是,全数据显示并无关联。
  3、可扩展数据。譬如,零售在店内安装的监控摄像头,不仅能认出把手,也能跟踪经过商店的客户流和他们停留的位置。
  4、数据的折旧值:随着时间的退役,大部分的数据都会失去一部分基本用途。然而,即使数据用于基本用途的价值会减少,但选择的价值却依然强大。从这个角度,组织机构应收集尽可能多的使用数据,并保存尽可能长的时间,同时也应当与第三方分享数据,保留所谓的“延展性”权利。
  5、数据废气:在拼写检查中,用户会有大量的错误拼写。这些数据看起来是废品,但收集在一起却能够锻造成一块闪亮的金元宝。例如,当couresa这样的网络平台中一个班级数量超过万人时,教授发现2000个学生在作业中犯了同样的一个错误。修正后,系统将会提醒以后犯同样错误的学生。通过这些’错误“,我们改变了教育的方式。
  6、开放数据:政府只是收集信息的托管人,而数据应当对全球开放。


IP属地:上海1楼2013-05-09 11:01回复
    又想了想,傻子+懒汉才不会重视因果关系呢。


    IP属地:上海2楼2013-05-09 11:41
    回复
      不明觉厉


      IP属地:黑龙江3楼2013-05-09 12:46
      收起回复
        这是什么学的范畴?


        4楼2013-07-03 03:44
        回复