做了10年的数据相关作业,做过数据剖析、数据运营和数据产品等作业内容,感觉自己最满足的,并不是自己把握了多少数据剖析的技能和多少大数据技能,而是碰到任何问题时,都会联想到怎么用数据驱动的办法去处理,我信任这便是一个人具有数据思想能力的表现。
那数据思想是什么?简略来说,数据思想便是关于事物认知的一套思想模型,一个具有很强数据思想的人,最重要的是要考虑到一个事物从原因到成果的开展进程中所发生的数据流,而这个数据流其实便是记载这个进程的最好依据。
今日我经过3个和数据相关的例子来举例证明数据思想在我们日常日子中所发生的重要商业价值。
上一年,回母校参与数学建模二十周年活动,跟教师聊起了现在的大学生一些现象级的问题,便是现在的大学生欠好办理,沉浸各种网络游戏,学习松懈现象很严重。因而,我也就立刻想到,大学里怎么经过数字化和数据驱动办法论,来处理这些个问题。在大学里,大学的考试根本上一个学期只要一次,所以假如一位同学在暑假迷上了网络游戏,开学后即便彻底不学习,最早也得半年后比及学期期末考试成果出来,才可以看出一些端倪。也便是说,考试作为对学生学业开展的一种评价手法,是静态和滞后的,并不能实时发现学生学习行为的反常。
那么,有没有或许经过搜集学生在校园日常被迫堆集的数据,对这些数据做剖析,前期发现学生学业开展中的反常情况,并进行预警和干涉。我们一会儿或许就会想到的与学生成果有关的数据,包含学生历年的考试成果、选课记载、教材与参考书的图书馆借阅记载等等。这些数据当然有用,可是要做到精确的成果猜测,并且一起发现学习行为的反常,还远远不行的。在睡房待得越久,成果是否越差?进图书馆的次数越多,成果是否越好?去水房吊水的次数越多,成果是否越好?吃早饭越多、洗澡越规则,成果是否越好?食堂打卡记载是否可以定位孤单人群以及他们心思状况的改变?这些数据维度,关于猜测学生考试成果,都会有很大的协助。
但其实惋惜的是,据我了解,绝大部分大学,这样的数据是没有被搜集的,因而也就无法支撑这么详细的研讨。所以说,当时大校园园要建造大数据的一体化渠道,其建造的主旨是为了更好地辅佐教育,最大价值的发挥教育数据的外部性,由于学生的行为数据蕴含着很多有价值的信息,并且这些数据是实时的,可以及时捉住当时学生的反常问题,防止“亡羊补牢,为时已晚”的悲惨剧。
有人说,这么隐私的数据被搜集和运用,会引发巨大的争议。但我以为,个人信息的适度敞开,会协助更好完成教育的主旨。
我们每次坐电梯的时分,都会传来各种广告声,这是分众公司的广告商业形式。那投进广告,广告主比较关心的一个问题,便是怎么保证自己的投进广告触达到了自己的方针人群。可是线下广告和线上广告不相同,线上用户行为的数据很丰厚,而线下广告可以搜集到用户的数据对错常有限的。那么,线下媒体是怎么做到精准和细分,让投进广告的广告主更有用确定自己的方针受众,这对分众这样的广告公司来说是一个巨大的应战。
传统的办法,便是在和物业签约的时分,将物业供给的一切材料都录入到数据库当中去,一起还会向物业公司问更多的问题来弥补为获取到的信息。可是这种传统的办法所获取到的信息维度不行丰厚、不行详细和精确、也无法做到及时更新。
比较传统的办法,分众在全国的小区很早就建立了自己的废物剖析网,经过对废物的剖析来研讨小区居民的用户画像和品类/品牌偏好。他们给小区卫生办理员配一把扫描枪,看见废物里的条形码就扫,扫到的数据会实时同步到数据库。这样就可以知道这个小区首要喝什么水、喝什么酒、用什么油.....经过这些数据,相关这些产品的价格信息,就可以洞悉这个小区顾客的品类偏好、品牌偏好和消费水平。这种办法的革新,比较传统办法,很大程度上是在做经过大数据库堆集构成的革新,跟着这些废物数据的堆集,根本上可以对小区居民做到精准的细分和洞悉。
上一年,涨幅最大的食物是什么,我们肯定会异口同声的说“猪肉”。因而,上一年我们政府的官员,常常会给我们解读一个重要目标—CPI,居民消费价格指数,它是作为一个反映通货膨胀的重要经济目标。正是由于CPI的重要性,快速而精确地核算CPI指数,关于国家宏观决议计划有至关重要的价值。惋惜的是,实际中的CPI指数,是经过实地调研的方法获取数据,然后再核算和对外发布,在实时性和精确性方面往往都不尽人意。
为了处理数据的实时性问题,阿里巴巴集团研讨院发布了网络零售价格指数(ISPI),它归纳反映了淘宝和天猫渠道的网络零售买卖产品和服务的一般价格水平。尽管淘宝和天猫的线上消费仅仅整个国民消费的一部分,但从抽样的原理上,来看,阿里全量收集的这些数据,比国家统计局经过抽样的方法获取到的数据要多得多,数据成果或许会更精确。因而,ISPI指数是CPI指数的重要弥补,可以快速和精确地供给价格信息,为相关决议计划部分供给决议计划依据。
更有意思的是,国外有一家叫做Premise的草创公司,经过付费众包形式将大宗日常消费品的价格收集使命分配至当地居民身上,全球700多人须每日到特定便利店或许超市收集至少多250种特定产品的图片和价格信息,每收集相同产品可获得酬劳5-15美分。700多名当地职工就能把握全球的CPI指数变化信息,他们使用这些数据和许多消费品公司建立了长时间合作关系,一起他们还为客户供给定制化的数据收集服务,比方自家感兴趣的产品或许竞品。当然,他们的收集也有不足之处,比方众包人员在数据收集进程中犯错误而导致数据的不精确,这个是需求他们要躲避的比较突出的问题。
数据思想如此重要,那么怎么进步数据思想,依据我的经历给出3条主张:首要,根底常识是思想能力的根底。数据范畴涉及到的根本常识,我们要把握厚实。其次,日常日子和作业中,要经常重视所看到的数据,对数据坚持满足的敏感性。最终,多考虑数据背面的东西,把数据转化成常识,让数据发生线日就要开营啦。本次训练营首要针对零根底小白、产品同学、运营同学,想体系学习sql的同学们,扫海报下方二维名哦!