2012年,《哈佛商业谈论》将数据科学家称为是21世纪最性感的作业。自此,数据科学家这个词变得越来越盛行。
从上图中能够看到在2016年到2021年,“数据科学”一词在谷歌的查找状况。从中可见,在曩昔几年中,咱们对数据科学的爱好稳步递加。
数据科学家不只收入丰厚,并且该作业能让你运用各种技术,从实际渐至佳境的数据中提取风趣的见地,并经过你的剖析产生影响。因而,它被称为21世纪最性感的作业是有道理的。
但是,在找数据相关作业前,咱们很有必要剖析下数据相关从业者的特征和布景。这能为你供给必要的信息,然后强化相关技术,在许多求职者中锋芒毕露。
在文本中,咱们将运用来自渐至佳境各地的16万多名数据科学家、57万名数据剖析师、10万多名数据工程师以及1.9万多名机器学习工程师的数据。
咱们将运用这个数据集来剖析不同编程言语在某个数据相关职位中的受欢迎程度。接着,将运用在Observable上创立的气泡矩阵对数据集进行可视化。
注:Observable是一家数据可视化渠道供给商,为开发人员、数据科学家等人群供给数据可视化渠道。
气泡矩阵运用巨细和色彩来表明二维信息,其间行代表职位称号,列代表言语,气泡越大,阐明该言语在某一职位类别中的运用频率越高。
在创立气泡巨细时,咱们将核算某种言语的频率与一切言语、职位中最大频率之间的比率。
假如气泡的呈现次数逾越必定数量,则气泡将高亮显现。咱们能够运用滑块挑选气泡高亮显现的阈值。例如,假如咱们挑选阈值为10万,则当计数逾越10万时气泡会变成深紫色。
让咱们将这个数据集可视化,首要创立一个函数来对对应作业的专业进行可视化。
关于数据科学家来说,需求必定的编程和数学常识,因而该职位人群专业散布中,排名前两位的是核算机科学和数学。
由于数据工程师的作业需求不同技术和编程言语的常识,因而能够看到,大多数数据工程师的专业是核算机科学和信息技术,而不是数学。
数据剖析师的前三大专业是工商管理、核算机科学和经济学。这是有道理的,由于数据剖析师的作业涉及到解说数据。
许多数据相关职位的作业描绘中都要求有硕士学位或博士学位,但实际上数据从业者们的学历状况怎么呢?
这也很好了解,由于大多数与数据相关的作业至少需求学士学位,而那些具有硕士学位或博士学位的人也有学士学位。
但是,在数据科学家中,具有学士学位的与具有硕士学位的数量大致相同。这意味着比较数据剖析师,数据科学家中挑选持续攻读进修的人群要更多。
接下来,咱们用分组条形图将数据可视化,其间赤色条形代表男性,紫色代表女人。
那么放眼全球,各个国家的数据从业者散布怎么呢?下面咱们看到全球数据科学家人数TOP 25的国家。
接下来咱们进一步看看,这些数据科学家都散布在哪些城市。咱们将下载显现每个城市的数据科学家数量的数据。
接下来,咱们将运用folium制作数据,folium是一个用于创立地图的Python库。
从地图上,咱们能够看到,在美国数据科学家数量最多的州是加州。其次纽约、马萨诸塞州和德克萨斯州别离排在第二到第四位。
与数据科学家这个人物相关的头衔有许多,比方高档数据科学家、初级数据科学家、数据科学家实习生等等。
能够看到排在前三的别离是,数据科学家、资深数据科学家以及实习数据科学家。
在谷歌查找中,数据科学家这个关键词的查找量跟着时刻推移发生了怎样的改变?
图中可见,从2016年到2021年,人们对关键词“数据科学家”的查找量呈线性增加。
职位的数量跟着时刻推移是怎么改变的?咱们能够运用显现全职职位数量随时刻改变的数据来核算出来。
数据中的榜首行显现,1988年有40位数据科学家从业者。数据中的第二行显现,1989年有52名数据科学家从业者。
咱们能够看到,在2014年之前,教育和经济学是数据科学家中最受欢迎的两项技术。但是,2014年之后,Python逾越了这两项技术,成为最受欢迎的技术。