分析拉勾网上数据分析这一岗位的信息,找出数据分析岗位的地域性分布、薪酬情况、技能需求以及技能对薪酬的影响。
通过实际的数据来解答针对数据分析岗位的一些疑惑,为自己提供一些参考性的意见。具体来说,主要针对以下几个问题:
- 数据分析师岗位需求的地域性分布;
- 整个群体中薪酬分布的情况;
- 不同城市数据分析师的薪酬情况是怎样的;
- 该岗位对于工作经验的要求是怎样的;
- 根据工作经验的不同,薪酬是怎样变化的;
- 从用人单位的角度看,数据分析师应当具备哪些技能?
- 掌握不同技能是否会对薪酬有影响?影响是怎样的?
本项目主要分为两大部分,第一部分是数据爬取,采用的是集搜客网络爬虫工具。第二部分是数据分析,以python编程语言为基础。 数据分析部分主要使用pandas作为数据整理和统计分析的工具,matplotlib用于图形的可视化,seaborn库包用于图形美化。在进行技能需求分析的时候,使用了jieba作为分词工具包,并使用wordcloud包制作词云。