社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python程序员薪资大曝光!现在转行还来得及吗?

中国统计网 • 5 年前 • 541 次点击  


相信各位同学多多少少在拉钩上投过简历,今天突然想了解一下北京Python开发的薪资水平、招聘要求、福利待遇以及公司地理位置。


既然要分析那必然是现有数据样本。本文通过爬虫和数据分析为大家展示一下北京Python开发的现状,希望能够在职业规划方面帮助到大家!!!


01 爬虫


爬虫的第一步自然是从分析请求和网页源代码开始。从网页源代码中我们并不能找到发布的招聘信息。但是在请求中我们看到这样一条Post请求。


如下图我们可以得知:

url:

https://www.lagou.com/jobs/positionAjax.json?

city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false


请求方式:Post

result:发布的招聘信息

total Count:招聘信息的条数




通过实践发现除了必须携带headers之外,拉勾网对IP访问频率也是有限制的。一开始会提示 '访问过于频繁',继续访问则会将IP拉入黑名单。不过一段时间之后会自动从黑名单中移除。


针对这个策略,我们可以对请求频率进行限制,这个弊端就是影响爬虫效率。


其次我们还可以通过代理IP来进行爬虫。网上可以找到免费的代理IP,但大都不太稳定。付费的价格又不太实惠。具体就看大家如何选择了。


1)思路


通过分析请求我们发现每页返回15条数据,total Count又告诉了我们该职位信息的总条数。


向上取整就可以获取到总页数。然后将所得数据保存到CSV文件中。这样我们就获得了数据分析的数据源!


Post请求的Form Data传了三个参数:

  • First : 是否首页(并没有什么用)

  • PN:页码

  • KD:搜索关键字


2)show code



接下来我们只需要每次翻页之后调用getJSON获得请求的结果,再遍历取出需要的招聘信息即可。



ok! 数据我们已经获取到了,最后一步我们需要将数据保存下来。



运行main方法直接上结果:



02 数据分析


通过分析CVS文件,为了方便我们统计,我们需要对数据进行清洗


比如剔除实习岗位的招聘、工作年限无要求或者应届生的当做0年处理、薪资范围需要计算出一个大概的值,而学历无要求的当成大专。



数据通过简单的清洗之后,下面开始我们的统计。


1)绘制薪资直方图



结论:北京市Python开发的薪资大部分处于15~25k之间。


2)公司分布饼状图



结论:Python开发的公司最多的是海淀区,其次是朝阳区。准备去北京工作的小伙伴大概知道去哪租房了吧 


3)学历要求直方图



结论:在Python招聘中,大部分公司要求是本科学历以上。但是学历只是个敲门砖,如果努力提升自己的技术,这些都不是事儿


4)福利待遇词云图



结论:弹性工作是大部分公司的福利,其次五险一金少数公司也会提供六险一金。团队氛围、扁平化管理也是很重要的一方面。


至此,此次分析到此结束。有需要的同学也可以查一下其他岗位或者地区的招聘信息哦~ 希望能够帮助大家定位自己的发展和职业规划。


End.

来源:网络大数据

今日福利放送:Python基础知识思维导图,后台回复【思维】获取领取方式


【入职数据分析】第二季免费公开课每周更新中

第一季已完结,可点击阅读全文进行回看哟!


点击“阅读原文”

今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/XA4to9IgWe
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/27060
 
541 次点击