当前位置: 首页>> >>正文
要不要考公务员:大数据分析告诉你怎么样
2015-11-30 10:48:00 作者:网络 浏览次数:1885 标签: 大数据分析工具

大清早,学姐就推开我寝室的门,说道:“我妈又打电话催我要准备国考了。”

没错,这就是最近学姐和我之间的主要话题。什么考公务员考到哪里啦,公务员工资高不高啦,工作是不是很轻松啦。其实我觉得这些都不是什么重要因素。收入? 轻松?还要考虑这些事?难道当一名光荣的公务员的主要原因不应当是希望自己能够鞠躬尽瘁死而后已地致力于为人民服务的伟大事业吗?

当然,这些话我并未出口,大清早的我实在不想再被学姐打了。但为了结束这个絮絮叨叨的话题,我还是决定帮助她研究这么一个小问题:

学姐啊,公务员收入什么的我实在搞不清楚,但我们不妨来看看:当一名光荣的公务员,到底有多辛苦呢? 

假如只是四处打听一下的话,会发现关于公务员的消息往往都是两极分化的。城市公共部门工作的小伙伴们总是有的忙碌有的闲。毫无疑问,个体的遭遇总是剧情离奇且难以预料的。但是总体情况如何呢?

就全国而言太过复杂,还是以魔都为例吧。我们登录上海市人民政府的官方网站,可以看到魔都政府已经非常贴心地把各级各类的城市公共部门信息都公布在了网站 上,另加基层一线的上海所有镇级人民政府,我们把这些部门(共计704个)整理下来,按照类型和级别把它们放在地图上,可以看到下图:

 

那么,我们可以简单地将在这700多个公共部门工作的人,视为上海的主要公务员群体。那么,他们总体工作状态怎样呢?

事实上,我们没有办法去查看每个部门的打卡机,通过精确的出勤信息做出精准的分析。但非常恰巧的是,我的电脑正好放着一组来自某互联网公司(见注1)的关 于上海的移动设备源大样本数据(约300万个源吧)。太好了,让我们用这组数据作为一个抽样,来挖掘一下魔都公共部门的工作状况吧。
 

第一步,我们需要定义这些公共部门在法定时间内的工作状态

假设,这些公共部门的公务员们会认真地且相对固定地于8:00至18:00期间在办公室上班,那么,我们则需要找到每个办公地点里在以上时段内高频度出现 的移动设备源即可。而这些移动源的集聚状况在某种意义上代表了该部门的法定时间工作状况((根据地址频度显著性、分时段地址差异性等各项指标,从300万 个样本中共筛出来质量较高的约2万个样本是落在704栋办公楼的空间范围内的)。我们将移动源按位置汇总到各个单位,画出图来后大概长这样。

从上图中我们可以看到,工作人员规模最大的公共部门均分布在内环线以内,其中浦东新区和徐汇区的若干公共部门在工作人员总数量上遥遥领先,甚至超过了人民广场。而这些只是白天法定时段内的工作状况。
 

第二步,我们需要定义这些公共部门在法定时间之外的工作状态


假如某单位工作异常繁重,而领导的爱好则是快下班时过来说,“小团啊,这个文件你写一下我明天早上要。”为了满足领导的爱好,可怜的公务员下了班之后往往不能直接回家,经常还得在18:00到22:00这个期间仍然继续鞠躬尽瘁地在办公室里加班。

基于以上假设,为了描绘出公共部门在法定时间之外的工作状态(其实就是加班状况),我们需要从以上数据中再一次筛选出以上时段内(18:00至 22:00)仍然在工作地点高频出现的移动源。筛选完这些数据(差不多剩下8000个样本),将其汇总到部门后,画出图来大概长这样:

 

可以看到,加班总人数的分布和工作总人数分布基本相符。浦东与徐汇仍然领先,而人民广场附近也逐渐追赶上来。具体观察的话,在法定工作时间之外高频度移动源聚集量最大的部门是(冠军来了):

浦东新区地方税务局

看,我们纳税纳得连收税的都得加班加点了。

但是,我们需要注意到的是,加班人员总量(法定时间之外的)并不能完全反应该部门的忙碌程度,也许这个部门本来就人多呢。因此,相对真实地反应该部门的加班状况,我们还需要第三步。
 

好的,第三步来了,我们来计算不同公共部门的加班人员占比


很简单,我们将第一步和第二步的分别筛选出的两组数据相除,就可以得到每个部门的加班人员占比,汇总到各部门可以画出下图:

 

可以看到,市中心高高的红色柱子消失了,它们在郊区零零星星地长了出来。

的确,虽然郊区公共部门的加班工作人员总量与市中心不可比拟,但是其加班人员的比例还是相当高的,而市中心某些地区甚至出现了塌陷。这是怎么回事呢?

这时候,学姐打断我的分析和思考,问道:“会不会是这些郊区的工作人员下了班之后赖在办公室不走喝茶聊天打牌呢?反正我们老家的公务员很多都是这样的,都是五点下班但赖到七八点才回家或者去外面吃饭。”

的确,以我们所能掌握的数据是无法完全排除这个可能的。但是,魔都与一般小城市的差别在于上下班回家的通勤时间天壤之别,以魔都平均通勤时间来计算的话,假如赖到七八点才走,那晚饭就很难指望,估计回到家洗洗弄弄就只能吃宵夜了。
因此,本着关怀的精神,让我们再增加一个步骤。
 

第四步,验证一下看看,这些加班的公务员们,他们都住得离家远吗?


假设,在领导第二天要看文件的强烈需求下,公务员们虽然很努力地加班,但是不至于总是干通宵啊,一个礼拜也得有个三五天回家睡觉吧,当然睡觉时间可能不会很长,差不多也就是24:00至6:00期间吧。

基于这个假设,我们需要找到步骤二中筛选出的那些移动源在以上时段(24:00至6:00)内高频出现的地点,并将之视为该工作人员的居住点。然后将这些点与工作部门所在地进行连线,便可以画出一张加班人员通勤图:

 

上图中的红点,标示相应的公共部门所在地;而绿线,则表示加班的公务员回家的通勤方向与通勤距离。

可以看到,分布在远郊的红点们,其中很多的通勤连线都紧紧地联系着市中心,有些甚至是长途跋涉,比如金山、临港等地区。可以这么理解:对于某些在郊区工作的公务员来说,假如一不小心在办公室赖了以后,那他们这天其实也不太用考虑回家这件事了。

学姐忍不住问道:“郊区的公务员真的都住的那么远吗?还是这只是个别现象? ”

我们可以将以上结论做一个分区的统计,请看下图:

 

从通勤角度来看,的确,大部分市区的加班公务员通勤距离差异不大,保持在8公里左右。但是郊区加班公务员的通勤则差异极大。比如,嘉定、松江、青浦和奉 贤,在这四个传统区县里,加班公务员的通勤距离非常短,仅有5公里,估计很多都是本地解决。但对于金山和崇明而言,则达到了12公里以上。

但从加班指数(加班人员占比)上看,每个区也均有不同。可以看到,公务员加班指数排名最高的三个区分别为静安、崇明、和杨浦。加班比例达到了35%(崇明又加班路又远到底是有多惨)。而相对比较轻松的则是金山、嘉定和普陀,其加班比例略低,但也有20%以上。

我愉快地做完了这个分析,试图结束这个话题。但学姐又发话了,“考公务员的话,貌似不是按片考的吧,是按部门吧。”

啊,好像真的是这样(我真的应该认真去看一下公务员考试指南了)。那么好的,让我们按照公共部门的类型整理一下分析结果吧(只包括了按照官网分类标准能够准确分类的,无法准确分类的被我无情地剔除了,对的我就是这么任性),请看下图:

 

可以看到,加班指数最高的公共部门分别是城市规划部门、其次是人民政府和公安系统。依次排序下来,则是税务、财政、发改。

以上六类虽然通勤距离各有差异,但是加班指数均达到了30%。而相对较为舒适的公共部门看起来是交通系统啊,加班指数最低(约25%),而通勤距离也最短(3公里)。

我若有所思地自言自语道:看来我要劝告那些学城市规划的弟弟妹妹们,赶紧转行学城市交通了才对啊。

这时,学姐第三次发话了,“我觉得你这么分析还是不科学啊。难道区规划局和市规划局、区政府和市政府的加班、国税局和地税局的工作模式一样吗?同一个部门内部可是差异极大的啊。”

学姐真是难缠啊。好吧,让我再次将这些公共部门按照等级分类,分级到市、区、镇三级(魔都基本上没有国家级部门,有少数几个被我无情地剔除掉了,对的我就是这么任性)。请看下图:

 

额。这个规律也有点过于明显了吧。

我赶紧指着屏幕说道,“喂,学姐你看。市级部门的公务员平均加班比率最低,不到30%,通勤距离也比较短;而镇级加班率最高,通勤更是达到了9.5公里。。。哎,学姐你看啊。”

学姐没有搭腔,我转过头来,发现她已经把手机贴到了耳边,并对我做了一个嘘的手势,我赶紧闭上了嘴。隐隐听到她手机听筒里嘟了两声之后传来接通的声音,然后她赶忙急匆匆地问道:

“喂,妈,你在市里面有人吗?”

注:1,本次回答所用的移动设备数据提供方为某互联网公司,对此类数据特点及隐私政策问题的有兴趣的朋友请联系作者。其他数据(政府部门及地点什么的)均为公开数据。

 

来源:团支书(知乎)


(部分文字、图片来自网络,如涉及侵权,请及时与我们联系,我们会在第一时间删除或处理侵权内容。电话:4006770986  邮箱:zhangming[at]eefung.com负责人:张明)

热门文章
文章推荐
舆情监测关注问题
标签云 换一换
舆论风险防范 热点监测 舆论监测软件 文本识别 深度学习算法 NLP 机器学习 网络在线教学舆情 抗击疫情 疫情舆情分析 舆情工作总结 舆论分析 舆情公关 财经金融舆情监测 舆情事件 涉腐舆情 舆情案例 舆情系统 虐童事件 免费舆情监测软件 反转新闻 免费大数据平台有哪些 在线舆情监测 舆情监测哪家好 舆情监测方法 舆情监测报价 舆情网 做好舆情监控 负面监控软件 网红 微舆情 微博传播分析 舆情监测工具 传播路径分析 网红直播 舆情预警系统 近期舆情 手机舆情监测 全网舆情监测 新浪舆情 舆情搜索 网络热点事件 新华舆情 2019网络热词 网络流行语 在线监测软件 大数据分析工具 百度舆情监测 舆情监控前几大公司 数据分析软件有哪些 企业危机管理 315 网络舆情危机 网络舆情监测公司 中国食品药品安全舆情事件案例 社交新全媒体监测系统工具平台公司 舆情监测目的 网信办信息汇总 网络舆情信息简报 舆情监测是什么工作 危机公关 政府舆情 舆情监测预警 舆情监测解决方案 互联网舆情监控系统 网络舆论监测 网络舆情分析系统 互联网舆情分析 舆情是什么意思 德云社 网络舆论分析 医美整形舆情 大数据舆情监测案例 互联网舆情监测平台 政府舆情监测系统 互联网舆情监测系统哪家好 网络社会热点舆情分析系统 舆情信息收集 假期舆情 媒体监测 数据监测 谣言传播 维稳舆情 新闻舆情 舆情查询 舆情预警 5g舆情 网络热词 地方舆情 社会事件舆情分析 微博数据分析 社区舆情 地震舆情 民生舆情 舆情风险监测 高考舆情 政府舆情监测 舆情监测方案 舆情案例分析 网红舆情 舆情监测公司 2019舆情热点 舆情监测软件 舆情监测 社会舆论热点 犯罪舆情 科技舆情 股票舆情 月度舆情分析 消防舆情 舆情信息分析 航空舆情 微信舆情监测 民航舆情 舆情数据分析 消费舆情 环境舆情 人物舆情 公益舆情 食品舆情 新媒体舆情 新媒体舆情监测 感动中国 学校舆情 舆情监测平台 大数据舆情 大数据舆情分析 影视舆情 舆论监督 2019舆情 网络舆情监测 2018舆情事件盘点 2018舆情报告 舆情监测服务商 免费舆情监测系统 舆情报告 负面舆情 舆情分析 舆情研判 舆论监测 校园舆情 舆情热点事件 公共事件舆情 雾霾舆情 政务抖音总结 两个舆论场 官民舆论场 蚁坊软件 高校舆情 港澳台舆情 媒体舆情 涉军舆情 涉法舆情 拆迁舆情 网络舆情 舆情反转 旅游舆情 反腐舆情 海外舆情 信息惠民 灾害舆情 应急管理 智慧城市 体育舆情 景区舆情 媒体舆论 娱乐舆情 检察舆情 舆情管理 监察院舆情 政务舆情 税务舆情 涉外舆情 强拆舆情 司法舆情 舆情研究 交通舆情 企业舆情 法院舆情 舆情指数 政策舆情 舆情汇总 会议舆情 医疗舆情 环保舆情 涉警舆情 明星舆情 社会舆情 教育舆情