本报告的限制
由于本报告基于中华英才网的在线薪资调查,参加者都具有上网的条件,因此本报告不能代表没有上网条件的人群的薪资水平;
尽管采取了多种措施(我们一共设定了15条数据筛选规则)过滤不合理数据,但是仍然有可能包含了某些精心制作的假造数据。
另外,尽管我们采集样本数量很大(超过49377条),但是这些样本的分布并非十分均匀的(主要集中在几个大城市)。对某些参加者较少地区或者行业,本报告的数据可能没有代表意义。
数据的收集方法
本次在线英才薪资调查,被测试者不需填写姓名,系统只将e-mail地址作为唯一识别号,这就减小了被测试者的作弊动机,并且通过技术手段,三层筛选,确保同一回答者不能回答同一问卷两次及更多次。
本期2003年上半年(1月1日--6月30日)收集的原始数据总量为43883条,经过筛选后有效数据为42165条。
数据的探索方法
逻辑规则探索——排除不合理数据
说明:我们对不符合逻辑规则的数据做相应的处理,以保证数据的有效性。所有的逻辑规则按照序号由小到大执行;如果某个纪录中含有多个逻辑错误,那么,它将被序号最小的规则所处理。
例子:某纪录中年薪大于月薪的100倍,而且月薪小于200元(规则5、8),那么它将由规则5来处理。
规则
序号
|
逻辑错误类别
|
本期发生记录数(条)
|
1
|
对本期数据按照e-mail地址排序,相同e-mail地址的数据只保留最早的一条记录,删除其余重复记录
|
393
|
2
|
未满18岁就已工作
|
56
|
3
|
前一职位薪资大于现职位薪资的10倍
|
37
|
4
|
现职位薪资大于前一职位的50倍
|
23
|
5
|
年薪大于月薪的100倍
|
34
|
6
|
工龄一年以下,但年薪超过240000(上期99%分位点)
|
42
|
7
|
北京地区月薪少于260元
|
5
|
8
|
其他地区月薪小于200元
|
12
|
9
|
年薪高于240000元(上期99%分位点值),工龄少于5年
|
135
|
10
|
本科学历以上,但年薪少于6000元
|
86
|
11
|
有过海外经历,但年薪少于10000元
|
49
|
12
|
年薪高于240000元,工作单位性质为'政府机关'
|
4
|
13
|
行业累计任职时间1年以下,年薪超过240000(上期99%分位点)
|
121
|
14
|
薪资各位数数字相同,如111111
|
42
|
15
|
行业涂鸦(如“什么也不是”)
|
317
|
|
总计
|
1356
|
均值的计算方法
数据探索后,对符合研究范围内的合格参加者的年薪收入水平作频数分布分析,为了体现大多数被调查者的真实年薪收入水平,取年薪收入位于99%分位点以下的人进行均值分析。因此,据此得出的年薪均值代表了至少99%的被调查者的平均水平。
|