一、熟悉数据集
数据集来源:IBM HR Analytics员工流失和绩效,在kaggle下载,是由IBM数据科学家创建的虚构数据集,主要目的是演示用于员工流失的Watson分析工具。因此,数据集只用于测试自己需要员工数据的模型和数据分析,不用于得出现实结论。
数据大小:1470行*35列。
数据字段含义:age(年龄)Attrition(摩擦)BusinessTravel(出差)DailyRate(日产出)DistanceFromHome(上班距离)Department(部门)Education(学历)EducationField(专业)EnvironmentSatisfaction(环境满意度)Gender(性别)HourlyRate(小时工资)JobInvolvement(敬业度)JobLevel(职业等级)JobRole(工作角色)JobSatisfaction(工作满意度)MaritalStatus(婚姻状况)MonthlyIncome(月收入)MonthlyRate(月支出)OverTime(是否加班)PercentSalaryHike(工资上涨率)PerformanceRating(业绩评估)RelationshipSatisfaction(关系满意度)StockOptionLevel(期权)TotalWorkingYears(工作时间)YearsAtCompany(入职时间)TrainingTimesLastYear(上年培训次数)WorkLifeBalance(工作生活平衡度)YearsSinceLastPromotion(上次晋升时间)YearsInCurrentRole(当前职务时间)YearsInCurrentRole(当前职级)
二、想得到的描述信息
1、4种满意度员工的产出情况和绩效评估等级。
2、出差、产出、上班距离、学历、环境满意度、工资、职业等级、晋升时间等因素的工作满意度情况。
3、有摩擦和无摩擦两种情况下员工满意度、环境满意度