반응형
성 평등이 상식인 세상이 됐지만 여전히 성별에 따라 다른 직업을 갖는 경향이 있습니다. 성별에 따라 어떤 직업이 많은지 분석해 보겠습니다. 성별, 직업 변수 전처리 작업은 앞에서 완료했으니 바로 변수 간 관계를 분석하겠습니다.
분석 절차
1. 변수 검토 및 전처리
-성별, 직업
2. 변수 간 관계 분석
-성별 직업 빈도표 만들기, 그래프 만들기
성별 직업 빈도 분석하기
성별 변수 전처리는 02, 직업 변수 전처리는 06에서 완료했으니 생략하고 변수 간 관계를 분석하겠습니다.
1. 성별 직업 빈도표 만들기
각 성별로 직업별 빈도를 구해 상위 10개를 추출하겠습니다.
# 남성 직업 빈도 상위 10개 추출
job_male <- welfare %>%
filter(!is.na(job)&sex == "male") %>%
group_by(job) %>%
summarise(n = n()) %>%
arrange(desc(n)) %>%
head(10)
job_male
# A tibble: 10 x 2
job n
<chr> <int>
1 작물재배 종사자 640
2 자동차 운전원 251
3 경영관련 사무원 213
4 영업 종사자 141
5 매장 판매 종사자 132
6 제조관련 단순 종사원 104
7 청소원 및 환경 미화원 97
8 건설 및 광업 단순 종사원 95
9 경비원 및 검표원 95
10 행정 사무원 92
# 여성 직업 빈도 상위 10개 추출
job_female <- welfare %>%
filter(!is.na(job)&sex == "female") %>%
group_by(job) %>%
summarise(n = n()) %>%
arrange(desc(n)) %>%
head(10)
job_female
# A tibble: 10 x 2
job n
<chr> <int>
1 작물재배 종사자 680
2 청소원 및 환경 미화원 228
3 매장 판매 종사자 221
4 제조관련 단순 종사원 185
5 회계 및 경리 사무원 176
6 음식서비스 종사자 149
7 주방장 및 조리사 126
8 가사 및 육아 도우미 125
9 의료 복지 관련 서비스 종사자 121
10 음식관련 단순 종사원 104
2. 그래프 만들기
앞에서 만든 성별 직업 빈도표를 이용해 그래프를 만들겠습니다.
# 남성 직업 빈도 상위 10개 직업
ggplot(data=job_male, aes(x = reorder(job,n), y=n)) +
geom_col() +
coord_flip()
# 여성 직업 빈도 상위 10개 직업
ggplot(data = job_female, aes(x = reorder(job,n), y = n)) +
geom_col() +
coord_flip()
출력된 표와 그래프를 보면 남성들이 가장 많이 가지고 있는 직업은 작물 재배 종사자, 자동차 운전원, 경영 관련 사무원, 영업 종사자라는 것을 알 수 있습니다. 여성들이 가장 많이 가지고 있는 직업은 작물 재배 종사자, 청소원 및 환경 미화원, 매장 판매 종사자, 제조관련 단순 종사원이라는 것을 알 수 있습니다.
반응형
'R > 쉽게 배우는 R 데이터분석' 카테고리의 다른 글
한국인의 삶을 파악하라! -09 (0) | 2020.03.05 |
---|---|
한국인의 삶을 파악하라! -08 (0) | 2020.03.05 |
한국인의 삶을 파악하라! -06 (0) | 2020.03.04 |
한국인의 삶을 파악하라! -05 (0) | 2020.03.04 |
한국인의 삶을 파악하라! -04 (0) | 2020.03.03 |