본문 바로가기

R/쉽게 배우는 R 데이터분석

한국인의 삶을 파악하라! -07

반응형

성 평등이 상식인 세상이 됐지만 여전히 성별에 따라 다른 직업을 갖는 경향이 있습니다. 성별에 따라 어떤 직업이 많은지 분석해 보겠습니다. 성별, 직업 변수 전처리 작업은 앞에서 완료했으니 바로 변수 간 관계를 분석하겠습니다.

 

분석 절차

1. 변수 검토 및 전처리

-성별, 직업

 

2. 변수 간 관계 분석

-성별 직업 빈도표 만들기, 그래프 만들기

 

성별 직업 빈도 분석하기

성별 변수 전처리는 02, 직업 변수 전처리는 06에서 완료했으니 생략하고 변수 간 관계를 분석하겠습니다.

 

1. 성별 직업 빈도표 만들기

각 성별로 직업별 빈도를 구해 상위 10개를 추출하겠습니다.

 

# 남성 직업 빈도 상위 10개 추출
job_male <- welfare %>% 
  filter(!is.na(job)&sex == "male") %>% 
  group_by(job) %>% 
  summarise(n = n()) %>% 
  arrange(desc(n)) %>% 
  head(10)

job_male
# A tibble: 10 x 2
   job                          n
   <chr>                    <int>
 1 작물재배 종사자            640
 2 자동차 운전원              251
 3 경영관련 사무원            213
 4 영업 종사자                141
 5 매장 판매 종사자           132
 6 제조관련 단순 종사원       104
 7 청소원 및 환경 미화원       97
 8 건설 및 광업 단순 종사원    95
 9 경비원 및 검표원            95
10 행정 사무원                 92

# 여성 직업 빈도 상위 10개 추출
job_female <- welfare %>% 
  filter(!is.na(job)&sex == "female") %>% 
  group_by(job) %>% 
  summarise(n = n()) %>% 
  arrange(desc(n)) %>% 
  head(10)

job_female
# A tibble: 10 x 2
   job                              n
   <chr>                        <int>
 1 작물재배 종사자                680
 2 청소원 및 환경 미화원          228
 3 매장 판매 종사자               221
 4 제조관련 단순 종사원           185
 5 회계 및 경리 사무원            176
 6 음식서비스 종사자              149
 7 주방장 및 조리사               126
 8 가사 및 육아 도우미            125
 9 의료 복지 관련 서비스 종사자   121
10 음식관련 단순 종사원           104

 

2. 그래프 만들기

앞에서 만든 성별 직업 빈도표를 이용해 그래프를 만들겠습니다.

 

# 남성 직업 빈도 상위 10개 직업
ggplot(data=job_male, aes(x = reorder(job,n), y=n)) +
  geom_col() +
  coord_flip()

# 여성 직업 빈도 상위 10개 직업
ggplot(data = job_female, aes(x = reorder(job,n), y = n)) +
  geom_col() +
  coord_flip()

 

출력된 표와 그래프를 보면 남성들이 가장 많이 가지고 있는 직업은 작물 재배 종사자, 자동차 운전원, 경영 관련 사무원, 영업 종사자라는 것을 알 수 있습니다. 여성들이 가장 많이 가지고 있는 직업은 작물 재배 종사자, 청소원 및 환경 미화원, 매장 판매 종사자, 제조관련 단순 종사원이라는 것을 알 수 있습니다.

반응형