반응형
이번 글에서는 19.01월 피자집 이용 통화량을 분석해보겠습니다.
Data는 아래의 링크에서 다운받았습니다.
앞선 글에서 치킨, 중국집 통화 건수를 통해 확인 결과, 단순히 한달 Data로 깊이 있는 분석에는 무리가 있다고 생각이 듭니다. 그래서 이번글 역시 중국집 및 치킨 통화 건수를 분석 했던 것처럼 최대한 간소하게 진행하도록 하겠습니다.
Call_pizza_01 <- read.csv("CALL_PIZZA_01MONTH.csv")
str(Call_pizza_01)
# 컬럼 명 영어로 변경
colnames(Call_pizza_01) <- c("date", "wday", "gender", "age", "city", "county", "town", "call")
# type 피자가 없어 새로 추가
type <- rep("피자",nrow(Call_pizza_01))
# type를 그대로 재조합 해서 컬럼에 추가
Call_pizza_01 <- cbind(Call_pizza_01[,1:7],type, call = Call_pizza_01[,8])
# 날짜 데이터 형 변환
Call_pizza_01$date <- as.character(Call_pizza_01$date)
Call_pizza_01$date <- as.POSIXct(Call_pizza_01$date, format = "%Y%m%d")
# 요일 데이터 순서 조정
Call_pizza_01$wday <- factor(Call_pizza_01$wday,
levels = c("월", "화", "수","목","금","토","일"))
# Na값 확인
sum(is.na(Call_pizza_01))
# 연령, 요일 별 Data 그룹화
data_by_years_days <- Call_pizza_01 %>%
group_by(age,wday) %>%
summarize(call = sum(call)) %>% as.data.frame()
# 구, 별 data 그룹화
data_by_county <- Call_pizza_01 %>%
group_by(county) %>%
summarize(call = sum(call)) %>% as.data.frame()
data_by_years_days %>% arrange(call)
data_by_county %>% arrange(call)
아울러, 이번 글에서는 지역별 결과도 보겠습니다.
> data_by_years_days %>% arrange(call)
age wday call
1 10대 월 1339
2 60대이상 월 1529
3 10대 금 1580
4 10대 일 1639
5 10대 토 1705
6 60대이상 금 1752
......
37 40대 금 5632
38 40대 목 5695
39 40대 화 5798
40 30대 일 5916
41 40대 토 6557
42 40대 일 6783
> data_by_county %>% arrange(call)
county call
1 도봉구 1295
2 광진구 1695
3 양천구 2074
4 관악구 2423
5 종로구 2572
6 금천구 3094
......
20 중구 7959
21 서대문구 8513
22 강북구 9568
23 강남구 9721
24 동작구 11731
25 강서구 13929
눈에 띄게 치킨 통화량 분석과 결과가 다르다는것을 알 수 있습니다.
다음 글에서는 앞서 분석을 한 세 Data를 합쳐서 다루어보도록 하겠습니다.
반응형
'서울시 먹거리 분석' 카테고리의 다른 글
시각화 해석 (0) | 2020.02.18 |
---|---|
19.01 요식업계 통화량 시각화 (0) | 2020.02.18 |
19.01월 중국집 이용 통화량 분석 (0) | 2020.02.17 |
19.01 치킨집 이용 통화량 분석 (0) | 2020.02.16 |
기획하기 (0) | 2020.02.15 |