본문 바로가기

서울시 먹거리 분석

(9)
2018년 요식업계 통화량 시각화 지난 글에서는 2018년 전체의 csv 파일을 하나의 data frame으로 만드는데 초점을 두었습니다. 이번에는 2018년 전체의 데이터를 가지고 시각화하여 이를 파악해보도록 하겠습니다. 2018년 Data 시각화 시각화하기에 앞서 어떠한 방향으로 시각화를 할 지 생각해봐야겠습니다. 1월 Data에 비해 1년 전체의 Data는 얼 별로 파악이 가능하다는 점입니다. 일 단위로 파악을 하는것이 아닌, 조금 더 기간을 두고 파악이 가능합니다. > head(year_18_food_data_frame) 기준일 요일 성별 연령대 시도 시군구 읍면동 업종 통화건수 1 20180101 월 남 10대 서울특별시 강남구 도곡동 중국집 5 2 20180101 월 남 10대 서울특별시 강남구 삼성동 중국집 5 3 20180..
2018년 csv파일 불러오기 지금까지 2019년 1월의 치킨집, 중국집, 피자집 통화량으로 데이터 파악을 했습니다. 이후의 흐름을 파악해보기 위해 이번에는 2018년 전체 데이터를 불러와 분석해보도록 하겠습니다. Data 데이터는 SKT Data Hub에서 2018년의 치킨집, 중국집, 피자집 전체 Data를 다운받습니다. SKT Data Hub>생활>외식/식생활 Data 특이점이 있다면, 피자의 경우 업종이 존재하지 않습니다. 왜 그러한지 생각해본다면, 치킨집, 중국집의 경우 Data의 시작 날짜가 13년 8월이지만 피자집의 경우에는 15년 7월부터 Data를 쌓기 시작했습니다. 피자 판매업종이라고 적혀있는데 굳이 업종을 또 Data에 넣어야 할 필요성이 없어서 넣지 않은 것 같습니다. 아울러 피자집 데이터의 경우에는 시, 군, ..
원인 파악 이번 글에서는 시각화 시킨 자료를 해석한 토대로 왜 이러한 현상이 생겼는지 파알을 해보고, 이에 대한 가설을 세워보려고 한다. 요일별 그래프 원인 파악 1월 1일 화요일부터 1월 31일 목요일까지의 트렌드를 보면 주 단위로 주기가 보인다. 주말에 보통 증가한다는 것을 대략적으로 볼 수 있다. 그런데 노란색 원이 이상하다는 것을 알 수 있다. 왜 주말마다 증가하는 현상이 아닐까..? 도메인 지식을 활용해보자 사실 19년 1월에는 아시안컵 축구대회가 열렸으며, 저때는 아마 대한민국과 다른나라가 축구를 했을 것으로 예상된다. 축구 일정을 확인해보겠습니다. 조별리그 1월 7일 (월) 22:30 대한민국 필리핀 1월 16일 (수) 22:30 대한민국 중국 1월 22일 (화) 22:00 대한민국 바레인 1월 25일..
시각화 해석 이번 글에서는 지난번 글에서 시각화를 한 내용에 대해 특이점을 찾아보고, 왜 이러한 원인이 생겼는지 파악해보는 내용을 다룰 예정입니다. 1. 날짜별 치킨집, 중국집, 피자집 시각화 파악하기 먼저 날짜별로 치킨집, 중국집, 피자집의 통화량을 시각화한 결과를 보도록 하겠습니다. 1. 일주일 주기로 상승했다가 감소하는 경향을 알 수 있다. -> 주말에 많은 주문을 하는 것으로 추정해볼 수 있습니다. 2. 데이터의 양은 치킨집, 중국집이 피자집보다 많습니다. 3. 평일에는 중국집, 주말에는 치킨집의 데이터가 더 많습니다. ->평일의 중국집 데이터는 직장인들이, 주말의 치킨집은 가정에서일것이라고 사료됩니다. 4. 치킨집 통화량이 주말에 치중되어있지만, 평일에 크게 증가한 곳이 보입니다. ->19년 1월에 아시안컵..
19.01 요식업계 통화량 시각화 지난 글에서 19년 1월의 치킨집, 중국집, 피자집의 데이터를 파액해보았습니다. 이번에는 이 데이터를 전부 사용해서 업종별 비교를 하보도록 하겠습니다. 이 분석의 전체적인 방향, 그리고 목차는 기획하기 를 통해 확인하시기 바랍니다. library(dplyr) library(ggplot2) > Call_Chicken_01 Call_cfood_01 Call_pizza_01
19.01 피자집 이용 통화량 분석 이번 글에서는 19.01월 피자집 이용 통화량을 분석해보겠습니다. Data는 아래의 링크에서 다운받았습니다. 19년 1월 피자 판매업종 이용 통화량 앞선 글에서 치킨, 중국집 통화 건수를 통해 확인 결과, 단순히 한달 Data로 깊이 있는 분석에는 무리가 있다고 생각이 듭니다. 그래서 이번글 역시 중국집 및 치킨 통화 건수를 분석 했던 것처럼 최대한 간소하게 진행하도록 하겠습니다. Call_pizza_01 data_by_years_days %>% arrange(call) age wday call 1 10대 월 1339 2 60대이상 월 1529 3 10대 금 1580 4 10대 일 1639 5 10대 토 1705 6 60대이상 금 1752 ...... 37 40대 금 5632 38 40대 목 5695 3..
19.01월 중국집 이용 통화량 분석 이번에는 1월 중국집 이용 통화량 분석을 해보겠습니다. 지난 19.01 치킨 판매업종 이용 통화량 분석을 시도 해보았으며, 매우 흡사하게 진행을 할 예정입니다. 구체적인 인사이트는 -> 치킨집, 중국집, 피자집 데이터를 모두 합쳤을 때 -> 18년 2월~ 19년 1월까지의 데이터를 모두 합쳤을 때 입니다. Data 데이터는 아래에서 다운받도록 하겠습니다. 19년 1월 서울시 중국음식 판매업종 이용 통화량 Data 준비 먼저 분석에 알맞게 Data를 준비 하겠습니다. Data 준비는 지난 블로그에서 실행했던것과 유사하며, 추가로 컬럼명을 영어로 변경시켰습니다. Call_cfood_01 data_by_years_days %>% arrange(call) age wday call 1 10대 일 1846 2 10..
19.01 치킨집 이용 통화량 분석 이번에는 지난 블로그에 이어서 19.01월 치킨 판매 업종 통화량을 여러 방면에서 보도록 하겠습니다. 1.Data 확인 먼저 summary() 함수를 사용하여 Data에 대한 전반적인 내용을 확인해보겠습니다. > summary(Call_chicken_01) 기준일 요일 성별 연령대 시도 Min. :20190101 금:4255 남:14498 10대 :3688 서울특별시:29850 1st Qu.:20190108 목:4655 여:15352 20대 :5695 Median :20190116 수:4670 30대 :6116 Mean :20190116 월:3493 40대 :6084 3rd Qu.:20190124 일:3896 50대 :4537 Max. :20190131 토:4142 60대이상:3730 화:4739 시군구..