본문 바로가기

Python

PM 주차장을 머신러닝 알고리즘으로?!

반응형

- 생각의 흐름을 연달아 적어 멀미를 유발할 수 있다.

 

 


spark 강의를 듣다가 문득 재미난 생각이 들었다.

 

spark 강의의 내용은, NYC TLC(뉴욕시 택시&리무진 요금데이터)를

가지고 아주 간단한 머신러닝을 돌려보는것이었다.

 

하지만 강의수준에서 끝나는것이 아닌,

 

생각의 확장을 했다.

 

"택시 승하차 기록(시간 및 좌표)을 가지고 할 수 있는게 없을까..?"

2가지 생각을 하게 되었다.

 

1. 택시 승하차는 대부분 지하철역과 거리가 있을 것이다.

- 지하철역에서부터 걷는 거리가 멀면 멀수록 택시를 자주 이용할 것이다.

2. 역과 역 사이 애매한 지점에서 택시를 타고 내릴것이다.

- 애매한 지점에서 택시 대기를 한다면 승객을 더 자주 태울 수 있을 것이다.

 

이와같은 생각의 결론은 지하철역과 어느정도 거리(정확하게 알 수 없음)가 있는 지점을 찾는다면, 

택시기사들은 조금 더 효율적이게 승객을 태울 수 있지 않을까.!!?

 

TLC Data

위경도와 시간 이외에 요금과 팁 등의 정보들을 알 수 있다.

 

승차지 및 하차지와 지하철역을 folium으로 띄워보니 승하차가 'Manhattan'에 몰려있는 것을 확인했다.

 

지하철역에서부터 어느정도 거리가 떨어져있는 곳에서 승하차를 많이함을 보았다.(이미지 상 지름은 300m)

 

위의 빨간 원처럼 승차지점이 몰린곳이 택시가 기다리는곳이 좋아보였다.

해당 결과처럼 나오길 바라며 MeanShift clustering 알고리즘을 사용했다.

흠... 맵이 너무 커서 이렇게 나오는 것 같다... 심지어 3개의 구(구역)가 하나로 묶이는 현상도 발생했다.

이 부분은 조금 더 수정하고 조정하여 추후에 다시 올려보도록 하겠다.

 


위의 택시 승하차 데이터를 가지고 우리나라에서 해볼 수 있는것은 무엇일까 생각해보게 되었다.

택시 관련 기사를 읽어보던 중 아래의 기사를 보고 새로운 생각이 떠올랐다.

22년 말, 택시비 인상으로 인해 PM 이용자가 늘었다고 한다.

택시보다 전동킥보드 쪽으로 전환해보자..

 

전동킥보드는 주차(거치)를 해야한다.

PM주차장은 따릉이 주차장에 비해 현저하게 적다.

 

22곳에서 128대정도 수용할 수 있다.

단순 계산으로 보면 강서구는 약 600대 정도의 공유킥보드가 있는 것 같다.(23.1.25 "서울시 공유 킥보드 운영 현황")

 

공유킥보드는 많은데 주차장은 없을 때 일어나는 문제는 아무곳에나 주차를 하는 상황이 아닐까?

전동킥보드는 경량자동차로 판단하여 견인비 4만원 + 견인시간 30분당 700원의 보관비를 내야하구요, 최대 50만원이라고 하며, 특정 업체는 견인된 전동킥보드를 회수하는 비용만 총 매출액의 30%이상을 사용한다고 한다.

 

서울시 열린데이터광장 - 서울시 전동킥보드 견인 현황

견인이 되었다? --> 하차를 했다?? 라고 볼 수 있지 않을까??

해당 주소를 모아 뉴욕데이터에서 실패했던 MeanShift를 실행해보자.

 

초록색 원은 MeanShift로 인해 PM 주차장의 추천 결과이다.

 

 

반응형