데이터 분석
Chapter 1 미니 프로젝트: 뉴욕맛집
땅호720
2023. 12. 21. 16:16
NYC Restaurants Data - Food Ordering and Delivery 데이터셋 분석 (github)
카테고리 컬럼들 위주로 집계 차이를 관찰하려 했는데, 눈에 띄는 결과가 없었다.
그래서 결국 그룹을 나누어 줌
식당들을 주문량에 따라 세 그룹으로 나누어 주었다.
상대구간(qcut)으로 나누어 주면 주문량을 2/5/MAX로 나누어 지는데, 이렇게 되면 상위 그룹의 주문량 폭이 너무 넓어지게 된다.
그래서 상위 그룹을 10개 레스토랑으로 한정. 그 외 그룹은 중간 그룹에 넣었다. (하위 그룹은 주문량 2이하로 유지)
이렇게 그룹별로 분석을 하자, 아래와 같은 (그룹에 대한) 상관관계가 나왔다.
이 중에서 food_preparation_time이 가장 유의미하게 해석되었다.
A 그룹은 주말에 음식 준비 시간이 더 짧게 분포되어 있지만, C 그룹은 주말의 음식 준비 시간이 더 오래 걸리고 있는 것이 확인 되었다.
A그룹은 주말과 주중의 평점 5점이 4% 차이를 보였지만, C 그룹은 주말과 주중의 평점 5점이 9% 차이를 보였다.
결론적으로 나의 해석은,
A 그룹의 경우, 주말 주문량이 주중의 약 3배나 되지만, 평점과 음식 준비 시간이 큰 차이가 보이지 않는 것으로 보아
주말 주문량에 대한 대비를 하여 서비스 품질이 유지되도록 조치를 하는 것으로 판단된다.