NYC Restaurants Data - Food Ordering and Delivery 데이터셋 분석 (github)
카테고리 컬럼들 위주로 집계 차이를 관찰하려 했는데, 눈에 띄는 결과가 없었다.
그래서 결국 그룹을 나누어 줌
식당들을 주문량에 따라 세 그룹으로 나누어 주었다.
상대구간(qcut)으로 나누어 주면 주문량을 2/5/MAX로 나누어 지는데, 이렇게 되면 상위 그룹의 주문량 폭이 너무 넓어지게 된다.
그래서 상위 그룹을 10개 레스토랑으로 한정. 그 외 그룹은 중간 그룹에 넣었다. (하위 그룹은 주문량 2이하로 유지)
이렇게 그룹별로 분석을 하자, 아래와 같은 (그룹에 대한) 상관관계가 나왔다.
이 중에서 food_preparation_time이 가장 유의미하게 해석되었다.
A 그룹은 주말에 음식 준비 시간이 더 짧게 분포되어 있지만, C 그룹은 주말의 음식 준비 시간이 더 오래 걸리고 있는 것이 확인 되었다.
A그룹은 주말과 주중의 평점 5점이 4% 차이를 보였지만, C 그룹은 주말과 주중의 평점 5점이 9% 차이를 보였다.
결론적으로 나의 해석은,
A 그룹의 경우, 주말 주문량이 주중의 약 3배나 되지만, 평점과 음식 준비 시간이 큰 차이가 보이지 않는 것으로 보아
주말 주문량에 대한 대비를 하여 서비스 품질이 유지되도록 조치를 하는 것으로 판단된다.
'데이터 분석' 카테고리의 다른 글
문해력: 정량적 데이터 (0) | 2024.01.03 |
---|---|
문해력: 문제 정의 (1) | 2024.01.03 |
평가 메트릭 (0) | 2023.12.20 |
pandas: map, apply, transform, agg (0) | 2023.12.19 |
MongoDB (0) | 2023.12.05 |