本项目基于 Olist Kaggle 电商数据集,围绕订单趋势、配送效率、延误情况、品类结构、区域履约差异和客户满意度开展数据清洗与分析。
- 使用 Python 构建分析用数据表
- 分析订单量、配送时间、延误率和评论分数的变化趋势
- 分析不同产品类别的结构特征与履约表现
- 分析买家地区、卖家地区与履约效率之间的关系
- 为 Excel 数据透视表和业务汇报准备可直接使用的分析表
data_merge.py主数据处理脚本,用于从原始 Olist 数据生成分析表report.md项目的详细分析报告data/本地原始数据和生成结果目录
脚本会生成以下几张核心分析表:
orders_merged_withprint.csv订单级分析表,适合做订单趋势、配送效率、延误率、评分分析order_category_analysis.csv订单-品类分析表,适合做品类结构、品类订单数、品类时效分析order_seller_analysis.csv订单-卖家分析表,适合做卖家区域、同州/跨州履约分析orders_category_helper.csv精简版订单-品类辅助表,便于在 Excel 中快速透视分析
将 Olist 原始 CSV 数据放入 data/ 目录后,执行:
D:\miniconda\python.exe .\data_merge.py- 月度与季度订单趋势分析
- 配送时间与延误率分析
- 买家州与卖家州的区域履约比较
- 产品类别结构与品类表现分析
- 配送表现与客户评分关系分析
完整分析报告见:
- Git 仓库默认不上传原始和生成后的大型 CSV 文件,以保持仓库轻量
评论分数 = 0表示未评论,不代表真实差评- 在品类表和卖家表中做金额汇总时,应优先使用
分摊支付金额,避免重复累计整笔订单金额 - 卖家维度的配送分析优先参考单卖家订单,结论更稳定