Skip to content

TimeGone07/OliST_data_analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Olist 电商物流数据分析项目

本项目基于 Olist Kaggle 电商数据集,围绕订单趋势、配送效率、延误情况、品类结构、区域履约差异和客户满意度开展数据清洗与分析。

项目内容

  • 使用 Python 构建分析用数据表
  • 分析订单量、配送时间、延误率和评论分数的变化趋势
  • 分析不同产品类别的结构特征与履约表现
  • 分析买家地区、卖家地区与履约效率之间的关系
  • 为 Excel 数据透视表和业务汇报准备可直接使用的分析表

仓库结构

  • data_merge.py 主数据处理脚本,用于从原始 Olist 数据生成分析表
  • report.md 项目的详细分析报告
  • data/ 本地原始数据和生成结果目录

生成的分析表

脚本会生成以下几张核心分析表:

  1. orders_merged_withprint.csv 订单级分析表,适合做订单趋势、配送效率、延误率、评分分析
  2. order_category_analysis.csv 订单-品类分析表,适合做品类结构、品类订单数、品类时效分析
  3. order_seller_analysis.csv 订单-卖家分析表,适合做卖家区域、同州/跨州履约分析
  4. orders_category_helper.csv 精简版订单-品类辅助表,便于在 Excel 中快速透视分析

运行方式

将 Olist 原始 CSV 数据放入 data/ 目录后,执行:

D:\miniconda\python.exe .\data_merge.py

推荐分析方向

  • 月度与季度订单趋势分析
  • 配送时间与延误率分析
  • 买家州与卖家州的区域履约比较
  • 产品类别结构与品类表现分析
  • 配送表现与客户评分关系分析

详细报告

完整分析报告见:

说明

  • Git 仓库默认不上传原始和生成后的大型 CSV 文件,以保持仓库轻量
  • 评论分数 = 0 表示未评论,不代表真实差评
  • 在品类表和卖家表中做金额汇总时,应优先使用 分摊支付金额,避免重复累计整笔订单金额
  • 卖家维度的配送分析优先参考单卖家订单,结论更稳定

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages