科技布道,助你有为
杭州道为教育老师直接接听
2023/9/20 17:11:51
bilibili电商平台订单报表分析(上)——数据准备
1. 实验背景
Bilibili作为一个中国主要的弹幕视频服务网站,越来越受到年轻用户的青睐。B站的用户数量和活动度不断增长,是许多市场营销和数据分析专业人士的研究对象之一。对于数据分析师而言,探索和分析B站会员购订单数据将有助于我们深入研究B站用户的消费行为和偏好,为未来市场规划提供有力的支持。今天,通过对B站项目进行数据分析,可以帮助我们了解电商行业的常用数据分析思路。
2. 课程环境
Python、Excel
3. 课程目标
B站会员购订单数据具有多种指标和维度,这些数据的分析可以从宏观层面和细微层面同时展开。
(1)在宏观分类中,通过订单类型分析以及对取消订单进行针对性分析,了解是否存在恶意的订单占货情况,并根据订单分类进行数据筛选以满足后续分析要求。
(2)在了解B站会员购订单的基本宏观趋势的同时,进一步分析其微观特征,可以从另一个角度更深入地揭示其消费者的偏好和趋势。
①从时间层面分析,了解订单的高峰和低估时间,以及订单在不同时间的价格分布;
②从商品层面分析,分析不同商品客单价和销量的差异,各类商品在不同时间段的销量分布情况,以及不同地区商品价格和客单价的差异,并对其中的异常值进行深入分析;
③通过商品和时间的双维度分析,了解目标用户群体的特征;
④针对地区进行品牌渗透度分析,了解不同地区订单数和客单价的差异。
4. 实验步骤
2.1数据介绍
1、bilibili2月9日订单.xlsx
·商品基础信息数据:商品编号、商品名称
·订单信息:商品价格(用户消费的金额,并不是商品的单价)、票号、座位、联系地址、渠道、下单时间、支付时间、支付单号
·店铺信息:店铺名称、店铺id
2、全国各地人口数.xlsx
记录了全国各省的人口数
2.2数据读取与清洗
这里使用python读取数据,并对异常数据进行清洗,然后对清洗后的商品价格数据进行描述性分析,来初步了解商品价格的整体情况。
#导入需要的包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import os
1.单表格数据读取
#读取2月9日的订单数据,sheet_name是excel工作表的名字
data=pd.read_excel('bilibili2月9日订单.xlsx',sheet_name="order")
data.head()
#一、数据清洗,这里我们将联系地址中的空值去除,并分析商品价格的情况
#新建空白字典,用户储存清洗后的数据
data_cleaned={'price':[], 'sku':[], 'address':[]}
#获取数据表的行数
length= len(data)
#提出联系地址为空的数据,并将符合条件的结果存入到data_cleaned中
for i in range(a):
if data.loc[i,'联系地址'] != '--':
data_cleaned['price'].append(data.loc[i,'商品价格'])
data_cleaned['address'].append(data.loc[i,'联系地址'])
data_cleaned['sku'].append(data.loc[i,'商品编号'])
df=pd.DataFrame(data_cleaned)
df
通过查看数据的前五行,我们可以看到票号、座位、售后状态都是空值,所以这三列可以删除掉,而联系地址列中也包含空值,所以这一列数据需要处理。这里需要说明一下,只要是成功付款的用户,联系地址都不可能为空。
专业解答各类课程问题、介绍师资和学校情况
微信号:159******02
相关资讯
“杭州道为教育”是杭州道为教育科技有限公司在教育宝平台开设的店铺,若该店铺内信息涉嫌虚假或违法,请点击这里向教育宝反馈,我们将及时进行处理。
商业数据分析实训班
商业数据分析孵化班
商业数据分析就业冲刺班
低代码开发工程师就业班
¥16800
推荐系统就业实训