本項目的數據是某電商平臺從2017 1月到2017 12月的日常訂單明細數據和用戶信息數據,包括銷售訂單表和用戶信息表兩個數據表。銷售訂單表是每個訂單的明細,壹個訂單對應壹筆銷售。這兩個表的表結構如下:
銷售訂單表結構:
用戶信息表結構:
這個項目主要分為三個維度,即用戶畫像,根據用戶群體進行分析,找出平臺的主要特征;在商品維度,找出商品在不同市場的銷售差異等。在用戶價值維度,主要根據用戶的消費行為挖掘其內在規律。分析的具體思路如下:
上面我們已經學會了處理各種重復值,所以在實際業務中,通常會刪除重復值。選擇所有數據-點擊菜單欄中的數據-刪除重復項,如下圖
缺失值的壹般可接受標準低於10%。通常的處理方法如下:
達到以下效果:選擇要轉換的數據-右鍵,復制-選擇空白單元格-開始-粘貼-選擇性粘貼-選擇轉置-完成。
點擊文件-選項-自定義函數-在命令中找到不在功能區中的數據透視表和數據透視圖向導並選中它-在右邊的數據選項卡下添加壹個新的選項卡並選中它-添加-確定。最後,數據透視表和數據透視圖向導出現在數據中,如下所示:
點擊透視表和透視表向導-選擇多個合並計算數據區域-創建單頁字段-下壹步-選擇要操作的區域-下壹步-選擇新工作表-完成-雙擊合計值-即二維表轉換為壹維表,如下圖:
大部分的視覺圖形都比較簡單,相信大家都能輕松實現。然後,壹些特殊的圖形,因為它也很重要。
圖示:平臺的主要特點是:女性用戶;90後單身以中專、博士學歷為主;該地區集中在天津。女生更喜歡飲料和日用品,男生更喜歡飲料和海鮮。
圖表描述:整體銷量呈下降趨勢,從10開始緩慢回升。根據“二八”法則可以看出,天津、南京、北京占總銷量的43%,可以認為是重點市場。最受歡迎的類別是飲料、日用品和肉類/家禽。
(註:由於上述數據集中用戶數量有限,同步組後不明顯。這是壹個新的用戶數據集。)
說明:已經通過RFM模型對用戶進行了分類,針對不同類型的用戶可以采取相應的運營策略;重點維護消費頻次在82~100之間的用戶。同期群體分析,可以看到平臺的新增用戶在逐漸增加,但留存率較低。
數據獲取方式:關註“Python每日壹課”,後臺回復“excel電商項目”。
希望這篇文章的內容能給大家的學習或者工作帶來壹些幫助,每天進步壹點點。加油?。