Thống kê và trực quan hóa doanh số bán hàng bằng Python
- Duy Nguyễn Đức
- Apr 25, 2023
- 3 min read
Bạn đang muốn tìm hiểu về cách thống kê và trực quan hóa doanh số bán hàng trong Python? Đây là một công cụ mạnh mẽ và linh hoạt giúp bạn có thể thực hiện việc này một cách nhanh chóng và dễ dàng. Với Python, bạn có thể thực hiện việc xử lý dữ liệu, phân tích, và trực quan hóa kết quả một cách chính xác và đầy đủ. Sau đây là bài báo cáo chi tiết và thống kê doanh số bán hàng bằng Python.
Dữ liệu ta có gì?
Bộ dữ liệu ban đầu gồm 12 file .csv với mỗi file thể hiện cho dữ liệu bán hàng của mỗi tháng trong năm 2019

Bảng dữ liệu bảng hàng bao gồm :
Order ID: Mã đặt hàng
Product: Tên sản phẩm
Quantity Ordered: Số lượng đặt hàng
Price Each: Đơn giá
Order Date: Ngày đặt
Purchase Address: Địa chỉ đặt hàng
Gộp các bảng dữ liệu
Bởi bản chất các cột dữ liệu trong các file dữ liệu tháng là giống nhau nên ta có thể dễ dàng gộp các tháng lại thành một file tổng – thể hiện dữ liện bán hàng năm 2019. Đoạn code python thực thi như sau:
for ele in paths:
df = pd.read_csv(ele)
df = df[df['Order ID'].isna() == False].reset_index(drop = True)
df = df[df['Order ID'].str.contains('Order ID') == False].reset_index(drop = True)
df['Price Each'] = df['Price Each'].apply(lambda x :float(x))
df['Quantity Ordered'] = df['Quantity Ordered'].apply(lambda x :int(x))
df['Order Date'] = pd.to_datetime(df['Order Date'])
df['Sales Amount'] = df['Price Each'] * df['Quantity Ordered']
df['Date'] = df['Order Date'].apply(lambda x : x.date())
df['Time'] = df['Order Date'].apply(lambda x : x.time())
df['Day'] = df['Date'].apply(lambda x : x.day)
df['Year'] = df['Date'].apply(lambda x : x.year)
df['Month'] = df['Date'].apply(lambda x : x.month)
dfs.append(df)
Link github: combine files.
Phân tích dữ liệu bán hàng năm 2019
Đây là dữ liệu sau khi gộp tất cả các files

Bổ sung thêm so với các file gốc là cột dữ liệu về thời gian
Thống kê mô tả

Có tổng cộng 185,950 đơn đặt hàng năm 2019

Doanh thu cả năm 2019 là: 34,492,035




Trực quan hóa dữ liệu
Doanh thu và doanh số theo tháng

Doanh thu và doanh số thường có xu hướng tăng cao nhất vào khoảng cuối năm, trong tháng 10, 11 và 12. Đầu năm, thường có xu hướng thấp và tăng dần cho tới tháng 4. Từ tháng 4 đến tháng 9, thường có dấu hiệu sụt giảm. Doanh thu và doanh số theo loại sản phẩm.

Các mặt hàng chiếm tỷ trọng doanh thu cao nhất là Laptop, Monitor, Phone. Cao nhất là Laptop với 12,167,560 so với tổng thể là 34,492,035 (xấp xỉ 50%). Tuy chiếm doanh thu cao nhưng doanh số bán là thấp. Tức là bán không được nhiều nhưng lại được giá, cần đẩy mạnh doanh số để tăng cường doanh thu.
Doanh số theo thành phố

Các thành phố chiếm doanh thu cao nhất là San Fransisco, Los Angeles, Newyork City với tỷ lệ tương ứng là 24%, 15.8%, 13.5%.
Nhập thông tin tháng, loại sản phẩm, thành phố để nhận về kết quả thống kê
Ví dụ : Thống kê doanh số và doanh thu vào tháng 1 và 2 của việc bán điện thoại (Phone) tại thành phố Boston

Trực quan hóa dữ liệu

Link github : Visualization with Matplotlib
Như vậy, thông qua việc sử dụng Python và các thư viện hỗ trợ, chúng ta đã có thể thực hiện việc thống kê và trực quan hóa doanh số bán hàng một cách hiệu quả và nhanh chóng. Những kết quả và thông tin được thu thập từ quá trình này có thể giúp cho các nhà quản lý và doanh nghiệp đưa ra những quyết định đúng đắn hơn trong việc phát triển kinh doanh và tăng trưởng doanh số. Việc áp dụng Python vào thực tiễn kinh doanh đang trở thành xu hướng phát triển mới, giúp cho các công việc thống kê và phân tích dữ liệu trở nên dễ dàng và nhanh chóng hơn bao giờ hết.
Commentaires