top of page

Báo Cáo Phát Hiện Lạm Dụng Chương Trình Khuyến Mãi

Tổng quan vấn đề đang gặp phải

Chúng ta đang triển khai một chương trình khuyến mãi 30% trên tổng hóa đơn, khuyến mãi tối đa 20k/hóa đơn. Khách hàng đang liên kết với người bán để lạm dụng chương trình khuyến mãi này. Chúng ta phát hiện có những trường hợp hai bên đa cố gắng thỏa thuận để nhận được tối đa tiền khuyến mãi nhất.

Ví dụ:

Với một đơn hàng có giá trị lớn, người bán và người mua sẽ thỏa thuận với nhau để chia đơn hàng thành nhiều phần nhỏ hơn. Với mỗi phần nhỏ hơn đó thì sẽ nhận được một khuyến mãi tối đa của chúng ta. Tức là 20k/hóa đơn.

Ví dụ: Với đơn hàng là 900k, nếu hai bên giao dịch bình thường thì chúng ta chỉ tốn 20k khuyến mãi cho hóa đơn này. Nhưng nếu 2 bên có hành vi gian lận, họ sẽ chia nhỏ hóa đơn 900k thành 14 hóa đơn nhỏ hơn (13 hóa đơn 67k và 1 hóa đơn 29k). Từ đó, với mỗi hóa đơn 67k ta phải trả về cho người mua 20k và với 1 hóa đơn 29k thì ta trả về 8k. Vị chi, chương trình khuyến mãi đã làm cho ta phải hoàn tiền cho người mua (20x12 + 8x1 = 248k). Thay vì ta chỉ khuyến mãi 20k cho hóa đơn 900k như chương trình khuyến mãi đề ra thì ta phải tiêu tốn hết 248k nếu 2 bên kia gian lận. Chi phi của ta đã đôn lên gấp 12 lần so với thông thường.

Rủi ro:

Với càng nhiều những giao dịch mang tính lạm dụng như trên thì chi phí của ta sẽ càng tăng hơn so với dự kiến. Tổng số giao dịch sẽ tăng vọt nhưng thực chất tổng doanh thu nhận về thì vẫn không có gì thay đổi. Chi phí tăng cao, lượng khuyến mãi cho Customer tăng cao, tổng số lượt giao dịch cũng tăng nhưng doanh thu thì vẫn không đổi (so với trường hợp không có hành vi gian lận).

Tóm lại, việc phát hiện hành vi gian lận trong trường hợp này là vô cùng quan trọng và cấp thiết. Chúng ta chỉ mở đợt khuyến mãi một thời gian cố định và chúng ta đưa ra quyết định đúng đắn sớm lúc nào thì càng có lợi hơn lúc ấy. Điều này sẽ giúp chúng ta có được biện pháp nhằm giảm thiểu gian lận, giảm thiểu hành vi lạm dụng và kịp thời điều chỉnh chính sách sao cho hợp lý nhất có thể.


Tệp dữ liệu:

Đây là toàn bộ thông tin giao dịch của chúng ta trong suốt quá trình chạy khuyến mãi. Bao gồm (Thời điểm giao dịch, ngày giao dịch, mã đơn hàng, mã người mua, mã người bán, tổng hóa đơn, khuyến mãi)

File:

Định nghĩa dữ liệu:

Mục tiêu bài báo cáo

  • Xem xét và thống kê xem các đơn hàng đang phân bổ ở khoảng tổng hóa đơn nào?

Xem thử phân bổ giá trị các đơn hàng có đang tập trung ở những khoảng cụ thể nào không? Sự phân bổ này có phải là một dấu hiệu bất thường không? Và tại sao nó lại phân bổ như vậy, có phải chỉ là một sự phân bổ ngẫu nhiêu không?

  • Những người bán có khả năng cao là đang có hành vi lạm dụng chương trình khuyến mãi.

Họ có đang tăng số lượng giao dịch những đơn hàng có giá trị nhỏ một cách bất thường? Phần lớn đơn hàng có đang tập trung ở khoảng có nguy cơ cao là gian lận không?

  • Những khách hàng nào có nguy cơ là lạm dụng?

Những ai đang mua những đơn hàng có giá trị nhỏ với số lượng nhiều lần?

Giá trị của các hóa đơn đang phân bổ như thế nào?

Đồ thị phân bổ tổng tiền đơn hàng chia theo tứ phân vị

Cụ thể:

  • 25% lượng đơn hàng đang có giá trị trong khoảng [0,70.000)

  • 25% lượng đơn hàng đang có giá trị trong khoảng [70.000,84.926)

  • 25% lượng đơn hàng đang có giá trị trong khoảng [84.926,139.000)

  • 25% lượng đơn hàng đang có giá trị trong khoảng [139.000, ...)

Biểu đồ phân bổ tổng tiền của các hóa đơn

Đồ thị histogram với 50 thanh dữ liệu trong khoảng 0 -> 3,500,000(đ). Tương đương, 1 thanh tương ứng với 70,000đ.

Theo như đồ thị: Đa số các đơn hàng đang phân bổ trong phạm vi từ 0 --> 140,000đ (2 thanh đầu tiên)

==> Sự phân bổ lệch hẳn về bên trái.

Số đơn hàng từ 0đ - 140.000đ xấp xỉ gấp 3 lần sao với những đơn lớn hơn 140.000đ. 3/4 các đơn hàng đang rơi vào những đơn có giá trị nhỏ.

Những đơn hàng có giá trị nhỏ thế này sẽ tận dụng tối đa chương trình khuyến mãi. Điều này, gây bất lợi cho chúng ta.

Phân bổ trong khoảng gvm (0-140k)

Những đơn hàng tầm 70k là được mua nhiều nhất

Đâu là 3 người bán có khả năng gian lận?

Thế nào là gian lận ?

Như đã đề cập, những người bán nào thỏa thuận với khách hàng để chia nhỏ đơn hàng thành những phần nhỏ hơn so với giá thực tế nhằm hưởng tối đa chương trình khuyến mãi sẽ là những đối tượng nghi ngờ gian lận.

Vì vậy, một người bán có quá 3 giao dịch (>= 2 giao dịch) trong một khoảng thời gian nhất định với những giá trị giao dịch nhỏ sẽ được xem là gian lận. Đương nhiên là với điều kiện đơn hàng đó phải là đơn hàng áp dụng giảm giá (rebate > 0).

Giá trị giao dịch nhỏ là bao nhiêu ?

Với chương trình giảm giá 30% tối đa 20k thì đơn hàng có giá trị 67k sẽ được xem là tối ưu nhất nên nhưng đơn xoay quanh giá trị này sẽ được xem là đơn hàng có giá trị nhỏ. Chúng ta sẽ chọn luôn khoảng

(0 -140.000đ) vì 3 / 4 dữ liệu đã rơi vào khoảng này.

Khoảng thời gian nhất định là bao lâu ?

Trong tình huống này ta sẽ xét 2 trường hợp :

· Trong vòng 1 ngày

· Trong vòng cả 4 ngày

Làm sao để phát hiện gian lận ?

Mô tả quy trình tìm ra những ai có khả năng là gian lận :

Lọc ra những đơn hàng có áp dụng mã khuyến mãi

==> Tính số lần giao dịch, tổng tiền hóa đơn trong một khoảng thời gian nhất định (1 hoặc 4 ngày) giữa (người bán, người mua)

==> Lọc ra những cặp giao dịch có số lần giao dịch lớn hơn hoặc bằng 3 giao dịch (>=3 giao dịch) gán vào (bảng df_find_scammers)

==> Tính số lần xuất hiện của những chủ shop và những khách hàng trong bảng df_find_scammers.

==> Những ai có số lần xuất hiện cao nhất và (gmv/hóa đơn) xoay quanh mức giá 67k thì sẽ có khả năng gian lận cao nhất.

Tìm đối tượng có nguy cơ gian lận trong trường hợp xét theo ngày

Xem những cặp chủ-khách nào đang giao dịch quá 3 lần trên ngày (không kể là áp dụng mã khuyến mãi hay không) ?

Thống kê những cặp chủ-khách giao dịch quá 3 lần trong ngày (kể cả không áp mã)

Lấy 1 ví dụ điển hình về cặp chủ-khách (100262106-103312950) có 3 giao dịch vào ngày 2019-11-02 và gmv trung bình trên mỗi orders là 66333.33 >> Nguy cơ rất cao là gian lận

Kiểm tra

Kiểm tra giao dịch của cặp chủ-khách (100262106-103312950)

Đúng là vào ngày hôm đó đã diễn ra 3 giao dịch nhưng có 2 giao dịch trong số đó không áp dụng mã khuyến mãi. Vì thế, không thể xem là gian lận >> Vì vậy, chúng ta buộc phải lọc những đơn chỉ áp dụng mã khuyến mãi để tiếp tục phân tích.

Xem những cặp chủ-khách nào đang giao dịch quá 3 lần trên ngày (có áp dụng mã khuyến mãi)

Thống kê những giao dịch có áp dụng mã của các cặp chủ-khách

Khi lọc những giao dịch áp dụng mã khuyến mãi thì tất cả chỉ giao dịch đúng 1 giao dịch có áp dụng mã trên các ngày

>> Vì vậy, nếu xét theo góc độ trên từng ngày thì không ai là có hành vi đáng nghi ngờ

>> Chúng ta phải chọn xét trên toàn bộ thời gian khuyến mãi (4 ngày)

Tìm đối tượng có nguy cơ gian lận trong trường hợp xét theo 4 ngày

Xem những cặp chủ-khách nào đang giao dịch quá 3 lần trên ngày

Thống kê những cặp chủ-khách giao dịch quá 3 lần trong thời gian khuyến mãi

Đã có xuất hiện những cặp giao dịch quá 3 giao dịch có áp mã khuyến mãi trong 4 ngày vừa qua.

Những chủ shop có nguy cơ gian lận cao nhất

Thống kê những giao dịch bất thường của các chủ shop

Qua thống kê ta thấy 3 chủ shop này có rất nhiều lần giao dịch quá 3 giao dịch cùng với một người trong suốt chương trình khuyến mãi và gmv trung bình cũng dao động trong khoảng 67k

>> Đây là 3 chủ shop có khả năng lạm dụng chương trình khuyến mãi cao nhất

3 chủ shop đó là :

  • 102817559 với 16 lần giao dịch bất thường

  • 101476221 với 3 lần giao dịch bất thường

  • 1924682 với 3 lần giao dịch bất thường

Những khách hàng có nguy cơ gian lận cao nhất

Thống kê những giao dịch bất thường của các khách hàng

Có 2 khách hàng là có 2 lần giao dịch bất thường còn lại thì có 1 lần

>> Đây là 2 khách có khả năng lạm dụng chương trình khuyến mãi cao nhất

2 khách đó là :

  • 102469889 với 2 lần giao dịch bất thường

  • 101166204 với 2 lần giao dịch bất thường

Nếu phải tìm ra một khách lạm dụng chương trình khuyến mãi nữa thì chúng ta nên xem xét những ai có gmv trung bình trên mỗi orders tiệm cận với 67k nhất. Ở đây ta có khách 100945344 là tiệm cận với 67k nhất (66666.67k).

Kiểm tra

Kiểm tra giao dịch của khách 100945344

Rõ ràng khách 100945344 đã sử dụng gần như là tối đa mức khuyến mãi. Nhưng điều này cũng không có ý nghĩa lắm vì những user khác cũng có gmv trung bình nằm trong khoảng 67k. Vì vậy với việc tìm ra 3 khách có khả năng lạm dụng cao nhất ta chỉ tìm ra 2 người là 102469889 101166204 ra những user có 1 giao dịch bất thường đều có khả năng gian lận là như nhau.

Tiểu luận

Qua bài báo cáo phân tích trên ta có thể tóm gọn lại những điều rút ra như sau :

  • Các đơn hàng đang phân bổ trong khoảng giá trị nhỏ. Có đến 75% đơn hàng có giá trị từ (0đ-140.000đ). Điều này là một điều bất lợi khi những users sẽ tận dụng tối đa đợt khuyến mãi.

  • Xét theo góc độ từng ngày thì không thấy quá nhiều những giao dịch mang tính bất thường (có quá 3 giao dịch giữa chủ shop với cùng 1 người khách).

  • Xét theo khoảng thời gian toàn giao dịch, chủ shop có khả năng gian lận cao nhất là 102817559 với 16 lần giao dịch bất thường. Còn lại là 101476221 1924682 với mỗi người 3 lần giao dịch bất thường.

  • Khách có nguy cơ gian lận cao nhất là 102469889 101166204 với mỗi người có 2 lần giao dịch bất thường còn những khách có 1 lần giao dịch bất thường đều trong tình trạng nguy vấn.

Trường hợp 2: Shop tạo các đơn hàng ảo nhằm tăng tương tác.

Những đơn hàng ảo là những đơn hàng có giá trị thấp nhưng được shop/chủ shop tạo ra nhiều lần và xuất hiện vài khách hàng có nhiều giao dịch nghi vấn như thế. Trong trường hợp này ta xét những đơn hàng có gmv dưới 2.000đ là những đơn hàng ảo và ta sẽ xem xét ai là người thực hiện những giao dịch này nhiều nhất.

Thống kê số lượng đơn hàng có gmv dưới 2.000đ theo từng khách hàng

Tiếp theo, kiếm tra thử chủ shop có id=1006513

Ta thấy chủ shop này hành vi đang giao dịch chung với một khách hàng với gmv chỉ 1đ. Điều này chứng tỏ những đơn này là đơn hàng tự tạo để tạo impression.

Những chủ shop nằm trong TOP những người có hành vi lạm dụng nhất là {1006513, 1011881, 1007436, 104080159}

Tương tự, thống kê những khách hàng giao dịch nhiều đơn nghi vấn.

Top 10 khách hàng có nhiều giao dịch nghi vấn nhất

Ta có thể thấy 3 user có id {100205391, 100605978, 1026737} là có nguy cơ cao nhất đang có hành vi gian lận.

Như vậy, nếu phân tích theo một góc nhìn khác ta có thể tìm thêm được nhiều thông tin mang lại ý nghĩa. Điều đó hỗ trợ tối đa cho việc ra quyết định cho các nhà lãnh đạo.

Comments


JOIN MY MAILING LIST

Thanks for submitting!

© 2035 by Lovely Little Things. Powered and secured by Wix

  • Instagram
  • YouTube
  • Facebook
  • Pinterest
bottom of page