Đã có nhiều nghiên cứu về khai phá tập phần tử (TPT) phổ biến và khai phá TPT
lợi ích cao. Ví dụ: Trong khai phá dữ liệu giỏ hàng, các thuật toán khai phá TPT
phổ biến tìm ra các mặt hàng thường xuyên được bán, trong khi các thuật toán khai
phá TPT lợi ích cao tìm ra các mặt hàng có lợi nhuận cao hơn một giá trị ngưỡng
được đưa ra từ trước.
Tuy nhiên trong thực tế, có nhiều
TPT không phổ biến nhưng có lợi ích cao hoặc nếu người dùng quan tâm đồng thời
TPT vừa phổ biến và vừa có lợi ích cao thì các mô hình khai phá đã đề xuất chưa
đáp ứng được yêu cầu này. Hơn nữa, tất cả các kỹ thuật sử dụng để khai phá TPT
phổ biến, TPT lợi ích cao đòi hỏi người dùng phải xác định một giá trị ngưỡng,
mà đây cũng là một bước thực hiện không dễ dàng. Hơn nữa, bài toán khai
phá các TPT lợi ích cao - phổ biến từ một CSDL giao
dịch cũng gặp nhiều khó khăn:
- Khi phân loại một TPT là TPT lợi ích cao - phổ biến, phải xem xét cùng lúc
hai chiều phổ biến - lợi ích của TPT;
- Trong CSDL giao dịch tồn tại TPT phổ biến nhưng không có lợi ích cao hoặc
TPT lợi ích cao nhưng không phổ biến.
Từ những vấn đề nêu trên, tôi đã chọn đề tài: “Khai phá tập phần tử lợi
ích cao - phổ biến Skyline” làm luận văn cao học
của mình!Liên hệ qua trang: https://www.facebook.com/mis138/