liên kết website
Lượt truy cập
 Lượt truy cập :  13079543
  • Nhiệm vụ đang tiến hành

Phát triển các thuật toán khai thác mẫu tuần tự và luật từ cơ sở dữ liệu chuỗi

Đại học Khoa học Tự nhiên, Thành phố Hồ Chí Minh

Quốc gia

Giống như khai thác luật kết hợp, khai thác luật từ cơ sở dữ liệu chuỗi cũng được chia làm hai giai đoạn: (i) Khai thác các mẫu tuần tự hoặc mẫu tuần tự đóng; và (ii) Sinh luật từ các mẫu tuần tự (đóng) đã khai thác được ở giai đoạn (i). Các nghiên cứu trước đây tập trung chủ yếu vào việc giải quyết bài toán khai thác mẫu tuần tự / mẫu tuần tự đóng do độ phức tạp của giai đoạn (i) rất lớn. Giai đoạn (ii) cũng có một số đóng góp nhưng không đáng kể so với giai đoạn (i). Chính vì vậy, đề tài tập trung vào vấn đề giải quyết bài toán ở giai đoạn (ii) mà cụ thể là nghiên cứu các phương pháp khai thác hiệu quả luật từ chuỗi trên hai phương diện thời gian khai thác và rút gọn tập luật. Ngoài ra, bài toán khai thác mẫu tuần tự với các ràng buộc và khai thác mẫu tuần tự trên cơ sở dữ liệu chuỗi nội (inter-sequence) cũng sẽ được quan tâm nghiên cứu trong đề tài._x000d_ Đề tài tập trung nghiên cứu các điểm yếu của các phương pháp được đề nghị trước đây từ, đó đề xuất giải pháp hiệu quả hơn. Cụ thể như sau:_x000d_ 1. Đối với khai thác luật từ mẫu tuần tự, đề tài tập trung vào việc sử dụng cây tiền tố để sinh luật và khai thác luật không dư thừa._x000d_ 2. Đối với khai thác chuỗi phổ biến: Đề tài tập trung vào việc khai thác mẫu tuần tự với các ràng buộc phức tạp như kết hợp ràng buộc đơn điệu (monotonic) và ràng buộc phản đơn điệu (anti-monotonic)._x000d_ 3. Đối với khai thác chuỗi phổ biến trên CSDL chuỗi nội: Tập trung vào việc việc ứng dụng vectơ bit động trong khai thác mẫu tuần tự, mẫu tuần tự đóng.