SpStinet - vwpChiTiet

 

Thuật toán khai thác tập thường xuyên hiệu quả dựa trên kỹ thuật phân lớp dữ liệu

Đề tài do tác giả Nguyễn Hữu Trọng (khoa Công nghệ Thông tin – trường Đại học Nha Trang) thực hiện với mục đích đề xuất một thuật toán mới để tìm tập thường xuyên dựa vào kỹ thuật phân lớp dữ liệu có tốc độ xử lý nhanh hơn các thuật toán đã được công bố. Trong khai thác dữ liệu việc tìm các luật kết hợp có ý nghĩa quyết định.

Đề tài được tiến hành theo 2 bước. Thứ nhất, tìm các tất cả các tập S0 cho trước. Thứ hai, dựa vào các tập thường xuyên, tìm các luật kết hợp.
Tác giả đã đề xuất phương án giải bài toán bằng cách phân hoạch dữ liệu thành n lớp, mỗi lớp được lưu trữ độc lập thành một file trên bộ nhớ ngoài và đề xuất thuật toán SPP_Mining để khai thác các tập thường xuyên với ngưỡng S0 tùy ý và được xử lý song song n trên máy.
Kết quả cho thấy, với việc dùng các thuật toán trên đã thể hiện rõ ưu điểm như: thuật toán chỉ có 2 lần duyệt qua cơ sở dữ liệu; giảm thiểu thời gian khai thác dữ liệu; không phụ thuộc vào độ lớn của bộ nhớ trong; giảm khối lượng tính toán lớn; dễ dàng cài đặt chương trình song song; tốc độ xử lý nhanh, hiệu quả. Tuy nhiên, thuật toán SPP chỉ xử lý trên dữ liệu xác định, chưa xử lý dữ liệu tăng trưởng.

BH (Theo Tạp chí Tin học & Điều khiển học, số 3/07)

 

Các tin khác:

  • 10 mẫu tin
  • 50 mẫu tin
  • 100 mẫu tin
  • Tất cả