Tóm tắt luận án Phát hiện phụ thuộc hàm và phụ thuộc hàm suy rộng trong cơ sở dữ liệu
- Người chia sẻ : vtlong
- Số trang : 26 trang
- Lượt xem : 10
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Tóm tắt luận án Phát hiện phụ thuộc hàm và phụ thuộc hàm suy rộng trong cơ sở dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
Các phụ thuộc dữ liệu có vai trò quan trọng trong thiết kế cơ sở
dữ liệu, quản lý chất lượng dữ liệu và biểu diễn tri thức. Các phụ
thuộc trong phát hiện tri thức được trích xuất từ dữ liệu hiện có của
cơ sở dữ liệu. Quá trình trích xuất này được gọi là phát hiện phụ
thuộc.
Mục đích của việc phát hiện phụ thuộc là tìm các phụ thuộc quan
trọng đúng (thỏa mãn) trên dữ liệu của cơ sở dữ liệu. Các phụ thuộc
(được phát hiện) biểu diễn tri thức và có thể được dùng để kiểm tra
thiết kế cơ sở dữ liệu, đánh giá chất lượng dữ liệu.
Từ những năm đầu thập kỷ 80 của thế kỷ 20, bài toán phát hiện
phụ thuộc đã thu hút được đông đảo các nhà khoa học. Và cho đến
thời điểm hiện tại, vấn đề phát hiện phụ thuộc từ các tập dữ liệu lớn
(big data) càng trở nên quan trọng vì trong các tập dữ liệu lớn này
chứa rất nhiều tri thức quý giá.
Hiện nay, với sự phát triển của các thiết bị số, đặc biệt là các ứng
dụng mạng xã hội và điện thoại thông minh, lượng dữ liệu trong các
ứng dụng tăng rất nhanh làm nảy sinh vấn đề lưu trữ, quản lý, đặc
biệt là vấn đề phát hiện tri thức từ các tập dữ liệu lớn đó. Bài toán
phát hiện FD và RFD trong cơ sở dữ liệu là một trong những vấn đề
quan trọng của phát hiện tri thức. Ba loại phụ thuộc điển hình được
chú ý phát hiện là FD, AFD và CFD. AFD là sự mở rộng của FD,
tính chất “xấp xỉ” dựa trên độ thỏa hoặc độ đo lỗi; CFD là sự mở
rộng của FD, nhằm nắm bắt những yếu tố không nhất quán trong dữ
liệ