Luận án Nghiên cứu phát triển phương pháp phân cụm bán giám sát mờ an toàn ứng dụng cho bài toán quản lý cảng biển

  • Người chia sẻ :
  • Số trang : 147 trang
  • Lượt xem : 8
  • Lượt tải : 500

Các file đính kèm theo tài liệu này

  • luan_an_nghien_cuu_phat_trien_phuong_phap_phan_cum_ban_giam.pdf
  • CV gửi Cục CNTT.pdf
  • QĐ BV Cấp Trường.pdf
  • Tom_tat_LA_PTHuan (3).pdf
  • TrichYeu LATS.docx
  • Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại

NHẬP MÃ XÁC NHẬN ĐỂ TẢI LUẬN VĂN NÀY

Nếu bạn thấy thông báo hết nhiệm vụ vui lòng tải lại trang

Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu phát triển phương pháp phân cụm bán giám sát mờ an toàn ứng dụng cho bài toán quản lý cảng biển, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên

Tính cấp thiết của luận án Phân cụm dữ liệu là quá trình phân chia các điểm dữ liệu thành các cụm khác nhau, đảm bảo rằng các phần tử trong một cụm có nhiều điểm tương đồng hơn các phần tử trong các cụm khác [105]. Phân cụm dữ liệu được phân thành hai nhóm: phân cụm rõ và phân cụm mờ. Trong phân cụm rõ, một điểm dữ liệu thuộc về duy nhất một cụm. Trong phân cụm mờ, một điểm dữ liệu có thể thuộc nhiều hơn một cụm kèm theo thông tin về độ thuộc của điểm dữ liệu vào các cụm. Khi phân cụm mờ sử dụng một số thông tin bổ trợ thì được gọi là phân cụm bán giám sát mờ [13]. Một trong những hướng nghiên cứu về phân cụm bán giám sát đang được quan tâm hiện nay đó là phân cụm bán giám sát mờ an toàn (hay còn gọi là phân cụm dữ liệu với độ tin cậy). Vấn đề phân cụm dữ liệu với độ tin cậy được minh họa như trong Hình 1, giả sử bộ dữ liệu bao gồm 2 cụm và có một số dữ liệu đã được gán nhãn (hình vuông thể hiện dữ liệu đã được gán nhãn thuộc Cụm 1 và hình tam giác thể hiện dữ liệu đã được gán nhãn thuộc Cụm 2), hình tròn thể hiện các điểm dữ liệu chưa được gán nhãn. Đường nét đứt ngầm hiển thị ranh giới giữa hai cụm. Một số dữ liệu được gán nhãn không chính xác được biểu diễn bằng dấu thập phía trên các ký hiệu của dữ liệu được gán nhãn. Mục tiêu của bài toán này là tìm ra đường ranh giới “tốt nhất” giữa hai cụm với các dữ liệu được gán nhãn chính xác và không chính xác. Vấn đề phân cụm dữ liệu với độ tin cậy đã được nhận được sự quan tâm từ nhiều nhà nghiên cứu nghiên cứu, điển hình từ Gan và cộng sự [36, 37, 38]. Ý tưởng chính của cách tiếp cận này gồm hai bước: i) Tính toán trọng số tin cậy của dữ liệu được gán nhãn bằng một đồ thị cục bộ; ii) Xây dựng, xác định các tâm cụm và các giá trị phần tử mờ theo dữ liệu được gán nhãn có trọng số tin cậy cao.