Luận án Nâng cao độ chính xác của tra cứu ảnh theo nội dung dựa trên tiếp cận học đa tạp từ thông tin phản hồi của người dùng

  • Người chia sẻ : vtlong
  • Số trang : 113 trang
  • Lượt xem : 10
  • Lượt tải : 500

Các file đính kèm theo tài liệu này

  • luan_an_nang_cao_do_chinh_xac_cua_tra_cuu_anh_theo_noi_dung.pdf
  • Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại

NHẬP MÃ XÁC NHẬN ĐỂ TẢI LUẬN VĂN NÀY

Nếu bạn thấy thông báo hết nhiệm vụ vui lòng tải lại trang

Bạn đang xem trước 20 trang tài liệu Luận án Nâng cao độ chính xác của tra cứu ảnh theo nội dung dựa trên tiếp cận học đa tạp từ thông tin phản hồi của người dùng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên

Với sự phát triển mạnh mẽ của khoa học công nghệ, thiết bị thu nhận hình ảnh
cùng mạng xã hội như facebook, twitter, instagram làm cho số lượng ảnh được lưu
trữ trong các cơ sở dữ liệu và trên Internet ngày càng tăng lên. Chính vì thế, để tìm
một tập ảnh phù hợp với nhu cầu của con người trong tập dữ liệu khổng lồ đó, chúng
ta cần những phương pháp tra cứu ảnh hiệu quả [1]. Có hai cách tiếp cận trong bài
toán tra cứu ảnh gồm tra cứu ảnh dựa vào văn bản (TBIR- Text based image retrieval)
và tra cứu ảnh dựa vào nội dung (CBIR – Content based image retrieval). Trong TBIR,
siêu dữ liệu (metadata) chẳng hạn như từ khóa, chú thích được sử dụng để mô tả ảnh.
Mặc dù, cách tiếp cận dựa trên văn bản có thể mang lại sự linh hoạt trong việc tạo ra
các truy vấn, nhưng việc tra cứu ảnh chỉ dựa trên văn bản là không hiệu quả vì các lý
do sau: (1) khó tạo ra các mô tả thủ công cho một tập ảnh lớn và gia tăng từng giây,
(2) sự không nhất quán giữa các mô tả của người dùng khác nhau, và (3) khó chuyển
đổi từ hệ thống này sang hệ thống khác. Do đó, tra cứu ảnh dựa vào nội dung được
đề xuất để khắc phục những hạn chế kể trên của cách tiếp cận tra cứu ảnh dựa vào
văn bản.
Tra cứu ảnh dựa vào nội dung đã thu hút sự quan tâm của cộng đồng nghiên
cứu và phát triển ứng dụng trong những thập kỷ qua. Thuật ngữ “nội dung” gắn với
thị giác trực quan của con người như màu sắc, hình dạng, kết cấu hoặc các thông tin
khác được lấy từ chính bức ảnh đó, không phải siêu dữ liệu như từ khóa, chú thích
hay mô tả được liên kết với ảnh. Nội dung của các ảnh trong tập dữ liệu ảnh lớn sẽ
được trích rút một cách tự động từ chính những ảnh đó và được lưu trữ trong cơ sở
dữ liệu đặc trưng. Trong tra cứu ảnh dựa vào nội dung, một hoặc nhiều ảnh mẫu hoặc
ảnh phác thảo được cung cấp làm truy vấn, trong khi đó truy vấn TBIR trực tiếp sử
dụng các từ khóa, các chú thích. Khi đó đặc trưng của ảnh truy vấn sẽ được trích rút
tự động theo cùng một cách thức như với các ảnh trong cơ sở dữ liệu ảnh [2]. Đặc
trưng của ảnh truy vấn được đối sánh lần lượt với từng đặc trưng trong tập cơ sở dữ
liệu đặc trưng sử dụng một độ đo tương tự nào đó. Tập ảnh kết quả trả về và hiển thị
cho người dùng gồm các ảnh có độ tương tự cao nhất (hay có khoảng cách nhỏ nhất)
so với ảnh truy vấn.