Luận văn Cải tiến Clustalw cho bài toán sắp hàng đa trình tự

  • Người chia sẻ :
  • Số trang : 14 trang
  • Lượt xem : 8
  • Lượt tải : 500

Các file đính kèm theo tài liệu này

  • 8.PDF
  • 1.PDF
  • 2.PDF
  • 3.PDF
  • 4.PDF
  • 5.PDF
  • 6.PDF
  • 7.PDF
  • 9.PDF
  • 10.PDF
  • 11.PDF
  • 12.PDF
  • 13.PDF
  • Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại

NHẬP MÃ XÁC NHẬN ĐỂ TẢI LUẬN VĂN NÀY

Nếu bạn thấy thông báo hết nhiệm vụ vui lòng tải lại trang

Bạn đang xem trước 20 trang tài liệu Luận văn Cải tiến Clustalw cho bài toán sắp hàng đa trình tự, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên

Sinh tin học đang có những bước phát triển đột phá và từng bước trởthành một ngành khoa học có vai trò vô cùng quan trọng trong sựphát triển của nhân loại. Được đánh giá là một trong 10 bài toán lớn của sinh tin học, từkhi được đặt ra cho đến nay, bài toán sắp hàng đa trình tựvẫn đang được nghiên cứu. Nhiều giải pháp được đưa ra đểgiái quyết bài toán này, tuy nhiên cho đến hiện nay, MSA vẫn là một bài mở, chưa có một lời giải nào có thểgiải quyết trọn vẹn. Đứng trên góc độcủa một công trình nghiên cứu, đềtài cốgắng đưa ra một giải pháp nhằm cung cấp thêm cách thức giải quyết bài toán này. Tiếp cận theo hướng kết hợp phương pháp lũy tiến toàn cục và một sốkỹthuật heuristic, kỹthuật gom nhóm, đềtài đã cải tiến phần mềm ClustalW – một phần mềm mã nguồn mở. Từnhận xét rằng phần mềm ClustalW sẽsinh ra cây hướng dẫn không hợp lý khi trong dữliệu đầu vào có những trình tựcó độkhác biệt lớn, đềtài đã thay đổi quá trình sinh ra cây hướng dẫn bằng cách chọn lựa xửlý riêng những trình tựnày trước, điều chỉnh lại vịtrí của các trình tựnày để đảm bảo chúng sẽ được đặt vào các vịtrí gần gốc của cây hướng dẫn, cũng có nghĩa là đảm bảo chúng sẽ được sắp xếp sau cùng. Phần cải tiến này chỉthấy được tác dụng khi tập dữliệu đầu vào có những trình tự có độkhác biệt cao. Kết quả được kiểm chứng bằng cách so sánh cây hướng dẫn được sinh ra khi dùng phần mềm ClustalW và chương trình của đềtài. Dữliệu được dùng đểkiểm chứng là dữliệu có cây hướng dẫn đã được biết trước. Từviệc so sánh cây hướng dẫn đã được biết trước này lần lượt với cây hướng dẫn cho CMSA và ClustalW sinh ra, có thểthấy được độchính xác của CMSA so với ClustalW là khoảng 6%. Chương trình cũng được kiểm thửvới tập dữliệu của BAliBASE và cũng cho kết quảxấp xỉ6% về độchính xác so với ClustalW.