Luận văn Phát hiện quan hệ ngữ nghĩa nguyên nhân-Kết quả từ các văn bản
- Người chia sẻ :
- Số trang : 69 trang
- Lượt xem : 8
- Lượt tải : 500
- Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại
Bạn đang xem trước 20 trang tài liệu Luận văn Phát hiện quan hệ ngữ nghĩa nguyên nhân-Kết quả từ các văn bản, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên
World Wide Web là một kho thông tin khổng lồvới những tiềm năng không giới hạn. Có rất nhiều tiềm năng của World Wide Web mà cho đến nay vẫn chưa được khai thác một cách hiệu quả. Các văn bản Web được làm ra với mục đích ban đầu là dành cho con người đọc. Nhưng với sốlượng khổng lồ của các trang Web trên Internet, một người có dành cả đời mình cũng sẽ không bao giờ đọc hết tất cảnhững trang Web này đểthu được đầy đủcác tri thức cần thiết. Nhận thức được vấn đềnày, có rất nhiều hướng nghiên cứu đã hình thành, thu hút nhiều nhóm nhà khoa học trên thếgiới, nhằm mục đích sử dụng máy tính đểhỗtrợcon người trong việc thu thập thông tin và tổng hợp tri thức từcác trang Web trên Internet. Ví dụnhưviệc áp dụng các kỹthuật Data Mining đểkhai thác thông tin từcác văn bản Web, công nghệAgent trong kinh doanh trực tuyến Tuy nhiên trong thời gian vừa qua, những hướng nghiên cứu này chủyếu mới chỉtập trung vào việc khai thác thông tin dựa trên các từvựng đơn lẻhoặc dựa trên một sốcấu trúc cố định của trang Web. Thật là khó khăn đểmáy tính có thểtruy cập và tổng hợp các thông tin trong các văn bản vềphương diện ngữnghĩa. Gần đây, một sốhướng nghiên cứu mới đã được mởra nhằm mục đích khai thác khảnăng kết hợp nội dung trang Web với các thông tin ngữnghĩa, đểtạo ra Semantic Web. Semantic Web không phải là một loại Web mới tách biệt mà là sựnâng cấp của Web hiện tại (thếhệWeb thứba), ở đó các thông tin ngữnghĩa được xác định tốt hơn và được kết hợp vào cùng với trang Web. Nhưvậy, việc đọc và hiểu các trang Web không chỉthi hành được bởi con người mà còn có thể được thi hành bởi máy tính. Phát hiện quan hệngữnghĩa Nguyên nhân-Kết quảtừcác văn bản. VũBội Hằng-Luận văn cao học-Trường Đại học Công nghệ-2005 Semantic Web ra đời đòi hỏi một loạt các công nghệkèm theo nó. Một trong sốnhững công nghệquan trọng nhất đối với Semantic Web là Ontology. Thành phần cơbản của Ontology là một tập hợp các đối tượng (hay còn gọi là các khái niệm) với các thuộc tính của các đối tượng và tập hợp các mối quan hệgiữa các đối tượng đó. Việc xây dựng Ontology trong một miền ứng dụng là quá trình tổng hợp tri thức trong miền ứng dụng đó. Công việc này đòi hỏi những người xây dựng ontology phải có những hiểu biết và tri thức nhất định đểtìm ra đầy đủ đối tượng, thuộc tính và quan hệ. Xuất phát từnhu cầu nghiên cứu các phương pháp hỗtrợtrong việc xây dựng các Ontology cho Semantic Web, luận văn trình bày một phương pháp phát hiện mối quan hệngữnghĩa nguyên nhân-kết quảdựa trên ý tưởng nghiên cứu của bài toán Semantic Role (CoNLL Share Task 2004 [31]) và thuật toán khai phá quan hệnguyên nhân-kết quảmà Corina Roxana Girju đã tiến hành (Luận án Tiến sỹ2002 [11]). Kết quảtìm được của thuật toán chính là những thông tin cần thiết hỗtrợtrong việc phát hiện các đối tượng mới và mối quan hệvềmặt ngữnghĩa nguyên nhân-kết quảcủa các đối tượng này trong quá trình xây dựng Ontology. Ngoài phần giới thiệu, kết luận và các phụlục. Luận văn được chia thành 3 chương chính: Chương 1 – Tổng quan vềSemantic Web. Giới thiệu một cách tổng quan những nhu cầu dẫn đến sựra đời của thếhệWeb thứba (Semantic Web). Những khái niệm cơbản và những công nghệthiết yếu đểphát triển Semantic Web cũng được trình bày trong chương này. Phát hiện quan hệngữnghĩa Nguyên nhân-Kết quảtừcác văn bản. VũBội Hằng-Luận văn cao học-Trường Đại học Công nghệ-2005 Chương 2 – Quan hệnguyên nhân-kết quảvà thuật toán phát hiện quan hệnguyên nhân-kết quả.Chương này đi sâu vào phân tích cấu trúc quan hệngữnghĩa nguyên nhân-kết quảtrong ngôn ngữcủa con người và cấu trúc thểhiện của nó trong văn bản. Thông qua đó luận văn trình bày một thuật toán nhằm phát hiện quan hệnguyên nhân-kết quảtừtập các văn bản dựa vào tần suất xuất hiện của các cặp danh từtrong những câu chứa động từchỉ nguyên nhân. Chương 3 – Kết quảcài đặt thửnghiệm thuật toán.Chương này trình bày các kết quảthực nghiệm vềthuật toán phát hiện quan hệnguyên nhân – kết từcác văn bản. Chương trình cài đặt thửnghiệm cho thuật toán được viết trên ngôn ngữJava. Thông qua các nhận xét vềgiá trịcác độ đo đánh giá, kết quảthực hiện chương trình là khảquan. Phần Kết luận trình bày tổng hợp các kết quảthực hiện luận văn và phương hướng nghiên cứu tiếp theo vềcác nội dung của luận văn. Mặc dù đã có một môi trường làm việc tương đối đầy đủvà thuận tiện, nhưng luận văn chắc hẳn sẽkhông tránh khỏi có nhiều sai sót. Rất mong được sự đóng góp ý kiến, nhận xét đểtôi có thểhoàn thiện được kết quảlàm việc của mình.
