Khóa luận Kiểm lỗi chính tả Tiếng Việt

  • Người chia sẻ :
  • Số trang : 39 trang
  • Lượt xem : 12
  • Lượt tải : 500
  • Tất cả luận văn được sưu tầm từ nhiều nguồn, chúng tôi không chịu trách nhiệm bản quyền nếu bạn sử dụng vào mục đích thương mại

NHẬP MÃ XÁC NHẬN ĐỂ TẢI LUẬN VĂN NÀY

Nếu bạn thấy thông báo hết nhiệm vụ vui lòng tải lại trang

Bạn đang xem trước 20 trang tài liệu Khóa luận Kiểm lỗi chính tả Tiếng Việt, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD LUẬN VĂN ở trên

Hệ thống chữ viết iếng Việt là một hệthống chữ viết linh động, thông minh, có thể dễ dàng biểu thị tiếng nói dưới dạng chữviết chỉcần dựa trên những luật nhất định mà không đòi hỏi quá nhiều vềmặt kiến thức từvựng như nhiều ngôn ngữkhác (tiếng Anh, Pháp, Trung ).Tuy nhiên, việc giao tiếp hằng ngày chủyếu là qua tiếng nói, điều này dẫn đến việc có nhiều cách phát âm không giống nhau giữa các vùng miền khác nhau đối với cùng một từ. Việc này rất dễdẫn đến mắc lỗi sai chính tảtrong khi viết. Thêm vào đó, công nghệthông tin ngày càng phát triển, việc soạn thảo văn bản bằnghình thức viết tay dần được thay thếbằng soạn thảo văn bản qua hình thức đánh máy. Do đó, xuất hiện thêm một loại lỗi chính tảnữa là lỗi do đánh máy gây ra. Những lỗi sai này, người soạn thảo vănbản thường không hoặc khó có thểnhận ra lỗi chính tả của mình. Điều này đã dẫn nhu cầu kiểm lỗi chính tảtựđộng cho nhiều ngôn ngữtrên các hệsoạn thảo khác nhau. Có hai loại lỗi chính tảtiếng Việt là lỗi sai âm tiết và lỗi sai từvựng (âm tiết đúng).Luận văn này sửdụng thông tin ngữcảnh đểsửa loại lỗi thứhai. Thông tin ngữ cảnh được thống kê từcorpus văn bản thô dựa trên mô hình ngôn ngữn-gram. Nguồn dữliệu cho corpus được lọc tách từInternet.