Trong những năm gần đây, trong lĩnh vực xử lý ngôn ngữ tự nhiên thì xử lý ngữ nghĩa chiếm vai trò quyết định tính chính xác của các mô hình xử lý ngôn ngữ tự nhiên. Để xử lý ngữ nghĩa chúng ta phải có cơ sở tri thức ngữ nghĩa từ vựng của ngôn ngữ cần xử lý, hiện nay tiếng Anh đã có cơ sở tri thức ngữ nghĩa hoàn chỉnh. Trong đó hệ thống cơ sở tri thức ngữ nghĩa từ vựng WordNet là phổ biến nhất hiện nay. Đây là mạng ngữ nghĩa đồ sộ hơn 110.000 synset tiếng Anh. Các nhà ngôn ngữ học, tâm lý học và tin học đã bỏ ra gần 20 năm để xây dựng hệ thống này và ngày nay chúng vẫn còn được nâng cấp về số lượng và chất lượng. Tuy nhiên với các ngôn ngữ khác, hệ thống như vậy vẫn chưa có nhiều. Điển hình là tiếng Việt, hiện nay chúng ta vẫn chưa có hệ thống cơ sở tri thức ngữ nghĩa từ vựng như vậy. Do đó vấn đề cấp bách hiện nay là phải xây dựng một hệ thống ngữ nghĩa của tiếng Việt cho máy tính nếu chúng ta muốn phát triển các ứng dụng về xử lý ngôn ngữ tự nhiên. WordNet phân biệt giữa danh từ, động từ, tính từ và trạng từ, vì họ làm theo quy tắc ngữ pháp khác nhau. Danh từ là một loại từ phổ biến và phổ dụng trong mọi ngôn ngữ. Ðến nay, đã có nhiều cách phân lớp danh từ tiếng Việt theo các tiêu chí khác nhau, nhưng ít nhiều các cách này đều mang tính chủ quan và chỉ được thực hiện trên một số ít các ví dụ cụ thể. Tuy nhiên, trong thực tế, khi phân giải ngữ nghĩa của một danh từ tiếng Việt trong một ngữ cảnh bất kì, chúng ta lại cần đến một hệ thống phân lớp hoàn chỉnh cho tất cả các danh từ tiếng Việt theo những ý niệm chung nhất trong tư duy của con người. Việc xây dựng một hệ thống phân lớp như thế đã được thực hiện thành công lần đầu tiên đối với ti ếng Anh qua mạng WordNet, và cũng chính từ đây, các mạng tương tự cho tiếng Pháp, Tây Ban Nha, Ðức, Hoa, Nhật, . đã được hình thành trên cơ sở mạng này. Việc xây dựng một mạng từ vựng tương tự WordNet có nhiều ý nghĩa. Nó cho việc phát triển các ứng dụng xử lý ngôn ngữ tiếng Việt, cho các nghiên cứu về ngôn ngữ học tiếng Việt. Do vậy, trong bài báo cáo này, em trình bày về phương pháp xây dựng từ điển danh từ Tiếng Việt dựa theo từ điển WordNet. Đồ án được chia thành các phần như sau: Chương 1: Tìm hiểu đề tài và phương pháp tiếp cận. Chương 2: Tìm hiểu về tiếng Việt và WordNet áp dụng trong việc xây dựng từ điển danh từ tiếng Việt Chương 3: Xây dựng mô hình tổ chức dữ liệu cho WordNet tiếng Việt và thực nghiệm.
Công ty Điện lực Thành phố Hồ Chí Minh, là một công ty lớn trực thuộc Tổng Công ty Điện lực Việt Nam hiện có khoảng ...
Internet bắt đầu xuất hiện từ những năm thập niên 60. Tuy nhiên tại thời điểm đó nó chỉ đƣợc sử dụng nội bộ và phục ...
Trong môi trường hiện nay, một doanh nghiệp muốn hoạt động tốt đều cần phải có một qui trình các luồng xử lý công vi ...
1. Tính cấp thiết của đề tài - Sự phát triển nhanh chong cua cac ưng dụng công nghệ thông tin và Internet và ở n ...
Trong những năm gần đây, người ta chứng kiến những bước thay đổi mạnh mẽ chưa từng thấy của các phương tiện thông tin ...
Hỗ trợ download nhiều Website
Hỗ trợ nạp thẻ qua Momo & Zalo Pay
Khi đăng ký & nạp thẻ ngay Hôm Nay