Tóm tắt luận văn Nghiên cứu và xây dựng hệ thống hỏi đáp hướng miền ứng dụng

Tìm kiếm luôn là một trong những bài toán quan trọng trong việc lưu trữ và tổ chức dữ liệu. Các máy tìm kiếm như Google, Bing ra đời đã tạo nên cuộc cách mạng lớn trong việc tìm kiếm thông tin trên Internet. Tuy nhiên, những máy tìm kiếm này trong một số trường hợp không phù hợp với yêu cầu thực tế do kết quả trả về cho người dùng quá lớn (thường lên đến hàng triệu bản ghi). Do đó, người dùng sẽ rất khó tìm kiếm được thông tin hữu ích trong lượng thông tin đồ sộ như vậy. Thu thập, xử lý và khai thác thông tin theo một miền ứng dụng cụ thể sao cho hiệu quả đang là một vấn đề mới mẻ và thú vị trong lĩnh vực khai phá dữ liệu. Bài toán có ý nghĩa lớn đối với nhu cầu tiếp cận thông tin của con người. Trong luận văn này sẽ đề cập đến việc sử dụng các kỹ thuật trích rút thông tin (Information Extraction - IE) kết hợp với xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) để thu thập, xử lý, trích rút các thông tin từ các trang web đặt món ăn trực tuyến, từ đó xây dựng cơ sở dữ liệu lưu trữ các thông tin của nhà hàng và món ăn, cuối cùng xây dựng một hệ thống hỏi đáp tự động dựa trên cơ sở dữ liệu này.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC