Khóa luận Trích chọn thông tin y tế tiếng việt cho bài toán tìm kiếm ngữ nghĩa

Chăm sóc sức khỏe luôn là một nhu cầu thiết yếu của con người, vì thếtìm kiếm các thông tin vềlĩnh vực y tếtrên Internet luôn là một nhu cầu thiết yếu. Vấn đềnày càng cần phải được quan tâm thích đáng khi con người đang phải đối mặt với nhiều dịch bệnh truyền nhiễm, ví dụ điển hình có thểkểtới dịch bệnh cúm A H1N1 đang phát triển và có chiều hướng gia tăng trong thời gian gần đây. Cùng với sựra đời và phát triển không ngừng của các tài nguyên trực truyến, việc khai thác hiệu quảnguồn tài nguyên này để đưa tới nguồn tri thức hữu ích cho người dùng sẽ góp phần vào việc tuyên truyền và nâng cao sức khỏe cộng đồng. Sựbùng nổcác tài nguyên y tế, đặc biệt là các thông tin trực tuyến liên quan đến lĩnh vực sức khỏe; nhiều trang web vàthông tin thừa cũng nhưviệc tổchức thông tin một cách tựdo (không hoặc bán cấu trúc) làm cho người dùng khó có thểtheo dõi cũng nhưnắm bắt những thông tin cập nhật nhất. Bên cạnh đó, công nghệtìm kiếm thông tin truyền thống hoặc trảvềkết quảít do sựphong phú, phức tạp của việc diễn đạt ngôn ngữtựnhiên; hoặc quá nhiều theo nghĩa người tìm tin chỉmuốn tìm kiếm những tri thức ẩn chứkhông chỉlà các văn bản chứa từkhóa tìm kiếm. Do đó việc khai thác tối ưu nguồn tài nguyên phong phú này trởthành một đềtài quan trọng, thu hút nhiều nhà khoa học tham gia nghiên cứu trong hai thập niên gần đây, có nhiều công trình nhằm trích rút các thông tin có cấu trúc từ những tài nguyên này nhằm xây dựng các cơsởtri thức cho việc tổchức thông tin, tìm kiếm, truy vấn, quản lý và phân tích thông tin.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC