Luận văn Nghiên cứu một số phương pháp phân lớp cải tiến, ứng dụng vào hệ truy tìm văn bản

Bài toán Phân lớp văn bản (Text Categorization, Text Classification) được mô tả như sau: cho một số lớp văn bản đã được xác định trước, nhiệm vụ của phân lớp văn bản là gán các văn bản vào một (hay một số) lớp văn bản thích hợp dựa vào nội dung của văn bản. Trong những thập kỷ 80 hầu hết các cách tiếp cận (ít nhất là trong việc thiết đặt thao tác) để phân lớp văn bản tự động gồm các kỹ thuật điều khiển bằng tay bởi chuyên gia tri thức (Knowledge Engineering). Theo thời gian, cách tiếp cận để giải quyết bài toán phân lớp đã có sự thay đổi. Đầu thập kỷ 90, cách tiếp cận máy học (Machine Learning) để phân lớp văn bản được coi là nổi tiếng và trở thành thống trị, ít nhất là trong cộng đồng người nghiên cứu.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC