Khóa luận Sử dụng phương pháp xếp hạng trong bài toán phân cụm Tiếng Việt

Cùng với sựgia tăng nhanh chóng vềsốlượng các trang Web thì nhu cầu vềkhai phá dữliệu Web ngày càng nhận được sựquan tâm của các nhà khoa học và các nhóm nghiên cứu. Trong lĩnh vực khai phá Web thì phân cụm Web là một trong những bài toán cơbản và quan trọng. Đây cũng là thành phần chịu nhiều ảnh hưởng của các đặc trưng ngôn ngữ. Khóa luận này tập trung nghiên cứu vềbài toán phân cụm Web sửdụng phương pháp xếp hạng. Trên cơsởlý thuyết phân cụm Web và lựa chọn các đặc trưng của tiếng Việt, khóa luận đã sửdụng phương pháp xếp hạng các cụm từquan trọng vào phân cụm các tài liệu Web tiếng Việt và tiến hành thực nghiệm. Kết quảthực nghiệm đánh giá theo các đặc trưng TFDF, độdài (LEN), tương tựnội tại (ICS), entropy nội tại cụm văn bản (CE) cho thấy đặc trưng TFIDF và LEN có ảnh hưởng lớn hơn so với các đặc trưng khác.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC

HỖ TRỢ TÌM VÀ TẢI TÀI LIỆU

  • Từ ngày 01/05/2022

    Luanvan365 sẽ có thêm dịch vụ hỗ trợ các bạn tìm kiếm các tài liệu, luận văn ở nhiều website khác nhau
    Bạn có thể liên hệ với Admin để được hỗ trợ nhé
  • THÔNG TIN LIÊN HỆ


    Phone: 0909.773687 (Zalo, Text) Facebook : Facebook chat hỗ trợ

  • XEM THÊM THÔNG TIN

    Xem thêm bài viết
LIÊN HỆ NGAY

TIN KHUYẾN MÃI

  • Thư viện tài liệu Phong Phú

    Hỗ trợ download nhiều Website

  • Nạp thẻ & Download nhanh

    Hỗ trợ nạp thẻ qua Momo & Zalo Pay

  • Nhận nhiều khuyến mãi

    Khi đăng ký & nạp thẻ ngay Hôm Nay

NẠP THẺ NGAY