Cùng với sựgia tăng nhanh chóng vềsốlượng các trang Web thì nhu cầu vềkhai phá dữliệu Web ngày càng nhận được sựquan tâm của các nhà khoa học và các nhóm nghiên cứu. Trong lĩnh vực khai phá Web thì phân cụm Web là một trong những bài toán cơbản và quan trọng. Đây cũng là thành phần chịu nhiều ảnh hưởng của các đặc trưng ngôn ngữ. Khóa luận này tập trung nghiên cứu vềbài toán phân cụm Web sửdụng phương pháp xếp hạng. Trên cơsởlý thuyết phân cụm Web và lựa chọn các đặc trưng của tiếng Việt, khóa luận đã sửdụng phương pháp xếp hạng các cụm từquan trọng vào phân cụm các tài liệu Web tiếng Việt và tiến hành thực nghiệm. Kết quảthực nghiệm đánh giá theo các đặc trưng TFDF, độdài (LEN), tương tựnội tại (ICS), entropy nội tại cụm văn bản (CE) cho thấy đặc trưng TFIDF và LEN có ảnh hưởng lớn hơn so với các đặc trưng khác.
Công ty Điện lực Thành phố Hồ Chí Minh, là một công ty lớn trực thuộc Tổng Công ty Điện lực Việt Nam hiện có khoảng 700.000 khách hàng (điện kế) phục vụ phân p ...
Internet bắt đầu xuất hiện từ những năm thập niên 60. Tuy nhiên tại thời điểm đó nó chỉ đƣợc sử dụng nội bộ và phục vụ chủ yếu cho quân sự. Ngày 19/11/1997 là ...
Trong môi trường hiện nay, một doanh nghiệp muốn hoạt động tốt đều cần phải có một qui trình các luồng xử lý công việc rõ ràng nhằm đảm bảo được sự vận hành tố ...
1. Tính cấp thiết của đề tài - Sự phát triển nhanh chong cua cac ưng dụng công nghệ thông tin và Internet và ở nhiều lĩ nh vự c đờ i số ng xã hộ i , ...
Trong những năm gần đây, người ta chứng kiến những bước thay đổi mạnh mẽ chưa từng thấy của các phương tiện thông tin đại chúng, một trong những dịch vụ hàng đầ ...
Hỗ trợ download nhiều Website
Hỗ trợ nạp thẻ qua Momo & Zalo Pay
Khi đăng ký & nạp thẻ ngay Hôm Nay