Phương pháp phân cụm dữ liệu web và xây dựng ứng dụng trong máy tìm kiếm

1. Tính cấp thiết của đề tài - Sự phát triển nhanh chong cua cac ưng dụng công nghệ thông tin và Internet và ở nhiều lĩ nh vự c đờ i số ng xã hộ i , quản ly kinh tế , khoa họ c kỹ thuậ t đã tạ o ra nhiề u cơ sở dữ liệ u khổ ng lồ . Cac cơ sở dữ liệ u nà y không phả i khi nao cung bất biên theo thơi gian ma cung vơi sư phat triên trên , cac cơ sơ dư liệu cung không ngưng thay đổ i để đá p ứ ng nhu cầ u sử dụ ng củ a con ngườ i . Qua trình tiên hoa cua lĩnh vưc cơ sơ dư liệu (CSDL) tạo nên việc khai pha dư liệu (Data Mining) được coi la giai đoạn tiên hoa mơi cua công nghệ CSDL, việc thu thập va lưu trư cac kho chưa dư liệu khổng lồ được liệt kê ơ ngoai mục đích khai pha dư liệu, nhằm phat hiện cac tri thưc mơi giúp ích cho hoạt động cua con ngươi trong tập hợp dư liệu. Chẳng hạn, tư một giải phap phân cụm trong khai pha dư liệu Web (Web Mining), co thê phat triên thanh một thanh phần cua may tìm kiêm (Search Engine) đê khi một trang Web mơi được tải về, may tìm kiêm sẽ tư động no vao một cụm trang Web đã được xac định; việc phân cụm sẽ tạo ra thuận lợi cho việc tìm kiêm về sau cho ngươi dung. Chính vì ly do nay ma tôi nghiên cưu va chọn đề tai: “Phương pháp phân cụm dữ liệu Web và xây dựng ứng dụng trong máy tìm kiếm” la điều cấp thiêt hiện nay, dươi sư hương dẫn cua thầy PGS TS. Lê Văn Sơn.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC