Luận văn Tổng quan khai phá dữ liệu và ứng dụng

Khoảng hơn một thập kỷtrởlại đây, lượng thông tin được lưu trữtrên các thiết bị điện tử(đĩa cứng, CD-ROM, băng từ, .v.v.) không ngừng tăng lên. Sựtích lũy dữliệu này xảy ra với một tốc độbùng nổ. Người ta ước đoán rằng lượng thông tin trên toàn cầu tăng gấp đôi sau khoảng hai năm và theo đó sốlượng cũng nhưkích cỡ của các cơsởdữliệu (CSDL) cũng tăng lên một cách nhanh chóng. Nói một cách hình ảnh là chúng ta đang “ngập” trong dữliệu nhưng lại “đói” tri thức. Câu hỏi đặt ra là liệu chúng ta có thểkhai thác được gì từnhững “núi” dữliệu tưởng chừng như“bỏ đi” ấy không ? “Necessity is the mother of invention”- Data Mining ra đời nhưmột hướng giải quyết hữu hiệu cho câu hỏi vừa đặt ra ởtrên []. Khá nhiều định nghĩa vềData Mining và sẽ được đềcập ởphần sau, tuy nhiên có thểtạm hiểu rằng Data Mining như là một công nghệtri thứcgiúp khai thác những thông tin hữu ích từnhững kho dữliệu được tích trữtrong suốt quá trình hoạt động của một công ty, tổchức nào đó.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC