Luận văn Tóm tắt Nghiên cứu quy trình ETL trong kho dữ liệu ứng dụng vào hệ thống dữ liệu kinh doanh trong doanh nghiệp viễn thông

Ngành công nghiệp viễn thông sau những năm phát triển đang lưu trữ một khối lượng dữ liệu khổng lồ, bao gồm các dữ liệu như thông tin về khách hàng, chi tiết cuộc gọi, các dịch vụ thuê bao, thông tin cảnh bảo tình trạng hệ thống mạng viễn thông, dữ liệu về hệ thống cáp viễn thông v.v. Lượng dữ liệu khổng lồ này nếu được khai thác đúng cách sẽ là một lợi thế cho các doanh nghiệp viễn thông trong việc tung ra các dịch vụ chăm sóc khách hàng hay các ứng dụng mang tính thực tiễn cao, đồng nghĩa với việc tăng cơ hội cạnh tranh đối với các doanh nghiệp khác. Từ đó yêu cầu đặt ra việc xây dựng kho dữ liệu từ những nguồn dữ liệu trên phục vụ cho việc phân tích kinh doanh tại các đơn vị viễn thông. Tuy nhiên việc xây dựng một hệ thống như thế vấp phải một số hạn chế về mặt kỹ thuật, đặc biệt là khi kích thước cũng như độ phức tạp của môi trường thông tin tăng lên. Lưu trữ phân tán ở nhiều dạng không tương thích với nhau, thậm chí còn ở những dạng phi cấu trúc. Nhiều hệ CSDL đã được xây dựng không tương thích với nhau và không tương thích với những hệ thông tin mới được xây dựng. Nhiều khách hàng không thoả mãn với những hệ thống thông tin hiện thời. Kho dữ liệu thường bao gồm các thành phần khác nhau, mỗi thành phần có thiết kế, kĩ thuật và công cụ riêng [6]. Trong đó hệ thống ETL là một thành phần chính chịu trách nhiệm cho quá trình ETL ( Extract, Transform, Load) trong kho kho dữ liệu; cho phép trích rút các dữ liệu từ nhiều nguồn khác nhau, làm sạch, tùy chỉnh và chuyển đổi, và cuối cùng tải vào kho dữ liệu[1]. Việc xây dựng ETL chiếm đến 80% phát triển dự án và 55% thời gian của kho dữ liệu [4]. Vì vậy việc đánh giá đúng vai trò của quá trình ETL từ đó có thể thể mô hình hóa, thiết kế và tối ưu ETL trong việc xây dựng kho dữ liệu sẽ quyết định sự thành bại của kho dữ liệu [6].

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC