Luận văn Phát hiện luật bằng cách sử dụng siêu phằng tối ưu theo hướng tiếp cận thô

Cùng với sựphát triển của Công NghệThông Tin ngày nay, khai phá tri thức trong các cơsởdưliệu lớn là một trong nhưng lĩnh vực được rất nhiều nhà nguyên cứu và ứng dụng tin học đặc biệt quan tâm. Việc nguyên cứu những phương pháp có thểtự động phát hiện những tri thức mới trong cơsởdưliệu trên máy tính đã tỏra thực sự hữu ích trong việc hỗtrợquyết định cho con người. Hiện nay, trên thếgiới có rất nhiều thuật toán khai phá tri thức bằng cách phân lớp và rời rạc dữliệu như: Sửdụng cây quyết định, phương pháp thống kê, các mạng nơron, thuật toán di truyền,.Trong một vài năm gần đây, lý thuyết tâp thô được nhiều nhóm nguyên cứu hoạt động trong lĩnh vực tin học nói chung và khai phá tri thức nói riêng nguyên cứu và áp dụng trong thực tế. Lý thuyết tập thô được xây dựng trên nền tảng toán học vững chắc giúp cung cấp những công cụhữu ích đểgiải quyết những bài toán phân lớp dữliệu và khai phá luật,.Với đặc tính có thểxửlý được những dữliệu mơhồ, không chắc chắn tập thô tỏra rất hữu ích trong việc giải quyết những bài toán thực tế. Từnhững bảng dữliệu lớn với dữliệu dưthừa, không hoàn hảo, dữliệu liên tục, hay dữliệu dưới dạng ký hiệu lý thuyết tập thô cho phép khai phá tri thức từ những khối dữliệu này nhằm phát hiện những luật tiềm ẩn từkhối dữliệu này. Trong khoá luân tốt nghiệp chúng tôi đã trình bày một sốphương pháp rời rạc hoá dữliệu theo hướng tiếp cận tập thô. Và xây dựng chương trình thửnghiệm: phát hiện luật bằng cách sửdụng siêu phẳng tối ưu theo hướng tiếp cân tập thô. Chương trình được xây dựng đểthửnghiệm trên bộdữliệu chứa thông tin về768 bệnh nhân bị bệnh tiểu đường cung cấp bởi tổchức “National Institute of Diabetes and Digestive and Kidney Diseases”. Từ đó xây dựng hệthống các luật dựa trên cây quyết định dùng đểhỗtrợviệc khám bệnh của các bác sĩ.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC