PHÂN CỤM DỮ LIỆU DỰA TRÊN MẠNG NƠ RON HỌC SÂU
Nội dung chính của bài viết
Tóm tắt
Phân cụm dữ liệu (clustering) là bài toán cơ bản của lĩnh vực khoa học máy tính và có nhiều ứng dụng trong thực tiễn, đặc biệt là phân tích dữ liệu lớn và khai phá dữ liệu.
Các thuật toán phân cụm truyền thống như K-means, MeanShift đã được ứng dụng trong nhiều năm qua nhưng vẫn tồn tại nhiều hạn chế liên quan đến độ chính xác phân cụm. Bài báo này nghiên cứu các mô hình mạng nơ ron học sâu, cụ thể là mạng AutoEncoder để giải quyết bài toán phân cụm. Kết quả thực nghiệm trên cơ sở dữ liệu chuẩn cho hệ thống có độ chính xác phân cụm cao vượt trội so với các phương pháp truyền thống.
Từ khoá: Mạng AutoEncoder, phân cụm dữ liệu, mạng nơ ron học sâu.