Chương 46 k-means tụ loại phép tính
K-means tụ loại là một loại không giám sát phương pháp học tập, dùng đem tập dữ liệu chia làm K cái đám.
Nó giả thiết số liệu bên trong tồn tại K cái đám, mỗi cái đám bên trong số liệu điểm Tương Tự Độ tương đối cao, khác biệt đám ở giữa số liệu điểm Tương Tự Độ khá thấp.K-means tụ loại mục tiêu là thu nhỏ lại mỗi cái đám bên trong số liệu điểm cùng trọng tâm mét vuông sai sót chi cùng.
Phía dưới là K-means tụ loại chủ yếu trình tự:
1.
Sơ thủy hóa trọng tâm: Từ trong tập dữ liệu ngẫu nhiên lựa chọn K số lượng cứ điểm xem như ban đầu trọng tâm.
2.
Phân phối số liệu điểm: Đem mỗi cái số liệu điểm phân phối cho khoảng cách hắn gần nhất trọng tâm đối ứng đám.
3.
Đổi mới trọng tâm: Một lần nữa tính toán mỗi cái đám trọng tâm.
Trọng tâm phương pháp tính toán vì mỗi cái đám bên trong tất cả số liệu điểm giá trị bình quân.
4.
Thay đổi ưu hóa: Lặp lại trình tự 2 cùng trình tự 3, thẳng đến trọng tâm không xảy ra nữa rõ rệt biến hóa hoặc đạt đến lớn nhất thay đổi số lần.
5.
Kết quả ước định: Ước định tụ loại hiệu quả, tỷ như sử dụng hình dáng hệ sốchỉ số chờ chỉ tiêu.
K-means tụ loại ưu khuyết điểm:
Điểm tốt:
- Dễ dàng thực hiện cùng lý giải, tính toán hiệu suất tương đối cao.
- Đối với đại quy mô tập dữ liệu biểu hiện tốt hơn.
- nhưng thân súc tính mạnh, thích hợp với khác biệt lớn nhỏ tập dữ liệu.
Khuyết điểm:
- Cần dự đoán xác định đám số lượng K, lựa chọn không thể có thể dẫn đến tụ loại hiệu quả không tốt.
- Đối với ban đầu trọng tâm lựa chọn mẫn cảm, khác biệt ban đầu trọng tâm có thể dẫn đến khác biệt tụ loại kết quả.
- Đối với tiếng ồn cùng cách nhóm điểm mẫn cảm, có thể dẫn đến đám không ổn định.
- Không thích hợp tại không phải hình tròn hoặc không phải lồi hình dạng đám.
- Đối số liệu phân bố giả thiết tương đối nghiêm ngặt, yêu cầu đám bên trong số liệu điểm phân bố tương đối nhất trí.
Phía dưới là sử dụng Python cùngkho thực hiện K-means tụ loại thí dụ mẫu dấu hiệu:
"""python
# Đọc đến tập dữ liệu
# Dự xử lý số liệu ( Tỷ như: Thiếu hụt giá trị xử lý, số liệu chuyển đổi chờ )
# Sơ thủy hóa KMeans mô hình, thiết trí đám số lượng
# Mô phỏng hợp mô hình
# Tụ loại kết quả: Mỗi cái số liệu điểm sở thuộc đám nhãn hiệu
# Tụ loại trung tâm: Mỗi cái đám trọng tâm
# Đem tụ loại kết quả bảo tồn đến CSV văn kiện
"""
Cái này thí dụ mẫu phô bày như thế nào sử dụngtrong kho KMeans phương pháp tiến hành tụ loại, ngươi có thể căn cứ vào vấn đề cụ thể và số liệu loại hình điều chỉnh đám số lượng, khoảng cách độ lượng phương pháp các loại tham số. Đang tiến hành K-means tụ loại lúc, cần thiết phải chú ý phép tính áp dụng tính và hạn chế tính chất, như đối với ban đầu trọng tâm cùng tiếng ồn mẫn cảm tính chất các loại.