Chương 44 như thế nào tiến hành chủ thành phân tích dĩ hàng duy số liệu
Chủ thành phần phân tích (PCA) là một loại thường dùng không giám sát hàng duy phương pháp, thông qua đem nguyên thủy đặc thù không gian chiếu rọi đến một cái mới thấp duy không gian, khiến cho số liệu tại trong không gian mới có thể giữ lại làm hết khả năng nguyên thủy tin tức.
Phía dưới là một cái PCA giảm chiều không gian thí dụ mẫu:
Giả thiết ngươi có một cái bao hàm 1000 cái hàng mẫu, 100 cái đặc thù tập dữ liệu, dùng huấn luyện một cái máy móc học tập mô hình.
Đang tiến hành mô hình huấn luyện cùng ước định lúc, ngươi chú ý tới cao duy số liệu có thể dẫn đến tính toán chi phí tăng thêm cùng qua mô phỏng hợp vấn đề. Vì giải quyết vấn đề này, ngươi có thể sử dụng PCA Phương Pháp đem số liệu giảm chiều không gian đến 10 cái đặc thù.
PCA giảm chiều không gian trình tự như sau:
1.
Dẫn vào PCA kho: Đầu tiên, ngươi cần dẫn vào PCA kho ( Nhưkho ).
2.
Tính toán hiệp Phương Soa ma trận cùng đặc thù giá trị: Sử dụng PCA kho tính toán nguyên thủy số liệu hiệp Phương Soa ma trận cùng đặc thù giá trị. Hiệp Phương Soa ma trận phản ứng số liệu tại trên mỗi đặc thù Phương Soa cùng liên quan tính chất, đặc thù giá trị biểu thị ra nguyên thủy đặc thù tại hiệp Phương Soa ma trận bên trong tầm quan trọng.
3.
Lựa chọn chủ thành phần: Căn cứ vào đặc thù giá trị lớn nhỏ lựa chọn phía trước k cái chủ thành phần ( tại trong bản lệ, lựa chọn phía trước 10 cái chủ thành phần ). Chủ thành phần là nguyên thủy đặc thù tuyến tính chất tổ hợp, có thể trình độ lớn nhất giữ lại số liệu tin tức.
4.
Chuyển đổi số liệu: Đem nguyên thủy số liệu hình chiếu đến trên tuyển định chủ thành phần, nhận được giảm chiều không gian sau số liệu.
Tại trong cái này ví dụ, chúng ta sẽ sử dụng tuyển định 10 cái chủ thành phần tới biểu thị nguyên thủy số liệu.
Thí dụ mẫu dấu hiệukho ):
"""python
# Đọc đến tập dữ liệu
# Dự xử lý số liệu ( Tỷ như: Thiếu hụt giá trị xử lý, số liệu chuyển đổi chờ )
# Tính toán hiệp Phương Soa ma trận cùng đặc thù giá trị
# Lựa chọn chủ thành phần
# Chuyển đổi số liệu
# Đem giảm chiều không gian sau số liệu cùng nguyên thủy số liệu sát nhập
# Bảo tồn giảm chiều không gian sau tập dữ liệu
"""
Cái này thí dụ mẫu phô bày như thế nào sử dụng PCA Phương Pháp đem cao duy số liệu xuống tới 10 cái đặc thù. Tại trong ứng dụng thực tế, ngươi có thể cần căn cứ vào vấn đề cụ thể và số liệu loại hình điều chỉnh giảm chiều không gian sau đặc thù đếm.
Đang tiến hành PCA giảm chiều không gian lúc, cần thiết phải chú ý PCA Phương Pháp áp dụng tính và hạn chế tính chất, như tuyến tính chất liên quan tính chất giả thiết và số liệu đang thái phân bố giả thiết các loại.