Lựa chọn tính năng ngược (backward feature selection) bắt đầu với mô hình đầy đủ bao gồm tất cả các tính năng và lặp đi lặp lại loại bỏ tính năng ít quan trọng nhất dựa trên bình phương R đã điều chỉnh cho đến khi không thể cải thiện thêm.
Bây giờ, hãy xem một ví dụ trực quan về lựa chọn đặc trưng lùi (backward feature selection) với bình phương R được điều chỉnh bằng cách sử dụng tập dữ liệu trong đó chúng tôi dự đoán trọng lượng của cá dựa trên bốn đặc trưng: nhiệt độ, thức ăn, độ sạch của nước và gió.
Bước 1: Bắt đầu với tất cả các đặc trưng
Chúng ta bắt đầu với một mô hình bao gồm tất cả các đặc trưng: nhiệt độ, thức ăn, độ sạch của nước, và gió.
Bước 2: Đánh giá mô hình
Giả sử mô hình ban đầu có R bình phương hiệu chỉnh là .
Bước 3: Đánh giá việc loại bỏ từng đặc trưng
Chúng ta đánh giá R bình phương hiệu chỉnh cho mô hình với từng đặc trưng bị loại bỏ lần lượt:
Loại bỏ Nhiệt độ:
- R bình phương hiệu chỉnh
Loại bỏ Thức ăn:
- R bình phương hiệu chỉnh
Loại bỏ Độ sạch của nước:
- R bình phương hiệu chỉnh
Loại bỏ Gió:
- R bình phương hiệu chỉnh
Việc loại bỏ “Gió” dẫn đến R bình phương hiệu chỉnh cao nhất, vì vậy chúng ta loại bỏ “Gió” khỏi mô hình.
Bước 4: Loại bỏ đặc trưng ít quan trọng nhất
Bây giờ mô hình của chúng ta bao gồm các đặc trưng “Nhiệt độ”, “Thức ăn”, và “Độ sạch của nước”:
Bước 5: Đánh giá việc loại bỏ từng đặc trưng còn lại
Chúng ta đánh giá R bình phương hiệu chỉnh cho mô hình với từng đặc trưng còn lại bị loại bỏ lần lượt:
Loại bỏ Nhiệt độ:
- R bình phương hiệu chỉnh
Loại bỏ Thức ăn:
- R bình phương hiệu chỉnh
Loại bỏ Độ sạch của nước:
- R bình phương hiệu chỉnh
Việc loại bỏ “Nhiệt độ” dẫn đến R bình phương hiệu chỉnh cao nhất, vì vậy chúng ta loại bỏ “Nhiệt độ” khỏi mô hình.
Bước 6: Loại bỏ đặc trưng ít quan trọng nhất
Bây giờ mô hình của chúng ta bao gồm các đặc trưng “Thức ăn” và “Độ sạch của nước”:
Bước 7: Đánh giá việc loại bỏ từng đặc trưng còn lại
Chúng ta đánh giá R bình phương hiệu chỉnh cho mô hình với từng đặc trưng còn lại bị loại bỏ lần lượt:
Loại bỏ Thức ăn:
- R bình phương hiệu chỉnh
Loại bỏ Độ sạch của nước:
- R bình phương hiệu chỉnh
Việc loại bỏ “Thức ăn” hoặc “Độ sạch của nước” đều làm giảm R bình phương hiệu chỉnh đáng kể, vì vậy chúng ta giữ cả hai đặc trưng.
Mô hình cuối cùng
Mô hình cuối cùng bao gồm các đặc trưng “Thức ăn” và “Độ sạch của nước”:
Tóm tắt
Trong quá trình lựa chọn đặc trưng ngược sử dụng R bình phương hiệu chỉnh này, chúng ta bắt đầu với tất cả các đặc trưng và lần lượt loại bỏ đặc trưng ít quan trọng nhất dựa trên R bình phương hiệu chỉnh cho đến khi không còn cải thiện đáng kể nào được quan sát thấy. Mô hình cuối cùng của chúng ta bao gồm “Thức ăn” và “Độ sạch của nước” là các biến dự đoán trọng lượng cá.
bài viết gốc: