Cảnh báo!!!

Mô-đun 1: mô hình, đánh giá mô hình
Dữ liệu là gì? Tại sao cần dữ liệu chất lượng cao cho máy học?
Tham số và Hàm Mất Mát (Loss Function) là gì?
Hồi quy tuyến tính đơn biến phương pháp bình phương nhỏ nhất
Mô-đun 2: quá khớp, phân tách đào tạo-thử nghiệm
phân chia tập huấn luyện – tập kiểm tra là gì?
Cách phân chia tập huấn luyện – tập kiểm tra
phân chia tập xác nhận (validation set)
Tổng kết: “Chưa khớp” và “quá khớp”
đọc thêm
Bias và Variance trade off (cân bằng giữa độ chệch và phương sai) là gì?
Mô-đun 3: Hồi quy
hồi quy tuyến tính đa biến – các giả định cần nhớ (và nhớ cho vui)
Các loại Tổng bình phương (Sum of Squares)
Mô-đun 4: Lựa chọn tính năng & phép phạt
Lựa chọn đặc trưng tiến-lùi-từng bước
Lựa Chọn Đặc Trưng – Như Tìm Người Yêu Lý Tưởng
lựa chọn tiến – tuyển dụng nhân tài cấp cao
Ví dụ từng bước về lựa chọn đặc trưng tiến sử dụng R bình phương hiệu chỉnh
Lựa Chọn Lùi –Chọn Người Để “Đuổi Việc”
Lựa chọn từng bước (Stepwise Selection)
Lasso-Ridge – Elastic Net
Mô-đun 5: Điều chỉnh siêu tham số
Mô-đun 6: Phân loại
KNN
K-Nearest Neighbors (KNN): có vấn đề gì thì hỏi hàng xóm
So sánh KNN với các thuật toán học máy khác
những lưu ý quan trọng khi sử dụng KNN
Thực hành:
K-Nearest Neighbors trong Python
K-Nearest Neighbors (KNN) trong R
hồi quy logistic
Ước lượng hợp lý cực đại (Maximum Likelihood Estimation – MLE)
Hồi quy logistic – “thầy bói công nghệ”
Ví dụ về hồi quy Logistic trong R trên bộ dữ liệu mtcars
Cây quyết định
Cây Quyết Định (Decision Tree) cho người hay phân vân
Entropy (Sự rối loạn của dữ liệu)
Thực hành:
Ví dụ: Cây Quyết Định (Decision Tree) cho bài toán phân loại trong Python
Ví dụ cây quyết định hồi quy (Decision Tree Regression) với Python
xây dựng cây quyết định trong R với gói rpart trên bộ dữ liệu Iris
SVM
Máy véc tơ hỗ trợ (SVM) – Vừa thông minh vừa biết “giữ kẽ”!
Ưu điểm và khuyết điểm của Máy Vector Hỗ trợ
So sánh SVM với các Thuật toán Học máy Khác
Thực hành
Python:
Ví dụ về SVM với kernel RBF trong Python
R:
mô hình SVM với kernel RBF trong R
Mô-đun 7: Giảm chiều dữ liệu
Principal Component Analysis – Phân tích thành phần chính – giải pháp cho dữ liệu thừa mỡ
Mô-đun 8: Phân cụm
Ứng dụng Thực tế của Thuật toán Phân cụm K-Means trong Phân tích Dữ liệu và Kinh doanh
Phân cụm K-Means + code Python và R