Học máy cơ bản

Cảnh báo!!!

Mô-đun 1: mô hình, đánh giá mô hình

Những ứng dụng của học máy

Dữ liệu là gì? Tại sao cần dữ liệu chất lượng cao cho máy học?

Nhiễu dữ liệu

Học có giám sát

Học không có giám sát

Tham số và Hàm Mất Mát (Loss Function) là gì?

Hồi quy tuyến tính đơn biến phương pháp bình phương nhỏ nhất

Mô-đun 2: quá khớp, phân tách đào tạo-thử nghiệm

khả năng khái quát hóa

phân chia tập huấn luyện – tập kiểm tra là gì?

Cách phân chia tập huấn luyện – tập kiểm tra

phân chia tập xác nhận (validation set)

hồi quy đa thức

Chưa khớp (Underfitting)

Quá khớp (Overfitting)

Tổng kết: “Chưa khớp” và “quá khớp”

đọc thêm

Bias và Variance trade off (cân bằng giữa độ chệch và phương sai) là gì?

Mô-đun 3: Hồi quy

hồi quy tuyến tính đa biến – các giả định cần nhớ (và nhớ cho vui)

Hồi quy đa thức

Các loại Tổng bình phương (Sum of Squares)

Hệ số xác định

Hệ số xác định hiệu chỉnh

Biểu đồ phần dư

Phép biến đổi log là gì?

Mô-đun 4: Lựa chọn tính năng & phép phạt

Lựa chọn đặc trưng tiến-lùi-từng bước

Lựa Chọn Đặc Trưng – Như Tìm Người Yêu Lý Tưởng

lựa chọn tiến – tuyển dụng nhân tài cấp cao

Ví dụ từng bước về lựa chọn đặc trưng tiến sử dụng R bình phương hiệu chỉnh

Lựa Chọn Lùi –Chọn Người Để “Đuổi Việc”

Ví dụ từng bước về quá trình lựa chọn đặc trưng lùi (backward feature selection) sử dụng R bình phương hiệu chỉnh

Lựa chọn từng bước (Stepwise Selection)

Ví dụ từng bước về lựa chọn đặc trưng từng bước (stepwise feature selection) sử dụng R bình phương hiệu chỉnh

Lasso-Ridge – Elastic Net

Hồi quy Lasso

hồi quy Ridge

Hồi quy Elastic Net

Mô-đun 5: Điều chỉnh siêu tham số

Siêu tham số là gì?

Mô-đun 6: Phân loại

KNN

K-Nearest Neighbors (KNN): có vấn đề gì thì hỏi hàng xóm

Ưu và Nhược điểm của KNN

So sánh KNN với các thuật toán học máy khác

những lưu ý quan trọng khi sử dụng KNN

Thực hành:

K-Nearest Neighbors trong Python

K-Nearest Neighbors (KNN) trong R

hồi quy logistic

Ước lượng hợp lý cực đại (Maximum Likelihood Estimation – MLE)

Hồi quy logistic – “thầy bói công nghệ”

Ví dụ về hồi quy Logistic trong R trên bộ dữ liệu mtcars

Cây quyết định

Cây Quyết Định (Decision Tree) cho người hay phân vân

Entropy (Sự rối loạn của dữ liệu)

Gini Index (Chỉ số đồng nhất)

Thực hành:

Ví dụ: Cây Quyết Định (Decision Tree) cho bài toán phân loại trong Python

Ví dụ cây quyết định hồi quy (Decision Tree Regression) với Python

xây dựng cây quyết định trong R với gói rpart trên bộ dữ liệu Iris

SVM

Máy véc tơ hỗ trợ (SVM) – Vừa thông minh vừa biết “giữ kẽ”!

Phép thuật kernel trong SVM

Ưu điểm và khuyết điểm của Máy Vector Hỗ trợ

So sánh SVM với các Thuật toán Học máy Khác

Thực hành

Python:

Ví dụ về SVM với kernel RBF trong Python

R:

mô hình SVM với kernel RBF trong R

Mô-đun 7: Giảm chiều dữ liệu

Principal Component Analysis – Phân tích thành phần chính – giải pháp cho dữ liệu thừa mỡ

Mô-đun 8: Phân cụm

Ứng dụng Thực tế của Thuật toán Phân cụm K-Means trong Phân tích Dữ liệu và Kinh doanh

Phân cụm K-Means + code Python và R

Đọc thêm:

Ứng Dụng Học Máy Trong Phân Tích Khách Hàng: Tối Ưu Hóa Chiến Lược Kinh Doanh Trong Kỷ Nguyên Dữ Liệu

Học tăng cường

error: Content is protected !!