🎯 BIC (Bayesian Information Criterion) là “phiên bản nghiêm khắc hơn của AIC” trong việc chọn mô hình thống kê!








🧠 BIC là gì?
Hãy tưởng tượng bạn đang tuyển chọn mô hình cho một nhiệm vụ dự đoán. Nếu AIC là giám khảo dễ tính, thì BIC là giám khảo khó tính hơn, đặc biệt khi bạn có nhiều dữ liệu. BIC sẽ “phạt nặng” những mô hình có quá nhiều tham số không cần thiết.
📏 Công thức BIC:
Trong đó:
- (L): độ hợp lý (likelihood) của mô hình
- (k): số lượng tham số
- (n): số lượng mẫu dữ liệu
👉 BIC càng thấp → mô hình càng tốt (theo tiêu chí của BIC)
🎬 Ví dụ vui
Bạn có 2 mô hình dự đoán điểm thi:
- Mô hình A: đơn giản, ít tham số
- Mô hình B: phức tạp, nhiều biến
Cả hai đều dự đoán khá tốt, nhưng mô hình B dùng quá nhiều biến. BIC sẽ nói:
“Không cần rườm rà thế đâu, tôi chọn mô hình A!” 😎
🤹 So sánh AIC vs BIC
Tiêu chí | AIC | BIC |
---|---|---|
Phạt tham số | Nhẹ | Nặng hơn |
Phù hợp với | Mô hình dự đoán | Mô hình thống kê |
Ưu tiên | Độ chính xác | Độ đơn giản + chính xác |
Dữ liệu lớn | Ít thay đổi | Phạt mạnh mô hình phức tạp |
🧪 Khi nào dùng BIC?
- Khi bạn muốn chọn mô hình đơn giản nhưng hiệu quả.
- Khi làm việc với dữ liệu lớn, BIC giúp tránh overfitting.
- Khi bạn đang làm phân tích thống kê nghiêm túc hơn là chỉ dự đoán.