Tiêu chí BIC (Bayesian Information Criterion)

🎯 BIC (Bayesian Information Criterion) là “phiên bản nghiêm khắc hơn của AIC” trong việc chọn mô hình thống kê!


🧠 BIC là gì?

Hãy tưởng tượng bạn đang tuyển chọn mô hình cho một nhiệm vụ dự đoán. Nếu AIC là giám khảo dễ tính, thì BIC là giám khảo khó tính hơn, đặc biệt khi bạn có nhiều dữ liệu. BIC sẽ “phạt nặng” những mô hình có quá nhiều tham số không cần thiết.


📏 Công thức BIC:

    \[BIC = -2 \cdot \ln(L) + k \cdot \ln(n)\]

Trong đó:

  • (L): độ hợp lý (likelihood) của mô hình
  • (k): số lượng tham số
  • (n): số lượng mẫu dữ liệu

👉 BIC càng thấp → mô hình càng tốt (theo tiêu chí của BIC)


🎬 Ví dụ vui

Bạn có 2 mô hình dự đoán điểm thi:

  • Mô hình A: đơn giản, ít tham số
  • Mô hình B: phức tạp, nhiều biến

Cả hai đều dự đoán khá tốt, nhưng mô hình B dùng quá nhiều biến. BIC sẽ nói:

“Không cần rườm rà thế đâu, tôi chọn mô hình A!” 😎


🤹 So sánh AIC vs BIC

Tiêu chíAICBIC
Phạt tham sốNhẹNặng hơn
Phù hợp vớiMô hình dự đoánMô hình thống kê
Ưu tiênĐộ chính xácĐộ đơn giản + chính xác
Dữ liệu lớnÍt thay đổiPhạt mạnh mô hình phức tạp

🧪 Khi nào dùng BIC?

  • Khi bạn muốn chọn mô hình đơn giản nhưng hiệu quả.
  • Khi làm việc với dữ liệu lớn, BIC giúp tránh overfitting.
  • Khi bạn đang làm phân tích thống kê nghiêm túc hơn là chỉ dự đoán.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

error: Content is protected !!