Hypothesis Testing là gì?

Hypothesis testing là gì?

Hypothesis testing hay còn gọi là kiểm định giả thiết thống kê là một phương pháp giúp chúng ta đưa ra kết luận chung dựa trên số liệu thu thập được.

Lấy một ví dụ : Tiệm bánh kem Mr.RJ mới mua một máy nướng bánh mới. Ông chủ mong muốn bánh nướng ra phải có khối lượng trung bình là 30g.

Câu hỏi đặt ra là: Vậy những cái bánh nướng bằng máy mới này có đạt được yêu cầu mong muốn của ông ấy không? hay nói cách khác khối lượng của mỗi bánh có bằng 30 g không?

Chúng ta sẽ lấy 50 mẫu bánh sau khi nướng đi cân và chạy 1 Sample T test. Phương pháp này sẽ giúp chúng ta tìm ra đáp án.

Một số khái niệm trong Hypothesis testing:

Giả thiết Ho- Null Hypothesis

Giả thiết thay thế Ha- Alternate Hypothesis

Trong đó:

Ho là mệnh đề giả định rằng các giá trị đều bằng nhau (hay được hiểu là không có sự khác biệt đáng kể giữa các mẫu)

Ha là mệnh đề thay thế cho Ho ( hay còn gọi là Reject Ho), nghĩa là các giá trị không bằng nhau (hay được giả định rằng có sự khác biệt đáng kể giữa các mẫu)

Cụ thể từ ví dụ trên ta có thông tin như sau:

Ho: những chiếc bánh đều có khối lượng bằng 30g

Ha: những chiếc bánh nướng có khối lượng khác 30g

Lỗi trong kiểm định giả thiết thống kê(Hypothesis Test Errors)

Trong đó Alpha là một hệ số được đặt ra bởi người dùng. Giá trị Alpha = 0.05, nghĩa là chúng ta sẵn sàng chấp nhận 5% cơ hội ( rủi ro) rằng chúng ta đã sai trong việc bác bỏ Ho. Trong vài trường hợp, người dùng có thể chọn Alpha lớn hơn như 0.1.

Trước khi đi tiếp sâu hơn về kiểm định giả thuyết thông kê, chúng ta cần phải lưu ý một số cách dùng từ trong phương pháp này

Đôi khi chúng ta hay nói rằng: “ Chấp nhận giả thiết Ho”, như vậy thì không phù hợp. Vì phương pháp này không dùng để kết luận giả thuyết là đúng hai sai mà phương pháp này chỉ được dùng để chứng mình là có sự khác biệt hay không có sự khác biệt

P-Value (Probability Value) là gì?

P-Value là giá trị mà chúng ta sẽ nhận được sau khi chạy T-test và dùng nó để kết luận.

Công thức như sau:

Quay lại ví dụ chiếc bánh quy lúc đầu, nếu ta có

Ho: Khối lượng trung bình của bánh = 30 g

Ha: Khối lượng trung bình của bánh ≠ 30 g

P-Value = 0.01 và α = 0.05

Với α = 0.05, chúng ta cho phép  5% khả năng chúng ta đã sai trong việc bác bỏ Ho. Nhưng thực tế chúng ta tính ra có 1% thôi. Điều đó có nghĩa là chúng ta không sai khi bác bỏ Ho hay nói cách khác là phải bác bỏ Ho

Nói đến đây có thể bạn sẽ rất mong lung và mơ hồ vì Kiểm định giả thiết thống kê thực chất toàn là những giả thiết phủ định của phủ định.

Cho nên có một mẹo nhỏ để dễ nhớ như sau:

“ If P is LOW ….. Ho Must GO!” hay nói cách khác P thấp thì reject Ho ( có sự khác biệt)

“If P is HIGH….Ho’s the Guy!” hay nói cách khác P Cao thì Fail to reject Ho ( không có sự khác biệt)

Lần sau chúng ta sẽ cùng nhau tìm hiểu cụ thể về những phương pháp được áp dụng trong Hypothesis Testing nhé!

Nguồn: Hypothesis Testing Overview (https://Gembaacademy.com)

Han Vo

Leave a Reply