








Preview text:
Hypothesis Testing for Single Population * Có hai lo i hypothesis: H ạ
o (null hypothesis) và H (alternative hypothesis). Hai lo 1 ại hypothesis này cover tất c các kh ả năng có th ả x ể y ra c ả a data. T ủ h ng đ ườ bài mu ề
ốn test đi u gì thì cho nó ề là H , các kh o năng còn l ả i là H ạ 1. Ví dụ:
Ho : x ≥ 0 (null hypothesis)
H1: x < 0 (alternative hypothesis) * Test statistic: m t thông s ộ đ ố c tính d ượ a vào các s ự li ố u đ ệ bài đ ề
ưa ra, dùng đ so sánh và k ể t ế
lu n có reject null hypothesis hay không. ậ
* Rejection region: kho ng các giá tr ả n ị u test statistic r ế
i vào thì reject null hypothesis ơ
* Hypothesis testing population: quan tâm t i vi ớ c mình c ệ
n test cái gì (population mean, ầ
proportion hay variance), sample l n hay nh ớ
(large sample là >=30, small là < 30), test đó là ỏ one-tailed hay two-tailed.
* Test population mean, large sample: Sử dụng b ng z v ả i z ớ x ủ t là test statistic,
là mean c a sample, µ o là giá trị c n test đ ầ c s ượ ử d ng ụ ở
hypothesis, s là standard deviation c a sample, n là s ủ ph ố n t ầ c ử a sample. ủ
α ch significant level c ỉ a test, ví d ủ v
ụ ới α = 0.05, H có 1 - 0.05 = 0.95 = 95% kh o năng ả đúng trong t t c ấ các tr ả ng h ườ
ợp. Vì vậy thường mu n test gì thì b ố nó lên H ỏ o. Ví d : ụ
Phân tích đề: câu đ u tiên cho th ầ y công ty insurace này c ấ n test li ầ u average liabiity insurance ệ
per board seat … (đ t thông s ặ này là has been ố
greater than $2000. Quan trọng cái chú ý t i ớ những cái nh
ư greater than (>), less than (<), no more than ( ≤ ), no less than ( ≥ ) hay different (≠) đ đ ể t hypothesis cho đúng. N ặ u r
ế ơi vào trường hợp different thì là two-tailed, các tr ng h ườ p khác là ợ one-tailed. V i tr ớ ng h ườ
ợp này null hypothesis là µ > 2000, để cover tất cả các tr ng h ườ p còn l ợ i thì ạ
alternative hypothesis là µ ≤ 2000. Có n, và s x n nên ráp vào chung v ẵ ới µo = 2000 đ tính đ ể c test statistic z ượ t = 1.055 Đ tìm critical value, ta d ể
ựa vào hai yếu tố: α = 0.01 và d u c ấ a
ủ alternative hypothesis, ở đây là d u ấ ≤ nên s l ẽ y d ấ u âm, t ấ ư ng t ơ v ự i d ớ u bé h ấ
ơn. Nếu alternative hypothesis có d u ấ > ho c ặ
≥ thì critical value mang d u d ấ ng. ươ
Do đó critical value -zc = -2.33, zt > -zc nên không reject H . Null hypothesis đúng trong tr o ường h p này ợ . Ph i k ả t lu ế n hai th ậ ứ: m t là có rejec ộ
t null hypothesis hay không, hai là k t lu ế n ậ theo đ bài ề . K t lu ế n c ậ a ủ bài này nên ghi là:
We don’t reject the null hypothesis (hoặc We do not reject Ho nhưng phải có tính toán c th ụ ể và so sánh trên). ở
Therfore, the insurance company’s belief that over the last few years the average liabiltiy
insurance per board seat in companies defined as “small companies” is proved to be true at α
= 0.01. (ghi thêm α = 0.01 vào vì nó có thể b reject v ị i các ớ α khác)
* Test population mean, small sample, không bi t variance, population theo normal ế distribution.
Sử dụng t-distribution v i các công th ớ ức nh trên, cái khác so v ư i tr ớ ng h ườ ợp trên là ph i tính ả degree of freedom, l y n-1. ấ Bài gi i đ ả y đ ầ c ủ a mình: ủ
Let µ be the average speed of the new copier. Assuming the sample data is normally distributed. Ho: µ = 27 H1: µ ≠ 27
With n = 24, = 24.6, s = 7.4, we have the test statistic: x x−µo 24.6−27 t = s/ √❑ = 7.4/ √❑ = -1.59
At α = 0.05, df (degree of freedom) = n – 1 = 24 – 1 = 23, we have the critical value: tc = t23, 0.05/2 = t = 2.069 23.5, 0.025
As -tc < tt < tc (or tt > tc), we do not reject H . o
Therefore at α = 0.05, the company can conclude that the new copier does have the same
average speed as its standard compact copier.
* Test population proportion, large sample. S d ử ng b ụ ng z, ả là proportion c p a sample, p p ủ
o là proportion cần test, qo = 1-p . o Phân tích đ bài: p ề p ọ o = 0.096,
= 7/600 = 0.117, n = 600. G i µ là the proportion of all hotels in US that would qualify. Ho: µ > 0.096 H1:µ ≤ 0.096 0.117−0.096 Test statistic: zt = √❑ = 1.746 Do đ bài không cho ề α nên t ch ự n ọ α , th ng l ườ ấy 0.01 ho c 0.05. ặ đây mình ch Ở n 0.01. ọ Critical value là: zc = - zalpha = -2.33
As zt > -2.33, we do not reject the null hypothesis Ho. Therefore, the proportion of all hotels that
would qualify is indeed higher than 0.096 at a significance level of 0.01.
* Test for population variance, population must be normally distributed: S d
ử ụng Chi-distribution, n là s ph ố n t ầ c ử
a sample, s là standard deviation c ủ a sample, ủ σ 2 o là variance c n test. ầ
Tính sample variance nh đã h ư c, có đ ọ c s
ượ 2 = 5.156, các thông s khác đ ố bài cho bao g ề m n = ồ 10, σ 2 o = 2.25.
Tính test statistic theo công th c. V ứ i critical value, trong tr ớ ng h ườ
p này là two-tailed test nên ợ phải tính hai giá tr , m ị t là chi-distribution c ộ
a (df, alpha/2) và cái còn l ủ i là (df, 1 – alpha/2) nh ạ ư hình trên.
Do test statistic > chi-distribution value c a (df, alpha/2) nên reject null hypothesis. ủ * p-value p-value là m t cách ti ộ p c ế n khác đ ậ i v ố i nh ớ ng bài ữ
toán hypothesis testing. N u ế nh ở ng cách ữ đã nêu chúng ta s d ử ng so sánh gi ụ a cr ữ
itical value và test statistic đ đ ể a ra quy ư t đ ế nh reject ị
hay không reject null hypothesis, v i p-value chúng ta so s1ánh nó v ớ i ớ level of si gnificance α . Nh trong ư nh trên, ả
right-tailed test, p-value là area v ở phía bên ph ề i c ả a test statistic n ủ u test ế statistic d ng, ng ươ c l ượ i v ạ i
ớ left-tailed test. Cho two-tailed test, p-value l y kho ấ ng area bên ả
phải positive test statistic ho c bên trái negative test statistic nhân đôi lên. ặ Bài t p ví d ậ ụ v p-value: ề
Let � be the average battery life-time produced by the new chemical process. Our hypothesis: H � o: = 102.5 H1: � ≠ 102.5
As the sample contains 33 batteries, we consider this a large sample and use the z-distribution.
The test statistic in this case: 107−102.5 zt = 10 / √❑ = 2.585 Gi ph ờ i tính p-value cho con s ả 2.585 trên. Đ ố tính p-value các b ể n làm các b ạ c sau: ướ 1/Xem rejection region n m ằ đâu. V ở i tr ớ ng h ườ p
ợ này là two-tailed test nên nó n m ằ c ở hai ả
phía c a distribution, còn right-tailed hay left-tailed thì rejection region n ủ m bên ph ằ i hay bên ả trái theo th t ứ đó. ự 2/Dò bảng phù h p. V ợ i tr ớ ng h ườ p này dùng b ợ ng z, dò 2.585 s ả ra probability kho ẽ ng 0.995 ả
nh ng đó là probability tính t ư phía trái sang t ừ i 2.585, cái c ớ n l ầ y
ấ là phía bên phải, t c là 0.005. ứ
Do đây là two-tailed test nên nhân đôi giá trị đó lên s đ ẽ c p-value là 0.01. ượ
So sánh p-value v i alpha, trong tr ớ ng h ườ
ợp này có hai alpha là 0.05 và 0.01, đ u cho k ề t qu ế ả alpha l n h ớ n ho ơ
ặc b ng p-value nên reject null hypothesis. ằ K t lu ế n: The new process af ậ
fects the average lifetime of batteries at alpha = 0.05 and alpha = 0.01.