Hypothesis Testing for Single Population - Statistics for Business | Trường Đại học Quốc tế, Đại học Quốc gia Thành phố HCM

Hypothesis Testing for Single Population - Statistics for Business | Trường Đại học Quốc tế, Đại học Quốc gia Thành phố HCM được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

Hypothesis Testing for Single Population
* Có hai lo i hypothesis: H
o
(null hypothesis) và H (alternative hypothesis). Hai lo i hypothesis
1
này cover t t c các kh năng có th x y ra c a data. Th ng đ bài mu n test đi u gì thì cho nó ườ
là H , các kh năng còn l i là H
o
1
.
Ví d :
H
o
: x
0 (null hypothesis)
H
1
: x < 0 (alternative hypothesis)
* Test statistic: m t thông s đ c tính d a vào các s li u đ bài đ a ra, dùng đ so sánh và k t ượ ư ế
lu n có reject null hypothesis hay không.
* Rejection region: kho ng các giá tr n u test statistic r i vào thì reject null hypothesis ế ơ
* Hypothesis testing population: quan tâm t i vi c mình c n test cái gì (population mean,
proportion hay variance), sample l n hay nh (large sample là >=30, small là < 30), test đó là
one-tailed hay two-tailed.
* Test population mean, large sample:
S d ng b ng z v i z
t
là test statistic, là mean c a sample, µx
o
là giá tr c n test đ c s d ng ượ
hypothesis, s là standard deviation c a sample, n là s ph n t c a sample.
α
ch significant level c a test, ví d v i
α
= 0.05, H có 1 - 0.05 = 0.95 = 95% kh năng
o
đúng trong t t c các tr ng h p. Vì v y th ng mu n test gì thì b nó lên H ườ ườ
o
.
Ví d :
Phân tích đ : câu đ u tiên cho th y công ty insurace này c n test li u average liabiity insurance
per board seat … (đ t thông s này là has been greater than $2000. Quan tr ng cái chú ý t i
nh ng cái nh ư greater than less than no more than (>), (<), (
), (no less than
) hay
different (≠) đ đ t hypothesis cho đúng. N u r i vào tr ng h p different thì là two-tailed, các ế ơ ườ
tr ng h p khác là one-tailed.ườ
V i tr ng h p này null hypothesis là µ > 2000, đ cover t t c các tr ng h p còn l i thì ườ ườ
alternative hypothesis là µ
2000.
Có n, và s n nên ráp vào chung v i µx
o
= 2000 đ tính đ c test statistic z ượ
t
= 1.055
Đ tìm critical value, ta d a vào hai y u t : ế
α
= 0.01 và d u c a alternative hypothesis,
đây là d u
nên s l y d u âm, t ng t v i d u bé h n. N u ươ ơ ế alternative hypothesis có d u
> ho c
thì critical value mang d u d ng. ươ
Do đó critical value -z = -2.33, z > -z nên không reject H . Null hypothesis đúng trong tr ng
c t c o
ườ
h p này. Ph i k t lu n hai th : m t là có reject null hypothesis hay không, hai là k t lu n ế ế
theo đ bài .
K t lu n c a bài này nên ghi là:ế
We don’t reject the null hypothesis (ho c We do not reject H
o
nh ng ph i có tính toán c th ư
so sánh trên).
Therfore, the insurance company’s belief that over the last few years the average liabiltiy
insurance per board seat in companies defined as “small companies” is proved to be true at
α
= 0.01. (ghi thêm
α
= 0.01 vào vì nó có th b reject v i các
α
khác)
* Test population mean, small sample, không bi t variance, population theo normal ế
distribution.
S d ng t-distribution v i các công th c nh trên, cái khác so v i tr ng h p trên là ph i tính ư ườ
degree of freedom, l y n-1.
Bài gi i đ y đ c a mình:
Let µ be the average speed of the . Assuming the sample data is normally distributed.new copier
H
o
: µ = 27
H
1
: µ ≠ 27
With n = 24, = 24.6, s = 7.4, we have the test statistic: x
t =
xµo
s/
=
24.6 27
7.4 /
= -1.59
At
α
= 0.05, df (degree of freedom) = n – 1 = 24 – 1 = 23, we have the critical value:
t
c
= t = t = 2.069
23, 0.05/2 23.5, 0.025
As -t < t < t (or t > t ), we do not reject H .
c t c t c o
Therefore at
α
= 0.05, the company can conclude that the new copier does have the same
average speed as its standard compact copier.
* Test population proportion, large sample.
S d ng b ng z, là proportion c a sample, p pp
o
là proportion c n test, q
o
= 1-p .
o
Phân tích đ bài: p
o
= 0.096, = 7/600 = 0.117, n = 600. G i µ là the proportion of all hotels in p
US that would qualify.
H
o:
µ > 0.096
H
1
0.096
Test statistic: z =
t
0.117 0.096
= 1.746
Do đ bài không cho
α
nên t ch n
α
, th ng l y 0.01 ho c 0.05. đây mình ch n 0.01. ườ
Critical value là:
z
c
= - z = -2.33
alpha
As z > -2.33, we do not reject the null hypothesis H . Therefore, the proportion of all hotels that
t o
would qualify is indeed higher than 0.096 at a significance level of 0.01.
* Test for population variance, population must be normally distributed:
S d ng Chi-distribution, n là s ph n t c a sample, s là standard deviation c a sample,
σ
o
2
là variance c n test.
Tính sample variance nh đã h c, có đ c sư ượ
2
= 5.156, các thông s khác đ bài cho bao g m n =
10,
σ
o
2
= 2.25.
Tính test statistic theo công th c. V i critical value, trong tr ng h p này là two-tailed test nên ườ
ph i tính hai giá tr , m t là chi-distribution c a (df, alpha/2) và cái còn l i là (df, 1 – alpha/2) nh ư
hình trên.
Do test statistic > chi-distribution value c a (df, alpha/2) nên reject null hypothesis.
* p-value
p-value là m t cách ti p c n khác đ i v i nh ng bài toán hypothesis testing. N u nh ng cách ế ế
đã nêu chúng ta s d ng so sánh gi a critical value và test statistic đ đ a ra quy t đ nh reject ư ế
hay không reject null hypothesis, v i p-value chúng ta so s1ánh nó v i level of si gnificance
α
.
Nh trong nh trên, right-tailed test, p-value là area v phía bên ph i c a test statistic n u test ư ế
statistic d ng, ng c l i v i left-tailed test. Cho two-tailed test, p-value l y kho ng area bên ươ ượ
ph i positive test statistic ho c bên trái negative test statistic nhân đôi lên.
Bài t p ví d v p-value:
Let be the average battery life-time produced by the new chemical process.
Our hypothesis:
H
o
: = 102.5
H
1
: ≠ 102.5
As the sample contains 33 batteries, we consider this a large sample and use the z-distribution.
The test statistic in this case:
z
t
=
= 2.585
Gi ph i tính p-value cho con s 2.585 trên. Đ tính p-value các b n làm các b c sau: ướ
1/Xem rejection region n m đâu. V i tr ng h p này là two-tailed test nên nó n m c hai ườ
phía c a distribution, còn right-tailed hay left-tailed thì rejection region n m bên ph i hay bên
trái theo th t đó.
2/Dò b ng phù h p. V i tr ng h p này dùng b ng z, dò 2.585 s ra probability kho ng 0.995 ườ
nh ng đó là probability tính t phía trái sang t i 2.585, cái c n l y là phía bên ph i, t c là 0.005. ư
Do đây là two-tailed test nên nhân đôi giá tr đó lên s đ c p-value là 0.01. ượ
So sánh p-value v i alpha, trong tr ng h p này có hai alpha là 0.05 và 0.01, đ u cho k t qu ườ ế
alpha l n h n ho c b ng p-value nên reject null hypothesis. ơ
K t lu n: The new process affects the average lifetime of batteries at alpha = 0.05 and alpha = ế
0.01.
| 1/9

Preview text:

Hypothesis Testing for Single Population * Có hai lo i hypothesis: H ạ
o (null hypothesis) và H (alternative hypothesis). Hai lo 1 ại hypothesis này cover tất c các kh ả năng có th ả x ể y ra c ả a data. T ủ h ng đ ườ bài mu ề
ốn test đi u gì thì cho nó ề là H , các kh o năng còn l ả i là H ạ 1. Ví dụ:
Ho : x 0 (null hypothesis)
H1: x < 0 (alternative hypothesis) * Test statistic: m t thông s ộ đ ố c tính d ượ a vào các s ự li ố u đ ệ bài đ ề
ưa ra, dùng đ so sánh và k ể t ế
lu n có reject null hypothesis hay không. ậ
* Rejection region: kho ng các giá tr ả n ị u test statistic r ế
i vào thì reject null hypothesis ơ
* Hypothesis testing population: quan tâm t i vi ớ c mình c ệ
n test cái gì (population mean, ầ
proportion hay variance), sample l n hay nh ớ
(large sample là >=30, small là < 30), test đó là ỏ one-tailed hay two-tailed.
* Test population mean, large sample: Sử dụng b ng z v ả i z ớ x ủ t là test statistic,
là mean c a sample, µ o là giá trị c n test đ ầ c s ượ ử d ng ụ ở
hypothesis, s là standard deviation c a sample, n là s ủ ph ố n t ầ c ử a sample. ủ
α ch significant level c ỉ a test, ví d ủ v
ụ ới α = 0.05, H có 1 - 0.05 = 0.95 = 95% kh o năng ả đúng trong t t c ấ các tr ả ng h ườ
ợp. Vì vậy thường mu n test gì thì b ố nó lên H ỏ o. Ví d :
Phân tích đề: câu đ u tiên cho th ầ y công ty insurace này c ấ n test li ầ u average liabiity insurance ệ
per board seat … (đ t thông s ặ này là has been ố
greater than $2000. Quan trọng cái chú ý t i ớ những cái nh
ư greater than (>), less than (<), no more than ( ), no less than ( ) hay different (≠) đ đ ể t hypothesis cho đúng. N ặ u r
ế ơi vào trường hợp different thì là two-tailed, các tr ng h ườ p khác là ợ one-tailed. V i tr ớ ng h ườ
ợp này null hypothesis là µ > 2000, để cover tất cả các tr ng h ườ p còn l ợ i thì ạ
alternative hypothesis là µ 2000. Có n, và s x n nên ráp vào chung v ẵ ới µo = 2000 đ tính đ ể c test statistic z ượ t = 1.055 Đ tìm critical value, ta d ể
ựa vào hai yếu tố: α = 0.01 và d u c ấ a
alternative hypothesis, ở đây là d u ấ nên s l ẽ y d ấ u âm, t ấ ư ng t ơ v ự i d ớ u bé h ấ
ơn. Nếu alternative hypothesis có d u ấ > ho c ặ
thì critical value mang d u d ấ ng. ươ
Do đó critical value -zc = -2.33, zt > -zc nên không reject H . Null hypothesis đúng trong tr o ường h p này ợ . Ph i k t lu ế n hai th ứ: m t là có rejec
t null hypothesis hay không, hai là k t lu ế n theo đ bài . K t lu ế n c ậ a ủ bài này nên ghi là:
We don’t reject the null hypothesis (hoặc We do not reject Ho nhưng phải có tính toán c th ụ ể và so sánh trên). ở
Therfore, the insurance company’s belief that over the last few years the average liabiltiy
insurance per board seat in companies defined as “small companies” is proved to be true at α
= 0.01.
(ghi thêm α = 0.01 vào vì nó có thể b reject v ị i các ớ α khác)
* Test population mean, small sample, không bi t variance, population theo normal ế distribution.
Sử dụng t-distribution v i các công th ớ ức nh trên, cái khác so v ư i tr ớ ng h ườ ợp trên là ph i tính ả degree of freedom, l y n-1. ấ Bài gi i đ ả y đ ầ c ủ a mình: ủ
Let µ be the average speed of the new copier. Assuming the sample data is normally distributed. Ho: µ = 27 H1: µ ≠ 27
With n = 24, = 24.6, s = 7.4, we have the test statistic: x xµo 24.6−27 t = s/ √❑ = 7.4/ √❑ = -1.59
At α = 0.05, df (degree of freedom) = n – 1 = 24 – 1 = 23, we have the critical value: tc = t23, 0.05/2 = t = 2.069 23.5, 0.025
As -tc < tt < tc (or tt > tc), we do not reject H . o
Therefore at α = 0.05, the company can conclude that the new copier does have the same
average speed as its standard compact copier.
* Test population proportion, large sample. S d ử ng b ụ ng z, ả là proportion c p a sample, p p ủ
o là proportion cần test, qo = 1-p . o Phân tích đ bài: p ề p ọ o = 0.096,
= 7/600 = 0.117, n = 600. G i µ là the proportion of all hotels in US that would qualify. Ho: µ > 0.096 H1:µ 0.096 0.117−0.096 Test statistic: zt = √❑ = 1.746 Do đ bài không cho ề α nên t ch ự n ọ α , th ng l ườ ấy 0.01 ho c 0.05. ặ đây mình ch Ở n 0.01. ọ Critical value là: zc = - zalpha = -2.33
As zt > -2.33, we do not reject the null hypothesis Ho. Therefore, the proportion of all hotels that
would qualify is indeed higher than 0.096 at a significance level of 0.01.
* Test for population variance, population must be normally distributed: S d
ử ụng Chi-distribution, n là s ph ố n t ầ c ử
a sample, s là standard deviation c ủ a sample, ủ σ 2 o là variance c n test. ầ
Tính sample variance nh đã h ư c, có đ ọ c s
ượ 2 = 5.156, các thông s khác đ ố bài cho bao g ề m n = ồ 10, σ 2 o = 2.25.
Tính test statistic theo công th c. V ứ i critical value, trong tr ớ ng h ườ
p này là two-tailed test nên ợ phải tính hai giá tr , m ị t là chi-distribution c ộ
a (df, alpha/2) và cái còn l ủ i là (df, 1 – alpha/2) nh ạ ư hình trên.
Do test statistic > chi-distribution value c a (df, alpha/2) nên reject null hypothesis. ủ * p-value p-value là m t cách ti ộ p c ế n khác đ ậ i v ố i nh ớ ng bài ữ
toán hypothesis testing. N u ế nh ở ng cách ữ đã nêu chúng ta s d ử ng so sánh gi ụ a cr ữ
itical value và test statistic đ đ ể a ra quy ư t đ ế nh reject ị
hay không reject null hypothesis, v i p-value chúng ta so s1ánh nó v ớ i ớ level of si gnificance α . Nh trong ư nh trên, ả
right-tailed test, p-value là area v ở phía bên ph ề i c ả a test statistic n ủ u test ế statistic d ng, ng ươ c l ượ i v ạ i
ớ left-tailed test. Cho two-tailed test, p-value l y kho ấ ng area bên ả
phải positive test statistic ho c bên trái negative test statistic nhân đôi lên. ặ Bài t p ví d ậ ụ v p-value: ề
Let � be the average battery life-time produced by the new chemical process. Our hypothesis: H � o: = 102.5 H1: � ≠ 102.5
As the sample contains 33 batteries, we consider this a large sample and use the z-distribution.
The test statistic in this case: 107−102.5 zt = 10 / √❑ = 2.585 Gi ph ờ i tính p-value cho con s ả 2.585 trên. Đ ố tính p-value các b ể n làm các b ạ c sau: ướ 1/Xem rejection region n m ằ đâu. V ở i tr ớ ng h ườ p
ợ này là two-tailed test nên nó n m ằ c ở hai ả
phía c a distribution, còn right-tailed hay left-tailed thì rejection region n ủ m bên ph ằ i hay bên ả trái theo th t ứ đó. ự 2/Dò bảng phù h p. V ợ i tr ớ ng h ườ p này dùng b ợ ng z, dò 2.585 s ả ra probability kho ẽ ng 0.995 ả
nh ng đó là probability tính t ư phía trái sang t ừ i 2.585, cái c ớ n l ầ y
ấ là phía bên phải, t c là 0.005. ứ
Do đây là two-tailed test nên nhân đôi giá trị đó lên s đ ẽ c p-value là 0.01. ượ
So sánh p-value v i alpha, trong tr ớ ng h ườ
ợp này có hai alpha là 0.05 và 0.01, đ u cho k ề t qu ế ả alpha l n h ớ n ho ơ
ặc b ng p-value nên reject null hypothesis. ằ K t lu ế n: The new process af ậ
fects the average lifetime of batteries at alpha = 0.05 and alpha = 0.01.