Bài giảng Chương 4 Xác suất thống kê | Trường Đại học Mở Thành phố Hồ Chí Minh

Bài giảng Chương 4 Xác suất thống kê | Trường Đại học Mở Thành phố Hồ Chí Minh được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

Thông tin:
6 trang 11 tháng trước

Bình luận

Vui lòng đăng nhập hoặc đăng ký để gửi bình luận.

Bài giảng Chương 4 Xác suất thống kê | Trường Đại học Mở Thành phố Hồ Chí Minh

Bài giảng Chương 4 Xác suất thống kê | Trường Đại học Mở Thành phố Hồ Chí Minh được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

82 41 lượt tải Tải xuống
BÀI GI NG D N (SCRIPT) ẠNG VĂN BẢ
Môn h c: XÁC SU T VÀ TH NG KÊ
Chương ế 4: nh giKiểm đị thuy t th ng kê
Ch 4.1- Bài toán ki nh gi thuy t đề ểm đị ế
Slide
Ni dung
1
Chào các Anh, Ch và các B n
Hôm nay chúng ta ti p t c h c v ng kê suy lu n, i dung là: KIế th chương 4 nộ
ĐỊ NH GI THUY T THNG KÊ
Bài h u tiên c 4.1. Bài toán ki nh gi thuy t ọc đầ ủa chương 4 là Chủ đề ểm đị ế
M c tiêu ch c quy trình gi i bài toán ki nh gi thuy t v đề 4.1: Trình bày đư ểm đị ế
tham s c a t ng th .
2
4.1. Bài toán kiểm định gi thuy t th ng kê ế
Chương này sẽ gii thi ếu mt công c ca th ng kê suy di n là ki nh giểm đị thuy t
Trong th c t ng g p v ph i ki m tra xem m ế, chúng ta thườ n đ ột thông tin nào đó v
tham s t ng th ta nh c t các ngu n cung c p (con ận đượ người, các cơ quan,
chí hay các t i dung thôn chức,...) có đáng tin cậy hay không. Quy trình đánh giá n
tin này da trên d u m u là bài toán ki nh gi thuy t th ng kê. li ểm đị ế
ng d ng c a kiểm định gi thuyết thng kê
• Để kim tra gi ế thuy t trong nghiên c u.
• Kiểm tra s tht ca mt kh nh: ch ng h kh nh v l i nhu n c a mẳng đị ạn để ẳng đị
nhà s n xu t, ch ất lượng ca mt loi s n ph m.
Hỗ ết đị ần đưa ra mộ ữa hai trườ ợp, như chấ tr ra quy nh: C t la chn gi ng h p nh
hay không ch p nh n mua m t lô hàng t nhà cung c p.
3
4.2. Gi thuy t th ng kê (Statistical hypothesis) ế
M t gi thuy t th ng là m ế t khẳng định ho c m t nhận định v tham s c a m t h
nhi u t ng th .
Gi thuy t th ng kê bao g m hai ph n, m t gi thuy t không (null hypotheế ế sis), đượ
hi u H0 m t gi thuy t thay th ế ế (alternative hypothesis) được hiu H1,
khẳng định trái ngược vi H0 . Hai phần này đượ ựng đểc xây d cha t t c các k t q ế
có th có c a nghiên c u.
Gi thuy t H0 nói rế ằng điều kiện “không” đang t n t i, không có m i x y ra, thuy
cũ vẫn đúng, tiêu chuẩn cũ là chính xác và hệ ống đượ th c kim soát.
Gi ế thuy t thay th , nói r ng lý thuy t m ng tiêu chu n m i, hế ế ới là đúng, có nhữ th
n m ngoài t m ki m soát ho c m t s thay đổi đã xảy ra.
4
Ví d 1. Gi s gói hàng s n xu c bán theo tr nh là 40 gam. ất đượ ọng lượng quy đị
s n xu t mu n ki ểm tra để xác đ ệu quy trình đóng gói c nh xem li a h có nm ngo
t m ki m soát hay không. Gi thuy ng h ng tru ết không cho trườ ợp này là “trọng lượ
bình của gói hàng là 40 gam” (không có vấn đề gì). Gi thuyết thay thế là “trọng lượn
trung bình c a gói hàng không ph ải là 40 gam” (quá trình nằm ngoài t m ki m soát
Định nghĩa. Giả thuy t H0 , là gi thuy t gế ế ốc ban đầu v tham s 𝜃 c a t ng th , là
luận đang đượ năng vềc chp nhn. Có ba kh gi thuyết H0 là:
Gi thuy t H1, là gi thuyế ết (trái ngược v i H0 ) mà nhà nghiên c u nghi ng có th
s t, và là u c ng d u. th điề ần được “chứng minh” bằ li
𝐻
0
: 𝜃=𝜃
0
, 𝐻
0
: 𝜃 𝜃
0
hoặ𝑐 𝐻
0
: 𝜃 𝜃
0
.
Có ba kh gi thuy t H1 là: năng về ế
5
4.3. Ki nh gi thuy t th ng kê (Hypothesis testing) ểm đị ế
Kiểm định gi thuyết là phương pháp, quy trình toán học d a trên tính toán s li u m
c th và lý thuy t xác suế ất để giúp đưa ra quyết đị nh nên ch p nh n hay bác b m
thuy t H0. ế
4.4. Sai l m trong ki nh gi ểm đị thuy t th ng kê (Errors ) ế
Khi các d li ếu cung c p b ng ch ng quan tr ng r ng gi thuy t H0 là sai thì chú
bác b nó và ng h gi thuy t H1. quy p nh n hay bác b ế ết định đưa ra là chấ
thuy t H0 ch d a trên m t d u m u c nên kh ph mế li th năng chúng ta sẽ
l m. Có hai i sai l nh v m t gi lo ầm khi đưa ra quyết đị ế thuy t.
Kh m sai l m lo i 1: năng phạ
Kh m sai l m lo i 2: năng phạ
6
4.5. M a kiức ý nghĩa củ ểm định gi thuyết (Level of significance)
M a ki nh xác su t ph m sai l m lo t quá giá ức ý nghĩa α củ ểm đị ại 1 không vượ
định trước α.
Trong th c t ế thườ ng ch n mức ý nghĩa α nhỏ như: 10%, 5%, 2% hay 1%. Nế u bác b
H0 mức ý nghĩa thấp, xác su t ph m m t l i là nh ta t tin r ng k t lu n c a ch ế
ta là chính xác.
𝐻
1
: 𝜃 𝜃
0
, 𝐻
1
: 𝜃 >𝜃
0
hoặ𝑐 𝐻
1
:𝜃 <𝜃
0
.
𝛼 =𝑃
(
𝑏á𝑐 𝑏 𝐻
0
|𝐻
0
đú𝑛𝑔
)
=𝑃
(
𝐻
1
|𝐻
0
)
.
𝛽=𝑃
(
𝑐ℎấ𝑝 𝑛ℎậ𝑛 𝐻
0
|𝐻
0
𝑠𝑎𝑖 𝐻
)
=𝑃
(
0
|𝐻
1
)
.
4.6. Quy trình kiểm định gi thuy t th ng kê ế
Bước 1. Đặt gi thuy t ế
Gi thuyết H0: th hi n gi thuy t g c ch p nh n v tham s c ế ốc ban đầu đang đượ 𝜃
t ng th và ch c gán b ng m t trong ba d đượ ấu đó là
Gi thuyết H1: Kh c lẳng định ngượ i vi gi thuy t H0, ch th gán m t trong cế
d u là
7
Gi thuyết H1 tương ứ ới ba trườ ểm địng v ng hp ca ki nh:
Kiểm định hai phía:
Kiểm định bên phi:
Kiểm định bên trái:
Bước 2. Xác định giá tr t i h n
"=",
ho
ặc "≤",
hoặc
" ≥“.
{
𝐻
0
: 𝜃 =𝜃
0
𝐻 :𝜃𝜃
{
𝐻
0
: 𝜃 =𝜃
0
𝐻
1
: 𝜃>𝜃
0
hoặc {
𝐻
0
: 𝜃 𝜃
0
𝐻 :𝜃 >𝜃
{
𝐻
0
: 𝜃 =𝜃
0
𝐻
1
: 𝜃<𝜃
0
hoặc {
𝐻
0
: 𝜃 𝜃
0
𝐻 :𝜃 <𝜃
S d ng xác su t ph m sai l m lo nh tr t i h n cho vùng bác b ại I là α đ xác đị
c a phân ph i m u, là kho ng giá tr thống kê tương ứng v i xác su t ch p nh n sa
lo i I . Vùng còn l i c a phân ph i m u có tr ng kê b - th ằng γ=(1 α) đượ ọi là độc g
c y, là vùng không bác b H0 .
8
Bước 3. Tính giá tr thng kê ki nh (Test statistic value) ểm đị
Tính giá tr ng ki nh d a vào s u c a m u công th c tính ph t th ểm đị li
vào lo i ki ểm định tương ứng đang xét.
Bước 4. Qui tc kiểm định
Da vào vi c so sánh giá tr thng kê ki nh v i kho ng tr t i hểm đ ạn được xác đị
Kết lu c vùng mà giá tr ng kê ki u giá tận được đưa ra tùy thuộ th ểm định rơi vào. Nế
kiểm đị ằm trong vùng “bác bỏ H0” thì kếnh n t lun bác b gi thuyết H0 và dùng g
thuy t H1 làm k t lu n c a mình. N u giá trế ế ế kiểm định rơi vào vùng “không bác b
H0” thì kế ận “không có cơ sở ết H0 “. t lu để bác b gi thuy
9
BÀI T P CH 4.1 ĐỀ
Bài 1. Gi s m m gi 18% th ph n. Tuy nhiên, do n l c ti ột công ty đang nắ ếp t
công ty tin r ng th ph n c a công ty hi n t ại đã lớn hơn 18% và công ty mun ch
minh điều đó. Giả thuyết H0 ca bài toán là gì?
Bài 2. Th i gian khô c a m t lo u ki ng trung bình 75 phút. C ại sơn trong điề ện thườ
nhà hóa học đã đề ới để xut mt ph gia m gim th i gian khô c a lo ại sơn này.
đánh giá hiệu qu c a ch t ph t gi thuy t H1 là gì? gia, đặ ế
Bài 3. Bi t chi u cao trung bình c a cây bế ạch đàn sau 1 năm là 45 dm. Ti vùng X ngư
ta dùng m t lo i phân bón m i và theo dõi chi u cao c a 147 cây b ạch đàn sau 1
để đánh giá loạ hay không? Đặi phân bón mi có hiu qu t gi thuy t H1 là gì? ế
Đáp án: 1) thị ph n c a công ty b ng 18% 2) H1: µ < 75 3) H1: µ >45
10
Tm bi t, và h n g p l i các b n trong ch p theo. đề tiế
| 1/6

Preview text:


BÀI GING DẠNG VĂN BẢN (SCRIPT) Môn h c: XÁC
SUT VÀ THNG KÊ
Chương 4: Kiểm định gi ế thuy t thng kê Ch 4.1- Bài t đề
oán kiểm định gi thuy ết Slide Nội dung
Chào các Anh, Chị và các Bạn 1 Hôm nay chúng ta tiếp t c ụ học về th ng ố
kê suy luận, chương 4 có i nộ dung là: KI
ĐỊNH GIẢ THUYẾT THỐNG KÊ
Bài học đầu tiên của chương 4 là Chủ đề 4.1. Bài toán kiểm định giả thuyết M c
ụ tiêu chủ đề 4.1: Trình bày được quy trình giải bài toán kiểm định giả thuyết v tham số của tổng thể.
4.1. Bài toán kiểm định giả thuyết th ng kê ố 2
Chương này sẽ giới thiệu một công cụ củ ố
a th ng kê suy diễn là kiểm định giả ế thuy t
Trong thực tế, chúng ta thường gặp vấn đề phải kiểm tra xem một thông tin nào đó v tham s t ố ng ổ
thể mà ta nhận được từ các nguồn cung cấp (con người, các cơ quan,
chí hay các tổ chức,...) có đáng tin cậy hay không. Quy trình đánh giá n i ộ dung thôn
tin này dựa trên dữ liệu mẫu là bài toán kiểm định giả thuyết thống kê.
Ứng dụng của kiểm định giả thuyết thống kê
• Để kiểm tra giả thuyết trong nghiên cứu.
• Kiểm tra sự thật của một khẳng định: chẳng hạn để khẳng định về lợi nhuận của m
nhà sản xuất, chất lượng của một loại sản phẩm .
• Hỗ trợ ra quyết định: Cần đưa ra một lựa chọn giữa hai trường hợp, như chấp nhậ
hay không chấp nhận mua một lô hàng từ nhà cung cấp.
4.2. Giả thuyết th ng kê (St ố atistical hypothesis) 3 M t
ộ giả thuyết thống kê là một khẳng định hoặc một nhận định về tham số của một h nhiều tổng thể. Giả thuyết th ng kê ố bao g m ồ hai phần, m t
ộ giả thuyết không (null hypothesis), đượ
hiệu là H0 và một giả thuyết thay thế (alternative hypothesis) được ký hiệu là H1,
khẳng định trái ngược với H0 . Hai phần này được xây dựng để chứa tất cả các kết q có thể có c a nghi ủ ên cứu.
Giả thuyết H0 nói rằng điều kiện “không” đang tồn tại, không có gì mới xảy ra, lý thuy
cũ vẫn đúng, tiêu chuẩn cũ là chính xác và hệ thống được kiểm soát.
Giả thuyết thay thế, nói rằng lý thuyết mới là đúng, có những tiêu chuẩn mới, hệ thố
nằm ngoài tầm kiểm soát hoặc một sự thay đổi đã xảy ra. Ví d 1. ụ
Giả sử gói hàng sản xuất được bán theo trọng lượng quy định là 40 gam. 4 sản xuất mu n
ố kiểm tra để xác định xem liệu quy trình đóng gói của họ có nằm ngo
tầm kiểm soát hay không. Giả thuyết không cho trường hợp này là “trọng lượng tru
bình của gói hàng là 40 gam” (không có vấn đề gì). Giả thuyết thay thế là “trọng lượn
trung bình c a gói hàng không ph ủ
ải là 40 gam” (quá trình nằm ngoài tầm kiểm soát
Định nghĩa. Giả thuyết H0 , là giả thuyết gốc ban đầu về tham số 𝜃 của tổng thể, là
luận đang được chấp nhận. Có ba khả năng về giả thuyết H0 là:
𝐻0: 𝜃=𝜃0, 𝐻0: 𝜃 ≤𝜃0 hoặ𝑐 𝐻0: 𝜃 ≥𝜃0.
Giả thuyết H1, là giả thuyết (trái ngược với H0 ) mà nhà nghiên cứu nghi ngờ có th
sự thật, và là điều cần được “chứng minh” bằng dữ liệu.
Có ba khả năng về giả thuyết H1 là:
𝐻1: 𝜃 ≠𝜃0, 𝐻1: 𝜃 >𝜃0 hoặ𝑐 𝐻1: 𝜃 <𝜃0.
4.3. Kiểm định giả thuyết thống kê (Hypothesis testing) 5
Kiểm định giả thuyết là phương pháp, quy trình toán học dựa trên tính toán s ố liệu mẫ c
ụ thể và lý thuyết xác suất để giúp đưa ra quyết định nên chấp nhận hay bác b ỏ mộ thuyết H0.
4.4. Sai lầm trong kiểm định giả thuyết th ng kê ố (Errors )
Khi các dữ liệu cung cấp bằng chứng quan trọng rằng giả ế thuy t H0 là sai thì chú bác bỏ nó và ng ủ
hộ giả thuyết H1. Vì quyết định đưa ra là chấp nhận hay bác bỏ
thuyết H0 chỉ dựa trên m t
ộ dữ liệu mẫu cụ thể nên có khả năng chúng ta sẽ phạm
lầm. Có hai loại sai lầm khi đưa ra quyết định về một giả ế thuy t.
Khả năng phạm sai lầm loại 1: 𝛼 =𝑃(𝑏á 𝑐𝑏
ỏ 𝐻0|𝐻0 đú𝑛𝑔) =𝑃(𝐻1|𝐻0).
Khả năng phạm sai lầm loại 2: 𝛽=𝑃(𝑐ℎấ𝑝 𝑛 ℎậ𝑛 𝐻
0|𝐻0 𝑠𝑎𝑖) =𝑃(𝐻0|𝐻1).
4.5. Mức ý nghĩa của kiểm định giả thuyết (Level of significance) 6
Mức ý nghĩa α của kiểm định là xác suất phạm sai lầm loại 1 không vượt quá giá định trước α.
Trong thực tế thường chọn mức ý nghĩa α nhỏ như: 10%, 5%, 2% hay 1%. Nếu bác b
H0 ở mức ý nghĩa thấp, xác suất phạm một l i ỗ là nh
ỏ và ta tự tin rằng kết luận c a ủ ch ta là chính xác.
4.6. Quy trình kiểm định giả thuyết th ng kê ố
Bước 1. Đặt giả thuyết
Giả thuyết H0: thể hiện giả thuyết gốc ban đầu đang được chấp nhận về tham số 𝜃 c t ng th ổ
ể và chỉ được gán bằng m t ộ trong ba dấu đó là
"=", hoặc "≤", hoặc " ≥“.
Giả thuyết H1: Khẳng định ngược lại với giả thuyết H0, chỉ có thể gán một trong c dấu là
"≠", hoặc ">", hoặc "<“.
Giả thuyết H1 tương ứng với ba trường hợp của kiểm định: 7 Kiểm định hai phía: 𝐻 { 0: 𝜃 =𝜃0 𝐻 : 𝜃≠𝜃 Kiểm định bên phải: 𝐻 𝐻
{ 0: 𝜃 =𝜃0 hoặc { 0: 𝜃 ≤𝜃0 𝐻1: 𝜃>𝜃0 𝐻 : 𝜃 >𝜃 Kiểm định bên trái: 𝐻 { 0: 𝜃 =𝜃0 𝐻 hoặc { 0: 𝜃 ≥𝜃0 𝐻1: 𝜃<𝜃0 𝐻 : 𝜃 <𝜃
Bước 2. Xác định giá trị tới hạn
Sử dụng xác suất phạm sai lầm loại I là α để xác định trị tới hạn cho vùng bác bỏ c a ủ phân ph i
ố mẫu, là khoảng giá trị thống kê tương ứng với xác suất chấp nhận sa loại I . Vùng còn lạ ủ
i c a phân phối mẫu có trị th ng kê b ố
ằng γ=(1- α) được gọi là độ
cậy, là vùng không bác b H0 . ỏ
Bước 3. Tính giá trị thống kê kiểm định (Test statistic value) 8 Tính giá trị th ng ố
kê kiểm định dựa vào số liệu c a
ủ mẫu và công thức tính ph ụ t
vào loại kiểm định tương ứng đang xét.
Bước 4. Qui tắc kiểm định
Dựa vào việc so sánh giá trị thống kê kiểm định với khoảng trị tới hạn được xác đị
Kết luận được đưa ra tùy thuộc vùng mà giá trị th ng kê ki ố
ểm định rơi vào. Nếu giá t
kiểm định nằm trong vùng “bác bỏ H0” thì kết luận bác bỏ giả thuyết H0 và dùng g
thuyết H1 làm kết luận của mình. Nếu giá trị kiểm định rơi vào vùng “không bác b
H0” thì kết luận “không có cơ sở để bác bỏ giả ết H0 “. thuy 9 BÀI TẬP CHỦ ĐỀ 4.1
Bài 1. Giả sử một công ty đang nắm giữ 18% thị phần. Tuy nhiên, do nỗ lực tiếp t
công ty tin rằng thị phần c a
ủ công ty hiện tại đã lớn hơn 18% và công ty muốn chứ
minh điều đó. Giả thuyết H0 của bài toán là gì?
Bài 2. Thời gian khô của một loại sơn trong điều kiện thường trung bình 75 phút. C
nhà hóa học đã đề xuất một phụ gia mới để giảm thời gian khô của loại sơn này.
đánh giá hiệu quả c a ch ủ
ất phụ gia, đặt giả thuyết H1 là gì?
Bài 3. Biết chiều cao trung bình c a
ủ cây bạch đàn sau 1 năm là 45 dm. Tại vùng X ngư ta dùng m t lo ộ
ại phân bón mới và theo dõi chiều cao c a
ủ 147 cây bạch đàn sau 1
để đánh giá loại phân bón mới có hiệu quả hay không? Đặt giả thuyết H1 là gì?
Đáp án: 1) thị phần c a công ty b ủ
ằng 18% 2) H1: µ < 75 3) H1: µ >45
Tạm biệt, và hẹn gặp lại các bạn trong ch ủ đề tiếp theo. 10