Lý thuyết về khoảng tin cậy và mức ý nghĩa

Lý thuyết về khoảng tin cậy và mức ý nghĩa

Khong tin cy
Trong thng kê, khong tin cy (Confidence Invertal-CI) thut ng
ch mt loi ước ng khong, dùng để bin din xác sut tham s
tng th nm gia khong 2 g tr.
CI đưc tính toán da trên s liu thng ca d liu quan t
đưc. Theo đó, khong tin cy th bao hàm g tr thc ca tham
s qun th chưa biết. Tuy vy, khong tin cy đưc không nht
thiết phi bao gm giá tr thc ca tham s.
1. Các yếu t nh ng đến CI
Trong xác sut thng bao gi cũng s sai s, vy các yếu t
nh ng đến CI ? Theo Jerzy Neyman, 3 yếu t tác đng
đến độ rng ca khong tin cy : độ tin cy, kích thước mu độ
biến thiên ca mu. Nghĩa nếu độ tin cy cao hơn s xu ng
to ra khong tin cy độ rng hơn. Hoc 1 mu kích thước ln
hơn s xu ng cho ra khong tin cy tt hơn v tham s qun
th.
2. ng dng ca CI
Các n thng s dng CI đ đo ng độ chc chc hoc đ
không chc chn. Khong tin cy α% tính cho mt tham s s bao
gm 2 s xác sut t 1-α. Người ta th nói rng độ tin cy α%
giá tr chân thc nm trong khong gia 2 s đó.
d : T cùng 1 tng th, ta chn ngu nhiên ra 3 mu khác nhau
nh khong tin cy cho mi mu. Khi đó kết qu khong tin cy
ca mi mu khác nhau cho 3 mu đều đưc ly t 1 tng th.
Gi s mu 1 khong tin cy 1-95%, ta nói : ‘Chúng ta chc
chc 95% rng mu này cha tham s tng thc tế’.
Khong tin cy mt ch s giúp ta biết đưc tính chính xác ca
phép đo. Ngoài ra, cũng cho biết độ n định khi ước ng 1 g
tr, tc nh o khong tin cy, ta th biết đưc kết qu phép
đo lp li s sai lch thế nào so vi ước tính ban đầu.
3. ng dn xác định Confidence Interval
c 1. Kim tra uc đoán giá tr nghiên cu
Gi s bn mun nghiên cu v cân nng trung bình ca sinh viên
nam trường XYZ ước đoán giá tr này 81 kg. Bn cn kim tra
xem ước đoán ca mình liu chính xác trong khong tin cy cho
trước hay không.
c 2. Chn mu
Chn mu quá trình thu thp s liu ngu nhiên nhm kim tra
gi thiết đã đặt ra. Chng hn bn th chn ngu nhiên mu
1000 sinh viên nam ca trường XYZ.
c 3. Tính độ lch chun giá tr trung bình ca mu
Để tính giá tr trung bình ca mu, bn ly trung bình cng cân nng
ca 1000 sinh viên nam. Nghĩa tính tng n nng ca 1000 sinh
viên nam đã chn ri đem chia cho 1000. Gi s giá tr trung bình
thu đưc 81 kg.
Kế tiếp bn tính độ lch chun ca mu bng cách: tìm giá tr trung
bình ca bình phương sai lch so vi g tr trung bình ri ly căn bc
hai ca giá tr thu đưc. Gi s đ lch chun nh đưc 14 kg.
c 4. Chn khong tin cy mong mun
Chn khong tin cy mong mun thường da trên Confidence
Interval ph biến. Thế Confidence Interval thường dùng gì? Thông
thường n nghiên cu s chn các khong tin cy 90%, 95%
hoc 99%. Chng hn, trong trường hp này bn th xét
Confidence Interval 95%.
c 5. Tính gii hn sai s
Gii hn sai s đưc tính theo công thc:H s tin cy x Sai s chun
Trong đó:
H s tin cy = Khong tin cy / 2
d, trong bài toán nghiên cu này, ta đang xét khong tin tin cy
95%, chuyn sang s thp phân 0,95. N vy h s tin cy s
tính bng phép chia 0,95/2, ta đưc 0,475. Đối chiếu vi bngZ table
(bng h s tin cy), bn stìm đưc giá tr tương ng gn nht vi
0,475 1,96.
Sai s chun = độ lch chun / căn bc hai ca kích c mu.
Nghĩa đ tính sai s chun trong trường hp này, bn ly 14
lch chun) chia cho căn bc hai ca 1000 (kích thước mu). Ta đưc
14/31,6 = 0,44 kg.
T hai kết qu trên, ta tính đưc gii hn sai s bng cách ly 1,96 x
0,44 = 0,86 (kg).
c 6. Ghi khong tin cy
Khong tin cy đưc ghi theo thc như sau: Giá tr trung bình ±
Gii hn sai s. Chng hn, bn ghi 81 ± 0,86 kg. T đây, bn th
tìm đưc gii hn trên gii hn i ca tham s như i đây:
Gii hn i = 81 - 0,86 = 80,14 (kg).
Gii hn trên = 81+ 0,86 = 81,86 (kg).
Mc thng - Ý nghĩa thng ( Statistical Significance)
Ý nghĩa thng mt kết lun cho rng kết qu t kim định
hoc th nghim không xy ra do ngu nhiên hay nh c, thay vào
đó do mt nguyên nhân c th.
Kết lun ý nghĩa thng rt quan trng trong c ngành hc
ph thuc nhiu vào vic phân tích d liu nghiên cu, d như
kinh tế, tài chính, đầu tư, y hc, vt sinh hc.
Ý nghĩa thng th mnh hoc yếu. Khi phân tích mt tp d
liu thc hin các th nghim cn thiết để phân bit xem mt
hoc nhiu biến nh ng đến kết qu hay không, ý nghĩa thng
mnh cho thy kết qu tht không phi do yếu t ngu
nhiên. Nói mt cách đơn gin, nếu mt thng ý nghĩa cao thì
đưc coi đáng tin cy hơn.
Mt s vn đề thưng phát sinh trong khi kim định ý nghĩa thng
do các nhà nghiên cu thường m vic vi các mu ca tng th
ch không trc tiếp kim định lên tng th. vy, các mu cn phi
đại din cho tng th, hay d liu cha trong mu không đưc sai
lch trong bt trưng hp nào.
Trong hu hết các ngành khoa hc, bao gm c kinh tế hc, ý nghĩa
thng mt kết lun đưc đưa ra mc 95% (hoc đôi khi
99%).
1. Đặc đim ca ý nghĩa thng
Vic tính toán ý nghĩa thng (kim định ý nghĩa) mt mc li
th phát sinh nht định. Nhà nghiên cu phi c định trước c
sut xy ra li khi ly mu, li này luôn luôn tn ti trong bt phép
th nào không phi thc hin lên toàn b tng th.
C mu mt thành phn quan để đưc kết lun ý nghĩa
thng hay không, trong đó các mu ln hơn ít khi cho ra kết qu
do ngu nhiên hơn. Ch nên s dng các mu đi din ngu nhiên
trong kim định ý nghĩa thng kê. Mc đ th chp nhn mt s
kin ý nghĩa thng hay không đưc gi mc ý nghĩa.
Các nhà nghiên cu s dng mt thông s thng đưc gi giá
tr p (p-value) để phân bit xem biến c nm i mc ý nghĩa
hay không; nếu có, kết qu ý nghĩa thng kê. P-value hàm ca
giá tr trung bình độ lch chun đưc t vic ly các mu d
liu.
P-value cho biết xác sut theo đó mt kết qu thng xy ra do
ngu nhiên hoc do li trong ly mu. Nói cách khác, p-value ch ra
ri ro khi không s khác bit hoc mi quan h nào trong thc tế.
P-value phi nm i mc ý nghĩa để các kết qu ý nghĩa thng
.
Ngược li vi mc ý nghĩa độ tin cy, độ tin cy đưc tính bng 1
tr đi mc ý nghĩa. cho thy mc độ tin cy rng kết qu thng
không xy ra do ngu nhiên hoc do li ly mu. Mc độ tin cy
thông thường trong kim định thng 95%, mc ý nghĩa
thông thường hay p-value 5%.
2. Mt s lưu ý
Ý nghĩa thng không phi lúc nào cũng ch ra ý nghĩa thc tế,
nghĩa kết qu không phi lúc nào cũng th đưc áp dng
cho các tình hung trong thế gii thc. Ngoài ra, ý nghĩa thng
th b hiu sai khi c nhà nghiên cu không s dng ngôn ng mt
cách cn thn trong báo cáo kết qu ca h. Bi mt kết qu ý
nghĩa thng không nghĩa không ngu nhiên, ch xác
sut ngu nhiên ca đã đưc gim đi nhiu.
Hai chui d liu mi tương quan cht ch vi nhau không
nghĩa quan h nhân qu. d, s ng phim nam din
viên Nicolas Cage đóng trong mt năm nht định mi tương quan
rt cao vi s v chết đui do tai nn trong b i. Nhưng mi tương
quan này không đúng không thuyết nào th gii thích
hai s vic trên.
Mt vn đ khác th phát sinh vi ý nghĩa thng d liu
trong quá kh kết qu t d liu đó cho ý nghĩa thng
hay không, cũng không chc chn s phn ánh các hin ng đang
din ra hoc trong tương lai.
Trong đầu tư, điu này th th hin trong mt hình định giá
không kết qu chính xác trong thi khng hong tài chính khi
các mi tương quan thay đổi các biến không tương tác vi nhau
như bình thường. Ý nghĩa thng cũng th giúp nhà đầu nhn
ra liu mt hình đnh g tài sn tt hơn hình khác hay
không.
| 1/5

Preview text:

Khoảng tin cậy
Trong thống kê, khoảng tin cậy (Confidence Invertal-CI) là thuật ngữ
chỉ một loại ước lượng khoảng, dùng để biển diễn xác suất tham số
tổng thể nằm giữa khoảng 2 giá trị.
CI được tính toán dựa trên số liệu thống kê của dữ liệu quan sát
được. Theo đó, khoảng tin cậy có thể bao hàm giá trị thực của tham
số quần thể chưa biết. Tuy vậy, khoảng tin cậy được không nhất
thiết phải bao gồm giá trị thực của tham số.
1. Các yếu tố ảnh hưởng đến CI
Trong xác suất thống kê bao giờ cũng sẽ có sai số, vậy các yếu tố
ảnh hưởng đến CI là gì ? Theo Jerzy Neyman, có 3 yếu tố tác động
đến độ rộng của khoảng tin cậy là : độ tin cậy, kích thước mẫu và độ
biến thiên của mẫu. Nghĩa là nếu độ tin cậy cao hơn sẽ có xu hướng
tạo ra khoảng tin cậy có độ rộng hơn. Hoặc 1 mẫu có kích thước lớn
hơn sẽ có xu hướng cho ra khoảng tin cậy tốt hơn về tham số quần thể. 2. Ứng dụng của CI
Các nhà thống kê sử dụng CI để đo lường độ chắc chắc hoặc độ
không chắc chắn. Khoảng tin cậy α% tính cho một tham số sẽ bao
gồm 2 số có xác suất từ 1-α. Người ta có thể nói rằng độ tin cậy α%
có giá trị chân thực nằm trong khoảng giữa 2 số đó.
Ví dụ : Từ cùng 1 tổng thể, ta chọn ngẫu nhiên ra 3 mẫu khác nhau
và tính khoảng tin cậy cho mỗi mẫu. Khi đó kết quả khoảng tin cậy
của mỗi mẫu là khác nhau dù cho 3 mẫu đều được lấy từ 1 tổng thể.
Giả sử mẫu 1 có khoảng tin cậy là 1-95%, ta nói : ‘Chúng ta chắc
chắc 95% rằng mẫu này có chứa tham số tổng thực tế’.
Khoảng tin cậy là một chỉ số giúp ta biết được tính chính xác của
phép đo. Ngoài ra, nó cũng cho biết độ ổn định khi ước lượng 1 giá
trị, tức là nhờ vào khoảng tin cậy, ta có thể biết được kết quả phép
đo lặp lại sẽ sai lệch thế nào so với ước tính ban đầu.
3. Hướng dẫn xác định Confidence Interval
Bước 1. Kiểm tra uớc đoán giá trị nghiên cứu
Giả sử bạn muốn nghiên cứu về cân nặng trung bình của sinh viên
nam ở trường XYZ và ước đoán giá trị này là 81 kg. Bạn cần kiểm tra
xem ước đoán của mình liệu có chính xác trong khoảng tin cậy cho trước hay không. Bước 2. Chọn mẫu
Chọn mẫu là quá trình thu thập số liệu ngẫu nhiên nhằm kiểm tra
giả thiết đã đặt ra. Chẳng hạn bạn có thể chọn ngẫu nhiên mẫu là
1000 sinh viên nam của trường XYZ.
Bước 3. Tính độ lệch chuẩn và giá trị trung bình của mẫu
Để tính giá trị trung bình của mẫu, bạn lấy trung bình cộng cân nặng
của 1000 sinh viên nam. Nghĩa là tính tổng cân nặng của 1000 sinh
viên nam đã chọn rồi đem chia cho 1000. Giả sử giá trị trung bình thu được là 81 kg.
Kế tiếp bạn tính độ lệch chuẩn của mẫu bằng cách: tìm giá trị trung
bình của bình phương sai lệch so với giá trị trung bình rồi lấy căn bậc
hai của giá trị thu được. Giả sử độ lệch chuẩn tính được là 14 kg.
Bước 4. Chọn khoảng tin cậy mong muốn
Chọn khoảng tin cậy mong muốn thường dựa trên Confidence
Interval phổ biến. Thế Confidence Interval thường dùng là gì? Thông
thường nhà nghiên cứu sẽ chọn các khoảng tin cậy là 90%, 95%
hoặc 99%. Chẳng hạn, trong trường hợp này bạn có thể xét Confidence Interval là 95%.
Bước 5. Tính giới hạn sai số
Giới hạn sai số được tính theo công thức:Hệ số tin cậy x Sai số chuẩn Trong đó:
Hệ số tin cậy = Khoảng tin cậy / 2
Ví dụ, trong bài toán nghiên cứu này, ta đang xét khoảng tin tin cậy
là 95%, chuyển sang số thập phân là 0,95. Như vậy hệ số tin cậy sẽ
tính bằng phép chia 0,95/2, ta được 0,475. Đối chiếu với bảngZ table
(bảng hệ số tin cậy), bạn sẽtìm được giá trị tương ứng gần nhất với 0,475 là 1,96.
Sai số chuẩn = độ lệch chuẩn / căn bậc hai của kích cỡ mẫu.
Nghĩa là để tính sai số chuẩn trong trường hợp này, bạn lấy 14 (độ
lệch chuẩn) chia cho căn bậc hai của 1000 (kích thước mẫu). Ta được 14/31,6 = 0,44 kg.
Từ hai kết quả trên, ta tính được giới hạn sai số bằng cách lấy 1,96 x 0,44 = 0,86 (kg).
Bước 6. Ghi khoảng tin cậy
Khoảng tin cậy được ghi theo mô thức như sau: Giá trị trung bình ±
Giới hạn sai số. Chẳng hạn, bạn ghi 81 ± 0,86 kg. Từ đây, bạn có thể
tìm được giới hạn trên và giới hạn dưới của tham số như dưới đây:
Giới hạn dưới = 81 - 0,86 = 80,14 (kg).
Giới hạn trên = 81+ 0,86 = 81,86 (kg).
Mức thống - Ý nghĩa thống ( Statistical Significance)
Ý nghĩa thống là một kết luận cho rằng kết quả từ kiểm định
hoặc thử nghiệm không xảy ra do ngẫu nhiên hay tình cờ, thay vào
đó là do một nguyên nhân cụ thể.
Kết luận ý nghĩa thống rất quan trọng trong các ngành học
phụ thuộc nhiều vào việc phân tích dữ liệu và nghiên cứu, ví dụ như
kinh tế, tài chính, đầu tư, y học, vật lí và sinh học.
Ý nghĩa thống kê có thể mạnh hoặc yếu. Khi phân tích một tập dữ
liệu và thực hiện các thử nghiệm cần thiết để phân biệt xem một
hoặc nhiều biến có ảnh hưởng đến kết quả hay không, ý nghĩa thống
kê mạnh cho thấy kết quả là thật và không phải do yếu tố ngẫu
nhiên. Nói một cách đơn giản, nếu một thống kê có ý nghĩa cao thì
nó được coi là đáng tin cậy hơn.
Một số vấn đề thường phát sinh trong khi kiểm định ý nghĩa thống
do các nhà nghiên cứu thường làm việc với các mẫu của tổng thể
chứ không trực tiếp kiểm định lên tổng thể. Vì vậy, các mẫu cần phải
đại diện cho tổng thể, hay dữ liệu chứa trong mẫu không được sai
lệch trong bất kì trường hợp nào.
Trong hầu hết các ngành khoa học, bao gồm cả kinh tế học, ý nghĩa
thống kê là một kết luận được đưa ra ở mức 95% (hoặc đôi khi là 99%).
1. Đặc điểm của ý nghĩa thống kê
Việc tính toán ý nghĩa thống (kiểm định ý nghĩa) có một mức lỗi
có thể phát sinh nhất định. Nhà nghiên cứu phải xác định trước xác
suất xảy ra lỗi khi lấy mẫu, lỗi này luôn luôn tồn tại trong bất kì phép
thử nào không phải thực hiện lên toàn bộ tổng thể.
Cỡ mẫu là một thành phần quan để có được kết luận có ý nghĩa
thống kê hay không, trong đó các mẫu lớn hơn ít khi cho ra kết quả
do ngẫu nhiên hơn. Chỉ nên sử dụng các mẫu đại diện ngẫu nhiên
trong kiểm định ý nghĩa thống kê. Mức độ có thể chấp nhận một sự
kiện có ý nghĩa thống kê hay không được gọi là mức ý nghĩa.
Các nhà nghiên cứu sử dụng một thông số thống kê được gọi là giá
trị p (p-value) để phân biệt xem biến cố có nằm dưới mức ý nghĩa
hay không; nếu có, kết quả có ý nghĩa thống kê. P-value là hàm của
giá trị trung bình và độ lệch chuẩn có được từ việc lấy các mẫu dữ liệu.
P-value cho biết xác suất mà theo đó một kết quả thống kê xảy ra do
ngẫu nhiên hoặc do lỗi trong lấy mẫu. Nói cách khác, p-value chỉ ra
rủi ro khi không có sự khác biệt hoặc mối quan hệ nào trong thực tế.
P-value phải nằm dưới mức ý nghĩa để các kết quả có ý nghĩa thống kê.
Ngược lại với mức ý nghĩa là độ tin cậy, độ tin cậy được tính bằng 1
trừ đi mức ý nghĩa. Nó cho thấy mức độ tin cậy rằng kết quả thống
kê không xảy ra do ngẫu nhiên hoặc do lỗi lấy mẫu. Mức độ tin cậy
thông thường trong kiểm định thống kê là 95%, và mức ý nghĩa
thông thường hay p-value là 5%. 2. Một số lưu ý
Ý nghĩa thống không phải lúc nào cũng chỉ ra ý nghĩa thực tế,
có nghĩa là kết quả không phải lúc nào cũng có thể được áp dụng
cho các tình huống trong thế giới thực. Ngoài ra, ý nghĩa thống kê có
thể bị hiểu sai khi các nhà nghiên cứu không sử dụng ngôn ngữ một
cách cẩn thận trong báo cáo kết quả của họ. Bởi vì một kết quả có ý
nghĩa thống kê không có nghĩa là nó không ngẫu nhiên, chỉ là xác
suất ngẫu nhiên của nó đã được giảm đi nhiều.
Hai chuỗi dữ liệu có mối tương quan chặt chẽ với nhau không có
nghĩa là nó có quan hệ nhân quả. Ví dụ, số lượng phim mà nam diễn
viên Nicolas Cage đóng trong một năm nhất định có mối tương quan
rất cao với số vụ chết đuối do tai nạn trong bể bơi. Nhưng mối tương
quan này là không đúng vì không có lí thuyết nào có thể giải thích hai sự việc trên.
Một vấn đề khác có thể phát sinh với ý nghĩa thống là dữ liệu
trong quá khứ và kết quả từ dữ liệu đó cho dù có ý nghĩa thống kê
hay không, cũng không chắc chắn sẽ phản ánh các hiện tượng đang
diễn ra hoặc trong tương lai.
Trong đầu tư, điều này có thể thể hiện trong một mô hình định giá
không có kết quả chính xác trong thời kì khủng hoảng tài chính khi
các mối tương quan thay đổi và các biến không tương tác với nhau
như bình thường. Ý nghĩa thống kê cũng có thể giúp nhà đầu tư nhận
ra liệu một mô hình định giá tài sản có tốt hơn mô hình khác hay không.