Suy rộng thống kê, phép (statistical inference)
?
1. Suy rộng thống gì?
Phép suy rộng thống (statistical inference) quá trình đi đến các kết luận
về tổng thể thống từ một mẫu các kết quả quan sát rút ra từ tổng thể đó.
Chẳng hạn 10.000 người Hà Nội đi nghỉ Cửa mỗi năm. Nếu phỏng
vấn 50 người về do họ đi nghỉ Cửa lò, chứ không phải nơi khác
25 người (50%) trả lời bãi tắm đây đẹp, chúng ta thể suy ra rằng trong
số 10.000 người Nội đi nghỉ Cửa Lò, 5000 người đến đó do bãi
tắm đẹp. Đây chỉ một ước lượng thống kê, thường gọi phép suy rộng
thống kê, chúng ta không thể nói chính xác 5000 người nghĩ như vậy
nếu không phỏng vấn cả 10.000 người. Tuy nhiên, chúng ta thể nói với độ
tin cậy nhất định (chẳng hạn bằng 95%) ràng con số suy rộng 5000 người
đúng với cả tổng thể.
ràng việc phỏng vấn tất cả mọi người vế do di nghỉ Cửa rất khó
khăn, tốn kém tiền của thời gian. Phương pháp điều tra chọn mẫu suy
rộng thống tạo điều kiện cho chúng ta giảm được những khó khăn chi
phí này. Xác suất để tổng thể (10.000 người) hành động giống mẫu điều tra
(50 người) thể được xác định bằng phương pháp kiểm định giả thuyết
thống kê.
Tóm lại thì suy rộng thống quá trình suy luận ra các đặc điểm của một
phân phối bản bằng việc phân tích dữ liệu. Phân tích thống suy luận
suy ra tính chất của tổng thế, điều y thì bao gồm cả các giả thuyết thử
nghiệm các ước tính phát sinh. Suy rộng thống giải thích ràng về một
tổng thể, sử dụng dữ liệu rút ra từ tổng thể thông qua hình thức lấy mẫu.
Như vậy suy rộng thống statistical inference quá trình đi đến các kết
luận về tổng thể thống từ một mẫu các kết quả quan sát rút ra từ tổng thể
đó. Tức rút ra kết luận về một tổng thể o đo thông qua kết quả quan sát
thông kê.
2. Một số hình thức phổ biến nhất của thống kê.
Dưới đây 05 hình thức phổ biến nhất của thống các bạn th biết
đến. C thể như sau:
- Thứ nhất: Ước lượng điểm, được hiểu một giá trị đặc biệt xấp xỉ một
thông số tầm quan trọng
- Thứ hai ước lượng khoảng thời gian, dụ n một khoảng tin cậy ( hoặc
khoảng ước lượng) một khoảng thời gian được xây dựng dựa trên một
tập hợp dữ liệu rút ra từ một thống kê, chịu tác động của mẫu lặp lại của một
bộ d liệu này. Như vậy khoảng thời gian đó sẽ chứa c giá trị tham số đúng
với xác suất tại mức độ tin cậy nhất định
- Thứ ba một khoảng thời gian đáng tin cậy, tức một tập hợp các giá trị
giới hạn, dụ như 95% của đ tin cậy.
- Thứ bác bỏ giả thuyết.
- Thứ năm nhóm hoặc phân tầng các dữ liệu thành các nhóm.
3. Các phương pháp luận trong thống
Phương pháp suy luận trong thống một trong những vấn đ được nhiều
người quan tâm, để thể đưa ra những kết luận phân tích đúng đắn thì dĩ
nhiên chúng ta phải sử dụng những phương pháp suy luận. Hiện nay thì
rất nhiều những phương pháp luận khác nhau, như phương pháp suy luận
mẫu lặp, suy luận bayes, suy luận dựa theo AIC, suy luận sở so sánh
suy luận cấu trúc...Để thể hiểu hơn những phương pháp suy luận này
thì chúng tôi đã đưa ra những đặc điểm bản về từng phương pháp suy
luận này, các bạn thể tham khảo dưới đây.
Suy luận phương pháp mẫu lặp:
hình này hiệu chỉnh việc sản xuất các mệnh đề bằng cách xem xét lặp lại
việc lấy mẫu của bộ dữ liệu tương tự n một phương thức. Bằng cách xem
xét các đặc điểm của mẫu theo mẫu lặp lại. Suy luận hình, khách quan
thuyết quyết định. hình suy luận chỉ được áp dụng trong các dạng
của tần số xác suất, tức các dạng lấy mẫu lặp lại một tổng thể. Cách tiếp
cạn của Neyman phát triển một thủ tục dưới dạng xác suất th nghiệm trước,
khi thực hiện một thử nghiệm một quyết định về một quy tắc cho đến một kết
luận như vậy là xác suất đúng được kiểm soát một cách hợp lý, một c suất
như vậy không cần phải hình hoặc giải thích mẫu lặp lại. Ngược lại với
Neyman thì Bayesian lại hoạt động dưới dạng xác suất điều kiện, nghĩa
xác suất điều kiện dựa trên dữ liệu quan sát. Các hình thủ tục thử
nghiệm ý nghĩa khoảng tin cậy thể được xây dựng không liên
quan đến chức năng tiện ích.
Suy luận Bayes:
Cách tính toán của Bayesian tả mức đ tin cậy bằng cách đó sử dụng
ngôn ngữ của xác suất, độ tin cậy này thể chấp nhận được. Suy luận của
Bayse sử dụng khoảng tin cậy phía sau sẵn n sở cho việc thực
hiện mệnh đề thống kê.
Suy luận của bayes được hiệu chỉnh với tham chiếu đến một tiện ích được
nêu một cách ràng, hoặc hàm dự kiến. Hình thức suy luận Bayseian tự
động cung cấp các quyết định tối ưu trong một ý nghĩa thuyết quyết định.
Suy luận Bayesian thể được thực hiện cho bất kỳ vấn đ bản, mặc
không phải tất cả thống cần một giải thích Bayessian. Một số những
người ủng hộ suy luận Bayes khẳng định suy luận phải trong phạm vi
thuyết quyết định, rằng suy luận Bayesian không nên kết luận với việc
đánh giá, tổng hợp của độ tin cậy hậu nghiệm.
Suy luận dựa theo AIC:
AIC về bản một thước đo ước tính về chất lượng của mỗi hình kinh
tế sẵn khi chúng liên quan đến nhau cho một tập hợp dữ liệu nhất định,
làm cho trở thành một phương pháp tưởng để lựa chọn hình. Khi
sử dụng AIC để đo lường chất lượng tương đối của c hình kinh tế cho
một tập dữ liệu nhất định, AIC cung cấp cho nhà nghiên cứu một ước tính về
thông tin sẽ bị mất nếu một hình cụ thể được sử dụng để hiển thị quá
trình tạo dữ liệu.
Suy luận sở so sánh:
sở so sánh suy luận một phương pháp tiếp cận c kết luận thống
dựa trên xác suất chuẩn còn gọi phân phối sở so sánh. Phương pháp
này còn được gọi xác định tính tất yếu, rất hạn chế trong các ứng dụng
thậm chí sai lầm.
Suy luận cấu trúc:
Barnard phát triển suy luận cấu trúc dựa trên sự phát triển ý tưởng của
Fissher Pitman. Barnard đã trình bày lại lẽ sau suy luận chuẩn trên một
lớp hạn chế của hình những thủ tục sở so sánh sẽ được xác định
ràng hữu ích.

Preview text:

Suy rộng thống kê, phép (statistical inference) là gì ?
1. Suy rộng thống kê là gì?
Phép suy rộng thống kê (statistical inference) là quá trình đi đến các kết luận
về tổng thể thống kê từ một mẫu các kết quả quan sát rút ra từ tổng thể đó.
Chẳng hạn có 10.000 người Hà Nội đi nghỉ ở Cửa Lò mỗi năm. Nếu phỏng
vấn 50 người về lý do họ đi nghỉ ở Cửa lò, chứ không phải ở nơi khác và có
25 người (50%) trả lời vì bãi tắm ở đây đẹp, chúng ta có thể suy ra rằng trong
số 10.000 người Hà Nội đi nghỉ ở Cửa Lò, có 5000 người đến đó vì lý do bãi
tắm đẹp. Đây chỉ là một ước lượng thống kê, thường gọi là phép suy rộng
thống kê, vì chúng ta không thể nói chính xác là có 5000 người nghĩ như vậy
nếu không phỏng vấn cả 10.000 người. Tuy nhiên, chúng ta có thể nói với độ
tin cậy nhất định (chẳng hạn bằng 95%) ràng con số suy rộng 5000 người
đúng với cả tổng thể.
Rõ ràng việc phỏng vấn tất cả mọi người vế lý do di nghỉ ở Cửa Lò rất khó
khăn, tốn kém tiền của và thời gian. Phương pháp điều tra chọn mẫu và suy
rộng thống kê tạo điều kiện cho chúng ta giảm được những khó khăn và chi
phí này. Xác suất để tổng thể (10.000 người) hành động giống mẫu điều tra
(50 người) có thể được xác định bằng phương pháp kiểm định giả thuyết thống kê.
Tóm lại thì suy rộng thống kê là quá trình suy luận ra các đặc điểm của một
phân phối cơ bản bằng việc phân tích dữ liệu. Phân tích thống kê suy luận
suy ra tính chất của tổng thế, điều này thì bao gồm cả các giả thuyết thử
nghiệm và các ước tính phát sinh. Suy rộng thống kê giải thích rõ ràng về một
tổng thể, sử dụng dữ liệu rút ra từ tổng thể thông qua hình thức lấy mẫu.
Như vậy suy rộng thống kê statistical inference là quá trình đi đến các kết
luận về tổng thể thống kê từ một mẫu các kết quả quan sát rút ra từ tổng thể
đó. Tức là rút ra kết luận về một tổng thể nào đo thông qua kết quả quan sát và thông kê.
2. Một số hình thức phổ biến nhất của thống kê.
Dưới đây là 05 hình thức phổ biến nhất của thống kê mà các bạn có thể biết đến. Cụ thể như sau:
- Thứ nhất: Ước lượng điểm, được hiểu là một giá trị đặc biệt xấp xỉ một
thông số có tầm quan trọng
- Thứ hai là ước lượng khoảng thời gian, ví dụ như một khoảng tin cậy ( hoặc
khoảng ước lượng) là một khoảng thời gian được xây dựng mà dựa trên một
tập hợp dữ liệu rút ra từ một thống kê, chịu tác động của mẫu lặp lại của một
bộ dữ liệu này. Như vậy khoảng thời gian đó sẽ chứa các giá trị tham số đúng
với xác suất tại mức độ tin cậy nhất định
- Thứ ba là một khoảng thời gian đáng tin cậy, tức là một tập hợp các giá trị
có giới hạn, ví dụ như là 95% của độ tin cậy.
- Thứ tư là bác bỏ giả thuyết.
- Thứ năm là nhóm hoặc phân tầng các dữ liệu thành các nhóm.
3. Các phương pháp luận trong thống kê
Phương pháp suy luận trong thống kê là một trong những vấn đề được nhiều
người quan tâm, để có thể đưa ra những kết luận phân tích đúng đắn thì dĩ
nhiên chúng ta phải sử dụng những phương pháp suy luận. Hiện nay thì có
rất nhiều những phương pháp luận khác nhau, như là phương pháp suy luận
mẫu lặp, suy luận bayes, suy luận dựa theo AIC, suy luận cơ sở so sánh và
suy luận cấu trúc...Để có thể hiểu rõ hơn những phương pháp suy luận này
thì chúng tôi đã đưa ra những đặc điểm cơ bản về từng phương pháp suy
luận này, các bạn có thể tham khảo dưới đây.
Suy luận phương pháp mẫu lặp:
Mô hình này hiệu chỉnh việc sản xuất các mệnh đề bằng cách xem xét lặp lại
việc lấy mẫu của bộ dữ liệu tương tự như một phương thức. Bằng cách xem
xét các đặc điểm của mẫu theo mẫu lặp lại. Suy luận mô hình, khách quan và
lý thuyết quyết định. Mô hình suy luận là nó chỉ được áp dụng trong các dạng
của tần số xác suất, tức là các dạng lấy mẫu lặp lại một tổng thể. Cách tiếp
cạn của Neyman phát triển một thủ tục dưới dạng xác suất thử nghiệm trước,
khi thực hiện một thử nghiệm một quyết định về một quy tắc cho đến một kết
luận như vậy là xác suất đúng được kiểm soát một cách hợp lý, một xác suất
như vậy không cần phải có mô hình hoặc giải thích mẫu lặp lại. Ngược lại với
Neyman thì Bayesian lại hoạt động dưới dạng xác suất có điều kiện, có nghĩa
là xác suất có điều kiện dựa trên dữ liệu quan sát. Các mô hình thủ tục thử
nghiệm có ý nghĩa và khoảng tin cậy có thể được xây dựng mà không liên
quan đến chức năng tiện ích. Suy luận Bayes:
Cách tính toán của Bayesian mô tả mức độ tin cậy bằng cách đó là sử dụng
ngôn ngữ của xác suất, độ tin cậy này có thể chấp nhận được. Suy luận của
Bayse sử dụng khoảng tin cậy ở phía sau có sẵn như là cơ sở cho việc thực
hiện mệnh đề thống kê.
Suy luận của bayes được hiệu chỉnh với tham chiếu đến một tiện ích được
nêu một cách rõ ràng, hoặc hàm dự kiến. Hình thức suy luận Bayseian tự
động cung cấp các quyết định tối ưu trong một ý nghĩa lý thuyết quyết định.
Suy luận Bayesian có thể được thực hiện cho bất kỳ vấn đề cơ bản, mặc dù
không phải tất cả thống kê cần có một giải thích Bayessian. Một số những
người ủng hộ suy luận Bayes khẳng định suy luận phải trong phạm vi lý
thuyết quyết định, và rằng suy luận Bayesian không nên kết luận với việc
đánh giá, tổng hợp của độ tin cậy hậu nghiệm.
Suy luận dựa theo AIC:
AIC về cơ bản là một thước đo ước tính về chất lượng của mỗi mô hình kinh
tế có sẵn khi chúng liên quan đến nhau cho một tập hợp dữ liệu nhất định,
làm cho nó trở thành một phương pháp lý tưởng để lựa chọn mô hình. Khi
sử dụng AIC để đo lường chất lượng tương đối của các mô hình kinh tế cho
một tập dữ liệu nhất định, AIC cung cấp cho nhà nghiên cứu một ước tính về
thông tin sẽ bị mất nếu một mô hình cụ thể được sử dụng để hiển thị quá trình tạo dữ liệu.
Suy luận cơ sở so sánh:
Cơ sở so sánh suy luận là một phương pháp tiếp cận các kết luận thống kê
dựa trên xác suất chuẩn còn gọi là phân phối cơ sở so sánh. Phương pháp
này còn được gọi là xác định tính tất yếu, rất hạn chế trong các ứng dụng và thậm chí là sai lầm. Suy luận cấu trúc:
Barnard phát triển suy luận cấu trúc dựa trên sự phát triển ý tưởng của
Fissher và Pitman. Barnard đã trình bày lại lý lẽ sau suy luận chuẩn trên một
lớp hạn chế của mô hình mà những thủ tục cơ sở so sánh sẽ được xác định rõ ràng và hữu ích.
Document Outline

  • Suy rộng thống kê, phép (statistical inference) là
    • 1. Suy rộng thống kê là gì?
    • 2. Một số hình thức phổ biến nhất của thống kê.
    • 3. Các phương pháp luận trong thống kê