




Preview text:
lOMoAR cPSD| 45470709
Hướng Dẫn Ôn Tập Xác Suất Thống Kê Y Học
Tài liệu này cung cấp một bộ câu hỏi ôn tập, câu hỏi tự luận và bảng thuật ngữ chi tiết dựa trên
nội dung đề cương được cung cấp, nhằm củng cố kiến thức về các khái niệm cốt lõi trong xác
suất và thống kê y học.
Phần I: Câu Hỏi Ôn Tập (Trả Lời Ngắn)
Dưới đây là mười câu hỏi được thiết kế để kiểm tra sự hiểu biết về các khái niệm cơ bản. Hãy
trả lời mỗi câu hỏi trong khoảng 2-3 câu.
1. Phân biệt sự khác nhau cơ bản giữa biến định tính và biến định lượng.
Làm thế nào để có thể chuyển đổi một biến định tính sang định lượng?
2. Định nghĩa và phân biệt rõ ràng hai khái niệm "Tham số" (Parameter) và "Thống kê" (Statistic).
3. Nội dung chính của Định lý Giới hạn Trung tâm (Central Limit Theorem CLT) là gì và ứng
dụng quan trọng nhất của nó trong thống kê là gì?
4. Sai số chuẩn của trung bình (Standard Error of Mean - SE) là gì và nó có ý nghĩa như thế
nào trong việc ước lượng trung bình tổng thể?
5. Trong trường hợp nào ta sử dụng phân phối Student (t-distribution) thay vì phân phối
chuẩn tắc (z-distribution) để xây dựng khoảng tin cậy cho trung bình tổng thể µ?
6. Trình bày sự khác biệt cốt lõi về ý nghĩa diễn giải giữa Độ lệch chuẩn (Standard Deviation
- SD) và Sai số chuẩn (Standard Error of Mean - SE).
7. Nêu các bước và công thức cần thiết để xác định cỡ mẫu (n) cho bài toán ước lượng
trung bình tổng thể khi phương sai tổng thể (σ²) chưa được biết trước.
8. Trong thống kê mô tả, các thống kê nào thường được sử dụng để đo lường giá trị trung
tâm và sự phân tán của một biến định lượng?
9. Độ nhạy (Sensitivity) và Độ đặc hiệu (Specificity) của một xét nghiệm y học được định nghĩa như thế nào?
10. Giá trị tiên đoán dương (Positive Predictive Value) của một xét nghiệm cho biết điều gì?
--------------------------------------------------------------------------------
Phần II: Đáp Án Câu Hỏi Ôn Tập
1. Biến định tính được quyết định bởi dữ liệu mang tính phân loại (định danh, thứ bậc),
trong khi biến định lượng được quyết định bởi dữ liệu dạng số (rời rạc, liên tục). Có thể
chuyển đổi biến định tính sang định lượng bằng kỹ thuật tạo biến giả (dummy variable),
thường được dùng trong các mô hình hồi quy. lOMoAR cPSD| 45470709
2. Tham số là một giá trị tóm tắt của tổng thể (ví dụ: trung bình tổng thể µ, phương sai
tổng thể σ²). Thống kê là một giá trị tóm tắt dữ liệu từ mẫu (ví dụ: trung bình mẫu X̄, phương sai mẫu s²).
3. Định lý Giới hạn Trung tâm phát biểu rằng với cỡ mẫu (n) đủ lớn, phân phối của tổng các
biến ngẫu nhiên độc lập (hoặc trung bình mẫu) sẽ xấp xỉ phân phối chuẩn, bất kể phân
phối gốc của tổng thể là gì. Ứng dụng quan trọng là nó cho phép chúng ta sử dụng các
phương pháp dựa trên phân phối chuẩn để suy luận về trung bình tổng thể ngay cả khi
không biết phân phối của tổng thể đó.
4. Sai số chuẩn của trung bình (SE) được tính bằng công thức SE = SD / √n, trong đó SD là
độ lệch chuẩn mẫu và n là cỡ mẫu. Nó đo lường mức độ biến động của các trung bình
mẫu xung quanh trung bình của tổng thể (µ), và được dùng để ước lượng khoảng tin cậy cho µ.
5. Ta sử dụng phân phối Student để xây dựng khoảng tin cậy cho trung bình tổng thể µ khi
phương sai của tổng thể (σ²) không được biết trước. Trong trường hợp này, hằng số C
được tra từ bảng phân phối Student với (n-1) bậc tự do, thay vì từ bảng phân phối chuẩn tắc.
6. Độ lệch chuẩn (SD) mô tả sự phân tán của các giá trị dữ liệu riêng lẻ trong mẫu xung
quanh trung bình mẫu (X̄). Trong khi đó, Sai số chuẩn (SE) mô tả sự phân tán của các giá
trị trung bình mẫu có thể có xung quanh trung bình thật của tổng thể (µ).
7. Để tìm cỡ mẫu cho ước lượng trung bình khi σ² chưa biết, ta sử dụng công thức n ≥ (C² *
s²) / ε². Trong đó, s² là phương sai của một mẫu thăm dò, ε là sai số ước lượng tối đa cho
phép, và C thường được lấy xấp xỉ bằng zα/2 từ phân phối chuẩn.
8. Các thống kê thường dùng để đo lường giá trị trung tâm bao gồm trung bình (mean),
trung vị (median), và yếu vị (mode). Các thống kê để đo lường sự phân tán bao gồm
khoảng phân tán (range), phương sai (variance), độ lệch chuẩn (standard deviation), hệ
số biến thiên (CV), và khoảng tứ phân vị (interquartile range).
9. Độ nhạy là xác suất một xét nghiệm cho kết quả dương tính khi người được xét nghiệm
thực sự có bệnh. Độ đặc hiệu là xác suất một xét nghiệm cho kết quả âm tính khi người
được xét nghiệm thực sự không có bệnh.
10. Giá trị tiên đoán dương là xác suất một người thực sự mắc bệnh, biết rằng người đó có
kết quả xét nghiệm dương tính.
-------------------------------------------------------------------------------- lOMoAR cPSD| 45470709
Phần III: Câu Hỏi Tự Luận
Hãy soạn thảo câu trả lời chi tiết cho các câu hỏi sau để thể hiện sự hiểu biết sâu sắc về các chủ
đề. (Không cung cấp đáp án)
1. Trình bày một cách hệ thống về thống kê mô tả cho biến định tính và biến định lượng.
Đối với mỗi loại biến, hãy mô tả các phương pháp tổ chức số liệu, các thống kê thường
dùng và các loại biểu đồ phù hợp để trực quan hóa dữ liệu.
2. Giải thích cặn kẽ về Định lý Giới hạn Trung tâm (CLT). Thảo luận về các điều kiện của định
lý và tầm quan trọng của nó trong suy luận thống kê, đặc biệt khi phân phối của tổng thể
không phải là phân phối chuẩn.
3. Phân tích sự khác biệt về mặt ý nghĩa, công thức tính và ứng dụng giữa
Độ lệch chuẩn (Standard Deviation - SD) và Sai số chuẩn (Standard Error of Mean - SE).
Cho ví dụ minh họa về cách diễn giải khoảng tin cậy 95% được xây dựng bằng SD (mô tả
dữ liệu) và bằng SE (suy luận về tham số).
4. Trình bày quy trình và công thức xây dựng khoảng tin cậy cho trung bình tổng thể µ
trong hai kịch bản: (a) đã biết phương sai tổng thể σ² và (b) chưa biết phương sai tổng
thể σ². Thảo luận về các giả định cần thiết cho mỗi trường hợp và vai trò của cỡ mẫu.
5. So sánh và đối chiếu các phương pháp xác định cỡ mẫu cần thiết cho việc ước lượng
trung bình tổng thể và ước lượng tỉ lệ tổng thể. Thảo luận các yếu tố ảnh hưởng đến cỡ
mẫu (độ tin cậy, sai số mong muốn, phương sai/tỉ lệ dự kiến từ mẫu thăm dò) trong cả hai bài toán.
--------------------------------------------------------------------------------
Phần IV: Bảng Thuật Ngữ Thuật Ngữ Định Nghĩa và Ghi Chú Biến định tính
Loại biến có dữ liệu không phải dạng số, dùng để phân loại. Bao gồm (Qualitative
biến định danh và biến thứ bậc. Variable)
Biến định lượng
Loại biến có dữ liệu là dạng số, có thể thực hiện các phép toán. Bao (Quantitative
gồm biến rời rạc và biến liên tục. Variable) Biến định danh
Một loại biến định tính dùng để đặt tên, phân loại mà không có thứ (Nominal Variable)
tự hơn kém (ví dụ: nhóm máu). lOMoAR cPSD| 45470709 Biến thứ bậc
Một loại biến định tính có sự sắp xếp theo thứ tự, cấp bậc (ví dụ: (Ordinal Variable)
hàm lượng acid cao, bình thường, thấp). Biến giả (Dummy
Kỹ thuật chuyển đổi biến định tính sang biến định lượng, thường Variable)
dùng trong các mô hình hồi quy. Tổng thể
Toàn bộ tập hợp các đối tượng hoặc cá thể mà nhà nghiên cứu quan (Population) tâm. Mẫu (Sample)
Một tập hợp con được chọn ra từ tổng thể để tiến hành nghiên cứu. Tham số
Một đặc trưng số của tổng thể (ký hiệu: µ, σ, σ²). (Parameter)
Thống kê (Statistic)
Một đặc trưng số được tính toán từ dữ liệu mẫu (ký hiệu: X̄, S, S²).
Trung bình mẫu (Sample Thước đo giá trị trung tâm, được tính bằng tổng các giá trị trong Mean - X̄) mẫu chia cho cỡ mẫu.
Phương sai mẫu (Sample Thước đo sự phân tán của dữ liệu xung quanh trung Variance - s²) bình mẫu. Độ lệch chuẩn
Căn bậc hai của phương sai, cho biết mức độ biến động của dữ liệu (Standard
xung quanh trung tâm. Nó có cùng đơn vị với dữ liệu gốc. Deviation - SD) Sai số chuẩn
Độ lệch chuẩn của phân phối các trung bình mẫu, được tính bằng (Standard Error of
SD/√n. Nó phản ánh độ chính xác của trung bình mẫu khi dùng để Mean - SE)
ước lượng trung bình tổng thể.
Định lý Giới hạn Trung
Một định lý nền tảng cho rằng khi cỡ mẫu đủ lớn, phân phối của tâm (CLT)
trung bình mẫu sẽ xấp xỉ phân phối chuẩn, bất kể phân phối của tổng thể. lOMoAR cPSD| 45470709 Khoảng tin cậy
Một khoảng giá trị được ước tính từ dữ liệu mẫu, có khả năng chứa (Confidence
tham số tổng thể với một độ tin cậy nhất định (ví dụ: 95%). Interval)
Phân phối Student (t-
Một phân phối xác suất được sử dụng để suy luận về trung bình distribution)
tổng thể khi phương sai tổng thể không xác định và cỡ mẫu nhỏ. Phân phối chuẩn
Một phân phối xác suất liên tục có dạng hình chuông đối xứng, rất (Normal
phổ biến trong tự nhiên và thống kê. Distribution)
Phân phối chuẩn tắc
Một trường hợp đặc biệt của phân phối chuẩn với trung bình bằng 0 (Standard Normal) và phương sai bằng 1. Độ nhạy
Tỷ lệ những người thực sự có bệnh cho kết quả xét nghiệm dương (Sensitivity) tính.
Độ đặc hiệu (Specificity) Tỷ lệ những người thực sự không có bệnh cho kết quả xét nghiệm âm tính.
Giá trị tiên đoán
Xác suất một người có/không có bệnh dựa trên kết quả xét nghiệm (Predictive Value) dương tính/âm tính.