Lý thuyết môn Xác suất thống kê | Học viện Chính sách và Phát triển

Lý thuyết môn Xác suất thống kê | Học viện Chính sách và Phát triển được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

A. PHẦN XÁC SUẤT
1. Trong một nghiên cứu về việc trở thành nạn nhân của bạo lực đối với phụ nữ và
nam giới. Porcerelli và cộng sự. thu thập thông tin từ 679 phụ nữ và 345 nam giới
từ 18 đến 64 tuổi tại một số trung tâm thực hành gia đình ở khu vực đô thị Detroit.
Bệnh nhân điền vào bảng câu hỏi về lịch sử y tế bao gồm câu hỏi về nạn nhân hóa.
Bảng sau đây cho thấy các đối tượng mẫu được phân loại theo giới tính và loại nạn
nhân bạo lực được báo cáo. Các danh mục nạn nhân được định nghĩa là: không
phải nạn nhân, nạn nhân của người quen (và không phải của người khác), nạn
nhân của những người không thân thiết (thành viên gia đình, bạn bè hoặc người
lạ). và những người đã báo cáo nhiều nạn nhân.
Không phải là
nạn nhân
Người quen Không thân
thiết
Nạn nhân
khác
Total
Phụ nữ
Đàn ông
611
308
34
10
16
17
18
10
679
345
Tổng số
( Nguồn: Dữ liệu được cung cấp bởi John H. Porcerelli. Ph.D.. Rosemary Cogan.
Ph. D)
a) Giả sử chúng ta chọn đối tượng một cách ngẫu nhiên từ nhóm này. Xác suất để
đối tượng này là phụ nữ là bao nhiêu?
b) Giả sử chúng ta chọn ngẫu nhiên một người đàn ông. Biết thông tin này. Xác
suất anh ta bị bạo hành bởi những người không thân thiết là bao nhiêu?
2. Một cơ quan y tế quốc gia nhất định đã nhận được 25 đơn xin mở ngành y tá
công cộng. Trong số này có 10 ứng viên trên 30 tuổi và 15 người dưới 30. Mười
bảy người chỉ có bằng cử nhân và tám người có bằng thạc sĩ. Trong số những
người dưới 30 tuổi, sáu người có bằng thạc sĩ. Nếu một sự lựa chọn trong số 25
ứng viên này được thực hiện một cách ngẫu nhiên, thì khả năng một người trên 30
tuổi hoặc một người có bằng thạc sĩ sẽ được chọn là bao nhiêu?
B PHẦN THỒNG KÊ
Thống kê mô tả
1. Janardhan và cộng sự. đã tiến hành một nghiên cứu, trong đó họ đo lường các
chứng phình động mạch nội sọ ngẫu nhiên (IIAs) ở bệnh nhân. Các nhà nghiên cứu
đã kiểm tra các biến chứng sau phẫu thuật và kết luận rằng IIAs có thể được điều
trị một cách an toàn mà không gây tử vong và với tỷ lệ biến chứng thấp hơn so với
báo cáo trước đây. Sau đây là các kích thước (tính bằng milimét) của 159 IIAs
trong mẫu.
8.1 10.0 5.0 7.0 10.0 3.0
20.0 4.0 4.0 6.0 6.0 7.0
10.0 4.0 3.0 5.0 6.0 6.0
6.0 6.0 6.0 5.0 4.0 5.0
6.0 25.0 10.0 14.0 6.0 6.0
4.0 15.0 5.0 5.0 8.0 19.0
21.0 8.3 7.0 8.0 5.0 8.0
5.0 7.5 7.0 10.0 15.0 8.0
10.0 3.0 15.0 6.0 10.0 8.0
7.0 5.0 10.0 3.0 7.0 3.3
15.0 5.0 5.0 3.0 7.0 8.0
3.0 6.0 6.0 10.0 15.0 6.0
3.0 3.0 7.0 5.0 4.0 9.2
16.0 7.0 8.0 5.0 10.0 10.0
9.0 5.0 5.0 4.0 8.0 4.0
3.0 4.0 5.0 8.0 30.0 14.0
15.0 2.0 8.0 7.0 12.0 4.0
3.8 10.0 25.0 8.0 9.0 14.0
30.0 2.0 10.0 5.0 5.0 10.0
22.0 5.0 5.0 3.0 4.0 8.0
7.5 5.0 8.0 3.0 5.0 7.0
8.0 5.0 9.0 11.0 2.0 10.0
6.0 5.0 5.0 12.0 9.0 8.0
15.0 18.0 10.0 9.0 5.0 6.0
6.0 8.0 12.0 10.0 5.0
5.0 16.0 8.0 5.0 8.0
4.0 16.0 3.0 7.0 13.0
( Nguồn: Dữ liệu được cung cấp với cho phép của Vallabh Janardhan. M.D.)
a) Sử dụng tập dữ liệu này để chuẩn bị:
Phân bố tần số Phân phối tần số tương đối
Phân phối tần số tích lũy
Phân phối tần số tương đối tích lũy
Một biểu đồ và vẽ biểu đồ đó
b) (Sử dụng khoảng thời gian Lớp học) Nhóm dữ liệu bằng cách sử dụng công thức
của Sturges như sau
k= 1+3.322 (log )
t0
n
trong đó k là số khoảng lớp và n là số giá trị trong tập dữ liệu đang xem xét
Khoảng lớp phải có cùng độ rộng bằng cách áp dụng phương trình như sau
w=
trong đó phạm vi R là sự khác biệt giữa quan sát nhỏ nhất (giả sử. x ) và quan sát
(1)
lớn nhất (giả sử. x ) trong tập dữ liệu (tức là R = x - x )
(n) (n) (1)
Sử dụng dữ liệu được nhóm này để chuẩn bị:
Phân bố tần số Phân phối tần số tương đối
Phân phối tần số tích lũy
Phân bổ tần số tương đối tích lũy
Một biểu đồ và vẽ biểu đồ đó
Một đa giác tần suất và biểu đồ của nó.
2. Tính toán thống kê mẫu từ cả tập và nhóm dữ liệu ban đầu:
- Các ước số về xu hướng trung tâm ((mẫu) trung bình, trung vị, chế độ)
- Các ước số độ phân tán ((mẫu) Phạm vi, phương sai, độ lệch chuẩn, hệ số biến
thiên)
- Các ước số của các hành vi phân tán ((mẫu) lệch, kurtosis).
Suy diễn thống kê
3. (Khoảng tin cậy) Sử dụng tập và nhómdữ liệu ban đầu:
(a) Tìm khoảng tin cậy 95 % cho kích thước trung bình của động mạch bị phình
trong dân số.
(b) Sau đây là các kích thước (tính bằng milimét) của 159 IIAs trong một mẫu B.
và đối với mẫu đầu tiên A
10.0 7.0 6.0 7.0 10.0 5.0
16.0 4.0 5.0 6.0 8.0 7.0
11.0 7.0 5.0 5.0 6.0 4.0
8.0 6.0 4.0 5.0 4.0 3.0
10.0 25.0 10.0 8.0 6.0 5.0
3.0 15.0 6.0 5.0 8.0 19.0
20.0 8.3 6.0 9.0 5.0 12.0
4.0 7.5 7.0 12.0 15.0 9.0
10.0 5.0 15.0 4.0 9.0 6.0
15.0 5.0 8.0 3.0 7.0 5.3
11.0 5.0 8.0 6.0 7.0 6.0
5.0 6.0 6.0 8.0 15.0 10.0
10.0 5.0 8.0 4.0 7.0 3.0
5.0 4.0 5.0 6.0 30.0 20.0
12.0 2.0 4.0 7.0 11.0 6.0
9.0 3.0 10.0 5.0 4.0 30.0
20.0 5.0 5.0 22.0 4.0 8.0
7.5 5.0 8.0 3.0 5.0 6.0
12.0 5.0 5.0 12.0 9.0 7.0
10.0 18.0 10.0 9.0 5.0 7.0
Xây dựng khoảng tin cậy 90 % cho sự khác biệt giữa các trung bình dân số. Khi
phê duyệt, hãy nêu các giả định làm cho phương pháp của bạn hợp lệ.
4. (Thử nghiệm các giả thuyết) Chúng tôi muốn biết nếu.
(a) trên cơ sở tập dữ liệu A. chúng ta có thể kết luận rằng kích thước trung bình của
các động mạch bị phình lớn hơn 7,5 (milimét). Cho mức ý nghĩa a = 5%.
(b) Chúng ta có thể loại trừ những bệnh nhân mắc chứng IIAS trong (A) không.
trên trung bình. có kích thước động mạch bị phình cao hơn bệnh nhân ở (B)? Cho a
= 10%. Phân tích hồi quy tuyến tính.
Phân tích hồi quy tuyến tính
5. Reiss và cộng sự so sánh tại điểm chăm sóc và các xét nghiệm trong phòng thí
nghiệm tiêu chuẩn của bệnh viện để theo dõi bệnh nhân dùng một loại thuốc chống
đông máu đơn lẻ hoặc một phác đồ bao gồm sự kết hợp của thuốc chống đông
máu. Khá phổ biến khi so sánh hai kỹ thuật đo lường, sử dụng phân tích hồi quy,
trong đó một biến được sử dụng để dự đoán một biến khác. Trong nghiên cứu này,
các nhà nghiên cứu đã thu được các phép đo tỷ lệ chuẩn hóa quốc tế (INR) bằng
cách xét nghiệm các mẫu máu mao mạch và tĩnh mạch được thu thập từ 90 đối
tượng dùng warfarin. INR, được sử dụng đặc biệt khi nhận được bằng sáng chế
warfarin, hãy đo khả năng đông máu của máu. Thử nghiệm INR tại điểm chăm sóc
được thực hiện với sản phẩm xét nghiệm CoaguChek. Thử nghiệm tại bệnh viện
được thực hiện với các phòng thí nghiệm tiêu chuẩn của bệnh viện. Các tác giả đã
sử dụng mức INR trong xét nghiệm của bệnh viện đểMediet mức INR của
CoaguChek. Các phép đo được cho trong bảng sau.
CoaguChe Hospital CoaguChe Hospital CoaguChe Hospital
k (Y) (X) k (Y) (X) k (Y) (X)
1.8 1.6 2.4 2.4 1.2 3.1
1.6 1.9 2.3 2.3 2.3 1.7
2.5 2.8 2.0 2.0 1.6 1.8
1.9 2.4 3.3 3.3 3.8 1.9
1.3 1.5 1.9 1.9 1.6 5.3
2.3 1.8 1.8 1.8 1.5 1.6
1.2 1.3 2.8 2.8 1.8 1.6
2.3 2.4 2.5 2.5 1.5 3.3
2.0 2.1 0.8 0.8 1.0 1.5
1.5 1.5 1.3 1.3 1.2 2.2
2.1 2.4 3.7 3.7 1.4 1.1
1.5 1.5 2.4 2.4 1.6 2.6
1.5 1.7 4.1 4.1 3.2 6.4
1.8 2.1 2.4 2.4 1.2 1.5
1.0 1.2 2.3 2.3 2.3 3.0
2.1 1.9 3.1 3.1 1.6 2.6
1.6 1.6 1.5 1.5 1.4 1.2
1.7 1.6 3.6 3.6 2.1 2.1
2.0 1.9 2.5 2.5 1.7 1.1
1.8 1.6 2.1 2.1 1.7 1.0
1.3 4.1 1.8 1.8 1.2 1.4
1.5 1.9 1.5 1.5 1.3 1.7
3.6 2.1 2.5 2.5 1.1 1.2
2.4 2.2 1.5 1.5 1.2 2.5
2.2 2.3 1.5 1.5 1.1 1.2
2.7 2.2 1.6 1.6 1.2 2.5
2.9 3.1 1.4 1.4 1.4 1.9
2.0 2.2 4.0 4.0 2.3 1.8
1.0 1.2 2.0 2.0 1.2 1.2
2.4 2.6 2.5 2.5 1.5 1.3
(Nguồn: Dữ liệu được cung cấp với sự cho phép của Curtix E Haan. Pharm D.)
(a) Biểu đồ về mối quan hệ giữa hai biến bằng biểu đồ phân tán của dữ liệu. Tìm
hệ số tương quan.
(b) Tìm phương trình hồi quy lincar của Y trên X và vẽ đường thẳng này trên biểu
đồ phân tán.
(c) Thực hiện đánh giá phương trình hồi quy.
| 1/6

Preview text:

A. PHẦN XÁC SUẤT
1. Trong một nghiên cứu về việc trở thành nạn nhân của bạo lực đối với phụ nữ và
nam giới. Porcerelli và cộng sự. thu thập thông tin từ 679 phụ nữ và 345 nam giới
từ 18 đến 64 tuổi tại một số trung tâm thực hành gia đình ở khu vực đô thị Detroit.
Bệnh nhân điền vào bảng câu hỏi về lịch sử y tế bao gồm câu hỏi về nạn nhân hóa.
Bảng sau đây cho thấy các đối tượng mẫu được phân loại theo giới tính và loại nạn
nhân bạo lực được báo cáo. Các danh mục nạn nhân được định nghĩa là: không
phải nạn nhân, nạn nhân của người quen (và không phải của người khác), nạn
nhân của những người không thân thiết (thành viên gia đình, bạn bè hoặc người
lạ). và những người đã báo cáo nhiều nạn nhân. Không phải là Người quen Không thân Nạn nhân Total nạn nhân thiết khác Phụ nữ 611 34 16 18 679 Đàn ông 308 10 17 10 345 Tổng số
( Nguồn: Dữ liệu được cung cấp bởi John H. Porcerelli. Ph.D.. Rosemary Cogan. Ph. D)
a) Giả sử chúng ta chọn đối tượng một cách ngẫu nhiên từ nhóm này. Xác suất để
đối tượng này là phụ nữ là bao nhiêu?
b) Giả sử chúng ta chọn ngẫu nhiên một người đàn ông. Biết thông tin này. Xác
suất anh ta bị bạo hành bởi những người không thân thiết là bao nhiêu?
2. Một cơ quan y tế quốc gia nhất định đã nhận được 25 đơn xin mở ngành y tá
công cộng. Trong số này có 10 ứng viên trên 30 tuổi và 15 người dưới 30. Mười
bảy người chỉ có bằng cử nhân và tám người có bằng thạc sĩ. Trong số những
người dưới 30 tuổi, sáu người có bằng thạc sĩ. Nếu một sự lựa chọn trong số 25
ứng viên này được thực hiện một cách ngẫu nhiên, thì khả năng một người trên 30
tuổi hoặc một người có bằng thạc sĩ sẽ được chọn là bao nhiêu? B PHẦN THỒNG KÊ Thống kê mô tả
1. Janardhan và cộng sự. đã tiến hành một nghiên cứu, trong đó họ đo lường các
chứng phình động mạch nội sọ ngẫu nhiên (IIAs) ở bệnh nhân. Các nhà nghiên cứu
đã kiểm tra các biến chứng sau phẫu thuật và kết luận rằng IIAs có thể được điều
trị một cách an toàn mà không gây tử vong và với tỷ lệ biến chứng thấp hơn so với
báo cáo trước đây. Sau đây là các kích thước (tính bằng milimét) của 159 IIAs trong mẫu. 8.1 10.0 5.0 7.0 10.0 3.0 20.0 4.0 4.0 6.0 6.0 7.0 10.0 4.0 3.0 5.0 6.0 6.0 6.0 6.0 6.0 5.0 4.0 5.0 6.0 25.0 10.0 14.0 6.0 6.0 4.0 15.0 5.0 5.0 8.0 19.0 21.0 8.3 7.0 8.0 5.0 8.0 5.0 7.5 7.0 10.0 15.0 8.0 10.0 3.0 15.0 6.0 10.0 8.0 7.0 5.0 10.0 3.0 7.0 3.3 15.0 5.0 5.0 3.0 7.0 8.0 3.0 6.0 6.0 10.0 15.0 6.0 3.0 3.0 7.0 5.0 4.0 9.2 16.0 7.0 8.0 5.0 10.0 10.0 9.0 5.0 5.0 4.0 8.0 4.0 3.0 4.0 5.0 8.0 30.0 14.0 15.0 2.0 8.0 7.0 12.0 4.0 3.8 10.0 25.0 8.0 9.0 14.0 30.0 2.0 10.0 5.0 5.0 10.0 22.0 5.0 5.0 3.0 4.0 8.0 7.5 5.0 8.0 3.0 5.0 7.0 8.0 5.0 9.0 11.0 2.0 10.0 6.0 5.0 5.0 12.0 9.0 8.0 15.0 18.0 10.0 9.0 5.0 6.0 6.0 8.0 12.0 10.0 5.0 5.0 16.0 8.0 5.0 8.0 4.0 16.0 3.0 7.0 13.0
( Nguồn: Dữ liệu được cung cấp với cho phép của Vallabh Janardhan. M.D.)
a) Sử dụng tập dữ liệu này để chuẩn bị:
Phân bố tần số Phân phối tần số tương đối
Phân phối tần số tích lũy
Phân phối tần số tương đối tích lũy
Một biểu đồ và vẽ biểu đồ đó
b) (Sử dụng khoảng thời gian Lớp học) Nhóm dữ liệu bằng cách sử dụng công thức của Sturges như sau k= 1+3.322 (log n t0 )
trong đó k là số khoảng lớp và n là số giá trị trong tập dữ liệu đang xem xét
Khoảng lớp phải có cùng độ rộng bằng cách áp dụng phương trình như sau w=
trong đó phạm vi R là sự khác biệt giữa quan sát nhỏ nhất (giả sử. x (1)) và quan sát
lớn nhất (giả sử. x (n)) trong tập dữ liệu (tức là R = x (n) - x (1))
Sử dụng dữ liệu được nhóm này để chuẩn bị:
Phân bố tần số Phân phối tần số tương đối
Phân phối tần số tích lũy
Phân bổ tần số tương đối tích lũy
Một biểu đồ và vẽ biểu đồ đó
Một đa giác tần suất và biểu đồ của nó.
2. Tính toán thống kê mẫu từ cả tập và nhóm dữ liệu ban đầu:
- Các ước số về xu hướng trung tâm ((mẫu) trung bình, trung vị, chế độ)
- Các ước số độ phân tán ((mẫu) Phạm vi, phương sai, độ lệch chuẩn, hệ số biến thiên)
- Các ước số của các hành vi phân tán ((mẫu) lệch, kurtosis). Suy diễn thống kê
3. (Khoảng tin cậy) Sử dụng tập và nhómdữ liệu ban đầu:
(a) Tìm khoảng tin cậy 95 % cho kích thước trung bình của động mạch bị phình trong dân số.
(b) Sau đây là các kích thước (tính bằng milimét) của 159 IIAs trong một mẫu B.
và đối với mẫu đầu tiên A 10.0 7.0 6.0 7.0 10.0 5.0 16.0 4.0 5.0 6.0 8.0 7.0 11.0 7.0 5.0 5.0 6.0 4.0 8.0 6.0 4.0 5.0 4.0 3.0 10.0 25.0 10.0 8.0 6.0 5.0 3.0 15.0 6.0 5.0 8.0 19.0 20.0 8.3 6.0 9.0 5.0 12.0 4.0 7.5 7.0 12.0 15.0 9.0 10.0 5.0 15.0 4.0 9.0 6.0 15.0 5.0 8.0 3.0 7.0 5.3 11.0 5.0 8.0 6.0 7.0 6.0 5.0 6.0 6.0 8.0 15.0 10.0 10.0 5.0 8.0 4.0 7.0 3.0 5.0 4.0 5.0 6.0 30.0 20.0 12.0 2.0 4.0 7.0 11.0 6.0 9.0 3.0 10.0 5.0 4.0 30.0 20.0 5.0 5.0 22.0 4.0 8.0 7.5 5.0 8.0 3.0 5.0 6.0 12.0 5.0 5.0 12.0 9.0 7.0 10.0 18.0 10.0 9.0 5.0 7.0
Xây dựng khoảng tin cậy 90 % cho sự khác biệt giữa các trung bình dân số. Khi
phê duyệt, hãy nêu các giả định làm cho phương pháp của bạn hợp lệ.
4. (Thử nghiệm các giả thuyết) Chúng tôi muốn biết nếu.
(a) trên cơ sở tập dữ liệu A. chúng ta có thể kết luận rằng kích thước trung bình của
các động mạch bị phình lớn hơn 7,5 (milimét). Cho mức ý nghĩa a = 5%.
(b) Chúng ta có thể loại trừ những bệnh nhân mắc chứng IIAS trong (A) không.
trên trung bình. có kích thước động mạch bị phình cao hơn bệnh nhân ở (B)? Cho a
= 10%. Phân tích hồi quy tuyến tính.
Phân tích hồi quy tuyến tính
5. Reiss và cộng sự so sánh tại điểm chăm sóc và các xét nghiệm trong phòng thí
nghiệm tiêu chuẩn của bệnh viện để theo dõi bệnh nhân dùng một loại thuốc chống
đông máu đơn lẻ hoặc một phác đồ bao gồm sự kết hợp của thuốc chống đông
máu. Khá phổ biến khi so sánh hai kỹ thuật đo lường, sử dụng phân tích hồi quy,
trong đó một biến được sử dụng để dự đoán một biến khác. Trong nghiên cứu này,
các nhà nghiên cứu đã thu được các phép đo tỷ lệ chuẩn hóa quốc tế (INR) bằng
cách xét nghiệm các mẫu máu mao mạch và tĩnh mạch được thu thập từ 90 đối
tượng dùng warfarin. INR, được sử dụng đặc biệt khi nhận được bằng sáng chế
warfarin, hãy đo khả năng đông máu của máu. Thử nghiệm INR tại điểm chăm sóc
được thực hiện với sản phẩm xét nghiệm CoaguChek. Thử nghiệm tại bệnh viện
được thực hiện với các phòng thí nghiệm tiêu chuẩn của bệnh viện. Các tác giả đã
sử dụng mức INR trong xét nghiệm của bệnh viện đểMediet mức INR của
CoaguChek. Các phép đo được cho trong bảng sau. CoaguChe Hospital CoaguChe Hospital CoaguChe Hospital k (Y) (X) k (Y) (X) k (Y) (X) 1.8 1.6 2.4 2.4 1.2 3.1 1.6 1.9 2.3 2.3 2.3 1.7 2.5 2.8 2.0 2.0 1.6 1.8 1.9 2.4 3.3 3.3 3.8 1.9 1.3 1.5 1.9 1.9 1.6 5.3 2.3 1.8 1.8 1.8 1.5 1.6 1.2 1.3 2.8 2.8 1.8 1.6 2.3 2.4 2.5 2.5 1.5 3.3 2.0 2.1 0.8 0.8 1.0 1.5 1.5 1.5 1.3 1.3 1.2 2.2 2.1 2.4 3.7 3.7 1.4 1.1 1.5 1.5 2.4 2.4 1.6 2.6 1.5 1.7 4.1 4.1 3.2 6.4 1.8 2.1 2.4 2.4 1.2 1.5 1.0 1.2 2.3 2.3 2.3 3.0 2.1 1.9 3.1 3.1 1.6 2.6 1.6 1.6 1.5 1.5 1.4 1.2 1.7 1.6 3.6 3.6 2.1 2.1 2.0 1.9 2.5 2.5 1.7 1.1 1.8 1.6 2.1 2.1 1.7 1.0 1.3 4.1 1.8 1.8 1.2 1.4 1.5 1.9 1.5 1.5 1.3 1.7 3.6 2.1 2.5 2.5 1.1 1.2 2.4 2.2 1.5 1.5 1.2 2.5 2.2 2.3 1.5 1.5 1.1 1.2 2.7 2.2 1.6 1.6 1.2 2.5 2.9 3.1 1.4 1.4 1.4 1.9 2.0 2.2 4.0 4.0 2.3 1.8 1.0 1.2 2.0 2.0 1.2 1.2 2.4 2.6 2.5 2.5 1.5 1.3
(Nguồn: Dữ liệu được cung cấp với sự cho phép của Curtix E Haan. Pharm D.)
(a) Biểu đồ về mối quan hệ giữa hai biến bằng biểu đồ phân tán của dữ liệu. Tìm hệ số tương quan.
(b) Tìm phương trình hồi quy lincar của Y trên X và vẽ đường thẳng này trên biểu đồ phân tán.
(c) Thực hiện đánh giá phương trình hồi quy.