











Preview text:
lOMoAR cPSD| 59735516 )
1. Loại dữ liệu nhà nghiên cứu thu thập trực tiếp từ khảo sát của họ là dạng dữ liệu
a. Dữ liệu định lượng b. Dữ liệu định tính c. Dữ liệu sơ cấp d. Dữ liệu thứ cấp
2. Hình thức lẫy mẫu nào dưới đây là hình thức lấy mẫu phi xác suất
a. Lấy mẫu ngẫu nhiên giản b. Lấy mẫu phân tầng đơn
c. Lấy mẫu mạng quan hệ d. Lấy mẫu chùm
3. Những tham số nào sau đây phản ánh sự thay đổi của về ước tính của giá trị trung bình mẫu
a. Trung bình b. Độ lệch chuẩn mẫu mẫu c. Sai số chuẩn d. Mode
4. Quy tắc 2 sigma được hiểu là
a. Xấp xỉ 58% dữ liệu nằm trong vùng trung
b. Xấp xỉ 68% dữ liệu nằm trong vùng trung
bình +/- 2 độ lệch chuẩn
bình +/- 2 độ lệch chuẩn
c. Xấp xỉ 78% dữ liệu nằm trong vùng trung
d. Xấp xỉ 95% dữ liệu nằm trong vùng trung
bình +/- 2 độ lệch chuẩn
bình +/- 2 độ lệch chuẩn
5. Cho giá trị x =50, độ lệch chuẩn =5, trung bình =46. Giá trị chuẩn hoá của x là bao nhiêu? a. 1.02 b. 0.8 c. -1.02 d. -0.8
6. Giả định cho hiệp phương sai của xy=3; độ lệch chuẩn của x=1.4; độ lệch chuẩn của y=2.4.
Hỏi hệ số tương quan của xy là bao nhêu? a. 1.89 b. 0.89 c. -1.89 d. -0.89
7.dữ liệu sơ cấp là…
a. Các dữ liệu thu thập cho các mục đích
b. Dữ liệu được thu thập trước các dữ liệu thứ
khác nhau của nhà nghiên cứu cấp
c. Dữ liệu có sẵn từ các cơ quan thống kê,
d. Dữ liệu được thu thập cho một mục đích rõ các tổ chức
ràng, cụ thể của nghiên cứu
8. Hình thức lẫy mẫu nào dưới đây là hình thức lấy mẫu xác suất
a. Lấy mẫu mạng quan hệ b. Lấy mẫu thuận tiện
c. Lấy mẫu ngẫu nhiên giản d. Lấy mẫu phán đoán đơn
9. Tham số thống kê nào phản ánh sự thay đổi/biến động của dữ liệu lOMoAR cPSD| 59735516 a. Trung bình
b. Độ lệch chuẩn c. Trung vị d. Mode
10. Giá trị bất thường (outlier) của mộ biến được định nghĩa là giá trị thuộc các vùng giá trị
a. Nằm ngoài vùng trung bình +/- 3 lần độ lệch chuẩn
b. Nằm ngoài vùng trung bình +/- 2 lần độ lệch chuẩn
c. Nằm trong vùng từ trung bình + 2 lần độ lệch chuẩn
d. Nằm ngoài vùng trung bình +/- 4
đến + 3 lần độ lệch chuẩn lần độ lệch chuẩn
11. Cho giá trị x =42, độ lệch chuẩn =3, trung bình =40. Giá trị chuẩn hoá của x là bao nhiêu? a. b. 0.4 0.66 c. -0.4
d. Cả 3 phương án đều sai
12. Giả định cho hiệp phương sai của xy=13; độ lệch chuẩn của x=4; độ lệch chuẩn của y=5. Hỏi
hệ số tương quan của xy là bao nhêu? a. b. 0.76 1.88 c. d. -0.67 0.65
13. Dữ liệu được thu thập các tổ chức cung cấp dữ liệu như Tổng cục thống kê, World Bank, IMF… được gọi là …
a. Dữ liệu định lượng b. Dữ liệu định tính c. Dữ liệu sơ cấp
d. Dữ liệu thứ cấp
14. Doanh nghiệp sản xuất cần đánh giá tính ổn định của hệ thống sản xuất, họ phải sử dụng
tham số thống kê nào cho kết quả đầu ra của quá trình sản xuất a. Trung bình b. Trung vị
c. Độ lệch d. Mode chuẩn
15. Quy tắc 3 sigma được hiểu là
a. Xấp xỉ 69.7% dữ liệu nằm trong vùng
b. Xấp xỉ 79.7% dữ liệu nằm trong vùng trung
trung bình +/- 3 độ lệch chuẩn
bình +/- 3 độ lệch chuẩn
c. Xấp xỉ 89.7% dữ liệu nằm trong vùng
d. Xấp xỉ 99.7% dữ liệu nằm trong vùng
trung bình +/- 3 độ lệch chuẩn
trung bình +/- 3 độ lệch chuẩn
16. Hình dáng của đường cong phân phối chuẩn (rộng, hẹp) phụ thuộc vào tham số nào sau đây a. Trung bình
b. Độ lệch chuẩn c. Hệ số biến d. Sai số chuẩn thiên lOMoAR cPSD| 59735516
17. Cho giá trị x =42, độ lệch chuẩn =3, trung bình =38. Giá trị chuẩn hoá của x là bao nhiêu? a. 0.66 b. 0.4 c. 1.33
d. Cả 3 phương án đều sai
18. Giả định cho hiệp phương sai của xy=13; độ lệch chuẩn của x=5; độ lệch chuẩn của y=6. Hỏi
hệ số tương quan của xy là bao nhêu? a. 1.88 b. 0.76 c. 0.65 d. 0.433
19. Dữ liệu được thu thập các tổ chức cung cấp dữ liệu như Tổng cục thống kê, World Bank, IMF… được gọi là …
a. Dữ liệu định lượng b. Dữ liệu định tính c. Dữ liệu sơ cấp
d. Dữ liệu thứ cấp
20. Hình thức lẫy mẫu nào dưới đây KHÔNG phải là hình thức lấy mẫu xác suất
a. Lấy mẫu ngẫu nhiên giản b. Lấy mẫu phân tầng đơn
c. Lấy mẫu mạng quan hệ d. Lấy mẫu chùm
21. Doanh nghiệp sản xuất cần đánh giá tính ổn định của hệ thống sản xuất, họ phải sử dụng
tham số thống kê nào cho kết quả đầu ra của quá trình sản xuất a. Trung bình b. Trung vị
c. Độ lệch d. Mode chuẩn
22. Hình dáng của đường cong phân phối chuẩn (rộng, hẹp) phụ thuộc vào tham số nào sau đây a. Trung bình
b. Độ lệch chuẩn c. Hệ số biến d. Sai số chuẩn thiên
23. Cho giá trị x =42, độ lệch chuẩn =5, trung bình =40. Giá trị chuẩn hoá của x là bao nhiêu? a. 1.4 b. 0.4 c. -0.4
d. Cả 3 phương án đều sai
24. Giả định cho hiệp phương sai của xy=13; độ lệch chuẩn của x=3.4; độ lệch chuẩn của y=5.
Hỏi hệ số tương quan của xy là bao nhêu? a. 1.88 b. 0.76 c. -1.88 d. -0.67
25. Dự liệu sơ cấp là…
a. Các dữ liệu thu thập cho các mục b. Dữ liệu được thu thập trước các dữ liệu thứ cấp đích khác nhau lOMoAR cPSD| 59735516
c. Dữ liệu có sẵn từ các cơ quan thống
d. Dữ liệu được thu thập cho một mục đích ro ràng, kê, các tổ chức
cụ thể của nghiên cứu
26. Hình thức lấy mẫu nào dưới đây là hình thức lấy mẫu xác suất
a. Lấy mẫu mạng quan hệ b. Lấy mẫu thuận tiện
b. Lấy mẫu ngẫu nhiên giản đơn d. Lấy mẫu phán đoán
27. Tham số thống kê nào phản ánh sự thay đổi/biến động của dử liệu a. Trung
b. Độ lệch chuẩn bình c. Trung vị d. Mode
28. Mức ý nghĩa α trong thống kê liên quan đến. a. Sai lầm loại I b. Sai lầm loại II
b. Sau số hệ d. Sai số lấy mẫu thống
29. Một kiếm định giả thuyết H0: p=0,2 Ha≠ 0,2, một mẫu 400 quan sát có tỷ lệ mẫu là 0,175.
Giá trị thống t kiểm định cho kiểm định giả thuyết này bằng bao nhiêu. a. b.-10,9 10,9 c. d. -1,09 1.09 Bài 01
Trong ngành y tại đức người ta nhận hấy mức thu nhập trung bình của nhân viên nam cao
hơn ngân viên viên nữ . cụ thể , mức lương trung bình của nam là 67.000Euro/năm và
của nữa là 65.000Euro/năm. Giá sử tiền lương có phân phối chuẩn và độ lệch chuẩn là 7xyz
Euro (xyz là 3 số cuối trong mã sinh viên của bạn)
A, có bao nhiêu % nhân viên y tế nam có thu nhập lớn hơn 75.000euro/năm ?(0.5đ)
B, có bao nhiêu % nhân viên y tế nữ có thu nhập dưới 55.000Euro/năm?
C, có bao nhiêu % nhân viên y tế nữ có thu nhập từ 55.000 đến 65.000Euro/năm? D,
Một nhân viên y tế nam phải có thu nhập là bao nhiêu để có thể cao hơn 99% đồng nghiệp nữ của mình ?
Msv:20010262 ta có xyz=262 nên ta có độ lệch chuẩn = 7262
A, tỷ lệ nhân viên y tế nam có thu nhập lớn hơn 75.000Euro/năm là p(xnam> 75.000)=? lOMoAR cPSD| 59735516
Z=(x-xtbnam )/độ lệch chuẩn = (75000-67000)/7262 = 1.102 ~ 1.1
Tra bảng chuẩn hoá với z = 1.1 ta có p = 0.8438
Suy ra P(xnam> 75000) = 1-0.8438 = 0.1562
Suy ra tỷ lệ nhân viên y tế nam có thu nhập lớn hơn 75000Euro/năm là 15.62%
B, Tỷ lệ nhân viên y tế nữ có thu nhập dưới 55000euro/năm p(x nữ <55000 )
Z=(x-xtb nữ )/độ lệch chuẩn = (55000-65000)/7262 = -1.377 ~ -1.38
Tra bảng chuẩn hoá với z = -1.38 ta có p = 0.0838
Suy ra P(x nữ< 55000) = 0.0838
Suy ra tỷ lệ nhân viên y tế nữ có thu nhập dưới 55000Euro/năm là 8.38%
C, P (55000< x nữ < 65000) = ? X = 55000 suy ra p = 0.0838
X = 65000 suy ra z= ( x-xtb nữ )/ độ lệch chuẩn = (65000-65000)/7262 = 0
Tra bảng chuẩn hoá với z = 0 ta có p=0.5
Suy ra P ( 55000< x nữ < 65000) = 0.5 – 0.0838 = 0.4162 vậy tỷ lệ nhân
viên y tế có thu nhập từ 55000 đến 65000euro/năm là 41.62%
d nhân viên y tế nam phải có thu nhập bao nhiêu để cao hơn 99% nhân vieen y tế nữ
P(xTra bảng chuẩn hoá với p = 0.99 ta có z = 2.33
Mà z = (x-xtb nữ )/độ lệch chuẩn = (x-65000)/7262 = 2.33 Suy ra x = 81920.46
Như vậy , một nhân viên y tế nam phải có thu nhập ít nhất 81920.46Euro/năm để cao hơn 99% nhân viên nữ Bài 02
Trong một ngành công nghiệp người ta theo dõi sự liên quan giữa số lao động và sản lượng sản
xuất cho bởi bảng như sau : stt số lao động số lượng sản xuất 1 31 321 2 35 359 3 38 379 4 42 430 5 47 488 6 51 527 7 53 549 8 56 572 9 xy Xyz lOMoAR cPSD| 59735516
Ghi chú : xyz là ba số cuối của mã sinh viên trong trường hợp x=0 thì thay bằng lại bằng giá trị 1
A,tính trung bình độ lệch chuẩn của số lao động và sản lượng sản xuất trong ngành cho mỗi doanh nghiệp
B,tính hiệp phương sai và hệ số tương quan giữa số lao động và sản lượng sản xuất
C, giả sử quan hệ giữa sản lượng sản xuất và số lao động kaf một hàm tuyến tính có dạng
Y = beta0+ beta1X hãy tính hệ số bât 0,beta1 viết phương trình hồi quy mẫu và giải thích ý nghĩa của nó Xy=26, xyz= 262
gọi số lao động là xi, sản lượng sản xuất là yi
a, trung bình số lao động = tổng số lao động /n = xtb= 379/9 = 42.111
trung bình số sản lượng sản xuất = tổng số sản lượng sản xuất /n = ytb= 3887/9 = 431.889
độ lệch chuẩn = s(x) =[tổng ( xi-xtb)^2/ (n-1)]^0.5 = (864.889/8)^0.5=10.398
độ lệch chuẩn = s(y) =[tổng ( yi-ytb)^2/ (n-1)]^0.5 =(94812.889/8)^0.5=108.886
b, hiệp phương sai = sxy = [tổng(xi-xtb)*(yi-ytb)]/(n-1)=9064.111/8=1130.764 hệ
số tương quan = rxy=sxy/sx*sy ) = 1130.764/(10.398*108.865) = 0.999
c, quan hệ giữa sản lượng sản xuất và số lao động là hàm tuyến tính có dạng Y = beta0 +beta1*X
với Y là sản lượng sản xuất X là số lao động
Suy ra beta1 = [tổng(Xi-Xtb)*(Y-Ytb)]/[tổng (Xi-Xtb)^2] = 9046.111/864.889=10.459
Suy ra beta0 = Ytb – beta1*Xtb = 431.889 – 10.459*42.111 = -8.55
Ta có phương trình tuyến tính có dạng: Y = -8.55 + 10.459*X vậy :
nễu tăng 1 đơn vị thì Y tăg 10.459 đơn vị Khi X=0 thì Y= -8.55
1 Loại doanh nghiệp nhà nghiên cứu thu nhập trực tiếp từ khảo sát của họ là dạng dữ liệu: Sơ cấp
2 hình thức lấy mẫu nào dưới đây là hình thức lấy mẫu phi xác suất > Laays mẫu tiện nghi
Quy tắc 1sigma được hiểu là
> một tập dữ liệu. Trong ngữ cảnh này, "1 sigma" là một đơn vị của độ lệch chuẩn
(standard deviation) từ giá trị trung bình (mean) của tập dữ liệu. Nó cũng được gọi là "khoảng 1 sigma."
Khi bạn nói "1 sigma," bạn đang đề cập đến khoảng cách mà hầu hết các giá trị dữ liệu nằm
trong đó từ giá trị trung bình. Cụ thể, khoảng này bao gồm khoảng từ giá trị trung bình trừ một
đơn vị độ lệch chuẩn đến giá trị trung bình cộng một đơn vị độ lệch chuẩn.
Nếu bạn có một phân phối chuẩn (normal distribution) và bạn sử dụng 1 sigma, khoảng này sẽ
chứa khoảng 68% tổng số dữ liệu. Nó cho biết mức độ biến đổi tương đối nhỏ trong tập dữ liệu. lOMoAR cPSD| 59735516
Các giá trị ngoài khoảng này có thể được coi là ngoại lệ hoặc không bình thường đối với quá
trình hoặc hiện tượng bạn đang nghiên cứu.
Giá trị bất thường của một biến được định nghĩa là giá trị thuộc các vùng giá trị
-> Giá trị bất thường của một biến được định nghĩa là giá trị thuộc các vùng giá trị không phù
hợp hoặc không thường gặp trong một tập dữ liệu. Các giá trị bất thường thường được gọi là
ngoại lệ (outliers). Điều này có nghĩa rằng giá trị bất thường là các điểm dữ liệu mà dường như
rời xa hơn so với phân phối thông thường của tập dữ liệu hoặc không tuân theo quy luật chung của nó.
Các giá trị bất thường có thể xuất hiện trong dữ liệu do nhiều nguyên nhân, bao gồm sai sót
trong thu thập dữ liệu, biến đổi tự nhiên hoặc sự kiện đột ngột không mong muốn. Việc xác
định và xử lý giá trị bất thường là quan trọng trong quá trình phân tích dữ liệu và thống kê, vì
chúng có thể gây ra sự sai lệch trong kết quả nghiên cứu hoặc mô hình dự đoán. Có nhiều cách
để xác định giá trị bất thường, bao gồm sử dụng biểu đồ hộp và râu (box plots), phân tích z-
score, hoặc các phương pháp thống kê khác để xác định giá trị ngoại lệ trong tập dữ liệu.
Hình dáng của đường con phân phối chuẩn phụ thuộc vào tham số
> giá trị trung bình , độ lệch chuẩn
Công ty cần đánh giá tính ổn định của hệ thống họ phải sử dụng tham số thống kê ->
Dữ liệu được thu nhập các tổ chức cung cấp dữ liệu work bank báo cáo tài chính được gọi là Thứ cấp Bài 1
Một doanh nghiệp sản xuất màn hình tivi có thời gian sử dụng trung bình là 45.000
giờ và độ lệch chuẩn là 4xyz giờ dữ liệu quá khứ cho thấy thời gian sử dụng tivi có phân phối chuẩn
A, tính 1.000.000.000 lệ màn hình có độ bền dưới 38.000 giờ
B, tính 1.000.000.000 lệ màn hình có độ bền từ 38.000 giờ đến 50.000 giờ
C,Tính 1.000.000.000 lệ màn hình có độ bền trên 55.000 giờ
D, công ty cần thực hiện một chính sách sản phẩm cho loại màn hình này, giả sử
công ty không muốn có quá 0,2 %(0.002) sản phẩm phải bảo hành thì ngưỡng thời
gian chấp nhận cho bảo hành giá bao nhiêu Bài 2
Người ta theo dõi quan hệ giữa thu nhập và chi tiêu của những người đi làm cho bơir bảng sau stt Thu nhập Chi cho thực phẩm 1 100 38 2 120 43 3 135 49 lOMoAR cPSD| 59735516 4 150 56 5 165 57 6 167 59 7 171 62 8 176 66 9 180 69 10 Xyz 0.4*xyz(lấy phần nguyên
A,Tính trung bình , độ lệch chuẩn của thu nhập vàchỉ tiêu cho thực phẩm của các hộ gia đình
B,Tính hiệp phương sai, và hệ số tương quan giữa thu nhập và chi tiêu cho thực phẩm
C,giả sử quan hệ thu nhập và chỉ tiêu là một hàm tuyến tính có dạng y
=beta0+beta1X. hãy tính hệ số beta0, beta1 , viết phương trình hồi quy mẫu và giải thích ý nghĩa của nó Bài 3
Một nhà máy sản xuất được giới thiệu một phương pháp sản xuất mới từ một đơn
vị tư vấn. Để kiểm tra hiệu quả của phương pháp này, sau khi tập huấn về phương
pháp mới nhà máy lựa chọn t8 công nhân để đo lường hiệu quả giữa hai phương
pháp sản xuất cũ và mới. Số lượng sản phẩm sản xuất từ hai phương pháp được cho bbởi bảng sau: Công nhân
kết quả phương pháp cũ kết quả phương pháp mới 1 35 38 2 36 40 3 40 43 4 42 44 5 45 47 6 50 53 7 54 57 8 yz Yz
A, phương pháp sản xuất mới có hiệu quả hơn so với phương pháp sản xuất cũ hay
không? Nếu có mức độ thay đổi trung bình là bao nhiêu
B, một quản đốc phân xưởng cho rằng phương pháp sản xuất này có hiệu quả thấp
hơn một phương pháp được giới thiệu trước đây bởi trung bình sản phẩm làm ra
của phương pháp đó cao hơn phương pháp mới này 1 sản phẩm hỏi nhận định này có đúng hay không lOMoAR cPSD| 59735516 Phần II: Bài 01 Đôh lệch chuẩn 4283
a.z=(38000-45000)/4283=-1,63437 =>
P(độ bền <38000)=0,05109=>5,2%
B, P(độ bền >38000)=1-0,5109=0,9489 Z=(50000-45000)/4283=1.16741
P(độ bền <50000)= 0,87848
P(độ bền từ 38000 đến 50000)=0,887848-0,05109=0,8368 => 83,68%
C, z=(55000-45000)/4283 =2,33481
P(độ bền < 55000)= 0,9902
P(độ bền >55000)= 1-0,9902= 0,0978 =>9,87% D, p(x z=-2,88
Ta có -2,88 = (x-45000)/4283 => x=32664,96 vậy ngưỡng
thời gian chấp nhận cho bảo hành là 32664,96 giờ bài 03 a, Y: phương pháp mới X:phương pháp cũ
Tương tự cách ý c bài 2
Ptt hồi quy mẫu: y = 36,81 + 0,26X
Nhìn vào pt (36,81) ta thấy pp mới hiệu quả hơn pp cũ mức độ thay đổi trung bình là 0,26 B nhận định này đúng Bài 2
A ,trung bình của thu nhập = trung bình cộng của các giá trị = 164,7
độ lệch chuẩn của thu nhập = phương sai/(n-1)=2409,35
trung bình của chi cho thự phẩm=trung bình cộng của các giá trị = 61,2
độ lệch chuẩn của chi cho thực phẩm=phương sai/)n-1)=20,65 b, hiệp
phương sai giữa thu nhập và chỉ cho thực phẩm = tổng các giá trị (xj- xtb)(ỵ-ytb)/(n-1)=1005.96 c,X: thu nhập Y: chỉ cho thực phẩm
Beta1=tổng(Xj-xtb)(ỵ-ytb)/tổng(xj-xtb)^2 = 0,42 Beta0 = ytb-beta1*xtb= -7,75 =>pt:Y=-7,75 +0,42X
giải thích ý nghĩa : khi không có thu nhập thì chỉ tiêu cho thực phẩm trung bình là - lOMoAR cPSD| 59735516 7,75
khi thu nhập tăng 1 đơn vị thì chỉ cho thực phẩm trung bình tăng 0,42 lOMoAR cPSD| 59735516 lOMoAR cPSD| 59735516