Đáp án: Số 1 ôn tập thống kế và quy hồi đơn - Tài liệu tham khảo | Đại học Hoa Sen

Đáp án: Số 1 ôn tập thống kế và quy hồi đơn - Tài liệu tham khảo | Đại học Hoa Sen  và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học.

ĐẠI HỌC HOA SEN
KINH TẾ LƯỢNG
ĐÁP ÁN Bài tập SỐ 1
ÔN TẬP THỐNG KÊ và HỒI QUY ĐƠN
Người soạn: GV. Phạm Văn Minh
Câu 1 (20 điểm):
Hãy nêu định nghĩa của kỳ vọng, phương sai, độ lệch chuẩn của một biến ngẫu nhiên.
Hãy chứng minh những tính chất sau đây của kỳ vọng và phương sai, trong đó X là một
biến ngẫu nhiên và a, b là những hằng số.
(a) E[a] = a (b) E[bX] = bE[X]
(c) E[a + bX] = a + bE[X] (d) VAR[a] = 0
(e) VAR[bX] = b VAR[X] (f) VAR[a + bX] = b
2 2
VAR[X]
(g) VAR[X] = E[X
2
] - (E[X])
2
Giải:
(a) E[a] = a
(b) E[bX] = bE[X]
(c) E[a + bX] = a + bE[X]
(d) VAR[a] = 0
Dựa vào tính chất của toán tử kỳ vọng E[X]: E[a] = a (ở câu a)
(e) VAR[bX] = b
2
VAR[X]
(f) VAR[a + bX] = b
2
VAR[X]
(g) VAR[X] = E[X
2
] - (E[X])
2
Để đơn giản hóa ký hiệu, ta đặt = E[X]
Câu 2 (20 điểm):
một giả thuyết cho rằng điểm trung bình của một sinh viên thể được giải thích
bởi thu nhập trung bình hàng năm của Cha Mẹ. Để kiểm chứng giả thuyết này, một sinh
viên Kinh tế Khóa 34 đã tiến hành thu thập dữ liệu từ một mẫu gồm 8 sinh viên của
Trường Đại Học Hoa Sen và được kết quả như sau:
STT
Điểm trung bình
(ĐTB)
Thu nhập trung bình
hàng năm (TN – tr.đồng)
1 10.00 105
2 7.50 75
3 8.75 45
4 5.00 45
5 7.50 60
6 8.75 90
7 6.25 30
8 6.25 60
Giải:
(a) Hãy tính các trị thống tổng hợp cho biến thu nhập trung bình hàng năm và biến
điểm trung bình. Điền các kết quả vào bảng sau:
Trị thống kê Tổng hợp HÀM EXCEL Biến ĐTB Biến TN
Số lần Quan sát =COUNT( ) 8
8
Trung bình =AVERAGE( ) 7.5
63.75
Trung vị =MEDIAN( ) 7.5
60
Yếu vị (mode) =MODE( ) 6.25; 7.5; 8.75
45; 60
Giá trị lớn nhất =MAX( ) 10
105
Giá trị nhỏ nhất =MIN( ) 5
30
Phương sai (*) =VAR( ) 2.679
626.786
Độ Lệch chuẩn =STDEV( ) 1.637
25.036
Hệ số biến thiên
= STDEV( )/
AVERAGE( )
0.218 0.393
Đồng Phương sai =(n/(n-1))*COVAR() = 29.464
2
Hệ số biến thiên: được định nghĩa là tỷ số σ/μ, trong đó tử số là độ lệch chuẩn và mẫu
số trị trung bình. Đómột đại lượng của sự phân tán của phân phối tương đối so
với trị trung bình của phân phối.
Đồng Phương sai: Trong thuyết xác suất thống kê, đồng phương sai (hay hiệp
phương sai) độ đo sự biến thiên cùng nhau của hai biến ngẫu nhiên (phân biệt với
phương sai - đo mức độ biến thiên của một biến).
Nếu 2 biến có xu hướng thay đổi cùng nhau (nghĩa là, khi một biến có giá trị cao hơn
giá trị kỳ vọng thì biến kia có xu hướng cũng cao hơn giá trị kỳ vọng), thì hiệp phương
sai giữa hai biến này có giá trị dương. Mặt khác, nếu một biến nằm trên giá trị kì vọng
còn biến kia xu hướng nằm dưới giá trị vọng, thì hiệp phương sai của hai biến
này có giá trị âm.
Lưu ý: trong Excel đến 4 hàm để tính Phương sai. Đó VAR, VARA, VARP,
VARPA. Nhưng để tính phương sai cho mẫu, ta sử dụng công thức VAR( ), tương tự
như vậy công thức (n/(n-1))*COVAR sẽ tính đồng phương sai của hai biến trên mẫu.
Hoặc sử dụng Data Analysis/ Descriptive Statistics:
Ta có bảng sau:
ĐIỂM TRUNG BÌNH THU NHẬP
Mean 7.5 Mean 63.75
Standard Error Standard Error0.578638 8.851452665
Median 7.5 Median 60
Mode 7.5 Mode 45
Standard Deviation Standard Deviation1.636634 25.03568881
Sample Variance Sample Variance2.678571 626.7857143
Kurtosis -0.7 Kurtosis -0.596449704
Skewness -6.3E-17 Skewness 0.46088053
Range 5 Range 75
Minimum 5 Minimum 30
Maximum 10 Maximum 105
Sum 60 Sum 510
Count 8 Count 8
3
(b) Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến thu nhập
trung bình hàng năm trục tung cho biến điểm trung bình. Nhận xét một cách ngắn
gọn về đồ thị của dữ liệu.
Tính toán các hệ số hồi quy
1 2
trong hình hồi quy sau: ĐTB = + *TN
1 2
bằng Excel.
Đồ thị phân tán:
Nhận xét: Dựa vào đồ thị trên, ta thấy dường như giữa điểm trung bình của một sinh
viên mối tương quan tuyến tính đồng biến với thu nhập trung bình hàng năm của
Cha Mẹ.
Các bạn có thể “click đúp” trực tiếp vào bảng trên để xem cách tính toán mà không
cần phải mở Excel. Cụ thể hơn, được tính bằng các công thức như sau:
1 2
4
(c) Theo Anh/Chị, giả thuyết cho rằng điểm trung bình của một sinh viên thể được
giải thích bởi thu nhập trung bình hàng năm của Cha Mẹ là đúng hay không đúng. Giải
thích ngắn gọn câu trả lời của Anh/Chị.
Câu này chưa cần làm.
Câu 3 (20 điểm):
Thu thập dữ liệu về thu nhập (R), chi tiêu cho ăn uống (C1) và các chi tiêu khác (C2),
bình quân 1 tuần của 10 hộ gia đình ở một vùng, nhà nghiên cứu được kết quả sau (đơn
vị ngàn VNĐ/ tuần):
Hộ gia
đình i
1 2 3 4 5 6 7 8 9 10
R
i
800 1000 1200 1400 1600 1800 2000 2200 2400 2600
C1
i
320 310 340 310 450 420 480 520 600 520
C2
i
380 340 560 640 660 730 740 880 950 980
a) Gọi tổng chi tiêu bình quân 1 tuần của hộ gia đình là C (C = C1 + C2). Hãy tính giá
trị kỳ vọng và phương sai của tổng chi tiêu C cho tập dữ liệu trên.
Dùng hàm AVERAGE, VAR trong EXCEL ta được:
Ta thấy E(C) = E(C1) + E(C2); Var(C) = Var(C1) + Var(C2) +2Cov(C1,C2)
(Các bạn chỉ cần tìm ra Kỳ vọng và phương sai của C, chữ đậm màu đỏ bảng trên,
“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
5
.047.0
)75.63(*836900
5.7.*75.63*83.4031
).(
..
ˆ
2
1
22
1
2 n
i
i
n
i
ii
XnX
YXnYX
.5032.475.63*047.05.7
ˆˆ
21
XY
b) Gọi số tiền tích lũy bình quân 1 tuần của hộ gia đình là P (P = R – C). Hãy tính giá
trị kỳ vọng và phương sai của số tiền tích lũy bình quân 1 tuần cho tập dữ liệu trên.
Ta có bảng số liệu sau:
Tương tự, ta dùng hàm AVERAGE, VAR trong EXCEL:
Ta thấy E(P) = E(R) + E(C); Var(P) = Var(R) + Var(C) - 2Cov(R,C)
(Các bạn chỉ cần tìm ra K vọng phương sai của P, chữ đậm màu đỏ bảng trên,
“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
Câu 4 (20 điểm):
một giả thuyết cho rằng tổng chi tiêu của một hộ gia đình phụ thuộc vào thu nhập
của hộ gia đình đó. Để kiểm chứng giả thuyết này, nhà nghiên cứu đã dùng dữ liệu về
thu nhập (R), tổng chi tiêu (C) bình quân 1 tuần của hộ gia đình trong Câu 3:
a) Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến R trục
tung cho biến C. Nhận xét một cách ngắn gọn về đồ thị của dữ liệu.
Theo đồ thị ta thấy hình như giữa C và R có mối quan hệ đồng biến, và giữa C & R
có quan hệ tuyến tính khá chặt.
b) Hãy tìm khoảng tin cậy 95% của thu nhập (R) bình quân 1 tuần của hộ gia đình.
6
Câu này chưa cần làm.
7
Câu 5 (20 điểm):
Tìm hiểu về nhu cầu sử dụng điện thoại, ông Bình đã sử dụng bộ dữ liệu của Singapore
giai đoạn 1960-1981 với 2 biến sau:
TEL: Số lượng máy điện thoại trên 1000 người.
GDP: Tổng sản phẩm quốc nội theo đầu người, tại mức giá cơ cấu tính theo đô
la Singapore năm 1968.
Năm TEL GDP Năm (tt) TEL GDP
1960 36 1299 90 2723 1971
1961 37 1365 102 3033 1972
1962 38 1409 114 3317 1973
1963 41 1549 126 3487 1974
1964 42 1416 141 3575 1975
1965 45 1473 163 3784 1976
1966 48 1589 196 4025 1977
1967 54 1757 223 4286 1978
1968 59 1974 262 4628 1979
1969 67 2204 1980 291 5038
1970 78 2462 317 5472 1981
a. Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến GDP và trục
tung cho biến TEL. Bằng trực quan, Anh/ chị hãy nhận xét ngắn gọn về mối quan hệ
giữa 02 chỉ số trên dựa trên đồ thị này.
Đồ thị cho thấy: khi GDP tăng thì TEL tăng, và ngược lại. Nói cách khác, GDP
TEL quan hệ thuận chiều (đồng biến). Đồ thị cũng cho thấy quan hệ GDP
TEL xấp xỉ tuyến tính.
8
b. Hãy tính các trị thống tổng hợp cho biến GDP và TEL (trung bình, phương sai,
độ lệch chuẩn, đồng phương sai).
(“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
c. Sử dụng lệnh CORREL trong EXCEL, hãy xác định hệ số tương quan tuyến tính
giữa TEL và GDP. Giải thích ý nghĩa của hệ số tương quan.
(“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
Hệ số tương quan dương cho thấy hai biến TEL và GDP có quan hệ tỷ lệ thuận.
|r| rất gần 1 (≥ 0.8) cho thấy hai biến này có tương quan tuyến tính chặt.
HẾT
Để nắm vững cách làm, các bạn xem cụ thể trong Excel kèm theo đáp án này.
Hoặc nhấn đúp vào biểu tượng sau
GIẢ I BẰNG EXCEL
9
| 1/9

Preview text:

ĐẠI HỌC HOA SEN KINH TẾ LƯỢNG
ĐÁP ÁN Bài tập SỐ 1
ÔN TẬP THỐNG KÊ và HỒI QUY ĐƠN
Người soạn: GV. Phạm Văn Minh Câu 1 (20 điểm):
Hãy nêu định nghĩa của kỳ vọng, phương sai, độ lệch chuẩn của một biến ngẫu nhiên.
Hãy chứng minh những tính chất sau đây của kỳ vọng và phương sai, trong đó X là một
biến ngẫu nhiên và a, b là những hằng số. (a) E[a] = a (b) E[bX] = bE[X] (c) E[a + bX] = a + bE[X] (d) VAR[a] = 0 (e) VAR[bX] = b VA 2 R[X] (f) VAR[a + bX] = b2VAR[X] (g) VAR[X] = E[X2] - (E[X])2 Giải: (a) E[a] = a (b) E[bX] = bE[X] (c) E[a + bX] = a + bE[X] (d) VAR[a] = 0
Dựa vào tính chất của toán tử kỳ vọng E[X]: E[a] = a (ở câu a) (e) VAR[bX] = b2VAR[X] (f) VAR[a + bX] = b2VAR[X] (g) VAR[X] = E[X2] - (E[X])2
Để đơn giản hóa ký hiệu, ta đặt = E[X] Câu 2 (20 điểm):
Có một giả thuyết cho rằng điểm trung bình của một sinh viên có thể được giải thích
bởi thu nhập trung bình hàng năm của Cha Mẹ. Để kiểm chứng giả thuyết này, một sinh
viên Kinh tế Khóa 34 đã tiến hành thu thập dữ liệu từ một mẫu gồm 8 sinh viên của
Trường Đại Học Hoa Sen và được kết quả như sau: Điểm trung bình Thu nhập trung bình STT (ĐTB)
hàng năm (TN – tr.đồng) 1 10.00 105 2 7.50 75 3 8.75 45 4 5.00 45 5 7.50 60 6 8.75 90 7 6.25 30 8 6.25 60 Giải:
(a) Hãy tính các trị thống kê tổng hợp cho biến thu nhập trung bình hàng năm và biến
điểm trung bình. Điền các kết quả vào bảng sau:
Trị thống kê Tổng hợp HÀM EXCEL Biến ĐTB Biến TN Số lần Quan sát =COUNT( ) 8 8 Trung bình =AVERAGE( ) 7.5 63.75 Trung vị =MEDIAN( ) 7.5 60 Yếu vị (mode) =MODE( ) 6.25; 7.5; 8.75 45; 60 Giá trị lớn nhất =MAX( ) 10 105 Giá trị nhỏ nhất =MIN( ) 5 30 Phương sai (*) =VAR( ) 2.679 626.786 Độ Lệch chuẩn =STDEV( ) 1.637 25.036 = STDEV( )/ 0.218 0.393 Hệ số biến thiên AVERAGE( ) Đồng Phương sai
=(n/(n-1))*COVAR() = 29.464 2
Hệ số biến thiên: được định nghĩa là tỷ số σ/μ, trong đó tử số là độ lệch chuẩn và mẫu
số là trị trung bình. Đó là một đại lượng của sự phân tán của phân phối tương đối so
với trị trung bình của phân phối.
Đồng Phương sai: Trong lý thuyết xác suất và thống kê, đồng phương sai (hay hiệp
phương sai) là độ đo sự biến thiên cùng nhau của hai biến ngẫu nhiên (phân biệt với
phương sai - đo mức độ biến thiên của một biến).
Nếu 2 biến có xu hướng thay đổi cùng nhau (nghĩa là, khi một biến có giá trị cao hơn
giá trị kỳ vọng thì biến kia có xu hướng cũng cao hơn giá trị kỳ vọng), thì hiệp phương
sai giữa hai biến này có giá trị dương. Mặt khác, nếu một biến nằm trên giá trị kì vọng
còn biến kia có xu hướng nằm dưới giá trị kì vọng, thì hiệp phương sai của hai biến
này có giá trị âm.
Lưu ý: trong Excel có đến 4 hàm để tính Phương sai. Đó là VAR, VARA, VARP,
VARPA. Nhưng để tính phương sai cho mẫu, ta sử dụng công thức VAR( ), tương tự
như vậy công thức (n/(n-1))*COVAR sẽ tính đồng phương sai của hai biến trên mẫu.
Hoặc sử dụng Data Analysis/ Descriptive Statistics: Ta có bảng sau:
ĐIỂM TRUNG BÌNH THU NHẬP Mean 7.5 Mean 63.75 Standard Error 0.578638 Standard Error 8.851452665 Median 7.5 Median 60 Mode 7.5 Mode 45 Standard Deviation 1.636634 Standard Deviation 25.03568881 Sample Variance 2.678571 Sample Variance 626.7857143 Kurtosis -0.7 Kurtosis -0.596449704 Skewness -6.3E-17 Skewness 0.46088053 Range 5 Range 75 Minimum 5 Minimum 30 Maximum 10 Maximum 105 Sum 60 Sum 510 Count 8 Count 8 3
(b) Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến thu nhập
trung bình hàng năm và trục tung cho biến điểm trung bình. Nhận xét một cách ngắn
gọn về đồ thị của dữ liệu.
Tính toán các hệ số hồi quy 1 và 2 trong mô hình hồi quy sau: ĐTB = 1 + * 2 TN bằng Excel.
Đồ thị phân tán:
Nhận xét: Dựa vào đồ thị trên, ta thấy dường như giữa điểm trung bình của một sinh
viên có mối tương quan tuyến tính đồng biến với thu nhập trung bình hàng năm của Cha Mẹ.
Các bạn có thể “click đúp” trực tiếp vào bảng trên để xem cách tính toán mà không
cần phải mở Excel. Cụ thể hơn, và 1 được 2
tính bằng các công thức như sau: 4 n X Y . n X .Y i i 4031.3 8 * 63.75 *.7.5 ˆ i 1 0.047. 2 n 2 2 36900 8 * 6 ( 3.7 ) 5 2 X . n ( X) i i 1 ˆ ˆ Y X 7.5 0 047 . * 63 75 . 4.5032. 1 2
(c) Theo Anh/Chị, giả thuyết cho rằng điểm trung bình của một sinh viên có thể được
giải thích bởi thu nhập trung bình hàng năm của Cha Mẹ là đúng hay không đúng. Giải
thích ngắn gọn câu trả lời của Anh/Chị.
Câu này chưa cần làm. Câu 3 (20 điểm):
Thu thập dữ liệu về thu nhập (R), chi tiêu cho ăn uống (C1) và các chi tiêu khác (C2),
bình quân 1 tuần của 10 hộ gia đình ở một vùng, nhà nghiên cứu được kết quả sau (đơn vị ngàn VNĐ/ tuần): Hộ gia 1 2 3 4 5 6 7 8 9 10 đình i Ri
800 1000 1200 1400 1600 1800 2000 2200 2400 2600 C1i 320 310 340 310 450 420 480 520 600 520 C2i 380 340 560 640 660 730 740 880 950 980
a) Gọi tổng chi tiêu bình quân 1 tuần của hộ gia đình là C (C = C1 + C2). Hãy tính giá
trị kỳ vọng và phương sai của tổng chi tiêu C cho tập dữ liệu trên.
Dùng hàm AVERAGE, VAR trong EXCEL ta được:
Ta thấy E(C) = E(C1) + E(C2); Var(C) = Var(C1) + Var(C2) +2Cov(C1,C2)
(Các bạn chỉ cần tìm ra Kỳ vọng và phương sai của C, chữ đậm màu đỏ ở bảng trên,
“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể) 5
b) Gọi số tiền tích lũy bình quân 1 tuần của hộ gia đình là P (P = R – C). Hãy tính giá
trị kỳ vọng và phương sai của số tiền tích lũy bình quân 1 tuần cho tập dữ liệu trên. Ta có bảng số liệu sau:
Tương tự, ta dùng hàm AVERAGE, VAR trong EXCEL:
Ta thấy E(P) = E(R) + E(C); Var(P) = Var(R) + Var(C) - 2Cov(R,C)
(Các bạn chỉ cần tìm ra Kỳ vọng và phương sai của P, chữ đậm màu đỏ ở bảng trên,
“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể) Câu 4 (20 điểm):
Có một giả thuyết cho rằng tổng chi tiêu của một hộ gia đình phụ thuộc vào thu nhập
của hộ gia đình đó. Để kiểm chứng giả thuyết này, nhà nghiên cứu đã dùng dữ liệu về
thu nhập (R), tổng chi tiêu (C) bình quân 1 tuần của hộ gia đình trong Câu 3:
a) Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến R và trục
tung cho biến C. Nhận xét một cách ngắn gọn về đồ thị của dữ liệu.
Theo đồ thị ta thấy hình như giữa C và R có mối quan hệ đồng biến, và giữa C & R
có quan hệ tuyến tính khá chặt.
b) Hãy tìm khoảng tin cậy 95% của thu nhập (R) bình quân 1 tuần của hộ gia đình. 6
Câu này chưa cần làm. 7 Câu 5 (20 điểm):
Tìm hiểu về nhu cầu sử dụng điện thoại, ông Bình đã sử dụng bộ dữ liệu của Singapore
giai đoạn 1960-1981 với 2 biến sau:
TEL: Số lượng máy điện thoại trên 1000 người.
GDP: Tổng sản phẩm quốc nội theo đầu người, tại mức giá cơ cấu tính theo đô la Singapore năm 1968. Năm TEL GDP Năm (tt) TEL GDP 1960 36 1299 1971 90 2723 1961 37 1365 1972 102 3033 1962 38 1409 1973 114 3317 1963 41 1549 1974 126 3487 1964 42 1416 1975 141 3575 1965 45 1473 1976 163 3784 1966 48 1589 1977 196 4025 1967 54 1757 1978 223 4286 1968 59 1974 1979 262 4628 1969 67 2204 1980 291 5038 1970 78 2462 1981 317 5472
a. Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến GDP và trục
tung cho biến TEL. Bằng trực quan, Anh/ chị hãy nhận xét ngắn gọn về mối quan hệ
giữa 02 chỉ số trên dựa trên đồ thị này.
Đồ thị cho thấy: khi GDP tăng thì TEL tăng, và ngược lại. Nói cách khác, GDP và
TEL có quan hệ thuận chiều (đồng biến). Đồ thị cũng cho thấy quan hệ GDP và TEL xấp xỉ tuyến tính. 8
b. Hãy tính các trị thống kê tổng hợp cho biến GDP và TEL (trung bình, phương sai,
độ lệch chuẩn, đồng phương sai).
(“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
c. Sử dụng lệnh CORREL trong EXCEL, hãy xác định hệ số tương quan tuyến tính
giữa TEL và GDP. Giải thích ý nghĩa của hệ số tương quan.
(“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
Hệ số tương quan dương cho thấy hai biến TEL và GDP có quan hệ tỷ lệ thuận.
|r| rất gần 1 (≥ 0.8) cho thấy hai biến này có tương quan tuyến tính chặt. HẾT
Để nắm vững cách làm, các bạn xem cụ thể trong Excel kèm theo đáp án này.
Hoặc nhấn đúp vào biểu tượng sau GIẢI BẰNG EXCEL 9