Bài tập SPSS môn Phương pháp nghiên cứu kinh tế | Đại học Ngoại Thương
Bài tập SPSS môn Phương pháp nghiên cứu kinh tế | Đại học Ngoại Thương. Tài liệu gồm 46 trang giúp bạn tham khảo, củng cố kiến thức và ôn tập đạt kết quả cao trong kỳ thi sắp tới. Mời bạn đọc đón xem!
Preview text:
TRƯỜNG ĐẠI HỌC KINH TẾ
KHOA KINH TẾ PHÁT TRIỂN
BÀI TẬP GIỮA KỲ
PHƯƠNG PHÁP NGHIÊN CỨU KINH TẾ GVHD:Lê Đình Hải Họ và tên : Lương Minh Huế Mã sinh viên : 21051401 Lớp : QH-2021-E KTPT CLC 2 Mã lớp : INE1016
Hà Nội, tháng 1 năm 2023 1
Bài 1. Cho bảng số liệu Obs thunhap tieudung Obs thunhap tieudung 1 1 0.6 23 0.6 0.35 2 1.1 0.65 24 0.5 0.35 3 0.7 0.48 25 0.7 0.38 4 1.4 0.9 26 0.4 0.2 5 0.5 0.38 27 0.55 0.35 6 0.4 0.23 28 0.5 0.35 7 0.55 0.32 29 0.9 0.55 8 0.8 0.48 30 0.4 0.3 9 0.7 0.45 31 0.31 0.22 10 0.25 0.18 32 1.2 0.65 11 0.65 0.4 33 0.6 0.4 12 0.4 0.25 34 0.3 0.2 13 1.8 0.95 35 0.8 0.4 14 0.4 0.25 36 0.44 0.28 15 0.5 0.3 37 0.5 0.39 16 0.3 0.2 38 1 0.6 17 1 0.5 39 1.8 0.9 18 0.5 0.25 40 1.4 0.7 19 0.8 0.45 41 1.5 0.75 20 1.4 0.7 42 1.2 0.6 21 0.8 0.45 43 0.8 0.45 22 1.5 0.78 44 0.9 0.45
a. Hãy sử dụng các thủ tục cần thiết trong SPSS để lập bảng thống kê mô tả, hãy mô tả
về thông tin biến dựa trên các đặc trưng thống kê thu được.
b. Vẽ biểu đồ Histogram của thu nhập trên đó có vẽ đường cong chuẩn, hãy nhận xét
phân bố của biến thu nhập.
c. Hãy sử dụng các thủ tục cần thiết phân tích mối quan hệ giữa thu nhập và tiêu dùng. 2 Trả lời Mô tả thống kê Descriptive Statistics Minimu Maximu Std. N m m Mean Deviation thunhap 44 .25 1.80 .7898 .41414 tieudung 44 .18 .95 .4539 .20308 Valid N 44 (listwise)
Dựa vào bảng, ta thấy có tổng cộng 44 người trả lời khảo sát về thu nhập và tiêu dùng
- Giá trị nhỏ nhất của thu nhập là 0,25; tiêu dùng là 0,18
- Giá trị lớn nhất của tiêu dùng là 1,8; tiêu dùng là 0.95
- Giá trị trung bình cộng của thu nhập là 0,7898; tiêu dùng là 0,4539
- Độ lệch chuẩn: sự biến động quanh giá trị trung bình của thu nhập là 0,41414; tiêu dùng là 0,20308 Custom Tables Maximu Minimu Standard Mean m m Deviation thunhap .79 1.80 .25 .41 tieudun .45 .95 .18 .20 g
b. Vẽ biểu đồ Histogram 3
C, Phân tích mối quan hệ giữa thu nhập và tiêu dùng Correlations Correlations tieudun thunhap g thunhap Pearson 1 .975** Correlation Sig. (2-tailed) .000 N 44 44 tieudun Pearson .975** 1 g Correlation Sig. (2-tailed) .000 N 44 44
**. Correlation is significant at the 0.01 level (2-tailed).
Nhận xét: Hệ số tương quan bội: 0.9 < r = 0.967 < 1
- Với mức độ tin cậy 99%, thu nhập và tiêu dùng có mối quan hệ đồng biến và liên kết rất chặt chẽ.
Bài 2. Cho bảng số liệu doanh thu trong ngày của 2 cửa hàng của công ty như sau:
Cửa hàng 1 4.5 4.75 4.85 3.85 3.9 4.35 4.7 4.25 5.3 3.9 5.4 5.3 4.5 3.95 4.35 Cửa hàng 2 3.4 4.25 4.5 4.9 4.6 4.45 3.95 3 4.7 3.7 5.05 3.3 3.43 4.15 5.2
Hãy dùng các thủ tục cần thiết trong SPSS để phân tích và so sánh doanh thu của hai
cửa hàng nói trên. Cửa hàng nào cho doanh thu cao hơn (giả thiết rằng doanh thu trong
ngày có phân bố gần phân bố chuẩn). Trả lời
Bước 1: Kiểm định phương sai
H0: Var 1 (cửa hàng 1) = Var 2 (cửa hàng 2)
H1: Var 1 (cửa hàng 1) ≠ Var 2 (cửa hàng 2)
Bước 2: Kiểm định giá trị bình quân
H0 = µ1 (cửa hàng 1) = µ2 (cửa hàng 2)
H1: µ1 (cửa hàng 1) ≠ µ2 (cửa hàng 2) 4
Bước 3: Kiểm định
Independent Samples Test Levene's Test for Equality
of Variances t-test for Equality of Means 95% Confidence Interval of the Sig. (2- Mean Std. Error Difference F Sig. t df tailed) Difference Difference Lower Upper Doanh Equal thu varianc 1,60 1,57 es ,216 28 ,126 ,35133 ,22279 -,10502 ,80769 4 7 assume d Equal varianc 1,57 es not 26,234 ,127 ,35133 ,22279 -,10641 ,80908 7 assume d
Bước 4: Kết luận
- Kiểm định phương sai: Vì sig. = 0.216 > α = 0,05 → Chấp nhận H0
→ Kết luận phương sai 2 mẫu bằng nhau
- Kiểm định giá trị bình quân: vì giá trị cột Sig. (2-tailed) dòng 1=0.126 > α-0,05 → Chấp nhận H0
→ Giá trị bình quân của 2 mẫu không có sự khác biệt đáng kể 5
Bài 3. Cho bảng số liệu lượng tiêu thụ sản phẩm của doanh nghiệp được ghi theo mùa trong nhiều năm Mùa Lượng tiêu thụ Xuâ
5.2 4.9 6.3 4.7 4.5 5.2 4.8 6.1 4.8 5
4.9 6.3 5.5 6.1 4.9 4.7 5.7 4.7 6.3 6.5 Hạ
6.2 5.3 6.2 6.4 5.7 5.2 4.8 4.7 4.9 5.6 6.7 4.8 6.5 5.1 5.4 6.2 4.5 5.2 6.3 6.2 Thu 4.3 4.5 4.5 5 4.6 5.1 5
5.2 5.3 5.5 5.5 5.3 5.7 5.5 5.6 5.7 6 6.1 6.1 6.3
Đôn 4.3 4.7 4.5 5.1 3.9 4.1 5.2 6.1 3.7 4.8 4.3 5.7 3.2 5.3 4.5 6.1 3.2 5.1 4.7 4.9
Hãy thực hiện xử lý dữ liệu thích hợp, phân tích ảnh hưởng của mùa tới lượng tiêu thụ của sản phẩm. Trả lời
- Kiểm định giả thuyết:
H0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
H1: Có ít nhất một mùa có doanh thu khác với 3 mùa còn lại
- Kết quả thống kê mô tả: Descriptives Tiêu thụ 95% Confidence Interval for Mean Std. Std. Lower Upper Minimu Maximu N Mean Deviation Error Bound Bound m m Xuân 20 5.355 .6755 .1510 5.039 5.671 4.5 6.5 Hạ 20 5.595 .6917 .1547 5.271 5.919 4.5 6.7 Thu 20 5.340 .5744 .1284 5.071 5.609 4.3 6.3 Đông 20 4.670 .8202 .1834 4.286 5.054 3.2 6.1 Total 80 5.240 .7655 .0856 5.070 5.410 3.2 6.7
- Kết quả kiểm định giả thuyết ANOVA Tiêu thụ Sum of Mean Squares df Square F Sig. Between 9.483 3 3.161 6.527 .001 Groups 6 Within Groups 36.809 76 .484 Total 46.292 79 - Kết luận
So sánh cột Sig với 𝛼 = 0,05
Giá trị cột Sig = 0,001 < 𝛼 = 0,05 →bác bỏ H0, chấp nhận H1
Với mức độ tin cậy 95%, ta luôn khẳng định rằng có ít nhất 1 mùa có lượng tiêu thụ bình
quân khác biệt đáng kể với lượng tiêu thụ bình quân của 3 mùa còn lại.
- Kết quả so sánh cặp Multiple Comparisons
Dependent Variable: Tiêu thụ LSD Mean 95% Confidence Interval (I) (J) Difference Std. Lower Upper Mùa Mùa (I-J) Error Sig. Bound Bound Xuân Hạ -.2400 .2201 .279 -.678 .198 Thu .0150 .2201 .946 -.423 .453 Đông .6850* .2201 .003 .247 1.123 Hạ Xuân .2400 .2201 .279 -.198 .678 Thu .2550 .2201 .250 -.183 .693 Đông .9250* .2201 .000 .487 1.363 Thu Xuân -.0150 .2201 .946 -.453 .423 Hạ -.2550 .2201 .250 -.693 .183 Đông .6700* .2201 .003 .232 1.108 Đông Xuân -.6850* .2201 .003 -1.123 -.247 Hạ -.9250* .2201 .000 -1.363 -.487 Thu -.6700* .2201 .003 -1.108 -.232
*. The mean difference is significant at the 0.05 level.
Kết luận: Mùa xuân lớn hơn mùa đông 1 cách đáng kể
→ Với độ tin cậy 95%, ta luôn khẳng định rằng mùa đông luôn có lượng tiêu thụ thấp hơn đáng
kể so với lượng tiêu thụ của 3 mùa còn lại 7
- Đồ thị Means Plots
Bài 4: Tìm hiểu về nhu cầu sử dụng điện thoại, ông Bình đã sử dụng bộ dữ liệu của
Singapore giai đoạn 1960-1981 với 2 biến sau: TEL:
Số lượng máy điện thoại trên 1000 người.
GDP: Tổng sản phẩm quốc nội theo đầu người, tại mức giá cơ cấu tính theo đô la Singapore năm 1968 Năm TEL GDP Năm (tt) TEL GDP 1960 36 1299 1971 90 2723 1961 37 1365 1972 102 3033 1962 38 1409 1973 114 3317 1963 41 1549 1974 126 3487 1964 42 1416 1975 141 3575 1965 45 1473 1976 163 3784 1966 48 1589 1977 196 4025 8 1967 54 1757 1978 223 4286 1968 59 1974 1979 262 4628 1969 67 2204 1980 291 5038 1970 78 2462 1981 317 5472 9
a. Vẽ đồ thị phân tán điểm cho tập dữ liệu trên.
b. Hãy tính các trị thống kê tổng hợp cho biến GDP và TEL (trung bình, phương sai,
độ lệch chuẩn, Max, Min).
c. Hãy xác định hệ số tương quan tuyến tính giữa TEL và GDP. Giải thích ý nghĩa của hệ số tương quan.
d. Xây dựng mô hình hồi quy giữa TEL và GDP. Trả lời a, Đồ thị phân tán điểm cho tập dữ liệu
b, Hãy tính các trị thống kê tổng hợp cho biến GDP và TEL (trung bình, phương 10
sai, độ lệch chuẩn, Max, Min). Descriptive Statistics Minimu Maximu Std. N m m Mean Deviation Variance TEL 22 36 317 116.82 88.483 7829.299 GDP 1750399.85 22 1299 5472 2812.05 1323.027 5 Valid N 22 (listwise)
C, Hãy xác định hệ số tương quan tuyến tính giữa TEL và GDP. Giải thích ý nghĩa của hệ số tương quan. Correlations TEL GDP TEL Pearson 1 .973** Correlation Sig. (2-tailed) .000 N 22 22 GDP Pearson .973** 1 Correlation Sig. (2-tailed) .000 N 22 22
**. Correlation is significant at the 0.01 level (2-tailed).
- Phân tích mối quan hệ giữa TEL và GDP
Hệ số tương quan bội: 0,9→ Với mức độ tin cậy 99%, chúng ta luôn khẳng định rằng giữa TEL và GDP có mối quan
hệ đồng biến và liên kết rất chặt chẽ
d. Xây dựng mô hình hồi quy giữa TEL và GDP. TEL= β0 + β1.GDP + εi (1) 11
- Kiểm tra sự phù hợp và tin cậy của mô hình Model Summaryb Mode Adjusted R Std. Error of l R R Square Square the Estimate 1 .973a .946 .943 21.061
a. Predictors: (Constant), GDP b. Dependent Variable: TEL
Nhận xét: Mô hình tương đối phù hợp và đáng tin cậy, Adjusted R Square = 0,043 nghĩa
là trong các nhân tố ảnh hưởng đến sự thay đổi của TEL và GDP đã giải thích được 94,3%,
còn lại 5,7% được giải thích bởi các nhân tố khác chưa có điều kiện đưa vào mô hình
-Kiểm tra sự tồn tại của mô hình ANOVAa Sum of Mean Model Squares df Square F Sig. 1 Regressio 155543.959 1 155543.959 350.667 .000b n Residual 8871.314 20 443.566 Total 164415.273 21 a. Dependent Variable: TEL
b. Predictors: (Constant), GDP
Nhận xét: Với mức độ tin cậy 95%, Sig < α =0.05 →mô hình luôn luôn tồn tại
- Kiểm tra sự tồn tại của hệ số hồi quy Coefficientsa Standardize Unstandardized d Coefficients Coefficients Model B Std. Error Beta t Sig. 1 (Constant -66.106 10.751 -6.149 .000 ) GDP .065 .003 .973 18.726 .000 12
- Nhận xét: Với mức độ tin cậy 95%, hệ số hồi quy cảu GDP luôn khác 0 vì Sig. = 0.000< α=0.05
Bài 5: Bảng kết quả kì thi cuối kì của sinh viên được dự đoán dựa trên thời gian ôn tập và giới tính ID student Giới
Giờ ôn tập(X2) Điểm cuối kì(Y) tính(X1) 1 1 5 70 2 2 10 93 3 1 5 69 4 2 3 74 5 2 8 88 6 1 5 69 7 2 9 79 9 2 7 80 10 1 6 55 11 1 4 78 12 1 11 50 13 1 7 97 14 2 2 78 15 1 5 70 16 1 5 73 17 1 6 60 18 1 6 61 19 2 9 90 20 2 7 71
- Kiểm tra sự phù hợp và tin cậy của mô hình Model Summaryb Mode
Adjusted R Std. Error of Durbin- l R R Square Square the Estimate Watson 1 .826a .683 .645 7.324 2.352
a. Predictors: (Constant), giới tính , giờ ôn tập
c. Dependent Variable: điểm cuối kì
R=0,826→ mức độ tương quan cao
Adjusted R Square = 0.645 tức là trong các yếu tố ảnh hưởng đến điểm cuối kì thì các yếu
tố giới tính và giờ ôn tập đã giải thích được 64,5% sự thay đổi điểm cuối kì của các học 13
sinh. Còn lại 35,5% được giải thích bởi các yếu tố khác mà chưa có điều kiện đưa vào mô hình
- Kiểm tra hiện tượng tự tương quan
1<2,352<3→ không có hiện tượng tự tương quan phần dư
- Kiểm định sự tồn tại của mô hình: Mức độ phù hợp của phương trình hồi quy với dữ liệu ANOVAa Sum of Mean Model Squares df Square F Sig. 1 Regressio 1962.855 2 981.428 18.295 .000b n Residual 911.945 17 53.644 Total 2874.800 19
a. Dependent Variable: điểm cuối kì
b. Predictors: (Constant), giới tính , giờ ôn tập
Giá trị cột Sig. = 0.000 < α = 0.05
Với mức độ tin cậy 95% chúng ta luôn khẳng định rằng mô hình luôn luôn tồn tại
Kết quả kiểm tra F = 18,295>3,59 → mô hình hồi quy tổng thể có ý nghĩa thống kê
- Kiểm tra sự tồn tại của hệ số hồi quy Coefficientsa Unstandardized Standardized Collinearity Coefficients Coefficients Statistics Toleranc Model B Std. Error Beta t Sig. e VIF 1 (Constant 44.030 5.574 7.899 .000 ) giờ ôn tập 3.322 .719 .678 4.621 .000 .866 1.154 giới tính 6.875 3.537 .285 1.944 .069 .866 1.154
a. Dependent Variable: điểm cuối kì
- Phương trình hồi quy: Diemcuoiki = 44,03+3,322(ontap)+ 6,875(gioitinh)
→ Với mức tin cậy 95%, ta luôn khẳng định rằng điểm cuối kì có mối quan hệ đồng biến
với giới tính và giờ ôn tập 14
Giá trị VIF đều < 10→ không có hiện tượng đa cộng tuyến Residuals Statisticsa Minimu Maximu Std. m m Mean Deviation N Predicted Value 54.23 91.00 73.60 10.164 20 Residual -14.194 12.451 .000 6.928 20 Std. Predicted -1.906 1.712 .000 1.000 20 Value Std. Residual -1.938 1.700 .000 .946 20
a. Dependent Variable: điểm cuối kì
Giá trị trung bình của phần dư=0→ đáp ứng giả định của phân tích hồi quy Bài 6: - STT : 17
- loại bỏ các số: 17, 6, 10, 13, 16, 20, 25, 33, 36, 57, 59, 72, 92, 105, 124
• Phương trình mô hình hồi quy mẫu
Output = β0 + β1.Land + β2.Fertiliser + β3.Labour + β4.Machine + β5.Plot +
β6.LandClass + β7.Age + β8.Hhsize + β9.Region + εi (1) Trong đó: Output: biến phụ thuộc
Land, Fertiliser, Labour, Machine, Plot, LandClass, Age, Hhsize, Region: biến độc lập β0: hệ số tự do β1: hệ số góc εi: phần dư
• Phân tích tương quan giữa các biến độc lập và các biến phụ thuộc của
phương trình (1) để rút gọn mô hình 15 Correlations đầu tư đầu tư sản diện cho đầu tư cho tuổi
lượng tích đất phân cho lao máy số cấp chủ lúa HGD bón động móc thửa đất hộ số khẩu của hộ sản lượng lúa Pearso n - 1 .981** .935** .830** .936** .185** .052 .191** Correla .138** tion Sig. (2- .000 .000 .000 .000 .008 .000 .318 .000 tailed) N 368 368 368 368 368 368 368 368 368 diện tích đất HGD Pearso n .981** 1 .943** .844** .952** -.131* .249** .044 .220** Correla tion Sig. (2- .000 .000 .000 .000 .012 .000 .397 .000 tailed) N 368 368 368 368 368 368 368 368 368
đầu tư cho phân bón Pearso n - .935** .943** 1 .855** .904** .279** .024 .206** Correla .135** tion Sig. (2- .000 .000 .000 .000 .009 .000 .646 .000 tailed) N 368 368 368 368 368 368 368 368 368
đầu tư cho lao động Pearso n .830** .844** .855** 1 .831** .093 .188** .073 .249** Correla tion Sig. (2- .000 .000 .000 .000 .074 .000 .162 .000 tailed) N 368 368 368 368 368 368 368 368 368 16
đầu tư cho máy móc Pearso n .936** .952** .904** .831** 1 -.110* .300** .019 .209** Correla tion Sig. (2- .000 .000 .000 .000 .035 .000 .714 .000 tailed) N 368 368 368 368 368 368 368 368 368 số thửa Pearso n -.138** -.131* -.135** .093 -.110* 1 -.122* .001 .070 Correla tion Sig. (2- .008 .012 .009 .074 .035 .020 .983 .182 tailed) N 368 368 368 368 368 368 368 368 368 cấp đất Pearso n .185** .249** .279** .188** .300** -.122* 1 -.049 .103* Correla tion Sig. (2- .000 .000 .000 .000 .000 .020 .351 .048 tailed) N 368 368 368 368 368 368 368 368 368 tuổi chủ hộ Pearso n .052 .044 .024 .073 .019 .001 -.049 1 .155** Correla tion Sig. (2- .318 .397 .646 .162 .714 .983 .351 .003 tailed) N 368 368 368 368 368 368 368 368 368 số khẩu của hộ Pearso n .191** .220** .206** .249** .209** .070 .103* .155** 1 Correla tion Sig. (2- .000 .000 .000 .000 .000 .182 .048 .003 tailed) N 368 368 368 368 368 368 368 368 368
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed). 17
• Phân tích mối quan hệ giữa Output và các biến quan sát còn lại
- Output với Land: r = 0,981 → giữa Output và Land có mối quan hệ rất chặt chẽ và đồng biến
- Output và Fertiliser: r = 0,935→ giữa Output và Fertiliser có mối quan hệ rất chặt chẽ và đồng biến
- Output với Labour: r = 0,830→ giữa Output và Labour có mối quan hệ tương đối
chặt chẽ và đồng biến
- Output với Machine: r = 0,936 → giữa Output và Machine có mối quan hệ rất chặt chẽ và đồng biến
- Output với Plot: r = -0,138 → giữa Output và Plot có mối quan hệ hết sức lỏng lẻo
và nghịch biến → loại biến Plot
- Output với LandClass: r = 0,185→ giữa Output và LandClass có mối quan hệ hết
sức lỏng lẻo → loại biến LandClass
- Output với Age: r = 0.052 → giữa Output và Age có mối quan hệ hết sức lỏng lẻo
và nghịch biến → loại biến Age
- Output với Hhsize: r = 0,191 →giữa Output và Hhsize có mối quan hệ hết sức lỏng
lẻo → loại biến Hhsize
- Phương trình mô hình hồi quy mẫu:
Output = 𝛽0 + 𝛽1. 𝐿𝑎𝑛𝑑 + 𝛽2. 𝐹𝑒𝑟𝑡𝑖𝑙𝑖𝑠𝑒𝑟 + 𝛽3. 𝐿𝑎𝑏𝑜𝑢𝑟 + 𝛽4. 𝑀𝑎𝑐ℎ𝑖𝑛𝑒 + 𝜀𝑖
• Kiểm định các biến định lượng có tiệm cận với phân phối chuẩn hay không 18
- Sản lượng lúa - Diện tích đất
- Đầu tư cho phân bón 19
- Đầu tư cho lao động
- Đầu tư cho máy móc thiết bị
- Loại bỏ các biến dị biệt 20