



















Preview text:
Đại học Kinh tế Quốc dân
Viện Đào tạo Sau đại học **********
BÀI TẬP NHÓM
Môn học phần: Thống kê ứng dụng
Vận dụng các phương pháp thống kê trong phân tích, đánh giá
và dự báo chi tiêu hộ gia đình tại Việt Nam
Giáo viên hướng dẫn: TS. Nguyễn Thị Xuân Mai
Thành viên nhóm: Ngô Thị Ngọc Anh
Nguyễn Thị Thanh Tâm
Phạm Trung Anh Lớp: K33KT2
Hà Nội, 11/2025 2
MỤC LỤC
MỞ ĐẦU ................................................................................................................................... 3
CHƯƠNG 1: THỐNG KÊ MÔ TẢ ........................................................................................... 4 1.1. T ng quan các bi ổ ến trong b d
ộ ữ liệu ............................................................................... 4 1.2. Th ng kê mô t ố
ả các biến định tính .................................................................................. 4 1.3. Th ng kê mô t ố ả các bi ng
ến định lượ ............................................................................... 6
CHƯƠNG 2: KIỂM ĐỊNH GIẢ THUYẾT ............................................................................. 12 2.1. Kiểm định tham s
ố ........................................................................................................ 12
2.1.1. Kiểm định Independent Samples T-test .................................................................. 12
2.1.2. Kiểm định One-way ANOVA ................................................................................ 14
2.2. Kiểm định phi tham s
ố .................................................................................................. 17
2.2.1. Kiểm định Chi-square ............................................................................................. 17
CHƯƠNG 3: PHÂN TÍCH HỒI QUY .................................................................................... 20
3.1. Phân tích tương quan ..................................................................................................... 20 3.2. Phân tích h i quy ồ
........................................................................................................... 21
3.2.1. Phương trình hồi quy đơn .................................................................................... 21
3.2.2. Phương trình hồi quy b i
ộ ..................................................................................... 22
CHƯƠNG 4: PHÂN TÍCH CHUỖI THỜI GIAN VÀ DỰ BÁO ........................................... 25
4.1. Phân tích biến động chuỗi thời gian .............................................................................. 25
4.1.1. Tính xu thế .............................................................................................................. 25 4.1.2. Tính mùa v
ụ............................................................................................................ 27
4.1.3. Tính chu kỳ ............................................................................................................. 28
4.2. Dự báo bằng phương pháp làm trơn chuỗi thời gian..................................................... 29
KẾT LUẬN .............................................................................................................................. 31
BẢNG PHÂN CÔNG CÔNG VIỆC CỦA NHÓM ................................................................. 32 3
MỞ ĐẦU
Trong bối cảnh Việt Nam đang đẩy mạnh phát triển kinh tế gắn liền với nâng cao đời
sống người dân, việc nghiên cứu hành vi và mức chi tiêu của các hộ gia đình có ý nghĩa quan
trọng cả về phương diện kinh tế lẫn xã hội. Bài báo cáo này vận dụng các phương pháp thống
kê trong phân tích, đánh giá và dự báo chi tiêu hộ gia đình tại Việt Nam, sử dụng bộ dữ liệu
Khảo sát mức sống dân cư năm 2018 và phần mềm SPSS làm công cụ xử lý.
Mục tiêu nghiên cứu nhằm:
(1) Mô tả đặc điểm chi tiêu của hộ gia đình theo khu vực dân cư và vùng kinh tế - xã hội;
(2) Kiểm định sự khác biệt về mức chi tiêu giữa các nhóm hộ;
(3) Xác định các yếu tố có ảnh hưởng đến tổng chi tiêu của hộ gia đình;
(4) Phân tích xu hướng biến động, tính mùa vụ, đồng thời dự báo mức chi tiêu trong giai đoạn tiếp theo.
Kết quả nghiên cứu cung cấp cơ sở thực nghiệm giúp hiểu rõ hơn cấu trúc và hành vi
chi tiêu của các hộ gia đình Việt Nam, qua đó gợi ý định hướng cho việc hoạch định chính
sách kinh tế - xã hội theo vùng và khu vực dân cư.
Nội dung bài báo cáo gồm bốn chương chính:
• Chương 1: Thống kê mô tả;
• Chương 2: Kiểm định giả thuyết;
• Chương 3: Phân tích hồi quy;
• Chương 4: Phân tích chuỗi thời gian và dự báo. 4
CHƯƠNG 1: THỐNG KÊ MÔ TẢ
Chương này mô tả đặc điểm cơ bản của dữ liệu nghiên cứu, bao gồm các biến
định tính như: khu vực dân cư, vùng kinh tế - xã hội và các biến định lượng như: tổng
chi tiêu, chi tiêu thực phẩm, chi tiêu y tế của hộ gia đình. Thông qua thống kê mô tả,
nhóm đánh giá được hình dạng phân phối, xu hướng trung tâm, mức độ phân tán và các
giá trị ngoại lai của dữ liệu, đây là nền tảng quan trọng cho các kiểm định giả thuyết và
mô hình hồi quy ở các chương sau.
1.1. Tổng quan các biến trong bộ dữ liệu
Bộ dữ liệu gồm 1000 hộ gia đình với đầy đủ giá trị, không có giá trị khuyết thiếu
nên phù hợp để thực hiện các kiểm định và hồi quy trong báo cáo.
Bảng 1. Thông tin cơ bản của các biến
Kí hiệu biến Tên biến
Loại biến Đơn vị urban Khu vực dân cư Biến định danh region Vùng kinh tế - xã hội Biến thứ bậc cons
Tổng chi tiêu của hộ gia đình Biến định lượng Nghìn đồng oop
Tổng chi tiêu của hộ gia đình cho y tế Biến định lượng Nghìn đồng fcons
Tổng chi tiêu của hộ gia đình cho thực phẩm Biến định lượng Nghìn đồng
* Nguồn: Nhóm tác giả tổng hợp từ bộ dữ liệu
1.2. Thống kê mô tả các biến định tính
Bảng 2. Phân b h
ố ộ gia đình theo khu vực dân cư Cumulative Frequency Percent Valid Percent Percent Valid Nông thôn 712 71.2 71.2 71.2 Thành thị 288 28.8 28.8 100.0 Total 1000 100.0 100.0
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Từ bảng 2 và Hình 1, cho ta thấy có 71,2% hộ gia đình sống ở nông thôn và 28,8%
hộ sống ở thành thị, phản ánh mẫu nghiên cứu tập trung chủ yếu ở khu vực nông thôn. 5
Hình 1. Biểu đồ phân b khu v ố ực dân cư
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Từ kết quả Bảng 3 và Hình 2, mẫu điều tra phân bố tương đối đồng đều giữa các
vùng, trong đó Bắc Trung Bộ & Duyên hải miền Trung và Trung du & miền núi phía
Bắc chiếm tỷ trọng lớn nhất (lần lượt là 21,9% và 21,4%). Vùng Tây Nguyên chiếm tỷ
trọng nhỏ nhất với 7% trong kỳ điều tra.
Bảng 3. Phân b h ố
ộ gia đình theo vùng kinh tế- xã hội Cumulative Frequency Percent Valid Percent Percent Valid
Bắc Trung Bộ và Duyên hải miền Trung 219 21.9 21.9 21.9
Trung du và miền núi phía Bắc 214 21.4 21.4 43.3
Đồng bằng sông Cửu Long 203 20.3 20.3 63.6 Đồng bằng sông Hồng 176 17.6 17.6 81.2 Đông Nam Bộ 118 11.8 11.8 93.0 Tây Nguyên 70 7.0 7.0 100.0 Total 1000 100.0 100.0
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26 6
Hình 2. Biểu đồ phân b vùng kinh t ố ế- xã h i ộ
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
1.3. Thống kê mô tả các biến định lượng
Bảng 4. Th ng kê mô t ố
ả các biến chi tiêu
Tổng chi tiêu thực tế của hộ
Tổng chi tiêu của hộ gia
Tổng chi tiêu của hộ gia gia đình đình cho y tế đình cho thực phẩm N Valid 1000 1000 1000 Missing 0 0 0 Mean 97120234.5000 4125091.00 8419144.00 Std. Error of Mean 1974293.95380 228373.312 226936.488 Median 83866000.0000 1432000.00 6380000.00 Mode 43730000.00a 0 5010000a Std. Deviation 62432656.64698 7221798.217 7176361.873 Variance 3897836615999612.500 52154369494213.140 51500169728992.990 Skewness 1.345 3.702 1.699 Std. Error of Skewness .077 .077 .077 Kurtosis 2.600 17.607 3.474 Std. Error of Kurtosis .155 .155 .155 Range 418155500.00 63230000 41810000 Minimum 4205500.00 0 0 Maximum 422361000.00 63230000 41810000 Sum 97120234500.00 4125091000 8419144000 Percentiles 25 52019250.0000 500000.00 3342500.00 7
Tổng chi tiêu thực tế của hộ
Tổng chi tiêu của hộ gia
Tổng chi tiêu của hộ gia gia đình đình cho y tế đình cho thực phẩm 50 83866000.0000 1432000.00 6380000.00 75 128765750.0000 4227500.00 11611250.00
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Dựa trên kết quả tại Bảng 4 cho thấy, cả ba biến định lượng gồm Tổng chi tiêu
thực tế của hộ gia đình, Tổng chi tiêu của hộ gia đình cho y tế và Tổng chi tiêu của hộ
gia đình cho thực phẩm đều có đặc điểm phân phối lệch phải, thể hiện qua mối quan hệ
Mode < Median < Mean và hệ số Skewness > 0. Điều này phản ánh xu hướng chung là
đa số các hộ có mức chi tiêu trung bình hoặc thấp, trong khi một số ít hộ có mức chi
tiêu cao đã kéo giá trị trung bình (Mean) tăng lên đáng kể so với giá trị trung vị (Median).
Cụ thể, biến Tổng chi tiêu thực tế của hộ gia đình có giá trị trung bình đạt
97.120.234 nghìn đồng, trung vị 83.866.000 nghìn đồng và độ lệch chuẩn 62.432.567
nghìn đồng. Hệ số Skewness là 1,345 và Kurtosis đạt 2,6 (< 3) cho thấy phân phối có
dạng lệch phải nhẹ (Hình 3). Khoảng biến thiên rất rộng (từ 4.205.500 nghìn đồng đến
422.361.000 nghìn đồng) phản ánh sự khác biệt đáng kể về mức chi tiêu giữa các hộ.
Phần lớn các hộ có mức chi tiêu thấp hoặc trung bình, trong khi một nhóm nhỏ hộ có
chi tiêu cao đã kéo giá trị trung bình lên cao hơn so với trung vị. Do đó, khi mô tả mức
chi tiêu điển hình của hộ nên ưu tiên sử dụng các giá trị trung vị hoặc các phân vị để
phản ánh sát thực tế hơn.
Đối với biến Tổng chi tiêu của hộ gia đình cho y tế, kết quả thống kê cho thấy
mức độ lệch phải rất mạnh, với Skewness = 3,702 và Kurtosis = 17,607 (Hình 4). Giá
trị trung bình đạt 4.125.091 nghìn đồng, trong khi trung vị chỉ 1.432.000 nghìn đồng và
mode bằng 0, thể hiện sự tập trung lớn của dữ liệu ở mức chi tiêu thấp hoặc bằng không.
Tuy nhiên, vẫn tồn tại một số ít hộ có chi tiêu y tế ở mức rất cao, làm cho phân phối bị
kéo dài về phía phải và có dạng nhọn. Đặc điểm này phản ánh thực tế là chi tiêu y tế
thường phát sinh không đều, phụ thuộc vào tình trạng sức khỏe hoặc các yếu tố đột xuất
của hộ. Vì vậy, khi phân tích cần đặc biệt lưu ý đến nhóm hộ có chi tiêu y tế cao đột
biến, đồng thời nên sử dụng trung vị và các phân vị để mô tả chính xác hơn đặc điểm phân bố của biến này.
Biến Tổng chi tiêu của hộ gia đình cho thực phẩm cũng có xu hướng lệch phải,
với Skewness = 1,699 và Kurtosis = 3,474 (>3) cho thấy phân phối hơi nhọn với đuôi
phải (Hình 5). Giá trị trung bình đạt 8.419.144 nghìn đồng, trung vị 6.380.000 nghìn
đồng, trong khi khoảng biến thiên dao động từ 0 đến 41.810.000 nghìn đồng. Kết quả 8
này cho thấy phần lớn hộ có chi tiêu thực phẩm ở mức trung bình hoặc thấp, nhưng vẫn
có một số hộ có chi tiêu thực phẩm cao hơn đáng kể (có thể do quy mô hộ lớn hoặc mức
sống cao) khiến giá trị trung bình vượt lên trên trung vị.
Nhìn chung, cả ba biến đều có dạng phân phối lệch phải, phản ánh sự chênh lệch
về mức chi tiêu giữa các hộ gia đình. Đa số các hộ có mức chi tiêu trung bình hoặc thấp,
trong khi một số ít hộ có mức chi tiêu cao đã làm dịch chuyển giá trị trung bình của mẫu
về phía phải. Đặc điểm này cho thấy sự khác biệt rõ rệt trong mức sống và chi tiêu giữa
các hộ, đồng thời gợi ý rằng các chỉ tiêu trung vị và phân vị sẽ là những thước đo phù
hợp hơn để phản ánh mức chi tiêu điển hình.
Hình 3. Biểu đồ histogam tổng chi tiêu thực tế của hộ gia đình
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26 9
Hình 4. Biểu đồ histogam tổng chi tiêu của hộ gia đình cho y tế
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Hình 5. Biểu đồ histogam tổng chi tiêu của hộ gia đình cho thực phẩm
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Dựa trên các chỉ số Mode, Median, Mean, Skewness và Kurtosis, nhóm tiếp tục
thực hiện kiểm tra biểu đồ Boxplot nhằm nhận diện các giá trị ngoại lai (outliers). Kết
quả thể hiện tại Hình 6, Hình 7 và Hình 8. 10
Trước khi xem xét Boxplot, nhóm đã tiến hành kiểm tra Z-score trên phần mềm
SPSS, kết quả cho thấy không có quan sát nào có |Z| ≥ 3, do đó có thể chấp nhận các
giá trị outlier hiển thị trên Boxplot là hợp lý về mặt thống kê.
Quan sát biểu đồ cho thấy Tổng chi tiêu thực tế của hộ gia đình và chi tiêu cho
thực phẩm chỉ xuất hiện một số ít giá trị ngoại lai, chủ yếu là các điểm đột xuất đơn lẻ,
không ảnh hưởng đáng kể đến phân phối chung. Ngược lại, tổng chi tiêu của hộ gia đình
cho y tế thể hiện sự lệch phải rõ rệt với phần đuôi phải kéo dài và số lượng giá trị ngoại lai lớn hơn.
Tuy nhiên, nhằm đảm bảo tính toàn vẹn và khách quan của bộ dữ liệu, nhóm
không loại bỏ thêm bất kỳ quan sát nào, mà giữ nguyên toàn bộ các giá trị có |Z| < 3 để
phục vụ cho các phân tích tiếp theo.
Hình 6. Biểu đồ boxplot cho tổng chi tiêu thực tế của hộ gia đình
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26 11
Hình 7. Biểu đồ boxplot tổng chi tiêu của hộ gia đình cho thực phẩm
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Hình 8. Biểu đồ boxplot tổng chi tiêu của hộ gia đình cho y tế
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26 12
CHƯƠNG 2: KIỂM ĐỊNH GIẢ THUYẾT
Chương này nhằm kiểm tra xem các khác biệt hoặc mối quan hệ quan sát được
trong mô tả có ý nghĩa thống kê hay không, thông qua các kiểm định tham số và phi
tham số. Mục tiêu là xác định:
(i) Sự khác biệt chi tiêu giữa khu vực nông thôn và thành thị;
(ii) Sự khác biệt chi tiêu giữa các vùng kinh tế;
(iii) Mối quan hệ giữa khu vực dân cư và vùng kinh tế - xã hội.
2.1. Kiểm định tham số
2.1.1. Kiểm định Independent Samples T-test
Nhóm tác giả sử dụng kiểm định Independent Samples T-test nhằm xem xét liệu
mức chi tiêu trung bình của hộ gia đình ở khu vực thành thị và nông thôn có sự khác
biệt có ý nghĩa thống kê hay không.
Trước khi diễn giải kết quả kiểm định T, cần xem xét kiểm định Levene’s Test
để xác định giả định đồng nhất phương sai có được thỏa mãn hay không. Kết quả của
kiểm định Levene sẽ quyết định việc sử dụng hàng kết quả Equal variances assumed
(khi phương sai bằng nhau) hay Equal variances not assumed (khi phương sai khác nhau) trong bảng T-test.
Các giả thuyết kiểm định được đặt ra như sau:
(1) Kiểm định Levene’s Test về đồng nhất phương sai
• H0: Phương sai giữa hai nhóm bằng nhau (hai khu vực có mức độ biến
thiên chi tiêu tương đương).
• H1: Phương sai giữa hai nhóm khác nhau (hai khu vực có độ biến thiên
chi tiêu khác biệt đáng kể).
Nếu Sig (Levene’s Test) > 0,05, chấp nhận H₀, nghĩa là phương sai hai nhóm
bằng nhau, sử dụng hàng Equal variances assumed.
Ngược lại, nếu Sig ≤ 0,05, bác bỏ H₀, nghĩa là phương sai khác nhau, sử dụng
hàng Equal variances not assumed.
(2) Kiểm định Independent Samples T-test về sự khác biệt trung bình
• H0: Không có sự khác biệt về tổng chi tiêu trung bình giữa hộ gia đình ở
khu vực thành thị và nông thôn. 13
• H1: Có sự khác biệt về tổng chi tiêu trung bình giữa hai khu vực.
Khi Sig (2-tailed) ≤ 0,05, bác bỏ H0, ta khẳng định có sự khác biệt có ý nghĩa
thống kê về chi tiêu trung bình giữa hai khu vực.
Ngược lại, nếu Sig (2-tailed) > 0,05, không đủ bằng chứng để kết luận có sự khác
biệt về chi tiêu trung bình giữa hai khu vực.
Bảng 5. Kết qu so sánh t ả ng chi tiêu th ổ
ực tế giữa nông thôn và thành thị Group Statistics Khu vực dân cư N Mean Std. Deviation Std. Error Mean Tổng chi tiêu thực Nông thôn 712 87671650.3511 55743741.57686 2089085.03875 tế của hộ gia đình Thành thị 288 120479234.2014 71418992.03790 4208404.46463 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means Sig. 95% Confidence Interval (2- Std. Error of the Difference F Sig. t df tailed) Mean Difference Difference Lower Upper Tổng chi Equal 22.253 .000 -7.744 998
.000 -32807583.85027 4236649.23456 - - tiêu thực tế variances 41121346. 24493821.2 của hộ gia assumed 40428 9625 đình Equal -6.983 435.206
.000 -32807583.85027 4698398.07137 - - variances not 42041955. 23573212.0 assumed 61189 8864
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Từ Bảng 5, ta quan sát thấy kết quả kiểm định Levene’s Test có giá trị Sig = 0,00
< 0,05, do đó bác bỏ giả thuyết H0 và chấp nhận H1, tức là phương sai giữa hai nhóm
không đồng nhất. Vì vậy, khi đọc kết quả Independent Samples T-test, ta sử dụng giá
trị ở dòng Equal variances not assumed.
Kết quả cho thấy giá trị Sig (2-tailed) = 0,00 < 0,05, do đó bác bỏ H0 và chấp
nhận H1, khẳng định rằng tổng chi tiêu thực tế trung bình của hộ gia đình giữa hai khu
vực thành thị và nông thôn có sự khác biệt có ý nghĩa thống kê.
Cụ thể, mức chi tiêu trung bình của hộ thành thị cao hơn hộ nông thôn khoảng
32,8 triệu đồng. Điều này cho thấy hộ gia đình ở khu vực thành thị có mức chi tiêu cao
hơn đáng kể so với khu vực nông thôn, phản ánh rõ nét sự chênh lệch về thu nhập, mức
sống và điều kiện kinh tế - xã hội giữa hai khu vực tại Việt Nam. 14
2.1.2. Kiểm định One-way ANOVA
Nhóm tác giả tiến hành kiểm định One-way ANOVA nhằm xem xét liệu tổng
chi tiêu thực tế trung bình của hộ gia đình có sự khác biệt có ý nghĩa thống kê giữa các
vùng kinh tế - xã hội hay không.
Các giả thuyết kiểm định được đặt ra như sau:
(1) Kiểm định Levene’s Test về sự đồng nhất phương sai
• H0: Phương sai của tổng chi tiêu giữa các vùng bằng nhau.
• H1: Có ít nhất hai vùng có phương sai khác nhau.
(2) Kiểm định One-way ANOVA về sự khác biệt trung bình
• H0: Không có sự khác biệt về tổng chi tiêu trung bình giữa các vùng kinh tế - xã hội.
• H1: Có ít nhất một vùng có tổng chi tiêu trung bình khác biệt so với vùng khác.
Kết quả kiểm định Levene’s Test (Bảng 5) cho thấy giá trị Sig = 0,000 < 0,05,
do đó bác bỏ giả thuyết H0 và chấp nhận H1, nghĩa là phương sai giữa các vùng không
đồng nhất. Vì vậy, nhóm lựa chọn phép kiểm định hậu nghiệm Post Hoc là Games–
Howell, thuộc nhóm Equal Variances Not Assumed, bởi phương pháp này không yêu
cầu giả định phương sai bằng nhau, đồng thời phù hợp với dữ liệu có độ lệch cao hoặc
chứa giá trị ngoại lai.
Bảng 5. Kết qu ki
ả ểm định oneway ANOVA
Test of Homogeneity of Variances Levene Statistic df1 df2 Sig.
Tổng chi tiêu thực tế của hộ Based on Mean 5.119 5 994 .000 gia đình Based on Median 4.674 5 994 .000 Based on Median and with 4.674 5 952.979 .000 adjusted df Based on trimmed mean 5.066 5 994 .000 ANOVA Sum of Squares df Mean Square F Sig. Between Groups 2012214288416 5 4024428576833 10.833 .000 69216.000 3840.000 Within Groups 3692717350541 994 3715007394911 944800.000 413.500 15 ANOVA Sum of Squares df Mean Square F Sig. Total 3893938779383 999 614000.000
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Bảng 6. Kết quả Post Hoc (Games-Howell) của kiểm định ANOVA Multiple Comparisons
Dependent Variable: Tổng chi tiêu thực tế của hộ gia đình Games-Howell (I) Vùng kinh tế 95% Confidence Interval - xã hội
(J) Vùng kinh tế - xã hội Mean Difference (I-J) Std. Error Sig. Lower Bound Upper Bound Trung du và Đồng bằng sông Hồng 27419940.14444* 6108853.16869 .000 9923365.5831 44916514.7058 miền núi phía Bắc Trung Bộ và Duyên 18236082.69321* 6024115.98077 .031 987338.5157 35484826.8708 Bắc hải miền Trung Tây Nguyên 19165422.67690 8738173.19478 .248 -6111799.2214 44442644.5752 Đông Nam Bộ -17089648.37637 7843938.84737 .252 -39621965.8269 5442669.0742 Đồng bằng sông Cửu 21090516.29759* 6329239.24358 .012 2968829.4423 39212203.1529 Long Đồng bằng
Trung du và miền núi phía -27419940.14444* 6108853.16869 .000 -44916514.7058 -9923365.5831 sông Hồng Bắc Bắc Trung Bộ và Duyên -9183857.45122 5415653.22635 .535 -24695030.7240 6327315.8216 hải miền Trung Tây Nguyên -8254517.46753 8330365.97638 .920 -32418758.2309 15909723.2958 Đông Nam Bộ -44509588.52080* 7386927.85667 .000 -65761550.1180 -23257626.9236 Đồng bằng sông Cửu -6329423.84684 5753137.91951 .881 -22808948.7925 10150101.0988 Long Bắc Trung Bộ
Trung du và miền núi phía -18236082.69321* 6024115.98077 .031 -35484826.8708 -987338.5157 và Duyên hải Bắc miền Trung Đồng bằng sông Hồng 9183857.45122 5415653.22635 .535 -6327315.8216 24695030.7240 Tây Nguyên 929339.98369 8268426.91287 1.000 -23064174.1217 24922854.0890 Đông Nam Bộ -35325731.06958* 7317006.86571 .000 -56378621.0899 -14272841.0493 Đồng bằng sông Cửu 2854433.60438 5663080.63107 .996 -13360372.0804 19069239.2891 Long Tây Nguyên
Trung du và miền núi phía -19165422.67690 8738173.19478 .248 -44442644.5752 6111799.2214 Bắc Đồng bằng sông Hồng 8254517.46753 8330365.97638 .920 -15909723.2958 32418758.2309 Bắc Trung Bộ và Duyên -929339.98369 8268426.91287 1.000 -24922854.0890 23064174.1217 hải miền Trung Đông Nam Bộ -36255071.05327* 9674930.84756 .003 -64169874.0834 -8340268.0231 Đồng bằng sông Cửu 1925093.62069 8493302.04728 1.000 -22681666.9790 26531854.2204 Long 16 Multiple Comparisons
Dependent Variable: Tổng chi tiêu thực tế của hộ gia đình Games-Howell (I) Vùng kinh tế 95% Confidence Interval - xã hội
(J) Vùng kinh tế - xã hội Mean Difference (I-J) Std. Error Sig. Lower Bound Upper Bound Đông Nam Bộ
Trung du và miền núi phía 17089648.37637 7843938.84737 .252 -5442669.0742 39621965.8269 Bắc Đồng bằng sông Hồng 44509588.52080* 7386927.85667 .000 23257626.9236 65761550.1180 Bắc Trung Bộ và Duyên 35325731.06958* 7317006.86571 .000 14272841.0493 56378621.0899 hải miền Trung Tây Nguyên 36255071.05327* 9674930.84756 .003 8340268.0231 64169874.0834 Đồng bằng sông Cửu 38180164.67396* 7570197.19199 .000 16416790.5659 59943538.7820 Long Đồng bằng
Trung du và miền núi phía -21090516.29759* 6329239.24358 .012 -39212203.1529 -2968829.4423 sông Cửu Long Bắc Đồng bằng sông Hồng 6329423.84684 5753137.91951 .881 -10150101.0988 22808948.7925 Bắc Trung Bộ và Duyên -2854433.60438 5663080.63107 .996 -19069239.2891 13360372.0804 hải miền Trung Tây Nguyên -1925093.62069 8493302.04728 1.000 -26531854.2204 22681666.9790 Đông Nam Bộ -38180164.67396* 7570197.19199 .000 -59943538.7820 -16416790.5659
*. The mean difference is significant at the 0.05 level.
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Dựa trên Bảng 6, kết quả kiểm định Games–Howell cho thấy có nhiều cặp vùng
kinh tế - xã hội có sự khác biệt có ý nghĩa thống kê về tổng chi tiêu thực tế của hộ gia
đình, với giá trị p-value < 0.05, cụ thể như sau:
• Vùng Trung du và miền núi phía Bắc có khác biệt về tổng chi tiêu trung
bình so với Đồng bằng sông Hồng, Bắc Trung Bộ và Duyên hải miền
Trung, và Đồng bằng sông Cửu Long.
• Vùng Đồng bằng sông Hồng có khác biệt về tổng chi tiêu trung bình so
với Trung du và miền núi phía Bắc và Đông Nam Bộ.
• Vùng Bắc Trung Bộ và Duyên hải miền Trung có khác biệt về tổng chi
tiêu trung bình so với Trung du và miền núi phía Bắc và Đông Nam Bộ.
• Vùng Tây Nguyên có khác biệt về tổng chi tiêu trung bình so với Đông Nam Bộ.
• Vùng Đông Nam Bộ có khác biệt về tổng chi tiêu trung bình so với hầu
hết các vùng còn lại, bao gồm Đồng bằng sông Hồng, Bắc Trung Bộ và
Duyên hải miền Trung, Tây Nguyên, và Đồng bằng sông Cửu Long. 17
• Vùng Đồng bằng sông Cửu Long có khác biệt về tổng chi tiêu trung bình
so với Trung du và miền núi phía Bắc và Đông Nam Bộ.
Từ kết quả trên có thể thấy, các vùng kinh tế - xã hội có sự khác biệt có ý nghĩa
thống kê về tổng chi tiêu thực tế của hộ gia đình. Kết quả này phù hợp với thực tế kinh
tế - xã hội Việt Nam, khi các vùng có mức độ phát triển công nghiệp, đô thị hóa và thu
nhập bình quân đầu người cao hơn thường có mức chi tiêu hộ gia đình lớn hơn. Ngược
lại, những vùng có tỷ lệ nông nghiệp cao, thu nhập thấp và hạ tầng chưa phát triển đồng
bộ thường có mức chi tiêu thấp hơn trung bình.
2.2. Kiểm định phi tham số
2.2.1. Kiểm định Chi-square
Nhóm tác giả sử dụng kiểm định Chi-square (Kiểm định độc lập – Chi-square
Test of Independence) nhằm xem xét liệu khu vực dân cư (thành thị – nông thôn) có
mối quan hệ phụ thuộc hay độc lập với vùng kinh tế - xã hội hay không.
Ta có các cặp giả thuyết như sau:
• H0: Khu vực dân cư độc lập với vùng kinh tế - xã hội (không có mối liên hệ giữa hai biến).
• H1: Khu vực dân cư có liên quan với vùng kinh tế - xã hội (hai biến có
mối quan hệ phụ thuộc).
Dựa vào kết quả ở Bảng 7, giá trị Sig. (2-sided) = 0,00 < 0.05, do đó bác bỏ giả
thuyết H0 và chấp nhận giả thuyết H1. Điều này cho thấy có mối liên hệ giữa khu vực
dân cư và vùng kinh tế - xã hội. 18
Bảng 7. Kiểm định m i quan h ố
ệ giữa khu vực dân cư và vùng kinh tế - xã hội
Vùng kinh tế - xã hội * Khu vực dân cư Crosstabulation Khu vực dân cư Nông thôn Thành thị Total Vùng kinh tế - xã hội
Trung du và miền núi phía Count 153 61 214 Bắc
% within Vùng kinh tế - xã hội 71.5% 28.5% 100.0% % within Khu vực dân cư 21.5% 21.2% 21.4% % of Total 15.3% 6.1% 21.4% Đồng bằng sông Hồng Count 141 35 176
% within Vùng kinh tế - xã hội 80.1% 19.9% 100.0% % within Khu vực dân cư 19.8% 12.2% 17.6% % of Total 14.1% 3.5% 17.6%
Bắc Trung Bộ và Duyên hải Count 155 64 219 miền Trung
% within Vùng kinh tế - xã hội 70.8% 29.2% 100.0% % within Khu vực dân cư 21.8% 22.2% 21.9% % of Total 15.5% 6.4% 21.9% Tây Nguyên Count 50 20 70
% within Vùng kinh tế - xã hội 71.4% 28.6% 100.0% % within Khu vực dân cư 7.0% 6.9% 7.0% % of Total 5.0% 2.0% 7.0% Đông Nam Bộ Count 58 60 118
% within Vùng kinh tế - xã hội 49.2% 50.8% 100.0% % within Khu vực dân cư 8.1% 20.8% 11.8% % of Total 5.8% 6.0% 11.8%
Đồng bằng sông Cửu Long Count 155 48 203
% within Vùng kinh tế - xã hội 76.4% 23.6% 100.0% % within Khu vực dân cư 21.8% 16.7% 20.3% % of Total 15.5% 4.8% 20.3% Total Count 712 288 1000
% within Vùng kinh tế - xã hội 71.2% 28.8% 100.0% % within Khu vực dân cư 100.0% 100.0% 100.0% % of Total 71.2% 28.8% 100.0% Chi-Square Tests Value df
Asymptotic Significance (2-sided) Pearson Chi-Square 37.452a 5 .000 Likelihood Ratio 35.334 5 .000 Linear-by-Linear Association 2.066 1 .151 N of Valid Cases 1000
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 20.16.
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26 19
Bên cạnh đó, phân bố dân cư giữa khu vực thành thị và nông thôn không đồng
đều giữa các vùng kinh tế. Như vậy, kiểm định Chi-square không chỉ khẳng định mối
liên hệ giữa khu vực dân cư và vùng kinh tế - xã hội, mà còn phản ánh sự khác biệt về
cơ cấu dân cư và trình độ phát triển giữa các vùng của Việt Nam. 20
CHƯƠNG 3: PHÂN TÍCH HỒI QUY
3.1. Phân tích tương quan
Hình 10. Biểu đồ scatter plot giữa biến chi tiêu của h cho th ộ ực ph m và bi ẩ ến
tổng chi tiêu của hộ
* Nguồn: Nhóm tác giả tính toán trên phần mềm SPSS26
Hình 10 thể hiện mối quan hệ giữa tổng chi tiêu thực tế của hộ gia đình và chi
tiêu dành riêng cho thực phẩm. Mỗi điểm trên biểu đồ tương ứng với một hộ gia đình trong mẫu khảo sát.
Nhìn chung, có thể thấy mối tương quan dương khá rõ ràng giữa hai biến. Khi
chi tiêu cho thực phẩm tăng thì tổng chi tiêu của hộ gia đình cũng có xu hướng tăng
theo. Điều này phản ánh rằng chi tiêu cho thực phẩm là một trong những khoản mục
chi tiêu chính, chiếm tỷ trọng đáng kể trong tổng chi tiêu của hộ. Ngoài ra, các điểm dữ
liệu tập trung nhiều ở khu vực chi tiêu thấp đến trung bình, cho thấy phần lớn hộ gia
đình có mức chi tiêu không quá cao.
Tuy nhiên, mặc dù xu hướng chung là tăng tuyến tính nhưng độ phân tán của
điểm dữ liệu vẫn tương đối lớn, cho thấy tỷ trọng chi cho thực phẩm trong tổng chi tiêu
có sự khác biệt giữa các hộ. Một số hộ có thể dành tỷ trọng cao cho thực phẩm, trong
khi một số khác có xu hướng chi tiêu nhiều hơn cho các nhu cầu khác như: giáo dục, y tế, giải trí…
Bảng 8. Hệ s
ố tương quan giữa t ng chi tiêu th ổ
ực tế và chi tiêu cho thực ph m c ẩ ủa h ộ