



Preview text:
LÝ THUYẾT THỐNG KÊ 2 BÀI TẬP
HỒI QUY TUYẾN TÍNH ĐƠN Bài 1:
Gọi kids là số con từng sinh của một phụ nữ, và educ là số năm đi học của người phụ
nữ. Mô hình đơn giản thể hiện sự phụ thuộc của kids vào educ:
kids = β0 + β1 educ + u
a) Bạn kỳ vọng β1 có dấu gì? Giải thích.
b) Những yếu tố nào có thể nằm trong u?
c) Liệu các yếu tố kể trên có khả năng tương quan với số năm đi học không? Điều
này có gây vấn đề gì không? Bài 2:
Mô hình: crime_rate = β0 + β1 police + u, với police là số cảnh sát trên đầu người. Bạn
kỳ vọng β1 có dấu gì? Liệu có khả năng biến police tương quan với u không? Tại sao? Bài 3:
Cho dữ liệu mẫu minh hoạ về Chi phí dành cho quảng cáo (QC, triệu đồng) và Doanh
thu (DT, triệu đồng) tại 8 công ty như sau: STT QC DT 1 8 40 2 12 52 3 15 65 4 18 75 5 20 82 6 22 88 7 25 96 8 28 105 ngatkt@neu.edu.vn 1 LÝ THUYẾT THỐNG KÊ 2
a) Viết phương trình hồi quy tổng thể dạng tuyến tính (theo cả biến số và tham
số) thể thể hiện tác động của Quảng cáo lên Doanh thu.
b) Ước lượng mô hình trên bằng OLS. Viết phương trình hồi quy ước lượng thu
được. Giải thích ý nghĩa của hệ số góc ước lượng trong bối cảnh nghiên cứu
c) Dự báo doanh thu của công ty khi chi 19 triệu đồng cho quảng cáo.
d) Tính và giải thích R2. Bài 4:
Cho kết quả hồi quy sau đây thể hiện mối quan hệ giữa thời gian chờ đợi (waiting,
phút) và mức độ hài lòng (satisfaction, thang 1–10, càng cao càng hài lòng) của khách hàng khi đến ngân hàng.
a) Viết phương trình hồi quy mẫu và đánh giá sự phù hợp của phương trình hồi quy mẫu.
b) Ý nghĩa của hệ số chặn ước lượng (Intercept) là gì trong bối cảnh nghiên cứu?
c) Ý nghĩa của ước lượng hệ số hồi quy của biến waiting là gì?
d) Những yếu tố nào khác ngoài thời gian chờ có thể ảnh hưởng đến sự hài lòng của khách hàng? ngatkt@neu.edu.vn 2 LÝ THUYẾT THỐNG KÊ 2
Bài 5: Thực hành R
Cho bộ dữ liệu LFS_5_Sample_sv.dta, trong đó wage là Tiền lương, và tenure
là Thâm niên làm việc (số năm).
1. Đọc dữ liệu từ file LFS_5_Sample_sv.dta vào R và kiểm tra cấu trúc dữ liệu.
2. Tính trung bình, độ lệch chuẩn, min, max cho wage và tenure. Vẽ histogram
của wage để quan sát phân phối lương.
3. Vẽ biểu đồ phân tán (scatterplot) của wage theo tenure (kèm đường hồi
quy). Nhận xét sơ bộ về mối quan hệ giữa hai biến.
4. Thực hiện ước lượng hồi quy tuyến tính đơn wage theo tenure.
5. Dự báo lương cho người có thâm niên 5 năm, 10 năm và 20 năm theo mô hình
hồi quy đã ước lượng. ngatkt@neu.edu.vn 3