THUYẾT THỐNG 2
ngatkt@neu.edu.vn
1
BÀI TẬP
HỒI QUY TUYẾN TÍNH ĐƠN
Bài 1:
Gọi số con từng sinh của một phụ nữ, số năm đi học của người phụ kids educ
nữ. hình đơn giản thể hiện sự phụ thuộc của vào : kids educ
kids = β + β educ + u 0 1
a) Bạn kỳ vọng β dấu gì? Giải thích. 1
b) Những yếu tố nào thể nằm trong u?
c) Liệu các yếu tố kể trên khả năng tương quan với số năm đi học không? Điều
này gây vấn đ không?
Bài 2:
hình: , với số cảnh sát trên đầu người. Bạn crime_rate = β + β police + u0 1 police
kỳ vọng β dấu gì? Liệu khả năng biến police tương quan với u không? Tại sao? 1
Bài 3:
Cho dữ liệu mẫu minh hoạ về Chi phí dành cho quảng cáo ( , triệu đồng) Doanh QC
thu ( , triệu đồng) tại 8 công ty n sau: DT
STT QC DT
1 8 40
2 12 52
3 15 65
4 18 75
5 20 82
6 22 88
7 25 96
8 28 105
THUYẾT THỐNG 2
ngatkt@neu.edu.vn
2
a) Viết phương trình hồi quy tổng th dạng tuyến tính (theo cả biến số tham
số) thể thể hiện tác động của Quảng cáo lên Doanh thu.
b) Ước lượng hình trên bằng OLS. Viết phương trình hồi quy ước lượng thu
được. Giải thích ý nghĩa của hệ số góc ước lượng trong bối cảnh nghiên cứu
c) Dự báo doanh thu của công ty khi chi 19 triệu đồng cho quảng cáo.
d) Tính giải thích R . 2
Bài 4:
Cho kết quả hồi quy sau đây thể hiện mối quan hệ giữa thời gian chờ đợi ( , waiting
phút) mức độ hài lòng ( , thang 1–10, càng cao càng hài lòng) của khách satisfaction
hàng khi đến ngân hàng.
a) Viết phương trình hồi quy mẫu đánh giá sự phù hợp của phương trình hồi
quy mẫu.
b) Ý nghĩa của h số chặn ước ợng (Intercept) trong bối cảnh nghiên cứu?
c) Ý nghĩa của ước lượng hệ số hồi quy của biến waiting gì?
d) Những yếu tố nào khác ngoài thời gian chờ thể ảnh hưởng đến sự hài lòng
của khách hàng?
THUYẾT THỐNG 2
ngatkt@neu.edu.vn
3
Bài 5: Thực hành R
Cho bộ dữ liệu LFS_5_Sample_sv.dta, trong đówage Tiền lương, tenure
Thâm niên m việc (số năm).
1. Đọc dữ liệu từ file vào R kiểm tra cấu trúc dữ LFS_5_Sample_sv.dta
liệu.
2. Tính trung bình, độ lệch chuẩn, min, max cho Vẽ histogram wage tenure.
của wageđể quan t phân phối ơng.
3. Vẽ biểu đồ phân tán (scatterplot) của theo (kèm đường hồi wage tenure
quy). Nhận xét bộ về mối quan hệ giữa hai biến.
4. Thực hiện ước lượng hồi quy tuyến tính đơn wage theo tenure.
5. Dự báo lương cho người thâm niên 5 năm, 10 năm 20 năm theo mô hình
hồi quy đã ước lượng.

Preview text:

LÝ THUYẾT THỐNG KÊ 2 BÀI TẬP
HỒI QUY TUYẾN TÍNH ĐƠN Bài 1:
Gọi kids là số con từng sinh của một phụ nữ, và educ là số năm đi học của người phụ
nữ. Mô hình đơn giản thể hiện sự phụ thuộc của kids vào educ:
kids = β0 + β1 educ + u
a) Bạn kỳ vọng β1 có dấu gì? Giải thích.
b) Những yếu tố nào có thể nằm trong u?
c) Liệu các yếu tố kể trên có khả năng tương quan với số năm đi học không? Điều
này có gây vấn đề gì không? Bài 2:
Mô hình: crime_rate = β0 + β1 police + u, với police là số cảnh sát trên đầu người. Bạn
kỳ vọng β1 có dấu gì? Liệu có khả năng biến police tương quan với u không? Tại sao? Bài 3:
Cho dữ liệu mẫu minh hoạ về Chi phí dành cho quảng cáo (QC, triệu đồng) và Doanh
thu (DT, triệu đồng) tại 8 công ty như sau: STT QC DT 1 8 40 2 12 52 3 15 65 4 18 75 5 20 82 6 22 88 7 25 96 8 28 105 ngatkt@neu.edu.vn 1 LÝ THUYẾT THỐNG KÊ 2
a) Viết phương trình hồi quy tổng thể dạng tuyến tính (theo cả biến số và tham
số) thể thể hiện tác động của Quảng cáo lên Doanh thu.
b) Ước lượng mô hình trên bằng OLS. Viết phương trình hồi quy ước lượng thu
được. Giải thích ý nghĩa của hệ số góc ước lượng trong bối cảnh nghiên cứu
c) Dự báo doanh thu của công ty khi chi 19 triệu đồng cho quảng cáo.
d) Tính và giải thích R2. Bài 4:
Cho kết quả hồi quy sau đây thể hiện mối quan hệ giữa thời gian chờ đợi (waiting,
phút) và mức độ hài lòng (satisfaction, thang 1–10, càng cao càng hài lòng) của khách hàng khi đến ngân hàng.
a) Viết phương trình hồi quy mẫu và đánh giá sự phù hợp của phương trình hồi quy mẫu.
b) Ý nghĩa của hệ số chặn ước lượng (Intercept) là gì trong bối cảnh nghiên cứu?
c) Ý nghĩa của ước lượng hệ số hồi quy của biến waiting là gì?
d) Những yếu tố nào khác ngoài thời gian chờ có thể ảnh hưởng đến sự hài lòng của khách hàng? ngatkt@neu.edu.vn 2 LÝ THUYẾT THỐNG KÊ 2
Bài 5: Thực hành R
Cho bộ dữ liệu LFS_5_Sample_sv.dta, trong đó wage là Tiền lương, và tenure
là Thâm niên làm việc (số năm).
1. Đọc dữ liệu từ file LFS_5_Sample_sv.dta vào R và kiểm tra cấu trúc dữ liệu.
2. Tính trung bình, độ lệch chuẩn, min, max cho wage và tenure. Vẽ histogram
của wage để quan sát phân phối lương.
3. Vẽ biểu đồ phân tán (scatterplot) của wage theo tenure (kèm đường hồi
quy). Nhận xét sơ bộ về mối quan hệ giữa hai biến.
4. Thực hiện ước lượng hồi quy tuyến tính đơn wage theo tenure.
5. Dự báo lương cho người có thâm niên 5 năm, 10 năm và 20 năm theo mô hình
hồi quy đã ước lượng. ngatkt@neu.edu.vn 3