LÝ THUYT THNG KÊ 2
ngatkt@neu.edu.vn
1
I TP
HI QUY TUYN T Í NH ĐƠN
i 1:
Gi là s con tng sinh ca mt ph n, và là s năm đi hc ca người ph kids educ
kids = β + β educ + u
0 1
a) Bạn k vng β c ó du gì? Gii t hích.
1
b) Nhng yếu t nào có th nm trong u?
c) Liu các y ế u t k trên có kh năng t ư ơng quan v i s năm đi hc không? Điu
này có gây vn đ gì không?
i 2:
Mô hìn h : , với là s cnh sát tr ê n đu người. Bạn crime_rate = β + β police + u
0 1
police
k vng β có d u gì? Liu có kh năng biến polic e t ư ơng quan với u không? Ti sao?
1
i 3:
Cho d liu mu minh ho v Chi phí dành cho qung cáo ( , triu đng) và Doanh QC
thu ( , triu đng) ti 8 công t y như sau: DT
STT
QC
DT
1
8
40
2
12
52
3
15
65
4
18
75
5
20
82
6
22
88
7
25
96
8
28
105
LÝ THUYT THNG KÊ 2
ngatkt@neu.edu.vn
2
a) Viết phương t r ì nh hi quy tn g t h dng tuyến tính (theo c biến s và tham
s) th th hin tác đng ca Qung cáo lên D oanh thu.
b) Ước lượng mô hình trên bng OLS. Viết phương trình h i quy ước lượng thu
được. Gii thích ý n g hĩa ca h s góc ước lượng trong bi cnh n g hiên cu
c) D báo doanh thu ca công ty khi chi 19 tri u đng cho qung cáo.
d) Tính và gii t h í c h R .
2
i 4:
Cho kết qu hi quy sau đây th hin mi quan h gia thời gian chđợi ( , waiting
phút) và mc đ hài lòng ( , th ang 110, càng cao càng hài lòng) ca khách satisfaction
hàng khi đến ng â n hàng.
a) Viết ph ư ơng trình hi quy mu và đánh giá s phù hợp ca phương trình hi
quy mu.
b) Ý nghĩa ca h s chn ước l ượng (Intercept) l à g ì trong bi cnh nghiên cu?
c) Ý nghĩa ca ước lượng h s hi quy ca biế n waiting là gì?
d) Nhng y ế u t nào khác ngoài thời gian chcó th n h hưởng đến s hài lòng
ca khách hàng?
LÝ THUYT THNG KÊ 2
ngatkt@neu.edu.vn
3
i 5: Thc hành R
Cho b d liu LFS_5_Sample_sv.dta, trong đó wage là Tin lương, và tenure
là Thâm niên l àm vic (s năm).
1. Đc d liu t file vào R và kim t r a cu trúc d LFS_5_Sample_sv.dta
liu.
2. Tính trun g bình, đ lch chun, min, max cho và V histo g r a m wage tenure.
ca wage đ quan sát phân phi l ương.
3. V biu đ phân tán (scatterplot) ca theo ( k è m đường hi wage tenure
quy). Nhn xé t s ơ b v mi quan h gia hai biến.
4. Thc hin ưc lượng hi qu y t uyến tính đơn wage theo tenure.
5. D báo lương cho người có thâm niên 5 năm, 10 năm và 20 năm t heo mô hình
hi quy đã ưc l ư ng.

Preview text:

LÝ THUYẾT THỐNG KÊ 2 BÀI TẬP
HỒI QUY TUYẾN T Í NH ĐƠN Bài 1:
Gọi kids là s ố con từng sinh của một phụ nữ, và educ là số năm đi học của người phụ
nữ. Mô hình đơn giản thể hiệ n sự phụ thuộc c ủa kids vào educ: kids = β0 + β1 educ + u
a) Bạn kỳ vọng β 1 c ó dấu gì? Giải t hích.
b) Những yếu tố nào có thể nằm trong u?
c) Liệu các y ế u tố kể trên có khả năng t ư ơng quan v ới số năm đi học không? Điều
này có gây vấn đề gì không? Bài 2:
Mô hìn h : crime_rate = β0 + β1 police + u, với police là số cảnh sát tr ê n đầu người. Bạn
kỳ vọng β1 có dấ u gì? Liệu có kh ả năng biến polic e t ư ơng quan với u không? Tại sao? Bài 3:
Cho dữ liệu mẫu minh ho ạ về Chi phí dành cho quảng cáo (QC, triệu đồng) và Doanh
thu (DT, triệu đồng) tại 8 công t y như sau: STT QC DT 1 8 40 2 12 52 3 15 65 4 18 75 5 20 82 6 22 88 7 25 96 8 28 105 ngatkt@neu.edu.vn 1 LÝ THUYẾT THỐNG KÊ 2
a) Viết phương t r ì nh hồi quy tổn g t hể dạng tuyến tính (theo cả biến số và tham
số) thể thể hiện tác động của Quảng cáo lên D oanh thu.
b) Ước lượng mô hình trên bằng OLS. Viết phương trình hồ i quy ước lượng thu
được. Giải thích ý n g hĩa của hệ số góc ước lượng trong bối cảnh n g hiên cứu
c) Dự báo doanh thu của công ty khi chi 19 triệ u đồng cho quảng cáo.
d) Tính và giải t h í c h R2. Bài 4:
Cho kết quả hồi quy sau đây thể hiện mối quan hệ giữa thời gian chờ đợi (waiting,
phút) và mức độ hài lòng (satisfaction, th ang 1–10, càng cao càng hài lòng) của khách
hàng khi đến ng â n hàng.
a) Viết ph ư ơng trình hồi quy mẫu và đánh giá sự phù hợp của phương trình hồi quy mẫu.
b) Ý nghĩa của hệ số chặn ước l ượng (Intercept) l à g ì trong bối cảnh nghiên cứu?
c) Ý nghĩa của ước lượng hệ số hồi quy của biế n waiting là gì?
d) Những y ế u tố nào khác ngoài thời gian chờ có thể ản h hưởng đến sự hài lòng của khách hàng? ngatkt@neu.edu.vn 2 LÝ THUYẾT THỐNG KÊ 2 Bài 5: Thực hành R
Cho bộ dữ liệu LFS_5_Sample_sv.dta, trong đó wage là Tiền lương, và tenure
là Thâm niên l àm việc (số năm).
1. Đọc dữ liệu từ file LFS_5_Sample_sv.dta vào R và kiểm t r a cấu trúc dữ liệu.
2. Tính trun g bình, độ lệch chuẩn, min, max cho wage và tenure. Vẽ histo g r a m
của wage để quan sát phân phối l ương.
3. Vẽ biểu đồ phân tán (scatterplot) của wage theo tenure ( k è m đường hồi
quy). Nhận xé t s ơ bộ về mối quan hệ giữa hai biến.
4. Thực hiện ước lượng hồi qu y t uyến tính đơn wage theo tenure.
5. Dự báo lương cho người có thâm niên 5 năm, 10 năm và 20 năm t heo mô hình
hồi quy đã ước l ư ợng. ngatkt@neu.edu.vn 3