Tài liệu thực hành Stata môn Tin học Đại cương | Đại Học Thăng Long

Tài liệu thực hành Stata môn Tin học Đại cương | Đại Học Thăng Long được chia sẻ dưới dạng file PDF sẽ giúp bạn đọc tham khảo , củng cố kiến thức ,ôn tập và đạt điểm cao. Mời bạn đọc đón xem!

lOMoARcPSD|40615933
Chương 2:
BT1: Cho MHHQ: log(sales) = beta1 + beta2*log(advert) + ui
* Tạo biến log(sales) và log(advert) Câu lệnh tạo biến gen bien_moi =
hamtinh gen ln_sales = ln(sales) gen ln_advert = ln(advert) * Thực hiện ước lượng
OLS reg ln_sales ln_advert
PTUL: ln_sales = 4,322 + 0,04*ln_advert
*Ý nghĩa beta2 = 0,04 Khi các yếu tố khác trong mô hình không thay đổi, nếu chi phí
quảng cáo tăng lên 1% thì TRUNG BÌNH doanh thu bán hàng tăng tăng 0,04%
BT2.1: Thực hành ước lượng mô hình hồi qui sau: food_exp = beta1 + beta2*income + ui
Thực hiện kiểm định giả thuyết: Ho >= 3,5, H1 < 3,5 Bài làm:
reg food_exp income
PTUL: food_exp = 83,4 + 10,2*income
Ý nghĩa: beta2 = 10,2 Khi các yếu tố khác trong mô hình không thay đổi, nếu thu
nhập tăng 1000 đô thì trung bình chi tiêu trong thực phẩm tăng 10,2 đô
* Khoảng tin cậy 95% beta2 thuộc (5,97; 14,44) ==>Khi các yếu tố khác trong
mô hình không thay đổi, nếu thu nhập tăng lên 1000 đô la thì trung bình trong chi tiêu
tăng ít nhất là 5,97 đô la và tăng nhiều nhất là 14,44 đô la (giải thích ý nghĩa của
khoảng tin cậy tham số beta2)
*Thực hiện kiểm định giả thuyết: Ho: beta2 >= 3,5, H1: beta2 < 3,5
*Thực hiện kiểm định theo phương pháp tới hạn: sca t_thongke =
(10.209-3.5)/2.09 sca list t_thongke t_thongke = 3.2100478 di"
t_tới hạn kiểm định 1 phía, phía trái " invttail(40-2,1-0.05) t_tới
hạn kiểm định 1 phía, phía trái -1.6859545
*Kết luận: t_thongke = 3,21 > t_tới hạn = -1,68 ==> Không đủ bằng chứng để bác bỏ H0,
tương ứng H0 đúng: beta2 >=3,5 với độ tin cậy là 95%
*(bác bỏ H0 kết luận theo H1) BT2.2: CGT2: H0:
beta2 = 8 và H1 # 8 di"t_thống kê = " (10.209-
8)/2.09 t_thống kê = 1.0569378 di" t_tới hạn kiểm
lOMoARcPSD|40615933
định 2 phía = "invttail(38,0.05/2) t_tới hạn kiểm
định 2 phía = 2.0243942
*Kết luận: t_thống kê = 1.056 < t_tới hạn = 2,024 ==> Không đủ bằng chứng để bác bỏ
H0, tương ứng với H0 đúng beta2 = 8 với độ tin cậy là 95%
*Nếu thu nhập tăng 1000 đô thì trung bình chi tiêu cho thực phẩm tăng 8 đô la với ĐTC
95%
BT2.3: CGT3: H0: beta2 = 16 và H1: beta 2 # 16
di"t_thống kê = " (10.209 -16)/2.09 t_thống kê = -
2.7708134 di" t_tới hạn kiểm định 2 phía = "
invttail(38,0.05/2) t_tới hạn kiểm định 2 phía =
2.0243942
*Kết luận: |t_thống kê| = 2,77 > t_tới hạn = 2,024 ==> Đủ bằng chứng để bác bỏ H0,
chấp nhận H1: beta2 # 16 với độ tin cậy 95% BT2.4: CGT4: H0: beta2 >= 15,2 và
H1: beta 2 < 15,2 di"t_thống kê = " (10.209-15.2)/2.09 t_thống kê = -2.3880383 di"
t_tới hạn = " invttail(38,1-0.05) t_tới hạn = -1.6859545
*Kết luận: t_thống kê = -2,388 < t_tới hạn = -1,68 ==> Đủ bằng chứng thống kê để bác
bỏ H0, chấp nhận H1 tương ứng beta2 < 15,2 với ĐTC 95%
*Với ĐTC 95%, khi thu nhập tăng lên 1000 usd thì chi tiêu cho thực phẩm tăng ít hơn
15,2 đô la
*Thực hiện cặp giả thuyết với ĐTC là 99% di
"t_toihan với ĐTC 99% = " invttail(38,1-0.01)
t_toihan với ĐTC 99% = -2.4285676
*Kết luận: t_thống kê = -2,388 > t_tới hạn = -2,42 ==> Không đủ bằng chứng thống kê
để bác bỏ H0, tương ứng beta2 >= 15,2 với ĐTC 99%
BT3: Xây dựng mô hình hồi quy để kiểm định giả thuyết sau: khi thu nhập tăng lên 1%
thì chi tiêu cho thực phẩm tăng 0,5% với ĐTC 95% *MHHQ: log(food_exp) = beta1 +
beta2*log(income) + ui gen ln_food_exp = ln( food_exp)
PTUL: ln_food_exp = 3,96 + 0,55*ln_income
lOMoARcPSD|40615933
* Ý nghĩa của beta2 ==> Khi các yếu tố khác trong mô hình không thay đổi, khi thu nhập
tăng 1% thì trung bình cho chi tiêu trong thực phẩm tăng 0,5% CGT: H0: beta2 = 0,5 và
beta2 # 0,5 sca t_thongke = (_b[ln_income]-0.5)/_se[ln_income] sca list t_thongke
t_thongke = .55515085 di"t_toihan = " invttail(38,0.5/2) t_toihan = .68100088
*KL: t_thong ke < t_toihan ==> Đủ bằng chứng thống kê để bác bỏ H0, chấp nhận H1
tương ứng beta2 # 0,5 với ĐTC 95%
BT4: Người ta cho rằng: khi thu nhập tăng lên 1000 usd thì chi tiêu cho thực phẩm tăng
nhiều hơn 6%.Xây dựng mô hình và thực hiện kiểm định giả thuyết
*MHHQ: log(food_exp) = beta1 + beta2*income +ui
gen ln_food_exp = ln( food_exp) reg ln_food_exp
income
*PTUL: ln_food_exp = 4,78 + 0,04*income
*Ý nghĩa của beta2: Khi các yếu tố trong mô hình khác không thay đổi, nếu thu nhập
tăng lên 1000 usd thì trung bình cho chi tiêu trong thực phẩm tăng 0,04*100% = 4%
*CGT: H0: beta2 <= 6 và H1: beta2 > 6
di"t_thongke = " (0.04-0.06)/0.007
t_thongke = -2.8571429
di"t_toihan = " invttail(38,0.05)
t_toihan = 1.6859545
*KTC 95% cho tham số beta2 = (0,024,0,055) ==> Khi các yếu tố khác trong mô hình
không thay đổi, nếu thu nhập tăng 1 đơn vị(1000 đô la) thì TRUNG BÌNH chi tu cho
thực phẩm tăng ít nhất 0,024*100% = 2,4% và tăng nhiều nhất 0,555*100% = 5,5% (giải
thích ý nghĩa của ktc 95%)
*KL: t_thongke < t_toihan ==> Không đủ bằng chứng để bác bỏ H0, H0 đúng với beta2
<= 6% với ĐTC 95%. Nếu thu nhập tăng 1000 đô la thì chi tiêu cho thực phẩm tăng =
hoặc nhỏ hơn 6% với ĐTC 95%.
*Thực hiện bài toán kiểm định theo phương pháp xác suất
*Bước 1: Tính t thống kê sca t_tk1 =
(_b[income] - 0.06)/_se[income]
lOMoARcPSD|40615933
*Bước 2: Tính p_value của bài toán kiểm định 1 phía - phía phải ===> ttail(bậc tự do,
t_thống kê)
di"P_value kiểm định phía phải= " ttail(e(df_r),t_tk1)
P_value kiểm định phía phải= .99348344
*Bước 3: kết luận: nếu P_value < Mức ý nghĩa thì bác bỏ giả thuyết H0
*KL: P_value = 0,99 > Mức ý nghĩa 0,05 ==> Không đủ bằng chứng thống kê để bác bỏ
giả thuyết H0 tương ứng beta2 <=6% với độ tin cậy 95%
BT5: Thu nhập tăng 1% thì chi tiêu cho thực phẩm tăng 1,5 đô la ĐTC 95%. Xây dựng
mô hình và kiểm định
*MHHQ: food_exp = beta1 + beta2*log(income) + ui
gen ln_income = ln( income) reg food_exp
ln_income
*PTUL: food_exp = -97,18 + 132,16*ln_income
*Ý nghĩa của beta2 ==> Khi các yếu tố khác trong mô hình không thay đổi, nếu thu nhập
tăng lên 1% thì trung bình chi tiêu cho thực phẩm tăng 132,16/100 = 1,32 đô la.
*CGT: H0: beta2 = 150 và H1: beta2 # 150
sca t_thongke = (_b[ ln_income] - 150)/_se[ ln_income]
*Bước 2: Tính P_value của kiểm định 2 phía = 2*ttail(BTD,abs(t_thongke)
di "P_value kiểm định 2 phía = "2*ttail(40-2,abs(t_thongke))
P_value kiểm định 2 phía = .53951721
*KL: p_value = 0,53 > mức ý nghĩa 5% ==> Không đủ bằng chứng để bác bỏ H0 tương
ứng với beta2 = 150 với ĐTC 95%
BT6: *Lấy tập andy.dta. Thực hiện ước lượng mô hình sales = beta1 + beta2*price +ui.
Viết PTUL và giải thích khoảng tin cậy của tham số beta2.
*Khi giá tăng 1 đô thì doanh thu bán hàng giảm 6000 đô. ĐTC 95%
*MHHQ: sales = beta1 + beta2*price + ui
reg sales price
*CGT: H0: beta1 = -6 và H1: beta2 # -6
lOMoARcPSD|40615933
*KĐ pp xác suất sca t_tk =(_b[price]+6)/_se[price] di"
p_value kiểm định 2 phía = " 2*ttail(e(df_r),abs(t_tk))
p_value kiểm định 2 phía = .11382267
*KL: p_value > 0,05 => Không đủ bằng chứng để bác bỏ H0 tương ứng với beta 2 = -6
với ĐTC 95%
BT7: *Người ta cho rằng: khi giá tăng lên 1% thì doanh thu giảm nhiều hơn 5%. Kiểm
định với độ tin cậy 95%
*MHHQ: log(sales) = beta1 + beta2*log(price) + ui
gen ln_price = ln( price) gen ln_sales = ln( sales)
reg ln_sales ln_price
PTUL: ln_sales = 5,34 - 5,75*ln_price
*Ý nghĩa của beta2 => Khi các yếu tố khác trong mô hình không thay đổi, nếu giá tăng
1% thì trung bình doanh thu bán hàng giảm 5,75%
*CGT: H0: beta2 >= -5 và H1: beta2 < -5
sca t_thongke =(_b[ln_price]+5)/_se[ln_price] di "p_value
kiểm định phía trái = "1 - ttail(e(df_r),t_thongke) p_value
kiểm định phía trái = 1
*KL: p_value > 0.05 => Không đủ bằng chứng để bác bỏ H0 với ĐTC 95%, khi giá tăng
1% thì doanh thu giảm ít hơn 5%
BT8: Kiểm định sự phù hợp của mô hình
Người ta cho rằng giá không tác động đến doanh thu, xây dựng cặp giả thuyết và kiểm
định
Viết cặp giả thuyết và kiểm định sự phù hợp của mô hình với độ tin cậy 99%
*CGT: H0: Mô hình không phù hợp và H1: Mô hình phù hợp
*KL: p_value = 0,000 < mức ý nghĩa 1% ==> Đủ bằng chứng thống kê để bác bỏ H0 và
chấp nhận H1 - tương ứng với mô hình phù hợp để giải thích sự thay đổi của doanh thu
với độ tin cậy 99%
lOMoARcPSD|40615933
BT9: Tính khoảng tin cậy 90% cho tham số beta2và giả thích ý nghĩa của khoảng tin cậy
di " Cận dưới ktc 90% = " 121.90 - invttail(73,0.1/2)*6.52 Cận dưới ktc 90% =
111.0377
di " Cận trên ktc 90% = " 121.90 + invttail(73,0.1/2)*6.52
Cận trên ktc 90% = 132.7623
*Kl: KTC 90% tham số beta1 là (111,03; 132,76) ==>Khi các yếu tố khác trong mô hình
không thay đổi, nếu giá =0 thì TRUNG BÌNH doanh thu bán hàng tối thiểu bằng 111,03
nghìn đô và bằng tối đa là 132,76 nghìn đô
Tính khoảng tin cậy 99%cho tham số beta2và giả thích ý nghĩa của khoảng tin cậy
*KL KTC 99% tham số beta2 là (-10,83; -4,80) ==> khi các yếu tố khác trong mô hình
không thay đổi, nếu giá tăng 1 đô là thì trung bình doanh thu bán hàng giảm tối thiểu
4,8 nghìn đô và giảm tối đa là 10,83 nghìn đô *Nếu giá là 5 đô thì doanh thu bán
hàng =?
*dựa vào mô hình ước lượng *PTUL:
sale = 121,9 - 7,82*price di "Price = 5
==> Sales = " 121.9 -7.82*5 Price = 5
==> Sales = 82.8
*Nếu giá = 5 đô thì doanh thu bán hàng là 82,8 nghìn đô
*Cách kiểm tra tính khoảng tin cậy của tham số beta
reg sales price,level(90)
*Dự báo khoảng tin cậy 95% cho doanh thu bán hàng khi giá = 5 usd
*Bước 1: Tạo miền chứa giá trị dự báo: set obs n+1
set obs 76
*Bước 2 Thay price = 5 tại dòng 76
==> replace price = 5 in 76
*Bước 3: Thực hiện dự báo cho doanh thu ==> predict ten_bien
predict doanh_thu
lOMoARcPSD|40615933
*Bước 4: Tính sai số chuẩn của giá trị dự báo ==> predict saiso,stdf
predict saisochuan,stdf
-*Bước 5: Tính cận trên và cận dưới bằng hàm gen gen
CT = doanh_thu + invttail(73,0.05/2)*saisochuan
gen CD = doanh_thu - invttail(73,0.05/2)*saisochuan
*Bước 6: Hiện kết quả ==> list ten_bien in 76 list price
CD doanh_thu CT in 76
*KL: Nếu giá = 5 usd thì KTC 95% cho doanh thu bán hàng BẰNG (72,41 ; 93,09) nghìn
đô
Bài 1 (BT chương 2)
(a) Tỷ lệ lấp đầy của nhà nghỉ bị hư hỏng A là MOTEL_PCT và tỷ lệ lấp đầy của đối thủ
cạnh tranh là COMP_PCT. Trên cùng một biểu đồ, hãy vẽ các biến này theo TIME. Cái
nào có công suất cao hơn trước thời gian sửa chữa? Cái nào có công suất cao hơn trong
thời gian sửa chữa?
twoway (line motel_pct time) (line comp_pct time)
*KL:Nhìn vào biểu đồ cho thấy, trước thời gian sửa chữa thì tỉ lệ lấp đầy của khách sạn
A cao hơn đối thủ cạnh tranh và trong thời gian sửa chữa tỉ lệ lấp đầy của khách sạn A
cao hơn trong 5 tháng và đối thủ cạnh tranh cao hơn trong 2 tháng
twoway (scatter motel_pct comp_pct)
*KL: Có mối tương quan cùng chiều giữa 2 biến model_pct và comp_pct vì trong mùa du
lịch tỉ lệ lấp đầy của khách sạn A và đối thủ cạnh tranh đều tăng tương tự trong mùa thấp
điểm tỉ lệ cạnh tranh của khách sạn A và đối thủ cạnh tranh đều giảm
*Trên cùng một đồ thị vẽ biểu đồ tương quan giữa motel_pct và comp_pct cùng với
biểu đồ của phương trình hồi quy twoway (scatter motel_pct comp_pct) (lfit motel_pct
comp_pct)
*Ước lượng hồi quy tuyến tính với y = MOTEL_PCT và x = COMP_PCT. Thảo luận về
kết quả
*Xây dựng mô hình hồi quy thực hiện ước lượng ols, viết ptul và giải thích tham số beta
*MHHQ: model_pct = beta1 + beta2*comp_pct + ui
reg motel_pct comp_pct
lOMoARcPSD|40615933
*PTUL: motel_pct = 21,399 + 0,864*comp_pct
*Ý nghĩa của beta1= 21,399 ==> Khi các yếu tố khác trong mô hình không thay đổi, nếu
tỉ lệ lấp đầy của đối thủ cạnh tranh = 0 thì trung bình tỉ lệ lấp đầy của khách sạn A tăng
21,399%
*Ý nghĩa của beta2 = 0,864 ==> Khi các yếu tố khác trong mô hình không thay đổi, nếu
tỉ lệ lấp đầy của đối thủ cạnh tranh tăng lên 1 đơn vị (1 điểm %) thì trung bình tỉ lệ lấp
đầy của nhà nghỉ A tăng 0,864 đơn vị (điểm %)
d) Tính phần dư bình phương nhỏ nhất từ kết quả hồi quy trong ý (c). Lập đồ thị những
phần dư này theo thời gian. Mô hình dự đoán quá mức, dự đoán thiếu hay dự đoán chính
xác tỷ lệ lấp đầy của nhà nghỉ trong thời gian sửa chữa?
*Bước 1: Lấp phần dư bình phương từ kết quả ước lượng ==> predict ten_bien,res
predict phan_du,res
*Bước 2: Vẽ đồ thị phần dư theo thời gian
twoway (line phan_du time)
*Bước 3: NX: 3 tháng đâu tiên trong thời gian sửa chữa thì ui >0 ==> Mô hình dự báo
thiếu, tháng 4 ui~0 ==> dự báo chính xác và 3 tháng cuối thời gian sửa chữa ui < 0 ==>
Mô hình dự báo thừa
e)Hãy xem xét một hồi quy tuyến tính với y = MOTEL_PCT và x = RELPRICE là tỷ lệ
giữa giá tính trên mỗi phòng của nhà nghỉ A so với các đối thủ cạnh tranh của nó. Bạn dự
đoán về dấu của hệ số góc? Tại sao? Dấu của độ dốc ước tính có phù hợp với kỳ vọng
của bạn không?
*MHHQ: motel_pct = beta1 + beta2*relprice + ui
reg motel_pct relprice
*beta2 = -122,12 ==> Khi các yêu tố khác trong mô hình không thay đổi nếu biến
relprice tăng 1 đơn vị thì trung bình tỉ lệ lấp đầy của khách sạn A giảm 122,12 đơn vị
BT10:
*Xây dựng mô hình hồi quy đánh giá tác động của diện tích tới gbán của các ngôi nhà.
Dự báo về dấu của hệ số góc.
*Thực hiện ước lượng mô hình với các ngôi nhà có bể bơi. Viết ptul, giải thích ý nghĩa
của các tham số beta và đánh giá sự phù hợp của mô hình
*Xây dựng mô hình hồi quy đánh giá tác động của diện tích tới giá bán của các ngôi nhà.
Dự báo về dấu của hệ số góc.
lOMoARcPSD|40615933
*MHHQ: sprice = beta1 + beta2*livarea + ui
reg sprice livarea if pool==1
*PTUL: sprice = -76701,95 + 12111,26*livarea
*Kl: ý nghĩa của beta 1 = -76701,95 ==> Khi các yếu tố trong mô hình không thay đổi,
nếu diện tích = 0 thì giá bán của các ngôi nhà có bể bơi giảm -76701,95 đô
*Ý nghĩa của beta 2 = 12111,26 ==> Khi các yếu tố khác trong hình không thay đổi,
nếu diện tích tăng lên 1 trăm feet vuông thì giá bán của ngôi nhà có bể bơi tăng 12111,26
đô la
*R^2 = 0,7104*100% = 71,04% ==> Diện tích giải thích được 71,04% sự thay đổi của
giá bán, các yếu tố ngoài mô hình giải thích được 1-71,04% = 28,96% sự thay đổi của giá
bán
*Vẽ đường hồi qui twoway (lfit sprice
livarea if pool==1)
*SPRICE=d1 + d2*AGE + e
*Người ta cho rằng khi tuổi của ngôi nhà tăng thì giá bán của ngôi nhà giảm 300 đô la
với đtc 95%
*CGT: H0: beta2 = -300, H1: beta # -300
reg sprice age sca t_thongke =
(_b[age]+300)/_se[age] sca list
t_thongke t_thongke = {res}-2.6479537
di" t_toihan = "invttail(e(df_r), 1-0.05/2)
t_toihan = -1.9615489
*Kl: t_thongke < t_toihan ==> Đủ bằng chứng để bác bỏ H0, chấp nhận H1 tương ứng
với beta2 # -300
*Người ta cho rằng: Với các ngôi nhà có 2 phòng ngủ khi tuổi của ngôi nhà tăng lên 1
tuổi thì giá bán giảm nhiều hơn 1000 usd với ĐTC 95% reg sprice age if beds==2
*CGT: H0: beta2 >= -1000 và H1: beta2 < -
1000 sca t_tk = (_b[age]+1000)/_se[age] di "t_th
lOMoARcPSD|40615933
= " invttail(e(df_r),1-0.05) t_th = -1.6654254 sca
list t_tk t_tk =. 3.263319
*KL: t_tk > t_th ==> Không đủ bằng chứng để bác bỏ H0 tương ứng với beta2 >= -1000,
với những ngôi nhà 2 phòng ngủ khi tuổi tăng thêm 1 năm thì giá bán giảm ít hơn 1000
usd với độ tin cậy 95%
*Cho MHHQ: log(sprice) = beta1+ beta2*age +ui. Thực hiện ước lượng trên toàn bộ
hình và giải thích ý nghĩa của beta2. So với MHHQ: sprice = beta1 + beta2*age + ui =>
Mô hình nào phù hợp hơn
*MHHQ: log(sprice) = beta1 + beta2*age + ui
gen ln_sprice = ln(sprice) reg ln_sprice age
* Ý nghĩa của beta2 = -0,00476 ==> Khi các yếu tố khác trong mô hình thay đổi, nếu tuổi
của ngôi nhà tăng lên 1 tuổi thì trung bình giá nhà giảm 0,00476*100%= 0,476%
*R^2 của MH1 = 0.0169 < R^2 của MH2 = 0.0269 ==> Mô hình 2 sẽ phù hợp hơn để
giải thích tác động của tuổi đến giá bán của ngôi nhà
*Người ta cho rằng: Việc ngôi nhà có hay không có bể bơi sẽ không ảnh hưởng đến giá
bán của ngôi nhà. Hãy xây dựng mô hình và thực hiện kiểm định nhận định trên ĐTC
95%
*MHHQ: sprice = beta1 + beta2*pool + ui
reg sprice pool
*beta1 = 119318,7 ==> Khi các yếu tố khác không thay đổi, ngôi nhà không có bể bơi thì
trung bình giá bán bằng 119318,7
. *beta2 = 66966,7 ==> Khi các yếu tố khác không thay đổi, nếu ngôi nhà có bể bơi thì
trung bình giá bán tăng 66966,7 đô la
. *Với những ngôi nhà có bể bơi thì trung bình giá bán . di
"giá bán của ngôi nhà có bể bơi = "119318.7 + 66966.7*1 giá
bán của ngôi nhà có bể bơi = 186285.4 *Dự báo khoảng tin
cậy 99% cho ngôi nhà có bể bơi set obs 1501 replace pool=1
in 1501 predict gia_nha predict ssc,stdf gen CT = gia_nha +
invttail(e(df_r),0.01/2)*ssc gen CD = gia_nha -
invttail(e(df_r),0.01/2)*ssc list pool CD gia_nha CT in 1501
lOMoARcPSD|40615933
*Khoảng tin cậy 99% cho giá bán của ngôi nhà có bể bơi bằng (27986;344584) đô la
*Người ta cho rằng: Việc ngôi nhà có hay không có bể bơi không ảnh hưởng đến giá bán
của ngôi nhà với ĐTC 95%
*CGT: H0: beta2 = 0 và H1: beta2 #
0 sca t_tk = (_b[pool]-0)/_se[pool]
sca t_toihan = invttail(e(df_r),0.05/2)
sca list t_tk t_toihan t_tk = 10.495339
t_toihan = 1.9615489
*Đủ bằng chứng thống kê để bác bỏ H0 do t_tk > t_toihan ==> Bể bơi có tác động đến
giá nhà với ĐTC 95%
Mô hình đa biến
*Thực hiện tính toán giá trị Trung bình, độ lệch chuẩn, giá trị lớn nhất, nhỏ nhất của tất
cả các biến trong tập file
*Xây dựng MHHQ thể hiện mối quan hệ giữa advert, price và sales. Kỳ vọng về dấu của
tham số beta
*Thực hiện ước lượng OLS và viết PTUL
* Giám đốc bán hàng cho rằng: Khi giảm giá bán 1 đô la thì doanh thu bán hàng sẽ tăng
9000 đô với ĐTC 95%
*CGT: H0: beta2 =-9 , H1: beta2 #9 sca t_thongke = (_b[price]+9)/_se[price] sca
t_toihan = invttail(e(df_r),0.05) t_thongke < t_toihan ==> Không đủ bằng chứng để bác
bỏ H0 tương ứng với beta = 9 với độ tin cậy 95%
*Xây dựng cặp giả thuyết và kiểm định Khi tăng chi phí quảng cáo lên 1000 đô thì doanh
thu bán hàng tăng ít hơn 400 đô la với ĐTC 95%
*CGT: H0: beta2 = -9 và H1: beta2 # -9
*C1: Dùng lệnh test ==> test (Viết theo H0 và thay beta bằng tên biến)
test price=-9
*KL: p_value = 0,3223 > 0,05 ==> Không đủ bằng chứng thống kê đủ bác bỏ H0 tương
ứng beta2 =-9 với độ tin cậy 95%
lOMoARcPSD|40615933
*C2: lincom ==> lincom (Viết theo H0 nhưng chuyển vế đổi dấu)
lincom price+9
*KL: p_value = 0,322 > 0,05 ==> Không đủ bằng chứng thống kê đủ bác bỏ H0 tương
ứng beta2 =-9 với độ tin cậy 95%
*Xây dựng cặp giả thuyết và kiểm định Khi tăng chi phí quảng cáo lên 1000 đô thì doanh
thu bán hàng tăng ít hơn 400 đô la với ĐTC 95% *CGT: H0: beta3>=0,4 và H1:
beta3<0,4 lincom advert-0.4
*Do kiểm định 1 phía ==> Thực hiện kiểm định hồi quy phụ (cách làm giống như
phương pháp xác suất) *B1: Tính t_tk của hồi quy phụ sca t_tk1 =
r(estimate)/r(se)
*B2: Tính p_value kiểm định phía trái
*KL: P_value = 0,982 > 0,05 ==> Không đủ bằng chứng thống kê để bác bỏ H0 tương
ứng beta3>= 0,4 với ĐTC 95%
*người ta cho rằng khi giảm giá một đơn vị thì doanh thu thay đổi không khác so với
trường hợp tăng chi phí quảng cáo 1000 đô
*CGT: H0: -1*beta2 = 1*beta3 và H1: -1*beta2 # 1*beta3
test -1*price=1*advert
*KL: p_value = 0,000 < 0,05 ==> Đủ bằng chứng thống kê để bác bỏ H0 tương ứng chấp
nhận H1 ==> Có sự khác biệt về sự thay đổi doanh thu khi giảm giá 1 đô la và tăng chi
phí quảng cáo lên 1000 đô la
*GĐBH cho rằng việc giảm giá 60 xu sẽ hiệu quả hơn việc tăng chi phí quảng cáo 800 đô
la. Kiểm định với ĐTC 95%
*CGT: H0 -0,6*beta2 <= 0,8*beta3 và H1 -0,6*beta2
>0,8*beta3 lincom -0.6*price - 0.8*advert sca t_tk2 =
r(estimate)/r(se)
*KL: p_value < 0.05 ==> Đủ bằng chứng đủ bác bỏ H0 tương ứng chấp nhận H1 ==>
giảm giá 60 xu hiệu quả hơn việc tăng chi phí quảng cáo 800 đô la
*Doanh thu thay đổi như thế nào nếu đồng thời tăng giá bán 30 xu và tăng chi phí quảng
cáo 1200 đô la
lOMoARcPSD|40615933
*Sự thay đổi của doanh thu = 0.3*beta2 + 1.2*beta3
lincom 0.3*price+1.2*advert
*Với khoảng tin cậy 95%, thay đổi của doanh thu khi đồng thời tăng chi phí quảng cáo
1200 đô la và tăng giá 30 xu thì doanh thu giảm nhiều nhất là 1,88 nghìn đô và tăng
nhiều nhất là 1,607 nghìn đô
*Dự báo khoảng tin cậy 95% cho doanh thu nếu chi phí quảng cáo là 1500 đô la và giá
bán là 450 xu set obs 76 replace price=4.5 in 76 replace advert=1.5 in 76 gen CD =
doanh_thu - invttail(72,0.05/2)*ssc gen CT = doanh_thu + invttail(72,0.05/2)*ssc list
price advert CD doanh_thu CT in 76
*KL: nếu giá bán = 450 xu và chi phí quảng cáo là 1500 đô la thì KTC 95% cho doanh
thu bằng (75,97: 96,27) nghìn đô
BT 11: Với ĐTC 90%, kiểm định mô hình có biến thừa hay không?
p_value của biến pr2 =0,19 > 0,1 mức ý nghĩa ==> Nghi ngờ biến pr2 là biến thừa. Thực
hiện kiểm định với giả thuyết như sau
CGT: H0: b3=0 (biến thừa) và H1: b3#0 (Biến không thừa)
test pr2=0
Kết luận: p_value = 0,19> mức ý nghĩa 0,1 ==> Không đủ bằng chứng thống kê để bác
bỏ H0, beta3=0, biến pr2 là biến thừa với ĐTC 90%. Thực hiện loại biến
MHHQ mới: sal1 = b1 + b2*pr1 + b2*pr3 + ui
BT12: *Đánh giá sự phù hợp của mô hình với ĐTC 95%
*CGT: Ho: b2=b3=b4=0 và H1: có ít nhất 1 tham số beta#0
test educ=exper=hrswk=0
*KL: p_value = 0,0000 < mức ý nghĩa 0,05 ==> Đủ bằng chứng để bác bỏ H0 chấp nhận
H1 tương ứng mô hình phù hợp với ĐTC 95%
*R^2 điều chỉnh = 0,2173*100% = 21,73% ==> Mô hình giải thích được 21,73% sự thay
đổi của tiền lương và 1-21,73=78,27% sự thay đổi của tiền lương thì được giải thích bởi
các yếu tố khác ngoài mô hình
BT13: *người ta cho rằng khi các yếu tố educ, exper, hrswk không thay đổi thì cũng
không có sự khác biện về tiền lượng của những NLĐ đã kết hôn cao hơn những N
chưa kết hôn. Xây dựng mô hình hồi quy mới và kiểm định giả thuyết
lOMoARcPSD|40615933
*CGT: H0: b5<=0 và H1: b5>0 sca
t_tk = (_b[married]-0)/_se[married] di"
p_value = " ttail(e(df_r),t_tk)
PHẦN 2: BÀI TẬP TRÊN MÁY (6 ĐIỂM)
Cho dữ liệu của 62 công ty ngành dệt may niêm yết trên thị trường chứng khoán Việt
Nam giai đoạn 2022. Nhà nghiên cứu muốn xem xét ảnh hưởng của các nhân tố, tăng
trưởng doanh thu (growth – lần); Tỷ số nợ (DA – lần); quy mô công ty (LogTS đo
lường Log của tổng tài sản) đến lợi nhuận sau thuế (EAT- triệu đồng).Dữ liệu trong file
EAT.dta. Mô hình hồi quy tổng thể: EATi = beta1 + beta2*growthi + beta3*DAi +
beta4*LogTSi + ui
a) Ước lượng và viết phương trình hồi quy mẫu (1 điểm)
Lệnh: reg EAT growth DA LogTS (0.5đ) chú ý theo thứ tự đề bài
b) Mô hình có hiện tượng phương sai của sai số thay đổi không? Thiết lập giả
thuyếtthống kê và kiểm định (1 điểm)
Giả thuyết (0.25đ)
Ho: mô hình không có hiện tượng phương sai của sai số thay đổi
H1: mô hình có hiện tượng phương sai của sai số thay đổi
Lệnh: mỗi lệnh 0.25đ
. estat hettest
. estat imtest,white
Kết luận: Pvalue của kiểm định Breusch-Pagan cho Pvalue = 0.2676 > alpha = 5% tuy
nhiên Pvalue của kiểm định White cho pvalue= .0083< alpha = 5% đủ cơ sở để bác bỏ
Ho, chấp nhận H1 mô hình có hiện tượng phương sai của sai số thay đổi
c) Nhà nghiên cứu cho rằng khi tổng tài sản của công ty tăng 1% thì lợi nhuận sau thuế
của công ty tăng nhỏ hơn 10 triệu đồng. Thiết lập giả thuyết thống kê và kiểm định (1
điểm) dEAT = beta3 * dTS/TS
|dTS/TS|= 0.01, TS tăng dTS/TS=0.01
|dEAT| <10 , Eat tăng dEAT<10 beta4* 0.01<10 beta4< 1000 ( giải thích) Giả
thuyết:
Ho: beta4 >= 1000
lOMoARcPSD|40615933
H1: beta4< 1000
Do câu b, kiểm định mô hình đã kết luận mô hình có phương sai sai số thay đổi nên trước
khi kiểm định hoặc ước lượng cần phải khắc phục bằng phương sai sma trận sai số thay
đổi
Lệnh: reg EAT growth DA LogTS,robust
sca t_1 =(_b[ LogTS]-1000)/_se[ LogTS]
sca pvalue1= 1-ttail(e(df_r),t_1) sca list
t_1 pvalue1 t_1 = -2.0827421 pvalue1
= .02084713
Kết luận : pvalue= pvalue1 =0.00154446, alpha=5% đủ cơ sỏ bác bỏ Ho, chấp nhận
H1 hay khi tổng tài sản của công ty tăng 1% thì lợi nhuận sau thuế của công ty tăng nhỏ
hơn 10 tr đ
d) Ước lượng khoảng tin cậy với độ tin cậy 99% biết doanh thu tăng 0,02 lần và tỷ số
nợgiảm 0,05 lần, tổng tài sản không đổi. Kết luận và nêu ý nghĩa của khoảng tin cậy
này. (1 điểm) Lệnh: (0.5đ)
lincom 0.02*growth +(-0.05)* DA+0* LogTS,level(99)
Kết luân: khoảng tin cậy đồng thời với độ tin cậy 99% biết doanh thu tăng 0.02 lần và t
số nợ giảm 0,05 lần, tổng tài sản không đổi là [ 48.82919 ; 98.21252]
Ý nghĩa: với độ tin cậy 99%, khi doanh thu tăng 0.02 lần và tỷ số nợ giảm 0,05 lần, tổng
tài sản không đổi thì EAT tăng từ 48.82919 đơn vị (trđ) đến 98.21252 đơn vị (trđ)
e) Dự báo điểm và khoảng cho EAT biết growth là 0,15 lần; DA là 0,5 lần và Tài sản là
10.000 triệu đồng (2 điểm)
Lệnh:
. reg EAT growth DA LogTS
. set obs 63 number of observations (_N) was
62, now 63
. replace growth=0.15 in 63
(1 real change made)
lOMoARcPSD|40615933
. replace DA=0.5 in 63
(1 real change made)
. replace LogTS= log(10000) in 63
(1 real change made)
. predict EAT_F
(option xb assumed; fitted values)
. predict SSC,stdf
. gen LB= EAT_F - invttail(e(df_r),0.05/2)* SSC
. gen UB= EAT_F + invttail(e(df_r),0.05/2)* SSC
. list LB EAT_F UB in 63
Kết luận : 0.5đ Dự báo điểm của EAT là 7371.355 ; dự báo khoảng cho EAT
là[ 6328.957 ; 8413.754 ]
Ý nghĩa : 0.5đ khi growth là 0,15 lần; DA là 0.5 lần và tài sản là 10.000 triệu đồng thì giá
trị Tb của EAT là 7371.355 đơn vị (trđ), tối thiểu là 6328.957 đơn vị (trđ) và tối thiểu là
8413.754 đơn vị (trđ)
| 1/16

Preview text:

lOMoARcPSD| 40615933 Chương 2:
BT1: Cho MHHQ: log(sales) = beta1 + beta2*log(advert) + ui *
Tạo biến log(sales) và log(advert) Câu lệnh tạo biến gen bien_moi =
hamtinh gen ln_sales = ln(sales) gen ln_advert = ln(advert) * Thực hiện ước lượng OLS reg ln_sales ln_advert
PTUL: ln_sales = 4,322 + 0,04*ln_advert
*Ý nghĩa beta2 = 0,04 Khi các yếu tố khác trong mô hình không thay đổi, nếu chi phí
quảng cáo tăng lên 1% thì TRUNG BÌNH doanh thu bán hàng tăng tăng 0,04%
BT2.1: Thực hành ước lượng mô hình hồi qui sau: food_exp = beta1 + beta2*income + ui
Thực hiện kiểm định giả thuyết: Ho >= 3,5, H1 < 3,5 Bài làm: reg food_exp income
PTUL: food_exp = 83,4 + 10,2*income
Ý nghĩa: beta2 = 10,2 Khi các yếu tố khác trong mô hình không thay đổi, nếu thu
nhập tăng 1000 đô thì trung bình chi tiêu trong thực phẩm tăng 10,2 đô *
Khoảng tin cậy 95% beta2 thuộc (5,97; 14,44) ==>Khi các yếu tố khác trong
mô hình không thay đổi, nếu thu nhập tăng lên 1000 đô la thì trung bình trong chi tiêu
tăng ít nhất là 5,97 đô la và tăng nhiều nhất là 14,44 đô la (giải thích ý nghĩa của
khoảng tin cậy tham số beta2)
*Thực hiện kiểm định giả thuyết: Ho: beta2 >= 3,5, H1: beta2 < 3,5
*Thực hiện kiểm định theo phương pháp tới hạn: sca t_thongke =
(10.209-3.5)/2.09 sca list t_thongke t_thongke = 3.2100478 di"
t_tới hạn kiểm định 1 phía, phía trái " invttail(40-2,1-0.05) t_tới
hạn kiểm định 1 phía, phía trái -1.6859545
*Kết luận: t_thongke = 3,21 > t_tới hạn = -1,68 ==> Không đủ bằng chứng để bác bỏ H0,
tương ứng H0 đúng: beta2 >=3,5 với độ tin cậy là 95%
*(bác bỏ H0 kết luận theo H1) BT2.2: CGT2: H0:
beta2 = 8 và H1 # 8 di"t_thống kê = " (10.209-
8)/2.09 t_thống kê = 1.0569378 di" t_tới hạn kiểm lOMoARcPSD| 40615933
định 2 phía = "invttail(38,0.05/2) t_tới hạn kiểm định 2 phía = 2.0243942
*Kết luận: t_thống kê = 1.056 < t_tới hạn = 2,024 ==> Không đủ bằng chứng để bác bỏ
H0, tương ứng với H0 đúng beta2 = 8 với độ tin cậy là 95%
*Nếu thu nhập tăng 1000 đô thì trung bình chi tiêu cho thực phẩm tăng 8 đô la với ĐTC 95%
BT2.3: CGT3: H0: beta2 = 16 và H1: beta 2 # 16
di"t_thống kê = " (10.209 -16)/2.09 t_thống kê = -
2.7708134 di" t_tới hạn kiểm định 2 phía = "
invttail(38,0.05/2) t_tới hạn kiểm định 2 phía = 2.0243942
*Kết luận: |t_thống kê| = 2,77 > t_tới hạn = 2,024 ==> Đủ bằng chứng để bác bỏ H0,
chấp nhận H1: beta2 # 16 với độ tin cậy 95% BT2.4: CGT4: H0: beta2 >= 15,2 và
H1: beta 2 < 15,2 di"t_thống kê = " (10.209-15.2)/2.09 t_thống kê = -2.3880383 di"
t_tới hạn = " invttail(38,1-0.05) t_tới hạn = -1.6859545
*Kết luận: t_thống kê = -2,388 < t_tới hạn = -1,68 ==> Đủ bằng chứng thống kê để bác
bỏ H0, chấp nhận H1 tương ứng beta2 < 15,2 với ĐTC 95%
*Với ĐTC 95%, khi thu nhập tăng lên 1000 usd thì chi tiêu cho thực phẩm tăng ít hơn 15,2 đô la
*Thực hiện cặp giả thuyết với ĐTC là 99% di
"t_toihan với ĐTC 99% = " invttail(38,1-0.01)
t_toihan với ĐTC 99% = -2.4285676
*Kết luận: t_thống kê = -2,388 > t_tới hạn = -2,42 ==> Không đủ bằng chứng thống kê
để bác bỏ H0, tương ứng beta2 >= 15,2 với ĐTC 99%
BT3: Xây dựng mô hình hồi quy để kiểm định giả thuyết sau: khi thu nhập tăng lên 1%
thì chi tiêu cho thực phẩm tăng 0,5% với ĐTC 95% *MHHQ: log(food_exp) = beta1 +
beta2*log(income) + ui gen ln_food_exp = ln( food_exp)
PTUL: ln_food_exp = 3,96 + 0,55*ln_income lOMoARcPSD| 40615933
* Ý nghĩa của beta2 ==> Khi các yếu tố khác trong mô hình không thay đổi, khi thu nhập
tăng 1% thì trung bình cho chi tiêu trong thực phẩm tăng 0,5% CGT: H0: beta2 = 0,5 và
beta2 # 0,5 sca t_thongke = (_b[ln_income]-0.5)/_se[ln_income] sca list t_thongke
t_thongke = .55515085 di"t_toihan = " invttail(38,0.5/2) t_toihan = .68100088
*KL: t_thong ke < t_toihan ==> Đủ bằng chứng thống kê để bác bỏ H0, chấp nhận H1
tương ứng beta2 # 0,5 với ĐTC 95%
BT4: Người ta cho rằng: khi thu nhập tăng lên 1000 usd thì chi tiêu cho thực phẩm tăng
nhiều hơn 6%.Xây dựng mô hình và thực hiện kiểm định giả thuyết
*MHHQ: log(food_exp) = beta1 + beta2*income +ui
gen ln_food_exp = ln( food_exp) reg ln_food_exp income
*PTUL: ln_food_exp = 4,78 + 0,04*income
*Ý nghĩa của beta2: Khi các yếu tố trong mô hình khác không thay đổi, nếu thu nhập
tăng lên 1000 usd thì trung bình cho chi tiêu trong thực phẩm tăng 0,04*100% = 4%
*CGT: H0: beta2 <= 6 và H1: beta2 > 6
di"t_thongke = " (0.04-0.06)/0.007 t_thongke = -2.8571429
di"t_toihan = " invttail(38,0.05) t_toihan = 1.6859545
*KTC 95% cho tham số beta2 = (0,024,0,055) ==> Khi các yếu tố khác trong mô hình
không thay đổi, nếu thu nhập tăng 1 đơn vị(1000 đô la) thì TRUNG BÌNH chi tiêu cho
thực phẩm tăng ít nhất 0,024*100% = 2,4% và tăng nhiều nhất 0,555*100% = 5,5% (giải
thích ý nghĩa của ktc 95%)
*KL: t_thongke < t_toihan ==> Không đủ bằng chứng để bác bỏ H0, H0 đúng với beta2
<= 6% với ĐTC 95%. Nếu thu nhập tăng 1000 đô la thì chi tiêu cho thực phẩm tăng =
hoặc nhỏ hơn 6% với ĐTC 95%.
*Thực hiện bài toán kiểm định theo phương pháp xác suất
*Bước 1: Tính t thống kê sca t_tk1 =
(_b[income] - 0.06)/_se[income] lOMoARcPSD| 40615933
*Bước 2: Tính p_value của bài toán kiểm định 1 phía - phía phải ===> ttail(bậc tự do, t_thống kê)
di"P_value kiểm định phía phải= " ttail(e(df_r),t_tk1)
P_value kiểm định phía phải= .99348344
*Bước 3: kết luận: nếu P_value < Mức ý nghĩa thì bác bỏ giả thuyết H0
*KL: P_value = 0,99 > Mức ý nghĩa 0,05 ==> Không đủ bằng chứng thống kê để bác bỏ
giả thuyết H0 tương ứng beta2 <=6% với độ tin cậy 95%
BT5: Thu nhập tăng 1% thì chi tiêu cho thực phẩm tăng 1,5 đô la ĐTC 95%. Xây dựng mô hình và kiểm định
*MHHQ: food_exp = beta1 + beta2*log(income) + ui
gen ln_income = ln( income) reg food_exp ln_income
*PTUL: food_exp = -97,18 + 132,16*ln_income
*Ý nghĩa của beta2 ==> Khi các yếu tố khác trong mô hình không thay đổi, nếu thu nhập
tăng lên 1% thì trung bình chi tiêu cho thực phẩm tăng 132,16/100 = 1,32 đô la.
*CGT: H0: beta2 = 150 và H1: beta2 # 150
sca t_thongke = (_b[ ln_income] - 150)/_se[ ln_income]
*Bước 2: Tính P_value của kiểm định 2 phía = 2*ttail(BTD,abs(t_thongke)
di "P_value kiểm định 2 phía = "2*ttail(40-2,abs(t_thongke))
P_value kiểm định 2 phía = .53951721
*KL: p_value = 0,53 > mức ý nghĩa 5% ==> Không đủ bằng chứng để bác bỏ H0 tương
ứng với beta2 = 150 với ĐTC 95%
BT6: *Lấy tập andy.dta. Thực hiện ước lượng mô hình sales = beta1 + beta2*price +ui.
Viết PTUL và giải thích khoảng tin cậy của tham số beta2.
*Khi giá tăng 1 đô thì doanh thu bán hàng giảm 6000 đô. ĐTC 95%
*MHHQ: sales = beta1 + beta2*price + ui reg sales price
*CGT: H0: beta1 = -6 và H1: beta2 # -6 lOMoARcPSD| 40615933
*KĐ pp xác suất sca t_tk =(_b[price]+6)/_se[price] di"
p_value kiểm định 2 phía = " 2*ttail(e(df_r),abs(t_tk))
p_value kiểm định 2 phía = .11382267
*KL: p_value > 0,05 => Không đủ bằng chứng để bác bỏ H0 tương ứng với beta 2 = -6 với ĐTC 95%
BT7: *Người ta cho rằng: khi giá tăng lên 1% thì doanh thu giảm nhiều hơn 5%. Kiểm
định với độ tin cậy 95%
*MHHQ: log(sales) = beta1 + beta2*log(price) + ui
gen ln_price = ln( price) gen ln_sales = ln( sales) reg ln_sales ln_price
PTUL: ln_sales = 5,34 - 5,75*ln_price
*Ý nghĩa của beta2 => Khi các yếu tố khác trong mô hình không thay đổi, nếu giá tăng
1% thì trung bình doanh thu bán hàng giảm 5,75%
*CGT: H0: beta2 >= -5 và H1: beta2 < -5
sca t_thongke =(_b[ln_price]+5)/_se[ln_price] di "p_value
kiểm định phía trái = "1 - ttail(e(df_r),t_thongke) p_value
kiểm định phía trái = 1
*KL: p_value > 0.05 => Không đủ bằng chứng để bác bỏ H0 với ĐTC 95%, khi giá tăng
1% thì doanh thu giảm ít hơn 5%
BT8: Kiểm định sự phù hợp của mô hình
Người ta cho rằng giá không tác động đến doanh thu, xây dựng cặp giả thuyết và kiểm định
Viết cặp giả thuyết và kiểm định sự phù hợp của mô hình với độ tin cậy 99%
*CGT: H0: Mô hình không phù hợp và H1: Mô hình phù hợp
*KL: p_value = 0,000 < mức ý nghĩa 1% ==> Đủ bằng chứng thống kê để bác bỏ H0 và
chấp nhận H1 - tương ứng với mô hình phù hợp để giải thích sự thay đổi của doanh thu với độ tin cậy 99% lOMoARcPSD| 40615933
BT9: Tính khoảng tin cậy 90% cho tham số beta2và giả thích ý nghĩa của khoảng tin cậy
di " Cận dưới ktc 90% = " 121.90 - invttail(73,0.1/2)*6.52 Cận dưới ktc 90% = 111.0377
di " Cận trên ktc 90% = " 121.90 + invttail(73,0.1/2)*6.52
Cận trên ktc 90% = 132.7623
*Kl: KTC 90% tham số beta1 là (111,03; 132,76) ==>Khi các yếu tố khác trong mô hình
không thay đổi, nếu giá =0 thì TRUNG BÌNH doanh thu bán hàng tối thiểu bằng 111,03
nghìn đô và bằng tối đa là 132,76 nghìn đô
Tính khoảng tin cậy 99%cho tham số beta2và giả thích ý nghĩa của khoảng tin cậy
*KL KTC 99% tham số beta2 là (-10,83; -4,80) ==> khi các yếu tố khác trong mô hình
không thay đổi, nếu giá tăng 1 đô là thì trung bình doanh thu bán hàng giảm tối thiểu
4,8 nghìn đô và giảm tối đa là 10,83 nghìn đô *Nếu giá là 5 đô thì doanh thu bán hàng =?
*dựa vào mô hình ước lượng *PTUL:
sale = 121,9 - 7,82*price di "Price = 5
==> Sales = " 121.9 -7.82*5 Price = 5 ==> Sales = 82.8
*Nếu giá = 5 đô thì doanh thu bán hàng là 82,8 nghìn đô
*Cách kiểm tra tính khoảng tin cậy của tham số beta
reg sales price,level(90)
*Dự báo khoảng tin cậy 95% cho doanh thu bán hàng khi giá = 5 usd
*Bước 1: Tạo miền chứa giá trị dự báo: set obs n+1 set obs 76
*Bước 2 Thay price = 5 tại dòng 76
==> replace price = 5 in 76
*Bước 3: Thực hiện dự báo cho doanh thu ==> predict ten_bien predict doanh_thu lOMoARcPSD| 40615933
*Bước 4: Tính sai số chuẩn của giá trị dự báo ==> predict saiso,stdf
predict saisochuan,stdf
-*Bước 5: Tính cận trên và cận dưới bằng hàm gen gen
CT = doanh_thu + invttail(73,0.05/2)*saisochuan
gen CD = doanh_thu - invttail(73,0.05/2)*saisochuan
*Bước 6: Hiện kết quả ==> list ten_bien in 76 list price CD doanh_thu CT in 76
*KL: Nếu giá = 5 usd thì KTC 95% cho doanh thu bán hàng BẰNG (72,41 ; 93,09) nghìn đô Bài 1 (BT chương 2)
(a) Tỷ lệ lấp đầy của nhà nghỉ bị hư hỏng A là MOTEL_PCT và tỷ lệ lấp đầy của đối thủ
cạnh tranh là COMP_PCT. Trên cùng một biểu đồ, hãy vẽ các biến này theo TIME. Cái
nào có công suất cao hơn trước thời gian sửa chữa? Cái nào có công suất cao hơn trong thời gian sửa chữa?
twoway (line motel_pct time) (line comp_pct time)
*KL:Nhìn vào biểu đồ cho thấy, trước thời gian sửa chữa thì tỉ lệ lấp đầy của khách sạn
A cao hơn đối thủ cạnh tranh và trong thời gian sửa chữa tỉ lệ lấp đầy của khách sạn A
cao hơn trong 5 tháng và đối thủ cạnh tranh cao hơn trong 2 tháng
twoway (scatter motel_pct comp_pct)
*KL: Có mối tương quan cùng chiều giữa 2 biến model_pct và comp_pct vì trong mùa du
lịch tỉ lệ lấp đầy của khách sạn A và đối thủ cạnh tranh đều tăng tương tự trong mùa thấp
điểm tỉ lệ cạnh tranh của khách sạn A và đối thủ cạnh tranh đều giảm
*Trên cùng một đồ thị vẽ biểu đồ tương quan giữa motel_pct và comp_pct cùng với
biểu đồ của phương trình hồi quy twoway (scatter motel_pct comp_pct) (lfit motel_pct comp_pct)
*Ước lượng hồi quy tuyến tính với y = MOTEL_PCT và x = COMP_PCT. Thảo luận về kết quả
*Xây dựng mô hình hồi quy thực hiện ước lượng ols, viết ptul và giải thích tham số beta
*MHHQ: model_pct = beta1 + beta2*comp_pct + ui reg motel_pct comp_pct lOMoARcPSD| 40615933
*PTUL: motel_pct = 21,399 + 0,864*comp_pct
*Ý nghĩa của beta1= 21,399 ==> Khi các yếu tố khác trong mô hình không thay đổi, nếu
tỉ lệ lấp đầy của đối thủ cạnh tranh = 0 thì trung bình tỉ lệ lấp đầy của khách sạn A tăng 21,399%
*Ý nghĩa của beta2 = 0,864 ==> Khi các yếu tố khác trong mô hình không thay đổi, nếu
tỉ lệ lấp đầy của đối thủ cạnh tranh tăng lên 1 đơn vị (1 điểm %) thì trung bình tỉ lệ lấp
đầy của nhà nghỉ A tăng 0,864 đơn vị (điểm %)
d) Tính phần dư bình phương nhỏ nhất từ kết quả hồi quy trong ý (c). Lập đồ thị những
phần dư này theo thời gian. Mô hình dự đoán quá mức, dự đoán thiếu hay dự đoán chính
xác tỷ lệ lấp đầy của nhà nghỉ trong thời gian sửa chữa?
*Bước 1: Lấp phần dư bình phương từ kết quả ước lượng ==> predict ten_bien,res predict phan_du,res
*Bước 2: Vẽ đồ thị phần dư theo thời gian twoway (line phan_du time)
*Bước 3: NX: 3 tháng đâu tiên trong thời gian sửa chữa thì ui >0 ==> Mô hình dự báo
thiếu, tháng 4 ui~0 ==> dự báo chính xác và 3 tháng cuối thời gian sửa chữa ui < 0 ==> Mô hình dự báo thừa
e)Hãy xem xét một hồi quy tuyến tính với y = MOTEL_PCT và x = RELPRICE là tỷ lệ
giữa giá tính trên mỗi phòng của nhà nghỉ A so với các đối thủ cạnh tranh của nó. Bạn dự
đoán về dấu của hệ số góc? Tại sao? Dấu của độ dốc ước tính có phù hợp với kỳ vọng của bạn không?
*MHHQ: motel_pct = beta1 + beta2*relprice + ui reg motel_pct relprice
*beta2 = -122,12 ==> Khi các yêu tố khác trong mô hình không thay đổi nếu biến
relprice tăng 1 đơn vị thì trung bình tỉ lệ lấp đầy của khách sạn A giảm 122,12 đơn vị BT10:
*Xây dựng mô hình hồi quy đánh giá tác động của diện tích tới giá bán của các ngôi nhà.
Dự báo về dấu của hệ số góc.
*Thực hiện ước lượng mô hình với các ngôi nhà có bể bơi. Viết ptul, giải thích ý nghĩa
của các tham số beta và đánh giá sự phù hợp của mô hình
*Xây dựng mô hình hồi quy đánh giá tác động của diện tích tới giá bán của các ngôi nhà.
Dự báo về dấu của hệ số góc. lOMoARcPSD| 40615933
*MHHQ: sprice = beta1 + beta2*livarea + ui reg sprice livarea if pool==1
*PTUL: sprice = -76701,95 + 12111,26*livarea
*Kl: ý nghĩa của beta 1 = -76701,95 ==> Khi các yếu tố trong mô hình không thay đổi,
nếu diện tích = 0 thì giá bán của các ngôi nhà có bể bơi giảm -76701,95 đô
*Ý nghĩa của beta 2 = 12111,26 ==> Khi các yếu tố khác trong mô hình không thay đổi,
nếu diện tích tăng lên 1 trăm feet vuông thì giá bán của ngôi nhà có bể bơi tăng 12111,26 đô la
*R^2 = 0,7104*100% = 71,04% ==> Diện tích giải thích được 71,04% sự thay đổi của
giá bán, các yếu tố ngoài mô hình giải thích được 1-71,04% = 28,96% sự thay đổi của giá bán
*Vẽ đường hồi qui twoway (lfit sprice livarea if pool==1) *SPRICE=d1 + d2*AGE + e
*Người ta cho rằng khi tuổi của ngôi nhà tăng thì giá bán của ngôi nhà giảm 300 đô la với đtc 95%
*CGT: H0: beta2 = -300, H1: beta # -300
reg sprice age sca t_thongke =
(_b[age]+300)/_se[age] sca list
t_thongke t_thongke = {res}-2.6479537
di" t_toihan = "invttail(e(df_r), 1-0.05/2) t_toihan = -1.9615489
*Kl: t_thongke < t_toihan ==> Đủ bằng chứng để bác bỏ H0, chấp nhận H1 tương ứng với beta2 # -300
*Người ta cho rằng: Với các ngôi nhà có 2 phòng ngủ khi tuổi của ngôi nhà tăng lên 1
tuổi thì giá bán giảm nhiều hơn 1000 usd với ĐTC 95% reg sprice age if beds==2
*CGT: H0: beta2 >= -1000 và H1: beta2 < -
1000 sca t_tk = (_b[age]+1000)/_se[age] di "t_th lOMoARcPSD| 40615933
= " invttail(e(df_r),1-0.05) t_th = -1.6654254 sca list t_tk t_tk =. 3.263319
*KL: t_tk > t_th ==> Không đủ bằng chứng để bác bỏ H0 tương ứng với beta2 >= -1000,
với những ngôi nhà 2 phòng ngủ khi tuổi tăng thêm 1 năm thì giá bán giảm ít hơn 1000 usd với độ tin cậy 95%
*Cho MHHQ: log(sprice) = beta1+ beta2*age +ui. Thực hiện ước lượng trên toàn bộ mô
hình và giải thích ý nghĩa của beta2. So với MHHQ: sprice = beta1 + beta2*age + ui =>
Mô hình nào phù hợp hơn
*MHHQ: log(sprice) = beta1 + beta2*age + ui
gen ln_sprice = ln(sprice) reg ln_sprice age
* Ý nghĩa của beta2 = -0,00476 ==> Khi các yếu tố khác trong mô hình thay đổi, nếu tuổi
của ngôi nhà tăng lên 1 tuổi thì trung bình giá nhà giảm 0,00476*100%= 0,476%
*R^2 của MH1 = 0.0169 < R^2 của MH2 = 0.0269 ==> Mô hình 2 sẽ phù hợp hơn để
giải thích tác động của tuổi đến giá bán của ngôi nhà
*Người ta cho rằng: Việc ngôi nhà có hay không có bể bơi sẽ không ảnh hưởng đến giá
bán của ngôi nhà. Hãy xây dựng mô hình và thực hiện kiểm định nhận định trên ĐTC 95%
*MHHQ: sprice = beta1 + beta2*pool + ui reg sprice pool
*beta1 = 119318,7 ==> Khi các yếu tố khác không thay đổi, ngôi nhà không có bể bơi thì
trung bình giá bán bằng 119318,7
. *beta2 = 66966,7 ==> Khi các yếu tố khác không thay đổi, nếu ngôi nhà có bể bơi thì
trung bình giá bán tăng 66966,7 đô la
. *Với những ngôi nhà có bể bơi thì trung bình giá bán . di
"giá bán của ngôi nhà có bể bơi = "119318.7 + 66966.7*1 giá
bán của ngôi nhà có bể bơi = 186285.4 *Dự báo khoảng tin
cậy 99% cho ngôi nhà có bể bơi set obs 1501 replace pool=1
in 1501 predict gia_nha predict ssc,stdf gen CT = gia_nha +
invttail(e(df_r),0.01/2)*ssc gen CD = gia_nha -
invttail(e(df_r),0.01/2)*ssc list pool CD gia_nha CT in 1501 lOMoARcPSD| 40615933
*Khoảng tin cậy 99% cho giá bán của ngôi nhà có bể bơi bằng (27986;344584) đô la
*Người ta cho rằng: Việc ngôi nhà có hay không có bể bơi không ảnh hưởng đến giá bán
của ngôi nhà với ĐTC 95%
*CGT: H0: beta2 = 0 và H1: beta2 #
0 sca t_tk = (_b[pool]-0)/_se[pool]
sca t_toihan = invttail(e(df_r),0.05/2)
sca list t_tk t_toihan t_tk = 10.495339 t_toihan = 1.9615489
*Đủ bằng chứng thống kê để bác bỏ H0 do t_tk > t_toihan ==> Bể bơi có tác động đến giá nhà với ĐTC 95% Mô hình đa biến
*Thực hiện tính toán giá trị Trung bình, độ lệch chuẩn, giá trị lớn nhất, nhỏ nhất của tất
cả các biến trong tập file
*Xây dựng MHHQ thể hiện mối quan hệ giữa advert, price và sales. Kỳ vọng về dấu của tham số beta
*Thực hiện ước lượng OLS và viết PTUL
* Giám đốc bán hàng cho rằng: Khi giảm giá bán 1 đô la thì doanh thu bán hàng sẽ tăng 9000 đô với ĐTC 95%
*CGT: H0: beta2 =-9 , H1: beta2 #9 sca t_thongke = (_b[price]+9)/_se[price] sca
t_toihan = invttail(e(df_r),0.05) t_thongke < t_toihan ==> Không đủ bằng chứng để bác
bỏ H0 tương ứng với beta = 9 với độ tin cậy 95%
*Xây dựng cặp giả thuyết và kiểm định Khi tăng chi phí quảng cáo lên 1000 đô thì doanh
thu bán hàng tăng ít hơn 400 đô la với ĐTC 95%
*CGT: H0: beta2 = -9 và H1: beta2 # -9
*C1: Dùng lệnh test ==> test (Viết theo H0 và thay beta bằng tên biến) test price=-9
*KL: p_value = 0,3223 > 0,05 ==> Không đủ bằng chứng thống kê đủ bác bỏ H0 tương
ứng beta2 =-9 với độ tin cậy 95% lOMoARcPSD| 40615933
*C2: lincom ==> lincom (Viết theo H0 nhưng chuyển vế đổi dấu) lincom price+9
*KL: p_value = 0,322 > 0,05 ==> Không đủ bằng chứng thống kê đủ bác bỏ H0 tương
ứng beta2 =-9 với độ tin cậy 95%
*Xây dựng cặp giả thuyết và kiểm định Khi tăng chi phí quảng cáo lên 1000 đô thì doanh
thu bán hàng tăng ít hơn 400 đô la với ĐTC 95% *CGT: H0: beta3>=0,4 và H1:
beta3<0,4 lincom advert-0.4
*Do kiểm định 1 phía ==> Thực hiện kiểm định hồi quy phụ (cách làm giống như
phương pháp xác suất) *B1: Tính t_tk của hồi quy phụ sca t_tk1 = r(estimate)/r(se)
*B2: Tính p_value kiểm định phía trái
*KL: P_value = 0,982 > 0,05 ==> Không đủ bằng chứng thống kê để bác bỏ H0 tương
ứng beta3>= 0,4 với ĐTC 95%
*người ta cho rằng khi giảm giá một đơn vị thì doanh thu thay đổi không khác so với
trường hợp tăng chi phí quảng cáo 1000 đô
*CGT: H0: -1*beta2 = 1*beta3 và H1: -1*beta2 # 1*beta3 test -1*price=1*advert
*KL: p_value = 0,000 < 0,05 ==> Đủ bằng chứng thống kê để bác bỏ H0 tương ứng chấp
nhận H1 ==> Có sự khác biệt về sự thay đổi doanh thu khi giảm giá 1 đô la và tăng chi
phí quảng cáo lên 1000 đô la
*GĐBH cho rằng việc giảm giá 60 xu sẽ hiệu quả hơn việc tăng chi phí quảng cáo 800 đô
la. Kiểm định với ĐTC 95%
*CGT: H0 -0,6*beta2 <= 0,8*beta3 và H1 -0,6*beta2
>0,8*beta3 lincom -0.6*price - 0.8*advert sca t_tk2 = r(estimate)/r(se)
*KL: p_value < 0.05 ==> Đủ bằng chứng đủ bác bỏ H0 tương ứng chấp nhận H1 ==>
giảm giá 60 xu hiệu quả hơn việc tăng chi phí quảng cáo 800 đô la
*Doanh thu thay đổi như thế nào nếu đồng thời tăng giá bán 30 xu và tăng chi phí quảng cáo 1200 đô la lOMoARcPSD| 40615933
*Sự thay đổi của doanh thu = 0.3*beta2 + 1.2*beta3 lincom 0.3*price+1.2*advert
*Với khoảng tin cậy 95%, thay đổi của doanh thu khi đồng thời tăng chi phí quảng cáo
1200 đô la và tăng giá 30 xu thì doanh thu giảm nhiều nhất là 1,88 nghìn đô và tăng
nhiều nhất là 1,607 nghìn đô
*Dự báo khoảng tin cậy 95% cho doanh thu nếu chi phí quảng cáo là 1500 đô la và giá
bán là 450 xu set obs 76 replace price=4.5 in 76 replace advert=1.5 in 76 gen CD =
doanh_thu - invttail(72,0.05/2)*ssc gen CT = doanh_thu + invttail(72,0.05/2)*ssc list
price advert CD doanh_thu CT in 76
*KL: nếu giá bán = 450 xu và chi phí quảng cáo là 1500 đô la thì KTC 95% cho doanh
thu bằng (75,97: 96,27) nghìn đô
BT 11: Với ĐTC 90%, kiểm định mô hình có biến thừa hay không?
p_value của biến pr2 =0,19 > 0,1 mức ý nghĩa ==> Nghi ngờ biến pr2 là biến thừa. Thực
hiện kiểm định với giả thuyết như sau
CGT: H0: b3=0 (biến thừa) và H1: b3#0 (Biến không thừa) test pr2=0
Kết luận: p_value = 0,19> mức ý nghĩa 0,1 ==> Không đủ bằng chứng thống kê để bác
bỏ H0, beta3=0, biến pr2 là biến thừa với ĐTC 90%. Thực hiện loại biến
MHHQ mới: sal1 = b1 + b2*pr1 + b2*pr3 + ui
BT12: *Đánh giá sự phù hợp của mô hình với ĐTC 95%
*CGT: Ho: b2=b3=b4=0 và H1: có ít nhất 1 tham số beta#0 test educ=exper=hrswk=0
*KL: p_value = 0,0000 < mức ý nghĩa 0,05 ==> Đủ bằng chứng để bác bỏ H0 chấp nhận
H1 tương ứng mô hình phù hợp với ĐTC 95%
*R^2 điều chỉnh = 0,2173*100% = 21,73% ==> Mô hình giải thích được 21,73% sự thay
đổi của tiền lương và 1-21,73=78,27% sự thay đổi của tiền lương thì được giải thích bởi
các yếu tố khác ngoài mô hình
BT13: *người ta cho rằng khi các yếu tố educ, exper, hrswk không thay đổi thì cũng
không có sự khác biện về tiền lượng của những NLĐ đã kết hôn cao hơn những NLĐ
chưa kết hôn. Xây dựng mô hình hồi quy mới và kiểm định giả thuyết lOMoARcPSD| 40615933
*CGT: H0: b5<=0 và H1: b5>0 sca
t_tk = (_b[married]-0)/_se[married] di"
p_value = " ttail(e(df_r),t_tk)
PHẦN 2: BÀI TẬP TRÊN MÁY (6 ĐIỂM)
Cho dữ liệu của 62 công ty ngành dệt may niêm yết trên thị trường chứng khoán Việt
Nam giai đoạn 2022. Nhà nghiên cứu muốn xem xét ảnh hưởng của các nhân tố, tăng
trưởng doanh thu (growth – lần); Tỷ số nợ (DA – lần); quy mô công ty (LogTS – đo
lường Log của tổng tài sản) đến lợi nhuận sau thuế (EAT- triệu đồng).Dữ liệu trong file
EAT.dta. Mô hình hồi quy tổng thể: EATi = beta1 + beta2*growthi + beta3*DAi + beta4*LogTSi + ui
a) Ước lượng và viết phương trình hồi quy mẫu (1 điểm)
Lệnh: reg EAT growth DA LogTS (0.5đ) chú ý theo thứ tự đề bài
b) Mô hình có hiện tượng phương sai của sai số thay đổi không? Thiết lập giả
thuyếtthống kê và kiểm định (1 điểm) Giả thuyết (0.25đ)
Ho: mô hình không có hiện tượng phương sai của sai số thay đổi
H1: mô hình có hiện tượng phương sai của sai số thay đổi Lệnh: mỗi lệnh 0.25đ . estat hettest . estat imtest,white
Kết luận: Pvalue của kiểm định Breusch-Pagan cho Pvalue = 0.2676 > alpha = 5% tuy
nhiên Pvalue của kiểm định White cho pvalue= .0083< alpha = 5% đủ cơ sở để bác bỏ
Ho, chấp nhận H1 mô hình có hiện tượng phương sai của sai số thay đổi
c) Nhà nghiên cứu cho rằng khi tổng tài sản của công ty tăng 1% thì lợi nhuận sau thuế
của công ty tăng nhỏ hơn 10 triệu đồng. Thiết lập giả thuyết thống kê và kiểm định (1
điểm) dEAT = beta3 * dTS/TS
|dTS/TS|= 0.01, TS tăng dTS/TS=0.01
|dEAT| <10 , Eat tăng dEAT<10 beta4* 0.01<10 beta4< 1000 ( giải thích) Giả thuyết: Ho: beta4 >= 1000 lOMoARcPSD| 40615933 H1: beta4< 1000
Do câu b, kiểm định mô hình đã kết luận mô hình có phương sai sai số thay đổi nên trước
khi kiểm định hoặc ước lượng cần phải khắc phục bằng phương sai sma trận sai số thay đổi
Lệnh: reg EAT growth DA LogTS,robust
sca t_1 =(_b[ LogTS]-1000)/_se[ LogTS]
sca pvalue1= 1-ttail(e(df_r),t_1) sca list
t_1 pvalue1 t_1 = -2.0827421 pvalue1 = .02084713
Kết luận : pvalue= pvalue1 =0.00154446, alpha=5% đủ cơ sỏ bác bỏ Ho, chấp nhận
H1 hay khi tổng tài sản của công ty tăng 1% thì lợi nhuận sau thuế của công ty tăng nhỏ hơn 10 tr đ
d) Ước lượng khoảng tin cậy với độ tin cậy 99% biết doanh thu tăng 0,02 lần và tỷ số
nợgiảm 0,05 lần, tổng tài sản không đổi. Kết luận và nêu ý nghĩa của khoảng tin cậy
này. (1 điểm) Lệnh: (0.5đ)
lincom 0.02*growth +(-0.05)* DA+0* LogTS,level(99)
Kết luân: khoảng tin cậy đồng thời với độ tin cậy 99% biết doanh thu tăng 0.02 lần và tỷ
số nợ giảm 0,05 lần, tổng tài sản không đổi là [ 48.82919 ; 98.21252]
Ý nghĩa: với độ tin cậy 99%, khi doanh thu tăng 0.02 lần và tỷ số nợ giảm 0,05 lần, tổng
tài sản không đổi thì EAT tăng từ 48.82919 đơn vị (trđ) đến 98.21252 đơn vị (trđ)
e) Dự báo điểm và khoảng cho EAT biết growth là 0,15 lần; DA là 0,5 lần và Tài sản là
10.000 triệu đồng (2 điểm) Lệnh: . reg EAT growth DA LogTS
. set obs 63 number of observations (_N) was 62, now 63 . replace growth=0.15 in 63 (1 real change made) lOMoARcPSD| 40615933 . replace DA=0.5 in 63 (1 real change made)
. replace LogTS= log(10000) in 63 (1 real change made) . predict EAT_F
(option xb assumed; fitted values) . predict SSC,stdf
. gen LB= EAT_F - invttail(e(df_r),0.05/2)* SSC
. gen UB= EAT_F + invttail(e(df_r),0.05/2)* SSC . list LB EAT_F UB in 63
Kết luận : 0.5đ Dự báo điểm của EAT là 7371.355 ; dự báo khoảng cho EAT là[ 6328.957 ; 8413.754 ]
Ý nghĩa : 0.5đ khi growth là 0,15 lần; DA là 0.5 lần và tài sản là 10.000 triệu đồng thì giá
trị Tb của EAT là 7371.355 đơn vị (trđ), tối thiểu là 6328.957 đơn vị (trđ) và tối thiểu là 8413.754 đơn vị (trđ)