












Preview text:
Ôn tập Excel and R
Các mức xác suất đều nhập là 1- 𝛼
dist – giá trị X→ xác suất
inv – xác suất p → gtri X
d – density: mật độ xác suất. =norm.dist(x, mean, sd, FALSE) false=0
p -probability: xác xuất tích lũy. =norm.dist(x, mean, sd, TRUE) true=1
q -quantile. =norm.inv(p, mean, sd)
• Hàm phân phối – hàm tích lũy xác suất(CDF) F(x):
• Hàm mật độ(PDF) f(x): đồ thị quả chuông
F(x)=P(X≤x) xác suất dưới đường cong tích lũy đến điểm x 𝛽 : mức phân vị var: variable – biến
Các phân phối thông dụng
Kiểm định giả thuyết
Kiểm định 𝝁 khi chưa biết 𝝈𝟐
• Kiểm định t một mẫu
Kiểm định giả thuyết trung bình mẫu có lớn hơn 12 hay không. {𝐻0=12 𝐻1 > 12
t (giá trị quan sát)= 2.5122 Thống kê t quan sát được (so sánh giữa trung bình mẫu và giả thuyết)
df = 9 Số bậc tự do = n - 1 = 10 - 1
p-value = 0.0166 Xác suất thu được giá trị t ≥ 2.5122 nếu H₀ đúng mean of x = 13.3 T
rung bình mẫu thực tế
95 percent confidence interval: 12.35141 Inf Khoảng tin cậy 1 phía cho trung bình thật: từ 12.35 trở lên
alternative hypothesis: true mean is greater than 12 Hướng kiểm định (1 phía: lớn hơn 12)
Cách diễn giải kết quả
Bước 1: So sánh p-value với mức ý nghĩa α = 0.05 𝑝=0.0166<0.05 Bác bỏ H₀.
Bước 2: Kết luận
Có bằng chứng thống kê cho thấy:Trung bình thật của tổng thể lớn hơn 12 (với mức ý nghĩa 5%). → Ý kiến đúng
Suy diễn trên mẫu theo cặp ễn giải kết quả Di
Excel:Dấu của t Stat:
• t = -3.098, do Excel mặc định lấy hiệu Before - After.
Kết quả âm có nghĩa là Sau > Trước (tức doanh số tăng).
• So sánh p-value (một phía):
p = 0.013 < 0.05 → Bác bỏ H₀
→ Có bằng chứng thống kê ở mức 5% rằng doanh số trung bình đã tăng sau khi áp dụng biện pháp mới.
R: Với mức ý nghĩa α = 0.05: 𝑝=0.01345<0.05 → Bác bỏ H₀
→ Có bằng chứng thống kê cho thấy trung bình After > Before. → Ý kiến đúng
Kiểm định 𝝁𝟏 và 𝝁𝟐
• Chưa biết 𝜇 nhưng giả định 𝜇21= 𝜇22 P-value = 0.0599 >0.05
→Chưa bác bỏ 𝐻0 →Ý kiến đúng
• Chưa biết 𝜇 nhưng giả định 𝜇21≠ 𝜇22 p=0.03391<0.05
→ Bác bỏ giả thuyết H₀. Nói cách khác:
→ Có bằng chứng thống kê cho thấy trung bình của hai hãng KHÁC NHAU (ở mức tin cậy 95%).
ễn giải khoảng tin cậy 95% Di
𝐶𝐼 95%=(−12.41;−0.59) Nghĩa là:
Hiệu trung bình thật sự (μA−μB) nằm trong khoảng từ -12.41 đến -0.59.
Khoảng này không chứa 0 → cũng xác nhận rằng trung bình hai nhóm không bằng nhau.
Ta ước lượng rằng trung bình của hãng A nhỏ hơn hãng B từ 0.6 đến 12.4 đơn vị, với độ tin cậy 95%.
Kiểm định về σ12 and σ22 • So sánh p-value với α p=0.0446<0.05
→ Bác bỏ giả thuyết H₀.
⇒ Kết luận: Hai phương sai khác nhau có ý nghĩa thống kê.
• Diễn giải giá trị F 0.14
F=0.14 nhỏ hơn nhiều so với 1
→ Nghĩa là phương sai của nhóm A nhỏ hơn nhóm B rõ rệt.
→ Dữ liệu nhóm B phân tán rộng hơn nhóm A.
• Khoảng tin cậy 95% cho tỷ lệ phương sai) CI95%=(0.029;0.947)
Khoảng này không chứa 1, nên cũng xác nhận rằng:
Hai phương sai không bằng nhau với độ tin cậy 95%.
Phân tích phương sai • Single Factor
F=3.9>Fcrit=3.805 và 0.05p=0.047<0.05
⟹ Bác bỏ giả thuyết H₀.
• 2Factor without replication
• Yếu tố 1 (Rows: High / Medium / Low / No) F=11.8>Fcrit=4.757 p=0.006<0.05
⟹ Bác bỏ H₀: Có sự khác biệt có ý nghĩa thống kê giữa các mức High, Medium, Low, No.
→ Nghĩa là yếu tố “Rows” có ảnh hưởng rõ rệt đến biến kết quả.
• Yếu tố 2 (Columns: Inner / Sub / Outer) F=2.6p=0.154>0.05
⟹ Không bác bỏ H₀: Không có sự khác biệt đáng kể giữa các cột.
→ Nghĩa là yếu tố “Columns” không ảnh hưởng rõ rệt đến biến kết quả. • 2Factor with relication
Kiểm định yếu tố “Sample” (Chính sách quảng cáo) F = 58.75 > F_crit = 3.49
P-value = 1.9×10⁻⁷ < 0.05
→ Có sự khác biệt có ý nghĩa thống kê giữa các chính sách quảng cáo.
⇒ Mức quảng cáo High, Medium, Low, None ảnh hưởng khác nhau rõ rệt đến kết quả bán hàng.
Kiểm định yếu tố “Columns” (Khu vực)
F = 11.812 > F_crit = 3.885 P-value = 0.001 < 0.05
→ Có sự khác biệt có ý nghĩa giữa các khu vực Inner, Sub, Outer.
⇒ Vị trí cửa hàng cũng ảnh hưởng đáng kể đến kết quả.
Kiểm định tương tác (Interaction) F = 3.312 > F_crit = 2.996 P-value = 0.037 < 0.05
→ Có tác động tương tác giữa quảng cáo và khu vực.
⇒ Nghĩa là hiệu quả quảng cáo phụ thuộc vào khu vực — ví dụ: quảng cáo “High” có thể rất
hiệu quả ở Inner, nhưng không hiệu quả bằng ở Outer. Kết luận tổng thể
Cả hai yếu tố quảng cáo và khu vực đều ảnh hưởng đáng kể đến doanh số.
Đồng thời có tác động tương tác, tức là ảnh hưởng của một yếu tố còn phụ thuộc vào yếu tố kia.