Tổng hợp bài giảng Tin học ứng dụng trong QLCL| Bài giảng Tin học ứng dụng trong QLCL| Trường Đại học Bách Khoa Hà Nội

Tổng hợp bài giảng Tin học ứng dụng trong QLCL| Bài giảng Tin học ứng dụng trong QLCL| Trường Đại học Bách Khoa Hà Nội. Tài liệu gồm 71 trang giúp bạn đọc ôn tập và đạt kết quả cao trong kỳ thi sắp tới. Mời bạn đọc đón xem.

Thông tin:
71 trang 3 tháng trước

Bình luận

Vui lòng đăng nhập hoặc đăng ký để gửi bình luận.

Tổng hợp bài giảng Tin học ứng dụng trong QLCL| Bài giảng Tin học ứng dụng trong QLCL| Trường Đại học Bách Khoa Hà Nội

Tổng hợp bài giảng Tin học ứng dụng trong QLCL| Bài giảng Tin học ứng dụng trong QLCL| Trường Đại học Bách Khoa Hà Nội. Tài liệu gồm 71 trang giúp bạn đọc ôn tập và đạt kết quả cao trong kỳ thi sắp tới. Mời bạn đọc đón xem.

29 15 lượt tải Tải xuống
1
Vũ Hng Sơn - ðHBK Hà ni 1
TIN HC TRONG QLCL
Vũ Hng Sơn - ðHBK Hà ni 2
CHƯƠNG 1
MỞ ðẦU
1. Thng kê nhu cu s dng trong XLSL
ðiu kin tiên quyết: Toán cao cp, lý thuyết xác sut
thuyết xác sut: khoa hc v các quy lut ca các hin
tượng ngu nhiên
Thng kê toán hc: là mt b phn ca lý thuyết xác sut.
Ni dung bao gm:
Thu thp s liu, cách thu thp s liu
Sp xếp s liu, tìm tham số ñc trưng ca b s liu
Phân tích quy lut biến thiên ca s liu, xây dng mô hình
lý thuyết
So sánh các tp hp s liu xem có cùng bn cht không
Xác ñịnh mi liên h gia các b s liu
2
Vũ Hng Sơn - ðHBK Hà ni 3
2. Nhng tiến b v s dng tin hc trong XLSL và QLCL
Thng kê cổ ñiển ñã chuyn thành thng kê hin ñại
S dng phương tin tính toán hin ñại:
Thế h máy vi tính mi nht
Ngôn ng lp trình mnh nht
Cho phép gii các bài toán h thng phc tp, ñòi hỏi vic
truyn ñạt kiến thc toán hc phi ñược kết hp vi phương
pháp tư duy, phương pháp tính toán bng phương tin mi
Cho phép mô phng quá trình sn xut
Giám sát quá trình sn xut
ðiu khin quá trình sn xut
Ti ưu hóa q trình sn xut
Vũ Hng Sơn - ðHBK Hà ni 4
3. Các sn phm tin hc ng dng trong XLSL
IRRISTAT
SPSS
R
STATISTICA
MATLAB
MINITAB
SAS
SPAD
NEMRODW
DESIGN-EXPERT
3
Vũ Hng Sơn - ðHBK Hà ni 5
CHƯƠNG 2
CÁC DNG BIN SỐ THƯNG GP
1. Các dng biến s
Biến mô tả ñặc tính ñịnh tính (biến ñnh tính): màu sc, mùi, v,
ngon hoc không ngon, thích không thích, tt hoc xu…
Biến mô tả ñặc tính ñịnh lưng (biến ñịnh lượng)
Biến ñịnh hng: so sánh mc ñộ biu hin tương ñối ca
ñặc tính (so hàng ñặc tính, ví d so hàng th hiếu…)
Biến ñịnh lượng ri rc (biến tn sut): s ln xut hin
ca ñặc tính, biu din bng s nguyên
Biến ñịnh lưng liên tc (biến liên tc): ly mt tr s bt k,
s nguyên hay hu t
Vũ Hng Sơn - ðHBK Hà ni 6
2. Các dng bng s liu
Bng mô tả ñặc tính ñịnh tính
Bng s liu 1 chiu
Bng s liu 2 chiu
Bng s liu ñặc tính ñịnh lượng
Gái
Trai
Ung VangGii tính
Gái
Trai
Vang trngVang ñỏGii tính
4
Vũ Hng Sơn - ðHBK Hà ni 7
3. Trình bày s liu bng biu ñ
Nguyên tc:
Biu ñồ rõ ràng, b qua chi tiết không cn thiết
Ch dn trên biu ñồ phi ñược hiu d dàng
ðơn v ca biu ñồ, phân bit các thành phn khác nhau
ca biu ñồ bng màu sc, nn, ký t…khác nhau
Các dng biu ñồ:
Biu ñồ hình ch nht (biu ñồ ct)
Biu ñồ hình qut
ðồ thị ñường liên tc
Vũ Hng Sơn - ðHBK Hà ni 8
4. Các phn mm hay dùng trong QLCL
SPSS
SPAD
DESIGN-EXPERT
NEMRODW
5
Vũ Hng Sơn - ðHBK Hà ni 9
CHƯƠNG 3
NG DNG CÁC CHUN THNG KÊ
The
mean of a set of observations is their average - the sum of
the observed values divided by the number of observations.
Population Mean Sample Mean
µ
=
=
x
N
i
N
1
x
x
n
i
n
=
=
1
Arithmetic Mean or Average
n
xfxfxf
xf
n
x
kk
k
i
ii
+++
==
=
K
2211
1
1
Sample size
Vũ Hng Sơn - ðHBK Hà ni 10
Given a series of values
x
i
(
i
=
1, … , n
):
x
1
, x
2
, …, x
n
, the mean
is:
=
=
n
i
i
x
n
x
1
1
Study 1: the color scores of 6 consumers are: 6, 7, 8, 4, 5, and 6. The mean is:
6
6
36
6
6548761
1
==
+++++
=
=
=
n
i
i
x
n
x
Study 2: the color scores of 4 consumers are: 10, 2, 3, and 9. The mean is:
6
4
24
4
932101
1
==
+++
=
=
=
n
i
i
x
n
x
6
Vũ Hng Sơn - ðHBK Hà ni 11
Variation
The mean does not adequately describe the data. We need to
know the
variation
in the data.
An obvious measure is the sum of
difference
from the mean:
For study 1, the scores 6, 7, 8, 4, 5, and 6, we have:
(6-6) + (7-6) + (8-6) + (4-6) + (5-6) + (6-6)
= 0 + 1 + 2 – 2 – 1 + 0
= 0
NOT SATISFACTORY!
Vũ Hng Sơn - ðHBK Hà ni 12
Sum of squares
We need to make the difference positive by squaring them.
This is called “
Sum of squares
(SS)
For study 1: 6, 7, 8, 4, 5, 6, we have:
SS = (6-6)
2
+ (7-6)
2
+ (8-6)
2
+ (4-6)
2
+ (5-6)
2
+ (6-6)
2
=
10
For study 2: 10, 2, 3, 9, we have:
SS= (10-6)
2
+ (2-6)
2
+ (3-6)
2
+ (9-6)
2
= 50
This is better!
But it does not take into account sample size n.
7
Vũ Hng Sơn - ðHBK Hà ni 13
Variance
We have to divide the SS by sample size n. But in each square
we use the mean to calculate the square, so we lose 1 degree
of freedom. Therefore the correct denominator is n-1. This
is called
variance
(denoted by s
2
)
( )
=
=
n
i
i
xx
n
s
1
2
2
1
1
(
)
(
)
(
)
1
...
22
2
2
1
2
+++
=
n
xxxxxx
s
n
Or, in the sum notation:
Vũ Hng Sơn - ðHBK Hà ni 14
( )
σ
µ
σ
σ
2
2
1
2
1
2
2
1
=
=
=
=
=
=
( )x
N
x
N
N
i
N
i
N
x
i
N
Population Variance
(
)
(
)
s
x x
n
x
x
n
n
s
s
i
n
i
n
i
n
2
2
1
2
1
2
2
1
1
1
=
=
=
=
=
=
( )
Sample Variance
Variance and Standard Deviation
(
)
8
Vũ Hng Sơn - ðHBK Hà ni 15
Variance - example
For study 1: 6, 7, 8, 4, 5, and 6, the variance is:
(
)
(
)
(
)
(
)
(
)
2
5
10
1
6
6665686766
22222
2
==
++++
=s
For study 2: 10, 2, 3, 9, the variance is:
(
)
(
)
(
)
(
)
7.16
3
50
1
4
696362610
2222
2
==
+++
=s
The scores in study 2 were much more variable than
those in study 1.
Vũ Hng Sơn - ðHBK Hà ni 16
Standard deviation
The problem with variance is that it is expressed in unit squared,
whereas the mean is in the actual unit. We need a way to convert
variance back to the actual unit of measurement.
We take the square root of variance – this is called “
standard
deviation
(denote by s)
For study 1, s = sqrt(2) = 1.41
For study 2, s = sqrt(16.7) = 4.1
9
Vũ Hng Sơn - ðHBK Hà ni 17
Standard Deviation
11 12 13 14 15 16 17 18 19 20 21
Data B
Mean = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
Data A
Mean = 15.5
s = .9258
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
s = 4.57
Data C
Vũ Hng Sơn - ðHBK Hà ni 18
99.7 %
68 %
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
µ
µµ
µ -3σ
σσ
σ µ
µµ
µ -2σ
σσ
σ µ
µµ
µ -σ
σσ
σ µ
µµ
µ µ
µµ
µ +σ
σσ
σ µ
µµ
µ +2σ
σσ
σ µ
µµ
µ +3σ
σσ
σ
normal(x)
95 %
Standard Deviation
10
Vũ Hng Sơn - ðHBK Hà ni 19
Kim ñịnh thng : khi- bình phương
χ
2
=
Σ
(O - T)
2
T
O = tn s quan sát
T = tn s thuyết
Tn s lý thuyết =
Tng hàng x Tng ct
Tng ln
Vũ Hng Sơn - ðHBK Hà ni 20
Sn phm Tr li Tng
A non A
A 32.5 27.5 60
Non A 32.5 27.5 60
Tng 65 55 120
χ
2
calculé
= 7,55 > χ
2
théorique
= 2,71, pour α = 0,05
11
Vũ Hng Sơn - ðHBK Hà ni 21
X 2 giá tr trung bình-kim ñịnh t-Student
Trường hp 2 mu ñộc lp
1. Kim ñnh phng sai
vi qui ước phương sai1 >phương sai 2
vi
F
b
tra bng mc α=5%, bc t do f
1
=n
1
-1, f
2
=n
2
-1
Nếu F<F
b
2 phương sai bng nhau
Nếu FF
b
2 phương sai khác nhau
2
2
2
1
S
S
F =
( )
(
)
=
=
=
n
x
x
n
xx
n
S
i
i
n
i
i
2
2
1
2
2
1
1
1
1
Vũ Hng Sơn - ðHBK Hà ni 22
where
with the mean of group i,
is the mean of all Z
ij
,
is the mean of the Z
ij
for group i.
The Levene test rejects the hypothesis that the variances are equal if
Levene’s test
12
Vũ Hng Sơn - ðHBK Hà ni 23
Giá tr xác sut (p Values)
Giá tr p value ñược so sánh vi mc ý nghĩa (significant
level - α), da trên kết qu y ñ c b hay không
bác b gi thiết.
Nếu giá tr p value nhhơn mức ý nghĩa, gi thiết b bác
b (p value < α, bác b gi thiết H
0
).
Nếu giá tr p value bng hoc ln hơn mc ý nghĩa,
không bác b gi thiết H
o
(p value > α, không bác b gi
thiết H
0
).
Vũ Hng Sơn - ðHBK Hà ni 24
2. Hai mu ñc lp có phng sai bng nhau
Group 1 Group2
x
11
x
21
x
12
x
22
x
13
x
23
x
14
x
24
x
15
x
25
x
1n
x
2n
Sample size n
1
n
2
Mean x
1
x
2
SD s
1
s
2
Mean difference:
D = x
1
x
2
Variance of D:
(
)
(
)
2
11
21
2
22
2
11
2
+
+
=
nn
snsn
s
T-statistic:
+
=
21
2
21
11
nn
s
xx
t
13
Vũ Hng Sơn - ðHBK Hà ni 25
Produc A Product B
106 110
98 134
108 122
104 104
120 118
124 131
108 114
96
100
N 9 7
Mean 107.1 119.0
SD 9.49 10.88
Mean difference:
D = 119.0 – 107.1 = 11.9
Variance of D:
(
)
(
)
2.102
2
7
9
88.10649.98
22
2
=
+
+
=s
T-statistic:
34.2
7
1
9
1
2.102
9.11
=
+
=t
t
b,5%,14
=2.15
Conclusion:
Significant difference
Vũ Hng Sơn - ðHBK Hà ni 26
3. Hai mu ñc lp có phng sai khác nhau
Group 1 Group2
x
11
x
21
x
12
x
22
x
13
x
23
x
14
x
24
x
15
x
25
x
1n
x
2n
Sample size n
1
n
2
Mean x
1
x
2
SD s
1
s
2
Mean difference:
D = x
1
x
2
Variance of D:
2
2
2
1
2
1
2
n
S
n
S
s +=
T-statistic:
+
=
2
2
2
1
2
1
21
n
S
n
S
xx
t
11
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
+
+
=
n
n
S
n
n
S
n
S
n
S
f
14
Vũ Hng Sơn - ðHBK Hà ni 27
Produc A Product B
28 12
17 7
36 11
23 10
27 11
N 5 5
Mean 26.2 10.2
SD 6.98 1.92
Mean difference:
D = 26.2 10.2 = 16
T-statistic:
t
b,5%,5
=2.57
Conclusion:
Significant difference
01.5
5
92.1
5
98.6
2.102.26
22
=
+
=t
(
)
(
)
56.4
4
5
92.1
4
5
98.6
5
92.1
5
98.6
2
2
2
2
2
22
=
+
+
=f
Vũ Hng Sơn - ðHBK Hà ni 28
Trường hp 2 mu tương quan, so sánh cp
Subject Before After Diff.
1 x
01
x
11
x
01
-x
11
2 x
02
x
12
x
02
-x
12
3 x
03
x
13
x
03
-x
13
4 x
04
x
14
x
04
-x
14
5 x
05
x
15
x
05
-x
15
n x
0n
x
1n
x
0n
-x
1n
Mean x
0
x
1
x
d
SD s
0
s
1
s
d
Mean difference:
D = x
1
x
2
ns
x
t
d
d
/
=
15
Vũ Hng Sơn - ðHBK Hà ni 29
Paired samples
The problem: Viewing certain meats under red light might
enhance judges preferences for meat. 12 judges were asked to
score the redness of meat under red light and white light
Results:
Judge Red White
1 20 22
2 18 19
3 19 17
4 22 18
5 17 21
6 20 23
7 19 19
Judge Red White
8 16 20
9 21 22
10 17 20
11 23 27
12 18 24
Question: Was there an effect of light?
Vũ Hng Sơn - ðHBK Hà ni 30
Paired samples – analysis
1.832119.2Mean
2.822.82.1SD
624 18 12
42723 11
32017 10
12221 9
42016 8
01919 7
32320 6
42117 5
-41822 4
-21719 3
11918 2
22220 1
DifferenceWhite lightRed lightJudge
Mean difference: 1.83, SD: 2.82
Standard error (SE):
SD/sqrt(n) = 2.82/sqrt(12) =
0.81
t-test = |1.83|/0.81 = 2.23
t
b,5%
= 2.201
Conclusion: there was a
significant effect of light colour.
Tin UD trong QLCL Anova
PhD.VHSơn-Hust 1
PHÂN TÍCH PHƯƠNG SAIPHÂN TÍCH PHƯƠNG SAI
(ANOVA)(ANOVA)
Mục tiêu của phân tích phương sai so sánh trung
bình của nhiều nhóm (tổng thể) dựa trên các số trung bình
của các mẫu quan sát từ các nhóm y và thông qua kiểm
định giả thuyết để kết luận về sự bằng nhau của các số
trung bình này.
Trong nghiên cứu, phân tích phương sai được ng
như một công cụ để xem xét ảnh hưởng của một hay một
số yếu tố nguyên nhân (định tính) đến một yếu tố kết quả
(định lượng).
PHÂN TÍCH PHƯƠNG SAIPHÂN TÍCH PHƯƠNG SAI
Ví dụ:
Nghiên cứu ảnh hưởng của phương pháp đánh
giá của giáo viên đến kết quả học tập của sinh
viên.
Nghiên cứu ảnh hưởng của bậc thợ tới năng
suất lao động.
Nghiên cứu ảnh hưởng của phương pháp bán
hàng, trình độ (kinh nghiệm) của nhân viên bán
hàng đến doanh số
Tin UD trong QLCL Anova
PhD.VHSơn-Hust 2
PHÂN TÍCH PHƯƠNG SAIPHÂN TÍCH PHƯƠNG SAI
Phân tích phương sai một yếu tố
Phân tích phương sai hai yếu tố
Phân tích phương sai một yếu tốPhân tích phương sai một yếu tố
Phân tích phương sai một yếu tố là phân tích
ảnh hưởng của một yếu tố nguyên nhân (dạng
biến định tính) đến một yếu tố kết quả (dạng
biến định lượng) đang nghiên cứu.
Tin UD trong QLCL Anova
PhD.VHSơn-Hust 3
Phân tích phương sai một yếu tốPhân tích phương sai một yếu tố
Giả sử cần so sánh số trung bình của k tổng
thể độc lập. Ta lấy k mẫu số quan sát n
1
,
n
2
n
k
; tuân theo phân phối chuẩn. Trung bình
của các tổng th được hiệu μ
1
; μ
2
.μ
k
thì hình phân tích phương sai một yếu tố
ảnh hưởng được tả dưới dạng kiểm định giả
thuyết như sau:
H
o
: μ
1
= μ
2
=.
k
H
1
: Tồn tại ít nhất 1 cặp μ
i
≠μ
j
; i j
Phân tích phương sai một yếu tốPhân tích phương sai một yếu tố
Để kiểm định ta đưa ra 3 giả thiết sau:
1) Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ
2
)
2) Các phương sai tổng thể bằng nhau
3) Ta lấy k mẫu độc lập từ k tổng thể. Mỗi mẫu
được quan sát n
i
lần.
Tin UD trong QLCL Anova
PhD.VHSơn-Hust 4
Các bước tiến hành:Các bước tiến hành:
Bước 1Bước 1: Tính các trung bình mẫu và trung bình chung: Tính các trung bình mẫu và trung bình chung
của k mẫucủa k mẫu
Ta lập bảng tính toán như sau:
TT k mẫu quan sát
1 2 3 k
1 X
11
X
21
X
31
X
k1
2 X
12
X
22
X
32
X
k2
3 X
13
X
23
X
33
X
k3
n
i
X
1n1
X
2n2
X
3n3
X
knk
Trung bình mẫu
x
1
x
2
x
3
x
k
Bước 1Bước 1: Tính các trung bình mẫu và trung bình: Tính các trung bình mẫu và trung bình
chung của k mẫuchung của k mẫu
Trung bình mẫu
x
1
x
2
x
k
được tính theo công thức:
1
( 1,2,.. )
i
n
ij
j
i
i
X
x i k
n
=
= =
1
1
( 1,2,.. )
k
i i
i
k
i
i
n x
x i k
n
=
=
= =
Trung bình chung của k mẫu được tính theo công thức:
Tin UD trong QLCL Anova
PhD.VHSơn-Hust 5
Bước 2Bước 2: Tính các tổng độ lệch bình phương: Tính các tổng độ lệch bình phương
Nhóm 1 Nhóm 2 Nhóm k
1
2
1
1 1
1
( )
n
j
j
SS X x
=
=
2
2
2
2 2
1
( )
n
j
j
SS X x
=
=
2
1
( )
k
n
k
k jk
j
SS X x
=
=
2
1 2
1 11
... ( )
i
n
k
i
k ij
i ij
SSW SS SS SS X x
= =
= + + + =
Tổng các độ lệch bình phương trong nội bộ nhóm
(nội bộ từng mẫu - SSW) được tính theo công thức sau:
Bước 2Bước 2: Tính các tổng độ lệch bình phương: Tính các tổng độ lệch bình phương
Tổng các độ lệch bình phương giữa các nhóm(SSB)
2
1
( )
k
i i
i
S S B n x x
=
=
Tổng các độ lệch bình phương của toàn bộ tổng thể(SST)
2
1 1
( )
i
n
k
i j
i j
SST SSW SSB X x
= =
= + =
| 1/71

Preview text:

TIN HC TRONG QLCL
Vũ Hồng Sơn - ðHBK Hà nội 1 CHƯƠNG 1 MỞ ðẦU 1.
Thống kê và nhu cầu sử dụng trong XLSL
ðiều kiện tiên quyết: Toán cao cấp, lý thuyết xác suất
Lý thuyết xác suất: khoa học về các quy luật của các hiện tượng ngẫu nhiên
Thống kê toán học: là một bộ phận của lý thuyết xác suất. Nội dung bao gồm:
Thu thập số liệu, cách thu thập số liệu
Sắp xếp số liệu, tìm tham số ñặc trưng của bộ số liệu
Phân tích quy luật biến thiên của số liệu, xây dựng mô hình lý thuyết
So sánh các tập hợp số liệu xem có cùng bản chất không
Xác ñịnh mối liên hệ giữa các bộ số liệu
Vũ Hồng Sơn - ðHBK Hà nội 2 1 2.
Những tiến bộ về sử dụng tin học trong XLSL và QLCL
Thống kê cổ ñiển ñã chuyển thành thống kê hiện ñại
Sử dụng phương tiện tính toán hiện ñại:
Thế hệ máy vi tính mới nhất
Ngôn ngữ lập trình mạnh nhất
Cho phép giải các bài toán hệ thống phức tạp, ñòi hỏi việc
truyền ñạt kiến thức toán học phải ñược kết hợp với phương
pháp tư duy, phương pháp tính toán bằng phương tiện mới
Cho phép mô phỏng quá trình sản xuất
Giám sát quá trình sản xuất
ðiều khiển quá trình sản xuất
Tối ưu hóa quá trình sản xuất
Vũ Hồng Sơn - ðHBK Hà nội 3 3.
Các sản phẩm tin học ứng dụng trong XLSL IRRISTAT SPSS R STATISTICA MATLAB MINITAB SAS SPAD NEMRODW DESIGN-EXPERT
Vũ Hồng Sơn - ðHBK Hà nội 4 2 CHƯƠNG 2
CÁC DẠNG BIẾN SỐ THƯỜNG GẶP 1. Các dạng biến số
Biến mô tả ñặc tính ñịnh tính (biến ñịnh tính): màu sắc, mùi, vị,
ngon hoặc không ngon, thích không thích, tốt hoặc xấu…
Biến mô tả ñặc tính ñịnh lượng (biến ñịnh lượng)
Biến ñịnh hạng: so sánh mức ñộ biểu hiện tương ñối của
ñặc tính (so hàng ñặc tính, ví dụ so hàng thị hiếu…)
Biến ñịnh lượng rời rạc (biến tần suất): số lần xuất hiện
của ñặc tính, biểu diễn bằng số nguyên
Biến ñịnh lượng liên tục (biến liên tục): lấy một trị số bất kỳ, số nguyên hay hữu tỷ
Vũ Hồng Sơn - ðHBK Hà nội 5 2. Các dạng bảng số liệu
Bảng mô tả ñặc tính ñịnh tính Bảng số liệu 1 chiều Bảng số liệu 2 chiều …
Bảng số liệu ñặc tính ñịnh lượng Giới tính Uống Vang Giới tính Vang ñỏ Vang trắng Trai Trai Gái Gái
Vũ Hồng Sơn - ðHBK Hà nội 6 3 3.
Trình bày số liệu bằng biểu ñồ Nguyên tắc:
Biểu ñồ rõ ràng, bỏ qua chi tiết không cần thiết
Chỉ dẫn trên biểu ñồ phải ñược hiểu dễ dàng
ðơn vị của biểu ñồ, phân biệt các thành phần khác nhau
của biểu ñồ bằng màu sắc, nền, ký tự…khác nhau Các dạng biểu ñồ:
Biểu ñồ hình chữ nhật (biểu ñồ cột) Biểu ñồ hình quạt
ðồ thị ñường liên tục
Vũ Hồng Sơn - ðHBK Hà nội 7 4.
Các phần mềm hay dùng trong QLCL SPSS SPAD DESIGN-EXPERT NEMRODW
Vũ Hồng Sơn - ðHBK Hà nội 8 4 CHƯƠNG 3
ỨNG DỤNG CÁC CHUẨN THỐNG KÊ Arithmetic Mean or Average
The mean of a set of observations is their average - the sum of
the observed values divided by the number of observations. Population Mean Sample MeanN n xk 1 f x 1 1 + f x 2 + K 2 + f x x = ∑ f x k k = µ x = i i i =1 n i=1 n i = =1 N x n Vũ Hồng Sơn - ðHBK Hà n S ội ample size 9
• Given a series of values xi (i = 1, … , n): x1, x2, …, xn, the mean is: n 1 x = ∑ xi n i=1
• Study 1: the color scores of 6 consumers are: 6, 7, 8, 4, 5, and 6. The mean is: 1 n 6 + 7 + 8 + 4 + 5 + 6 36 x = ∑ xi = = = 6 n i 1 = 6 6
• Study 2: the color scores of 4 consumers are: 10, 2, 3, and 9. The mean is: 1 n 10 + 2 + 3 + 9 24 x = ∑ xi = = = 6 n i 1 = 4 4
Vũ Hồng Sơn - ðHBK Hà nội 10 5 Variation
• The mean does not adequately describe the data. We need to
know the variation in the data.
• An obvious measure is the sum of difference from the mean:
• For study 1, the scores 6, 7, 8, 4, 5, and 6, we have: •
(6-6) + (7-6) + (8-6) + (4-6) + (5-6) + (6-6)
• = 0 + 1 + 2 – 2 – 1 + 0 • = 0 • NOT SATISFACTORY!
Vũ Hồng Sơn - ðHBK Hà nội 11 Sum of squares
• We need to make the difference positive by squaring them.
This is called “Sum of squares” (SS)
• For study 1: 6, 7, 8, 4, 5, 6, we have: •
SS = (6-6)2 + (7-6)2 + (8-6)2 + (4-6)2 + (5-6)2 + (6-6)2 = 10
• For study 2: 10, 2, 3, 9, we have: •
SS= (10-6)2 + (2-6)2 + (3-6)2 + (9-6)2 = 50 • This is better!
• But it does not take into account sample size n.
Vũ Hồng Sơn - ðHBK Hà nội 12 6 Variance
• We have to divide the SS by sample size n. But in each square
we use the mean to calculate the square, so we lose 1 degree
of freedom. Therefore the correct denominator is n-1. This
is called variance (denoted by s2) x x
+ x x + + xn − 2 ( )2 1 ( 2 )2 ... ( x )2 s = n −1 • Or, in the sum notation: n 1 s2 = ∑ ( 2 i x x) n −1 i=1
Vũ Hồng Sơn - ðHBK Hà nội 13
Variance and Standard Deviation Population Variance Sample Variance nN ∑ (x x 2) (x − µ 2 ) 2 i =1 σ s = 2 i 1 = = (n − ) 1 N 2 N n x ∑ ( x) N ( ∑ )2 n = 2 i 1 ∑ 2 i 1 x − = ∑ x − = i 1 = = N i 1 n = N (n − ) 1 σ = σ2 s = s2
Vũ Hồng Sơn - ðHBK Hà nội 14 7 Variance - example
• For study 1: 6, 7, 8, 4, 5, and 6, the variance is:
(6−6)2 + − + − + − + − 2 (7 6)2 (8 6)2 (5 6)2 (6 6)2 10 s = = = 2 6 −1 5
• For study 2: 10, 2, 3, 9, the variance is: (10−6)2 + − + − + − 2 (2 6)2 (3 6)2 (9 6)2 50 s = = =16 7 . 4 −1 3
The scores in study 2 were much more variable than those in study 1.
Vũ Hồng Sơn - ðHBK Hà nội 15 Standard deviation
• The problem with variance is that it is expressed in unit squared,
whereas the mean is in the actual unit. We need a way to convert
variance back to the actual unit of measurement.
• We take the square root of variance – this is called “standard deviation” (denote by s)
• For study 1, s = sqrt(2) = 1.41
• For study 2, s = sqrt(16.7) = 4.1
Vũ Hồng Sơn - ðHBK Hà nội 16 8 Standard Deviation Data A Mean = 15.5 s = 3.338
11 12 13 14 15 16 17 18 19 20 21 Data B Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = .9258 Data C Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
Vũ Hồng Sơn - ðHBK Hà nội 17 Standard Deviation 0.45 normal(x) 0.4 0.35 0.3 0.25 68 % 0.2 0.15 95 % 0.1 0.05 99.7 % 0
Vũ Hồng Sơn - ðHBK Hà nội 18 µ -3σ µ -2σ µ -σ µ µ +σ µ +2σ µ +3σ 9
Kim ñịnh thng kê : khi- bình phương χ2 O = tần số quan sát = Σ(O - T)2 T T = tần số lý thuyết Tổng hàng x Tổng cột Tần số lý thuyết = Tổng lớn
Vũ Hồng Sơn - ðHBK Hà nội 19 Sản phẩm Trả lời Tổng A non A A 32.5 27.5 60 Non A 32.5 27.5 60 Tổng 65 55 120 χ2 = 7,55 > χ2 = 2,71, pour α = 0,05 calculé théorique
Vũ Hồng Sơn - ðHBK Hà nội 20 10
Xlý 2 giá trtrung bình-kim ñịnh t-Student
Trường hp 2 mu ñộc lp
1. Kim ñnh phng sai 2 S1 F = 2
với qui ước phương sai1 >phương sai 2 S2 2 n 1 2 1 2 2 ∑ S = ( ∑ xi − )   ( xi)  với x = ∑xi −   n−1 1 i=1 n−  n
F tra bảng mức α=5%, bậc tự do f =n -1, f =n -1 b 1 1 2 2
Nếu F2 phương sai bằng nhau b Nếu F≥F 2 phương sai khác nhau b
Vũ Hồng Sơn - ðHBK Hà nội 21 Levene’s test where • with the mean of group i, • is the mean of all Z , ij
is the mean of the Z for group i. ij
The Levene test rejects the hypothesis that the variances are equal if
Vũ Hồng Sơn - ðHBK Hà nội 22 11
Giá trxác sut (p Values)
• Giá trị p value ñược so sánh với mức ý nghĩa (significant
level - α), và dựa trên kết quả này ñể bác bỏ hay không bác bỏ giả thiết.
• Nếu giá trị p value nhỏ hơn mức ý nghĩa, giả thiết bị bác
bỏ (p value < α, bác bỏ giả thiết H ). 0
• Nếu giá trị p value bằng hoặc lớn hơn mức ý nghĩa,
không bác bỏ giả thiết H (p value > α, không bác bỏ giả o thiết H ). 0
Vũ Hồng Sơn - ðHBK Hà nội 23
2. Hai mu ñc lp có phng sai bng nhau Group 1 Group2 Mean difference: x x 11 21 x x
D = x x 1 2 12 22 x x 13 23 Variance of D: x x 14 24 x x
n s + n s 2 ( 1 )1 21 ( 2 )1 2 15 25 2 s = n + n − 2 1 2 x x 1n 2n T-statistic: Sample size n n 1 2 x x 1 − 2 Mean x x t = 1 2  1 1  2 s  +  SD s sn n 1 2  1 2
Vũ Hồng Sơn - ðHBK Hà nội 24 12 Produc A Product B Mean difference: 106 110
D = 119.0 – 107.1 = 11.9 98 134 108 122 Variance of D: 104 104 (8 .949)2 + 2 (610 8.8)2 s = =10 . 2 2 120 118 9 + 7 − 2 124 131 108 114 T-statistic: 11.9 96 t = = 2.34  1 1  100 102 2 .  +   9 7  N 9 7 Mean 107.1 119.0 t =2.15 SD 9.49 10.88 b,5%,14 Conclusion: Significant difference
Vũ Hồng Sơn - ðHBK Hà nội 25
3. Hai mu ñc lp có phng sai khác nhau Mean difference: Group 1 Group2
D = x x 1 2 x x 11 21 x x Variance of D: 12 22 2 2 x x S S 13 23 2 1 2 s = + x x 14 24 n n 1 2 x x 15 25 T-statistic: x x 1 − 2 x x t = 1n 2n  2 2  S S  1 + 2  Sample size n nn n 1 2  1 2 Mean x x 2 2 2  S S1 2 1 2  +   n n 1 2  f = SD s s 2 2 2 2  S   S1 2 1 2      n n 1   2  + n −1 n −1 1 2
Vũ Hồng Sơn - ðHBK Hà nội 26 13 Produc A Product B Mean difference: 28 12 D = 26.2 – 10.2 = 16 17 7 36 11 T-statistic: 23 10 26 . 2 − 10 . 2 t = = 5 . 01 27 11  6 . 98 2 1 . 92 2   +  N 5 5  5 5  Mean 26.2 10.2 ( 2 6.982 1.922 + 5 5 ) SD 6.98 1.92 f = ( = ≈ 2 2 6.982 2 5 ) (1.92 5) 4.6 5 + 4 4 t =2.57 b,5%,5 Conclusion: Significant difference
Vũ Hồng Sơn - ðHBK Hà nội 27
Trường hp 2 mu tương quan, so sánh cp Subject Before After Diff. Mean difference: 1 x x x -x 01 11 01 11
D = x x 2 x x x -x 1 2 02 12 02 12 3 x x x -x 03 13 03 13 4 x x x -x 04 14 04 14 x t d = 5 x x x -x 05 15 05 15 s / n dn x x x -x 0n 1n 0n 1n Mean x x x 0 1 d SD s s s 0 1 d
Vũ Hồng Sơn - ðHBK Hà nội 28 14 Paired samples
The problem: Viewing certain meats under red light might
enhance judges preferences for meat. 12 judges were asked to
score the redness of meat under red light and white light Results: Judge Red White Judge Red White 1 20 22 8 16 20 2 18 19 9 21 22 3 19 17 10 17 20 4 22 18 11 23 27 5 17 21 12 18 24 6 20 23 7 19 19
Question: Was there an effect of light?
Vũ Hồng Sơn - ðHBK Hà nội 29 Paired samples – analysis Judge Red light White light Difference
Mean difference: 1.83, SD: 2.82 1 20 22 2 2 18 19 1 Standard error (SE): 3 19 17 -2 SD/sqrt(n) = 2.82/sqrt(12) = 4 22 18 -4 0.81 5 17 21 4 6 20 23 3 7 19 19 0 t-test = |1.83|/0.81 = 2.23 8 16 20 4 t 9 21 22 1 b,5%= 2.201 10 17 20 3 Conclusion: there was a 11 23 27 4
significant effect of light colour. 12 18 24 6 Mean 19.2 21 1.83 SD 2.1 2.8 2.82
Vũ Hồng Sơn - ðHBK Hà nội 30 15 Tin UD trong QLCL Anova PHÂ P N N TÍ CH C PHƯ P ƠN G ƠN SAI SA (A ( N A OV N A OV ) A
Mục tiêu của phân tích phương sai là so sánh trung
bình của nhiều nhóm (tổng thể) dựa trên các số trung bình
của các mẫu quan sát từ các nhóm này và thông qua kiểm
định giả thuyết để kết luận về sự bằng nhau của các số trung bình này.
Trong nghiên cứu, phân tích phương sai được dùng
như là một công cụ để xem xét ảnh hưởng của một hay một
số yếu tố nguyên nhân (định tính) đến một yếu tố kết quả (định lượng). PHÂ PH N Â N T ÍCH T ÍCH PHƯ PH ƠN Ơ G N G SAI SA Ví dụ:
 Nghiên cứu ảnh hưởng của phương pháp đánh
giá của giáo viên đến kết quả học tập của sinh viên.
 Nghiên cứu ảnh hưởng của bậc thợ tới năng suất lao động.
 Nghiên cứu ảnh hưởng của phương pháp bán
hàng, trình độ (kinh nghiệm) của nhân viên bán hàng đến doanh số PhD.VHSơn-Hust 1 Tin UD trong QLCL Anova PHÂ PH N Â N T ÍCH T ÍCH PHƯ PH ƠN Ơ G N G SAI SA
Phân tích phương sai một yếu tố
Phân tích phương sai hai yếu tố Phân Ph ân tích h ph p ư h ơng n sai m ột y ếu u t
Phân tích phương sai một yếu tố là phân tích
ảnh hưởng của một yếu tố nguyên nhân (dạng
biến định tính) đến một yếu tố kết quả (dạng
biến định lượng) đang nghiên cứu. PhD.VHSơn-Hust 2 Tin UD trong QLCL Anova Phân Ph ân tích h ph p ư h ơng n sai m ột y ếu u t
Giả sử cần so sánh số trung bình của k tổng
thể độc lập. Ta lấy k mẫu có số quan sát là n , 1
n … n ; tuân theo phân phối chuẩn. Trung bình 2 k
của các tổng thể được ký hiệu là μ ; μ ….μ 1 2 k
thì mô hình phân tích phương sai một yếu tố
ảnh hưởng được mô tả dưới dạng kiểm định giả thuyết như sau: H : μ = μ =….=μ o 1 2 k
H : Tồn tại ít nhất 1 cặp có μ ≠μ ; i ≠ j 1 i j Phân Ph ân tích h ph p ư h ơng n sai m ột y ếu u t
Để kiểm định ta đưa ra 3 giả thiết sau: 1)
Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2) 2)
Các phương sai tổng thể bằng nhau
3) Ta lấy k mẫu độc lập từ k tổng thể. Mỗi mẫu được quan sát n lần. i PhD.VHSơn-Hust 3 Tin UD trong QLCL Anova Các bư Các ớc ớ t c i t ế i n ế hành: Bướ ư c c 1 : : T ín í h c á c c á c tr t u r ng b ìn ì h m ẫ m u ẫ và à t r t u r ng b ìn ì h c h c ung củ c a a k m ẫ m u ẫ
 Ta lập bảng tính toán như sau: TT k mẫu quan sát 1 2 3 … k 1 X X X X 11 21 31 k1 2 X X X X 12 22 32 k2 3 X X X X 13 23 33 k3 … … n X X X X i 1n1 2n2 3n3 knk Trung bình mẫu x x x x 1 2 3 k B ớc ư 1 ớc : : T í T nh c í á nh c c á c trung bì t nh rung bì mẫ m u ẫ và và trung bì t nh rung bì chung c c hung ủa c ủa k mẫ k m u ẫ
Trung bình mẫu x x x được tính theo công thức: 1 2 k i n Xij j 1 = x = (i = 1, 2,..k) i ni
Trung bình chung của k mẫu được tính theo công thức: k n xi i i 1 x = = (i = 1, 2,..k) k ni i 1 = PhD.VHSơn-Hust 4 Tin UD trong QLCL Anova B ớc 2 ớc : T í T nh các tổng đ ộ l ệch b ình p hươn ươ g
Tổng các độ lệch bình phương trong nội bộ nhóm
(nội bộ từng mẫu - SSW) được tính theo công thức sau: Nhóm 1 Nhóm 2 Nhóm k 1 n n k n 2 2 SS = (X ∑ 2 − 2 =∑ − =∑ − 1) x SS (X x) SS (X x) k 1 1 j 2 2 2 j k jk j 1 = j 1 = j 1 = k i n 2 SSW S = S S + S . +.. S + S = (X ∑∑ − ix) 1 2 k ij i 1 = ij 1 = 1 B ớc ư 2 ớc : : T í T nh c í á nh c c á c tổng t độ lệ độ l c ệ h c bình phươ bì ng nh phươ
Tổng các độ lệch bình phương giữa các nhóm(SSB) k 2 S S B = n ( x ∑ − x ) i i i = 1
Tổng các độ lệch bình phương của toàn bộ tổng thể(SST) k ni 2
S S T = S S W + S S B = ( X ∑ ∑ − x ) i j i =1 j =1 PhD.VHSơn-Hust 5