1
Bài 1
GII THIU
CHUNG V THNG KÊ
0
Tóm t t
Gi thi thiu v ng
Các khái nim c nơb
Thang ođ
Gi li ui thiu phn mm phân tích d
1
Thng gì?
2 3
4
Thng gì?
Thng thểđưc hiu theo nghĩa thông
th li uường thu thp, tng hp phân tích d
Theo chiu sâu: thng được hiu cách th c
chi d liết xut thông tin t uđể ra quyếtđịnh
trong điu kin không chc ch n.
Phân tích thng áp dng các phương pháp thu
thp, tng hp phân tích dliu da vào các mô
hình thng thuyết vxác su t.
5
0 1
2 3
4 5
2
Vn đề
Làm thếnào chiết xutđược thông tin giá trt
d li uđể ra quyếtđịnh chính xác? Điu này
không d!
6
Ti sao thng tm quan trng đặc bit?
Qun tài chính (lp kếhoch đầu t )ư
Qun marketing (định giá)
Nghiên cu marketing (hành vi người tiêu dùng)
Qun quá trình hotđộng (Kim kê, kho)
Kếtoán (dbáo doanh thu)
Qun ngun nhân l ánh giá hic (đ u qucông
vi c)
Hthng thông tin
Kinh tế(tóm tt, dbáo)
7
Why is statistics important?
8
Phân loi thng
Thng kê t thng suy di n
9
Thng kê t
Giai đo linđầu tiên ca phân tích d u nhm
t hi gi n tượng hoc khám phá mi liên h a các
hin t ng.ượ
- t: Đặcđim ca khách hàng tim năng gì?
- Khám phá mi liên h: Có mi liên hgi nga ch i
k hết qu c tp ko?
tháp dng cho TT hoc mu
Kthut:
- Bng
-Đồ th
- Tính các tham s/ thng
10
Thng kê suy di n
Suy din cho TT da vào kết qutính toán ca m u.
Kthu t
Ước lượng tham sca TT da vào thng mu.
- VD: Nếu chiu cao trung bình ca mu 1000 ngườiđàn ông
1.63m thì chiu cao TB ca toàn bộđàn ông VN là bao
nhiêu?
Kimđịnh k ng th ng kê mết quca t da vào th u.
- đúng chiu cao TB cađàn ông VN là 1.65m không khi
chiu cao TB ca mu 1000 đàn ông 1.60m?
11
6 7
8 9
10 11
3
Khái nim cơbn: 1. T ng thth ng (1)
TTTK hay Tng th(TT) toàn thcác đơn v
thu ic phm vi đối tượng đ u tra
Để xác định được tng thcn xác định được:
-Đối tượng điu tra
-Đơn vịđiu tra
- Phm vi điu tra
Tng sốđơn vtng thểđưc hiu N
d:
- Tng thsv ca NEU
- Tng thcác doanh nghip tưnhân trong nước trên ađị
bàn TP. Hà N i
12
Khái nim cơbn: Tng ththng (2)
T ing đ u tra thu thp thông tin vt cáct c
đơ n vthu c t ng th
- Thu th p thông tin v ềđcđim ca toàn bsv ca NEU
- Thu th p thông tin v doanh thu ca tt ccác doanh
nghip tưnhân trong nước trên địa bàn TP. N i
Tham s: là các giá trịđưc tính toán nhm ph n
ánh đặc trưng ca TT
13
2
( , )
Khái nim cơbn: 2. Mu (1)
Mu mt tp hp con được rút ra ttng th
Tng sốđơn v u ca m c hiuđượ n
d:
- Mu 100 sv ttng th20000 sv chính quy ca NEU
- Mu 100 doanh nghip tưnhân trong nước trên địa bàn
TP. Hà Ni
14
Khái nim cơb n: M u (2)
Điu tra chn mu tiến hành thu thp thông tin
ca các đơn v trong m u
- Thu th p thông tin v doanh thu c pa 100 doanh nghi
- Thu th p thông tin v thu nhp ca 1000 h
Thng kê: là các giá trịđưc tính toán nhm ph n
ánh đặc trưng ca m u
2
(x, s )
15
Tham s thng
Mt cuc kho sát gnđây trên mu gm 450 sinh
viên NEU cho biết, chi tiêu bình quân mt tháng c a
sinh viên 5,25 tri ng.uđồ
Thu nhp trung bình hàng tháng ca toàn bsinh viên
NEU đang ng.đi làm thêm 4,05 triuđồ
Tham s? Thng m u?
do tiến hành điu tra ch n m u
T vng điu tra cung cp bc tranh đầyđủ
tng thnh th cưng nhìn chung không th
hinđược do
Tng điu tra tn rt nhiu thi gian kinh phí
M h chou vi quy nh ơn so v i t ng th
phép thu thpđược nhiu thông tin chi tiết h nơ
Muđược rút ra ttng thkhông phn ánh
được bc tranh đầyđủ vtng th. Tuy nhiên v i
m muđại din mt c uđủ lnscho b c
tranh ràng vt phng th, đủ c vcho m c
đích ra quyếtđịnh
17
12 13
14 15
16 17
4
Lý do tiế Đn hành TCM
18
Muđảm bođại di n
19
T t ng thểđến m u
20
TNG TH
Dàn chn m u
(danh sách tt c các đơn v
thuc đối tượng nghiên
cu)
M U
M l nuđủ
Hcbài 5
21
Khái nim cơbn: 3. Biế n dli u
Biến: đặcđi t hom cađơn v ng th c m u
được chn ra u.để nghiên c
VD:
Chiu cao
Nghnghi p
Dliu: giá trquan sát ca bi n.ế
VD:
Chiu cao ca 10 người: 1.6, 1.7, 1.55, 1.59, 1.5, 1.58,
1.64, 1.67, 1.58, 1.55
Nghnghip ca 5 người: giáo viên, bác sĩ, nhà kinh
doanh, …
22
M r bi n ng khái nim v ế
Trong thng kê, biến th tiêu thc hoc chtiêu thng
Tiêu thc thng kê: định nghĩa ging nhưbiến trên
hàm ý giá trịđơn lc u.ađơn vTT hoc m
- d: Chiu cao ca sinh viên
Chtiêu thng kê: hàm ý kết qu đo lường phn ánh quy mô,
trình độ, t c , c c c độ ơ u hay mi liên h a hin tượng kinh tế
- hi.
- d:
+ S sinh viên n ca trường công nghlà 3.000
+ Thu nhp bình quân hgia đình năm 2024 là 10tr đồng/tháng.
23
18 19
20 21
22 23
5
Thang đo cho dli u
D li u
Định tính Định lượng
Ri rcLiên tcĐịnh danh Thb c
24
Dliuđịnh tính
Dliuđịnh tính: không đo lường được bng các con s
bng các biu hi n
Tình trng hôn nhân: độc thân, có gia đình, ly hôn, góa
Kết qulàm vic ca mi nhân: kém, trung bình, tt, rt tt.
Thang đo cho dliuđịnh tính:
Thang đođịnh danh (Nominal data): chỉđơn gin các tên gi hay
biu hi n
+ Tình trng hôn nhân: 1. độc thân; 2. có gia đình; 3. ly hôn; 4. góa
Thang đo thbc (Ordinal data): là thang đođịnh danh nhưng giá tr
biu hi n th bc hơn kém
+ Kết qu t tlàm vic ca mi nhân: kém, trung bình, tt, r t.
+ Ý kiến ca khách hàng: rt không đồng ý, không ng ý, khôngđồ
đồ đố đồ đồng ý cũng không phn i, ng ý, rt ng ý.
25
D liu định lượng
Dliuđịnh lượng: đo lường trc tiếp bng con s
- Nhitđộ
- Sthành viên trong gia đình
- Thu nhp ca các thành viên trong h
Thang đo cho dliuđịnh lượng.
Thang đo khong: là thang đo thbc nhưng khong cách đều nhau
không có đim gc 0 tuy itđố
d :
Nhitđộ: thành ph(TP) A là 40
o
C; ca TP B 20
o
C
Thang đo tl: là thang đo khong nhưng đim gc 0 tuytđối
d: Sthành viên trong gia đình: 1, 2, 4, 7, 2
26
M li ngrng vd uđịnh lượ
Dliuđịnh lượng được chia làm 2 loi: ri rc
liên t c
Dliu (biến) ri rc: slượng giá tr hu hn
th nh nguyênường ch n giá tr
d :
Sthành viên trong gia đình : 1, 2, 4, 7, 2
Snhà (căn h) thuc shu ca h
Dliu (biến) liên tc: slượng giá trthường hn
nh thn bt kgiá trnào (csnguyên s p phân)
d :
Thu nhp ca các thành viên trong h
Doanh thu ca các hotđộng sn xut kinh doanh ca htrong
vòng 12 tháng qua
27
Dliu chéo: thu thp thông tin ti cùng m t th i
đ đơim c a nhiu n v(quan sát)
d: Thu nhp chi tiêu ca 1000 h ình tronggia đ
năm 2012.
Phương pháp phân tích cho dliu chéo
Dliu theo thi gian: thu thp thông tin ca m t
đơ n vqua nhiu m c th i gian khác nhau.
d: Giá đóng ca hàng ngày ca vàng trong vòng 30
năm
Ph liương pháp phân tích d u theo thi gian
28
Các loi dli u
Dliu mng (panel data): thu thp thông tin c a
nhiuđơn vqua nhiu mc thi gian khác nhau
d: Sn lượng ca 101 ngành công nghip năm 2007
2012
Phương pháp phân tích d u mli ng (Không đề cp
trong khoá hc này)
29
Các loi dli u
24 25
26 27
28 29
6
Ngu li un d
Da vào phương pháp thu th p thông tin, d liu
được phân thành:
D liu sơ cp: do các cơ quan/t chc t tiến hành thu
thp phc v cho yêu cu nghiên cu riêng ca h
VD: bn c n bi ết hành vi ca khách hàng ca
Techcombank, bn t p thông tin thu th
D liu th c p: được thu thp bi các cơ quan/t
chc khác, phc v cho yêu cu nghiên cu khác
VD: S d s u ng b li điu tra mc sng (VHLSS) để
đ đ ánh giá tình trng nghèo ói và cơ s h tng c a các
địa phương.
30
Ngun d liu th c p
Ngun Internet
Ca stìm kiếm google các thông tin nghiên c u vth
tr trường tim năng th ường các sn phm phí thiên nhiên
trên phm vi toàn quc ti khu vc min Trung
Danh sách các doanh nghip thuc tpđoàn PVN
Thng chính thc tcác cơquan chính ph
T ch giáng cc thng (GSO) cung cp thông tin v s
tiêu dùng (CPI) rt quan trng cho vic loi blm phát để
ướ ược l ng tiêu dùng thc tếc đa các hgia ình
(www.gso.gov.vn)
Dli iuđ u tra ca GSO các cơquan khác (VHLSS)
Dli cu công b a PVN (www.pvgas.com.vn)
D li li u ni b: d u thu thp bi các đơn vkhác thu c
PVN được sdng chung trong các đơn v
Dli Vi ngu t n Năng lượ
31
Tình hung tho lun 1
Phân bit dliu sau đây thuc loi sdng thang
đo nào?
i. Tng skm mà ô tô/xe máy ca bnđãđi.
ii.M i m.c lương khiđ
iii.Tháng nhân viên ca mt tpđoàn la chnđể ngh
phép.
iv.Ngh nghi p ca sv sau khi ra trường.
v. Xếp hng ging viên.
32
Làm quen vi SPSS
Lưu file d liu ‘assignment 1 data set.xls’ vào
SPSS và làm quen v n mi ph m này
33
30 31
32 33

Preview text:

Tóm tắt Bài 1
•Giới thiệu vềthống kê
GIỚI THIỆU CHUNG VỀ THỐNG KÊ •Các khái niệm cơbản •Thang đo
•Giới thiệu phần mềm phân tích dữliệu 0 1 0 1 Thống kê là gì? 2 3 2 3 Thống kê là gì? •Thống kê có thểđ ư ợ c hiểu theo nghĩa thông
thường là thu thập, tổng hợp và phân tích dữliệu
•Theo chiều sâu: thống kê được hiểu là cách thức
chiết xuất thông tin từdữliệuđể ra quyếtđịnh
trong điều kiện không chắc chắn.
•Phân tích thống kê là áp dụng các phương pháp thu
thập, tổng hợp và phân tích dữliệu dựa vào các mô
hình thống kê và lý thuyết vềxác suất. 4 5 4 5 1 Vấn đề là …
Tại sao thống kê có tầm quan trọng đặc biệt?
•Làm thếnào chiết xuấtđược thông tin có giá trịtừ
•Quản lý tài chính (lập kếhoạch đầu tư)
dữliệuđể ra quyếtđịnh chính xác? Điều này
•Quản lý marketing (định giá) không dễ!
•Nghiên cứu marketing (hành vi người tiêu dùng)
•Quản lý quá trình hoạtđộng (Kiểm kê, kho)
•Kếtoán (dựbáo doanh thu)
•Quản lý nguồn nhân lực (đánh giá hiệu quảcông việc) •Hệthống thông tin
•Kinh tế(tóm tắt, dựbáo) 6 7 6 7 Why is statistics important? Phân loại thống kê
Thng kê mô tvà thng kê suy din 8 9 8 9 Thống kê mô tả Thống kê suy diễn
•Giai đoạnđầu tiên của phân tích dữliệu nhằm mô
•Suy diễn cho TT dựa vào kết quảtính toán của mẫu.
tảhiện tượng hoặc khám phá mối liên hệgiữa các •Kỹthuật hiện tượng.
Ước lượng tham sốcủa TT dựa vào thống kê mẫu.
- Mô tả: Đặcđiểm của khách hàng tiềm năng là gì?
- VD: Nếu chiều cao trung bình của mẫu 1000 ngườiđàn ông
- Khám phá mối liên hệ: Có mối liên hệgiữa chỗngồi và
là 1.63m thì chiều cao TB của toàn bộđàn ông VN là bao kết quảhọc tập ko? nhiêu?
•Có thểáp dụng cho TT hoặc mẫu
Kiểmđịnh kết quảcủa tổng thểdựa vào thống kê mẫu. •Kỹthuật:
- Có đúng chiều cao TB củađàn ông VN là 1.65m không khi
chiều cao TB của mẫu 1000 đàn ông là 1.60m? - Bảng -Đồ thị
- Tính các tham số/ thống kê 10 11 10 11 2
Khái niệm cơbản: 1. Tổng thểthống kê (1)
Khái niệm cơbản: Tổng thểthống kê (2)
TTTK hay Tng th(TT) là toàn thểcác đơn vị
thuộc phạm vi đối tượng điều tra
Tng điu tra là thu thập thông tin vềtất cảcác
Để xác định được tổng thểcần xác định được: đơn vịthuộc tổng thể -Đối tượng điều tra
- Thu thập thông tin vềđặcđiểm của toàn bộsv của NEU -Đơn vịđiều tra
- Thu thập thông tin vềdoanh thu của tất cảcác doanh - Phạm vi điều tra
nghiệp tưnhân trong nước trên địa bàn TP. Hà Nội
•Tổng sốđơn vịtổng thểđược kí hiệu là N
Tham số: là các giá trịđược tính toán nhằm phản ánh đặc trưng của TT Ví d: - Tổng thểsv của NEU 2 (, ) 
- Tổng thểcác doanh nghiệp tưnhân trong nước trên địa bàn TP. Hà Nội 12 13 12 13
Khái niệm cơbản: 2. Mẫu (1)
Khái niệm cơbản: Mẫu (2)
Mulà một tập hợp con được rút ra từtổng thể
Điu tra chn mulà tiến hành thu thập thông tin
của các đơn vịtrong mẫu
•Tổng sốđơn vịcủa mẫuđược kí hiệu là n
- Thu thập thông tin vềdoanh thu của 100 doanh nghiệp Ví d:
- Thu thập thông tin vềthu nhập của 1000 hộ
- Mẫu 100 sv từtổng thể20000 sv chính quy của NEU
- Mẫu 100 doanh nghiệp tưnhân trong nước trên địa bàn
Thng kê: là các giá trịđược tính toán nhằm phản TP. Hà Nội ánh đặc trưng của mẫu 2 (x, s ) 14 15 14 15 ọ ẫ Tham sốvà thống kê
Lý do tiến hành điều tra ch n m u
•Tổng điều tra cung cấp bức tranh đầyđủ về
•Một cuộc khảo sát gầnđây trên mẫu gồm 450 sinh
tổng thểnhưng nhìn chung không thểthực
viên NEU cho biết, chi tiêu bình quân một tháng của hiệnđược do
sinh viên là 5,25 triệuđồng.
–Tổng điều tra tốn rất nhiều thời gian và kinh phí
•Thu nhập trung bình hàng tháng của toàn bộsinh viên
NEU đang đi làm thêm là 4,05 triệuđồng.
–Mẫu với quy mô nhỏhơn so với tổng thểcho
phép thu thậpđược nhiều thông tin chi tiết hơn Tham số? Thống kê mẫu?
–Mẫuđược rút ra từtổng thểkhông phản ánh
được bức tranh đầyđủ vềtổng thể. Tuy nhiên với
mẫuđại dinvà một cỡmẫuđủ lnsẽcho bức
tranh rõ ràng vềtổng thể, đủ phục vụcho mục đích ra quyếtđịnh 17 16 17 3 Lý do tiến hành ĐTCM Mẫuđảm bảođại diện 19 18 18 19 Từtổng thểđến mẫu Mẫuđủ lớn Họcởbài 5 TỔNG THỂ Dàn chọn mẫu
(danh sách tất cả các đơn vị
thuộc đối tượng nghiên cứu) MẪU 21 20 20 21
Khái niệm cơbản: 3. Biến và dữliệu
Mởrộng khái niệm vềbiến
Biến: là đặcđiểm củađơn vịtổng thểhoặc mẫu
•Trong thống kê, biến có thểlà tiêu thức hoặc chỉtiêu thống kê
được chọn ra để nghiên cứu.
Tiêu thc thng kê: có định nghĩa giống nhưbiếnở trên và VD:
hàm ý giá trịđơn lẻcủađơn vịTT hoặc mẫu. • Chiều cao
-Ví dụ: Chiều cao của sinh viên • Nghềnghiệp
Chtiêu thng kê: hàm ý kết quả đo lường phản ánh quy mô,
Dliu: là giá trịquan sát của biến.
trình độ, tốc độ, cơ cấu hay mối liên hệ của hiện tượng kinh tế VD: - xã hội.
• Chiều cao của 10 người: 1.6, 1.7, 1.55, 1.59, 1.5, 1.58, -Ví dụ: 1.64, 1.67, 1.58, 1.55
+ Số sinh viên nữ của trường công nghệlà 3.000
• Nghềnghiệp của 5 người: giáo viên, bác sĩ, nhà kinh
+ Thu nhập bình quân hộgia đình năm 2024 là 10tr đồng/tháng. doanh, … 22 23 22 23 4 Thang đo cho dữliệu Dữliệuđịnh tính
•Dữliệuđịnh tính: không đo lường được bằng các con sốmà bằng các biểu hiện Dữliệu
•Tình trạng hôn nhân: độc thân, có gia đình, ly hôn, góa
•Kết quảlàm việc của mỗi cá nhân: kém, trung bình, tốt, rất tốt.
•Thang đo cho dữliệuđịnh tính: Định tính Định lượng
–Thang đođịnh danh (Nominal data): chỉđơn giản là các tên gọi hay biểu hiện
+ Tình trạng hôn nhân: 1. độc thân; 2. có gia đình; 3. ly hôn; 4. góa
–Thang đo thứbậc (Ordinal data): là thang đođịnh danh nhưng giá trị
biểu hiện thứbậc hơn kém Định danh Thứbậc Rời rạcLiên tục
+ Kết quảlàm việc của mỗi cá nhân: kém, trung bình, tốt, rất tốt.
+ Ý kiến của khách hàng: rất không đồng ý, không đồng ý, không
đồng ý cũng không phảnđối, đồng ý, rấtđồng ý. 24 25 24 25 Dữ liệu định lượng
Mởrộng vềdữliệuđịnh lượng
•Dữliệuđịnh lượng: đo lường trực tiếp bằng con số
•Dữliệuđịnh lượng được chia làm 2 loại: rời rạc và - Nhiệtđộ liên tục
- Sốthành viên trong gia đình
–Dữliệu (biến) rời rạc: sốlượng giá trịlà hữu hạn và
- Thu nhập của các thành viên trong hộ
thường chỉnhận giá trịnguyên
•Thang đo cho dữliệuđịnh lượng. Ví dụ:
–Thang đo khoảng: là thang đo thứbậc nhưng có khoảng cách đều nhau
và không có điểm gốc 0 tuyệtđối
•Sốthành viên trong gia đình : 1, 2, 4, 7, 2
•Sốnhà (căn hộ) thuộc sởhữu của hộ Ví dụ:
–Dữliệu (biến) liên tục: sốlượng giá trịthường vô hạn và
•Nhiệtđộ: thành phố(TP) A là 40 oC; của TP B là 20oC
nhận bất kỳgiá trịnào (cảsốnguyên và sốthập phân)
–Thang đo tỷlệ: là thang đo khoảng nhưng có điểm gốc 0 tuyệtđối Ví dụ:
Ví dụ: Sốthành viên trong gia đình: 1, 2, 4, 7, 2
•Thu nhập của các thành viên trong hộ
•Doanh thu của các hoạtđộng sản xuất kinh doanh của hộtrong vòng 12 tháng qua 26 27 26 27 Các loại dữliệu Các loại dữliệu
•Dữliệu chéo: thu thập thông tin tại cùng một thời
•Dữliệu mảng (panel data): thu thập thông tin của
điểm của nhiềuđơn vị(quan sát)
nhiềuđơn vịqua nhiều mốc thời gian khác nhau
–Ví dụ: Thu nhập và chi tiêu của 1000 hộgia đình trong năm 2012.
–Ví dụ: Sản lượng của 101 ngành công nghiệp năm 2007 và 2012
Phương pháp phân tích cho dliu chéo
Phương pháp phân tích dliu mng (Không đề cp
•Dữliệu theo thời gian: thu thập thông tin của một
trong khoá hc này)
đơn vịqua nhiều mốc thời gian khác nhau. –
Ví dụ: Giá đóng cửa hàng ngày của vàng trong vòng 30 năm
Phương pháp phân tích dliu theo thi gian 28 29 28 29 5 Nguồn dữliệu
Nguồn dữ liệu thứ cấp •Nguồn Internet
•Dựa vào phương pháp thu thập thông tin, dữ liệu
•Cửa sổtìm kiếm google các thông tin và nghiên cứu vềthị được phân thành:
trường và tiềm năng thịtrường các sản phẩm phí thiên nhiên
trên phạm vi toàn quốc và tại khu vực miền Trung
D liu sơ cp: do các cơ quan/tổ chức tự tiến hành thu
•Danh sách các doanh nghiệp thuộc tậpđoàn PVN
thập phục vụ cho yêu cầu nghiên cứu riêng của họ
•Thống kê chính thức từcác cơquan chính phủ
VD: bạn cần biết hành vi của khách hàng của
•Tổng cục thống kê (GSO) cung cấp thông tin vềchỉsốgiá
Techcombank, bạn tự thu thập thông tin
tiêu dùng (CPI) rất quan trọng cho việc loại bỏlạm phát để
ước lượng tiêu dùng thực tếcủa các hộgia đình – (www.gso.gov.vn)
D liu th cp: được thu thập bởi các cơ quan/tổ
chức khác, phục vụ cho yêu cầu nghiên cứu khác
•Dữliệuđiều tra của GSO và các cơquan khác (VHLSS)
•Dữliệu công bốcủa PVN (www.pvgas.com.vn)
VD: Sử dụng bộ số liệu điều tra mức sống (VHLSS) để
•Dữliệu nội bộ: dữliệu thu thập bởi các đơn vịkhác thuộc
đánh giá tình trạng nghèo đói và cơ sở hạ tầng của các
PVN và được sửdụng chung trong các đơn vị địa phương.
•Dữliệu từViện Năng lượng 30 31 30 31 Tình huống thảo luận 1 Làm quen với SPSS
•Phân biệt dữliệu sau đây thuộc loại gì và sửdụng thang đo nào?
•Lưu file dữ liệu ‘assignment 1 data set.xls’ vào
i. Tổng sốkm mà ô tô/xe máy của bạnđãđi.
SPSS và làm quen với phần mềm này
ii.Mức lương khởiđiểm.
iii.Tháng mà nhân viên của một tậpđoàn lựa chọnđể nghỉ phép.
iv.Nghềnghiệp của sv sau khi ra trường.
v. Xếp hạng giảng viên. 32 33 32 33 6