






Preview text:
Tóm tắt Bài 1
•Giới thiệu vềthống kê
GIỚI THIỆU CHUNG VỀ THỐNG KÊ •Các khái niệm cơbản •Thang đo
•Giới thiệu phần mềm phân tích dữliệu 0 1 0 1 Thống kê là gì? 2 3 2 3 Thống kê là gì? •Thống kê có thểđ ư ợ c hiểu theo nghĩa thông
thường là thu thập, tổng hợp và phân tích dữliệu
•Theo chiều sâu: thống kê được hiểu là cách thức
chiết xuất thông tin từdữliệuđể ra quyếtđịnh
trong điều kiện không chắc chắn.
•Phân tích thống kê là áp dụng các phương pháp thu
thập, tổng hợp và phân tích dữliệu dựa vào các mô
hình thống kê và lý thuyết vềxác suất. 4 5 4 5 1 Vấn đề là …
Tại sao thống kê có tầm quan trọng đặc biệt?
•Làm thếnào chiết xuấtđược thông tin có giá trịtừ
•Quản lý tài chính (lập kếhoạch đầu tư)
dữliệuđể ra quyếtđịnh chính xác? Điều này
•Quản lý marketing (định giá) không dễ!
•Nghiên cứu marketing (hành vi người tiêu dùng)
•Quản lý quá trình hoạtđộng (Kiểm kê, kho)
•Kếtoán (dựbáo doanh thu)
•Quản lý nguồn nhân lực (đánh giá hiệu quảcông việc) •Hệthống thông tin
•Kinh tế(tóm tắt, dựbáo) 6 7 6 7 Why is statistics important? Phân loại thống kê
Thống kê mô tảvà thống kê suy diễn 8 9 8 9 Thống kê mô tả Thống kê suy diễn
•Giai đoạnđầu tiên của phân tích dữliệu nhằm mô
•Suy diễn cho TT dựa vào kết quảtính toán của mẫu.
tảhiện tượng hoặc khám phá mối liên hệgiữa các •Kỹthuật hiện tượng.
Ước lượng tham sốcủa TT dựa vào thống kê mẫu.
- Mô tả: Đặcđiểm của khách hàng tiềm năng là gì?
- VD: Nếu chiều cao trung bình của mẫu 1000 ngườiđàn ông
- Khám phá mối liên hệ: Có mối liên hệgiữa chỗngồi và
là 1.63m thì chiều cao TB của toàn bộđàn ông VN là bao kết quảhọc tập ko? nhiêu?
•Có thểáp dụng cho TT hoặc mẫu
Kiểmđịnh kết quảcủa tổng thểdựa vào thống kê mẫu. •Kỹthuật:
- Có đúng chiều cao TB củađàn ông VN là 1.65m không khi
chiều cao TB của mẫu 1000 đàn ông là 1.60m? - Bảng -Đồ thị
- Tính các tham số/ thống kê 10 11 10 11 2
Khái niệm cơbản: 1. Tổng thểthống kê (1)
Khái niệm cơbản: Tổng thểthống kê (2)
•TTTK hay Tổng thể(TT) là toàn thểcác đơn vị
thuộc phạm vi đối tượng điều tra
Tổng điều tra là thu thập thông tin vềtất cảcác
Để xác định được tổng thểcần xác định được: đơn vịthuộc tổng thể -Đối tượng điều tra
- Thu thập thông tin vềđặcđiểm của toàn bộsv của NEU -Đơn vịđiều tra
- Thu thập thông tin vềdoanh thu của tất cảcác doanh - Phạm vi điều tra
nghiệp tưnhân trong nước trên địa bàn TP. Hà Nội
•Tổng sốđơn vịtổng thểđược kí hiệu là N
•Tham số: là các giá trịđược tính toán nhằm phản ánh đặc trưng của TT Ví dụ: - Tổng thểsv của NEU 2 (, )
- Tổng thểcác doanh nghiệp tưnhân trong nước trên địa bàn TP. Hà Nội 12 13 12 13
Khái niệm cơbản: 2. Mẫu (1)
Khái niệm cơbản: Mẫu (2)
•Mẫulà một tập hợp con được rút ra từtổng thể
Điều tra chọn mẫulà tiến hành thu thập thông tin
của các đơn vịtrong mẫu
•Tổng sốđơn vịcủa mẫuđược kí hiệu là n
- Thu thập thông tin vềdoanh thu của 100 doanh nghiệp Ví dụ:
- Thu thập thông tin vềthu nhập của 1000 hộ
- Mẫu 100 sv từtổng thể20000 sv chính quy của NEU
- Mẫu 100 doanh nghiệp tưnhân trong nước trên địa bàn
•Thống kê: là các giá trịđược tính toán nhằm phản TP. Hà Nội ánh đặc trưng của mẫu 2 (x, s ) 14 15 14 15 ọ ẫ Tham sốvà thống kê
Lý do tiến hành điều tra ch n m u
•Tổng điều tra cung cấp bức tranh đầyđủ về
•Một cuộc khảo sát gầnđây trên mẫu gồm 450 sinh
tổng thểnhưng nhìn chung không thểthực
viên NEU cho biết, chi tiêu bình quân một tháng của hiệnđược do
sinh viên là 5,25 triệuđồng.
–Tổng điều tra tốn rất nhiều thời gian và kinh phí
•Thu nhập trung bình hàng tháng của toàn bộsinh viên
NEU đang đi làm thêm là 4,05 triệuđồng.
–Mẫu với quy mô nhỏhơn so với tổng thểcho
phép thu thậpđược nhiều thông tin chi tiết hơn Tham số? Thống kê mẫu?
–Mẫuđược rút ra từtổng thểkhông phản ánh
được bức tranh đầyđủ vềtổng thể. Tuy nhiên với
mẫuđại diệnvà một cỡmẫuđủ lớnsẽcho bức
tranh rõ ràng vềtổng thể, đủ phục vụcho mục đích ra quyếtđịnh 17 16 17 3 Lý do tiến hành ĐTCM Mẫuđảm bảođại diện 19 18 18 19 Từtổng thểđến mẫu Mẫuđủ lớn Họcởbài 5 TỔNG THỂ Dàn chọn mẫu
(danh sách tất cả các đơn vị
thuộc đối tượng nghiên cứu) MẪU 21 20 20 21
Khái niệm cơbản: 3. Biến và dữliệu
Mởrộng khái niệm vềbiến
•Biến: là đặcđiểm củađơn vịtổng thểhoặc mẫu
•Trong thống kê, biến có thểlà tiêu thức hoặc chỉtiêu thống kê
được chọn ra để nghiên cứu.
Tiêu thức thống kê: có định nghĩa giống nhưbiếnở trên và VD:
hàm ý giá trịđơn lẻcủađơn vịTT hoặc mẫu. • Chiều cao
-Ví dụ: Chiều cao của sinh viên • Nghềnghiệp
Chỉtiêu thống kê: hàm ý kết quả đo lường phản ánh quy mô,
•Dữliệu: là giá trịquan sát của biến.
trình độ, tốc độ, cơ cấu hay mối liên hệ của hiện tượng kinh tế VD: - xã hội.
• Chiều cao của 10 người: 1.6, 1.7, 1.55, 1.59, 1.5, 1.58, -Ví dụ: 1.64, 1.67, 1.58, 1.55
+ Số sinh viên nữ của trường công nghệlà 3.000
• Nghềnghiệp của 5 người: giáo viên, bác sĩ, nhà kinh
+ Thu nhập bình quân hộgia đình năm 2024 là 10tr đồng/tháng. doanh, … 22 23 22 23 4 Thang đo cho dữliệu Dữliệuđịnh tính
•Dữliệuđịnh tính: không đo lường được bằng các con sốmà bằng các biểu hiện Dữliệu
•Tình trạng hôn nhân: độc thân, có gia đình, ly hôn, góa
•Kết quảlàm việc của mỗi cá nhân: kém, trung bình, tốt, rất tốt.
•Thang đo cho dữliệuđịnh tính: Định tính Định lượng
–Thang đođịnh danh (Nominal data): chỉđơn giản là các tên gọi hay biểu hiện
+ Tình trạng hôn nhân: 1. độc thân; 2. có gia đình; 3. ly hôn; 4. góa
–Thang đo thứbậc (Ordinal data): là thang đođịnh danh nhưng giá trị
biểu hiện thứbậc hơn kém Định danh Thứbậc Rời rạcLiên tục
+ Kết quảlàm việc của mỗi cá nhân: kém, trung bình, tốt, rất tốt.
+ Ý kiến của khách hàng: rất không đồng ý, không đồng ý, không
đồng ý cũng không phảnđối, đồng ý, rấtđồng ý. 24 25 24 25 Dữ liệu định lượng
Mởrộng vềdữliệuđịnh lượng
•Dữliệuđịnh lượng: đo lường trực tiếp bằng con số
•Dữliệuđịnh lượng được chia làm 2 loại: rời rạc và - Nhiệtđộ liên tục
- Sốthành viên trong gia đình
–Dữliệu (biến) rời rạc: sốlượng giá trịlà hữu hạn và
- Thu nhập của các thành viên trong hộ
thường chỉnhận giá trịnguyên
•Thang đo cho dữliệuđịnh lượng. Ví dụ:
–Thang đo khoảng: là thang đo thứbậc nhưng có khoảng cách đều nhau
và không có điểm gốc 0 tuyệtđối
•Sốthành viên trong gia đình : 1, 2, 4, 7, 2
•Sốnhà (căn hộ) thuộc sởhữu của hộ Ví dụ:
–Dữliệu (biến) liên tục: sốlượng giá trịthường vô hạn và
•Nhiệtđộ: thành phố(TP) A là 40 oC; của TP B là 20oC
nhận bất kỳgiá trịnào (cảsốnguyên và sốthập phân)
–Thang đo tỷlệ: là thang đo khoảng nhưng có điểm gốc 0 tuyệtđối Ví dụ:
Ví dụ: Sốthành viên trong gia đình: 1, 2, 4, 7, 2
•Thu nhập của các thành viên trong hộ
•Doanh thu của các hoạtđộng sản xuất kinh doanh của hộtrong vòng 12 tháng qua 26 27 26 27 Các loại dữliệu Các loại dữliệu
•Dữliệu chéo: thu thập thông tin tại cùng một thời
•Dữliệu mảng (panel data): thu thập thông tin của
điểm của nhiềuđơn vị(quan sát)
nhiềuđơn vịqua nhiều mốc thời gian khác nhau
–Ví dụ: Thu nhập và chi tiêu của 1000 hộgia đình trong năm 2012.
–Ví dụ: Sản lượng của 101 ngành công nghiệp năm 2007 và 2012
Phương pháp phân tích cho dữliệu chéo
Phương pháp phân tích dữliệu mảng (Không đề cập
•Dữliệu theo thời gian: thu thập thông tin của một
trong khoá học này)
đơn vịqua nhiều mốc thời gian khác nhau. –
Ví dụ: Giá đóng cửa hàng ngày của vàng trong vòng 30 năm
Phương pháp phân tích dữliệu theo thời gian 28 29 28 29 5 Nguồn dữliệu
Nguồn dữ liệu thứ cấp •Nguồn Internet
•Dựa vào phương pháp thu thập thông tin, dữ liệu
•Cửa sổtìm kiếm google các thông tin và nghiên cứu vềthị được phân thành:
trường và tiềm năng thịtrường các sản phẩm phí thiên nhiên
trên phạm vi toàn quốc và tại khu vực miền Trung
–Dữ liệu sơ cấp: do các cơ quan/tổ chức tự tiến hành thu
•Danh sách các doanh nghiệp thuộc tậpđoàn PVN
thập phục vụ cho yêu cầu nghiên cứu riêng của họ
•Thống kê chính thức từcác cơquan chính phủ
VD: bạn cần biết hành vi của khách hàng của
•Tổng cục thống kê (GSO) cung cấp thông tin vềchỉsốgiá
Techcombank, bạn tự thu thập thông tin
tiêu dùng (CPI) rất quan trọng cho việc loại bỏlạm phát để
ước lượng tiêu dùng thực tếcủa các hộgia đình – (www.gso.gov.vn)
Dữ liệu thứ cấp: được thu thập bởi các cơ quan/tổ
chức khác, phục vụ cho yêu cầu nghiên cứu khác
•Dữliệuđiều tra của GSO và các cơquan khác (VHLSS)
•Dữliệu công bốcủa PVN (www.pvgas.com.vn)
VD: Sử dụng bộ số liệu điều tra mức sống (VHLSS) để
•Dữliệu nội bộ: dữliệu thu thập bởi các đơn vịkhác thuộc
đánh giá tình trạng nghèo đói và cơ sở hạ tầng của các
PVN và được sửdụng chung trong các đơn vị địa phương.
•Dữliệu từViện Năng lượng 30 31 30 31 Tình huống thảo luận 1 Làm quen với SPSS
•Phân biệt dữliệu sau đây thuộc loại gì và sửdụng thang đo nào?
•Lưu file dữ liệu ‘assignment 1 data set.xls’ vào
i. Tổng sốkm mà ô tô/xe máy của bạnđãđi.
SPSS và làm quen với phần mềm này
ii.Mức lương khởiđiểm.
iii.Tháng mà nhân viên của một tậpđoàn lựa chọnđể nghỉ phép.
iv.Nghềnghiệp của sv sau khi ra trường.
v. Xếp hạng giảng viên. 32 33 32 33 6