TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
KHOA TOÁN KINH TẾ
Đồng chủ biên: TS. Nguyễn Mạnh Thế, TS. Phạm Ngọc Hưng,
ThS. Bùi Dương Hải
Đồng tác giả: Lương Văn Long, Mai Cẩm Tú, Nguyễn Thị Thùy Trang,
Nguyễn Hồng Nhật, Nguyễn Hải Dương, Đức Hoàng
HƯỚNG DẪN HỌC
C SUT VÀ THỐNG
ỨNG DỤNG TRONG KINH TẾ
NHÀ XUT BẢN ĐẠI HỌC KINH TẾ QUỐC DÂN
2023
Mục lục
MỞ ĐẦU 1
Chương 1 THỐNG T 3
1.1 Khái niệm bản . . . . . . . . . . . . . . . . . . . . . . 4
1.2 tả dữ liệu qua bảng biểu . . . . . . . . . . . . . . . . 12
1.3 Thống tả bằng số . . . . . . . . . . . . . . . . . . . 21
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 45
Chương 2 BIẾN CỐ VÀ C SUT 51
2.1 Phép thử, biến cố và xác suất của biến cố . . . . . . . . . . 52
2.2 Định nghĩa và nguyên xác suất . . . . . . . . . . . . . . 57
2.3 Liên hệ giữa các biến cố . . . . . . . . . . . . . . . . . . 65
2.4 Các công thức xác suất . . . . . . . . . . . . . . . . . . . 74
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 90
i
ii MỤC LỤC
Chương 3 BIẾN NGU NHIÊN RỜI RẠC VÀ PHÂN PHỐI
C SUT 95
3.1 Khái niệm và phân loại biến ngẫu nhiên . . . . . . . . . . 96
3.2 Phân phối xác suất của biến ngẫu nhiên . . . . . . . . . . 98
3.3 Tham số đặc trưng của biến ngẫu nhiên . . . . . . . . . . 101
3.4 Phân phối Không-một . . . . . . . . . . . . . . . . . . . . 106
3.5 Phân phối Nhị thức . . . . . . . . . . . . . . . . . . . . . 107
3.6 Phân phối Poisson . . . . . . . . . . . . . . . . . . . . . . 108
3.7 Biến ngẫu nhiên hai chiều rời rạc . . . . . . . . . . . . . . 110
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 123
Chương 4 BIẾN NGU NHIÊN LIÊN TỤC VÀ PHÂN PHỐI
C SUT 130
4.1 Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . 131
4.2 Hàm phân phối xác suất . . . . . . . . . . . . . . . . . . . 131
4.3 Hàm mật độ xác suất . . . . . . . . . . . . . . . . . . . . 133
4.4 Các tham số đặc trưng . . . . . . . . . . . . . . . . . . . 138
4.5 Phân phối Đều . . . . . . . . . . . . . . . . . . . . . . . . 143
4.6 Phân phối - 𝐸 (𝜇) . . . . . . . . . . . . . . . . . . . . 146
4.7 Phân phối Chuẩn . . . . . . . . . . . . . . . . . . . . . . 149
4.8 Một số phân phối liên tục khác . . . . . . . . . . . . . . . 164
4.9 Ứng dụng Microsoft Excel . . . . . . . . . . . . . . . . . 170
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . .
173
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . .
178
MỤC LỤC iii
Chương 5 MẪU NGU NHIÊN VÀ THỐNG MẪU
188
5.1 Tổng thể nghiên cứu . . . . . . . . . . . . . . . . . . . . . 189
5.2 Mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . 195
5.3 Các thống đặc trưng mẫu . . . . . . . . . . . . . . . . 199
5.4 Phân phối xác suất của một số thống kê . . . . . . . . . . 204
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
215
Chương 6
ƯỚC LƯỢNG THAM SỐ
219
6.1 Khái niệm ước lượng tham số của tổng thể . . . . . . . . . 220
6.2 Ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . 221
6.3 Ước lượng bằng khoảng tin cậy . . . . . . . . . . . . . . . 231
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 247
250
Chương 7 KIỂM ĐỊNH THAM SỐ
254
7.1 Khái niệm bản . . . . . . . . . . . . . . . . . . . . . . 255
7.2 Kiểm định tham số một tổng thể . . . . . . . . . . . . . . 261
7.3 Kiểm định tham số hai tổng thể . . . . . . . . . . . . . . . 271
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 288
289
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . .
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . .
217
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . .
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . .
iv MỤC LỤC
8.3 Kiểm định tính độc lập . . . . . . . . . . . . . . . . . . . 298
303
Chương 9 PHÂN TÍCH PHƯƠNG SAI
310
9.1 Phân tích sự biến động . . . . . . . . . . . . . . . . . . . 311
9.2 Phân tích phương sai một nhân tố . . . . . . . . . . . . . . 313
9.3 Phân tích phương sai hai nhân tố không tương tác . . . . . 318
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 326
Phụ lục: Các bảng số . . . . . . . . . . . . . . . . . . . . . . . 328
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . 348
Thuật ngữ . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
Chương 8 KIỂM ĐỊNH PHI THAM SỐ
292
8.1 Kiểm định v phân phối thuyết . . . . . . . . . . . . . . 292
8.2 Kiểm định tính phân phối chuẩn . . . . . . . . . . . . . . 295
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . .
304
307
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . .
MỤC LỤC v
Các hiệu
hiệu Tên gọi, ý nghĩa
¯𝑥,
¯
𝑋 Trung bình mẫu cụ thể, mẫu ngẫu nhiên
𝜇 Trung bình tổng thể, vọng biến ngẫu nhiên
𝑚
0
, 𝑀
0
Mốt
𝑚
𝑒
, 𝑀
𝑒
Trung vị
𝑄
1
, 𝑄
2
, 𝑄
3
T phân vị thứ nhất, thứ hai, thứ ba
𝑠
2
, 𝑆
2
Phương sai mẫu cụ thể, mẫu ngẫu nhiên
𝜎
2
Phương sai tổng thể, phương sai biến ngẫu nhiên
𝑠, 𝑆 Độ lệch chuẩn mẫu cụ thể, mẫu ngẫu nhiên
𝜎 Độ lệch chuẩn tổng thể
𝐶𝑉 Hệ số biến thiên
ˆ𝑝 Tần suất mẫu
𝑝 Tần suất tổng thể, xác suất
𝐼𝑄𝑅 Khoảng tứ phân vị
𝑆𝑘 Hệ số bất đối xứng
𝐾; 𝐾
𝑒𝑥
Hệ số nhọn; hệ số nhọn hiệu chỉnh
𝐶𝑜𝑣 Hiệp phương sai
𝑟, 𝑅 Hệ số tương quan mẫu cụ thể, mẫu ngẫu nhiên
𝜌 Hệ số tương quan tổng thể
Rỗng, biến cố không thể
Ω Không gian mẫu, biến cố chắc chắn
𝑃 Độ đo xác suất
𝑃(𝐴) Xác suất của biến cố 𝐴
vi MỤC LỤC
hiệu Tên gọi, ý nghĩa
𝐵 𝐴 Biến cố kéo theo
𝐴 = 𝐵 Biến cố tương đương
𝐴 Biến cố đối lập
𝐴 𝐵;
Ñ
𝑛
𝑖=1
𝐴
𝑖
Tích các biến cố
𝐴 𝐵;
Ð
𝑛
𝑖=1
𝐴
𝑖
Tổng các biến cố
(𝐴 | 𝐵) Biến cố điều kiện
𝑃(𝐴 | 𝐵) Xác suất điều kiện
𝐹 (𝑥) Hàm phân phối xác suất
𝑃(𝑥) Hàm khối lượng xác suất
𝑓 (𝑥) Hàm mật độ xác suất
𝐹 (𝑥, 𝑦) Hàm phân phối xác suất đồng thời
𝑃(𝑥, 𝑦) Hàm khối lượng xác suất đồng thời
𝑃(𝑥 | 𝑦) Hàm khối lượng xác suất điều kiện
𝐸 (𝑋) vọng; trung bình
𝐸 (𝑋 | 𝑦) vọng điều kiện
𝑉 (𝑋) Phương sai của biến ngẫu nhiên
𝑉 (𝑋 | 𝑦) Phương sai điều kiện
𝜎
𝑋
; 𝜎(𝑋) Độ lệch chuẩn của biến ngẫu nhiên
𝑞
𝛽
Giá tr phân vị
𝑥
𝛼
Giá tr tới hạn
𝐵(1, 𝑝) Phân phối Bernoulli
𝐵(𝑛, 𝑝) Phân phối Nhị thức
𝑃(𝜆) Phân phối Poisson
𝑈(𝑎, 𝑏) Phân phối Đều
MỤC LỤC vii
hiệu Tên gọi, ý nghĩa
𝑁 (𝜇, 𝜎
2
) Phân phối Chuẩn
𝜒
2
(𝑛) Phân phối Khi-bình phương
𝑇 (𝑛) Phân phối Student
𝐹 (𝑚, 𝑛) Phân phối Fisher
MỞ ĐẦU
Giới thiệu
Giáo trình một học liệu rất quan trọng cho một môn học hay một học
phần. Học phần Lý thuyết xác suất và Thống kê toán đã Giáo trình do
PGS. TS. Nguyễn Cao Văn làm chủ biên năm 2012, tuy nhiên để cập nhật
một số nội dung cho phù hợp hơn với thực tế giảng dạy học phần Lý thuyết
xác suất Thống toán hiện nay tại Trường Đại học Kinh tế quốc dân,
tập thể thầy Bộ môn Toán Kinh tế - Khoa Toán Kinh tế đã biên soạn
cuốn sách Hướng dẫn học "Xác suất thống kê ứng dụng trong kinh tế"
nhằm đáp ứng tốt hơn việc giảng dạy của thầy việc học tập của sinh
viên.
Trong quá tr ình biên soạn, không tránh được những sai sót, rất mong quý
độc giả những góp ý để nhóm tác giả chỉnh sửa cuốn sách được đầy đủ
và chính xác hơn.
Các ý kiến góp ý xin vui lòng liên hệ nhóm tác giả tại Khoa Toán kinh
tế, Trường Đại học Kinh tế Quốc dân.
website: www.mfe.edu.vn.
Email: khoatoankt@neu.edu.vn; hungpn@neu.edu.vn, haibd@neu.edu.vn
1
2 MỤC LỤC
Cấu trúc của sách
Sách gồm 9 chương, bắt đầu từ định nghĩa bản nhất của Thống đến
các biến ngẫu nhiên cuối cùng kiểm định và phân tích phương sai.
Nội dung của sách gồm 9 chương
Chương 1: Thống tả
Chương 2: Biến cố Xác suất
Chương 3: Biến ngẫu nhiên rời rạc phân phối xác suất
Chương 4: Biến ngẫu nhiên liên tục phân phối xác suất
Chương 5: Mẫu ngẫu nhiên thống kê mẫu
Chương 6: Ước lượng tham số
Chương 7: Kiểm định tham số
Chương 8: Kiểm định phi tham số
Chương 9: Phân tích phương sai
Các tác giả
Bùi Dương Hải, Nguyễn Hải Dương: Chương 1
Phạm Ngọc Hưng, Mai Cẩm Tú: Chương 2
Phạm Ngọc Hưng, Nguyễn Hồng Nhật: Chương 3
Phạm Ngọc Hưng, Lương Văn Long: Chương 4
Nguyễn Mạnh Thế, Đức Hoàng: Chương 5, 6
Bùi Dương Hải, Nguyễn Thị Thùy Trang: Chương 7, 8
Bùi Dương Hải: Chương 9
Chương 1
THỐNG T
Mục tiêu của chương
1. Nêu một số khái niệm bản v thống kê, tổng thể, mẫu, dữ liệu,
phân loại dữ liệu;
2. tả dữ liệu bằng bảng biểu biểu đồ: bảng tần số, tần suất,
biểu đồ tròn, biểu đồ cột, phân phối giá trị, rải điểm;
3. Biểu diễn số liệu qua các đại lượng thống kê bản: nhóm trung
tâm, nhóm định vị, nhóm đo độ phân tán, nhóm biểu diễn dạng
phân phối;
4. Biểu diễn mối quan hệ giữa hai biến qua hiệp phương sai, hệ số
tương quan.
3
4 CHƯƠNG 1 THỐNG T
1.1 Khái niệm bản
Thống kê phân loại
Xác suất bộ môn toán học tìm hiểu các quy luật tất nhiên chứa đựng trong
các hiện tượng tính ngẫu nhiên; Thống bộ môn nghiên cứu các quy
luật của các hiện tượng ngẫu nhiên trên sở thông tin từ dữ liệu. Thống
bao gồm việc thu thập, xử lý, phân tích các dữ liệu để rút ra kết luận v
vấn đề cần nghiên cứu.
Thống thường được phân chia thành Thống tả Thống
suy diễn.
Thống tả gồm việc thể hiện dữ liệu dưới tổng hợp, thuận tiện
cho phân tích, sử dụng, như bảng biểu, đồ thị;
Thống kê suy diễn sử dụng các dữ liệu để tìm hiểu tính quy luật của
hiện tượng quy lớn hơn, phân tích, dự báo hỗ trợ ra quyết định.
Tất nhiên ngẫu nhiên
Tất nhiên (certain) hay tất định, những hiện tượng, sự kiện ta
biết chắc chắn kết cục sẽ xảy ra, các kết quả xác định, chính xác.
Ngẫu nhiên (uncertain, random) hay bất định, những hiện tượng,
sự kiện ta chưa biết chắc chắn kết cục nào sẽ xảy ra, các kết quả
chưa xác định, không chính xác.
Tổng thể và Mẫu
Tổng thể (Population) tập hợp tất cả các phần tử chứa đựng dấu hiệu
nghiên cứu.
Tổng số lượng phần tử trong tổng thể gọi kích thước tổng thể, hiệu
𝑁, thể hữu hạn hoặc vô hạn. Khi tổng thể gồm hữu hạn các phần
MỤC 1.1 KHÁI NIỆM BẢN 5
tử, thể liệt được, thì dữ liệu tổng thể thể được viết
(𝑥
1
, 𝑥
2
, ..., 𝑥
𝑁
)
Nếu dữ liệu tổng thể các con số, thì từ đó thể tính được các đại
lượng, và các đại lượng đó gọi tham số (parameter) hay tham số tổng thể.
Mẫu (sample) một bộ phận của tổng thể rút ra để nghiên cứu v tổng
thể. Tổng số lượng phần tử trong mẫu gọi kích thước mẫu, hiệu 𝑛.
Kích thước mẫu hữu hạn. Dữ liệu mẫu được hiệu
(𝑥
1
, 𝑥
2
, ..., 𝑥
𝑛
)
Nếu dữ liệu mẫu các con số, các đại lượng tính toán từ số liệu mẫu
gọi giá trị thống (statistic).
Mẫu rút ra từ tổng thể để nghiên cứu về tổng thể, cần đảm bảo tính ngẫu
nhiên tính đại diện. nhiều phương pháp lấy mẫu, một số phương pháp
thường được đề cập là:
Lấy mẫu ngẫu nhiên giản đơn
Lấy mẫu ngẫu nhiên hệ thống
Lấy mẫu phân tổ
Lấy mẫu nhiều cấp.
Dữ liệu
Phân loại theo nguồn gốc dữ liệu
Theo nguồn gốc, dữ liệu được phân thành hai loại: dữ liệu cấp và dữ liệu
thứ cấp.
Dữ liệu cấp: dữ liệu tự người nghiên cứu thu thập sử dụng
đầu tiên;
6 CHƯƠNG 1 THỐNG T
Dữ liệu thứ cấp: dữ liệu do nhân, tổ chức khác thu thập, công
bố. Người nghiên cứu sử dụng dữ liệu không phải người trực tiếp
thu thập.
Phân loại theo đặc tính của dữ liệu
Dữ liệu chéo: các đối tượng khác nhau được thu thập dữ liệu trong
cùng thời gian;
dụ: GDP bình quân đầu người các nước năm 2020, điểm tổng kết
của các sinh viên khóa 58 của Trường Đại học Kinh tế Quốc dân.
Dữ liệu chuỗi thời gian: một đối tượng được thu thập dữ liệu theo thời
gian; thời gian thể thời hoặc thời điểm;
dụ: GDP Việt Nam từ năm 1990 đến 2020, lợi nhuận sau thuế
hàng quý của một doanh nghiệp từ khi thành lập.
Dữ liệu hỗn hợp: nhiều đối tượng được thu thập dữ liệu theo thời
gian. Nếu các đối tượng giữ nguyên dữ liệu của tất cả các
thời điểm (thời kì), thì dữ liệu hỗn hợp cân bằng (dữ liệu mảng).
dụ: GDP các nước ASEAN từ năm 1995 đến 2020, giá cổ phiếu
của 5 ngân hàng trong 1 tháng gần nhất.
Cấu trúc dữ liệu truyền thống
Dữ liệu truyền thống gồm các biến (variable), các quan sát (observation),
và các giá trị (value), thể thể hiện dưới dạng một bảng hai chiều.
dụ 1.1. Dữ liệu về một số thí sinh trong một cuộc thi, gồm các biến
số thí sinh, Họ tên, Giới tính, Tuổi, Thời gian hoàn thành bài thi (phút),
Điểm số, Xếp loại. Mỗi thí sinh một quan sát.
MỤC 1.1 KHÁI NIỆM BẢN 7
TT số Họ tên Giới Tuổi Thời gian Điểm Xếp loại
1 1152 N.V.An Nam 20 40,2 68 B
2 1153 T.V.Bình Nam 21 45,0 52 C
3 1156 L.T.Chi N 22 38,3 82 A
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
dụ 1.2. Bảng dữ liệu một số biến kinh tế của các nước ASEAN
năm 2019 (nguồn: World Bank) và xếp hạng tín dụng của các tổ chức (ngày
1/1/2021). Trong đó:
gGDP tỉ lệ tăng trưởng GDP (%)
GDPpc GDP bình quân đầu người (USD, giá hiện hành, làm tròn)
TE chỉ số xếp hạng tín dụng TE (Trading Economics credit rating)
S&P xếp hạng tín dụng theo tổ chức Standard and Poor
Moody’s xếp hạng tín dụng theo tổ chức Moody
Fitch xếp hạng tín dụng theo tổ chức Fitch.
Country gGDP GDPpc TE S&P Moody’s Fitch
Brunei 3.9 31087 . . . .
Cambodia 7.1 1643 30 . B2 .
Indonesia 5.0 4136 60 BBB Baa2 BBB
Laos 4.7 2535 20 . Caa2 CCC
Malaysia 4.3 11414 70 A- A3 BBB+
Myanmar 2.9 1408 . . . .
Philippines 6.0 3485 61 BBB+ Baa2 BBB
Singapore 0.7 65233 98 AAA Aaa AAA
Thailand 2.4 7807 65 BBB+ Baa1 BBB+
Vietnam 7.0 2715 43 BB Ba3 BB
Bảng 1.1 Một số thống của các nước ASEAN
Nhận thấy một số quốc gia không giá trị của biến TE các xếp hạng
tín dụng, giá tr trống được thay bởi một dấu chấm.
8 CHƯƠNG 1 THỐNG T
Phân loại biến
Biến được phân thành hai loại chính biến định tính biến định lượng.
Mỗi loại lại phân thành các loại nhỏ hơn.
Biến định tính hay còn gọi biến thuộc tính, biến giá tr của
không phải đại lượng đo lường, không đơn vị. Biến định tính được chia
thành biến định danh và biến thứ bậc.
Biến định danh: các giá trị không thể so sánh được với nhau.
dụ: tên, địa danh, chuyên ngành học, nghề nghiệp.
Biến thứ bậc: các giá tr thể sắp xếp thứ tự, so sánh được nhưng
không tính toán, do khoảng cách giữa các giá tr không như nhau.
dụ: Xếp loại, phân hạng, cỡ sản phẩm.
Biến định lượng hay còn gọi biến đo được biến các giá trị
đại lượng đo lường, so sánh, tính toán được, và đơn vị. Biến định lượng
được phân loại theo hai cách.
Cách 1. Phân loại biến định lượng theo kiểu giá tr của biến.
Biến rời rạc: các giá tr hữu hạn hoặc vô hạn đếm được, thể liệt
được.
dụ: số nhân viên, số năm đi học.
Biến liên tục: các giá trị lấp đầy một hoặc một số khoảng, không đếm
được, không liệt được.
dụ: thời gian, độ dài, khối lượng, nhiệt độ.
Cách 2. Phân loại biến định lượng theo mức độ tính toán.
Biến khoảng: thể cộng trừ nhưng không nhân chia, giá trị bằng 0
tính quy ước, không phải đo lường bằng 0.
dụ: nhiệt độ đo bằng độ C, năm sinh.
MỤC 1.1 KHÁI NIỆM BẢN 9
Biến tỉ lệ: thể cộng trừ, nhân chia, giá tr bằng 0 đo lường thực
sự bằng 0.
dụ: tiền lương, khối lượng, tuổi.
Thông thường, phân loại biến định lượng theo cách 1. Như vậy, nếu
phân loại biến thì hai loại chính biến định tính và biến định lượng; nếu
phân loại chi tiết thì bốn loại là: định danh, thứ bậc, rời rạc, liên tục.
Trong nhiều trường hợp, việc phân loại biến thành rời rạc hay liên tục
cũng không quan trọng. Nhiều biến liên tục được rời rạc hóa bởi cách tính
xấp xỉ, nhiều biến rời rạc q nhiều giá trị cũng thể coi như liên tục.
Nếu không phân chia rời rạc và liên tục, thì biến ba loại định danh,
thứ bậc, và định lượng.
Biến định danh thứ bậc thể được hóa bằng các con số, nhưng
không được thực hiện tính toán với các con số y. Do tính chất mức độ
đo lường của các loại biến nên các công việc thực hiện cũng khác nhau.
Biến định danh: Liệt kê, gộp thành các nhóm
Biến thứ bậc: Liệt kê, gộp nhóm, xếp thứ tự, so sánh
Biến định lượng: Liệt kê, gộp nhóm, xếp thứ tự, so sánh, tính toán
Biến định tính Biến định lượng
Qualitative, categorical Quantitative, scale
Định danh Thứ bậc Rời rạc Liên tục
Nominal Ordinal Discrete Continuous
Liệt kê, nhóm Liệt kê, nhóm, Liệt kê, nhóm,
so sánh, so sánh, xếp thứ tự,
xếp thứ tự tính toán +, , ×, ÷, ···
thể hóa bằng con số đơn vị, thể dùng để
nhưng không đơn vị phân loại, xếp thứ bậc, xếp hạng
Bảng 1.2 Phân loại biến và tính chất
10 CHƯƠNG 1 THỐNG T
Bài tập
Bài 1.1. Cho biết các dữ liệu sau đây tổng thể hay mẫu, tương ứng với
mục đích nghiên cứu:
a) Nghiên cứu v tuổi của sinh viên K62 của Trường Đại học Kinh tế
Quốc dân qua hồ toàn bộ sinh viên tại phòng Quản đào tạo.
b) Nghiên cứu v sự hài lòng của khách hàng tại một ngân hàng qua dữ
liệu phỏng vấn ngẫu nhiên 300 khách hàng của ngân hàng đó.
c) Nghiên cứu v thị trường chứng khoán qua dữ liệu giá đóng cửa của
các chứng khoán vào ngày 31/12/2020.
d) Nghiên cứu v tổng khối lượng cổ phiếu giao dịch chính thức trong
năm 2020 của các ngân hàng niêm yết trên sàn chứng khoán qua số
liệu của Ủy ban Chứng khoán.
e) Nghiên cứu v kết quả học tập của sinh viên một trường đại học thông
qua số liệu của các sinh viên năm cuối.
Bài 1.2. Cho biết dữ liệu cho nghiên cứu sau đây thuộc loại cấp hay thứ
cấp, dữ liệu chéo hay dữ liệu chuỗi thời gian:
a) Một sinh viên nghiên cứu khoa học thực hiện khảo sát bằng bảng hỏi
với 300 sinh viên khác về thời gian tự học.
b) Một sinh viên nghiên cứu các biến tác động đến tăng trưởng
GDP của Việt Nam giai đoạn 1990 - 2020.
c) Trưởng phòng đếm số nhân viên đi muộn hằng ngày tại văn phòng
mình quản .
d) Nghiên cứu viên phân tích so sánh lợi thế cạnh tranh các tỉnh thành
Việt Nam năm 2020 qua chỉ số cạnh tranh cấp tỉnh PCI do VCCI tính
toán công bố.
e) Giảng viên đánh giá so sánh các sinh viên mình giảng dạy qua điểm
một bài kiểm tra giữa kì.
Bài 1.3. Cho biết các biến trong Ví dụ 1.1 và dụ 1.2 trang 6 thuộc loại
nào theo cách phân loại biến trong Bảng 1.2.
MỤC 1.1 KHÁI NIỆM BẢN 11
Bài 1.4. Cho biết các biến sau định tính hay định lượng, nếu định tính
thì định danh hay thứ bậc, nếu định lượng thì rời rạc hay liên tục:
a) Điểm thi cuối môn Lý thuyết xác suất và Thống toán
b) Thời gian để hoàn thành bài thi một học phần
c) Loại tốt nghiệp của cử nhân Trường Đại học Kinh tế Quốc dân
d) Cỡ giày của các đôi giày trong kho
e) Xếp hạng cạnh tranh cấp tỉnh năm 2020
f) Xếp hạng cạnh tranh của các tỉnh Việt Nam năm 2020
g) Chỉ số cạnh tranh của các tỉnh Việt Nam năm 2020
h) Hình thức sở hữu của các doanh nghiệp trên địa bàn Nội
i) Nhiệt độ trung bình của các ngày trong năm tại Nội
Bài 1.5. Cho biết với số liệu chứa các thông tin sau, thể thực hiện các
công việc trong số sau: nhóm, gộp, liệt kê, so sánh, xếp thứ tự, tính toán
a) Ngành học điểm kiểm tra của các sinh viên trong một lớp tín chỉ.
b) Giới tính trình độ (cao đẳng, đại học, cao học, tiến sĩ) của các nhân
viên tại một sở đào tạo.
c) Thu nhập và vị trí công việc của người lao động tại một công ty.
d) Năm sinh và tuổi của các thí sinh trong một cuộc thi.
e) V trí v đích và thời gian hoàn thành chặng đua của các vận động
viên trong một cuộc thi chạy.
f) Hình thức sở hữu và vốn điều lệ của các công ty thành lập mới trong
năm 2020.

Preview text:

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN KHOA TOÁN KINH TẾ
Đồng chủ biên: TS. Nguyễn Mạnh Thế, TS. Phạm Ngọc Hưng, ThS. Bùi Dương Hải
Đồng tác giả: Lương Văn Long, Mai Cẩm Tú, Nguyễn Thị Thùy Trang,
Nguyễn Hồng Nhật, Nguyễn Hải Dương, Lê Đức Hoàng HƯỚNG DẪN HỌC
XÁC SUẤT VÀ THỐNG KÊ
ỨNG DỤNG TRONG KINH TẾ
NHÀ XUẤT BẢN ĐẠI HỌC KINH TẾ QUỐC DÂN 2023 Mục lục MỞ ĐẦU 1 Chương 1 THỐNG KÊ MÔ TẢ 3 1.1
Khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . . . 4 1.2
Mô tả dữ liệu qua bảng biểu
. . . . . . . . . . . . . . . . 12 1.3
Thống kê mô tả bằng số . . . . . . . . . . . . . . . . . . . 21
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 45 Chương 2
BIẾN CỐ VÀ XÁC SUẤT 51 2.1
Phép thử, biến cố và xác suất của biến cố . . . . . . . . . . 52 2.2
Định nghĩa và nguyên lí xác suất . . . . . . . . . . . . . . 57 2.3
Liên hệ giữa các biến cố
. . . . . . . . . . . . . . . . . . 65 2.4
Các công thức xác suất . . . . . . . . . . . . . . . . . . . 74
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 90 i ii MỤC LỤC Chương 3
BIẾN NGẪU NHIÊN RỜI RẠC VÀ PHÂN PHỐI XÁC SUẤT 95 3.1
Khái niệm và phân loại biến ngẫu nhiên . . . . . . . . . . 96 3.2
Phân phối xác suất của biến ngẫu nhiên . . . . . . . . . . 98 3.3
Tham số đặc trưng của biến ngẫu nhiên . . . . . . . . . . 101 3.4
Phân phối Không-một . . . . . . . . . . . . . . . . . . . . 106 3.5
Phân phối Nhị thức . . . . . . . . . . . . . . . . . . . . . 107 3.6
Phân phối Poisson . . . . . . . . . . . . . . . . . . . . . . 108 3.7
Biến ngẫu nhiên hai chiều rời rạc . . . . . . . . . . . . . . 110
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 123 Chương 4
BIẾN NGẪU NHIÊN LIÊN TỤC VÀ PHÂN PHỐI XÁC SUẤT 130 4.1
Biến ngẫu nhiên liên tục
. . . . . . . . . . . . . . . . . . 131 4.2
Hàm phân phối xác suất . . . . . . . . . . . . . . . . . . . 131 4.3
Hàm mật độ xác suất . . . . . . . . . . . . . . . . . . . . 133 4.4 Các tham số đặc trưng
. . . . . . . . . . . . . . . . . . . 138 4.5
Phân phối Đều . . . . . . . . . . . . . . . . . . . . . . . . 143 4.6
Phân phối Mũ - 𝐸 (𝜇) . . . . . . . . . . . . . . . . . . . . 146 4.7
Phân phối Chuẩn . . . . . . . . . . . . . . . . . . . . . . 149 4.8
Một số phân phối liên tục khác . . . . . . . . . . . . . . . 164 4.9
Ứng dụng Microsoft Excel . . . . . . . . . . . . . . . . . 170
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 178 MỤC LỤC iii Chương 5
MẪU NGẪU NHIÊN VÀ THỐNG KÊ MẪU 188 5.1
Tổng thể nghiên cứu . . . . . . . . . . . . . . . . . . . . . 189 5.2
Mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . 195 5.3
Các thống kê đặc trưng mẫu
. . . . . . . . . . . . . . . . 199 5.4
Phân phối xác suất của một số thống kê . . . . . . . . . . 204
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 215
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 217
Chương 6 ƯỚC LƯỢNG THAM SỐ 219 6.1
Khái niệm ước lượng tham số của tổng thể . . . . . . . . . 220 6.2
Ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . 221 6.3
Ước lượng bằng khoảng tin cậy . . . . . . . . . . . . . . . 231
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 247
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 250
Chương 7 KIỂM ĐỊNH THAM SỐ 254 7.1
Khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . . . 255 7.2
Kiểm định tham số một tổng thể . . . . . . . . . . . . . . 261 7.3
Kiểm định tham số hai tổng thể . . . . . . . . . . . . . . . 271
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 288
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 289 iv MỤC LỤC
Chương 8 KIỂM ĐỊNH PHI THAM SỐ 292 8.1
Kiểm định về phân phối lí thuyết . . . . . . . . . . . . . . 292 8.2
Kiểm định tính phân phối chuẩn . . . . . . . . . . . . . . 295 8.3
Kiểm định tính độc lập . . . . . . . . . . . . . . . . . . . 298
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
Bài tập tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 304
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 307
Chương 9 PHÂN TÍCH PHƯƠNG SAI 310 9.1
Phân tích sự biến động . . . . . . . . . . . . . . . . . . . 311 9.2
Phân tích phương sai một nhân tố . . . . . . . . . . . . . . 313 9.3
Phân tích phương sai hai nhân tố không tương tác . . . . . 318
Thuật ngữ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
Câu hỏi trắc nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 326
Phụ lục: Các bảng số . . . . . . . . . . . . . . . . . . . . . . . 328
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . 348 MỤC LỤC v Các kí hiệu Kí hiệu Tên gọi, ý nghĩa ¯ 𝑥 , ¯ 𝑋
Trung bình mẫu cụ thể, mẫu ngẫu nhiên 𝜇
Trung bình tổng thể, kì vọng biến ngẫu nhiên 𝑚0, 𝑀0 Mốt 𝑚 , 𝑀 Trung vị 𝑒 𝑒 𝑄 1, 𝑄2, 𝑄3
Tứ phân vị thứ nhất, thứ hai, thứ ba 2 2 𝑠 , 𝑆
Phương sai mẫu cụ thể, mẫu ngẫu nhiên 2 𝜎
Phương sai tổng thể, phương sai biến ngẫu nhiên 𝑠, 𝑆
Độ lệch chuẩn mẫu cụ thể, mẫu ngẫu nhiên 𝜎
Độ lệch chuẩn tổng thể 𝐶𝑉 Hệ số biến thiên ˆ 𝑝 Tần suất mẫu 𝑝
Tần suất tổng thể, xác suất 𝐼 𝑄 𝑅 Khoảng tứ phân vị 𝑆 𝑘 Hệ số bất đối xứng 𝐾 ; 𝐾
Hệ số nhọn; hệ số nhọn hiệu chỉnh 𝑒𝑥 𝐶 𝑜𝑣 Hiệp phương sai 𝑟 , 𝑅
Hệ số tương quan mẫu cụ thể, mẫu ngẫu nhiên 𝜌
Hệ số tương quan tổng thể ∅
Rỗng, biến cố không thể có Ω
Không gian mẫu, biến cố chắc chắn 𝑃 Độ đo xác suất 𝑃 ( 𝐴)
Xác suất của biến cố 𝐴 vi MỤC LỤC Kí hiệu Tên gọi, ý nghĩa 𝐵 ⊂ 𝐴 Biến cố kéo theo 𝐴 = 𝐵 Biến cố tương đương 𝐴 Biến cố đối lập 𝐴 ∩ 𝐵; Ñ𝑛 𝐴 Tích các biến cố 𝑖=1 𝑖 𝐴 ∪ 𝐵; Ð𝑛 𝐴 Tổng các biến cố 𝑖=1 𝑖 ( 𝐴 | 𝐵) Biến cố có điều kiện 𝑃 ( 𝐴 | 𝐵) Xác suất có điều kiện 𝐹 (𝑥) Hàm phân phối xác suất 𝑃 (𝑥)
Hàm khối lượng xác suất 𝑓 (𝑥) Hàm mật độ xác suất 𝐹 (𝑥, 𝑦)
Hàm phân phối xác suất đồng thời 𝑃 (𝑥, 𝑦)
Hàm khối lượng xác suất đồng thời 𝑃 (𝑥 | 𝑦)
Hàm khối lượng xác suất có điều kiện 𝐸 ( 𝑋 ) Kì vọng; trung bình 𝐸 ( 𝑋 | 𝑦) Kì vọng có điều kiện 𝑉 ( 𝑋 )
Phương sai của biến ngẫu nhiên 𝑉 ( 𝑋 | 𝑦)
Phương sai có điều kiện 𝜎 ; 𝜎( 𝑋)
Độ lệch chuẩn của biến ngẫu nhiên 𝑋 𝑞 Giá trị phân vị 𝛽 𝑥 Giá trị tới hạn 𝛼 𝐵 (1, 𝑝) Phân phối Bernoulli 𝐵 (𝑛, 𝑝) Phân phối Nhị thức 𝑃 (𝜆) Phân phối Poisson 𝑈 (𝑎, 𝑏) Phân phối Đều MỤC LỤC vii Kí hiệu Tên gọi, ý nghĩa 2 𝑁 ( 𝜇, 𝜎 ) Phân phối Chuẩn 2 𝜒 (𝑛)
Phân phối Khi-bình phương 𝑇 (𝑛) Phân phối Student 𝐹 (𝑚, 𝑛) Phân phối Fisher MỞ ĐẦU Giới thiệu
Giáo trình là một học liệu rất quan trọng cho một môn học hay một học
phần. Học phần Lý thuyết xác suất và Thống kê toán đã có Giáo trình do
PGS. TS. Nguyễn Cao Văn làm chủ biên năm 2012, tuy nhiên để cập nhật
một số nội dung cho phù hợp hơn với thực tế giảng dạy học phần Lý thuyết
xác suất và Thống kê toán hiện nay tại Trường Đại học Kinh tế quốc dân,
tập thể thầy cô Bộ môn Toán Kinh tế - Khoa Toán Kinh tế đã biên soạn
cuốn sách Hướng dẫn học "Xác suất và thống kê ứng dụng trong kinh tế"
nhằm đáp ứng tốt hơn việc giảng dạy của thầy cô và việc học tập của sinh viên.
Trong quá trình biên soạn, không tránh được những sai sót, rất mong quý
độc giả có những góp ý để nhóm tác giả chỉnh sửa cuốn sách được đầy đủ và chính xác hơn.
Các ý kiến góp ý xin vui lòng liên hệ nhóm tác giả tại Khoa Toán kinh
tế, Trường Đại học Kinh tế Quốc dân. website: www.mfe.edu.vn.
Email: khoatoankt@neu.edu.vn; hungpn@neu.edu.vn, haibd@neu.edu.vn 1 2 MỤC LỤC Cấu trúc của sách
Sách gồm 9 chương, bắt đầu từ định nghĩa cơ bản nhất của Thống kê đến
các biến ngẫu nhiên và cuối cùng là kiểm định và phân tích phương sai.
Nội dung của sách gồm 9 chương
• Chương 1: Thống kê mô tả
• Chương 2: Biến cố và Xác suất
• Chương 3: Biến ngẫu nhiên rời rạc và phân phối xác suất
• Chương 4: Biến ngẫu nhiên liên tục và phân phối xác suất
• Chương 5: Mẫu ngẫu nhiên và thống kê mẫu
• Chương 6: Ước lượng tham số
• Chương 7: Kiểm định tham số
• Chương 8: Kiểm định phi tham số
• Chương 9: Phân tích phương sai Các tác giả
• Bùi Dương Hải, Nguyễn Hải Dương: Chương 1
• Phạm Ngọc Hưng, Mai Cẩm Tú: Chương 2
• Phạm Ngọc Hưng, Nguyễn Hồng Nhật: Chương 3
• Phạm Ngọc Hưng, Lương Văn Long: Chương 4
• Nguyễn Mạnh Thế, Lê Đức Hoàng: Chương 5, 6
• Bùi Dương Hải, Nguyễn Thị Thùy Trang: Chương 7, 8
• Bùi Dương Hải: Chương 9 Chương 1 THỐNG KÊ MÔ TẢ
Mục tiêu của chương
1. Nêu một số khái niệm cơ bản về thống kê, tổng thể, mẫu, dữ liệu, phân loại dữ liệu;
2. Mô tả dữ liệu bằng bảng biểu và biểu đồ: bảng tần số, tần suất,
biểu đồ tròn, biểu đồ cột, phân phối giá trị, rải điểm;
3. Biểu diễn số liệu qua các đại lượng thống kê cơ bản: nhóm trung
tâm, nhóm định vị, nhóm đo độ phân tán, nhóm biểu diễn dạng phân phối;
4. Biểu diễn mối quan hệ giữa hai biến qua hiệp phương sai, hệ số tương quan. 3 4
CHƯƠNG 1 THỐNG KÊ MÔ TẢ
1.1 Khái niệm cơ bản
Thống kê và phân loại
Xác suất là bộ môn toán học tìm hiểu các quy luật tất nhiên chứa đựng trong
các hiện tượng có tính ngẫu nhiên; Thống kê là bộ môn nghiên cứu các quy
luật của các hiện tượng ngẫu nhiên trên cơ sở thông tin từ dữ liệu. Thống
kê bao gồm việc thu thập, xử lý, phân tích các dữ liệu để rút ra kết luận về
vấn đề cần nghiên cứu.
Thống kê thường được phân chia thành Thống kê mô tả và Thống kê suy diễn.
• Thống kê mô tả gồm việc thể hiện dữ liệu dưới tổng hợp, thuận tiện
cho phân tích, sử dụng, như bảng biểu, đồ thị;
• Thống kê suy diễn sử dụng các dữ liệu để tìm hiểu tính quy luật của
hiện tượng ở quy mô lớn hơn, phân tích, dự báo hỗ trợ ra quyết định.
Tất nhiên và ngẫu nhiên
• Tất nhiên (certain) hay tất định, là những hiện tượng, sự kiện mà ta
biết chắc chắn kết cục sẽ xảy ra, các kết quả là xác định, chính xác.
• Ngẫu nhiên (uncertain, random) hay bất định, là những hiện tượng,
sự kiện mà ta chưa biết chắc chắn kết cục nào sẽ xảy ra, các kết quả
là chưa xác định, không chính xác. Tổng thể và Mẫu
Tổng thể (Population) là tập hợp tất cả các phần tử chứa đựng dấu hiệu nghiên cứu.
Tổng số lượng phần tử trong tổng thể gọi là kích thước tổng thể, kí hiệu
là 𝑁, có thể là hữu hạn hoặc vô hạn. Khi tổng thể gồm hữu hạn các phần
MỤC 1.1 KHÁI NIỆM CƠ BẢN 5
tử, có thể liệt kê được, thì dữ liệu tổng thể có thể được viết là (𝑥1, 𝑥2, ..., 𝑥 ) 𝑁
Nếu dữ liệu tổng thể là các con số, thì từ đó có thể tính được các đại
lượng, và các đại lượng đó gọi là tham số (parameter) hay tham số tổng thể.
Mẫu (sample) là một bộ phận của tổng thể rút ra để nghiên cứu về tổng
thể. Tổng số lượng phần tử trong mẫu gọi là kích thước mẫu, kí hiệu là 𝑛.
Kích thước mẫu là hữu hạn. Dữ liệu mẫu được kí hiệu là (𝑥1, 𝑥2, ..., 𝑥 ) 𝑛
Nếu dữ liệu mẫu là các con số, các đại lượng tính toán từ số liệu mẫu
gọi là giá trị thống kê (statistic).
Mẫu rút ra từ tổng thể để nghiên cứu về tổng thể, cần đảm bảo tính ngẫu
nhiên và tính đại diện. Có nhiều phương pháp lấy mẫu, một số phương pháp
thường được đề cập là:
• Lấy mẫu ngẫu nhiên giản đơn
• Lấy mẫu ngẫu nhiên hệ thống • Lấy mẫu phân tổ • Lấy mẫu nhiều cấp. Dữ liệu
Phân loại theo nguồn gốc dữ liệu
Theo nguồn gốc, dữ liệu được phân thành hai loại: dữ liệu sơ cấp và dữ liệu thứ cấp.
• Dữ liệu sơ cấp: là dữ liệu tự người nghiên cứu thu thập và sử dụng đầu tiên; 6
CHƯƠNG 1 THỐNG KÊ MÔ TẢ
• Dữ liệu thứ cấp: là dữ liệu do cá nhân, tổ chức khác thu thập, công
bố. Người nghiên cứu sử dụng dữ liệu không phải là người trực tiếp thu thập.
Phân loại theo đặc tính của dữ liệu
• Dữ liệu chéo: các đối tượng khác nhau được thu thập dữ liệu trong cùng thời gian;
Ví dụ: GDP bình quân đầu người các nước năm 2020, điểm tổng kết
của các sinh viên khóa 58 của Trường Đại học Kinh tế Quốc dân.
• Dữ liệu chuỗi thời gian: một đối tượng được thu thập dữ liệu theo thời
gian; thời gian có thể là thời kì hoặc thời điểm;
Ví dụ: GDP Việt Nam từ năm 1990 đến 2020, lợi nhuận sau thuế
hàng quý của một doanh nghiệp từ khi thành lập.
• Dữ liệu hỗn hợp: nhiều đối tượng được thu thập dữ liệu theo thời
gian. Nếu các đối tượng là giữ nguyên và có dữ liệu của tất cả các
thời điểm (thời kì), thì dữ liệu là hỗn hợp cân bằng (dữ liệu mảng).
Ví dụ: GDP các nước ASEAN từ năm 1995 đến 2020, giá cổ phiếu
của 5 ngân hàng trong 1 tháng gần nhất.
Cấu trúc dữ liệu truyền thống
Dữ liệu truyền thống gồm các biến (variable), các quan sát (observation),
và các giá trị (value), có thể thể hiện dưới dạng một bảng hai chiều.
Ví dụ 1.1. Dữ liệu về một số thí sinh trong một cuộc thi, gồm các biến Mã
số thí sinh, Họ tên, Giới tính, Tuổi, Thời gian hoàn thành bài thi (phút),
Điểm số, Xếp loại. Mỗi thí sinh là một quan sát.
MỤC 1.1 KHÁI NIỆM CƠ BẢN 7 TT Mã số Họ tên Giới Tuổi Thời gian Điểm Xếp loại 1 1152 N.V.An Nam 20 40,2 68 B 2 1153 T.V.Bình Nam 21 45,0 52 C 3 1156 L.T.Chi Nữ 22 38,3 82 A . . . . . . . . . . . . . . . . . . . . . . . .
Ví dụ 1.2. Bảng dữ liệu một số biến kinh tế vĩ mô của các nước ASEAN
năm 2019 (nguồn: World Bank) và xếp hạng tín dụng của các tổ chức (ngày 1/1/2021). Trong đó:
• gGDP là tỉ lệ tăng trưởng GDP (%)
• GDPpc là GDP bình quân đầu người (USD, giá hiện hành, làm tròn)
• TE là chỉ số xếp hạng tín dụng TE (Trading Economics credit rating)
• S&P là xếp hạng tín dụng theo tổ chức Standard and Poor
• Moody’s là xếp hạng tín dụng theo tổ chức Moody
• Fitch là xếp hạng tín dụng theo tổ chức Fitch. Country gGDP GDPpc TE S&P Moody’s Fitch Brunei 3.9 31087 . . . . Cambodia 7.1 1643 30 . B2 . Indonesia 5.0 4136 60 BBB Baa2 BBB Laos 4.7 2535 20 . Caa2 CCC Malaysia 4.3 11414 70 A- A3 BBB+ Myanmar 2.9 1408 . . . . Philippines 6.0 3485 61 BBB+ Baa2 BBB Singapore 0.7 65233 98 AAA Aaa AAA Thailand 2.4 7807 65 BBB+ Baa1 BBB+ Vietnam 7.0 2715 43 BB Ba3 BB
Bảng 1.1 – Một số thống kê của các nước ASEAN
Nhận thấy một số quốc gia không có giá trị của biến TE và các xếp hạng
tín dụng, giá trị trống được thay bởi một dấu chấm. 8
CHƯƠNG 1 THỐNG KÊ MÔ TẢ Phân loại biến
Biến được phân thành hai loại chính là biến định tính và biến định lượng.
Mỗi loại lại phân thành các loại nhỏ hơn.
Biến định tính hay còn gọi là biến thuộc tính, là biến mà giá trị của nó
không phải đại lượng đo lường, không có đơn vị. Biến định tính được chia
thành biến định danh và biến thứ bậc.
• Biến định danh: các giá trị không thể so sánh được với nhau.
Ví dụ: tên, địa danh, chuyên ngành học, nghề nghiệp.
• Biến thứ bậc: các giá trị có thể sắp xếp thứ tự, so sánh được nhưng
không tính toán, do khoảng cách giữa các giá trị không như nhau.
Ví dụ: Xếp loại, phân hạng, cỡ sản phẩm.
Biến định lượng hay còn gọi là biến đo được là biến mà các giá trị là
đại lượng đo lường, so sánh, tính toán được, và có đơn vị. Biến định lượng
được phân loại theo hai cách.
Cách 1. Phân loại biến định lượng theo kiểu giá trị của biến.
• Biến rời rạc: các giá trị là hữu hạn hoặc vô hạn đếm được, có thể liệt kê được.
Ví dụ: số nhân viên, số năm đi học.
• Biến liên tục: các giá trị lấp đầy một hoặc một số khoảng, không đếm
được, không liệt kê được.
Ví dụ: thời gian, độ dài, khối lượng, nhiệt độ.
Cách 2. Phân loại biến định lượng theo mức độ tính toán.
• Biến khoảng: có thể cộng trừ nhưng không nhân chia, giá trị bằng 0
có tính quy ước, không phải đo lường bằng 0.
Ví dụ: nhiệt độ đo bằng độ C, năm sinh.
MỤC 1.1 KHÁI NIỆM CƠ BẢN 9
• Biến tỉ lệ: có thể cộng trừ, nhân chia, giá trị bằng 0 là đo lường thực sự bằng 0.
Ví dụ: tiền lương, khối lượng, tuổi.
Thông thường, phân loại biến định lượng theo cách 1. Như vậy, nếu
phân loại biến thì có hai loại chính là biến định tính và biến định lượng; nếu
phân loại chi tiết thì có bốn loại là: định danh, thứ bậc, rời rạc, liên tục.
Trong nhiều trường hợp, việc phân loại biến thành rời rạc hay liên tục
cũng không quan trọng. Nhiều biến liên tục được rời rạc hóa bởi cách tính
xấp xỉ, nhiều biến rời rạc có quá nhiều giá trị cũng có thể coi như liên tục.
Nếu không phân chia rời rạc và liên tục, thì biến có ba loại là định danh,
thứ bậc, và định lượng.
Biến định danh và thứ bậc có thể được mã hóa bằng các con số, nhưng
không được thực hiện tính toán với các con số này. Do tính chất và mức độ
đo lường của các loại biến nên các công việc thực hiện cũng khác nhau.
• Biến định danh: Liệt kê, gộp thành các nhóm
• Biến thứ bậc: Liệt kê, gộp nhóm, xếp thứ tự, so sánh
• Biến định lượng: Liệt kê, gộp nhóm, xếp thứ tự, so sánh, tính toán Biến định tính Biến định lượng
Qualitative, categorical Quantitative, scale Định danh Thứ bậc Rời rạc Liên tục Nominal Ordinal Discrete Continuous Liệt kê, nhóm Liệt kê, nhóm, Liệt kê, nhóm, so sánh, so sánh, xếp thứ tự, xếp thứ tự
tính toán +, −, ×, ÷, · · ·
Có thể mã hóa bằng con số
Có đơn vị, có thể dùng để nhưng không có đơn vị
phân loại, xếp thứ bậc, xếp hạng
Bảng 1.2 – Phân loại biến và tính chất 10
CHƯƠNG 1 THỐNG KÊ MÔ TẢ Bài tập
Bài 1.1. Cho biết các dữ liệu sau đây là tổng thể hay mẫu, tương ứng với mục đích nghiên cứu:
a) Nghiên cứu về tuổi của sinh viên K62 của Trường Đại học Kinh tế
Quốc dân qua hồ sơ toàn bộ sinh viên tại phòng Quản lý đào tạo.
b) Nghiên cứu về sự hài lòng của khách hàng tại một ngân hàng qua dữ
liệu phỏng vấn ngẫu nhiên 300 khách hàng của ngân hàng đó.
c) Nghiên cứu về thị trường chứng khoán qua dữ liệu giá đóng cửa của
các chứng khoán vào ngày 31/12/2020.
d) Nghiên cứu về tổng khối lượng cổ phiếu giao dịch chính thức trong
năm 2020 của các ngân hàng niêm yết trên sàn chứng khoán qua số
liệu của Ủy ban Chứng khoán.
e) Nghiên cứu về kết quả học tập của sinh viên một trường đại học thông
qua số liệu của các sinh viên năm cuối.
Bài 1.2. Cho biết dữ liệu cho nghiên cứu sau đây thuộc loại sơ cấp hay thứ
cấp, là dữ liệu chéo hay dữ liệu chuỗi thời gian:
a) Một sinh viên nghiên cứu khoa học thực hiện khảo sát bằng bảng hỏi
với 300 sinh viên khác về thời gian tự học.
b) Một sinh viên nghiên cứu các biến vĩ mô tác động đến tăng trưởng
GDP của Việt Nam giai đoạn 1990 - 2020.
c) Trưởng phòng đếm số nhân viên đi muộn hằng ngày tại văn phòng mình quản lý.
d) Nghiên cứu viên phân tích so sánh lợi thế cạnh tranh các tỉnh thành
Việt Nam năm 2020 qua chỉ số cạnh tranh cấp tỉnh PCI do VCCI tính toán công bố.
e) Giảng viên đánh giá so sánh các sinh viên mình giảng dạy qua điểm
một bài kiểm tra giữa kì.
Bài 1.3. Cho biết các biến trong Ví dụ 1.1 và Ví dụ 1.2 trang 6 thuộc loại
nào theo cách phân loại biến trong Bảng 1.2.
MỤC 1.1 KHÁI NIỆM CƠ BẢN 11
Bài 1.4. Cho biết các biến sau là định tính hay định lượng, nếu định tính
thì là định danh hay thứ bậc, nếu định lượng thì rời rạc hay liên tục:
a) Điểm thi cuối kì môn Lý thuyết xác suất và Thống kê toán
b) Thời gian để hoàn thành bài thi một học phần
c) Loại tốt nghiệp của cử nhân Trường Đại học Kinh tế Quốc dân
d) Cỡ giày của các đôi giày trong kho
e) Xếp hạng cạnh tranh cấp tỉnh năm 2020
f) Xếp hạng cạnh tranh của các tỉnh ở Việt Nam năm 2020
g) Chỉ số cạnh tranh của các tỉnh ở Việt Nam năm 2020
h) Hình thức sở hữu của các doanh nghiệp trên địa bàn Hà Nội
i) Nhiệt độ trung bình của các ngày trong năm tại Hà Nội
Bài 1.5. Cho biết với số liệu chứa các thông tin sau, có thể thực hiện các
công việc gì trong số sau: nhóm, gộp, liệt kê, so sánh, xếp thứ tự, tính toán
a) Ngành học và điểm kiểm tra của các sinh viên trong một lớp tín chỉ.
b) Giới tính và trình độ (cao đẳng, đại học, cao học, tiến sĩ) của các nhân
viên tại một cơ sở đào tạo.
c) Thu nhập và vị trí công việc của người lao động tại một công ty.
d) Năm sinh và tuổi của các thí sinh trong một cuộc thi.
e) Vị trí về đích và thời gian hoàn thành chặng đua của các vận động
viên trong một cuộc thi chạy.
f) Hình thức sở hữu và vốn điều lệ của các công ty thành lập mới trong năm 2020.