

















Preview text:
Tên Chương
Nội dung lý thuyết cần nhớ (Theo Slide)
- Thống kê học là khoa học nghiên cứu hệ thống các phương pháp thu thập, xử lý và phân tích
các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn
có của chúng (mặt chất) trong những điều kiện nhất định (không gian, thời gian).
- Đối tượng nghiên cứu của thống kê: mặt lượng, mặt chất, hiện tượng số lớn, điều kiện nhất
định (không gian, thời gian).
- Tổng thể thống kê (hiện tượng số lớn) là hiện tượng số lớn bao gồm những đơn vị, hoặc phần
tử cấu thành hiện tượng (gọi là các đơn vị tổng thể hay hiện tượng cá biệt), cần được quan sát
và phân tích. Có 3 cách phân loại:
Phân theo sự nhận biết các đơn vị: *
+ Tổng thể bộc lộ: có ranh giới rõ ràng, các đơn vị của tổng thể được biểu hiện một cách rõ
ràng, dễ xác định. VD: Số sinh viên Đại học KTQD
+ Tổng thể tiềm ẩn: các đơn vị không được nhận biết một cách trực tiếp, ranh giới của tổng thể
không rõ ràng. VD: Số sinh viên Đại học KTQD hài lòng với chất lượng đào tạo của trường
Phân theo mục đích nghiên cứu: *
+ Tổng thể đồng chất ồ ữ đơn ị ữ đặ ủ ế : bao g m nh ng v có cùng chung nh ng c điểm ch y u có liên
quan đến mục đích nghiên cứ u.
+ Tổng thể không đồng chất: bao gồm những đơn vị khác nhau về loại hình, khác nhau về
những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu.
VD: Khi nghiên cứu học phí hàng tháng của sinh viên Đại học KTQD thì nếu tổng thể là sinh
viên AEP => Đồng chất, nếu tổng thể là sinh viên tất cả các hệ => Không đồng chất
Phân theo phạm vi nghiên cứu: *
+ Tổng thể chung: bao gồm tất cả các đơn vị của hiện tượng nghiên cứu Chương 1:
Giới + Tổng thể bộ phận: chỉ chứa đựng một phần của tổng thể chung ọ ổ ể ệ đào ạ ế
thiệu chung VD: Sinh viên Đại h c KTQD là t ng th chung thì sinh viên vi n t o tiên ti n, CLC và POHE
về thống kê là tổng thể bộ phận.
- Tiêu thức thống kê là đặc điểm của đơn vị tổng thể được chọn ra để nghiên cứu tùy theo
mục đích nghiên cứu khác nhau. Phân thành 3 loại:
* Tiêu thức thực thể:
+ Tiêu thức thuộc tính: Biểu hiện không trực tiếp bằng con số mà bằng các đặc điểm, tính chất
(VD: giới tính, quê quán, dân tộc, khoa gì, lớp gì, …)
+ Tiêu thức số lượng: Biểu hiện trực tiếp thông qua con số (VD: chi tiêu, thu nhập, điểm thi,
chiều cao, cân nặng, thời gian học,…)
+ Đặc biệt: Tiêu thức thay phiên (có thể là thuộc tính hoặc số lượng): có 2 biểu hiện không
trùng nhau trên cùng một đơn vị tổng thể (VD: Giới tính: Nam/Nữ, Có ở kí túc hay không: Có/Không,…)
Tiêu thức thời gian: Phản ánh thời gian của hiện tượng nghiên cứu
* Tiêu thức không gian: Nêu lên phạm vi lãnh thổ của hiện tượng nghiên cứu *
- Chỉ tiêu thống kê phản ánh mặt lượng gắn với mặt chất của các hiện tượng trong điều kiện
thời gian và địa điểm cụ thể (phản ánh đặc điểm của số lớn đơn vị tổng thể).
VD: Điểm thi của mỗi sinh viên là tiêu thức thống kê, còn điểm thi trung bình của tất cả sinh
viên là chỉ tiêu thống kê. Có 4 cách phân loại:
* Phân theo hình thức biểu hiện:
+ Chỉ tiêu hiện vật: có biểu hiện bằng đơn vị tự nhiên (người, cái, chiếc,…) hoặc đơn vị đo lường
quy ước (kg, mét, …). VD: Chiều cao trung bình của nam giới Việt Nam là 168,1cm (nữ là 156,2cm)
+ Chỉ tiêu giá trị: có biểu hiện bằng đơn vị tiền tệ (VND, USD, …). VD: GDP bình quân đầu người
của Việt Nam năm 2021 là 86,08 triệu VND/ người (Đứng thứ 129)
* Phân theo tính chất biểu hiện:
+ Chỉ tiêu tuyệt đối: phản ánh quy mô, khối lượng của hiện tượng. VD: GDP của Việt Nam
năm 2021 là 362,6 tỷ USD (Đứng thứ 39)
+ Chỉ tiêu tương đối: phản ánh mối quan hệ so sánh giữa cá mức độ của hiện tượng. VD: GDP
của Việt Nam năm 2021 tăng 2,58%
* Phân theo đặc điểm thời gian:
+ Chỉ tiêu thời điểm: phản ánh mặt lượng của hiện tượng nghiên cứu tại một thời điểm nhất
định. VD: Dân số Việt Nam là 99.144.053 ngày 03/10/2022 (Đứng thứ 15)
+ Chỉ tiêu thời kỳ: phản ánh mặt lượng của hiện tượng nghiên cứu trong một thời kỳ nhất
định. VD: Tổng kim ngạch xuất khẩu của Việt Nam năm 2021 đạt 336,3 tỷ USD
* Phân theo nội dung phản ánh
+ Chỉ tiêu chất lượng: biểu hiện trình độ phổ biến và mối quan hệ so sánh trong tổng thể,
đây là số tương đối. VD: Mật độ dân số Việt Nam hiện nay là 319 người/km2
+ Chỉ tiêu số lượng (khối lượng): phản ánh quy mô, khối lượng của hiện tượng nghiên cứu
theo thời gian và địa điểm cụ thể. VD: Số ca mắc covid tại Việt Nam ngày 01/10/2022 là 672 người.
- Thang đo thống kê:
Thang đo định danh: VD: Quê quán, dân tộc, giới tính, tôn giáo … -> Bình đẳng
Thang đo thứ bậc: VD: Bằng cấp, size quần áo, size giầy dép, thẻ thành viên,… ->Không bình đẳng, có sự hơn kém
Thang đo khoảng: Nhiệt độ, điểm thi (Không có gốc 0)
Thang đo tỷ lệ: Chiều cao, cân nặng (Có gốc 0)
- Sơ đồ quá trình nghiên cứu thống kê:
+ Xác định mục đích nghiên cứu, phân tích mục đích nghiên cứu
+Xây dựng hệ thống chỉ tiêu thống kê (Xác định nhu cầu thông tin)
+ Điều tra thống kê (Thu thập thông tin)
+ Tổng hợp thống kê (Xử lý tài liệu)
+ Phân tích và dự đoán thống kê (Phan tích dữ liệu)
+ Trình bày kết quả nghiên cứu Chương 2:
- Điều tra thống kê là tổ chức một cách khoa học và theo một kế hoạch thống nhất việc
Thu thập dữ
thu thập tài liệu về các hiện tượng nghiên cứu. Yêu cầu: Chính xác, kịp thời, đầy đủ nội
liệu thống kê dung. Có 3 cách phân loại:
* Phân theo tính chất liên tục của việc ghi chép:
+ Điều tra thường xuyên: là điều tra một cách liên tục, có hệ thống và thường là theo sát quá
trình phát sinh, phát triển của hiện tượng. VD: Chấm công đi làm hàng ngày
+ Điều tra không thường xuyên: là điều tra một cách không liên tục, không gắn với quá trình
phát sinh, phát triển của hiện tượng. VD: Thầy cô thỉnh thoảng điểm danh trên lớp đại học.
* Phân theo phạm vi đối tượng được điều tra:
+ Điều tra toàn bộ: Tiến hành thu thập thông tin ở tất cả các đơn vị thuộc đối tượng nghiên cứu
+ Điều tra không toàn bộ: chỉ tiến hành thu thập thông tin ở một số đơn vị thuộc đối tượng
nghiên cứu. Phân tiếp thành 3 loại con:
Điều tra trọng điểm: Tiến hành thu thập thông tin ở bộ phận chiếm tỷ trọng lớn nhất trong tổng thể
Điều tra chuyên đề: Tiến hành thu thập thông tin trên một số ít các đơn vị (thậm chí
1 đơn vị) nhưng đi sâu nghiên cứu trên nhiều phương diện
Điều tra chọn mẫu: Tiến hành thu thập thông tin trên các đơn vị đại diện (một số đủ
lớn), kết quả thường để suy rộng cho tổng thể.
- Thời điểm điều tra, Thời kỳ điều tra, Thời hạn điều tra:
+ Thời điểm điều tra: là mốc thời gian được quy định thống nhất mà cuộc điều tra phải thu
thập thông tin về hiện tượng tồn tại đúng thời điểm đó. VD: Thời điểm tổng điều tra dân số Việt Nam là 1/4/2022.
+ Thời kỳ điều tra: là khoảng thời gian được quy định để thu thập số liệu về lượng của hiện
tượng được tích lũy trong cả thời kỳ đó. VD: Thời kì điều tra về GDP của Việt Nam là năm 2021.
+ Thời hạn điều tra: là khoảng thời gian dành cho việc thực hiện nhiệm vụ thu thập số liệu
VD: Thầy giáo cho phép học sinh thời hạn để thu thập số liệu làm BT lớn là 1 tuần.
- Sai số trong điều tra thống kê là chênh lệch giữa trị số thu được qua điều tra so với trị số
thực tế của hiện tượng. Phân thành 2 loại:
+ Sai số do đăng ký ghi chép: xảy ra với mọi cuộc điều tra. Nguyên nhân rất đa dạng cả chủ quan, khách quan
+ Sai số do tính chất đại biểu (sai số chọn mẫu): chỉ xảy ra trong điều tra chọn mẫu. Nguyên
nhân là do chỉ chọn một số đơn vị để điều tra thực thế, không đủ đảm bảo đại diện cho toàn bộ tổng thể Chương 3:
- Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để tiến hành phân chia
Trình bày dữ các đơn vị của hiện tượng nghiên cứu thành các tổ (hoặc các tiểu tổ) có tính chất khác
liệu thống kê nhau. Có ý nghĩa trong cả quá trình nghiên cứu thống kê (giai đoạn điều tra-tổng hợp-phân tích)
- Nhiệm vụ: 1/ Phân chia các loại hình kinh tế xã hội; 2/ Biểu hiện kết cấu của hiện
tượng nghiên cứu; 3/ Nghiên cứu mối liên hệ giữa các tiêu thức
- Phân loại (Đọc thêm):
- Các bước phân tổ: 3 bước
+ Bước 1: Lựa chọn tiêu thức phân tổ: là tiêu thức được chọn làm căn cứ để tiến hành phân tổ
thống kê. Khi lựa chọn tiêu thức phân tổ cần căn cứ vào những yêu cầu sau:
Phải dựa trên cơ sở phân tích lý luận
Phải căn cứ vào điều kiện lịch sử cụ thể của hiện tượng nghiên cứu
Phải tùy theo mục đích nghiên cứu và điều kiện tài liệu thực tế
+ Bước 2: Xác định số tổ và khoảng cách tổ
Phân tổ theo tiêu thức thuộc tính
Phân tổ theo tiêu thức số lượng
- Có ít biểu hiện (lượng biến): mỗi
lượng biến là cơ sở để hình thành một
tổ, gọi là phân tổ không có khoảng
- Có ít biểu hiện: mỗi loại hình hình cách tổ thành nên 1 tổ
VD: Điểm thi (số nguyên) thang
VD: Giới tính: Nam (1 tổ), Nữ (1 tổ)
4 1, 2, 3, 4 mỗi cái là 1 tổ
- Có nhiều biểu hiện: ghép các biểu hiện
- Có nhiều biểu hiện (lượng biến): căn cứ
gần giống nhau thành một tổ
vào quan hệ lượng - chất, mỗi tổ sẽ bao
VD: Quê quán -> Các tỉnh miền bắc (1 tổ),
gồm một phạm vi lượng biến, gọi là
các tỉnh miền trung (1 tổ), các tỉnh miền
phân tổ có khoảng cách tổ Nam (1 tổ)
VD: Điểm thi (không bắt buộc nguyên), thang 10 <5 là 1 tổ Từ 5-8 là 1 tổ >8 là 1 tổ
+ Bước 3: Phân phối các đơn vị vào từng tổ: Sắp xếp các đơn vị vào từng tổ tương ứng với biểu
hiện của từng tổ. (Số đơn vị được phân vào mỗi tổ gọi là tần số, giá trị của tổ gọi là lượng biến).
- Dãy số phân phối: sau khi phân tổ tổng thể theo một tiêu thức nào đó, các đơn vị tổng thể
được phân phối vào trong các tổ (các tần số) -> Dãy các tần số gọi là một dãy số phân phối
+ Dãy số phân phối theo tiêu thức thuộc tính
+ Dãy số phân phối theo tiêu thức số lượng (dãy số lượng biến) Chương 4:
Số tuyệt đối
Số tương đối
Các mức độ
Biểu hiện quy mô, khối lượng
Biểu hiện quan hệ so sánh giữa hai mức độ nào đó thống kê mô
của hiện tượng nghiên cứu tại của hiện tượng. tả thời gian, địa điểm.
- Đơn vị: Lần; phần trăm (%); phần nghìn (‰) Đ ; ơn vị
Mẫu và tổng
- Đơn vị hiện vật: Tự nhiên (cái, kép (triệu/người)
thể => Tính
chiếc, m, kg); Thời gian (ngày, - Phân loại:
các chỉ tiêu
giờ); Quy chuẩn; Kép (tấn-km,
- Quan hệ so sánh giữa hai hiện tượng cùng loại kwh)
+ Số tương đối động thái (tốc độ phát triển): Số
- Đơn vị giá trị: VND, USD,… tương đối thời gian - Phân loại:
+ Số tương đối kế hoạch gồm số tương đối nhiệm vụ
+ Thời kỳ: quy mô, khối lượng
kế hoạch và thực hiện kế hoạch
trong một khoảng thời gian
STĐ NV kế hoạch= 𝑆ố 𝑛ℎ𝑖ệ𝑚 𝑣ụ 𝑛ă𝑚 𝑛𝑎𝑦
+ Thời điểm: quy mô, khối
𝑇ℎự𝑐 𝑡ế 𝑛ă𝑚 𝑛𝑔𝑜á𝑖
lượng tại một thời điểm nhất
STĐ thực hiện NV=𝐾ế𝑡 𝑞𝑢ả 𝑡ℎự𝑐 ℎ𝑖ệ𝑛 𝑛ă𝑚 𝑛𝑎𝑦 định
𝑁ℎ𝑖ệ𝑚 𝑣ụ đề 𝑟𝑎 đầ𝑢 𝑛ă𝑚
+ Số tương đối kết cấu: Phản ánh tỷ trọng của từng
bộ phận cấu thành trong một tổng thể
STĐ kết cấu=𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢 𝑚ộ𝑡 𝑏ộ 𝑝ℎậ𝑛
𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢 𝑡ổ𝑛𝑔 𝑡ℎể
+ Số tương đối không gian: so sánh giữa hai hiện
tượng cùng loại nhưng khác nhau về không gian hoặc
là quan hệ so sánh mức độ giữa hai bộ phận trong một tổng thể
- Quan hệ so sánh giữa hai hiện tượng khác loại
+ Số tương đối cường độ: quan hệ so sánh giữa hai
hiện tượng khác loại nhưng có quan hệ với nhau (VD:
mật độ dân số = Dân số/Diện tích, Vận tốc = Quãng đường/Thời gian)
- Một số công thức thêm:
Doanh thu = Giá bán x Số lượng = Doanh thu một nhân viên (NSLĐ) x Số nhân viên
Tổng chi phí = Giá thành (Chi phí mỗi sản phẩm) x Số lượng
Sản lượng = NSLĐ x Số lao động
Tỷ lệ hoàn thành kế hoạch = 𝑆ả𝑛 𝑙ượ𝑛𝑔 𝑡ℎự𝑐 𝑡ế
𝑆ả𝑛 𝑙ượ𝑛𝑔 𝑘ế ℎ𝑜ạ𝑐ℎ Chương 4:
Các mức độ trung tâm
Các mức độ phân tán (độ đồng
Các mức độ đều) thống kê mô
1. Số bình quân (trung bình):
1. Khoảng biến thiên tả
- Khái niệm: Là mức độ đại biểu theo một tiêu
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Mẫu và tổng
thức nào đó của một tổng thể bao gồm nhiều đơn 2. Phương sai
thể => Tính vị. Phương sai tổng thể:
các chỉ tiêu
- Đặc điểm: Mang tính tổng hợp, khái quát. San
- Lấy phương sai lớn nhất hoặc tỷ lệ
bằng các chênh lệch giữa các đơn vị về trị số của
gần 0.5 nhất trong các lần điều tra tiêu thức nghiên cứu. trước
- Tác dụng: Phản ánh mức độ đại biểu, nêu lên đặc
- Lấy phương sai hoặc tỷ lệ của các
trưng chung nhất của tổng thể. So sánh các hiện
cuộc điều tra khác có tính chất
tượng không có cùng quy mô. tương tự
- Điều kiện vận dụng: Số bình quân chỉ nên tính
- Điều tra thí điểm để xác định
ra từ tổng thể đồng chất. Số bình quân chung phương sai hoặc tỷ lệ
cần được vận dụng kết hợp với các số bình quân
- Ước lượng phương sai dựa vào
tổ hoặc dãy số phân phối. khoảng biến thiên
𝜎 = 𝑥𝑚𝑎𝑥 −6 𝑥 =𝑚 𝑅𝑖𝑛
- Trung bình cộng giản đơn = 𝑥 = 𝜇 = 𝛴𝑥 𝑛 6
- Trung bình cộng gia quyền: ∑𝑥⋅𝑓 Mẫu 𝑠2 𝑛 Tổng thể 𝜎 2
- Nhược điểm: chịu ảnh hưởng của lượng biến
Lấy từng giá trị được cho trừ đi 𝑥 ,sau
đột xuất, nếu có thì nên chuyển qua tính mốt hoặc đó bình phương trung vị
𝑠2=(𝑎 − 𝑥)2+(𝑏 − 𝑥)2+(𝑐 + 𝑥)2+ ⋯ )
2. Mốt (𝑴𝟎): 𝑛 − 1
- Khái niệm: là biểu hiện của tiêu thức phổ biến
𝜎2=(𝑎 − 𝑥)2+(𝑏 − 𝑥)2+(𝑐 + 𝑥)2+ ⋯ ) 𝑛
nhất (gặp nhiều nhất) trong một tổng thể hay
trong một dãy số phân phối, giá trị xuất hiện Hoặc nhiều nhất.
𝑠2=∑𝑥2⋅ 𝑓 − 𝑛𝑥2
- Tác dụng: Có thể thay thế hoặc bổ sung cho 𝑛 − 1
trung bình cộng trong trường hợp tính trung
𝜎2=∑𝑥2⋅ 𝑓 − 𝑛𝑥2
bình gặp khó khăn. Có ý nghĩa hơn số bình quân 𝑛
cộng trong trường hợp dãy số có lượng biến đột
= 𝛴𝑥2⋅ 𝑓 − 𝑛 ⋅ 𝜇2
xuất. Là một trong những tham số nêu lên đặc
trưng phân phối của dãy số. Có tác dụng trong 𝑛
phục vụ nhu cầu hợp lý ∑𝑥2𝑑 − 𝜇2
- Chú ý: Có thể có nhiều Mốt. có thể có 1 Mốt, có Trong đó: thể không có Mốt
f là tần số xuất hiện
3. Trung vị (𝑴𝒆) x là lượng biến
- Khái niệm: là lượng biến của đơn vị đứng ở vị trí n là tổng số biến
giữa trong một dãy số, chia dãy số thành hai 𝑥 là trung bình mẫu phần bằng nhau
𝜇 là trung bình tổng thể
- Tác dụng: Tương tự mốt + Có tác dụng trong phục
vụ công cộng vì ∑|𝑥𝑖−𝑀ⅇ|𝑓𝑖= min
d là tỷ trọng hoặc tần suất
- B1: Sắp xếp dãy số tăng dần
Khi nào cho 𝑥2𝑓 thì tính phương sai
- B2: TH1: n lẻ 𝑀𝑒= 𝑥 ở 𝑣ị 𝑡𝑟í 𝑛+1
mẫu, cho 𝑥2𝑑 thì tính phương sai 2 tổng thể. 2+(𝑛
3. Độ lệch chuẩn:
TH2: n chẵn 𝑀𝑒= 𝑥 ở 𝑣ị í 𝑡𝑟 𝑛 2+1) 2
bằng căn bậc hai của phương sai Mẫu √𝑠2 Tổng thể √𝜎2
*/ Mối quan hệ giữa trung bình, trung vị, mốt
4. Hệ số biến thiên (sai số tương đối)
𝐶𝑉 =Độ 𝑙ệ𝑐ℎ 𝑐ℎ𝑢ẩ𝑛 (𝑠, 𝜎)
𝑇𝑟𝑢𝑛𝑔 𝑏ì𝑛ℎ (𝑥, 𝜇) .100
- Lưu ý: Nếu dãy số có giá trị ngoại
lai: rất lớn hoặc rất nhỏ thì trung
bình sẽ mất đi ý nghĩa đo xu hướng
trung tâm, từ đó ta nên chuyển qua tính trung vị và mốt.
- Phân phối chuẩn (đối xứng): TB = Trung vị = Mốt
- Lệch phải: TB>Trung vị>Mốt - Lệch trái: TB Chương 5:
- Thống kê suy diễn: từ chỉ tiêu mẫu => chỉ tiêu tổng thể Điều tra
+ Trung bình 𝑥 => 𝜇 ỷ ệ ọ
chọn mẫu + T l /Tỷ tr ng f => p
- Ước lượng khoảng: từ mẫu mà đoán được tổng thể, lớn hơn bao nhiêu, nhỏ hơn bao
Thống kê suy nhiêu diễn
+ Ước lượng trung bình (Suy diễn bình quân):
Khi biết phương sai tổng thể
Khi chưa biết phương sai tổng thể (dùng 𝜎2) (dùng 𝑠2) Hai phía
𝑥 − 𝑧𝛼2⋅ 𝜎𝑥 ≤ 𝜇 ≤ 𝑥 + 𝑧𝛼 2⋅ 𝜎𝑥
𝑥 − 𝑡𝛼𝑛−1 ⋅ 𝜎𝑥 ≤ 𝜇 ≤ 𝑥 + 𝑡𝛼𝑛−1 ⋅ 𝜎𝑥 2 2 Vế phải
𝑥 − 𝑧𝛼⋅ 𝜎𝑥 ≤ 𝜇 ≤ ∞
𝑥 − 𝑡𝛼𝑛−1 ⋅ 𝜎𝑥 ≤ 𝜇 ≤ ∞ 2 Vế trái
−∞ ≤ 𝜇 ≤ 𝑥 + 𝑧𝛼⋅ 𝜎𝑥
−∞ ≤ 𝜇 ≤ 𝑥 + 𝑡𝛼𝑛−1 ⋅ 𝜎𝑥 2
Trong đó: sai số bình quân chọn mẫu 𝝈𝒙 tính như sau: Suy rộng/Cách chọn
Hoàn lại (chọn nhiều lần)
Không hoàn lại (chọn 1 lần) Số bình quân 𝜎𝑥 =√𝜎2
𝜎𝑥 =√𝜎2𝑛 (𝑁 − 𝑛 𝑛 𝑁 − 1) 𝜎𝑥 =√𝑠2
𝜎𝑥 =√𝑠2𝑛 (𝑁 − 𝑛 𝑛 𝑁 − 1) Tỷ lệ 𝜎𝑓=√𝑓(1 − 𝑓) 𝜎𝑓=√𝑓(1 − 𝑓 𝑛()𝑁 − 𝑛 𝑛 𝑁 − 1)
N là kích thước tổng thể n là mẫu
Đề bài không nêu rõ hoàn lại hay không hoàn lại, thì luôn tính theo công thức hoàn lại.
Hệ số tin cậy: 𝒁𝜶𝟐
+ Ước lượng tỷ lệ: Hai phía
𝑓 − 𝑧𝛼2. 𝜎𝑓≤ 𝑝 ≤ 𝑓 + 𝑧𝛼2. 𝜎𝑓 Vế phải
𝑓 − 𝑧𝛼2. 𝜎𝑓≤ 𝑝 ≤ ∞ Vế trái
−∞ ≤ 𝑝 ≤ 𝑥 + 𝑧𝛼2. 𝜎𝑓
Trong đó 𝜎𝑓=√1(1−𝑓)𝑛
- Xác định kích thước mẫu (Tìm n): Nếu n càng lớn thì 𝘀 (sai số chọn mẫu) càng nhỏ và ngược lại
Dạng bài tập: cho 𝘀 tìm n Bình quân:
+ Cho phương sai tổng thể => dùng
+ Cho nhiều phương sai mẫu => dùng cái lớn nhất
+ Cho một phương sai mẫu => dùng Tỷ lệ:
+ Cho tỷ lệ tổng thể => dùng
+ Cho nhiều tỷ lệ mẫu => chọn cái gần 0.5 nhất
+ Cho một tỷ lệ mẫu => dùng Suy rộng/Cách chọn
Chọn hoàn lại (chọn nhiều lần)
Chọn không hoàn lại (chọn một lần) Bình quân 𝑛 = 𝑧𝛼2𝜎2 𝑛 = 𝑁. 𝑧𝛼2. 𝜎2 2 2 𝘀𝑥2
(𝑁 − 1).𝘀𝑥2+ 𝑧𝛼2.𝜎2 2 Tỷ lệ
𝑛 = 𝑧𝛼2. 𝑝(1 − 𝑝) 𝑛 =
𝑁. 𝑧𝛼2. 𝑝(1 − 𝑝) 2 2 𝘀𝑓2
(𝑁 − 1).𝘀𝑓2+ 𝑧𝛼2.𝑝(1 − 𝑝) 2
- Kiểm định: bao gồm kiểm tra trung bình tổng thể µ so sánh một số (trung bình) và kiểm tra
với một 1 số bất kì (tỷ lệ)
+ Bước 1: Xét cặp giả thuyết (2 trường hợp) {𝐻0: = ≥ ≤ 𝐻1: ≠ < >
Ví dụ 1: Hãy kiểm định, kiểm tra trung bình lớn hơn 3 (tức µ > 3) {𝐻0: µ ≤ 3 𝐻1: µ > 3
Ví dụ 2: Hãy kiểm định tỷ lệ không vượt quá 0.5 (tức p ≤ 0.5) {𝐻0: 𝑝 ≤ 0.5 𝐻1: 𝑝 > 0.5
Hai dấu ≥ hay ≤ đều viết là =
+ Bước 2: Tính tiêu chuẩn kiểm định
Kiểm định µ trung bình (chưa biết phương sai tổng thể): 𝑇𝑞𝑢𝑎𝑛 𝑠á𝑡 = 𝑥 − µ 𝑠 0 √𝑛
µ0 là số được đem đi so sánh. Ví dụ 1: µ0 là 3
Kiểm định µ trung bình (biết phương sai tổng thể): 𝑍𝑞𝑢𝑎𝑛 𝑠á𝑡 = 𝑥 − µ𝜎0 √𝑛
Kiểm định P tỷ lệ: 𝑍𝑞𝑢𝑎𝑛 𝑠á𝑡 = 𝑓− 𝑝0 √ 𝑛 𝑝0(1−𝑝0)
Thường thi vào biết phương sai mẫu
+ Bước 3: Điều kiện để bác bỏ 𝑯𝟎 Dấu của 𝐻1 Điều kiện ≠
|𝑇𝑞𝑠| hoặc |𝑍𝑞𝑠| > 𝑡(𝑛−1𝛼2) hoặc 𝑍𝛼 2 >
𝑇𝑞𝑠 hoặc 𝑍𝑞𝑠 > 𝑡 (𝑛−1𝛼 )hoặc 𝑍𝛼 <
𝑇𝑞𝑠 hoặc 𝑍𝑞𝑠 < 𝑡(𝑛−1𝛼) hoặc 𝑍𝛼 Kết luận:
Nếu thoả mãn điều kiện: Bác bỏ 𝐻0, chấp nhận 𝐻1 => 𝐻0 sai, 𝐻1 đúng => Đề bài đúng/ sai
Nếu không thoả mãn điều kiện: Chưa bác bỏ => 𝐻0 đúng/𝐻1 sai => Đề bài đúng/sai
Ước lượng hai phía (đối xứng) 𝛼2: 𝑥 − 𝑠√𝑛 𝑡 (𝑛−1𝛼2)< 𝜇 < 𝑥 + 𝑠 √𝑛 𝑡 (𝑛−1𝛼) 2
Ước lượng một phía
Tối đa (bên phải): 𝜇 < 𝑥 + 𝑠 √𝑛 𝑡 (𝑛−1𝛼) 2
Tối thiểu (bên trái): 𝑥 − 𝑠 √𝑛 𝑡 (𝑛−1 𝛼2 ) < 𝜇
- Note: Cách giải bài toán kiểm định bằng SPSS
P value 𝐸𝑣𝑖𝑒𝑤𝑠 𝑑ù𝑛𝑔 𝑃𝑟𝑜𝑏 (𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡𝑦,𝐾𝑖𝑛ℎ 𝑡ế 𝑙ượ𝑛𝑔)
𝑆𝑃𝑆𝑆 𝑑ù𝑛𝑔 𝑆𝑖𝑔 (𝑆𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑡) So sánh:
P Value > α => Chưa bác bỏ 𝐻0 (𝐻0 đúng, 𝐻1 sai)
P Value < α => Bác bỏ 𝐻0, chấp nhận 𝐻1 (𝐻0 𝑠𝑎𝑖, 𝐻1 đúng)
- Định lý giới hạn trung tâm:
+ Nếu tổng thể có phân phối chuẩn thì phân phối của trung bình mẫu cũng có phân phối chuẩn
+ Với kích thước mẫu đủ lớn thì phân phối trung bình và tỷ lệ mẫu sẽ xấp xỉ phân phối chuẩn
- Sai lầm và mức ý nghĩa trong kiểm định:
+ Sai lầm loại I là bác bỏ H0 khi H0 đúng, xác suất là α
+ Sai lầm loại II là không bác bỏ H0 khi H0 sai, xác suất là β 𝛼
Mức ý nghĩa hay Xác suất mắc sai lầm loại I β
Xác suất mắc sai lầm loại II 1 - 𝛼
Xác suất hay trình độ tin cậy 1- β Lực kiểm định Chương 6:
- Hồi qui tương quan là phương pháp phân tích dựa trên mối liên hệ phụ thuộc của một biến Hồi quy
phụ thuộc (biến kết quả) vào một hay nhiều biến độc lập (biến nguyên nhân). Thống kê
Ví dụ: Chiều cao và tuổi của một người, Thu nhập và chi tiêu của hộ gia đình, Số giờ tự học và khám phá điểm số
Mối liên hệ phụ thuộc này được xây dựng bằng một phương trình hồi qui có thể là tuyến tính hay phi tuyến.
- Liên hệ hàm số là mối liên hệ hoàn toàn chặt chẽ, sự thay đổi của hiện tượng này có tác dụng
quyết định đến sự thay đổi của hiện tượng liên quan theo một tỷ lệ xác định.
Có dạng y=f(x), không những được biểu hiện ở tổng thể mà còn được biểu hiện
trên từng đơn vị cá biệt.
- Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ. Sự thay đổi của hiện tượng này
có thể làm hiện tượng liên quan thay đổi theo nhưng không có ảnh hưởng hoàn toàn quyết
định, không được biểu hiện trên từng đơn vị cá biệt mà phải thông qua hiện tượng số lớn (là tổng thể).
- Để tìm ra mối liên hệ giữa hai biến X và Y, có thể vẽ đồ thị phân tán (Scatterplot)
+ X được gọi là biến độc lập (biến nguyên nhân)
+ Y được gọi là biến phụ thuộc (biến kết quả)
→ Scatterplot có thể cho biết cường độ và chiều hướng của mối liên hệ tuyến tính giữa hai biến
+ Xây dựng mô hình hồi quy đơn: Bậc 1 đường thẳng tuyến tính
𝑌𝑖= 𝛽0+ 𝛽1. 𝑋𝑖+ 𝘀𝑖 K=1
Trong đó: 𝑌𝑖 là Biến phụ thuộc 𝛽0 là Hệ số chặn 𝛽1 là Hệ số góc
𝑋𝑖 là Biến độc lập
𝘀𝑖 là Sai số ngẫu nhiên
+ Xây dựng mô hình hồi quy bội:
𝑌𝑖= 𝛽0+ 𝛽1. 𝑋1+ 𝛽2. 𝑋2+ ⋯ + 𝛽𝑘. 𝑋𝑘+ 𝘀 K≥2
+ Hàm hồi quy mẫu:
𝑌𝑖= 𝑏0+ 𝑏1.𝑋1+ 𝑏2.𝑋2 Ý nghĩa:
Nếu 𝑋1𝑣à 𝑋2 = 0 thì 𝑌𝑖 là 𝑏0
Nếu 𝑋1tăng 1 đơn vị thì 𝑌𝑖 tăng hoặc giảm |𝑏1| đơn vị, 𝑋2 tương tự
- Các dạng bài tập chương 6:
+ Xác định 𝑹𝟐 (hệ số xác định) và r (hệ số tương quan)
Giả sử điều tra 100 bạn sinh viên (n=100), ta sẽ có 100 điểm thi, 100 thời gian học, 100 IQ (các
nhân tố ảnh hưởng đếm điểm thi)
Điểm thi 𝑌𝑖 = 𝑏0 + 𝑏1.thời gian học + 𝑏2.IQ
Từ 100 điểm thi tính được 𝑌 , 𝑌 ⇒Tính được
SST (Sum of squared total: Tổng bình phương) = ∑(𝑌𝑖− 𝑌)2
SSR ( Sum of squared regression: Tổng hổi quy) = ∑(𝑌− 𝑌)2
SSE (sum of squared errors: Tổng bình phương sai số ) = ∑( 𝑌 − 𝑌)2
⇒𝑆𝑆𝑇 =𝑆𝑆𝑅 +𝑆𝑆𝐸
⇒ 𝑅2= 𝑆𝑆𝑅𝑆𝑆𝑇 hoặc 𝑅2= 1 − (𝑆𝑆𝐸𝑆𝑇)
Ý nghĩa của 𝑹𝟐: VD: Nếu 𝑅2= 0.75= 75% thì các biến độc lập sẽ giải thích được 75% sự thay đổi
của biến phụ thuộc ⇒ 0 ≤ 𝑅2 ≤ 1
r (hệ số tương quan) = ±√𝑅2 ⇒ 𝑅2=𝑟2
± dựa vào dấu của 𝛽1 Ý nghĩa của r:
Đo chiều hướng (r, 𝜷𝟏):
Nếu r > 0: Biến độc lập và biến phụ thuộc tương quan cùng chiều
Nếu r < 0: Biến độc lập và biến phụ thuộc tương quan ngược chiều
Nếu r = 0: Biến độc lập và biến phụ thuộc không tương quan
Đo mức độ (−𝟏 ≤ 𝒓 ≤ 𝟏)
|𝑟| càng gần 1 thì tương quan càng chặt
|𝑟| càng gần 0 thì tương quan càng lỏng
+ Ước lượng: 𝒃𝟎, 𝒃𝟏, 𝒃𝟐⇒ 𝜷𝟎, 𝜷𝟏, 𝜷𝟐
Ước lượng 2 phía đối xứng:
𝑏1−𝑆𝐸(𝑏1)𝑡(𝑛 − 𝑘 − 2 1
≤ )𝛽1≤ 𝑏1+𝑆𝐸(𝑏1)𝑡(𝑛 − 𝑘 − 1) 𝛼 𝛼 2 SE là sai số chuẩn
Ước lượng 1 phía:
𝑏1−𝑆𝐸(𝑏1)𝑡(𝑛 − 𝑘 − 1) 𝛼≤ 𝛽1
𝛽1≤ 𝑏1+𝑆𝐸(𝑏1)𝑡(𝑛 − 𝑘 − 1) 𝛼
+ Kiểm định 𝒀𝒊= 𝜷𝟎+ 𝜷𝟏. 𝑿𝟏+ 𝜷𝟐. 𝑿𝟐+ 𝜺
* So sánh 𝛽1= 0 (X không tác động đến Y) và 𝛽1≠ 0 (X có tác động đến Y)
Bước 1: Xét cặp giả thuyết: {𝐻0: 𝛽1= 0 𝐻1: 𝛽1≠ 0
Bước 2: Tính tiêu chuẩn kiểm định 𝑡𝑞𝑠 =𝑏1𝑆𝐸(𝑏1)
Bước 3: Điều kiện bác bỏ 𝐻0
Nếu |𝑡𝑞𝑠|> (𝑛 − 𝑘 − 1)
𝛼2𝑇ℎ𝑜á 𝑚ã𝑛 ⇒ 𝐵á𝑐 𝑏ỏ 𝐻0,𝑐ℎấ𝑝 𝑛ℎậ𝑛 𝐻1 ⇒𝑋 𝑡á𝑐 độ𝑛𝑔 đế𝑛 𝑌
𝐾ℎô𝑛𝑔 𝑡ℎ𝑜ả 𝑚ã𝑛 ⇒𝐶ℎư𝑎 𝑏á𝑐 𝑏ỏ 𝐻0⇒𝑋 𝑘ℎô𝑛𝑔 𝑡á𝑐 độ𝑛𝑔 đế𝑛 𝑌
*Kiểm định sự phù hợp của mô hình hồi quy
Một mô hình hồi quy phù hợp là có ít nhất một biến độc lập giải thích cho biến phụ thuộc, mô
hình không phù hợp là tất cả các biến độc lập đều không giải thích cho biến phụ thuộc
Bước 1: xét cặp giả thuyết {𝐻0∶ 𝑅2= 0 (𝑀ô ℎì𝑛ℎ 𝑘ℎô𝑛𝑔 𝑝ℎù ℎợ𝑝)
𝐻1: 𝑅2≠ 0 (𝑀ô ℎì𝑛ℎ 𝑐ó 𝑝ℎù ℎợ𝑝)
Bước 2: Tính tiêu chuẩn kiểm định: 𝐹𝑞𝑠 = 𝑅2𝐾⁄
(1 − 𝑅)2(𝑛 − 𝑘 − 1) ⁄ Hoặc
𝐹𝑞𝑠 =𝑆𝑆𝑅 𝑘 ⁄
𝑆𝑆𝐸 (𝑛 − 𝑘 − 1) ⁄ 𝐹𝑞𝑠 =𝑀𝑆𝐹 𝑀𝑆𝐸
Bước 3: Điều kiện bác bỏ 𝐻0 𝐹𝑞𝑠 > 𝑓 (𝑘; 𝑛 − 𝑘 − 1) 𝛼
Tra bảng fisher hoặc đề cho sẵn
Nếu thoả mãn điều kiện thì bác bỏ 𝐻0, chấp nhận 𝐻1 ⇒ mô hình có phù hợp
Nếu không thoả mãn điều kiện thì chưa bác bỏ 𝐻0 ⇒ mô hình không phù hợp Chương 7:
- Thời kì: theo tháng, theo năm, theo quý (doanh thu, số lượng, chi phí)
Dãy số thời
- Thời điểm: Theo ngày (Số lao động) gian * 5 chỉ tiêu
- Tính trung bình/ bình quân của dãy số thời kì Ví dụ: Năm 2019 2020 2021 2022 Doanh thu Y 1 tỉ 2 tỉ 1.5 tỉ 2 tỉ
Tính trung bình 𝑦 = ∑𝑦4= 1+2+1.5+2 4
- Tính trung bình/ bình quân của dãy số thời điểm Ví dụ: Ngày 1/1 1/2 13 1/4 Số lao động Y 30 34 40 36
Tính trung bình số lao động của tháng và quý I
Tháng 1: 𝑦 tháng 1 = Đầ𝑢+𝑐 2 𝑢ố = 𝑖 30+34 2
Tháng 2: 𝑦 tháng 2 = Đầ𝑢+𝑐 2 𝑢ố = 𝑖 34+40 2
Tháng 3: 𝑦 tháng 3 = Đầ𝑢+𝑐 2 𝑢ố = 𝑖 40+36 2
Tháng 4 không tính được do không có cuối tháng
Trung bình quý 1= trung bình 3 tháng= 𝑇1+𝑇2+𝑇3 3
- Thời điểm và thời kì đều là số tuyệt đối
- Số tương đối:
+ NSLĐ = 𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢,𝐷𝑜𝑎𝑛ℎ 𝑠ố,𝑆ả𝑛 𝑙ượ𝑛𝑔
𝑆ố 𝑙𝑎𝑜 độ𝑛𝑔
+ NSLĐ Trung bình = ∑𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢
∑𝑆ố 𝑙𝑎𝑜 độ𝑛𝑔
+ Tỷ lệ hoàn thành kế hoạch: 𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢,𝐷𝑜𝑎𝑛ℎ 𝑠ố,𝑆ả𝑛 𝑙ượ𝑛𝑔 𝑡ℎự𝑐 𝑡ế
𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢,𝐷𝑜𝑎𝑛ℎ 𝑠ố,𝑆ả𝑛 𝑙ượ𝑛𝑔 𝑘ế ℎ𝑜ạ𝑐ℎ
+ Tỷ lệ hoàn thành kế hoạch trung bình: ∑𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢,𝐷𝑜𝑎𝑛ℎ 𝑠ố,𝑆ả𝑛 𝑙ượ𝑛𝑔 𝑡ℎự𝑐 𝑡ế
∑𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢,𝐷𝑜𝑎𝑛ℎ 𝑠ố,𝑆ả𝑛 𝑙ượ𝑛𝑔 𝑘ế ℎ𝑜ạ𝑐ℎ
- Có 5 chỉ tiêu:
Tên chỉ tiêu Liên hoàn Định gốc
Mối liên hệ Bình quân (quan trọng nhất) Lượng tăng 𝛿 𝛿=𝑦
𝑖= 𝑦𝑖− 𝑦𝑖−1 ∆𝑖= 𝑦𝑖− 𝑦1 𝑛 𝑛− 𝑦1
giảm tuyệt ∆𝑛=∑𝛿𝑖 𝑛 − 1 𝑖=2 đối 𝑡 𝑇 𝑛
Tốc độ phát 𝑖=𝑦𝑖 𝑖= 𝑦𝑖 = √𝑦𝑛 triển 𝑦𝑖−1 𝑦1 𝑇𝑛=∏𝑡𝑖 𝑡 𝑖=2 𝑦1
Tốc độ tăng 𝑎𝑖= 𝑡1− 1 𝐴𝑖= 𝑇𝑖− 1 𝑎 = 𝑡− 1 giảm 𝐺
Giá trị tuyệt 𝑔𝑖=𝛿𝑖 𝑖= 𝑦1 đối của 1% 𝛿𝑖.100 100 tăng giả =𝑦𝑖−𝑦𝑖−1 m 𝑦𝑖−1 .100 = 𝑦𝑖−1 100
- Bài toán dự báo:
Phương pháp lượng tăng giảm tuyệt đối bình quân: 𝜎 = 𝑦𝑛−𝑦1 𝑛−1 Phương pháp tốc độ 𝑛−1
phát triển bình quân: 𝑡=√𝑦𝑛 𝑦1
Phương pháp dựa vào hàm xu thế (t biến xu thế):
3 kiểu hàm: - Linear (Đường thẳng tuyến tính, bậc nhất): 𝑦 = 𝑏0+ 𝑏1. 𝑡 (k=1)
- Inverse (Nghịch đảo, Hypebol): 𝑦 = 𝑏0+ 𝑏1.1𝑡 (k=1)
- Quadratic (Bậc 2, Parabol): 𝑦 = 𝑏0+ 𝑏1. 𝑡 + 𝑏2. 𝑡2 (k=2)
- Phương trình nào là dự báo chính xác nhất SE = √𝑆𝑆 𝑛 𝐸
−𝑘−1 (sai số hàm hồi quy) SE càng nhỏ thì dự báo càng chính xác ỉ ố ể ờ ố tương đối độ Chương 8: Chỉ
- Ch s phát tri n (th i gian): s ng thái: 𝑦1 số 𝑦0
Có 3 loại chỉ số
- Chỉ số không gian (vd: khu vực HN và khu vực SG): số tương đối không gian: 𝑦𝐴 𝑦𝐵
- Chỉ số kế hoạch: số tương đối kế hoạch
+ Nhiệm vụ kế hoạch (kế hoạch năm nay so với thực tế năm ngoái): 𝑦𝐾𝐻 𝑦0
+ Thực hiện kế hoạch: 𝑦1 𝑦𝐾𝐻
Trong đó: 𝑦0 là năm gốc, 𝑦1là năm báo cáo (năm nghiên cứu)
Mối liên hệ: 𝑦𝐾𝐻
𝑦0.𝑦1𝑦𝐾𝐻 =𝑦1𝑦0
* Chỉ số phát triển
- Chỉ số đơn (Index) + Giá 𝑖𝑝=𝑝1𝑝0
+ Sản lượng 𝑖𝑞=𝑞1𝑞0
- Chỉ số tổng hợp gồm giá và sản lượng
+ Laspayres: 𝐼𝑃𝐿=𝑝1.𝑝0 𝑝0.𝑞0
+ Pascher: 𝐼𝑃𝑝=𝑝1.𝑝1 𝑝0.𝑞1
+ Fisher: 𝐼𝑃𝐹= √𝐼𝑃 𝐿. 𝐼𝑃𝑝
- Bài toán phân tích chỉ số: A= B x C
* Chỉ số tương đối: 𝐴1 𝐴0=𝐵1.𝐵𝐶 0.1𝐶1.𝐵0. 𝐶1 𝐵0. 𝐶0
Doanh thu = Giá x Sản lượng = NSLĐ x Số lao động = NSLĐ bình quân x tổng lao động y p q x f 𝑥 ∑𝑓
* Chỉ số tuyệt đối:
𝐴1− 𝐴0=(𝐵1. 𝐶1− 𝐵0.𝐶1)+ (𝐵0.𝐶1− 𝐵0.𝐶0) - Chú ý: ∑𝑝0.𝑞0=∑𝑝1 𝐿=∑𝑝1. 𝑞0 𝑝0.𝑝0.𝑞0 ∑𝑝0.𝑞0=∑𝑖0. 𝑦0 𝐼𝑃 ∑𝑦0=∑𝑖0.𝑑0 ⇒ 𝑑0=𝑦0∑𝑦0
Trong đó: 𝑑0 là tỷ trọng doanh thu (quyền số) => 𝐼𝑃𝐿 thì quyền số có thể là 𝑞0, 𝑦0, 𝑑0
* Chỉ số không gian:
- Chỉ số đơn
+ Giá: 𝑖𝑝=𝑃𝐴𝑃𝐵
+ Sản lượng: 𝑖𝑝=𝑞𝐴𝑞𝐵
- Chỉ số tổng hợp + Giá: 𝐼𝑝=𝑃𝐴.𝑞
𝑃𝐵.𝑞 (𝑞 = 𝑞𝐴+ 𝑞𝐵)
+ Sản lượng: 𝐼𝑞=𝑝.𝑞𝐴 𝑝.𝑞𝐵
Nếu giá như nhau thì 𝑝𝐴= 𝑝𝐵= 𝑝