

















Preview text:
Chương 1: GIỚI THIỆU VỀ THỐNG KÊ
I, Khái niệm về thống kê
• Thống kê là khoa học về thu thập, tổ chức, trình bày, phân tích, diễn giải dữ
liệu phục vụ quá trình ra quyết định. (Giáo trình Thống kê trong kinh tế và kinh doanh)
• Giáo trình Lý thuyết thống kê:
+ Thống kê học là môn khoa học xã hội nghiên cứu hệ thống các phương
pháp thu thập, xử lý và phân tích các con số (mặt lượng) của những hiện
tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt
chất) trong những điều kiện địa điểm và thời gian cụ thể.
+ Thống kê học đòi hỏi nghiên cứu những hiện tượng số lớn.
+ Đối tượng nghiên cứu của Thống kê học: Là mặt lượng trong mối liên hệ
với mặt chất của các hiện tượng số lớn trong điều kiện thời gian và không gian cụ thể.
• Hiện tượng số lớn:
+ Ví dụ: Có 2 bệnh viện A và B. Ở bệnh viện A trung bình một ngày có 1000
đứa bé được sinh ra, ở bệnh viện B trung bình một ngày có 10 đứa bé được
sinh ra. Thông thường, theo quy luật tự nhiên tỷ lệ bé trai và bé gái sẽ xấp xỉ
103‐104 bé trai trên 100 bé gái. Nhưng có một ngày, tại1bệnh viện, số bé trai
sinh ra nhiều gấp đôi số bé gái. Theo bạn,tại bệnh viện nào có khả năng xảy ra điều này cao hơn.
+ Thông qua nghiên cứu một số đủ lớn các đơn vị cá biệt này, chúng ta sẽ rút
ra được kết luận về bản chất, tính qui luật của sự vật, hiện tượng.
+ Kết luận này có thể sẽ không đúng với từng hiện tượng cá biệt, nhưng nó
phản ánh đúng với hiện tượng số lớn.
II, Các thuật ngữ dùng trong thống kê
1. Tổng thể (Population) & Mẫu (Sample)
- Tổng thể bao gồm toàn bộ các đơn vị thuộc phạm vi đối tượng nghiên cứu.
(Giáo trình Thống kê trong kinh tế và kinh doanh)
- Tổng thể thống kê là một tập hợp những đơn vị, hoặc phần tử cấu tạo thành
hiện tượng, cần được quan sát và phân tích. (Giáo trình Lý thuyết thống kê)
- Ví dụ: Toàn bộ các doanh nghiệp trong thành phố Hà Nội.
- Lưu ý: Xác định chính xác tổng thể thống kê giúp ta xác định rõ giới hạn
về phạm vi của hiện tượng đang là đối tượng nghiên cứu
- Mẫu là một phần của tổng thể.
- Ví dụ: Một mẫu gồm 500 doanh nghiệp trong thành phố Hà Nội.
Phân loại tổng thể
‐ Căn cứ vào sự nhận biết các đơn vị: Tổng thể bộc lộ, tổng thể tiềm ẩn.
• Tổng thể bộc lộ: là tổng thể có ranh giới rõ ràng, các đơn vị của tổng
thể được biểu diễn một cách rõ ràng, dễ xác định.
VD: Số nhân khẩu của một địa phương, số xe máy được cấp đăng ký
trong 1 tháng tại 1 thành phố…
• Tổng thể tiềm ẩn: một tổng thể mà các đơn vị của nó không được
nhận biết một cách trực tiếp, ranh giới của tổng thể không rõ ràng.
VD: Số người mê tín trong một thành phố, tổng thể những người ưa
dùng 1 sản phẩm nào đó…
‐ Căn cứ mục đích nghiên cứu: Tổng thể đồng chất, tổng thể không đồng
chất.• Tổngthểđồngchất:baogồmnhữngđơnvịcócùngchungnhữngđặc
điểm chủ yếu có liên quan đến mục đích nghiên cứu.
VD: Một lớp học có 60 học sinh có độ tuổi từ 20-22.
• Tổng thể không đồng chất: bao gồm những đơn vị khác nhau về loại
hình, khác nhau về những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu.
VD: Một làng quê có người dân độ tuổi từ 10-100.
• Việc phân chia như này có ý nghĩa quan trọng trong việc xác định tính
đại diện của các con số thông kê tính được. Các con số này chỉ có ý
nghĩa , đảm bảo tính đại diện khi được tính ra từ 1 tổng thể đồng chất.
Nếu tính từ 1 tổng thể không đồng chất thì ý nghĩa, tính đại diện của
chúng cho tổng thể cho tổng thể giảm đi rất nhiều, thậm chí không sử dụng được.
‐ Căn cứ vào phạm vi: Tổng thể chung, tổng thể bộ phận.
• Tổng thể chung: bao gồm tất cả các đơn vị của hiện tượng nghiên cứu.
• Tổng thể bộ phận: chỉ chứa đựng một phần của tổng thể chung.
2. Tham số tổng thể chung (Parameters) & Tham số tổng thể mẫu (Statistics)
- Tham số tổng thể chung là mô tả bằng số về một đặc trưng của tổng thể.
- Tham số tổng thể mẫu là mô tả bằng số về một đặc trưng của mẫu. VD:
• Một nghiên cứu gần đây trên một mẫu gồm 450 sinh viên cho thấy thu
nhập bình quân 1 tuần của 1 sinh viên là 32$ là tham số tổng thể mẫu.
• Thu nhập bình quân 1 tuần của 1 sinh viên là 37$ là tham số tổng thể chung
Lưu ý: Các tham số tổng thể mẫu có giá trị khác nhau với các mẫu khác
nhau mặc dù có thể được chọn từ một tổng thể.
3. Biến (Variables) & Dữ liệu (Data)
- Biến là một thuộc tính mô tả sự vật, hiện tượng (tiêu thức thông kê) Ví dụ:
• Doanh thu của doanh nghiệp
• Màu sắc ưa thích của một nhóm khách hàng
- Dữ liệu thường được định nghĩa là một thuật ngữ khoa học bao gồm các
con số, thông tin, các đo lường …
- Dữ liệu thống kê là các sự kiện và số liệu được thu thập và tổng hợp và
phân tích để trình bày và giải thích ý nghĩa của chúng. (Giáo trình Lý thuyết thống kê)
→ Dữ liệu với các giá trị khác nhau liên quan đến một biến Ví dụ:
• Doanh thu theo tỷ đồng trong tháng 7/2022 của 10 doanh nghiệp nào
đó: 1.6, 1.7, 1.55, 1.59, 1.5, 1.58, 1.64, 1.67, 1.58, 1.55
• Màu sắc ưa thích của 5 khách hàng được hỏi: đen, trắng, trắng, vàng, nâu, vàng.
- Dữ liệu thu thập được từ một nghiên cứu cụ thể được gọi là bộ dữ liệu (data set).
Phân loại dữ liệu
• Dữ liệu định tính: dữ liệu bao gồm các nhãn hay tên được sử dụng để
xác định đặc điểm của hiện tượng nghiên cứu. Dữ liệu định tính sử
dụng thang đo định danh hoặc thang đo thứ bậc để đo lường và có thể
ký hiệu bằng các con số hoặc các ký tự.
• Dữ liệu định lượng: dữ liệu bao gồm các con số phản ánh mặt lượng
của hiện tượng nghiên cứu. Dữ liệu định lượng được đo lường bằng
thang đo khoảng hoặc thang đo tỷ lệ.
o Rời rạc (số người, số nguyên,…)
o Liên tục ( chiều cao, cân nặng, số nguyên, số thập phân,…) -Lưu ý:
• Phân tích thống kê phù hợp phải dựa trên dữ liệu là định tính hay định lượng.
• Có nhiều phương pháp và công cụ thống kê dành cho dữ liệu định lượng hơn.
4. Thực thể (Elements) & Quan sát (Observations)
- Thực thể từ đó các dữ liệu được thu thập.
→ Một biến là một đặc tính được quan tâm từ một thực thể
- Một bộ các đo lường được thu thập từ một thực thể cụ thể được gọi là một quan sát.
- Số lượng các dữ liệu trong một bộ dữ liệu chính là số lượng thực thể nhân với số biến.
5. Tiêu thức thống kê, Chỉ tiêu thống kê
-Tiêu thức thống kê: là một khái niệm chỉ đặc điểm của đơn vị tổng thể
được chọn ra để nghiên cứu tùy theo mục đích nghiên cứu khác nhau.
-Trong nghiên cứu thống kê, tiêu thức thống kê còn được gọi là biến.
-Tiêu thức thống kê gồm các loại sau:
• Tiêu thức thực thể: Là loại tiêu thức phản ánh đặc điểm về nội dung
của đơn vị tổng thể. Tùy theo cách biểu hiện mà có 2 loại:
o Tiêu thức thuộc tính: là tiêu thức mà các biểu hiện của nó được
dùng để phản ánh các thuộc tính của đơn vị tổng thể và không
có các biểu hiện trực tiếp bằng con số. Ví dụ: tiêu thức giới
tính, nghề nghiệp, dân tộc, thành phần kinh tế,…
o Tiêu thức thuộc tính có hai loại: Thứ nhất là tiêu thức thuộc tính
có biểu hiện trực tiếp, chẳng hạn như giới tính có hai biểu hiện
nam và nữ. Thứ hai, tiêu thức thuộc tính có biểu hiện gián tiếp,
chẳng hạn như tiêu thức mức sống có biểu hiện gián tiếp qua
thu nhập, diện tích nhà ở,… Các biểu hiện gián tiếp của tiêu
thức thuộc tính gọi là tiêu chí thống kê.
o Tiêu thức số lượng: là tiêu thức phản ánh các đặc điểm về
lượng của đơn vị tổng thể và có biểu hiện trực tiếp bằng con số,
mỗi con số này được gọi là lượng biến. Ví dụ: số nhân khẩu
trong gia đình, tiền lương tháng của người lao động, năng suất lao động,…
• Tiêu thức (cả thuộc tính và số lượng) chỉ có 2 biểu hiện không trùng
nhau trên 1 đơn vị tổng thể gọi là tiêu thức thay phiên. Ví dụ: tiêu
thức giới tính chỉ có 2 biểu hiện không trùng nhau là nam và nữ.
• Tiêu thức thời gian: là loại tiêu thức phản ánh hiện tượng nghiên cứu
theo sự xuất hiện của nó ở thời gian nào. Ví dụ: Có dữ liệu về số
lượng khách du lịch quốc tế đến Việt Nam theo quý trong 5 năm qua
thì “quý” là tiêu thức thời gian.
• Tiêu thức không gian: là loại tiêu thức phản án phạm vi lãnh thổ bao
trùm và sự xuất hiện theo địa điểm của hiện tượng nghiên cứu. Ví dụ:
tiêu thức “tỉnh/thành phố” trong dữ liệu phản ánh giá tri sản xuất công
nghiệp của Việt Nam theo tỉnh/thành phố.
- Chỉ tiêu thống kê là những con số phản ánh mặt lượng gắn với mặt
chất của hiện tượng số lớn trong điều kiện thời gian và địa điểm cụ thể.
-Chỉ tiêu thống kê gồm 2 mặt: khái niệm và mức độ của chỉ tiêu. Mặt khái
niệm của chỉ tiêu bao gồm các định nghĩa và giới hạn về thực thể, thời gian
và không gian. Mức độ của chỉ tiêu là các trị số phản ánh quy mô, quan hệ
so sánh hoặc cường độ của hiện tượng với các đơn vị tính phù hợp.
Ví dụ: Theo niên giám thống kê năm 2010, tổng sản phẩm trong nước (GDP)
của Việt Nam năm 2010 (tính sơ bộ) theo giá thực tế là 1980914 tỷ đồng; số
dân trung bình của Việt Nam năm 2010 là 86927,7 nghìn người và mật độ
dân số cả nước là 263 người/km2 . Với chỉ tiêu dân số trung bình của Việt
Nam năm 2010 là 86927,7 nghìn người thì mặt khái niệm của chỉ tiêu là “số
dân trung bình của Việt Nam năm 2010”, còn mức độ của chỉ tiêu là 86927,7
với đơn vị tính là nghìn người. - Phân loại:
• Theo hình thức biểu hiện: chỉ tiêu hiện vật, chỉ tiêu giá trị
o Chỉ tiêu hiện vật là chỉ tiêu có biểu hiện bằng đơn vị tự nhiên
hoặc đơn vị đo lường quy ước. Ví dụ: số dân (đơn vị “người”),
sản lượng sản phẩm sản xuất (đơn vị “mét” , “tấn”),…
o Chỉ tiêu giá trị là chỉ tiêu có biêu hiện bằng đơn vị tiền tệ như
đồng Việt Nam, đô la Mỹ,… Ví dụ: GDP, giá trị sản xuất công
nghiệp (đơn vị đồng Việt Nam), FDI (đơn vị đô la Mỹ),…
• Theo tính chất biểu hiện: chỉ tiêu tuyệt đối, chỉ tiêu tương đối
o Chỉ tiêu tuyệt đối là chỉ tiêu phản ánh quy mô, khối lượng của
hiện tượng. Ví dụ: Số học sinh lớp 12A, trường THPT Thăng
Long là 50 em là chỉ tiêu tuyệt đối phản ánh quy mô của hiện
tượng, sản lượng vải sản xuất trong tháng 6 năm 2011 của nhà
máy dệt X là 1 triệu mét là chỉ tiêu tuyệt đối phản ánh khối
lượng của hiện tượng.
o Chỉ tiêu tương đối phản ánh mối quan hệ so sánh giữa các mức
độ của hiện tượng. Ví dụ: Tốc độ phát triển doanh thu của
doanh nghiệp A năm 2010 so với năm 2019 là 110%, mật độ
dân số của Việt Nam năm 2010 là 263 người/km2 .
• Theo đặc điểm về thời gian: chỉ tiêu thời kỳ, chỉ tiêu thời điểm
o Chỉ tiêu thời kỳ phản ánh mặt lượng của hiện tượng nghiên cứu
trong một thời kỳ nhất định, phụ thuộc vào độ dài thời kỳ
nghiên cứu. Khi là chỉ tiêu tuyệt đối thì có thể cộng với nhau để
tính chỉ tiêu trong thời kỳ dài hơn. Ví dụ: Doanh thu của doanh
nghiệp A trong quý 1/2010 là 1,2 tỷ đồng, quý 2/2010 là 1 tỷ
đồng, quý 3/2010 là 0,7 tỷ đồng, quý 4/2010 là 1,1 tỷ đồng.
Tổng doanh thu của doanh nghiệp A cả năm 2010 là 4 tỷ đồng.
o Chỉ tiêu thời điểm phản ánh mặt lượng của hiện tượng nghiên
cứu tại1 thời điẻm nhất định, không phụ thuộc vào độ dài của
thời kì nghiên cứu. Thông thường chỉ tiêu này phản ánh nguồn
lực như lao động, vốn,…không thể cộng với nhau để tính chỉ
tiêu trong thời kỳ dài hơn. Ví dụ: số dân VN ngày 1/4/2002 là
79727,4 nhìn nghìn người; số dân VN ngày 1/4/2003 là 80902,4
nghìn người, số dân VN ngày 1/4/2004 là 82031,7 nghìn người.
Từ đây không thể cộng 3 chỉ tiêu trên để ra chỉ tiêu số dân Việt Nam thời kỳ 2002-2004.
• Theo nội dung: chỉ tiêu khối lượng, chỉ tiêu chất lượng
o Chỉ tiêu khối lượng phản ánh quy mô, khối lượng của hiện
tượng nghiên cứu theo thời gian và địa điểm cụ thể. Ví dụ: Số
dân VN vào 0h ngày 1/4/2009 là 85846997 người.
o Chỉ tiêu chất lượng biểu hiện trình độ phổ biến và mối quan hệ
so sánh trong tổng thể. Chỉ tiêu chất lượng có thể là số tương
đối, số bình quân chứ không biểu hiện bằng số tuyệt đối. Ví dụ:
Tổng sản phẩm trong nước bình quân đầu người của Việt Nam
năm 2009 là 1064 USD/người.
III, Thang đo (Measurement Scales)
Dữ liệu được đo lường thông qua các loại thang đo khác nhau. Thang đo sẽ quyết
định dữ liệu được tóm tắt và trình bày như thế nào. Có 4 loại thang đo: định danh
(nominal), thứ bậc (ordinal), khoảng (interval), và tỷ lệ (ratio). (Thấp nhất đến cao nhất).
1. Thang đo định danh (Nominal)
- Thang đo định danh là đánh số các biểu hiện cùng loại của tiêu thức.
- Khi được đo lường bằng thang đo định danh, dữ liệu được biểu hiện bằng
các đặc điểm, tính chất. Giữa các biểu hiện không có quan hệ hơn kém.
- Với loại dữ liệu này, chỉ có thể phân loại các quan sát và đếm số lượng
quan sát theo các biểu hiện.
- Đặc điểm của thang đo này là các con số không có quan hệ hơn kém,
không thực hiện được tất cả các phép tính, chỉ dùng mã hóa và đếm tần
số xuất hiện của từng biểu hiện.
- Ví dụ: Giới tính, nghề nghiệp, tình trạng kết hôn, màu da, tên của sinh
viên trong lớp, tên các quyển sách trong thư viện,…
2. Thang đo thứ bậc (Ordinal)
- Thang đo thứ bậc là thang đo định danh nhưng giữa các biểu hiện của
tiêu thức có quan hệ hơn kém
- Là thang đo mà các biểu hiện của biến định tính có quan hệ thứ bậc, hơn
kém. Khi dữ liệu được đo lường bằng thang đo này, chỉ phân loại và đếm
các quan sát theo các biểu hiện thể hiện thứ tự hơn kém.
- Thang đo thứ bậc có đặc điểm là sự chênh lệch giữa các biểu hiện của
tiêu thức không nhất thiết phải bằng nhau và chưa biết được khoảng cách
giữa các số thứ tự đó gần hay xa bao nhiêu vì vậy không thực hiện được
các phép tính cộng trừ nhân chia mà chỉ nói lên đặc trưng chung của tổng
thể một cách tương đối căn cứ trên sự giải thích “lớn nhất” hay “nhỏ nhất” mà thôi.
- Ví dụ: Xếp loại sinh viên cuối năm học, mức độ hài lòng với dịch vụ của
1 công ty, top 10 bài hát được ưa thích nhất
3. Thang đo khoảng (Interval)
- Thang đo khoảng là thang đo thứ bậc có các khoảng cách đều nhau
nhưng không có điểm gốc là 0
- Thang đo khoảng được biểu hiện bằng con số và có đơn vị đo lường cụ
thể. Với loại thang đo này, khoảng cách giữa các con số là có ý nghĩa.
- Dữ liệu chỉ có thể là dữ liệu định lượng.
- Ví dụ. Nhiệt độ, IQ, điểm …
- Không có điểm gốc 0 tuyệt đối. Nếu có điểm 0 thì đó cũng chỉ là quy
ước. Ví dụ nhiệt độ không khí đo theo độ C, điểm 0oC chỉ là điểm quy
ước tại đó nước đó nước đóng băng. Do chưa có điểm gốc là số 0 nên
không so sánh được tỷ lệ giữa các trị số đo.
- Khoảng cách giữa các biểu hiện là có ý nghĩa nhưng không nên tính tỷ lệ.
- Thang đo này luôn có đơn vị đo và được sử dung cho tiêu thức số lượng.
Từ đó ta có thể thực hiện các phép tính cộng trừ, tính được các đặc trưng
thống kê như trung bình, phương sai…
4. Thang đo tỷ lệ (Ratio)
- Là thang đo khoảng với 1 điểm gốc 0 tuyệt đối (một trị số thật) được coi
là điểm xuất phát của độ dài đo lường trên thang đo.
- Thang đo tỷ lệ được đo lường bằng con số, có đơn vị đo lường cụ thể và
có điểm gốc 0 tuyệt đối. Do có điểm gốc 0, nên có thể giúp so sánh tỷ lệ giữa các trị số đo.
- Dữ liệu chỉ có thể là dữ liệu định lượng.
- Ví dụ: chiều cao, cân nặng, khoảng cách, khoảng thời gian … IV, Loại dữ liệu 1. Dữ liệu chéo
- Dữ liệu chéo được thu thập ở cùng một thời gian. (thu thập nhiều biến và
thực thể trong 1 thời gian)
- Ví dụ: Thu nhập của các hộ gia đình của Việt Nam, GDP bình quân đầu
người của các quốc gia ASEAN,…
2. Dữ liệu chuỗi thời gian
- Dữ liệu chuỗi thời gian được thu thập ở các khoảng thời gian khác nhau.
(thu thập về 1 thực thể và 1 biến trong các thời kỳ)
- Thông thường được thu thập theo định kỳ (cố định khoảng thời gian) ví
dụ dữ liệu theo tuần, theo tháng, theo quý, theo năm …
- Ví dụ: Giá cổ phiếu GDP của Việt Nam trong khoảng thời gian 2000 ‐ 2022
- Dữ liệu chuỗi thời gian yêu cầu các kỹ thuật phân tích khác biệt để phân
tích và so sánh dữ liệu so với dữ liệu chéo 3. Dữ liệu gộp
- Dữ liệu gộp là sự kết hợp của dữ liệu chéo và dữ liệu theo chuỗi thời gian.
- Ví dụ: GDP bình quân đầu người của các quốc gia ASEAN trong giai
đoạn 10 năm từ 2011‐2020.
V, Các nguồn dữ liệu
1. Dựa vào nơi thu thập thông tin
- Dữ liệu nội bộ là dữ liệu được thu thập từ bên trong của tổ chức.
Ví dụ: Số lao động của doanh nghiệp, lương của lao động,…
- Dữ liên bên ngoài là dữ liệu được thu thập từ bên ngoài tổ chức.
Ví dụ: Chỉ số CPI tháng 7/2022 của Việt Nam
2. Dựa trên phương pháp thu thập thông tin
- Dữ liệu sơ cấp là dữ liệu được thu thập bởi chính tổ chức đó do có 1 nhu
cầu cụ thể. Nguồn của dữ liệu sơ cấp: nghiên cứu thực nghiệm, khảo
sát/điều tra, nghiên cứu quan sát,…
Ví dụ: Dữ liệu từ một khảo sát mức độ hài lòng khách hàng của công ty
- Dữ liệu thứ cấp là được thu thập bởi tổ chức khác do nhu cầu khác.
Nguồn của dữ liệu thứ cấp: Internet, dữ liệu chính thức của Chính Phủ và
các cơ quan công quyền, dữ liệu nội bộ.
Ví dụ: Chỉ số PCI các tỉnh/thành phố Việt Nam
VI, Các nhánh của thống kê 1. Thống kê mô tả
- Thống kê mô tả bao gồm các phương pháp thu thập dữ liệu, mô tả và
trình bày dữ liệu bằng bảng, đồ thị, tính toán các đặc trưng của dữ liệu
như trung bình, mốt, trung vị,…
- Thống kê mô tả tập trung vào thu thập, trình bày và tóm tắt bộ dữ liệu
• Thu thập dữ liệu. Ví dụ: điều tra
• Trình bày dữ liệu. Ví dụ: bảng và đồ thị
• Tóm tắt dữ liệu. Ví dụ: số trung bình
- Mục đích: mô tả dữ liệu
2. Thống kê suy luận (suy diễn)
- Thống kê suy luận bao gồm các phương pháp ước lượng, kiểm định giả
thuyết thống kê, phân tích mối liên hệ, dự đoán,… trên cơ sở các dữ liệu
thu thập được từ mẫu điều tra, từ đó đưa ra các thông tin về tổng thể chung.
- Thống kê suy luận sử dụng dữ liệu được thu thập từ một mẫu để đưa ra
kết luận cho một tổng thể.
• Ước lượng. Ví dụ: ước lượng trung bình tổng thể (cân nặng trung
bình) từ cân nặng trung bình của mẫu
• Kiểm định. Ví dụ: kiểm định phát biểu cho rằng trung bình cân nặng của tổng thể là 70 kg
- Suy luận là quá trình đưa ra kết luận hoặc đưa ra quyết định về tổng thể
dựa trên kết quả của mẫu.
Chương 2,3: THU THẬP THÔNG TIN THỐNG KÊ
TRÌNH BÀY DỮ LIỆU THỐNG KÊ
I, Điều tra thống kê 1. Khái niệm
- Điều tra thống kê là việc tổ chức một cách khoa học, theo một kế hoạch
thống nhất việc thu thập, ghi chép nguồn tài liệu ban đầu về hiện tượng
nghiên cứu trong điều kiện thời gian và không gian cụ thể.
2. Các yêu cầu cơ bản của điều tra thống kê
- Chính xác - khách quan các tài liệu thu thập phải phản ánh đúng đắn tình
hình thực tế khách quan của hiện tượng nghiên cứu. Phải được thực hiện
một cách trung thực, khách quan không được tùy tiện thêm bớt, không
được sao chép một cách tùy hứng, không được suy luận, “sáng tạo” ra
các con số theo ý muốn chủ quan của bất kỳ một tổ chức háy cá nhân
nào, nhằm bất cứ mục đích gì.
- Trung thực là yêu cầu được đặt ra cho cả người tổ chức điều tra và người
cung cấp thông tin. Yêu cầu này đòi hỏi người thu thập thông tin phải
tuyệt đối trung thực ghi chép đúng những điều đã được nghe, được thấy.
Đối với những người cung cấp thông tin, yêu cầu này đòi hỏi họ phải
cung cấp những thông tin xác thực, không được che dấu và đặc biệt
nghiêm cấm việc khai man thông tin…
- Kịp thời là các tài liệu của điều tra thống kê phải phản ánh được mọi sự
biến đổi của hiện tượng nghiên cứu đúng lúc cần thiết, đúng hiện tượng
có sự thay đổi về chất và phải phản ánh đầy đủ những bước ngoặt trong
sự biến đổi của hiện tượng nghiên cứu. Thống kê phải cung cấp tài liệu
phục vụ các yêu cầu nghiên cứu đúng lúc cần thiết.
- Đầy đủ là tài liệu được thu thập theo đúng nội dung cần thiết cho việc
nghiên cứu, pahir thu thập thông tin đối với tất cả số đơn vị của hiện
tượng nghiên cứu, không được đếm trùng hay bỏ sót bất kỳ một đơn vị nào.
3. Các loại điều tra thống kê
➢ Phân loại theo tính liên tục
- Điều tra thường xuyên: là việc tiến hành thu thập, ghi chép tài liệu ban
đầu của hiện tượng nghiên cứu một cách liên tục, có hệ thống và thường
theo sát quá trình phát sinh, phát triển, của hiện tượng. Ví dụ: việc tổ
chức chấm công lao động, việc ghi chép số sản phẩm nhập, xuất kho
hàng ngày tại các kho hàng,…
- Điều tra không thường xuyên: là tiến hành thu thập, ghi chép tài liệu ban
đầu của hiện tượng một cách không liên tục, không gắn với quá trình phát
sinh, phát triển của hiện tượng. Ví dụ các cuộc tổng điều tra dân số được
tiến hành 10 năm một lần ở nước ta hiện nay,…
➢ Phân loại theo phạm vi
- Điều tra toàn bộ: Là tiến hành thu thập tài liệu ban đầu trên toàn thể các
đơn vị thuộc đối tượng điều tra, không loại trừ bất kỳ đơn vị nào. Ví dụ
các cuộc tổng điều tra dân số được tiến hành vào ngày 1/4/1989 và
1/2/2009 ở nước ta là các cuộc điều tra toàn bộ.
- Điều tra không toàn bộ: Là tiến hành thu thập tài liệu của một số đơn vị
được chọn ra từ một tổng thể chung. Gồm:
• Điều tra chọn mẫu: Là chỉ tiến hành điều tra ở một số đơn vị thuộc
tổng thể nhưng phải là mẫu thu nhỏ của tổng thể chung. Kết quả
điều tra chọn mẫu suy rộng thành kết quả chung. Ví dụ: để đánh
giá chất lượng sản phẩm được sản xuất ra tại một nhà máy, người
ta chỉ chọn ra một số sản phẩm nhất định trong lô sản phẩm đã
được sản xuất để xem xét chất lượng của chúng,…
• Điều tra trọng điểm: Là điều tra bộ phận chiếm tỷ trọng lớn. Kết
quả không dùng suy rộng cho tổng thể chung mà chỉ để nhận thức
về bộ phận chủ yếu của tổng thể chung. Ví dụ: nghiên cứu tình
hình trồng chè ở Thái Nguyên, cà phê ở Tây Nguyên,…
• Điều tra chuyên đề: Là chỉ tiến hành điều tra ở một vài hoặc thậm
chí một đơn vị nhưng đi sâu nghiên cứu chi tiết nhiều khía cạnh.
Kết quả điều tra nhằm tìm ra nhân tố mới, rút ra bài học kinh nghiệm.
II, Phương án điều tra 1. Khái niệm
- Là tài liệu hướng dẫn thực hiện cuộc điều tra, trong đó xác định cụ thể
những khái niệm liên quan đến việc thực hiện điều tra cần được hiểu
thống nhất, các bước tiến hành và các vấn đề khác có liên quan. 2. Nội dung
- Bao gồm 4 nội dung chủ yếu: Xác định mục đích điều tra; đối tượng điều
tra và đơn vị điều tra; nội dung điều tra; thời điểm điều tra, thời kỳ điều tra, thời hạn điều tra.
III, Đối tượng điều tra, đơn vị điều tra
Khi điều tra trên toàn tổng thể thì đối tượng điều tra là đơn vị điều tra.
1. Đối tượng điều tra (Điều tra ai ?)
- Là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có các dữ liệu cần
thiết khi tiến hành điều tra.
2. Đơn vị điều tra (Điều tra ở đâu?)
- Là từng đơn vị cá biệt thuộc đối tượng điều tra và được xác định là sẽ điều tra thực tế.
- Nơi cung cấp thông tin là đơn vị điều tra
IV, Thời điểm điều tra, thời kỳ điều tra, thời hạn điều tra
1. Thời điểm điều tra
- Là mốc thời gian được xác định để thu thập tài liệu một cách thống nhất
trên tất cả các đơn vị của hiện tượng nghiên cứu.
- Ví dụ: Thời điểm cuộc Tổng điều tra dân số lần thứ tư ở nước ta được xác
định vào 0 giờ ngày 1/4/2009. Như vậy, tổng số dân nước ta có tại cuộc
điều tra này (85846997 người) là chỉ tính những người sinh trước 0 giờ
1/4/2009 và đến thời điểm này đang còn sống.
2. Thời kỳ điều tra
- Là độ dài thời gian có sự tích lũy về mặt lượng của hiện tượng nghiên cứu.
- Ví dụ: Điều tra doanh số của 1 công ty trong hằng năm.
3. Thời hạn điều tra
- Là khoảng thời gian kể từ lúc ban đầu tiến hành điều tra cho đến khi hoàn
thành việc thu thập tài liệu trên tất cả các đơn vị điều tra.
V, Sai số trong thống kê 1. Khái niệm
- Sai số trong điều tra thống kê là chênh lệch giữa trị số thực của hiện
tượng nghiên cứu so với trị số của nó mà điều tra thống kê thu được.
- Sai số này làm giảm chất lượng của các cuộc điều tra, ảnh hưởng đến kết
quả của tổng hợp và phân tích.
2. Phân loại sai số thống kê
- Căn cứ vào tính chất của các sai số, ta có thể phân biệt 2 loại:
➢ Sai số do đăng ký, ghi chép: xảy ra đối với mọi cuộc điều tra thống
kê. Phát sinh do việc đăng ký số liệu ban đầu không chính xác.
Nguyên nhân gây ra loại sai số này rất đa dạng, có thể do cân
đong, đếm sai, tính toán sai, ghi chép sai, do công cụ đo lường
không chuẩn xác,….Ta có thể phân loại sai số này thành sai số
ngẫu nhiên và sai số có hệ thống, do cố ý, có chủ định của người
điều tra và người trả lời.
• Sai số ngẫu nhiên là những sai số phát sinh một cách tình cờ,
không có chủ định, không có bất kỳ một sự sắp đặt trước
nào của nguòi tham gia điều tra. Loại sai số này bị chi phối
bởi quy luật số lớn, tức là nếu ta điều tra càng nhiều đơn vị,
các sai lệch ngẫu nhiên sẽ có khả năng bù trừ, triệt tiêu nhau
làm cho sai số chung càng nhỏ.
• Sai số có hệ thống, có chủ định của người điều tra, người trả
lời hoặc sai số một cách có hệ thống do lỗi của hệ thống đo
lường, hệ thống thang đo được thiết kế một cách không
chuẩn xác,…Loại sai số này không chịu sự chi phối của quy
luật số lớn, nên điều tra càng nhiều, khả năng sai số sẽ càng lớn.
➢ Sai số do tính đại diện chỉ xảy ra trong điều kiện chọn mẫu.
Nguyên nhân là do trong các cuộc điều tra này, người ta chỉ chọn
một số đơn vị để điều tra thực tế. Các đơn vị này không đủ đảm
bảo đại diện cho toàn bộ tổng thể.
- Để đảm bảo các kết quả điều tra đạt độ chính xác cao, cần áp dụng một
số biện pháp để hạn chế sai số:
• Làm tốt công tác chuẩn bị điều tra
• Tiến hành kiểm tra có hệ thống toàn bộ cuộc điều tra
- Ngoài ra, trong các cuộc điều tra chọn mẫu, người ta còn tiến hành kiểm
tra tính đại diện của các đơn vị được chọn ra để điều tra.
VI, Tổng hợp thống kê
1. Một số vấn đề chung của tổng hợp thống kê
a, Khái niệm, ý nghĩa và nhiệm vụ của tổng hợp thống kê
- Khái niệm: Tổng hợp thống kê là tiến hành tập trung, chỉnh lý, hệ thống
hóa một cách khoa học các tài liệu ban đầu thu được trong điều tra thống
kê, nhằm làm cho các đặc trưng riêng biệt về từng đơn vị của hiện tượng
nghiên cứu bước đầu chuyển thành những đặc trưng chun của toàn bộ hiện tượng.
- Nhiệm vụ cơ bản của tổng hợp thống kê là làm cho những đặc trưng
riêng biệt của từng đơn vị tổng thể bước đầu chuyển thành các đặc trưng
chung của toàn bộ tổng thể, làm cho các biểu hiện riêng của tiêu thức
điều tra bước đầu chuyển thành các biểu hiện chung về đặc điểm hiện tượng nghiên cứu
- Ý nghĩa: Tổng hợp thống kê là giai đoạn thứ 2 của quá trình nghiên cứu
thống kê. Nhờ có các số liệu thống kê đã được tổng hợp một cách khoa
học, ta mới có thể rút ra kết luận chính xác về bản chất, tính quy luật của hiện tượng nghiên cứu.
b, Yêu cầu của tổng hợp thống kê
- Xây dựng kế hoạch tổng hợp một cách khoa học
- Dựa trên cơ sở phân tích lý luận để lựa chọn các chi tiêu tổng hợp có ý nghĩa.
- Căn cứ vào điều kiện lịch sử cụ thể.
2. Nội dung tổng hợp
- Là danh mục các biểu hiện của những tiêu thức mà chúng được xác định trong nội dung điều tra.
- Là danh mục các biển hiện của các tiêu thức điều tra được chọn lọc và
theo mỗi biểu hiện chúng được phân chia thành các nhóm khác nhau để
đáp ứng yêu cầu phản ánh các cơ cấu khác nhau phù hợp với mục đích nghiên cứu.
3. Chuẩn bị tài liệu để tổng hợp
4. Phương pháp tổng hợp
- Phân tổ thống kê là phương pháp phân chia các đơn vị của tổng thể vào
các tổ (và tiểu tổ) khác nhau theo từng tiêu thức nghien cứu. Trị số được
tính toán ở mỗi tổ cho ta một cơ cấu về lượng cụ thể của tổng thể.
5. Hình thức tổ chức tổng hợp
a. Tổng hợp từng cấp và tổng hợp tập trung
• Tổng hợp từng cấp là tổ chức tổng hợp tài liệu điều tra theo
từng bước, từ dưới lên cấp trên theo kế hoạch đã vạch sẵn.
• Tổng hợp tập trung là toàn bộ tài liệu điều tra được tập trung
về một nơi để tiến hành tổng đầu đến cuối.
b. Tổng hợp thủ công và tổng hợp bằng máy
• Tổng hợp thủ công là hình thức tổng hợp giản đơn với việc
sử dụng các công cụ như giấy, bút, thước kẻ,…
• Tổng hợp bằng máy là hình thức tổng hợp có sử dụng máy tính điện tử.
6. Kiểm tra các tài liệu đã được tổng hợp
- Phương pháp kiểm tra đơn giản có hiệu quả (với trường hợp xử lý số liệu
bằng máy tính) là đếm và xác định tần suất của mỗi biểu hiện đối với từng câu hỏi.
VII, Phân tích và dự đoán thống kê
Phân tích và dự đoán thống kê là giai đoạn cuối cùng của quá trình nghiên cứu
thống kê. Đây là một vấn đề lớn, bao gồm nhiều nội dung và có nhiều phương pháp khác nhau.
1. Một số vấn đề chung của phân tích dự đoán thống kê
a, Khái niệm, ý nghĩa của phân tích dự đoán thống kê
- Khái niệm: Phân tích và dự đoán thống kê là nêu tên một cách tổng hợp,
qua các biểu hiện về lượng, bản chất, tính quy luật của các hiện tượng và
quá trình kinh tế - xã hội trong điều kiện cụ thể về thời gian và không
gian, đồng thời nêu lên các mức độ của hiện tượng trong tương lai.
- Trước hết, phân tích thống kê là biểu hiện tập trung kết quả của toàn bộ
quá trình nghiên cứu thống kê.
- Phân tích thống kê giúp nêu rõ bản chất, quy luật phát triển của hiện tượng nghiên cứu.
- Phân tích thống kê giúp thấy rõ các mối liên hệ giữa các hiện tượng và
quá trình kinh tế - xã hội, trên cơ sở đó tìm ra nguyên nhân, động lực và
đề ra các giải pháp phát triển.
- Phân tích và dự đoán thống kê giúp hoạch định kế hoạch phát triển trong tương lai.
b, Các nguyên tắc của phân tích dự đoán thống kê
- Phân tích thống kê phải tiến hành trên cơ sở phân tích lý luận kinh tế- xã hội.
- Phân tích thống kê phải căn cứ vào toàn bộ sự kiện và phân tích trong sự
liên hệ ràng buộc lẫn nhau giữa các hiện tượng.
- Đối với các hiện tượng có tính chất và hình thức phát triển khác nhau
phải áp dụng các phương pháp phân tích thống kê khác nhau.
2. Kiểm tra, đánh giá, lựa chọn tài liệu dùng để phân tích dự đoán
3. Các phương pháp phân tích dự đoán
VII, Phân tổ thống kê
1. Những vấn đề chung về phân tổ thống kê
2. Các bước phân tổ thống kê 3. Dãy số phân phối
4. Phân tổ nhiều chiều IX, Bảng thống kê
Document Outline
- I, Khái niệm về thống kê
- II, Các thuật ngữ dùng trong thống kê
- Phân loại tổng thể
- 2.Tham số tổng thể chung (Parameters) & Tham số tổng
- 3.Biến (Variables) & Dữ liệu (Data)
- Phân loại dữ liệu
- 4.Thực thể (Elements) & Quan sát (Observations)
- 5.Tiêu thức thống kê, Chỉ tiêu thống kê
- III, Thang đo (Measurement Scales)
- 1.Thang đo định danh (Nominal)
- 2.Thang đo thứ bậc (Ordinal)
- 3.Thang đo khoảng (Interval)
- 4.Thang đo tỷ lệ (Ratio)
- IV, Loại dữ liệu
- 2.Dữ liệu chuỗi thời gian
- 3.Dữ liệu gộp
- V, Các nguồn dữ liệu
- 2.Dựa trên phương pháp thu thập thông tin
- VI, Các nhánh của thống kê
- 2.Thống kê suy luận (suy diễn)
- 2.Các yêu cầu cơ bản của điều tra thống kê
- 3.Các loại điều tra thống kê
- II, Phương án điều tra
- 2.Nội dung
- III, Đối tượng điều tra, đơn vị điều tra
- 1.Đối tượng điều tra (Điều tra ai ?)
- 2.Đơn vị điều tra (Điều tra ở đâu?)
- IV, Thời điểm điều tra, thời kỳ điều tra, thời hạn
- 2.Thời kỳ điều tra
- 3.Thời hạn điều tra
- V, Sai số trong thống kê
- 2.Phân loại sai số thống kê
- VI, Tổng hợp thống kê
- 2.Nội dung tổng hợp
- 3.Chuẩn bị tài liệu để tổng hợp
- 5.Hình thức tổ chức tổng hợp
- 6.Kiểm tra các tài liệu đã được tổng hợp
- VII, Phân tích và dự đoán thống kê
- 1.Một số vấn đề chung của phân tích dự đoán thống kê