Buổi 4 Tính các số đo biến thiên môn Kinh tế vĩ | Trường đại học kinh doanh và công nghệ Hà Nội
Variance hay còn gọi là phương sai để đo lường mức độ phân tán củacác giá trị trong một tập dữ liệu. Nó đo độ lệch của mỗi điểm dữ liệu so với giá trị trung bình của toàn bộ tập dữ liệu.Variance cho biết mức độ đồng nhất hoặc không đồng nhất của các giá trị trong một tập dữ liệu. Khi variance thấp nghĩa là các giá trị trong tập dữ liệu gần nhau và không chênh lệch nhiều. Ngược lại, khi variance cao, các giá trị trong tập dữ liệu có sự chênh lệch lớn. Tài liệu giúp bạn tham khảo, ôn tập và đạt kết quả cao. Mời đọc đón xem!
Môn: Kinh tế vĩ mô(HUBT)
Trường: Đại học Kinh Doanh và Công Nghệ Hà Nội
Thông tin:
Tác giả:
Preview text:
lOMoAR cPSD| 48599919
Buổi 4: Tính các số đo độ biến thiên A – LÝ THUYẾT
1. range = giá trị lớn nhất – giá trị nhỏ nhất
2. variance (phương sai) và standard deviation ( độ lệch chuẩn )
Hai tập dữ liệu có thể cùng các giá trị mean, median và mode, tuy nhiên vẫn khác nhau ở các góc
độ khác. Và một trong số đó là độ biến thiên ( Variation).
Ví dụ xem xét chiều cao của các bạn học sinh ở độ tuổi từ 15-17 tuổi của 2 trường phổ thông đều
có cùng mean, median và mode tuy nhiên độ biến thiên về chiều cao của các các bạn học sinh là
khác nhau; trường A có sự đồng đều hơn (độ biến thiên thấp), trường B có độ biến thiên cao hơn.
Và chúng ta có thể dùng Variance (phương sai) và Standard Deviation(độ lệch chuẩn) để đo.
Variance hay còn gọi là phương sai để đo lường mức độ phân tán của các giá trị trong một tập dữ
liệu. Nó đo độ lệch của mỗi điểm dữ liệu so với giá trị trung bình của toàn bộ tập dữ liệu.Variance
cho biết mức độ đồng nhất hoặc không đồng nhất của các giá trị trong một tập dữ liệu. Khi variance
thấp nghĩa là các giá trị trong tập dữ liệu gần nhau và không chênh lệch nhiều. Ngược lại, khi
variance cao, các giá trị trong tập dữ liệu có sự chênh lệch lớn
2.1. Variance & Standard Deviation (Population Theoretical Model)
a. Population variance N
b. Population standard deviation √ σ= ∑(X−μ)2 N
2.2. Variance & Standard Deviation (Sample Theoretical Model) a. Sample variance s
b. Sample standard deviation s
2.3. Variance & Standard Deviation (Shortcut or Computational Formulas – Rule of thumb) lOMoAR cPSD| 48599919 a. Sample variance s n(n−1)
b. Sample standard deviation s
3 . Độ đo của Variation: Coefficient of Variation (cVar ) s cVar = X .100 % trong đó, s : Standard Deviation X: mean
2.4 . Range rule of thumb range s
3. Định lý Chebyshev
Định lý Chebyshev được sử dụng để phát biểu về phần trăm của các số hạng sẽ nằm trong
một con số cụ thể của độ lệch chuẩn tính từ giá trung bình Định lý Chebyshev
• Tối thiểu (1-1/Z2 ) của các số hạng có trong mọi tập dữ liệu sẽ phải nằm trong Z
độ lệch chuẩn tính từ số trung bình, khi Z > 1. Hay 1
• Prob x−zs<x<x+zx >= 1- 2 z
Đối với mọi tập dữ liệu
• Prob x - 2s x x 2s 75%
• Prob x -3s x x 3s 88.89%
• Prob x - 4s x x 4s 93.75%
Đối với mọi tập dữ liệu có phân phối dạng hình chuông:
• Prob x - 1s x x 1s 68%
• Prob x -2s x x 2s 95%
• Prob x - 3s x x 3s 99.7% B – BÀI TẬP lOMoAR cPSD| 48599919 Phần I
Câu 1. Có 3 tập dữ liệu có cùng giá trị mean và range. Tính giá trị độ lệch chuẩn
(standard deviation). Giả sử các giá trị này lấy từ tập mẫu (samples). a 5 7 9 11 13 15 17 b 5 6 7 11 15 16 17 c 5 5 5 11 17 17 17
Câu 2. Số liệu thống kê về việc tăng thuế với thuốc lá của 17 bang nước Mỹ. Sủ dụng
quy tắc range để ước tính độ lệch chuẩn, sau đó sử dụng công thức tính độ lệch chuẩn để
tính toán lại và so sánh 2 giá trị trên 60 20 40 40 45 12 34 51 30 70 42 31 69 32 8 18 50
Phần II – Tìm các giá trị mean, mode, median, range, standard deviation và Cvar để so
sánh độ biến thiên 2 tập dữ liệu
Câu 3. Diện tích của 6 bang phía Đông và 6 bang phía Tây nước Mỹ được liệt kê dưới
đây. Hãy cho biết tập nào có tính biến thiên cao hơn?
Diện tích 6 bang miền Đông PA 28.995 FL 37.534 NY 31.361 VA 27.087 ME 20.966 GA 37.741
Diện tích 6 bang miền Tây AZ 72.964 NV 70.763 CA 101.510 OR 62.161 CO 66.625 UT 54.339
Câu 4. Thống kê 13 tòa nhà cao nhất của 2 thành phố Houston và Pittsburgh. Hãy cho
biết, dữ liệu của thành phố nào có độ biến thiên cao hơn. Houston
75 , 71, 64, 56, 53, 55, 47, 55, 52, 50, 50, 50, 47 Pittsburgh
64 , 54, 40, 32, 46, 44, 42, 41, 40, 40, 34, 32, 30
Câu 5. Mức lương của giáo viên bậc Trung học phổ thông (tính bằng USD) của các nước
châu Âu và châu Á được thống kê bên dưới. Hãy cho biết dữ liệu của châu lục nào có độ biến thiên cao hơn. Europe Asia Sweden 48.704 Korea 26.852 Germany 41.441 Japan 23.493 Spain 32.679 India 18.247 Finland 32.136 Malaysia 13.647 lOMoAR cPSD| 48599919 Denmark 30.384 Philippines 9.857 Netherlands 29.326 Thailand 5.862 Scotland 27.789
Phần III – Tính phương sai (variance) và độ lệch chuẩn (standard deviation), CVar
Câu 6. Thống kê của một tổ chức tiêu dùng về giá giặt đồ tại các cửa tiệm theo loại bột
giặt mà khách hàng chọn. Kết quả thống kê được mô tả trong bảng phân bố tần số bên dưới. Lớp Tần số 13–19 2 20–26 7 27–33 12 34–40 5 41–47 6 48–54 1 55–61 0 62–68 2
Câu 7. Một thí nghiệm thực hiện với 80 viên pin để đo tuổi thọ của chúng (tính bằng
giờ). Dưới đây là bảng phân bố tần số của thí nghiệm. Class boundaries Frequency 62.5 – 73.5 5 73.5 – 84.5 14 84.5 – 95.5 18 95.5 – 106.5 25 106.5 – 117.5 12 117.5 – 128.5 6
Câu 8. Tính Cvar của 2 tập dữ liệu, so sánh xem tập dữ liệu nào có độ biến thiên lớn hơn.
Người ta nghiên cứu tại công ty Three Rivers Corp và đo được 2 biến sau: •
Thâm niên trung bình của kế toán là 26 năm và độ lệch chuẩn là 6 năm •
Lương trung bình của kế toán là 31.000$ với độ lệch chuẩn là
4.000$ Phần IV – Định lý Chebyshev
Câu 9. Giải các bài tập sau đây cho một phân phối với trung bình là 80 với độ lệ chuẩn là 108.
a. Ít nhất bao nhiêu phần trăm giá trị sẽ nằm giữa 60 và 100.
b. Ít nhất bao nhiêu phần trăm giá trị sẽ nằm giữa 65 và 95.
Câu 10. Người Mỹ giành trung bình 3 giờ mỗi ngày để online, giả sử độ lệch chuẩn là 32
phút. Hãy tìm phạm vi mà ít nhất 88,89% dữ liệu sẽ nằm trong đó.