














Preview text:
CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ
1. Số tuyệt đối và số tương đối trong thống kê
Số tuyệt đối biểu hiện quy mô khối lượng của hiện tượng trong điều kiện thời gian cụ thể.
Số tuyệt đối thời điểm Số tuyệt đối thời kì
-Số tương đối trong thống kê biểu hiện quan hệ so sánh giữa hai mức độ
của hiện tượng. Đơn vị : lần, %
Có 5 loại số tương đối 2. Các mức độ trung tâm
Số trung bình: f đóng vai trò quyền số Gồm tb cộng và tb nhân
Số trung vị: dùng để thay thế cho tb cộng khi dãy số pp quá lệch hoặc quá ít đơn vị
Mốt : Dùng để bổ sung thay thế cho số tb cộng
Phân vị : Phân vị cung cấp thông tin về phân phối của dữ liệu trên khoảng
từ giá trị nhỏ nhất đến giá trị lớn nhất.
Phân vị mức p là giá trị mà có ít nhất p% số quan sát có giá trị nhỏ hơn
hoặc bằng giá trị phân vị mức p và có ít nhất (100-p)% số quan sát có giá
trị lớn hơn hoặc bằng giá trị phân vị mức p
3. Các mức độ biến thiên Khoảng biến thiên
Độ lệch tuyệt đối bình quân( mean) : Là trung bình cộng của giá trị biến
số và trung bình cộng của các giá trị biến số
Phương sai: cho biết độ biến thiên xung quanh giá trị trung bình
Độ lệch chuẩn( vì do sự phân bổ ko đều nên có độ lệch chuẩn):
cho biết độ biến thiên xung quanh gtri trung bình Với tổng thể: ơ, Với mẫu: S
Bốn tham số này chỉ dùng để so sánh độ biến thiên của hai hiện tượng
cùng loại, có số trung bình bằng nhau.
Hệ số biến thiên: độ biến thiên tương đối xung quanh giá trị trung bình (đơn vị: %)
Công thức (đối với mẫu): cv= S/x.100
CHương 5: điều tra chọn mẫu
1. Xác suất và quy luật phân phối xác suất
Xác suất của một biến cố và xác suất thực nghiệm
→ Quy luật số lớn: Với số lần thử lớn, xác suất thực nghiệm của một
biến cố sẽ tiệm cận với xác suất thực của nó
Biến ngẫu nhiên rời rạc và Biến ngẫu nhiên liên tục
Các tham số đặc trưng của biến ngẫu nhiên là trung bình (kỳ vọng
toán) -E(X) và phương sai – V(X).
giá trị trung bình mà một biến ngẫu nhiên có thể nhận được:
trung bình khả năng khi tung đồng xu nhiều lần sẽ gặp 1,5 mặt ngửa
1/8( 0-1,5) bình+ 3/8(1-1,5) bình + 3/8(2-…
Quy luật phân phối nhị thức B(n,p) Qu
Quy luật phân phối chuẩn : ứng dụng rộng nhất : chiều cao, lượng mưa, điểm thi…
Quy luật phân phối chuẩn hóa:
Quy khoảng cách ( x-E)/ xich ma Tra bảng P( Z<= 0.83)
2. Những vấn đề chung về điều tra chọn mẫu
Chọn mẫu để suy rộng ra toàn bộ hiện tượng tổng thể gồm 2 loại: Suy
rộng số bình quân và suy rộng tỷ lệ
F: % gì đó của cái mẫu đó
Kết cấu mẫu khác với kết cấu tổng thể tức là: Ví dụ, nếu trong mẫu
của bạn, số lượng nữ nhiều hơn nam (so với tỷ lệ tổng thể),
Trường hợp vận dụng của điều tra chọn mẫu: thay thế cho điều tra
toàn bộ; kết hợp với điều tra toàn bộ ; kiểm định giả thuyết thống kê.
Định lý giới hạn trung tâm:
+ mẫu tuân theo quy luật phân phối chuẩn
BT1: Sử dụng thống kê Z để tính xác suất cho bất kỳ 1 giá trị trung bình nào
P( x ngang <1,53) = P(1,53-1,6/ (0,2/ căn 25)=P( Z<-1,75)=P(Z>1,75)
Với tổng thể vô hạn( quá lớn) hoặc mẫu quá nhỏ(<5%)
Với tổng thể hữu hạn:
Kiểu tổng thì lệch ơ nhg mẫu n thì lệch ơ/ căn n ( vì có 2 bên đồ thị)
Số lượng đvi mẫu càng lớn thì suy ra càng chính xác
Nếu tổng thể có phân phối chuẩn, quy mô mẫu có thể nhận bất kỳ giá trị nào
Bậc tự do là số lượng biến tự do
3. Ước lượng kết quả điều tra chọn mẫu
+ Ước lượng khoảng tin cậy c
ủa trung bình( 95%- độ tin cậy trung bình
của tổng thể nằm từ 40-60)
Khoảng tin cậy của 95% của trung bình tổng thể u: tức khi mẫu lặp lại
95% các khoảng tin cậy tạo ra theo cách này sẽ chứa u
BT1: Trường hợp đã biết phương sai của tt: Có +- vì 2 bên đồ thị
Có 3 đơn vị : trung bình mẫu, psai, quy mô mẫu
BT2: Chưa biết phương sai tt và cho độ lệch chuẩn của mẫu S
Không có phân phối chuẩn hóa
Có phương sai lớn hơn pp chuẩn
Bậc tự do càng lớn thì càng giống pp chuẩn hóa
Ước lượng tỷ lệ của tổng thể
Phân phối mẫu của 𝑓 xấp xỉ phân phối chuẩn nếu np > 5 và n(1 – p) > 5.( Ví
dụ có 30 câu hỏi thì mẫu nên là 150)
Tỷ lệ mẫu f: ví dụ tỉ lệ nữ trong 50 bạn neu
Cũng có sai số bình quân chọn mẫu:
CTHUC CHUNG: ƯỚc LƯỢNG = độ lệch chuẩn tb mẫu z bậc 2( phạm vị ss)
Sai số bình quân= độ lệch chuẩn
BT3: Xác định quy mô mẫu
+ Cho phương sai( còn tên khác là độ đồng đều)
sai số bình quân chọn mẫu và phạm vi bình quân chọn mẫu có giống nhau không: Phạm vi ss chọn mẫu
4. Kiểm định giả thuyết thống kê
Chương 6: Phân tích hồi quy- tương quan
I. Một số vấn đề chung về phân tích hồi quy tương quan
Phân tích hồi quy là phân tích mối liên hệ giữa 2 hoặc nhiều biến
+ Hồi quy tuyến tính đơn: phân tích mqh giữa 2 biến y=ax
+ Hồi quy bội: phân tích mqh giữa nhiều biến t= ax+by+cz
Mục đích: dự báo t dựa trên ít nhất 1 x,y,z cho trước
Phân tích tương quan: để xác định ‘có mối quan hệ với nhau không’; đo
cường độ mối quan hệ chứ không cho biết mối liên hệ đó có phải là
nguyên nhân - kết quả hay không.
II. Hồi quy tương quan tuyến tính đơn( người dùng có tần suất xem dưới
x lần/ tuần có nguy cơ hủy follơ cao hơn 60%)
Trình tự tiến hành phân tích HQTQ:
1. Xây dựng mô hình hồi quy: Đây là mô hình gốc
2. Ước lượng mô hình hồi quy
Đường hồi quy luôn đi qua trung bình của x, y.
3. Đánh giá cường độ của mối liên hệ, sự phù hợp của mô hình 3.1 Hệ số xác định
R bình= SSR( sự tdoi của biến độc lập)/SST( sự tdoi của biến phụ thuộc)
R bình =1 tức là Y thay đổi 100% là do X
Căn hệ số xác định= hệ số tương quan Y nón là y ước lượng 3.2 Hệ số tương quan
Đánh giá cường độ của mối liên hệ tương quan tuyết tính
Trung bình bình phương sai số MSE=SSE/(n-2)
4. Kiểm định các hệ số của mô hình hồi quy
Kiểm định ý nghĩa của hệ số hồi quy (b1)
Kiểm định ý nghĩa của hệ số tương quan
Liệu giữa X và Y thực sự có mối liên hệ tương quan tuyến tính?
Kiểm định ý nghĩa của mô hình
Liệu mô hình hồi quy có phù hợp không?
III. Hồi quy tương quan bội
Ei chênh lệch giữa y thực tế và y nón. Hàm y nón được xác định bằng
phương pháp bình phương nhỏ nhất tức tối thiểu chênh lệch thì nó sẽ gần thực tế nhất
Hệ số hồi quy chuẩn hóa: dùng để xác định vai trò tác của các biến động
độc lập tới biến phụ thuộc trong mô hình hồi quy.
Hệ số xác định: dùng để xác định phần trăm thay đổi của biến phụ thuộc
y được giải thích bởi tất cả các biến độc lập xj trong mô hình