



















Preview text:
HỌC PHẦN TIN HỌC ỨNG DỤNG TRONG THỐNG KÊ 1 NỘI QUY LỚP HỌC
K -Sử dụng điện thoại di động trong lớp
H -Mở các chương trình/phần mềm khác Ô
N ngoài phần mềm GV yêu cầu.
G -Gục xuống bàn/Ngủ trong lớp. 2
CÔNG CỤ HỖ TRỢ HỌC TẬP - Laptop/Desktop
-Bài giảng, video, các phần mềm,…. 3 NỘI DUNG
GIỚI THIỆU CHUNG VỀ TIN HỌC THỐNG KÊ VÀ CSDL 1
QUẢN LÝ DỮ LIỆU TRONG SPSS 2
TRÌNH BÀY DỮ LIỆU THỐNG KÊ BẰNG SPSS 3 4
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ BẰNG SPSS 5
PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN BẰNG SPSS 6
DỰ ĐOÁN THỐNG KÊ BẰNG SPSS 7
MỘT SỐ VẤN ĐỀ CƠ BẢN VỀ STATA 4 Bài 1
GIỚI THIỆU CHUNG VỀ TIN HỌC THỐNG KÊ VÀ CƠ SỞ DỮ LIỆU I II Giới thiệu Cơ sở dữ chung về tin liệu thống học thống kê kê 5 5 Các phần mềm thống kê
Nhập dữ liệu:Webform, Epidata, MSAccess,…
Xử lý dữ liệu: - SPSS, STATA, SAS,. . - R, Python - MINITAB - EVIEW - AMOS, M-PLUS, SMartPLS,… 6 6 MỘT SỐ KHÁI NIỆM
Dữ liệu là những phản ánh khách quan về
thuộc tính (đặc điểm) của các thực thể.
Dữ liệu có thể được mô tả dưới nhiều dạng
khác nhau (các ký tự, ký số, ký hiệu, hình ảnh, âm thanh, video,…). 7 7 MỘT SỐ KHÁI NIỆM
Dữ liệu thống kê là dữ liệu về các đối tượng
điều tra (cá nhân, hộ gia đình, tổ chức,
doanh nghiệp,…) được thu thập thông qua
các cuộc điều tra thống kê. 8 8 Dữ liệu thống kê Các loại/dạng dữ liệu
Dữ liệu chéo – cross data
Dữ liệu chuỗi/thời gian – time serial data
Dữ liệu tổng hợp/mảng – Pannel data 9 9 1. Thiết lập CSDL
Cơ sở dữ liệu (định nghĩa kiểu kĩ thuật): là
một tập hợp thông tin có cấu trúc. 10 10 Thành phần của CSDL
•Quan sát (Observation): chứa thông tin về 1
đối tượng điều tra/thời gian nghiên cứu
•Biến (variable): thể hiện các thuộc tính của quan sát 11 11
Phân loại biến theo số lượng câu trả lời
Biến một trả lời (câu hỏi lựa chọn)
Biến nhiều trả lời (câu hỏi tuỳ chọn) 12 12 Biến một trả lời
Câu hỏi 1: Hãy cho biết bạn ở nhóm tuổi nào trong số những nhóm tuổi sau: Nhóm tuổi code Dưới 18 1 18 đến 30 2 31 đến 40 3 41 đến 50 4 Trên 50 5
Mỗi câu hỏi sẽ hình thành một biến với các giá trị tương ứng 13 13 Biến nhiều trả lời
Câu hỏi 2: Nói đến thuốc lá, bạn biết được những nhãn hiệu
nào trong danh sách liệt kê dưới đây: Nhãn hiệu code Vinataba 1 Marlboro 2 KENT 3 JET 4
Mỗi biểu hiện sẽ hình thành một biến với 2 giá trị (có và không) 14 14 Thiết lập CSDL Biến định tính
•Thang đo định danh (nominal scale)
•Thanh đo thứ bậc (ordinal scale) Biến định lượng
•Thang đo khoảng (interval scale)
•Thang đo tỷ lệ (ratio scale) 15 15
Các yếu tố cơ bản của biến -Tên biến
-Loại biến (số, chuỗi, ngày)
-Nhãn biến –dùng để giải thích rõ tên biến
-Nhãn giá trị -dùng để giải thích cho các các giá trị
gán cho từng biểu hiện của dữ liệu 16 16
PHẦN MỀM NHẬP DỮ LIỆU EPIDATA 17
MỘT SỐ LỢI THẾ CỦA EPIDATA
•Phần mềm hoàn toàn miễn phí
•Dễ sử dụng (thân thiện)
•Thiết lập các ràng buộc dễ dàng
•Thiết lập bước nhảy đơn giản
•Xuất dữ liệu sang các phần mềm khác đơn giản (giữ
nguyên thuộc tính dữ liệu – nhãn biến, nhãn giá trị,…) 18
MỘT SỐ HẠN CHẾ CỦA EPIDATA
• Không sử dụng được tiếng Việt theo chuẩn Unicode, mà
phải sử dụng font chữ theo chuẩn TCVN3
• Các nút, di chuyển, tìm kiếm khó khăn • Giao diện không đẹp 19 Cài đặt Epidata
•Địa chỉ download phần mềm www.epidata.dk 20