Bài tập phân tích dữ liệu | Trường Đại học Kinh tế – Luật, Đại học Quốc gia Thành phố Hồ Chí Minh

Bảng dữ liệu biến bdrms có tổng 88 quan sát, trong đó giá trị bdrms = 3 xuất hiện nhiều nhất 42 lần và giá trị bdrms = 6 và bdrms = 7 xuất hiện ít nhất 1 lần. Sự chênh lệch giữa 2 giá trị là 42 lần. Tài liệu giúp bạn tham khảo, ôn tập và đạt kết quả cao. Mời đọc đón xem!

lOMoARcPSD| 46663874
MỤC LC
PHẦN I: MÔ TẢ DỮ LIỆU ...................................................................................................................... 2
PHẦN II: MÔ TẢ CÁC BIẾN TRONG DỮ LIỆU ........................................................................................ 2
2.1. Biến định lượng......................................................................................................................... 2
2.2. Biến định nh ............................................................................................................................ 5
2.3. Mô tả bằng hình ........................................................................................................................ 6
lOMoARcPSD| 46663874
2
Phần mềm sử dụng: STATA
PHẦN I: MÔ TẢ DỮ LIỆU
Bộ dữ liệu gồm 10 biến, 88 quan sát.
DỮ LIỆU
BIN
THANG ĐO
Dữ liệu định nh
bdrms
Thang đo định danh
colonial
Thang đo định danh
Dữ liệu định lượng
price
Thang đo tỷ lệ
assess
Thang đo tỷ lệ
lotsize
Thang đo tỷ lệ
sqr
Thang đo tỷ lệ
lprice
Thang đo tỷ lệ
lassess
Thang đo tỷ lệ
llotsize
Thang đo tỷ lệ
lsqr
Thang đo tỷ lệ
PHẦN II: MÔ TẢ CÁC BIẾN TRONG DỮ LIỆU
2.1. Biến định lượng
2.1.1. Biến price
lOMoARcPSD| 46663874
3
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 293.546
Độ lệch chuẩn (Std.dev.): 102.7134
Giá trị nhnhất (Min): 111 Giá
trị lớn nhất (Max): 725
2.1.2. Biến assess
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 315.7364
Độ lệch chuẩn (Std.dev.): 95.31444
Giá trị nhnhất (Min): 198.3
Giá trị lớn nhất (Max): 708.6
2.1.3. Biến lotsize
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 9019.864
Độ lệch chuẩn (Std.dev.): 10174.15
Giá trị nhnhất (Min): 1000
Giá trị lớn nhất (Max): 92681
lOMoARcPSD| 46663874
4
2.1.4. Biến sqr
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 2013.693
Độ lệch chuẩn (Std.dev.): 577.1916
Giá trị nhnhất (Min): 1171 Giá
trị lớn nhất (Max): 3880
2.1.5. Biến lprice
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 5.63318
Độ lệch chuẩn (Std.dev.): 0.3035726
Giá trị nhnhất (Min): 4.70953
Giá trị lớn nhất (Max): 6.586172
2.1.6. Biến lassess
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 5.717994
Độ lệch chuẩn (Std.dev.): 0.2621131
Giá trị nhnhất (Min): 5.291796
lOMoARcPSD| 46663874
5
Giá trị lớn nhất (Max): 6.563291
2.1.7. Biến llotsize
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 8.905105
Độ lệch chuẩn (Std.dev.): 0.5440602
Giá trị nhnhất (Min): 6.097755
Giá trị lớn nhất (Max): 11.43692
2.1.8. Biến lsqr
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 7.57261
Độ lệch chuẩn (Std.dev.): 0.2586883
Giá trị nhnhất (Min): 7.065613
Giá trị lớn nhất (Max): 7.263591
2.2. Biến định nh
2.2.1. Biến bdrms
lOMoARcPSD| 46663874
6
Bảng dữ liệu biến bdrms tổng 88 quan sát, trong đó giá trị bdrms = 3 xuất hiện
nhiều nhất 42 lần và giá trị bdrms = 6 và bdrms = 7 xuất hiện ít nhất 1 lần. Sự chênh
lệch giữa 2 giá trị là 42 lần.
2.2.2. Biến colonial
Bảng dữ liệu biến bdrms có tổng 88 quan sát, biến này có 2 giá trị colonial = 0 và
colonial = 1. Sự chênh lệch giữa 2 giá trị là 2.3 lần.
2.3. Mô tả bằng hình
lOMoARcPSD| 46663874
7
- Đồ thị đạt mode tại mức giá 200 với tần suất 32.
- Price phân phối không đều và biểu đồ lệch phải
- Xuất hiện một giá trị lớn hơn 700 khiến cho Range của biểu đồ ng lên, từ đó
ảnh hưởng đến đại lượng đo lường mức độ phân tán là Mean.
lOMoARcPSD| 46663874
8
- Đồ thị đạt mode tại giá trị định giá là 300 với tần số 32.
- Đa số các giá trị định giá nằm vùng lớn ở phía trái biểu đồ. Theo đó, có rất ít
giá trị xuất hiện về phía cuối của biểu đồ, chỉ rải rác. Đồ thị lệch phải rất nặng.
- Xuất hiện một giá trị lớn hơn 700 khiến cho Range của biểu đồ ng lên, từ đó
ảnh hưởng đến đại lượng đo lường mức độ là Mean.
- Nhìn chung, giá trị định giá nhà có hiệu suất không ổn định và thỉnh thoảng
xuất hiện một số lần có giá định giá lớn mà thôi (bởi vì đa số giá trị đều tập
trung trong khoảng giá trị nhỏ đầu ên bên phía trái đồ thị).
lOMoARcPSD| 46663874
9
- Tỷ lệ về số lượng phòng ngủ giữa các căn nhà có sự chênh lệch lớn, trong đó
số căn nhà có 3 phòng ngủ đạt tỷ lệ lớn nhất (47,73%), kế đến là số căn nhà có
4 phòng ngủ (37,5%).
- Số lượng căn nhà có 6 và 7 phòng ngủ chiếm tỷ lệ ít nhất.
lOMoARcPSD| 46663874
10
- Nhìn vào biểu đồ ta thấy được mô tả tỷ lệ các thành phần trong một tổng thể
Colonial gồm có hai đặc nh “0” và “1” (lần lượt đại diện cho việc căn nhà
không có phong cách colonial và có phong cách colonial)
- Tỷ lệ căn nhà có phong cách colonial cao hơn hẳn so với bên còn lại, đạt
69,32% (cao hơn 38,64% so với căn nhà không có phong cách colonial).
| 1/10

Preview text:

lOMoAR cPSD| 46663874 MỤC LỤC
PHẦN I: MÔ TẢ DỮ LIỆU ...................................................................................................................... 2
PHẦN II: MÔ TẢ CÁC BIẾN TRONG DỮ LIỆU ........................................................................................ 2
2.1. Biến định lượng......................................................................................................................... 2
2.2. Biến định tính ............................................................................................................................ 5
2.3. Mô tả bằng hình ........................................................................................................................ 6 lOMoAR cPSD| 46663874
Phần mềm sử dụng: STATA
PHẦN I: MÔ TẢ DỮ LIỆU
Bộ dữ liệu gồm 10 biến, 88 quan sát. DỮ LIỆU BIẾN THANG ĐO bdrms Thang đo định danh Dữ liệu định tính colonial Thang đo định danh price Thang đo tỷ lệ assess Thang đo tỷ lệ lotsize Thang đo tỷ lệ sqrft Thang đo tỷ lệ Dữ liệu định lượng lprice Thang đo tỷ lệ lassess Thang đo tỷ lệ llotsize Thang đo tỷ lệ lsqrft Thang đo tỷ lệ
PHẦN II: MÔ TẢ CÁC BIẾN TRONG DỮ LIỆU 2.1. Biến định lượng 2.1.1. Biến price 2 lOMoAR cPSD| 46663874
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 293.546
Độ lệch chuẩn (Std.dev.): 102.7134
Giá trị nhỏ nhất (Min): 111 Giá trị lớn nhất (Max): 725 2.1.2. Biến assess
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 315.7364
Độ lệch chuẩn (Std.dev.): 95.31444
Giá trị nhỏ nhất (Min): 198.3
Giá trị lớn nhất (Max): 708.6 2.1.3. Biến lotsize
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 9019.864
Độ lệch chuẩn (Std.dev.): 10174.15
Giá trị nhỏ nhất (Min): 1000
Giá trị lớn nhất (Max): 92681 3 lOMoAR cPSD| 46663874 2.1.4. Biến sqrft
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 2013.693
Độ lệch chuẩn (Std.dev.): 577.1916
Giá trị nhỏ nhất (Min): 1171 Giá
trị lớn nhất (Max): 3880 2.1.5. Biến lprice
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 5.63318
Độ lệch chuẩn (Std.dev.): 0.3035726
Giá trị nhỏ nhất (Min): 4.70953
Giá trị lớn nhất (Max): 6.586172 2.1.6. Biến lassess
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 5.717994
Độ lệch chuẩn (Std.dev.): 0.2621131
Giá trị nhỏ nhất (Min): 5.291796 4 lOMoAR cPSD| 46663874
Giá trị lớn nhất (Max): 6.563291 2.1.7. Biến llotsize
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 8.905105
Độ lệch chuẩn (Std.dev.): 0.5440602
Giá trị nhỏ nhất (Min): 6.097755
Giá trị lớn nhất (Max): 11.43692 2.1.8. Biến lsqrft
Số lượng quan sát (Obs): 88
Trung bình cộng (Mean): 7.57261
Độ lệch chuẩn (Std.dev.): 0.2586883
Giá trị nhỏ nhất (Min): 7.065613
Giá trị lớn nhất (Max): 7.263591 2.2. Biến định tính 2.2.1. Biến bdrms 5 lOMoAR cPSD| 46663874
Bảng dữ liệu biến bdrms có tổng 88 quan sát, trong đó giá trị bdrms = 3 xuất hiện
nhiều nhất 42 lần và giá trị bdrms = 6 và bdrms = 7 xuất hiện ít nhất 1 lần. Sự chênh
lệch giữa 2 giá trị là 42 lần. 2.2.2. Biến colonial
Bảng dữ liệu biến bdrms có tổng 88 quan sát, biến này có 2 giá trị colonial = 0 và
colonial = 1. Sự chênh lệch giữa 2 giá trị là 2.3 lần. 2.3. Mô tả bằng hình 6 lOMoAR cPSD| 46663874
- Đồ thị đạt mode tại mức giá 200 với tần suất 32.
- Price phân phối không đều và biểu đồ lệch phải
- Xuất hiện một giá trị lớn hơn 700 khiến cho Range của biểu đồ tăng lên, từ đó
ảnh hưởng đến đại lượng đo lường mức độ phân tán là Mean. 7 lOMoAR cPSD| 46663874
- Đồ thị đạt mode tại giá trị định giá là 300 với tần số 32.
- Đa số các giá trị định giá nằm vùng lớn ở phía trái biểu đồ. Theo đó, có rất ít
giá trị xuất hiện về phía cuối của biểu đồ, chỉ rải rác. Đồ thị lệch phải rất nặng.
- Xuất hiện một giá trị lớn hơn 700 khiến cho Range của biểu đồ tăng lên, từ đó
ảnh hưởng đến đại lượng đo lường mức độ là Mean.
- Nhìn chung, giá trị định giá nhà có hiệu suất không ổn định và thỉnh thoảng
xuất hiện một số lần có giá định giá lớn mà thôi (bởi vì đa số giá trị đều tập
trung trong khoảng giá trị nhỏ đầu tiên bên phía trái đồ thị). 8 lOMoAR cPSD| 46663874
- Tỷ lệ về số lượng phòng ngủ giữa các căn nhà có sự chênh lệch lớn, trong đó
số căn nhà có 3 phòng ngủ đạt tỷ lệ lớn nhất (47,73%), kế đến là số căn nhà có 4 phòng ngủ (37,5%).
- Số lượng căn nhà có 6 và 7 phòng ngủ chiếm tỷ lệ ít nhất. 9 lOMoAR cPSD| 46663874
- Nhìn vào biểu đồ ta thấy được mô tả tỷ lệ các thành phần trong một tổng thể
Colonial gồm có hai đặc tính “0” và “1” (lần lượt đại diện cho việc căn nhà
không có phong cách colonial và có phong cách colonial)
- Tỷ lệ căn nhà có phong cách colonial cao hơn hẳn so với bên còn lại, đạt
69,32% (cao hơn 38,64% so với căn nhà không có phong cách colonial). 10