


Preview text:
Median hay số trung vị (median) là gì ?
1. Trung vị (median) được hiểu như thế nào?
Trong tiếng Anh, trung vị là Median. Trung vị là số nằm giữa trong một tập dữ
liệu có các số được sắp xếp. Để xác định giá trị trung vị trong một chuỗi số,
trước tiên các số phải được sắp xếp theo thứ tự giá trị từ thấp nhất đến cao
nhất hoặc cao nhất đến thấp nhất. Trung vị có thể được sử dụng để xác định
giá trị trung bình gần đúng hoặc giá trị trung bình, tuy nhiên không được
nhầm lẫn trung vị với giá trị trung bình thực tế.
Nếu tập dữ liệu có số lượng điểm dữ liệu là lẻ, trung vị là số nằm ở giữa có
cùng một số lượng điểm dữ liệu ở bên dưới và bên trên.
Nếu tập dữ liệu có số lượng điểm dữ liệu là chẵn, để tìm giá trị trung vị cần
xác định cặp điểm dữ liệu ở giữa sau đó cộng 2 số này lại và chia cho hai.
Trung vị được sử dụng thay cho giá trị trung bình khi có các điểm ngoại lai
trong chuỗi dữ liệu, các điểm ngoại lai có thể làm lệch giá trị trung bình của
các giá trị. Trung vị của một chuỗi ít bị ảnh hưởng bởi các điểm ngoại lai hơn giá trị trung bình.
Để Median dễ hiểu hơn, có thể thông qua ví dụ sau:
Giả sử ta có một căn phòng với 19 người nghèo và 1 tỷ phú. Các người này
đã bỏ tất cả số tiền trong túi của họ ra và đặt lên một cái bàn. Trong đó, mỗi
người nghèo đặt 5 đồng lên bàn và người tỉ phú đặt 1 tỷ đồng (109 đồng) lên
bàn. Tổng số tiền lúc này là 1.000.000.095 đồng.
Nếu chúng ta chia đều số tiền này cho 20 người, mỗi người sẽ nhận được số
tiền là 50.000.004 đồng và 75 xu. Số tiền này trung bình cho mỗi người trong
phòng. Tuy nhiên, số trung vị của số tiền này lại là 5 đồng. Điều này có nghĩa
là, chúng ta có thể chia thành 2 nhóm, mỗi nhóm có 10 người và nói rằng,
người trong nhóm thứ nhất đưa ra số tiền không nhiều hơn 5 đồng, và người
trong nhóm thứ hai đưa ra số tiền không ít hơn 5 đồng.
Như vậy, số trung vị là số tiền mà một người đại diện trong số các người
trong căn phòng này mang đến. Trái lại, giá trị trung bình không điển hình một
chút nào, bởi vì không ai, bao gồm cả người nghèo và tỉ phú, đã đưa ra một
số tiền gần bằng 50.000.004,75 đồng. Do đó, số trung vị là một phép đo trung
tâm tốt hơn giá trị trung bình trong trường hợp này để mô tả số tiền mà một
người điển hình mang đến.
2. Các đặc điểm của trung vị
Dưới đây là một số đặc điểm của số trung vị:
- Số trung vị không bị ảnh hưởng bởi các giá trị ngoại lệ (outlier) trong tập dữ
liệu. Các giá trị ngoại lệ thường là các giá trị cực đại hoặc cực tiểu của tập dữ
liệu, có thể là do lỗi đo lường hoặc ghi nhận sai sót. Vì vậy, khi tính toán số
trung vị, các giá trị ngoại lệ không ảnh hưởng đến kết quả cuối cùng.
- Số trung vị là một giá trị dễ hiểu và dễ sử dụng trong các phép tính toán
khác. Vì nó được tính toán bằng cách chọn giá trị nằm ở giữa của tập dữ liệu,
số trung vị có thể dễ dàng được tính toán và sử dụng trong các phép tính
toán khác như phương sai, độ lệch chuẩn, ...
- Số trung vị thường được sử dụng trong các tập dữ liệu có phân phối không
đối xứng. Trong trường hợp phân phối không đối xứng, giá trị trung bình có
thể không phản ánh đúng giá trị trung tâm của tập dữ liệu, vì nó bị ảnh hưởng
bởi các giá trị ngoại lệ. Trong khi đó, số trung vị sẽ phản ánh được giá trị
trung tâm của tập dữ liệu một cách chính xác hơn.
- Số trung vị không thể được tính toán cho tập dữ liệu không thứ tự hoặc
không có thứ tự. Do đó, nếu muốn tính toán số trung vị, tập dữ liệu phải được
sắp xếp theo thứ tự tăng dần hoặc giảm dần. 3. Cách tìm median
Để xác định số trung vị của một tập hợp các giá trị, ta thực hiện các bước sau:
- Sắp xếp các giá trị trong tập hợp theo thứ tự tăng dần hoặc giảm dần.
- Nếu số lượng phần tử trong tập hợp là số lẻ, số trung vị sẽ là giá trị ở giữa
của tập hợp. Nếu số lượng phần tử là số chẵn, số trung vị sẽ là trung bình
của hai giá trị ở giữa.
Ví dụ, giả sử ta có tập hợp các giá trị sau: 2, 4, 5, 7, 8, 10. Để tìm số trung vị
của tập hợp này, ta thực hiện các bước sau:
- Sắp xếp các giá trị: 2, 4, 5, 7, 8, 10 -> 2, 4, 5, 7, 8, 10
- Vì số lượng phần tử là số chẵn, ta lấy trung bình của hai giá trị ở giữa: (5 + 7) / 2 = 6
Vậy số trung vị của tập hợp giá trị này là 6.
Nếu tập hợp có nhiều giá trị trùng nhau ở giữa, thì số trung vị vẫn là giá trị đó.
Ví dụ, nếu tập hợp giá trị là: 2, 3, 5, 5, 5, 7, 8, thì số trung vị vẫn là 5.
4. Ứng dụng của số trung vị (median)
Trung vị được ưu tiên sử dụng trong trường hợp tập hợp dữ liệu có giá trị
ngoại lai, tức là các giá trị bất thường so với các giá trị còn lại. Khi đó, trung vị
cho phép đo lường xu hướng tập trung của dữ liệu một cách chính xác hơn.
Tuy nhiên, nếu tập hợp dữ liệu lớn và không có giá trị ngoại lai, số trung bình
lại đo lường chính xác hơn.
Ví dụ, giá trị ngoại lai trong dãy số là tuổi của các học viên trong lớp tiếng Anh
(10, 15, 13, 17, 18, 65, 20, 19, 22, 16, 21, 14) là 65. Giá trị này khiến cho số
trung bình chênh lệch rất nhiều so với trung vị (20,83 so với 17,5).
Trung vị được sử dụng rộng rãi trong các lĩnh vực kỹ thuật, ví dụ như trong
việc xây dựng mạng lưới điện, lắp đặt đường ống dẫn nước và bố trí các trạm
đỗ xe ở công cộng nơi thuận lợi để đạt được hiệu quả.
Một ưu điểm của trung vị là nó không bị ảnh hưởng bởi các giá trị biên độ
trong dãy số, đồng thời dễ hiểu và dễ tính toán. Tuy nhiên, một nhược điểm
của nó là không thể dự đoán chính xác như số trung bình, thường được sử
dụng để thay thế hoặc bổ sung cho số trung bình trong trường hợp cần thiết.
Ngoài ra, số trung vị (median) được sử dụng trong nhiều lĩnh vực khác nhau
và có nhiều ứng dụng khác, ví dụ như:
- Trong thống kê: Số trung vị là một phép đo trung tâm của tập dữ liệu, được
sử dụng để mô tả giá trị trung bình của tập dữ liệu. Nó có thể được sử dụng
để so sánh giữa các tập dữ liệu và đo lường sự khác biệt giữa chúng.
- Trong kinh tế: Số trung vị được sử dụng để tính toán thu nhập trung bình
của một quốc gia hoặc khu vực. Nó cũng được sử dụng để tính toán các chỉ
số tài chính như trung bình giá thành hoặc giá trị trung bình của các khoản đầu tư.
- Trong y học: Số trung vị được sử dụng để mô tả phân bố của các chỉ số sức
khỏe như chiều cao, cân nặng, huyết áp, lượng đường trong máu, ... Nó có
thể được sử dụng để so sánh giữa các nhóm người và đo lường sự khác biệt giữa chúng.
- Trong khoa học dữ liệu: Số trung vị là một trong các thống kê cơ bản được
sử dụng để phân tích dữ liệu. Nó có thể được sử dụng để loại bỏ các giá trị
ngoại lệ, làm giảm sự ảnh hưởng của chúng đến kết quả phân tích.
- Trong các ứng dụng máy tính: Số trung vị được sử dụng để phân tách các
tập dữ liệu thành các nhóm có cùng phân phối. Nó cũng được sử dụng để
tính toán các giá trị tương tự như phương sai và độ lệch chuẩn.
Document Outline
- Median hay số trung vị (median) là gì ?
- 1. Trung vị (median) được hiểu như thế nào?
- 2. Các đặc điểm của trung vị
- 3. Cách tìm median
- 4. Ứng dụng của số trung vị (median)