Huff 1954 - cách lừa dối chỉ số - phần 1 | Thống kê cho khoa học xã hội | Đại học Khoa học Xã hội và Nhân văn, Đại học Quốc gia Thành phố HCM

Trường Đại học Khoa học Xã hội và Nhân văn cung cấp nhiều môn học phong phú như Ngôn ngữ học đối chiếu, Phong cách học, Kinh tế học Vi mô, Lịch sử Việt Nam, Xã hội học, Tâm lý học, Văn hóa học và Ngữ văn Trung Quốc. Các môn học này giúp sinh viên phát triển kiến thức chuyên môn, kỹ năng phân tích và nghiên cứu, chuẩn bị tốt cho công việc và nghiên cứu sau khi ra trường.

lOMoARcPSD| 40749825
CÁCH NÓI WRRH SỐ LIỆU THỐNG KÊ
Tạp chí Time từng bình luận về điều gì đó trên tờ New York Sun: “Yaleman, thế hệ 24”, “kiếm được 25.111 USD một năm”. Được rồi,
tốt cho anh ấy!
Nhưng đợi một chút. Con số ấn tượng này có ý nghĩa gì? Có vẻ như đó là bằng chứng cho thấy nếu bạn gửi con trai của mình
đến Yale thì bạn sẽ không phải làm việc khi về già và cả gan cũng vậy.
Hai điều về nhân vật này thoạt nhìn có vẻ đáng ngờ. Nó chính xác một cách đáng ngạc nhiên. Nó khá là lành mạnh.
Có rất ít khả năng thu nhập trung bình của bất kỳ nhóm người ở xa nào sẽ được tính bằng đồng đô la. Không có khả năng đặc biệt là
bạn biết
thu nhập của chính mình trong năm ngoái chính xác như
hoặc sự lạc quan. Những người khác giảm thiểu, đặc biệt
vậy trừ khi tất cả đều bắt nguồn từ tiền lương. Và thu
là đáng lo ngại, đối với các tờ khai thuế thu nhập; và
nhập 25.000 đô la thường không phải là tiền lương;
sau khi làm điều này có thể ngần ngại mâu thuẫn với
những người trong khung đó có khả năng có kết quả tốt-
chính mình trên bất kỳ bài báo nào khác. Ai biết được
đầu tư rải rác.
những gì người thu nhập có thể nhìn thấy? Có thể hai
Hơn nữa, mức trung bình đáng yêu này chắc chắn được tính từ số tiền mà
xu hướng này, khoe khoang và nói giảm nhẹ, triệt tiêu
những người đàn ông Yale nói rằng họ kiếm được. Ngay cả khi họ có hệ thống
lẫn nhau, nhưng điều đó khó xảy ra. Một xu hướng có
danh dự ở New Haven New Haven vào năm '24, chúng tôi cũng không thể chắc thể mạnh hơn nhiều so với xu hướng kia và chúng ta
chắn rằng nó hoạt động tốt như vậy sau một thời gian.
không biết đó là xu hướng nào.
một phần tư của
Sau đó, chúng tôi bắt đầu tính đến một con số mà lẽ
thường cho rằng khó có thể đại diện cho sự thật. Bây
một thế kỷ mà tất cả những báo cáo này đều là những báo cáo trung thực. Một
giờ chúng ta hãy tìm hiểu nguồn có khả năng của ermr
số người khi
lớn nhất, một nguồn có thể tạo ra "'thu nhập trung bình"
là 25.111 đô la của một số người đàn ông có mức trung
bình thực tế có thể gần bằng một nửa số tiền đó.
Đây là quy trình lấy mẫu, là trọng tâm của phần lớn số
liệu thống kê mà bạn gặp về tất cả các loại chủ đề. Cơ sở
yêu cầu thu nhập của họ phóng đại vì sự phù phiếm
của nó khá đơn giản, mặc dù những cải tiến của nó
trong thực tế đã dẫn tới đủ loại lối đi phụ, một số còn
kém đáng nể hơn. Nếu bạn có một thùng đậu, một số
lOMoARcPSD| 40749825
MẪU BIAS TÍCH HỢP
màu đỏ và một số màu trắng, chỉ có một cách để biết
chính xác bạn có bao nhiêu màu; Đếm đi. Tuy nhiên,
bạn có thể biết gần đúng có bao nhiêu hạt màu đỏ một
cách dễ dàng hơn nhiều bằng cách lấy một nắm đậu ra
và chỉ đếm những hạt đó, tính toán rằng tỷ lệ sẽ giống
nhau trong suốt thùng. Nếu mẫu của bạn đủ lớn và được
chọn đúng cách, nó sẽ đại diện cho tổng thể đủ tốt cho
hầu hết các mục đích. Nếu không, nó có thể kém chính
xác hơn nhiều so với một phỏng đoán thông minh và
không có gì để đề xuất ngoài vẻ giả tạo về độ chính xác
khoa học. Thật đáng buồn là những kết luận từ những
mẫu như vậy, dù có sai lệch hay quá nhỏ hay cả hai, lại
nằm đằng sau phần lớn những gì chúng ta đọc hoặc
nghĩ rằng chúng ta biết.
Báo cáo về những người đàn ông Yale đến từ một
mẫu. Chúng ta có thể khá chắc chắn về điều đó bởi vì
trí cho chúng ta biết rằng không ai thể nắm bắt được
tất cả các thành viên còn sống của lớp '24 đó. Chắc chắn
có nhiều người không có địa chỉ sau 25 năm.
14
Và, trong số những người có địa chỉ đã được biết,
nhiều người sẽ không trả lời các câu hỏi, đặc biệt là
những câu hỏi mang tính cá nhân. Với một số loại bảng
câu hỏi qua thư, tỷ lệ phản hồi 5 hoặc 10% khá
cao. Người này lẽ ra phải làm tốt hơn thế, nhưng không
thể nào đạt được một trăm phần trăm.
vậy, chúng tôi thấy rằng con số thu nhập dựa trên
một mẫu bao gồm tất cả các thành viên trong lớp có địa
chỉ được biết những người đã trả lời bảng câu hỏi.
Đây phải mẫu đại diện không? Nghĩa là, liệu
nhóm y có thể được coi thu nhập ngang bằng
với nhóm không đại diện, những người không thể
liên lạc được hoặc những người không trả lời?
Ai là những con cừu nhỏ bị lạc trong danh sách Yale
"không địa chỉ"? Họ phải những người thu
nhập lớn - những người Phố Wall, các giám đốc tập
đoàn, các nhà điều hành sản xuất tiện ích? Không;
địa chỉ của những người giàu sẽ không khó thể gặp
được. Nhiều thành viên thành đạt nhất của lớp thể
được tìm thấy qua Who's Who in America các tài
liệu tham khảo khác ngay cả khi họ không giữ liên lạc
với văn phòng cựu sinh viên. là của
lOMoARcPSD| 40749825
CÁCH NÓI WRRH THỐNG
những người đàn ông, khoảng 25 năm sau khi trở thành
cử nhân nghệ thuật của Yale, vẫn chưa thực hiện được
bất kỳ lời hứa sáng chói nào. Họ là những thư ký, thợ cơ
khí, kẻ lang thang, người nghiện rượu thất nghiệp, nhà
văn nghệ gần như không còn sống sót, những
người mà phải cần nửa tá người trở lên mới có được thu
nhập 25.111 đô la. Những người đàn ông này không
thường xuyên đăng ký tham gia các buổi họp lớp, chỉ
họ không đủ khả năng chi trả cho chuyến đi.
are
poor
li琀琀le
lambs
Ai người đã ném bảng câu hỏi vào thùng rác gần
nhất? Chúng ta không thể chắc chắn về những điều này,
nhưng ít nhất cũng thể đoán được rằng nhiều người
trong số họ không kiếm đủ tiền để khoe khoang. Họ hơi
giống một người tìm thấy một mẩu giấy được đính kèm
trong tấm séc trả lương đầu tiên của anh ta gợi ý rằng
anh ta coi số tiền lương của mình mật không
quan trọng để trao đổi bí mật văn phòng. “Đừng lo,”
KÊ MẪU BIAS TÍCH HỢP
anh nói với ông chủ. “Tôi cũng xấu hổ về điều đó như
anh vậy.”
lOMoARcPSD| 40749825
CÁCH ĐẶT
Rõ ràng là mẫu đã bỏ qua hai nhóm có nhiều khả năng
làm giảm mức trung bình nhất. Con số 25.111 USD đang
bắt đầu giải thích. Nếu đó là con số thực cho bất cứ điều
gì thì đó chỉ là con số dành cho nhóm đặc biệt của lớp
'24 có địa chỉ được biết và những người sẵn sàng đứng
lên và cho biết họ kiếm được bao nhiêu. Thậm chí điều
đó đòi hỏi phải giả định rằng các quý ông là kể
lại sự thật.
Một giả định như vậy không thể được thực hiện một
cách nhẹ nhàng. Kinh nghiệm từ một loại nghiên cứu lấy
mẫu, được gọi nghiên cứu thị trường, cho thấy rằng nó
khó thể được thực hiện. Một cuộc khảo sát từng nhà
nhằm nghiên cứu lượng độc giả tạp chí đã từng được
thực hiện, trong đó u hỏi quan trọng là: Gia đình bạn
đọc tạp chí nào? Khi kết quả được lập bảng phân tích,
vẻ như rất nhiều người yêu thích Harper's nhưng lại
không nhiều người đọc True Story. Hiện tại, số liệu
của c nhà xuất bản vào thời điểm đó cho thấy rất
ràng rằng True Story nhiều triệu bản phát hành hơn
HarpeFs có hàng trăm nghìn. lẽ chúng ta đã hỏi nhầm
loại người, những người thiết kế cuộc khảo sát tự nhủ.
Nhưng không, những câu hỏi này đã được đặt ra ở đủ loại
khu dân trên khắp đất nước. Kết luận hợp duy nhất
khi đó rất nhiều người được hỏi, như mọi người
thường gọi khi họ trả lời những câu hỏi như vậy, đã
không nói sự thật. Tất cả những cuộc khảo sát đã phát
hiện ra là sự hợm hĩnh.
MẪU BẰNG BIAS BUILT-N
Cuối cùng người ta nhận ra rằng nếu bạn muốn biết
một số người đọc thì hỏi họ cũng chẳng ích gì. Bạn
TI-Æ có thể học được nhiều điều hơn bằng cách đến nhà
họ và
nói rằng bạn muốn mua Tạp chí cũ và có thể có những
gì? Sau đó, tất cả những gì bạn phải làm là đếm số lượt
xem của Yale Ree và Looe Romances. Tất nhiên , ngay
cả thiết bị đáng ngờ đó cũng không cho bạn biết mọi
người đã đọc gì mà chỉ cho bạn biết họ đã tiếp xúc với
những gì.
Tương tự như vậy, lần tới khi bạn đọc được rằng một
người Mỹ trung bình (ngày nay bạn nghe rất nhiều về
anh ta, hầu hết điều đó gần như không thể xảy ra) đánh
răng 1,02 lần một ngày - một con số vừa mới bịa ra,
nhưng nó có thể là như vậy. tốt như của bất kỳ ai khác—
hãy tự hỏi mình một câu hỏi. m thế o ai thể
phát hiện ra một điều như vậy? Liệu một người phụ nữ
đã đọc trong số quảng cáo rằng những người không
đánh răng những kẻ vi phạm hội thú nhận với
một người lạ rằng ấy không đánh răng thường xuyên
không? số liệu thống kê
18
thể ý nghĩa đối với những người chỉ muốn biết
người ta nói về việc đánh răng nhưng không có ý
nghĩa nhiều về tần suất lông bàn chải được áp vào
răng cửa.
lOMoARcPSD| 40749825
CÁCH NÓI WRRH THỐNG
Chúng ta được biết rằng một dòng sông không thể
vượt lên trên nguồn của nó. Chà, vẻ như một
trạm bơm được giấu đâu đó. Điều tương tự cũng
đúng kết quả của một nghiên cứu lấy mẫu không tốt
hơn mẫu dựa vào. Vào thời điểm dữ liệu đã
được lọc qua các lớp thao tác thống giảm xuống
mức trung bình có dấu thập phân, kết quả bắt đầu có vẻ
tin chắc rằng nếu xem xét kỹ hơn việc lấy mẫu sẽ phủ
nhận.
Phát hiện sớm ung thư cứu được mạng sống?
lẽ. Nhưng trong số những con số thường được sử dụng
để chứng minh điều đó, điều tốt nhất thể nói
không phải vậy. Những hồ sơ này của quan đăng
khối u Connecticut, từ năm 1935 dường như cho
thấy sự gia tăng đáng kể về tỷ lệ sống sót sau 5 năm từ
năm đó cho đến năm 1941. Trên thực tế, những hồ
đó được bắt đầu vào năm 1941, và mọi thứ trước đó đều
được bằng cách truy ngược lại . . Nhiều bệnh nhân
đã rời khỏi Connecticut, không thể biết được họ sống
hay chết. Theo phóng viên y tế Leonard Engel, thành
kiến cố hữu do đó tạo ra "đủ để giải thích gần như
toàn bộ sự cải thiện được tuyên bố về tỷ lệ sống sót."
ĐỂ giá trị nhiều, một báo cáo dựa trên việc lấy
mẫu phải sử dụng một mẫu đại diện, đó là mẫu mọi
nguồn sai lệch đã được loại bỏ. Đó là lúc nhân vật Yale
của chúng ta thể hiện sự vô giá trị của nó. Đó cũng là
KÊ MẪU BẰNG BIAS TÍCH HỢP
nơi mà rất nhiều thứ bạn có thể đọc trên báo và tạp chí
bộc lộ sự thiếu ý nghĩa vốn có của chúng.
Một bác tâm thần đã từng báo cáo rằng thực tế mọi
người đều bị loạn thần kinh. Ngoài thực tế việc sử
dụng như vậy sẽ phá hủy mọi ý nghĩa của từ "loạn thần
kinh", hãy xem mẫu của người đàn ông. Đó là, bác
tâm thần đã quan sát ai? Hóa ra là anh ấy đã đạt được
kết luận tính xây dựng này từ việc nghiên cứu các
bệnh nhân của mình, những người còn lâu mới trở thành
một mẫu của dân số. Nếu một người đàn ông bình
thường, bác tâm của chúng tôi sẽ không bao giờ
gặp anh ta.
Hãy cái nhìn thứ hai như vậy đối với những điều
bạn đọc bạn thể tránh được việc học rất nhiều
điều không đúng như vậy.
lOMoARcPSD| 40749825
CÁCH NÓI THỐNG
cũng cần lưu ý rằng độ tin cậy của một mẫu thể bị phá
hủy dễ dàng bởi những nguồn sai lệch nh cũng
như những nguồn thể nhìn thấy được. Nghĩa là,
ngay cả khi bạn không thể tìm thấy nguồn gốc của s
thiên vị thể chứng minh được, hãy cho phép bản
thân một mức độ hoài nghi nhất định về kết quả
miễn vẫn có khả năng xảy ra sự thiên vị đâu đó.
Luôn luôn có.
Các cuộc bầu cử tổng thống năm 1948 1952 đủ để
chứng minh điều đó, nếu còn nghi ngờ gì.
Để có thêm bằng chứng, hãy quay trở lại năm 1936
thất bại nổi tiếng của Literary Digest. mười triệu thuê
bao điện thoại Digest đã đảm bảo với các biên tập
viên về sự diệt vong
tạp chí cho rằng đó sẽ Landon 870, Roosevelt 161
nằm trong danh sách đã dự đoán chính xác cuộc bầu cử
năm 1982. Làm sao có thể có sự thiên vị trong một danh
KÊ MU BNG BIAS TÍCH HP
sách đã được thử nghiệm như vậy? Tất nhiên, một sự
thiên vị như các luận văn đại học và các cuộc khám
nghiệm tử thi khác đã phát hiện ra: Những người đủ
tiền mua điện thoại đặt mua tạp chí vào năm 1986
không phải một bộ phận cử tri. Vmặt kinh tế, họ
loại người đặc biệt, một mẫu người thiên vị trong đó
nhiều cử tri thuộc đảng Cộng hòa. Nhóm bầu chọn
Landon, nhưng cử tri lại nghĩ khác.
Mẫu cơ bản là loại được gọi là "ngẫu nhiên". Nó được
lựa chọn hoàn toàn ngẫu nhiên từ “vũ trụ”, một từ
nhà thống dùng để chỉ toàn bộ trong đó 21 mẫu
một phần. Mỗi cái tên thứ mười được lấy từ một tập tin
thẻ mục lục. Năm mươi tờ giấy được lấy từ một chiếc
mũ. Cứ hai mươi người gặp trên Phố Chợ đều được
phỏng vấn. (Nhưng hãy nhớ rằng đây không phải mẫu
của dân số thế giới, Hoa Kỳ, hay Của San Francisco, mà
chỉ Của những người trên Phố Market vào thời điểm
đó. Một người phỏng vấn cho một cuộc thăm dư luận
nói rằng ấy đã nhận được người của ấy một nhà
ga xe lửa bởi "có thể tìm thấy tất cả mọi loại người
trong một nhà ga." Phải chỉ ra cho cô ấy biết rằng những
bà mẹ có con nhỏ chẳng hạn, có thể không được đại diện
ở đó.)
Bài kiểm tra mẫu ngẫu nhiên thế này: Liệu mọi cái
tên hoặc đồ vật trong cả nhóm đều hội như nhau
để có mặt trong mẫu?
lOMoARcPSD| 40749825
CÁCH NÓI WRRH THỐNG KÊ MẪU BẰNG BIAS TÍCH HỢP
Mẫu hoàn toàn ngẫu nhiên là loại duy nhất có thể
được kiểm tra với độ tin cậy hoàn toàn bằng lý thuyết
thống kê, nhưng có một điều sai với nó, đó là rất khó và
tốn kém để có được cho mục đích sử dụng manv nên
chi phí tuyệt đối đã loại bỏ nó. Một giải pháp thay thế
kinh tế hơn, hầu như được sử dụng phổ biến trong các
lĩnh vực như thăm dò dư luận và nghiên cứu thị trường,
được gọi là lấy mẫu ngẫu nhiên phân tầng.
ĐỂ có được mẫu phân tầng này, bạn chia vũ trụ của
mình thành nhiều nhóm tương ứng với mức độ phổ
biến đã biết của chúng. Và ngay tại đó rắc rối của bạn
có thể bắt đầu: Thông tin của bạn về tỷ lệ của chúng có
thể không chính xác. Bạn hướng dẫn những người
phỏng vấn của bạn đảm bảo rằng họ nói chuyện với rất
nhiều người da đen và một tỷ lệ phần trăm người nào
đó trong mỗi khung thu nhập, với một số lượng nông
dân nhất định, v.v. Trong suốt thời gian đó nhóm phải
lOMoARcPSD| 40749825
CÁCH NÓI WRRH THỐNG
chia đều cho những người trên bốn mươi tuổi và dưới
bốn mươi tuổi.
Điều đó nghe vẻ ổn—nhưng chuyện sẽ xảy ra?
Về câu hỏi của người da đen hay người da trắng, người
phỏng vấn sẽ đánh giá chính c hầu hết thời gian. Về
thu nhập, anh ta sẽ mắc nhiều sai lầm hơn. Đối với
những người nông dân bạn phân loại một người làm
trang trại bán thời gian cũng làm việc thành phố
như thế nào? Ngay cả câu hỏi về tuổi tác cũng có thể đặt
ra một số vấn đề thể giải quyết dễ dàng nhất bằng
cách chỉ chọn những người trả lời ràng dưới hoặc
trên bốn mươi tuổi. Trong trường hợp đó, mẫu sẽ bị sai
lệch do sự vắng mặt thực sự của các nhóm tuổi cuối ba
mươi và đầu bốn mươi. Bạn không thể thắng được.
Trên hết, làm thế nào để bạn được một mẫu ngẫu nhiên
trong phân tầng? Điều hiển nhiên là bắt đầu với một danh sách
tất cả mọi người tìm kiếm những cái tên được chọn ngẫu
nhiên từ đó: nhưng như vậy thì quá đắt. vậy, bạn đi ra
đường - thiên vị mẫu của bạn so với những người đứng
yên. Bạn đi từ nhà này sang nhà khác hàng ngày bỏ lỡ hầu
hết những người việc làm. Bạn chuyển sang các cuộc
phỏng vấn buổi tối và bỏ mặc những người đi xem phim cũng
như những người đi câu lạc bộ đêm.
Hoạt động của một cuộc thăm dò cuối cùng dẫn đến một
cuộc chiến đang diễn ra chống lại các nguồn thiên vị
cuộc chiến y luôn được tiến hành bởi tất cả các tổ chức
bầu cử uy tín. Điều người đọc báo cáo phải nhớ
trận chiến không bao giờ có phần thắng. Không
KÊ MẪU BIAS TÍCH HỢP
nên đọc kết luận rằng “sáu mươi bảy phần trăm người
dân Mỹ chống lại” điều này hay điều khác mà không đặt
ra câu hỏi dai dẳng, Sáu mươi bảy phần trăm trong số
những người Mỹ nào? Vì vậy, với TiếnAlfred C, "tập
sách dành cho nữ" của Kinsey. Vấn đề, giống như bất kỳ
thứ dựa trên việc lấy mẫu, làm thế nào để đọc
(hoặc một bản tóm tắt phổ biến về nó) mà không cần học
quá nhiều, điều đó không nhất thiết phải như vậy. ít
nhất ba cấp độ lấy mẫu liên quan. Các mẫu của Tiến
Kinsey Về dân số (một cấp độ) khác xa với các mẫu
ngẫu nhiên thể không đặc biệt mang tính đại diện,
nhưng chúng những mẫu rất lớn nếu so nh với bất
kỳ điều được thực hiện trong lĩnh vực của ông trước
đây các số liệu của ông phải được chấp nhận
ràng quan trọng nếu không muốn nói nhất thiết.
trên mũi. Điều quan trọng hơn cần nhớ bất kỳ bảng
câu hỏi nào cũng chỉ một mẫu (cấp độ khác) của các
câu hỏi thể câu trả lời người phụ nữ đưa ra
không hơn gì một mẫu (cấp độ thứ ba) về thái độ và kinh
nghiệm của cô ấy đối với mỗi câu hỏi.
Những người trong đội ngũ phỏng vấn có thể tạo ra
kết quả một ch thú vị. Cách đây vài năm, trong thời
kỳ chiến tranh, Trung tâm Nghiên cứu Ý kiến Quốc gia
đã cử hai nhân viên phỏng vấn đến hỏi ba câu hỏi đối
với năm trăm người da đen ở một thành phố miền Nam.
lOMoARcPSD| 40749825
CÁCH NÓI THỐNG KÊ
Những người phỏng vấn da trắng gồm một nhân viên,
người còn lại là người da đen.
Một câu hỏi là "Người da đen sẽ được đối xử tốt hơn
hay tệ hơn đây nếu người Nhật chinh phục Hoa Kỳ?"
Những người phỏng vấn người da đen báo cáo rằng 9%
trong số những người họ hỏi nói rằng "tốt hơn". Những
người phỏng vấn người da trắng chỉ tìm thấy 2% số câu
trả lời như vậy. trong khi những người phỏng vấn
người da đen chỉ tìm thấy 25% nghĩ rằng người da đen
sẽ bị đối xử tệ hơn thì những người phỏng vấn người da
trắng lại có tới 45%.
Khi "Nazis" được thay thế cho "Nhật Bản" trong câu
hỏi, kết quả cũng tương tự,
Câu hỏi thứ ba thăm thái độ thể dựa trên cảm
xúc được bộc lộ bởi hai câu hỏi đầu tiên. "Bạn nghĩ
điều quan trọng hơn tập trung vào việc đánh bại phe
Trục hay làm cho nền n chủ hoạt động tốt hơn ở quê
nhà?" Theo những người phỏng vấn người da đen,
"Beat Axis" câu trả lời chiếm 39%; theo người da
trắng là sáu mươi hai phần trăm.
Đây sự thiên vị được đưa ra bởi các yếu tố chưa
biết. vẻ như yếu tố hiệu quả nhất xu hướng luôn
được cho phép khi đọc kết quả thăm ý kiến, mong
muốn đưa ra một câu trả lời vừa ý. Sẽ đáng ngạc
nhiên nếu, khi trả lời một câu hỏi có hàm ý về sự
không trung thành trong thời chiến, một người da đen
miền Nam lại nói với một người da trắng điều gì nghe
có vẻ tốt hơn điều anh ta thực sự tin tưởng? Cũng có
thể c nhóm người phỏng vấn khác nhau đã chọn
những kiểu người khác nhau để nói chuyện.
Trong mọi trường hợp, kết quả ràng sai lệch đến
mức giá trị. Bạn thể tự mình đánh giá xem bao
nhiêu kết luận dựa trên cuộc thăm dò ý kiến khác cũng thiên
vị, giá trị - nhưng không tấm séc nào để hiển thị
chúng.
lOMoARcPSD| 40749825
CÁCH NÓI THỐNG KÊ
VI
Bạn có bằng chứng khá công bằng để tiếp tục nếu bạn nghi ngờ rằng các cuộc thăm dò nói chung thiên về một hướng cụ thể, hướng
của lỗi Literary Digest. Thành kiến này hướng tới người có nhiều tiền hơn, học vấn cao hơn, hiểu biết tốt hơn và tỉnh táo hơn,
ngoại hình đẹp hơn, hành vi truyền thống hơn và thói quen ổn định hơn mức trung bình của nhóm dân số mà anh ta được chọn để
đại diện.
Bạn thể dễ dàng nhìn thấy những tạo ra điều này. Giả sử bạn người phỏng vấn được phân công một
góc phố chỉ được phỏng vấn một lần. Bạn phát hiện ra hai người đàn ông có vphù hợp với hạng mục mà bạn
phải hoàn thành: trên bốn mươi, người da đen, thành thị. Một người trong bộ quần áo liền quần sạch sẽ, víu
tươm tất, gọn gàng. Người kia thì bẩn thỉu trông vẻ cáu kỉnh. Với một công việc cần hoàn thành, bạn tiếp
cận những người có vẻ ngoài có vẻ ngoài khả quan hơn các đồng nghiệp của bạn trên khắp đất nước cũng đang
đưa ra những quyết định tương tự.
Một số cảm giác chống lại dư luận mạnh mẽ nhất được tìm thấy trong giới tự do hoặc cánh tả, nơi kinh doanh bất động sản. Nhưng giả sử bạn
và tôi đều tin rằng các cuộc thăm dò nói chung có gian lận. Đằng sau quan điểm này là thực tế là các kết quả thăm dò ý kiến thường không phù
hợp với quan điểm và mong muốn của những người có lối suy nghĩ không theo hướng bảo thủ. Người ta đã chỉ ra rằng các cuộc thăm dò dường
như đã bầu chọn đảng viên Đảng Cộng hòa ngay cả khi các cử tri ngay sau đó lại làm khác. Trên thực tế, như chúng ta đã thấy, POLI không cần
thiết phải gian lận - nghĩa là kết quả bị cố tình bóp méo để tạo ra ấn tượng sai lầm. Xu hướng của mẫu bị sai lệch theo hướng nhất quán này
thể tự động điều chỉnh mẫu.
| 1/10

Preview text:

lOMoAR cPSD| 40749825
CÁCH NÓI WRRH SỐ LIỆU THỐNG KÊ
Tạp chí Time từng bình luận về điều gì đó trên tờ New York Sun: “Yaleman, thế hệ 24”, “kiếm được 25.111 USD một năm”. Được rồi, tốt cho anh ấy!
Nhưng đợi một chút. Con số ấn tượng này có ý nghĩa gì? Có vẻ như đó là bằng chứng cho thấy nếu bạn gửi con trai của mình
đến Yale thì bạn sẽ không phải làm việc khi về già và cả gan cũng vậy.
Hai điều về nhân vật này thoạt nhìn có vẻ đáng ngờ. Nó chính xác một cách đáng ngạc nhiên. Nó khá là lành mạnh.
Có rất ít khả năng thu nhập trung bình của bất kỳ nhóm người ở xa nào sẽ được tính bằng đồng đô la. Không có khả năng đặc biệt là bạn biết
thu nhập của chính mình trong năm ngoái chính xác như
hoặc sự lạc quan. Những người khác giảm thiểu, đặc biệt
vậy trừ khi tất cả đều bắt nguồn từ tiền lương. Và thu
là đáng lo ngại, đối với các tờ khai thuế thu nhập; và
nhập 25.000 đô la thường không phải là tiền lương;
sau khi làm điều này có thể ngần ngại mâu thuẫn với
những người trong khung đó có khả năng có kết quả tốt-
chính mình trên bất kỳ bài báo nào khác. Ai biết được đầu tư rải rác.
những gì người thu nhập có thể nhìn thấy? Có thể hai
Hơn nữa, mức trung bình đáng yêu này chắc chắn được tính từ số tiền mà
xu hướng này, khoe khoang và nói giảm nhẹ, triệt tiêu
những người đàn ông Yale nói rằng họ kiếm được. Ngay cả khi họ có hệ thống
lẫn nhau, nhưng điều đó khó xảy ra. Một xu hướng có
danh dự ở New Haven New Haven vào năm '24, chúng tôi cũng không thể chắc thể mạnh hơn nhiều so với xu hướng kia và chúng ta
chắn rằng nó hoạt động tốt như vậy sau một thời gian.
không biết đó là xu hướng nào. một phần tư của
Sau đó, chúng tôi bắt đầu tính đến một con số mà lẽ
thường cho rằng khó có thể đại diện cho sự thật. Bây
một thế kỷ mà tất cả những báo cáo này đều là những báo cáo trung thực. Một
giờ chúng ta hãy tìm hiểu nguồn có khả năng của ermr số người khi
lớn nhất, một nguồn có thể tạo ra "'thu nhập trung bình"
là 25.111 đô la của một số người đàn ông có mức trung
bình thực tế có thể gần bằng một nửa số tiền đó.
Đây là quy trình lấy mẫu, là trọng tâm của phần lớn số
liệu thống kê mà bạn gặp về tất cả các loại chủ đề. Cơ sở
yêu cầu thu nhập của họ phóng đại vì sự phù phiếm
của nó khá đơn giản, mặc dù những cải tiến của nó
trong thực tế đã dẫn tới đủ loại lối đi phụ, một số còn
kém đáng nể hơn. Nếu bạn có một thùng đậu, một số lOMoAR cPSD| 40749825 MẪU BIAS TÍCH HỢP
màu đỏ và một số màu trắng, chỉ có một cách để biết
những câu hỏi mang tính cá nhân. Với một số loại bảng
chính xác bạn có bao nhiêu màu; Đếm đi. Tuy nhiên,
câu hỏi qua thư, tỷ lệ phản hồi là 5 hoặc 10% là khá
bạn có thể biết gần đúng có bao nhiêu hạt màu đỏ một
cao. Người này lẽ ra phải làm tốt hơn thế, nhưng không
cách dễ dàng hơn nhiều bằng cách lấy một nắm đậu ra
thể nào đạt được một trăm phần trăm.
và chỉ đếm những hạt đó, tính toán rằng tỷ lệ sẽ giống
Vì vậy, chúng tôi thấy rằng con số thu nhập dựa trên
nhau trong suốt thùng. Nếu mẫu của bạn đủ lớn và được
chọn đúng cách, nó sẽ đại diện cho tổng thể đủ tốt cho
một mẫu bao gồm tất cả các thành viên trong lớp có địa
hầu hết các mục đích. Nếu không, nó có thể kém chính
chỉ được biết và những người đã trả lời bảng câu hỏi.
xác hơn nhiều so với một phỏng đoán thông minh và
Đây có phải là mẫu đại diện không? Nghĩa là, liệu
không có gì để đề xuất ngoài vẻ giả tạo về độ chính xác
nhóm này có thể được coi là có thu nhập ngang bằng
khoa học. Thật đáng buồn là những kết luận từ những
với nhóm không có đại diện, những người không thể
mẫu như vậy, dù có sai lệch hay quá nhỏ hay cả hai, lại
liên lạc được hoặc những người không trả lời?
nằm đằng sau phần lớn những gì chúng ta đọc hoặc
nghĩ rằng chúng ta biết.
Báo cáo về những người đàn ông Yale đến từ một
mẫu. Chúng ta có thể khá chắc chắn về điều đó bởi vì lý
trí cho chúng ta biết rằng không ai có thể nắm bắt được
tất cả các thành viên còn sống của lớp '24 đó. Chắc chắn
có nhiều người không có địa chỉ sau 25 năm.
Ai là những con cừu nhỏ bị lạc trong danh sách Yale
"không rõ địa chỉ"? Họ có phải là những người có thu
nhập lớn - những người ở Phố Wall, các giám đốc tập
đoàn, các nhà điều hành sản xuất và tiện ích? Không;
địa chỉ của những người giàu sẽ không khó có thể gặp
được. Nhiều thành viên thành đạt nhất của lớp có thể
được tìm thấy qua Who's Who in America và các tài 14
liệu tham khảo khác ngay cả khi họ không giữ liên lạc
Và, trong số những người có địa chỉ đã được biết,
với văn phòng cựu sinh viên. là của
nhiều người sẽ không trả lời các câu hỏi, đặc biệt là lOMoAR cPSD| 40749825 CÁCH NÓI WRRH THỐNG KÊ MẪU BIAS TÍCH HỢP
những người đàn ông, khoảng 25 năm sau khi trở thành
anh nói với ông chủ. “Tôi cũng xấu hổ về điều đó như
cử nhân nghệ thuật của Yale, vẫn chưa thực hiện được anh vậy.”
bất kỳ lời hứa sáng chói nào. Họ là những thư ký, thợ cơ
khí, kẻ lang thang, người nghiện rượu thất nghiệp, nhà
văn và nghệ sĩ gần như không còn sống sót, những
người mà phải cần nửa tá người trở lên mới có được thu
nhập 25.111 đô la. Những người đàn ông này không
thường xuyên đăng ký tham gia các buổi họp lớp, chỉ vì
họ không đủ khả năng chi trả cho chuyến đi. are poor li琀琀le lambs
Ai là người đã ném bảng câu hỏi vào thùng rác gần
nhất? Chúng ta không thể chắc chắn về những điều này,
nhưng ít nhất cũng có thể đoán được rằng nhiều người
trong số họ không kiếm đủ tiền để khoe khoang. Họ hơi
giống một người tìm thấy một mẩu giấy được đính kèm
trong tấm séc trả lương đầu tiên của anh ta gợi ý rằng
anh ta coi số tiền lương của mình là bí mật và không
quan trọng để trao đổi bí mật văn phòng. “Đừng lo,” lOMoAR cPSD| 40749825 CÁCH ĐẶT MẪU BẰNG BIAS BUILT-N
Rõ ràng là mẫu đã bỏ qua hai nhóm có nhiều khả năng
Cuối cùng người ta nhận ra rằng nếu bạn muốn biết
làm giảm mức trung bình nhất. Con số 25.111 USD đang
một số người đọc gì thì hỏi họ cũng chẳng ích gì. Bạn
bắt đầu giải thích. Nếu đó là con số thực cho bất cứ điều
TI-Æ có thể học được nhiều điều hơn bằng cách đến nhà
gì thì đó chỉ là con số dành cho nhóm đặc biệt của lớp họ và
'24 có địa chỉ được biết và những người sẵn sàng đứng
nói rằng bạn muốn mua Tạp chí cũ và có thể có những
lên và cho biết họ kiếm được bao nhiêu. Thậm chí điều
gì? Sau đó, tất cả những gì bạn phải làm là đếm số lượt
đó đòi hỏi phải giả định rằng các quý ông là kể
xem của Yale Ree và Looe Romances. Tất nhiên , ngay lại sự thật.
cả thiết bị đáng ngờ đó cũng không cho bạn biết mọi
Một giả định như vậy không thể được thực hiện một
người đã đọc gì mà chỉ cho bạn biết họ đã tiếp xúc với
cách nhẹ nhàng. Kinh nghiệm từ một loại nghiên cứu lấy những gì.
mẫu, được gọi là nghiên cứu thị trường, cho thấy rằng nó
Tương tự như vậy, lần tới khi bạn đọc được rằng một
khó có thể được thực hiện. Một cuộc khảo sát từng nhà
người Mỹ trung bình (ngày nay bạn nghe rất nhiều về
nhằm nghiên cứu lượng độc giả tạp chí đã từng được
anh ta, hầu hết điều đó gần như không thể xảy ra) đánh
thực hiện, trong đó câu hỏi quan trọng là: Gia đình bạn
răng 1,02 lần một ngày - một con số vừa mới bịa ra,
đọc tạp chí nào? Khi kết quả được lập bảng và phân tích,
nhưng nó có thể là như vậy. tốt như của bất kỳ ai khác—
có vẻ như rất nhiều người yêu thích Harper's nhưng lại
hãy tự hỏi mình một câu hỏi. Làm thế nào có ai có thể
không có nhiều người đọc True Story. Hiện tại, số liệu
phát hiện ra một điều như vậy? Liệu một người phụ nữ
của các nhà xuất bản vào thời điểm đó cho thấy rất rõ
đã đọc trong vô số quảng cáo rằng những người không
ràng rằng True Story có nhiều triệu bản phát hành hơn
đánh răng là những kẻ vi phạm xã hội có thú nhận với
HarpeFs có hàng trăm nghìn. Có lẽ chúng ta đã hỏi nhầm
một người lạ rằng cô ấy không đánh răng thường xuyên
loại người, những người thiết kế cuộc khảo sát tự nhủ.
không? số liệu thống kê
Nhưng không, những câu hỏi này đã được đặt ra ở đủ loại
khu dân cư trên khắp đất nước. Kết luận hợp lý duy nhất 18
khi đó là rất nhiều người được hỏi, như mọi người
có thể có ý nghĩa đối với những người chỉ muốn biết
thường gọi khi họ trả lời những câu hỏi như vậy, đã
người ta nói gì về việc đánh răng nhưng nó không có ý
không nói sự thật. Tất cả những gì cuộc khảo sát đã phát
nghĩa gì nhiều về tần suất lông bàn chải được áp vào
hiện ra là sự hợm hĩnh. răng cửa. lOMoAR cPSD| 40749825 CÁCH NÓI WRRH THỐNG KÊ MẪU BẰNG BIAS TÍCH HỢP
Chúng ta được biết rằng một dòng sông không thể
nơi mà rất nhiều thứ bạn có thể đọc trên báo và tạp chí
vượt lên trên nguồn của nó. Chà, có vẻ như có một
bộc lộ sự thiếu ý nghĩa vốn có của chúng.
trạm bơm được giấu ở đâu đó. Điều tương tự cũng
Một bác sĩ tâm thần đã từng báo cáo rằng thực tế mọi
đúng là kết quả của một nghiên cứu lấy mẫu không tốt
người đều bị loạn thần kinh. Ngoài thực tế là việc sử
hơn mẫu mà nó dựa vào. Vào thời điểm dữ liệu đã
dụng như vậy sẽ phá hủy mọi ý nghĩa của từ "loạn thần
được lọc qua các lớp thao tác thống kê và giảm xuống
kinh", hãy xem mẫu của người đàn ông. Đó là, bác sĩ
mức trung bình có dấu thập phân, kết quả bắt đầu có vẻ
tâm thần đã quan sát ai? Hóa ra là anh ấy đã đạt được
tin chắc rằng nếu xem xét kỹ hơn việc lấy mẫu sẽ phủ
kết luận có tính xây dựng này từ việc nghiên cứu các nhận.
bệnh nhân của mình, những người còn lâu mới trở thành
Phát hiện sớm ung thư có cứu được mạng sống? Có
một mẫu của dân số. Nếu một người đàn ông bình
lẽ. Nhưng trong số những con số thường được sử dụng
thường, bác sĩ tâm lý của chúng tôi sẽ không bao giờ
để chứng minh điều đó, điều tốt nhất có thể nói là gặp anh ta.
không phải vậy. Những hồ sơ này của Cơ quan đăng ký
khối u Connecticut, có từ năm 1935 và dường như cho
thấy sự gia tăng đáng kể về tỷ lệ sống sót sau 5 năm từ
năm đó cho đến năm 1941. Trên thực tế, những hồ sơ
đó được bắt đầu vào năm 1941, và mọi thứ trước đó đều
có được bằng cách truy ngược lại . . Nhiều bệnh nhân
đã rời khỏi Connecticut, không thể biết được họ sống
hay chết. Theo phóng viên y tế Leonard Engel, thành
kiến cố hữu do đó tạo ra là "đủ để giải thích gần như
toàn bộ sự cải thiện được tuyên bố về tỷ lệ sống sót."
Hãy có cái nhìn thứ hai như vậy đối với những điều
ĐỂ có giá trị nhiều, một báo cáo dựa trên việc lấy
bạn đọc và bạn có thể tránh được việc học rất nhiều
mẫu phải sử dụng một mẫu đại diện, đó là mẫu mà mọi
nguồn sai lệch đã được loại bỏ. Đó là lúc nhân vật Yale
điều không đúng như vậy.
của chúng ta thể hiện sự vô giá trị của nó. Đó cũng là lOMoAR cPSD| 40749825 CÁCH NÓI THỐNG
KÊ MẪU BẰNG BIAS TÍCH HỢP
cũng cần lưu ý rằng độ tin cậy của một mẫu có thể bị phá
sách đã được thử nghiệm như vậy? Tất nhiên, có một sự
hủy dễ dàng bởi những nguồn sai lệch vô hình cũng
thiên vị như các luận văn đại học và các cuộc khám
như những nguồn có thể nhìn thấy được. Nghĩa là,
nghiệm tử thi khác đã phát hiện ra: Những người có đủ
ngay cả khi bạn không thể tìm thấy nguồn gốc của sự
tiền mua điện thoại và đặt mua tạp chí vào năm 1986
thiên vị có thể chứng minh được, hãy cho phép bản
không phải là một bộ phận cử tri. Về mặt kinh tế, họ là
thân có một mức độ hoài nghi nhất định về kết quả
loại người đặc biệt, một mẫu người thiên vị vì trong đó
miễn là vẫn có khả năng xảy ra sự thiên vị ở đâu đó.
có nhiều cử tri thuộc đảng Cộng hòa. Nhóm bầu chọn
Landon, nhưng cử tri lại nghĩ khác. Luôn luôn có.
Các cuộc bầu cử tổng thống năm 1948 và 1952 là đủ để
Mẫu cơ bản là loại được gọi là "ngẫu nhiên". Nó được
chứng minh điều đó, nếu còn nghi ngờ gì.
lựa chọn hoàn toàn ngẫu nhiên từ “vũ trụ”, một từ mà
nhà thống kê dùng để chỉ toàn bộ trong đó 21 mẫu là
Để có thêm bằng chứng, hãy quay trở lại năm 1936 và
thất bại nổi tiếng của Literary Digest. mười triệu thuê
một phần. Mỗi cái tên thứ mười được lấy từ một tập tin
bao điện thoại và Digest đã đảm bảo với các biên tập
thẻ mục lục. Năm mươi tờ giấy được lấy từ một chiếc viên về sự diệt vong
mũ. Cứ hai mươi người gặp trên Phố Chợ đều được
phỏng vấn. (Nhưng hãy nhớ rằng đây không phải là mẫu
của dân số thế giới, Hoa Kỳ, hay Của San Francisco, mà
chỉ là Của những người trên Phố Market vào thời điểm
đó. Một người phỏng vấn cho một cuộc thăm dò dư luận
nói rằng cô ấy đã nhận được người của cô ấy ở một nhà
ga xe lửa bởi vì "có thể tìm thấy tất cả mọi loại người
trong một nhà ga." Phải chỉ ra cho cô ấy biết rằng những
bà mẹ có con nhỏ chẳng hạn, có thể không được đại diện ở đó.)
Bài kiểm tra mẫu ngẫu nhiên là thế này: Liệu mọi cái
tạp chí cho rằng đó sẽ là Landon 870, Roosevelt 161
tên hoặc đồ vật trong cả nhóm đều có cơ hội như nhau
nằm trong danh sách đã dự đoán chính xác cuộc bầu cử để có mặt trong mẫu?
năm 1982. Làm sao có thể có sự thiên vị trong một danh lOMoAR cPSD| 40749825 CÁCH NÓI WRRH THỐNG
KÊ MẪU BẰNG BIAS TÍCH HỢP
Mẫu hoàn toàn ngẫu nhiên là loại duy nhất có thể
được kiểm tra với độ tin cậy hoàn toàn bằng lý thuyết
thống kê, nhưng có một điều sai với nó, đó là rất khó và
tốn kém để có được cho mục đích sử dụng manv nên
chi phí tuyệt đối đã loại bỏ nó. Một giải pháp thay thế
kinh tế hơn, hầu như được sử dụng phổ biến trong các
lĩnh vực như thăm dò dư luận và nghiên cứu thị trường,
được gọi là lấy mẫu ngẫu nhiên phân tầng.
ĐỂ có được mẫu phân tầng này, bạn chia vũ trụ của
mình thành nhiều nhóm tương ứng với mức độ phổ
biến đã biết của chúng. Và ngay tại đó rắc rối của bạn
có thể bắt đầu: Thông tin của bạn về tỷ lệ của chúng có
thể không chính xác. Bạn hướng dẫn những người
phỏng vấn của bạn đảm bảo rằng họ nói chuyện với rất
nhiều người da đen và một tỷ lệ phần trăm người nào
đó trong mỗi khung thu nhập, với một số lượng nông
dân nhất định, v.v. Trong suốt thời gian đó nhóm phải lOMoAR cPSD| 40749825 CÁCH NÓI WRRH THỐNG KÊ MẪU BIAS TÍCH HỢP
chia đều cho những người trên bốn mươi tuổi và dưới
nên đọc kết luận rằng “sáu mươi bảy phần trăm người bốn mươi tuổi.
dân Mỹ chống lại” điều này hay điều khác mà không đặt
Điều đó nghe có vẻ ổn—nhưng chuyện gì sẽ xảy ra?
ra câu hỏi dai dẳng, Sáu mươi bảy phần trăm trong số
Về câu hỏi của người da đen hay người da trắng, người
những người Mỹ nào? Vì vậy, với Tiến sĩ Alfred C, "tập
phỏng vấn sẽ đánh giá chính xác hầu hết thời gian. Về
sách dành cho nữ" của Kinsey. Vấn đề, giống như bất kỳ
thu nhập, anh ta sẽ mắc nhiều sai lầm hơn. Đối với
thứ gì dựa trên việc lấy mẫu, là làm thế nào để đọc nó
những người nông dân – bạn phân loại một người làm
(hoặc một bản tóm tắt phổ biến về nó) mà không cần học
trang trại bán thời gian và cũng làm việc ở thành phố
quá nhiều, điều đó không nhất thiết phải như vậy. Có ít
như thế nào? Ngay cả câu hỏi về tuổi tác cũng có thể đặt
nhất ba cấp độ lấy mẫu liên quan. Các mẫu của Tiến sĩ
ra một số vấn đề có thể giải quyết dễ dàng nhất bằng
Kinsey Về dân số (một cấp độ) khác xa với các mẫu
cách chỉ chọn những người trả lời rõ ràng là dưới hoặc
ngẫu nhiên và có thể không đặc biệt mang tính đại diện,
trên bốn mươi tuổi. Trong trường hợp đó, mẫu sẽ bị sai
nhưng chúng là những mẫu rất lớn nếu so sánh với bất
lệch do sự vắng mặt thực sự của các nhóm tuổi cuối ba
kỳ điều gì được thực hiện trong lĩnh vực của ông trước
mươi và đầu bốn mươi. Bạn không thể thắng được.
đây và các số liệu của ông phải được chấp nhận là rõ
Trên hết, làm thế nào để bạn có được một mẫu ngẫu nhiên
ràng và quan trọng nếu không muốn nói là nhất thiết.
trong phân tầng? Điều hiển nhiên là bắt đầu với một danh sách
trên mũi. Điều quan trọng hơn cần nhớ là bất kỳ bảng
tất cả mọi người và tìm kiếm những cái tên được chọn ngẫu
câu hỏi nào cũng chỉ là một mẫu (cấp độ khác) của các
nhiên từ đó: nhưng như vậy thì quá đắt. Vì vậy, bạn đi ra đường
câu hỏi có thể có và câu trả lời mà người phụ nữ đưa ra
- và thiên vị mẫu của bạn so với những người đứng
yên. Bạn đi từ nhà này sang nhà khác hàng ngày và bỏ lỡ hầu
không hơn gì một mẫu (cấp độ thứ ba) về thái độ và kinh
hết những người có việc làm. Bạn chuyển sang các cuộc
nghiệm của cô ấy đối với mỗi câu hỏi.
phỏng vấn buổi tối và bỏ mặc những người đi xem phim cũng
như những người đi câu lạc bộ đêm.
Những người trong đội ngũ phỏng vấn có thể tạo ra
Hoạt động của một cuộc thăm dò cuối cùng dẫn đến một
kết quả một cách thú vị. Cách đây vài năm, trong thời
cuộc chiến đang diễn ra chống lại các nguồn thiên vị và
kỳ chiến tranh, Trung tâm Nghiên cứu Ý kiến Quốc gia
cuộc chiến này luôn được tiến hành bởi tất cả các tổ chức
đã cử hai nhân viên phỏng vấn đến hỏi ba câu hỏi đối
bầu cử có uy tín. Điều mà người đọc báo cáo phải nhớ là
với năm trăm người da đen ở một thành phố miền Nam.
trận chiến không bao giờ có phần thắng. Không lOMoAR cPSD| 40749825 CÁCH NÓI THỐNG KÊ
Những người phỏng vấn da trắng gồm một nhân viên,
có vẻ tốt hơn là điều anh ta thực sự tin tưởng? Cũng có
người còn lại là người da đen.
thể các nhóm người phỏng vấn khác nhau đã chọn
Một câu hỏi là "Người da đen sẽ được đối xử tốt hơn
những kiểu người khác nhau để nói chuyện.
hay tệ hơn ở đây nếu người Nhật chinh phục Hoa Kỳ?"
Trong mọi trường hợp, kết quả rõ ràng là sai lệch đến
Những người phỏng vấn người da đen báo cáo rằng 9%
mức vô giá trị. Bạn có thể tự mình đánh giá xem có bao
trong số những người họ hỏi nói rằng "tốt hơn". Những
nhiêu kết luận dựa trên cuộc thăm dò ý kiến khác cũng thiên
vị, vô giá trị - nhưng không có tấm séc nào để hiển thị
người phỏng vấn người da trắng chỉ tìm thấy 2% số câu chúng.
trả lời như vậy. Và trong khi những người phỏng vấn
người da đen chỉ tìm thấy 25% nghĩ rằng người da đen
sẽ bị đối xử tệ hơn thì những người phỏng vấn người da trắng lại có tới 45%.
Khi "Nazis" được thay thế cho "Nhật Bản" trong câu
hỏi, kết quả cũng tương tự,
Câu hỏi thứ ba thăm dò thái độ có thể dựa trên cảm
xúc được bộc lộ bởi hai câu hỏi đầu tiên. "Bạn nghĩ
điều quan trọng hơn là tập trung vào việc đánh bại phe
Trục hay làm cho nền dân chủ hoạt động tốt hơn ở quê
nhà?" Theo những người phỏng vấn người da đen,
"Beat Axis" là câu trả lời chiếm 39%; theo người da
trắng là sáu mươi hai phần trăm.
Đây là sự thiên vị được đưa ra bởi các yếu tố chưa
biết. Có vẻ như yếu tố hiệu quả nhất là xu hướng luôn
được cho phép khi đọc kết quả thăm dò ý kiến, mong
muốn đưa ra một câu trả lời vừa ý. Sẽ có gì đáng ngạc
nhiên nếu, khi trả lời một câu hỏi có hàm ý về sự
không trung thành trong thời chiến, một người da đen
miền Nam lại nói với một người da trắng điều gì nghe lOMoAR cPSD| 40749825 CÁCH NÓI THỐNG KÊ VỚI
Bạn có bằng chứng khá công bằng để tiếp tục nếu bạn nghi ngờ rằng các cuộc thăm dò nói chung thiên về một hướng cụ thể, hướng
của lỗi Literary Digest. Thành kiến này hướng tới người có
nhiều tiền hơn, học vấn cao hơn, hiểu biết tốt hơn và tỉnh táo hơn,
ngoại hình đẹp hơn, hành vi truyền thống hơn và thói quen ổn
định hơn mức trung bình của nhóm dân số mà anh ta được chọn để đại diện.
Bạn có thể dễ dàng nhìn thấy những gì tạo ra điều này. Giả sử bạn là người phỏng vấn được phân công ở một
góc phố và chỉ được phỏng vấn một lần. Bạn phát hiện ra hai người đàn ông có vẻ phù hợp với hạng mục mà bạn
phải hoàn thành: trên bốn mươi, người da đen, thành thị. Một người trong bộ quần áo liền quần sạch sẽ, vá víu
tươm tất, gọn gàng. Người kia thì bẩn thỉu và trông có vẻ cáu kỉnh. Với một công việc cần hoàn thành, bạn tiếp
cận những người có vẻ ngoài có vẻ ngoài khả quan hơn và các đồng nghiệp của bạn trên khắp đất nước cũng đang
đưa ra những quyết định tương tự.
Một số cảm giác chống lại dư luận mạnh mẽ nhất được tìm thấy trong giới tự do hoặc cánh tả, nơi kinh doanh bất động sản. Nhưng giả sử bạn
và tôi đều tin rằng các cuộc thăm dò nói chung có gian lận. Đằng sau quan điểm này là thực tế là các kết quả thăm dò ý kiến thường không phù
hợp với quan điểm và mong muốn của những người có lối suy nghĩ không theo hướng bảo thủ. Người ta đã chỉ ra rằng các cuộc thăm dò dường
như đã bầu chọn đảng viên Đảng Cộng hòa ngay cả khi các cử tri ngay sau đó lại làm khác. Trên thực tế, như chúng ta đã thấy, POLI không cần
thiết phải gian lận - nghĩa là kết quả bị cố tình bóp méo để tạo ra ấn tượng sai lầm. Xu hướng của mẫu bị sai lệch theo hướng nhất quán này có
thể tự động điều chỉnh mẫu.