



















Preview text:
với mọi chiến lược J (7.1) Hoặc , hoặc
với mọi chiến lược J (7.2)
Những điều kiện này xuất phát tự nhiên từ các ý tưởng cơ bản đã
được phác thảo ở trên. Điều kiện thứ nhất phải được thỏa mãn nếu chiến
lược I được coi là một chiến lược cân bằng: Nó phải mang lại kết quả ít
nhất ngang bằng so với mọi chiến lược khác, nếu không thì mọi người sẽ
từ bỏ việc sử dụng nó. Điều kiện thứ hai phải được thỏa mãn để một chiến
lược không dễ dàng bị lấn át bởi một chiến lược khác. Để hiểu vì sao, chú
ý rằng khi (7.1) được thỏa mãn dưới dạng đẳng thức, một nhóm sử dụng
chiến lược I có thể bị lấn át bởi một cá nhân sử dụng chiến lược J, với điều
kiện người chơi sử dụng J có lợi thế tương đương với những người sử dụng I
trong tình huống này. Do đó, để ngăn chặn sự lấn át của người chơi sử
dụng J, thì hoặc I phải hoàn toàn vượt trội hơn J khi đối đầu với I, hoặc, nếu
điều kiện trên không được thỏa mãn, chiến lược I phải có lợi thế khi đối
đầu với J hơn là khi J đối đầu với chính nó.
Để minh họa cách ý tưởng này có thể được áp dụng vào khoa học xã
hội, hãy xét một biến thể của trò chơi kẻ nhát gan ( chicken game ), hay
còn gọi là trò chơi Diều hâu - Bồ câu ( Hawk- Dove ) ( xem Schotter (1981)
và Sugden (1986) để tham khảo thêm các ứng dụng chi tiết hơn ). Giả sử
có hai cá nhân đối đầu về một tài sản đang tranh chấp có giá trị 2 đơn vị
lợi ích đối với cả hai bên. Mỗi người chơi đều có cùng một tập hợp lựa chọn
giống nhau: Hoặc hành động hung hăng, giống như một con diều hâu
( hawk ), hoặc nhượng bộ giống như một con bồ câu ( dove ). Khi cả hai
hành xử như “dove”, họ sẽ chia sẻ tài sản đang tranh chấp. Khi một người
chọn “hawk” và người kia chọn “dove”, người “hawk” sẽ giành được toàn
bộ tài sản. Nhưng nếu cả hai chọn “hawk” sẽ dẫn đến xung đột. Các mức
lợi ích từ sự tranh chấp này được thể hiện trong Hình 7.1. Hawk Dove Hawk -2, -2 2,0 Người chơi R Dove 0, 2 1, 1 Hình 7.1
Trong ngành nghiên cứu lý thuyết trò chơi, có thể phân ra ba trạng
thái cân bằng Nash trong trò chơi này: ( Hawk, Dove ), ( Dove, Hawk ) và
một chiến lược Nash hỗn hợp mà mỗi người chơi chọn hawk với xác xuất
1/3. Để nâng cao thêm, giả định rằng trong một quần thể, các cá nhân
tương tác với một cách ngẫu nhiên theo cách thức nêu trên. Đây có thể
được coi như một phiên bản “Cơn ác mộng Hobbes” ( Hobbes’s
nightmare ), nơi không có quyền tư hữu, và bất gì ai bạn gặp đều có khả
năng tuyên bố sở hữu với tài sản của bạn. Cũng giả định rằng không có
nhân nào biết được đâu là chiến lược tối ưu nhất để sử dụng ( điều mà khá
hợp lý vì có sự tồn tại của ba trạng thái cân bằng Nash, và ngay cả ngành
nghiên cứu lý thuyết trò chơi cũng không có chỉ dẫn rõ nên lựa chọn cân
bằng nào ). Thay vào đó, các cá nhân tự sử dụng một hoặc tổ hợp xác
xuất của vài chiến lược nào đó, và dần điều chỉnh chiến lược thông qua học hỏi và sai lầm.
Cụ thể, có hai cách tiếp cận nhằm đưa học hỏi vào mô hình trò chơi.
Hoặc, giả định rằng có một xác suất p ( 0 < p < 1 ) trong nhóm sử dụng
chiến lược “hawk”, và ( 1 – p ) còn lại sử dụng “dove”, đồng thời giả định
rằng các cá nhân sẽ chuyển đổi giữa hai chiến lược tùy vào độ hiệu quả
khi sử dụng chiến lược này so với chiến lược kia. Hoặc, ta có thể giả định
mỗi cá nhận sử dụng một hỗn hợp các chiến lược, và điều chỉnh mức hỗn
hợp dựa trên kinh nghiệm áp dụng từng chiến lược thuần túy ( VD: Tăng
giá trị p khi chiến lược “hawk” có kết quả tốt hơn hơn “dove” và ngược
lại ). Dù là cách tiếp cận nào, về cơ bản, phân tích vẫn giống nhau. Con
người sẽ hành động logic vì họ biết được rằng chiến thuật nào sẽ cho kết
quả tốt nhất mỗi khi trò chơi được lặp lại. Tất nhiên, sự “logic” không nhất
thiết sẽ phản ánh sự học hỏi có ý thức. Theo như sinh học, các cá thể có
mức thích nghi tốt hơn sẽ sinh sản tốt hơn. Giống như vậy, những người
nhận được kết quả thấp trong dài hạn có xu hướng sẽ bắt chước chiến
lược của những người có kết quả cao hơn.
Để thấy được sự phát triển của cách sử dụng các chiến lược trong
quá trình học hỏi trên, hãy xét đến lợi ích được kỳ vọng khi các chiến lược
có khả năng p sẽ đối đầu với chiến lược “hawk” ( có thể bởi đây là tỉ lệ các
cá nhân trong quần thể hiện dang chọn chiến lược này, hoặc đây là xác
suất trung bình trong kết hợp các chiến lược đang được các cá nhân trong quần thể áp dụng ): E(H)
= p( -2 ) + ( 1 – p ) = 2 – p 4 E(D) = p( 0 ) + ( 1 – p ) = 1 -p
( Nhớ lại Chương 2, trong cân bằng Nash với chiến lược hỗn hợp
NEMS, có điều kiện rằng E(H) = E(D), dẫn đến p = 1/3 ). Do đó, lợi nhuận
kỳ vọng từ việc chọn chiến lược “hawk” sẽ lớn hơn so với “dove” khi p <
1/3, khuyến khích các cá nhân chuyển sang chiến lược “hawk” ( tức p sẽ
tăng ). Ngược lại, khi p > 1/3, lợi nhuận kỳ vọng từ việc chọn “dove” sẽ lơn
hơn so với “hawk” ( tức p sẽ giảm ). Từ đó, có thể kết luận rằng quá trình
phát triển của trò chơi sẽ dẫn đến trạng thái mà trong đó có tỉ lệ 1/3 quần
thể sẽ sử dụng chiến lược “hawk”, vì nếu tỉ lệ này giảm thì p sẽ tăng và ngược lại.
Trên thực tế, p = 1/3 chính là một ESS ( điều này đã được ngầm hiểu
trong các lập luận trước đó ). Để thấy điều này một cách cụ thể, giả sử I là
chiến lược với p = 1/3 và J là bất kỳ chiến lược nào khác, mà trong đó một
người chơi chọn H với xác suất p’ 1/3. Trong trường hợp này, E(I, I) =
E(J, I) vì với p = 1/3, lợi nhuận kỳ vọng từ H bằng với D, và bất kì sự kết
hợp xác suất nào của chúng đều sẽ cho cùng một lợi nhuận kỳ vọng như
nhau. Theo như (7.2), ta biết p = 1/3 là một ESS chỉ khi E(I, J) > E(J, J). Tuy nhiên, E(I, J) = [
p -2p’ - 2 ( 1 - p' )] + ( 1 – p ) ( 1 – p' ) = - 2p’
E(J, J) = p'[ - 2p’ + 2( 1 - p' )] + ( 1 - p' ) = 1 – 3p'
Qua quan sát, ta thấy E(I, J) luôn lớn hơn E(J, J), do đó điều kiện (7.2)
thỏa mãn rằng: chiến lược hỗn hợp với p = 1/3 là một ESS. Nhân đây,
cũng cần nhớ rằng trạng thái cân bằng Nash với chiến lược hỗn hợp trong
trò chơi này cũng được xác định bởi p = 1/3. Do đó, có thể nhận định một
cách khá bất ngờ, rằng sự phát triển của trò chơi đối xứng này lại cung
cấp cơ sở ủng hộ cho khái niệm cân bằng Nash trong chiến lược hỗn hợp
(NEMS) - xem thêm tại Chương 2.
7.2.2 Tiến hóa phi đối xứng: Hành vi gắn với vai trò
Các nhà sinh học cũng đã quan tâm đến sự tiến hóa của các kiểu
hình mới, do đó họ đã nghiên cứu sự tiến hóa của các trò chơi khi xuất
hiện các chiến lược mới ( tức các kiểu hình mới ). Một cách mà chiến lược
mới có thể xuất hiện mà không làm thay đổi cấu trúc của trò chơi là thông
qua việc điều kiện hóa việc sử dụng một chiến lược đã có dựa trên một
đặc điểm ngoại sinh của tương tác (nghĩa là một yếu tố nằm ngoài mô
hình lý thuyết trò chơi). Chẳng hạn, đặc điểm ngoại sinh này có thể là
vòng bụng, chiều cao, độ tuổi, v.v. của người chơi, và có thể được dùng để
phân chia người chơi thành vai trò R (ví dụ: béo, cao, già, tùy thuộc vào
yếu tố ngoại sinh được chọn) hoặc vai trò C (tương ứng là gầy, thấp, trẻ,
v.v.). Quy tắc hành vi mới sẽ có dạng: “Nếu được gán vào vai trò R sẽ chọn chiến lược ,
x nếu thuộc vai trò C thì sẽ chọn chiến lược y”. Trò chơi
như này được gọi là trò chơi phi đối xứng, nhằm phản ánh thực tế rằng các
người chơi sẽ học cách phân biệt, và gán cho mỗi cá nhân một vai trò
khác nhau. Điều này cũng khiến quá trình học hỏi tinh vi hơn vì nó gắn với
từng vai trò cụ thể. Tuy nhiên, sự tiến hóa của trò chơi lặp lại phi đối xứng
này vẫn có thể được nghiên cứu dễ dàng dưới ảnh hưởng của cơ chế học hỏi.
Giả định rằng p là xác xuất mà những người chơi thuộc vai trò R sẽ
chọn chiến lược “hawk” (H), trong khi q là xác suất mà những người có vai
trò C sẽ chọn “hawk”. Gọi E(X|K) là lợi nhuận kỳ vọng của một người chơi
có đặc điểm K khi lựa chọn chiến lược .
X Khi đó, lợi nhuận kỳ vọng của
người chơi thuộc vai trò R và C khi chọn từng chiến lược được xác định như sau: E(H| R) = E(D| R) = E(H| C) = E(D| C) =
Với cùng một quy tắc học hỏi như trước, ta có thể suy rằng xác suất
p sẽ được điều chỉnh tăng lên bởi những người chơi thuộc vai trò R khi q <
1/3, và giảm khi q > 1/3. Tương tự, xác suất q sẽ tăng lên bởi những ngươi
thuộc vai trò C khi p < 1/3, và giảm xuống khi p > 1/3. Hình 7.2 minh họa
các cộng thái tiến hóa này:
Hình 7.2Quan sát biểu đồ pha cho thấy tồn tại một cân bằng Nash không ổn định
của (p, q) tại (1/3, 1/3), và trạng thái cân bằng Nash ổn định tại (1, 0) và (0, 1). Cân
bằng thứ nhất là không ổn định, vì hầu hết các quỹ đạo – ngoại trừ một –
đều phân kỳ khỏi điểm này). Do đó, nếu loại trừ cân bằng Nash không ổn
định, phiên bản phi đối xứng của trò chơi sẽ tiến hóa đến trạng thái mà
hoặc vai trò R luôn chọn chiến lược “hawk” còn C chọn “dove”, hoặc
ngược lại. Đây là một kết quả đáng chú ý. Trước khi thảo luận chi tiết,
phân tích chính thức cần được hoàn thiện bằng cách chứng minh rằng hai
điểm cân bằng ổn định này là các chiến lược ESS.
Giống trước đó, các điều kiện (7.1) và (7.2) cần được thỏa mãn.
Trong những trường hợp này, một chiến lược phải được diễn giải dưới dạng
cặp (p, q), thay vì chỉ là một xác suất đơn lẻ p như trong phiên bản đối
xứng của trò chơi. Các chiến lược (1, 0) và (0, 1) rõ ràng thỏa mãn các
điều kiện này, bởi vì phản ứng tối ưu khi đối thủ chắc chắn dùng chiến
lược “hawk” là dùng “dove”, và ngược lại. Bây giờ, hãy xem xét I = (1/3,
1/3) (là NEMS từ chương 2) và J = (p’, q’), trong đó J ≠ I. Liệu I có phải là
một chiến lược ổn định tiến hóa (ESS) không? Vì E(I, I) = E(J, I) trong
trường hợp này, điều kiện quan trọng cần được thỏa mãn để đảm bảo tính
ổn định là phần thứ hai của (7.2), tức là: =
Tuy nhiên, điều kiện này chỉ được thỏa mãn nếu cả p’ và q’ đều lớn
hơn 1/3 hoặc cả hai đều nhỏ hơn 1/3. Đối với bất kỳ tổ hợp (p’, q’) nào
khác, chiến lược I = (1/3, 1/3) có thể bị xâm nhập. Do đó, chiến lược này
không phải là một chiến lược ổn định tiến hóa (ESS), một kết luận củng cố
thêm nghi ngờ của chúng ta từ Chương 2 rằng điểm cân bằng Nash trong
chiến lược hỗn hợp (NEMS), mặc dù có giá trị lý thuyết, sẽ không thực sự xảy ra trong thực tế.
7.3 MỘT SỐ SUY LUẬN TỪ QUÁ TRÌNH
TIẾN HÓA CỦA TRÒ CHƠI DIỀU HÂU - BỒ CÂU
7.3.1 Bốn nhận xét
Vậy, đã đủ lý thuyết. Hãy chuyển sang một số suy luận chung có thể
rút ra từ các trò chơi trong bối cảnh tiến hóa.
Tính ổn định tiến hóa và điểm cân bằng Nash
Thứ nhất, quay lại thảo luận về khái niệm điểm cân bằng Nash (xem
Chương 2), tất cả các ESS đều là các điểm cân bằng Nash, nhưng không
phải mọi điểm cân bằng Nash đều là ESS. Do đó, lý thuyết trò chơi tiến
hóa cung cấp một số cơ sở lý luận cho khái niệm điểm cân bằng Nash
(xem thêm mục 7.7). Tuy nhiên, một cách nghịch lý, khái niệm điểm cân
bằng Nash bắt đầu trở nên thuyết phục hơn theo quan điểm này khi giả
định một hình thức hợp lý không hoàn hảo. Nói cách khác, nó không được
suy ra như một hệ quả của giả định về kiến thức chung về tính hợp lý, vốn
là cách tiếp cận truyền thống của lý thuyết trò chơi chính thống.
Sự hấp dẫn của tính bất đối xứng
Thứ hai, cụ thể hơn, có kết quả cho thấy mặc dù lối chơi đối xứng
của trò chơi này tạo ra một điểm cân bằng duy nhất, điểm cân bằng này
trở nên không ổn định ngay khi việc phân vai bắt đầu và một số người chơi
nhận ra tính bất đối xứng. Vì các tác nhân sáng tạo dường như có xu
hướng thử nghiệm các cách chơi trò chơi khác nhau, sẽ thật đáng ngạc
nhiên nếu không bao giờ có sự lệch hướng nào dựa trên tính bất đối xứng.
Thực tế, điều này còn hơn cả đáng ngạc nhiên, bởi có nhiều bằng chứng
hỗ trợ ý tưởng rằng con người tìm kiếm những lý do “ngoại lai” để giải
thích cho những hành vi thực chất là ngẫu nhiên (xem khung bên cạnh về các chuỗi chiến thắng)
Về mặt chính thức, điều này đưa chúng ta trở lại với vấn đề cũ về cách
thức đạt được lời giải cho trò chơi. Tuy nhiên, lý thuyết trò chơi tiến hóa ít
nhất cũng chỉ ra một hướng đi cho câu trả lời. Biểu đồ pha trong Hình 7.2
cho thấy việc lựa chọn một điểm cân bằng phụ thuộc mạnh mẽ vào tập
hợp niềm tin ban đầu (được tóm tắt trong cặp (p, q) ban đầu). Đối với một
số niềm tin, cụ thể là những niềm tin nằm trong các góc phần tư tây-bắc
và đông-nam, điều này đủ để xác định điểm cân bằng Nash nào được
chọn. Tuy nhiên, đối với các niềm tin khác, cụ thể là những niềm tin nằm
trong các góc phần tư tây-nam và đông-bắc, việc lựa chọn điểm cân bằng
còn phụ thuộc vào quy tắc học hỏi cụ thể (tức là cách thức chính xác mà p
và q được điều chỉnh tăng hoặc giảm), vì điều này sẽ quyết định liệu niềm
tin có tiến hóa vào góc phần tư tây-bắc hay đông-nam hay không. Nói một
cách bớt khô khan hơn, vì tính hợp lý trong trường hợp này chỉ chịu trách
nhiệm cho xung lực chung hướng tới việc bắt chước hành vi mang lại lợi
nhuận, lịch sử của trò chơi phụ thuộc một phần vào những đặc điểm riêng
biệt và không thể đoán trước (có thể nói là phi lý tính, trái ngược với bất
hợp lý) của niềm tin và quá trình học hỏi của từng cá nhân. Hộp 7.1
CHUỖI THẮNG VÀ CHUỖI THUA?
Mọi người thường nói đến chuỗi thắng hoặc chuỗi thua để mô tả một quá Các quy ước
Thứ ba, có thể nhận thấy rằng việc lựa chọn một chiến lược ổn định
tiến hóa (ESS) thay vì một chiến lược khác thể hiện một quy ước theo
nghĩa của Lewis (1969). Điều duy trì hành vi của những người chơi vai R,
chẳng hạn, nhượng bộ trong khi những người chơi vai C chiếm toàn bộ lợi
ích (ví dụ: p=0, q=1), đơn giản là dự đoán của người chơi rằng điều này sẽ
xảy ra, bởi vì, với những dự đoán này, hành vi như vậy tối đa hóa lợi ích
của mỗi bên. Dự đoán thay thế, rằng những người chơi vai R chiếm toàn
bộ lợi ích trong khi những người chơi vai C nhượng bộ (p=1, q=0), cũng có
thể được duy trì nếu tập hợp dự đoán thay thế này được đám đông chấp
nhận. Do đó, hành vi tại một trong những ESS này được xác định theo quy
ước, và để nhắc lại điểm trước đó, chúng ta có thể vẽ biểu đồ sự xuất hiện
của một quy ước cụ thể bằng cách sử dụng biểu đồ pha này. Điều này sẽ
phụ thuộc vào cả giả định rằng các tác nhân học hỏi từ kinh nghiệm
(thành phần hợp lý của lời giải thích) và những đặc điểm riêng biệt (và phi
lý tính) của niềm tin ban đầu cũng như các quy tắc học hỏi cụ thể.
Dĩ nhiên, quan sát này chỉ khiến các nhà lý thuyết trò chơi lo ngại
nếu những đặc điểm riêng biệt này tạo ra một sự khác biệt đáng kể, theo
nghĩa rằng chúng không chỉ đóng góp vào việc lựa chọn điểm cân bằng
mà các đặc tính của một điểm cân bằng còn khác biệt đáng kể so với các
điểm cân bằng khác. Điều này dẫn trực tiếp đến quan sát tiếp theo.
Sự bất bình đẳng
Thứ tư, việc lựa chọn một điểm cân bằng thay vì một điểm cân bằng
khác có thể mang ý nghĩa rất quan trọng. Trong thực tế, trong trò chơi
hawk-dove liên quan đến tài sản tranh chấp, điều xảy ra trong quá trình
tiến tới một trong các chiến lược ổn định tiến hóa (ESSs) là sự thiết lập
một hình thức quyền sở hữu tài sản. Hoặc những người chơi vai R giành
được tài sản và những người chơi vai C nhượng bộ quyền này, hoặc những
người chơi vai C giành được tài sản và những người chơi vai R nhượng bộ
quyền này. Điều này thú vị không chỉ vì nó chứa đựng mầm mống của một
lời giải thích khả thi về quyền sở hữu tài sản (mà chúng ta sẽ thảo luận
thêm sau này) mà còn vì xác suất được phân vai R hoặc vai C khó có thể
được phân bố đồng đều trong dân số. Thực tế, sự phân bố này sẽ phụ
thuộc vào bất kỳ nguồn gốc nào của sự phân biệt được sử dụng để phân
vai cho mọi người. Ví dụ, sự phân bố tài sản có khả năng rất khác biệt
trong một xã hội nơi việc phân vai phụ thuộc vào giới tính và độ tuổi, so
với, chẳng hạn, chiều cao. Trong trường hợp đầu, hoặc những người cao
hoặc những người thấp sẽ lần lượt được hưởng lợi và bị bất lợi. Trong khi
đó, ở trường hợp sau, có thể là phụ nữ lớn tuổi bị thiệt thòi, trong khi nam
giới trẻ tuổi thống trị; hoặc một số kết hợp thứ bậc khác của những khác
biệt về độ tuổi và giới tính này.
7.3.2 Nguồn gốc của các quy ước và thách thức đối với chủ nghĩa
cá nhân phương pháp luận Hộp 7.2
TÍNH NỔI BẬT VÀ TRỌNG TÂM TRONG ĐỜI SỐNG XÃ HỘI
Thomas Schelling đã thực hiện một loạt thí nghiệm với sinh viên của
mình, qua đó hé lộ một khả năng đáng ngạc nhiên của con người trong
việc phối hợp các quyết định của họ. Xét theo lý thuyết trò chơi chính
thống, các thí nghiệm này nêu bật vấn đề lựa chọn trạng thái cân bằng
mà chúng ta đã bàn luận trước đó; tuy nhiên, trên thực tế, dường như
con người có thể giải quyết vấn đề này bằng cách tìm ra một khía cạnh
nào đó của tình huống mang tính nổi bật – theo cách mà lý thuyết trò
chơi hình thức thường bỏ qua. Dưới đây là một vài ví dụ từ các thí
nghiệm ban đầu của Schelling (xem Schelling, 1963).
1. Gọi tên sấp hay ngửa. Nếu bạn và người cùng chơi chọn trùng
nhau, cả hai đều thắng giải thưởng.
36 người chọn ngửa và chỉ có 6 người chọn sấp.
2. Bạn được yêu cầu gặp ai đó tại thành phố New York. Bạn không
được chỉ dẫn nơi gặp; bạn không có sự thống nhất trước với
người kia về địa điểm; và hai người không thể liên lạc với nhau.
Bạn chỉ có thể đoán nơi gặp.
Phần lớn người tham gia chọn Grand Central Station.
3. Bạn được thông báo ngày gặp nhưng không được cho biết giờ.
Bạn sẽ xuất hiện vào lúc nào?
Hầu như tất cả đều chọn 12 giờ trưa.
4. Bạn được yêu cầu chia $100 thành hai phần, được ghi nhãn là A và B.
Đối tác của bạn cũng chia một khoản $100 khác thành hai
phần, cũng được ghi nhãn A và B.
Nếu bạn chia cùng tỉ lệ cho A và B như đối tác, mỗi người sẽ nhận được $100.
Ngược lại, cả hai sẽ không nhận được gì.
36 trên 41 người chia khoản tiền thành hai phần bằng nhau – mỗi phần $50. Như Schelling gợi ý:
Những vấn đề này là nhân tạo, nhưng chúng minh họa rõ ràng cho luận điểm.
Con người thường phối hợp ý định hoặc kỳ vọng của mình với người khác
khi cả hai đều biết rằng đối phương cũng đang cố làm điều tương tự.
Phần lớn các tình huống... cung cấp một số manh mối cho hành vi phối
hợp — một điểm trọng tâm (focal point) cho kỳ vọng của mỗi người về
những gì người kia kỳ vọng ở mình.
Việc tìm ra “điểm mấu chốt” đó... có thể phụ thuộc ít vào logic hơn mà
nhiều vào tương đồng, phép ẩn dụ, bố cục không gian, sự đối xứng, hoặc
nét thẩm mỹ – hình học của hoàn cảnh.
Vậy, cách thức một nguồn phân biệt được thiết lập trở nên khá quan
trọng. Một số nhà lý thuyết trò chơi tiến hóa đã cố gắng giải thích việc lựa
chọn một đặc điểm ngoại lai nào đó bằng cách viện dẫn ý tưởng về sự nổi
bật hoặc tính dễ nhận biết (xem Schelling, 1963). Một số khía cạnh của
tình huống xã hội dường như nổi bật hơn và trở thành các “điểm tập
trung” mà quanh đó các cá nhân phối hợp quyết định của họ (xem Hộp
7.2 để biết một số bằng chứng về khả năng đáng ngạc nhiên của chúng ta
trong việc phối hợp quanh các điểm tập trung). Chẳng hạn, Sugden (1986,
1989) lập luận rằng các quy ước lan truyền từ lĩnh vực này sang lĩnh vực
khác thông qua sự tương tự. Ví dụ, “sở hữu” là một yếu tố nổi bật hoặc dễ
nhận biết trong các trò chơi tài sản như hawk-dove, dẫn đến việc dường
như “tự nhiên” khi chơi chiến lược hawk trong một trò chơi tranh chấp tài
sản hiện tại khi bạn dường như “sở hữu” tài sản, trong khi không sở hữu
tài sản tự nhiên dẫn đến việc chơi chiến lược dove. Thực tế, các nhà sinh
học tiến hóa cũng ủng hộ ý tưởng này, bởi họ nhận thấy rằng một mối
quan hệ trước đó (hơn là kích thước hay sức mạnh) dường như có vai trò
quan trọng trong các tranh chấp giữa các con đực về con cái trong thế giới
động vật (xem Maynard Smith, 1982, và Wilson, 1975). Tuy nhiên, họ
cũng chỉ ra sự “nổi bật” rõ ràng của giới tính trong thế giới tự nhiên như
một nguồn phân biệt; do đó, dường như khó có khả năng một đặc điểm
đơn lẻ, tự bản thân nó, có thể giải thích sự xuất hiện của những quy ước quan trọng này.
Có một vấn đề sâu sắc hơn và cơ bản hơn với khái niệm tính nổi bật
dựa trên sự tương tự, bởi việc gán ghép các thuật ngữ như “sở hữu” rõ
ràng là lập luận vòng vo bằng cách giả định trước sự tồn tại của một dạng
quyền sở hữu tài sản trong quá khứ. Nói cách khác, con người đã chia sẻ
một quy ước trong quá khứ, và điều này đang được sử dụng để giải thích
một quy ước liên quan chặt chẽ trong hiện tại. Do đó, chúng ta chưa đi
đến tận cùng của vấn đề liên quan đến cách thức con người hình thành
các quy ước ngay từ đầu.3 Thực tế, giả định ngầm về sự chia sẻ trước đó
cũng mở rộng đến các cách thức chia sẻ trong việc chiếu quá khứ vào hiện
tại. Trong trường hợp cụ thể này, việc viện dẫn đến “sở hữu” trước đó dựa
trên sự chia sẻ có lẽ vô hại của nguyên tắc quy nạp. Tuy nhiên, nói chung,
các quy tắc chiếu chung có khả năng phức tạp hơn, bởi tình huống hiện tại
hiếm khi lặp lại chính xác quá khứ, và do đó sự chia sẻ phải bao gồm các quy chiếu tưởng tượng.
Có hai cách để tiếp nhận quan sát này. Cách thứ nhất là thừa nhận
rằng trong bất kỳ tương tác xã hội nào mà chúng ta quan tâm, con người
thực sự tham gia với một loạt các quy ước chung đã có từ trước (xem Hộp
7.2). Vì vậy, rõ ràng, chúng ta không thể hy vọng giải thích cách họ thực
sự đạt được sự phối hợp mới mà không viện dẫn đến những quy ước nền
tảng đó. Theo nghĩa này, sẽ là không khôn ngoan nếu các nhà khoa học
xã hội (và đặc biệt là các nhà lý thuyết trò chơi) bỏ qua bối cảnh xã hội
mà trong đó các cá nhân chơi các trò chơi mới.
Nói một cách khác, đây là hình thức yếu của việc thừa nhận rằng
các cá nhân được định vị trong xã hội, và nếu chúng ta dừng lại ở đó thì
nó sẽ chỉ gây ra sự bất an vừa phải với tham vọng của lý thuyết trò chơi,
theo nghĩa rằng lý thuyết trò chơi phải dựa vào những đặc điểm chưa được
giải thích của bối cảnh xã hội trong chính các giải thích của mình. Tuy
nhiên, nó cũng có thể là nguồn gốc của những câu hỏi cơ bản hơn. Rốt
cuộc, có lẽ sự tồn tại của những quy ước này chỉ có thể được giải thích
bằng cách chuyển hướng sang một bản thể học Wittgensteinian, trong
trường hợp đó nền tảng của lý thuyết trò chơi chính thống trông có vẻ
lung lay đáng kể. Để ngăn chặn sự trôi dạt này, cần có một phản ứng vững chắc hơn.
Phản ứng thay thế là phủ nhận rằng việc viện dẫn sự nổi bật hoặc
tính dễ nhận biết chung hàm ý một chuỗi hồi quy vô hạn hoặc sự thừa
nhận rằng các cá nhân mang tính chất xã hội về mặt bản thể học (tức là
chấp nhận quan điểm thực tiễn rằng mỗi cá nhân đều mang một lịch sử
riêng, nhưng phủ nhận rằng điều này làm suy yếu chủ nghĩa cá nhân
phương pháp luận). Theo hướng này, có ít nhất hai cách để, trong một bài
tập mô hình lý tưởng, giải thích sự nổi bật chung theo hai cách khác mà
không phải nhượng bộ đối với chủ nghĩa cá nhân phương pháp luận. Thứ
nhất, sự nổi bật có thể dựa trên cơ sở sinh học (và do đó được chia sẻ)
thông qua một thiên kiến nhất định trong bộ máy tri giác của chúng ta.
Điều này, dĩ nhiên, luôn là một khả năng. Tuy nhiên, chúng tôi nghi ngờ
rằng sinh học có thể giải thích toàn bộ vấn đề, bởi nó không thể lý giải
được sự đa dạng của các thực tiễn con người trong các trò chơi như vậy (xem Hộp 7.3).
Thứ hai, một nguồn gốc của sự nổi bật có thể được giải thích nếu nó
xuất hiện từ một cuộc cạnh tranh tiến hóa giữa hai hoặc nhiều nguồn gốc
tiềm năng của sự khác biệt. Đây dường như là một hướng tiếp cận tự
nhiên (và cũng là hướng được Lewis (1969) lựa chọn). Cách tiếp cận này
cũng mang tính quan tâm rộng hơn bởi vì trong nhiều bối cảnh thực tế,
việc viện dẫn một bối cảnh xã hội chung sẽ không chỉ rõ một cách rõ ràng
một nguồn gốc duy nhất của sự nổi bật. Tuy nhiên, hướng tiếp cận này
cũng có khả năng tái hiện một vấn đề/kết luận trước đó dưới một hình
thức khác. Cụ thể, phân bố ban đầu của các niềm tin (nay liên quan đến
sự nổi bật) sẽ đóng vai trò quyết định trong việc xác định nguồn gốc nào
của sự nổi bật cuối cùng giành được sự ủng hộ của toàn bộ dân số. Chúng ta sẽ chờ xem kết quả!
7.3.3 Xung đột giữa các quy ước
Để hiểu tại sao điều này có khả năng xảy ra, hãy xem xét một tình huống
trong đó tồn tại hai nguồn gốc khác biệt cạnh tranh, dẫn đến sự hình
thành của hai loại quy ước. Giả sử một quy ước phân biệt người chơi dựa
trên độ tuổi và hướng dẫn người trẻ nhường bước cho người lớn tuổi, trong
khi quy ước kia phân biệt dựa trên chiều cao và hướng dẫn người thấp
nhường bước cho người cao. Trực giác cơ bản dễ hiểu: một quy ước sẽ nổi
lên thành quy ước thống trị, và việc lựa chọn quy ước này phụ thuộc chặt
chẽ vào số lượng người ban đầu ủng hộ mỗi quy ước. Lý do rất đơn giản.
Chúng ta đang đề cập đến các quy ước, mà bản chất của chúng là hoạt
động hiệu quả hơn và trở nên mạnh mẽ hơn khi có càng nhiều người tuân
theo. Do đó, một khi cán cân nghiêng về phía một quy ước, nó nhanh
chóng tạo ra một hiệu ứng lan tỏa. Tuy nhiên, vấn đề cốt lõi là: điều gì khiến cán cân nghiêng?
Để làm rõ vấn đề này, hãy xem xét cách mà lợi ích (pay-off) từ việc
tuân theo một quy ước cụ thể phụ thuộc vào số lượng người ủng hộ quy
ước đó. Quy ước sẽ chỉ dẫn hành động tối ưu nên thực hiện khi bạn gặp
một người cũng tuân theo quy ước của bạn (ví dụ, nếu bạn là người lớn
tuổi và gặp một người trẻ tuân theo quy ước dựa trên độ tuổi, hành động
tối ưu là chơi theo kiểu "hawk"). Tuy nhiên, quy ước này sẽ dẫn bạn đến
một hành động kém hiệu quả khi bạn gặp một người tuân theo một quy
ước khác, và quy ước đó chỉ dẫn một hành động khác biệt. Dĩ nhiên, không
phải lúc nào một quy ước khác cũng gây ra xung đột. Chẳng hạn, trong ví
dụ của chúng ta, một số người trẻ có thể cao hơn một số người lớn tuổi, do
đó hai quy ước đôi khi sẽ chỉ dẫn cùng một mô hình nhường bước cho đối
thủ. Tuy nhiên, với bất kỳ mức độ chồng lấn nào giữa các quy ước như
vậy, xác suất gặp phải một người chơi theo cách trái ngược (tức là chơi
"hawk" khi bạn cũng chơi "hawk"), và do đó biến hành động của bạn
thành kém hiệu quả, sẽ phụ thuộc vào số lượng người tuân theo quy ước
trái ngược. Nói cách khác, khi số lượng người sử dụng quy ước của bạn
tăng lên, khả năng quy ước đó hướng dẫn bạn đến hành động tối ưu cũng
tăng theo. Nếu mọi người chuyển đổi giữa các quy ước dựa trên kỳ vọng
lợi ích, thì cuối cùng một quy ước sẽ nổi lên thành quy ước thống trị.
Kết luận này củng cố kết quả trước đó rằng tiến trình lịch sử phụ
thuộc một phần vào những yếu tố dường như, từ góc độ lý thuyết hành vi
lý trí mang tính công cụ, là không lý trí (và có lẽ mang tính cá biệt), và do
đó, các đặc điểm của niềm tin và hành động con người khó có thể dự đoán
một cách máy móc. Có thể diễn giải điều này theo tinh thần của chủ nghĩa
cá nhân phương pháp luận, nhưng phải chấp nhận rằng các cá nhân, ở
khía cạnh này, là khó dự đoán một cách đáng kể. Một mặt, điều này không
có lợi cho các tuyên bố giải thích của lý thuyết. Mặt khác, để khiến các cá
nhân trở nên có thể dự đoán, dường như họ phải được gắn với một lịch sử
chung, và điều này sẽ lại làm dấy lên mối quan ngại về phương pháp luận
rằng liệu chúng ta có thể giải thích sự chia sẻ này một cách thỏa đáng mà
không cần thay đổi bản thể học hay không. Tóm lại, nếu các cá nhân được
gán cho một lịch sử chung, thì bối cảnh xã hội không đứng “phía sau” bất
kỳ ai mà nằm “bên trong” tất cả mọi người. Khi đó, câu hỏi đặt ra là liệu
việc phân tích hành vi bằng cách giả định (như các nhà cá nhân phương
pháp luận thực hiện) sự tách biệt giữa bối cảnh và hành động có phải là
Có một khía cạnh bổ sung trong phân tích này đáng được đề cập, chính
bởi vì vấn đề cạnh tranh giữa các quy ước không chỉ hấp dẫn trong các bối
cảnh xã hội thực tế mà còn trong các mô hình tái cấu trúc lý tưởng. Lợi ích
từ việc sử dụng một quy ước đối với một cá nhân cụ thể không chỉ phụ
thuộc vào tỷ lệ dân số ủng hộ quy ước đó, mà còn phụ thuộc vào tần suất
quy ước đó được gán vai trò thống trị. Do đó, xu hướng chung của dân số
hướng tới quy ước đang nổi lên có thể diễn ra trong bối cảnh tồn tại các
chuyển động ngược chiều, chẳng hạn, theo ví dụ trước, những người lớn
tuổi bị thu hút bởi quy ước dựa trên độ tuổi, còn những người thấp bị thu
hút bởi quy ước dựa trên chiều cao. Thực tế, những chuyển động ngược
chiều này có thể đóng vai trò rất quan trọng trong việc xác định quy ước
nào trở nên phổ biến hơn.một ý tưởng phù hợp hay .
Có một khía cạnh bổ sung trong phân tích này đáng được đề cập,
chính bởi vì vấn đề cạnh tranh giữa các quy ước không chỉ hấp dẫn trong
các bối cảnh xã hội thực tế mà còn trong các mô hình tái cấu trúc lý
tưởng. Lợi ích từ việc sử dụng một quy ước đối với một cá nhân cụ thể
không chỉ phụ thuộc vào tỷ lệ quần thể ủng hộ quy ước đó, mà còn phụ
thuộc vào tần suất quy ước đó được gán vai trò thống trị. Do đó, xu hướng
chung của quần thể hướng tới quy ước đang nổi lên có thể diễn ra trong
bối cảnh tồn tại các chuyển động ngược chiều, chẳng hạn, theo ví dụ
trước, những người lớn tuổi bị thu hút bởi quy ước dựa trên độ tuổi, còn
những người thấp bị thu hút bởi quy ước dựa trên chiều cao. Thực tế,
những chuyển động ngược chiều này có thể đóng vai trò rất quan trọng
trong việc xác định quy ước nào trở nên phổ biến hơn.
Để nhìn nhận vấn đề một cách rõ nét hơn, giả sử hai quy ước có số
lượng người sử dụng bằng nhau. Kỳ vọng lợi ích từ việc sử dụng mỗi quy
ước là như nhau khi mỗi cá nhân có xác suất 50% trở thành bên có lợi ở
mỗi quy ước. Bây giờ, giả sử một quy ước thực tế phân bổ lợi thế một cách
bất bình đẳng hơn so với quy ước kia. Điều này sẽ khuyến khích một số
người từ quy ước bình đẳng chuyển sang quy ước bất bình đẳng (cụ thể,
những người tin rằng họ sẽ hưởng lợi dưới quy ước bất bình đẳng hơn 50%
số thời gian). Đồng thời, những người thiệt thòi dưới quy ước bất bình đẳng
sẽ bị thu hút bởi quy ước bình đẳng. Chuyển dịch tương đối của quần thể
ban đầu sẽ được quyết định bởi các chuyển dịch được kích hoạt bởi sự
khác biệt trong đặc tính của mỗi quy ước liên quan đến phân bố lợi thế thống trị.
Các biểu thức (7.3) và (7.4) minh họa điều này. Giả định rằng trong
bối cảnh trò chơi hawk—dove ở Hình 7.1, tồn tại hai quy ước (p và f).
Chúng ta có các xác suất sau:
p – xác suất để một người chơi π tương tác với người chơi π khác =
Tỷ lệ người chơi theo quy ước π
q – xác suất để một người chơi ɸ tương tác với người chơi ɸ khác =
Tỷ lệ người chơi theo quy ước ɸ
k – tỷ lệ của tất cả các tương tác giữa các quy ước mà trong đó các
người chơi được chỉ dẫn bởi các quy ước (khác nhau) của họ để chơi theo cùng một cách thức
r – xác suất để một người chơi π được hướng bởi π để chơi “dove”
s – xác suất để một người chơi ɸ được hướng bởi ɸ để chơi “dove”
Trong Hình 7.3, chúng ta có sơ đồ cây liệt kê tất cả các khả năng đối với
một người chơi theo quy ước π gặp phải trong trò chơi Diều hâu – Bồ câu,
khi một người lạ phải tuân theo một trong hai quy ước π hoặc ɸ. Kết quả 1 002-2 2 Đ ( ) p ( ) p Đối phương là ngườ
Đối phương là Ngugi chơi ɸ Hình 7.3 ( 1 – p )
Xác suất trong ngoặc dưới các mũi tên
Đối thủ là người chơi π Đối thủ là người Hawk
Biểu thức sau đây cho lợi nhuận kỳ vọng của người chơi p xuất phát từ sơ đồ cây ở trên: (7.3)
Tương tự, ta có phép tính: (7.4)
Việc kiểm tra kỹ lưỡng các biểu thức này cho thấy tồn tại một phạm vi rộng các giá trị , k r và s mà tại đó và
lần lượt là các hàm tang của
p và q. Điều này xác nhận quan
sát trước đó rằng các chuyển động Người chơi π dân số
có thể tạo ra hiệu ứng bandwagon ủng hộ
một quy ước một khi nó nổi lên như là quy
ước mang lại lợi ích kỳ vọng vượt trội. Tại
sao? Lý do là, dưới sự ghép đôi ngẫu
nhiên của người chơi, và giả sử
tăng khi p tăng thì giá trị p càng cao
( tức tỉ lệ người chơi π ) thì lợi nhuận kỳ vọng của người chơi π càng lớn. Và
lợi ích kỳ vọng càng cao, càng có nhiều người có động lực áp dụng quy
ước π. Do đó, hiệu ứng đám đông. Tuy nhiên, để điều này xảy ra ( tức để
là hàm tăng của p ), có thể chứng minh rằng điều kiện sau phải thỏa
Dĩ nhiên điều kiện tương tự áp dụng cho quy ước ɸ, cụ thể là là hàm tang theo q,
Các bất đẳng thức (7.5) và (7.6) cho thấy chuyện thú vị. Ví dụ, hãy
xem xét điều gì xảy ra khi r=2/3, hoặc s=2/3; tức là, khi các quy ước
khuyến nghị rằng một người chơi chơi “dove” với xác suất tương đương
mà tiến hóa đối xứng sẽ khuyến nghị (xem phần 7.2.1). Khi đó, vế phải
của các bất đẳng thức bằng không, và lợi ích kỳ vọng từ mỗi quy ước sẽ là
các hàm tăng của số lượng người tuân theo nó, miễn là dĩ nhiên >0; k tức
là, miễn là tồn tại ít nhất một khả năng nhỏ rằng một đối thủ tuân theo
một quy ước khác với bạn sẽ chơi cùng chiến lược như bạn khi hai bên gặp nhau.
Vậy, chúng ta thấy rằng, bắt đầu từ chỉ một quy ước duy nhất áp
dụng cho tất cả, quy ước đối xứng ban đầu có thể phân chia thành hai (π
và ɸ). Nói cách khác, một đặc tính phân biệt thứ hai có thể xuất hiện và,
khi nó thu hút thêm nhiều người ủng hộ, những cá nhân đã tuân theo nó
sẽ hưởng lợi (miễn là >0). k
Quy ước nào sẽ mang lại lợi ích vượt trội hơn
cho người ủng hộ của nó? Chúng ta không thể xác định theo cách trừu
tượng. Những gì chúng ta có thể xác định là người ủng hộ của một quy ước
sẽ đạt kết quả tốt hơn, trong khi những người của quy ước kia sẽ kém hơn.
Lý do là khi chỉ tồn tại hai quy ước, =1-q p
(tức là, khi một cá nhân chuyển
sang một quy ước thì họ tự động từ bỏ quy ước kia), và do đó, khi một số
cá nhân bắt đầu chuyển sang π (ví dụ), những người tuân theo p sẽ hưởng
lợi ích cao hơn trong khi những người tuân theo ɸ sẽ chịu thiệt thòi. Một hệ
quả thú vị từ điều này là một quy ước có khả năng làm lệch hướng tương
tác của người theo nó hướng tới các cá nhân đồng quy ước sẽ có khả năng
tồn tại bền vững hơn so với một quy ước không đạt được điều đó.
Để minh họa một điểm khác một cách đơn giản, hãy giả định rằng
các ghép đôi là ngẫu nhiên: vậy
p là tỷ lệ dân số tuân theo quy ước π, và nó bằng 1- .
q Hơn nữa, giả sử p bằng 0.5. Lợi ích kỳ vọng cho một cá nhân
với xác suất 1-r=1-s được gán vai trò thống trị dưới mỗi quy ước giờ đây là
giống nhau, đặt toàn bộ nhóm người vào tình trạng cân bằng mong manh,
sẵn sàng cho hiệu ứng bandwagon lăn về phía một quy ước này hoặc quy
ước kia. Bây giờ, hãy tưởng tượng cách mà tình trạng cân bằng mong
manh này bị xáo trộn khi một quy ước không mang lại cho mọi cá nhân
tuân theo nó cơ hội như nhau để được gán vai trò thống trị (tức là, khi r và
s không giống nhau đối với tất cả người chơi dùng π và ɸ tương ứng).
Dĩ nhiên, đối với toàn bộ dân số, luôn tồn tại xác suất 1-r = 1-s được
gán vai trò thống trị dưới mỗi quy ước tại bất kỳ thời điểm nào, vì lợi ích kỳ
vọng bình quân đầu người đối với những người tuân theo mỗi quy ước vẫn
giống nhau. Tuy nhiên, sự phân bố lợi ích đó có thể biến thiên giữa các cá
nhân tuân theo trong các lượt chơi lặp lại, bởi một số cá nhân cụ thể có
thể được gán vai trò thống trị thường xuyên hơn hoặc ít hơn so với con số
trung bình 1-r = 1-s của toàn nhóm. Ví dụ, dưới quy ước dựa trên chiều
cao giả định, người thấp nhất trong dân số luôn được gán vai trò thống trị,
trong khi người cao nhất luôn được gán vai trò phụ thuộc. Điều này được
thể hiện ở trên thông qua khả năng rằng xác suất r hoặc s của một cá
nhân (xem các phương trình (7.3) và (7.4)) không nhất thiết phải giống với
con số trung bình của nhóm. Do đó, ngay cả khi lợi ích kỳ vọng bình quân
đầu người được giả định là bằng nhau, các cá nhân vẫn sẽ được khuyến
khích chuyển sang quy ước mang lại cho họ cá nhân xác suất kỳ vọng cao
hơn trong việc đóng vai trò thống trị (ví dụ, người cao nhất có thể áp dụng
quy ước dựa trên độ tuổi). Vì việc tính toán chủ quan về giá trị r và s cá
nhân bị phức tạp hóa bởi thực tế rằng chúng phụ thuộc vào việc ai khác
chuyển đổi cùng bạn, sẽ là sự tình cờ thuần túy nếu những ước tính thô sơ và