Thuở bé, chúng ta vẫn đinh ninh rằng Kéo, búa, bao là trò chơi đơn thuần dựa vào may mắn, và dù thông minh đến đâu, ta cũng không dám tuyên bố mình là kẻ luôn chiến thắng. Thế nhưng, ít ai biết đây chính là phiên bản tối giản nhất của lý thuyết trò chơi trong cuộc sống thường ngày. Theo đó, quyết định và chiến thuật của mỗi người chơi đều ảnh hưởng đến chiến lược của những người còn lại.

Tiến sĩ Len Fisher, nhà vật lý học đoạt giải Ig Nobel (dành cho những thành tựu khoa học hài hước), đã tiết lộ tất cả những bí mật xung quanh trò chơi Kéo, búa, bao, hiện thân của lí thuyết trò chơi trong quyển sách cùng tên. Ông chứng minh vì sao đôi lúc chúng ta phải chấp nhận thiệt hại để đạt kết quả chung tốt nhất, cùng những cách thức xoay chuyển tình thế sao cho có lợi cho mình. Từ đó, ông đã làm rõ bản chết tưởng như phức tạp của lí thuyết trò chơi, và ứng dụng nó nhẳm giải quyết những tìn huống lưỡng nam mà chúng ta luôn phải đối mặt.

Trích đoạn sách hay

ĂN MIẾNG TRẢ MIẾNG

Quá trình đào tạo xã hội của tôi khi bé được định hình bởi hai nhân vật đáng sợ trong một câu chuyện dành cho trẻ nhỏ từ thời Nữ hoàng Victoria. Tên của họ là Bà Muốn người làm sao thì ta làm vậy và Bà Làm sao chịu vậy- hai nhân vật xuất hiện trong tác phẩm The Water Babies (tạm dịch: Những đứa trẻ dưới nước) của Charles Kingsley mà bố mẹ đã tặng cho tôi nhân dịp tôi lên bảy. Tính cách của họ khác hẳn nhau, nhưng về cơ bản đều dựa trên nguyên tắc Ăn miếng trả miếng – một chiến lược trả đũa phát huy tác dụng khi hai người hoặc một nhómngười có khảnăng chạm trán nhau thường xuyên. Các lý thuyết gia trò chơi đã phát hiện ra những tương tác lặp đi lặp lại như thế là chìa khóa quan trọng để tìm ra những giải pháp hợp tác cho bảy thế lưỡng nan chết người, bởi mối đe dọa về sự Ăn miếng trả miếng trong tương lai có thể ngăn tình trạng gian dối, và mọi người có khả năng hợp tác với bạn nhiều hơn trong tương lai nếu bạn đã hợp tác với họ trong quá khứ.

Hai nhân vật trên là hình mẫu thu nhỏ của hai phương pháp tiếp cận này: thứ nhất là củ cà rốt hợp tác, thứ hai là lời đe dọa trả đũa. Trong cuốn sách, hai nữ nhân vật đáng sợ này đóng vai những lời chỉ dẫn của lương tâm cho một cái chổi quét ống khói nhỏ tên là Tom – cái chổi này rơi xuống một dòng sông và biến thành một đứa trẻ dưới nước. Bà Muốn người làm sao thì ta làm vậythức tỉnh tôi vì bà giống mẹ tôi đến khó chịu, tức luôn ép tôi phải làm theo Nguyên tắc Vàng: “Đừng làm cho người khác điều bạn không muốn họ làm cho mình”. Bà không bao giờ trực tiếp phạt Tom khi cậu bé phá vỡ quy tắc đó, nhưng lại rất giỏi trò “tống tình”: bà chỉ cần nói cho Tom biết nó đã khiến bà thất vọng như thế nào khi phá vỡ các nguyên tắc đó, rồi để cho thằng bé tự suy nghĩ về hành vi xấu xa của mình. Thỉnh thoảng tôi vẫn còn mơ thấy bà.

BàLàm sao chịu vậy lại khiến tôi lo lắng vì mộtlý do khác. Đó là một người luôn sống theo kỷ luật, giống như bà tôi, một bà lão dữ tợn có thể đánh hơi ra mọi trò lừa gạt và trừng phạt kẻ phạm tội với sự hăng hái của một nhà tiên tri trong kinh Cựu ước. Thật không may, trò lừa gạt mà bà thường phát hiện ra lại từ tôi.

Một lần, bà bắt quả tang khi tôi mượn ống tẩu của bố để lén thử hút phía sau hàng rào. Bà đuổi theo tôi ba vòng quanh khu vườn khi tất cả những gì tôi muốn là yên tĩnh và nghỉ ngơi, và phải cố gắng lắm tôi mới có thể leo lên hàng rào ngăn giữa nhà chúng tôi với nhà thờ giáo hội bên cạnh. Khi tôi lơ lửng treo người trên hàng cây tú cầu thì bà đến bên hàng rào và nói: “Cứ đợi tới lúc mày về nhà mà xem”. Khi tôi lén trở về nhà, bà đã đợi ở đó, tay cầm ống tẩu của cha tôi và một hộp diêm. Bà bắt tôi hút hết ống tẩu để tôi chừa cái thói quen tai hại này. Cho tới nay, tôi vẫn ngờ rằng việc sau này tôi hút thuốc tẩu chỉ là để trêu bà cho bõ ghét.

Hai nữ nhân vật trong câu chuyện tượng trưng cho hai phương pháp khác nhau một trời một vực nhằm giải quyết vấn đề tương tác với người khác. Bà Muốn người làm sao thì ta làm vậythể hiện sự có qua có lại (còn được gọi làNguyên tắc Vàng) vốn nhận được sự ủng hộ của các nhà triết học từ thời Socrates trở đi và họ coi đó là nền tảng đạo đức thực tế. Nó cũng được hầu hết các tôn giáo lớn trên thếgiới ủng hộ. Chúa Jesus đã gợi ý phương pháp này trong buổi giảng đạo trên núi; Người nói: “Hãy làm cho người khác những gì mà các con muốn họ làm cho mình”. Trong buổi giảng đạo cuối cùng của mình, nhà tiên tri Hồi giáo Muhammad đã khuyên các tín đồ của Ngài rằng: họ“đừng làm tổn thương ai, để không ai có thể làm tổn thương mình”. Trong cuốn Luận Ngữ, Khổng Tử cũng viết: “Kỷ sở bất dục, vật thi ư nhân (38)”.Đạt Lai Lạt Ma thì lại nói theo cách khác: “Nếu con muốn người khác hạnh phúc, hãy tập yêu thương. Nếu con muốn bản thân mình hạnh phúc, hãy tập yêu thương”.

Có qua có lại là tuyên ngôn đạo đức mà nhiều người chúng ta tin tưởng, bất kể chúng ta có đức tin tôn giáo hay không. Nhiều nhà triết học đã đẩy nó đi xa hơn. Pythagoras nói:“Nếu muốn hàng xóm đối xử với anh như thế nào, thì anh hãy trở thành người như thế đối với họ trước đã”. Triết gia người Đức Immanuel Kant còn nói một cách cương quyết hơn khi ông cho rằng nó là một ví dụ của mệnh lệnh tối thượng:“Hãy hành động theo nguyên tắc đó khi nào có thể, bởi nó sẽ trở thành quy luật phổ quát”.Theo Kant, mệnh lệnh tối thượng là yêu cầu trước nhất và vô điều kiện; yêucầu này phát huy sức mạnh trong mọi tình huống và bản thân nó có quyền đòi hỏi và biện minh.

Nguyên tắc có qua có lại cung cấp những chỉ dẫn hành động về cách cư xử của chúng ta, cho dù người khác phản ứng như thế nào. Đối với Bà Muốn người làm sao thì ta làm vậy, đó cũng là một hướng dẫn thực hiện các chiến lược thực tế. Trong truyện, bà đã nói với Tom rằng: “Nếu cháu muốn người khác tin tưởng mình, cháu phải thể hiện rằng cháu tin tưởng họ trước đã. Nếu cháu muốn người khác yêu thương mình, cách tốt nhất là cháu phải thể hiện rằng cháu thương yêu họ đã. Nếu cháu muốn người khác hợp tác với mình, hãy thử hợp tác với họ đi”.

Chiến lược của BàMuốn người làm sao thì ta làm vậydựa trên đánh giá lạc quan về bản tính con người, vốn cũng phù hợp với vị trí của Kingsley là một nhà cải cách xã hội, vì ông tin tưởng vào bản tính thiện lương của con người. BàLàm sao chịu vậycó cái nhìn hoài nghi hơn về hành vi và các giá trị của con người. Làm sao chịu vậylà phương pháp được xây dựng dựa trên sự sợ hãi. Nhân vật này nói trong truyện: “Nếu cháu không thực sự tin tưởng ai, thì nếu cần hợp tác, cách tốt nhất là phải đe dọa trừng phạt những kẻ không hợp tác. Nếu cháu muốn người khác tuân phục mình và muốn người khác tuân theo những quy tắc của mình, cách tốt nhất vẫn là phải đe dọa trừng phạt”.

Cả hai phương án này đều phát triển trong tự nhiên với tư cách là phương tiện giành lấy và duytrì sự hợp tác trong những tình huống bao gồm các tương tác lặp lại giữa mỗi cá thể động vật. Chẳng hạn, loài chim chìa vôi cổ nâu sử dụng các chiến thuật trừng phạt của BàLàm sao chịu vậyđể tự vệ. “Nếu không nuôi con tao thì trứng của mày sẽ lãnh đủ” là thông điệp đe dọa mà chúng gửi tới loài chim chích sống ở các đầm lầy quanh khu vực sông Cache ở nam Illinois. Khi một con chim chích đẻ trứng, một con chim chìa vôi sẽ tới đẻ trứng ngay bên cạnh. Nếu con chim chích nuôi tất cả chỗ chim con đó, bao gồm cả con của chim chìa vôi, thì mọi chuyện đều ổn thỏa. Nhưng nếu con chim chích từ chối nhận nuôi con của chim chìa vôi, thì chim chìa vôi sẽ trả đũa bằng cách quay lại tổ của chim chích để ăn hoặc phá những quả trứng của chim chích.

Ngược lại, chuột lại sử dụng chiến lược“Đừng làm cho người khác điều gì mà con không muốn họ làm cho con”của BàMuốn người làm sao thì ta làm vậy– và chiến lược này đã phát huy hiệu quả. Khi những con chuột trong một cái lồng kéo đòn bẩy để thả thức ăn xuống cho một con chuột ở lồng bên cạnh, thì con chuột nhận được thức ăn cũng sẽ kéo đòn bẩy để thả thức ăn cho con chuột kia ăn. Nói cách khác, chuột bị tác động bởi lòng tốt của chuột lạ khiến bản thân nócũng có hành động tốt, như vậy toàn bộ đàn chuột bị nhốt trong lồng cuối cùng đều trở nên vịtha hơn.

Các lý thuyết gia trò chơi gọi hành vi này là “lòng vị tha có qua có lại” và chuột không phải là loài duy nhất biết sử dụng chúng. Loài dơi quỷ sẽ cho những con dơi chưa kiếm được mồi cùng uống máu và những con được nhận ân huệ đó sẽ nhớ và trả lại ơn sau. Loài vượn cũng sẵn sàng chia sẻ thức ăn với nhau, mặc dù chúng không có mối liên hệ họ hàng. Chúng sẽ sẵn lòng giúp đỡ một con người xa lạ đang cố gắng với lấy một cái gậy, cũng giống như những em nhỏ đang tuổi tập đi sẽ làm vậy.

Chiến lược của hai bà Muốn người làm sao thì ta làm vậyvàLàm sao chịu vậyđều đóng góp vào quá trình tiến hóa của sự hợp tác trong tự nhiên, nhưng con người chúng ta nên chọn chiến lược nào? Cả hai đều tiềm ẩn yếu tố rủi ro. Nếu sử dụng Nguyên tắc Vàng của Bà Muốn người làm sao thì ta làm vậy, rủi ro mà chúng ta gặp phải là người khác sẽ không tham gia vào tiến trình vị tha có qua có lại bằng cách không làm cho chúng ta điều mà chúng ta không làm cho họ. Còn nếu áp dụng chiến lược đe dọa trừng phạt của Bà Làm sao chịu vậy, chúng ta sẽ đối mặt với một rủi ro thường trực là vòng xoáy trả đũa và trả đũa lại nếu đối phương không sợ lời đe dọa.

Rủi ro đó có thể rất thực, đặc biệt nếu một trongcác bên là một đứa trẻ đang bị tổn thương với cảm giác bất công. Khi bà bắt tôi hút cái tẩu thuốc, tôi đã trả đũa bằng cách bắt một con cóc thả vào giường bà. Bà trả đũa lại tôi bằng cách mách bố tôi và tôi phải hứng chịu hậu quả đau đớn. Tôi không dám nói chuyện gì xảy ra tiếp theo, ngoại trừ phải thú nhận một điều là khi tôi phóng tên lửa vào phòng ngủ của bà, điều đó không vô tình như tôi đã mô tả ở chương 2 đâu.

Điểm khởi đầu của các chu trình Ăn miếng trả miếng là khi có người cảm thấy ức chế. Tôi đã từng trải qua một ví dụ thú vị khi còn là một nhà khoa học nghiên cứu trong một tổ chức của chính phủ. Một vài nhân viên kỹ thuật thường xuyên đi muộn. Vị quản lý quyết định rằng sẽ phải để một sổ ghi danh để họ ghi nhận giờ đi giờ đến, nhưng một số nhân viên kỹ thuật lại cảm thấy bất công vì các nhà khoa học nghiên cứu lại không bị yêu cầu phải ký vào sổ đó. Trong con mắt của một người Úc công bằng thì chỉ có một giải pháp rõ ràng – đó là ăn cắp cuốn sổ. Vị quản lý đáp trả bằng những lời đe dọa trừng phạt khủng khiếp nếu kẻ cắp không trả lại cuốn sổ. Và thế là cuốn sổ xuất hiện trở lại. Để giữ an toàn cho nó, vị quản lý đã đóng chặt nó vào một cái bàn gỗ chắc. Ngày hôm sau, cả cái bàn và cuốn sổ gắn trên đó đều bị đánh cắp. Và thế là không còn ai nhắc thêm gì về cuốn sổ nữa.

Thật không may, trong thế giới người lớn, chu trình Ăn miếng trả miếng có thể dẫn đến những hệquả nghiêm trọng hơn, chẳng hạn như những vụ ly dị lùm xùm, tình trạng bạo lực, khủng bố và chiến tranh. Những vụ đánh bom liều chết ở Trung Đông được đáp trả bằng những cuộc tấn công bằng tên lửa, và rồi chúng lại khiến những vụ đánh bom xuất hiện nhiều hơn, tạo thành một chu trình bạo lực không hồi kết. Không ai thực sự có được tiếng nói quyết định sau cùng trong những chu trình trả đũa như vậy. Nếu sử dụng chiến lược của BàLàm sao chịu vậylà đe dọa trừng phạt và trả đũa để thiết lập và duy trì sự hợp tác, thì chúng ta cần phải tìm ra một cách thức nào đó để phá vỡ những chu trình đó, hoặc ngăn chúng từ trong trứng nước.

Phá vỡ chu trình

Cách rõ ràng nhất để dừng một chu trình Ăn miếng trả miếng là một bên phải ngừng “trả miếng”. Oscar Wilde nói:“Hãy luôn tha thứ cho kẻ thù của bạn, vì chẳng có gì khiến chúng tức giận hơn đâu”. Sự tha thứ khiến họ tức giận là vì nó đã loại bỏ lý do tiếp tục cuộc chiến của họ. Điều đó chắc chắn đã khiến bà tôi bị sốc và tức giận khi tôi từ trường học ngày chủ nhật trở về nhà, trong đầu tràn ngập những suy nghĩ trong sáng và đẹp đẽ sau khi được nghe một bài giảng về sự tha thứ, và trước mặt bố mẹ, tôi nói tôi tha thứ cho bà vì bà đã khiến tôi bị đòn oan. Tôi và bà thực ravẫn chẳng quý mến nhau hơn, nhưng chu trình trừng phạt và trả đũa đã biến mất hẳn từ hôm đó.

Một cách khác để phá vỡ chu trình này là sử dụng lời xin lỗi, mà với vợ chồng tôi thì điều này có nghĩa là một trong hai chúng tôi sẽ ôm nhau và nói:“Anh/em xin lỗi”. Như bất kỳ ai đang yêu nhau sẽ biết, điều này đòi hỏi một số điều kiện, nhưng với vợ chồng tôi thì đây là một chiến lược mà hai bên đã nhất trí sử dụng ngay khi một người nhận ra rằng cả hai đã bị đẩy vào chu trình đổ lỗi lẫn nhau.

Nếu chu trình này không bị phá vỡ thì những cuộc đổ lỗi có thể kéo dài, như trong ví dụ lịch sử là “thế hệ bị đánh cắp” ở Úc chẳng hạn. Trong giai đoạn 1900 – 1970, các chính phủ kế tiếp nhau ở đây đã theo đuổi chính sách cưỡng chế khi đưa những đứa trẻ lai thổ dân ra khỏi gia đình của chúng và trao cho những người da trắng nhận làm con nuôi hoặc đưa vào nhà trẻ mồ côi. Tất cả đều được thực hiện với ý định tốt, nhằm tạo cho những đứa trẻ đó cơ hội sống “tốt hơn” nhưng tác động của nó đối với những đứa trẻ và gia đình của chúng (như trong bộ phimRabbit-Proof Fence) lại rất lớn. Các chính phủ kế nhiệm đã từ chối xin lỗi vì đã tạo ra giai đoạn đáng xấu hổ này trong lịch sử nước Úc, điều đó làm nảy sinh một chu trình đổ lỗi và biện hộ. Nhưng chính phủ hiện tại đã nhanh tayhành động và gửi một lời xin lỗi vô điều kiện tới các cá nhân và gia đình bị ảnh hưởng. Động thái này đã khiến chovết thương lớn có dịp lành lại. Có lẽ những chính phủ khác và những xã hội bị chia rẽ khác, có thể học hỏi được từ điều đó.

Dĩ nhiên, tốt hơn hết là những chu trình đó không nên được bắt đầu. Chiến lược trao đổi của Bà Muốn người làm sao thì ta làm vậylà nhổ tận gốc các chu trình Ăn miếng trả miếng bằng cách ra tay trước. Bà khuyên: “Đừng làm gì có thể khiến người khác nghĩ tới chuyện trả đũa, nhưng hãy hành động với người khác như thể con muốn họ đối xử với mình trong hoàn cảnh tương tự”. Chúng ta cũng thường xuyên làm điều này. Hành động đó của chúng ta được gọi làNghịch lý Samaritan, bởi nó giống với hành vi được mô tả trong Kinh Thánhvề người Samaritan tốt lành (trích kinh Phúc âmchương 10, dòng 25-37). Người này đối xử tử tế với một người lạ dù ông ta biết rằng mình có thể không bao giờ gặp lại người lạ đó nữa. Khó có thể hình dung được sự tiến hóa của hành vi vị tha này ngay cả khi bản thân bị thiệt thòi mà không hề nghĩ đến phần thưởng. Có thể chúng ta nên tự làm điều đó thay vì để nó áp đặt lên chúng ta thông qua tiến hóa. Nếu như vậy, thì chúng ta cũng có thể tự làm những việc khác nữa.

Tác giả Lawrence Durrell cũng tạo ra một biến thể của chiến lược của Bà Muốn người làm sao thì ta làm vậy cho bản thân khi ông kết luận từ kinh nghiệm của mình trong thời gian sống ở những hòn đảo Hy Lạp rằng: “Để tước vũ khí của người Hy Lạp, ta phải ôm lấy anh ta”. Khi còn sống ở Đảo Síp trước khi chủ nghĩa khủng bố nổ ra làm chia rẽ đất nước này, ông đã có cơ hội kiểm chứng kết luận của mình khi đối mặt với một người hàng xóm hung hăng, hay say xỉn, hay vung dao và thường lầm bầm chửi tục vì có người Anh xuất hiện trong làng mình. Thay vì phản ứng lại sự đối đầu đó, ông đứng lên và ôm lấy người hàng xóm rồi nói:

– Xin đừng để người khác nói rằng người Hy Lạp và người Anh rút gươm ra đánh nhau.

Người hàng xóm sửng sốt, đút con dao vào vỏ rồi ôm lại Durrell và nói:

– Không, tôi không bao giờ làm thế đâu.

Tuy nhiên, những người khác không phải lúc nào cũng phản ứng lại tương tự như thế. Sự tử tế có thể bị coi là dấu hiệu của sự yếu đuối – điều này đã xảy ra với một người bạn của tôi khi anh ấy để ai đó sống trong nhà mình một tuần, rồi sáu tháng sau hắn ta chiếm luôn ngôi nhà đó! Trong một kỷ niệm đáng xấu hổ của tôi khi còn là sinh viên, từ đầu học kỳ, một anh bạn sinh viên đã cho tôi dùng nước mà anh ấy đã nhẫn nại giữ nóng để làm ấm các mẫu vật của tôi. Và tôi đã tiếp tục dùng nước của anh ấy trong suốt học kỳ mà không hề nghĩ tới chuyện phải tự đun nước lên. Tới học kỳ sau, anh ấy trả đũa tôi bằng cách cứ dùng nước của tôi và không tự đun nước nữa. Tôi cho rằng tự tôi đã khuyến khích anh ấy trả đũa mình.

Hai “bà” hợp lại

Chúng ta có thể sử dụng những chiến lược nào để tránh gặp phải các chu trình Ăn miếng trả miếng , mà không để cho những người coi nỗ lực hợp tác của chúng ta là yếu đuối để rồi lợi dụng chúng ta khi chúng ta chủ động mời gọi sự hợp tác? Lý thuyết gia trò chơi Robert Axelrod tại Đại học Michigan đã tìm ra một câu trả lời đơn giản đến ngạc nhiên vào năm 1980, khi ông mời các chuyên gia lý thuyết trò chơi nộp các chương trình giải quyết Thế lưỡng nan của người tù trên máy tính. Từng cặp hai chương trình sẽ thi đấu với nhau trong một trò chơi trong đó với mỗi bước đi, các chương trình được lựa chọn sẽ hợp tác hoặc gian lận khi đang hợp tác; quyết định của chúng dựa trên những nước đi của chương trình đối thủ trước đó. Cũng giống như mọi tình huống trong Thế lưỡng nan của người tù (dù do con người tạo ra hay tự phát sinh trong cuộc sống), lợi ích lớn nhất luôn thuộc về những người gian dối khi người kia đề nghị hợp tác. Sự hợp tác song phương mang lại phần thưởng thấp hơn, nhưng nếu cả hai bên cùng gian lận thì lợi íchcòn thấp hơn nữa. Còn đề nghị hợp tác khiđối phương gian lận sẽ không mang lại lợi ích nào (các lý thuyết gia trò chơi gọi đây là “lợi ích của kẻ chẳng ra gì”).

Tám lý thuyết gia trò chơi nộp chương trình theo lời kêu gọi của Axelrod đã đưa ra một số chiến lược tinh tế, nhưng khi chúng đấu với nhau, thì kẻ thắng cuộc lại là chương trình sử dụng chiến lược đơn giản nhất, do cố giáo sư Anatol Rapoport của Đại học Toronto thực hiện. Tất cả những gì chương trình này làm là đưa ra đề nghị hợp tác trong bước đầu tiên, sau đó bắt chước mọi hành vi của đối thủ. Nói cách khác, nó bắt đầu với chiến lược mềm mỏng của BàMuốn người làm sao thì ta làm vậy, nhưng sẵn sàng theo đuổi chiến lược trả đũa của BàLàm sao chịu vậynếu phương pháp hợp tác của BàMuốn người làm sao thì ta làm vậykhông hiệu quả.

Axelrod không thể tin rằng một chiến lược đơn giản như thế lại có thể hiệu quả đến vậy, vì thế ông đã tổ chức một vòng thi đấu rộng hơn, thu hút 62 người tham gia đến từ sáu quốc gia khác nhau. Lần này, dù có nhiều chiến lược hơn, một số trong đó dựa vào cách chúng ta đối phó với xung đột và hợp tác trong đời thực, thì kẻ chiến thắng vẫn lại là chương trình của Rapoport. Từ đó, chương trình này được đặt tên là TIT FOR TAT (39)( Ăn miếng trả miếng ). Axelrod chorằng đó có thể là một lời khuyên hữu ích đơn giản cho cấp lãnh đạo của các quốc gia trong tương tác giữa họ với nhau. Ông nói: “Đừng ghen tỵ. Đừng trở thành người đầu tiên gian dối, hãy đáp trả với cả sự hợp tác và gian lận và đừng quá khôn ngoan”.

TIT FOR TAT có ảnh hưởng lớn trong các nhà khoa học xã hội khi Axelrod công bố một điều phổ biến trong các phát hiện của ông trong cuốn The Evolution of Cooperation (tạm dịch: Tiến hóa của sự hợp tác), bởi vì nó dường như mang lại câu trả lời gọn ghẽ và đơn giản cho vấn đề hợp tác. Tôi cho rằng mình sẽ tự thử nghiệm để xem nó vận hành ra sao trong tình huống thường nhật, và tôi gặp được cơ hội thử nghiệm đó khi một cửa hàng sách gần nhà có chương trình giảm giá một nửa các loại sách. Những cuốn sách được chất đống khắp nơi, người mua tha hồ nhặt chúng lên, liếc qua tựa sách, hoặc là giữ hoặc là lại bỏ chúng xuống. Tôi khởi động một chu trình hợp tác với người đàn ông đứng cạnh mình bằng cách đưa cho anh ta xem những cuốn mà tôi định bỏ xuống trước khi bỏ chúng xuống thật. Anh ta chọn lấy một vài cuốn tôi chỉ cho anh ta, chẳng bao lâu anh ta cũng bắt đầu đưa cho tôi xem những cuốn mà anh ta đã nhặt lên. Bằng cách này, chúng tôi có thể xem được nhiều đầu sách hơn và nhanh chóng xử lý xong đống sách. Có lúc anh chàng không cho tôi xem những cuốn sách mà mình nhặt lên nữa, khi ấy, tôi phản ứng lại ngay bằng cách không đưa sách của mình cho anh ta xem. Anh chàng hiểu ngay ra rằng tôi đang trả đũa sự gian lận của anh ta, nên lại bắt đầu chuyển sang hợp tác.

Trong trường hợp này chiến lược Ăn miếng trả miếng dường như hoạt động khá hiệu quả để khởi động và duy trì sự hợp tác, nhưng giá trị chính của nó là giúp chúng ta nhìn nhận vấn đề hợp tác dưới một góc nhìn mới. Góc nhìn này đặc biệt được các nhà sinh học tiến hóa ưa thích, bởi họ luôn băn khoăn tìm hiểu về sự tiến hóa của sự hợp tác trong tự nhiên khi tồn tại nguyên lý “kẻ thích nghi nhất là kẻ sống sót”. Họ đã phát hiện ra rằng một trong những câu trả lời nằm ở chiến lược Ăn miếng trả miếng , vốn không nhất thiết phải đồng nghĩa với chu kỳ trả đũa – trả đũa lại, trong đó kẻ mạnh nhất sẽ được đứng đầu. Nó cũng có thể có nghĩa là “anh gãi lưng cho tôi thì tôi sẽ gãi lưng cho anh”, trong đó sự tiến hóa đứng về phía những ai thích khích lệ và duy trì sự hợp tác. Có vẻ như khả năng hợp tác với các thành viên khác trong một nhóm thường là chìa khóa sinh tồn. Trong trường hợp loài người, các nhà nhân chủng học giờ đây tin rằng đó là một nhân tố chính, trong đó các nhóm xã hội hợp tác nhỏ thường có khả năng thích nghi và sinh tồn tốt hơn những cá nhân hay nhữngnhóm sống biệt lập vì sự phân ly của xã hội.

Tại sao phải tử tế?

Những nhóm xã hội hợp tác thành công cần mỗi thành viên trong đó phải vị tha và biết hợp tác, biết hy sinh lợi ích cá nhân vì lợi ích của cả nhóm. Nhưng tại sao con người (hay các loài động vật khác) lại phải có những sự hy sinh như vậy? Tại sao chúng ta phải chống lại cái thèm muốn lừa gạt để tư lợi, vốn là trọng tâm của Thế lưỡng nan của người tù? Các nhà sinh học đã phát hiện ra một câu trả lời trong quá trình “lựa chọn họ hàng”, trong đó lợi ích tiến hóa của sự hợp tác với các cá nhân có mối liên hệ gần gũi nhau nằm ở việc bảo tồn và truyền cho nhau những kế thừa về gien. Sự hung dữ của con hổ cái khi bảo vệ đàn con nhỏ chắc chắn là có thể sánh với sự hung dữ của nhiều người trong chúng ta khi đứng lên bảo vệ con mình. Tuy nhiên, lời lý giải về việc bảo vệ sự kế thừa gien vẫn không giải thích được cho tất cả mọi khía cạnh của sự hợp tác ở loài người và hành vi xã hội. Chẳng hạn, xu hướng chơi công bằng trongTrò chơi tối hậu thưkhông liên quan gì đến việc chúng ta có mối liên hệ về gien với những người cùng chơi khác hay không. Tuy nhiên, nó có thể liên quan nhiều đến thực tế rằng với tư cách là một loài, chúng ta đã được cấy vào một cảm giác công bằng và khả năng thông cảm với vấn đề mà đồng loại gặp phải.

Thật hay khi nghĩ rằng chúng ta có thể sử dụngsự công bằng và đồng cảm để khắc phục được nhiều thế lưỡng nan xã hội khác nhau mà mình gặp phải. Một cách để thực hiện điều này là sử dụng chiến lược “muốn người làm sao thì ta làm vậy” với niềm hy vọng rằng người khác, với cảm giác về sự công bằng và đồng cảm tương ứng, cũng sẽ làm như vậy. Chúng ta thường sử dụng chiến lược của Bà Muốn người làm sao thì ta làm vậytrong gia đình, trong các mối quan hệ và tại nơi làm việc. Lời lý giải của các lý thuyết gia trò chơi cho hành vi hợp tác của chúng ta trong những tình huống này là chúng gắn với nhiều sự tương tác lặp đi lặp lại, rằng chúng ta có thể gặp phải những hành động trả thù nếu chúng ta không cư xử với sự công bằng và cảm thông. Một chìa khóa để tìm đến sự ổn định xã hội là cư xử giống như cách cư xử với những người mà có thể chúng ta không bao giờ gặp lại nữa. Nhưng chúng ta có làm như thế không? Mà tại sao chúng ta phải làm như thế? Rất nhiều thí nghiệm xã hội quan trọng đã được thực hiện để tìm ra câu trả lời cho những câu hỏi đó.

Một trong những thí nghiệm thú vị như thế được thực hiện trên các sinh viên của Khoa Thần học thuộc Đại học Princeton. Các sinh viên này được giáo viên cử đi tới một tòa nhà khác để nói chuyện về chủ đề người Samaritan nhân lành. Họ không biết rằng mình là đối tượng trong một thí nghiệm về chính câu chuyện ngụ ngôn đó. Trên đường đi, họ đi ngang qua một nam diễn viên đang quỵ xuống lối ra vào, ôngnày ho và rõ ràng là đang gặp khó khăn. Mục đích của thí nghiệm là tìm hiểu xem liệu việc suy nghĩ về câu chuyện ngụ ngôn có khích lệ các sinh viên thực hành không? Câu trả lời là không. Yếu tố chính ở đây là mức độ vội vàng của họ. Nếu không vội, hai phần ba dừng lại giúp đỡ. Nếu rất vội, chỉ có mười phần trăm dừng lại. Phần còn lại vẫn đi tiếp, một số người còn bước qua người “nạn nhân” trong lúc vội vã. Trong số bốn mươi sinh viên trong cuộc thí nghiệm, mười sáu người giúp đỡ, nhưng hai mươi tư người không giúp – điều này khiến cho những người thực hiện nghiên cứu cho rằng động cơ cá nhân thường có thể lớn hơn niềm thương cảm, và rằng việc suy nghĩ về chủ đề thương cảm cũng không tạo ra khác biệt nào trong khả năng thực hiện hành động cả.

Tôi đã vô tình thực hiện thí nghiệm tương tự khi một chiếc va-li nặng mà tôi mang theo một chuyến hành trình qua nhiều nước bị gãy bánh. Khi thấy tôi đang chật vật kéo chiếc va-li, một số người ngoảnh đi chỗ khác, một số ngỏ ý giúp đỡ. Thực ra tôi không cần ai giúp cả, nhưng tôi muốn biết xem có bao nhiêu người lên tiếng giúp đỡ, vậy là tôi càng tỏ ra vất vả hơn, cả ở các sân bay và trên các con phố. Theo tôi đếm (trong thí nghiệm này tôi chỉ tập trung vào cánh mày râu) thì cứ khoảng mười người đàn ông khỏe mạnh đi qua thì mới cómột người lên tiếng giúp đỡ, con số trung bình nhất quán một cách kỳ lạ ở mọi các quốc gia, bao gồm Ấn Độ, Anh, Trung Quốc và Mỹ.

Tuy nhiên, sự thực rằng chỉ có một lượng nhỏ người sẵn sàng thực hiện những hành động vị tha làm dấy lên câu hỏi là tại sao họ lại làm như thế. Một câu trả lời là họ đã được thừa hưởng xu hướng sống vị tha. Một câu trả lời khác là họ đã được đào tạo sống vị tha từ bé, tới mức bây giờ họ cảm thấy không thoải mái nếu không giúp đỡ người khác. Những thầy tu theo đạo dòng Tên có câu nói: “Hãy đưa cho tôi trông một đứa trẻ cho tới khi nó lên bảy, tôi sẽ cho các bạn thấy một người đàn ông”. Sự thực trong câu nói này đã rõ ràng, không chỉ nhắc đến vấn đề nuôi dưỡng tôn giáo (tôi vẫn còn mang những thành kiến do từ bé được nuôi theo đạo Hội giám lý), mà còn kể đến việc nuôi dưỡng văn hóa đầu đời nói chung. Trải nghiệm đầu đời ảnh hưởng tới cuộc sống tương lai của chúng ta ra sao được thể hiện rõ ở series truyền hình của Anh có tên Seven Up! (tạm dịch: 7 trở lên!) (loạt phim này được chiếu ở Mỹ với tựa đềTuổi lên 7ở Mỹ), trong đó người ta theo dõi cuộc sống của một nhóm trẻ với nhiều tầng lớp khác nhau. Họ phỏng vấn chúng bảy năm một lần (cho tới khi họ 49 tuổi như hiện nay), và phát hiện ra rằng đường đời của họ phụ thuộc phần lớn vào tuổi thơ.

Tôi biết rằng mình vẫn mang theo nhiều quy tắc xã hội đã được dạy từ thuở nhỏ. Bà Muốn người làm sao thì ta làm vậy vẫn còn đâu đó trong tôi, định hướng cho tôi. Tuy nhiên, còn có một động lực khác giúp chúng ta đứng thẳng trong phần lớn thời gian. Đó chính là sự tồn tại của các thông lệ xã hội. Nhưng những thông lệ như thế xuất phát từ đâu và xã hội làm thế nào để thực thi chúng? Chúng ta không biết chúng xuất phát từ đâu, nhưng động lực thực thi thì tất cả các bằng chứng tìm được đều cho thấy đó chính là BàLàm sao chịu vậyvốn ưa trả thù.

Thông lệ xã hội là những chỉ dẫn quan trọng để hợp tác. Nói theo cách của giới kinh tế học Ernst Fehr và Urs Fischbacher thì “tiêu chuẩn hành vi phụ thuộc chủ yếu vào những niềm tin chung về cách cư xử của cá nhân trong một tình huống nhất định”. Nhưng điều đã khiến chúng ta tuân theo các tiêu chuẩn đó là gì lại là một câu hỏi hoàn toàn khác. Phần lớn các chứng cớ đều cho thấy động lực chính của chúng ta là nỗi sợ bị các thành viên khác trong nhóm trừng phạt.

Những hình phạt này rất đa dạng, từ không tán thành cho đến loại trừ khỏi xã hội hoặc tệ hơn nữa. Hình thức khai trừ khỏi xã hội khắc nghiệt nhất (chỉ thua xử tử) là lưu đày– một từ bắt nguồn từ người Athens cổ đại, trong đó những bạo chúa hoặc những người bị coi là mối đe dọa cho nhà nước bị đày đi nơikhác trong mười năm. Ngày nay thuật ngữ này có thể bao quát mọi thứ, từ cô gái nhỏ nói với bạn rằng: “Tớ sẽ không nói chuyện với cậu nữa” cho tới những công nhân bị đồng nghiệp tẩy chay vì không tham gia đình công, cho tới những người bị AIDS ở Thái Lan tuy giữ được mạng sống nhờ các loại thuốc kháng vi-rút sao chép ngược (antiretroviral) rẻ tiền song lại bị gia đình xa lánh nên buộc phải sống trong các ngôi chùa.

Trong những trường hợp này, mọi thành viên trong nhóm đều biết cá nhân bị khai trừ là ai, nhưng không phải lúc nào cũng thế. Điều quan trọng là tất cả các thành viên trong nhóm đều có thể xác định được người bị khai trừ. Chẳng hạn, những người phục vụ bàn lập hàng rào bãi công ở New York đã bí mật mang theo camera để chụp ảnh những thành viên công đoàn bỏ bãi công và đe dọa đăng các bức ảnh đó tại các trụ sở công đoàn để cho mọi thành viên đều biết ai là kẻ bỏ bãi công. Trong một trường hợp khác, cộng đồng người Mỹ gốc Hoa bị cảnh báo về một người gốc Hoa đã bỏ rơi đứa con gái ba tuổi của hắn ở một nhà ga ở Úc và trốn sang Mỹ. Sự phản đối rộng rãi của cộng đồng đã khiến hắn sớm bị phát hiện do người ta đăng ảnh hắn, sau đó, hắn bị bắt khi định gia nhập vào cộng đồng người Hoa ở Atlanta, Georgia. Hẳn Bà Làm sao chịu vậycũng tán thành việc các công dân ở bang này cởi quần người đàn ông đó, rồidùng nó trói chân hắn lại tới khi cảnh sát đến.

Sự kiện này là một ví dụ cực đoan củahình thức trừng phạt của bên thứ ba, tức là sự trừng phạt được thực hiện bởi những người không có liên quan tới hành vi sai trái ban đầu mà chỉ không tán thành hành vi đó về mặt lý thuyết. Loại hình phạt này là một trong những động lực chính để thực thi các thông lệ xã hội; đây là cách thể hiện sự không tán thành không chỉ đại diện cho bản thân chúng ta mà còn đại diện cho cả xã hội nữa. Khi quay lại nhìn vào người nào đó đang ngồi trong rạp chiếu phim mà lại bô bô nói, chúng ta không làm thế vì mình mà còn nhân danh tất cả mọi người trong rạp chiếu phim. Tôi từng gặp một việc như thế ở Thụy Sĩ. Hôm đó tôi nhìn thấy một người khách du lịch thả một vỏ bao kẹo xuống đường và một người dân sở tại nhặt lên, chạy đuổi theo người khách du lịch để trả lại cái vỏ kẹo đó và chỉ cho cô ta thấy một thùng rác gần đó. Khuôn mặt người khách du lịch đỏ bừng lên, và đó là dấu hiệu đủ để cho thấy hiệu quả của hành động trên.

Hình phạt của bên thứ ba kích thích tâm lý cá nhân của chúng ta để chúng ta phải duy trì các thông lệ xã hội trong một cộng đồng bằng cách thể hiện sự giận dữ khi có người đi chệch khỏi thông lệ đó. Các thí nghiệm cục bộ đã chỉ ra rằng chúng ta sẵn sàng thực hiện những sự trừng phạt như vậy ngay cả khi điều đó khiến chúng ta thiệt thòi. Chẳng hạn, mộtngười ngoài cuộc nhìn hai người khác đang ở trong tình huống Thế lưỡng nan của người tùsẽ sẵn sàng bỏ tiền túi của mình ra để có được cái hân hoan của việc trừng phạt kẻ đã phản bội lại cam kết hợp tác. Tuy nhiên, nếu cả hai bên cùng gian lận, thì người quan sát đó sẽ không muốn trừng phạt ai cả. Theo như các nhà tâm lý học Jeffrey Stevens và Marc Hauser, tác giả của nghiên cứu trên, điều này thể hiện rằng sự phản bội không được coi là vi phạm thông lệ nếu cả hai bên cùng phản bội, trong khi sự phản bội đơn phương lại được coi là xứng đáng với sự trừng phạt nghiêm khắc.

Hành vi ngoài đời thực của chúng ta phản ánh điều những người tham gia vào các thí nghiệm tình huống này đã làm. Bằng chứng ở đây là nhiều thông lệ xã hội được duy trì bằng sự hợp tác có điều kiện – nói cách khác, chúng ta sẽ hợp tác để duy trì thông lệ (chẳng hạn thông qua sự trừng phạt của bên thứ ba) nếu phần lớn mọi người khác đều làm, nhưng nếu có quá nhiều người phá vỡ thông lệ, thì chúng ta cũng cảm thấy hoàn toàn thoải mái khi phá vỡ thông lệ mà không bị sợ hãi về sự trừng phạt – từ bên thứ ba hoặc bên nào đó khác. Khi đổ rác ra đường hoặc khi gian lận thuế thu nhập, chúng ta tự nhủ: “Ai cũng làm thế, vậy thì sao mình lại không chứ?” Kết quả cuối cùng là sự đổ vỡ của thông lệ xã hội đó.

Stevens và Hauser nói: “Thông lệ xã hội về hợp tác có điều kiện mang lại một cơ chế sánh ngang với chiến lược trả đũa nổi tiếng”. Đó là vì nó gắn với trả đũa gián tiếp, theo đó chiến lược trả đũa của Bà Làm sao chịu vậycó thể mở rộng ra cả một cộng đồng vì một cá nhân có thể thực hiện hành vi trả đũa đối với sự xâm phạm thông lệ xã hội nhân danh cộng đồng, dù bản thân họ không trực tiếp bị ảnh hưởng.

Cách thiết lập và duy trì thông lệ xã hội gián tiếp chỉ áp dụng cho con người, bởi nó đòi hỏi các thành tố tâm lý kết hợp lại mà chỉ con người mới có. Stevens và Hauser đã xác định những thành tố cụ thể đó: khả năng định lượng (phần thưởng hoặc sự trừng phạt), thời gian ước lượng (để mối đe dọa trừng phạt không giảm quá mức), khả năng trì hoãn sự thỏa mãn, phát hiện và trừng phạt kẻ gian lận, phân tích và hồi tưởng về tiếng tăm cũng như sự kiểm soát.

Quả là một danh sách dài! Sự phân tích, truyền bá và nhớ về tiếng tăm là đặc biệt quan trọng. Chẳng hạn, khi tôi tới một nhà hàng mới, chất lượng thức ăn và chất lượng phục vụ ảnh hưởng tới ý kiến của tôi, nhưng tôi không đưa thông tin phản hồi trực tiếp tới nhân viên (dù rằng đã có vài ngoại lệ). Tôi thường đưa ý kiến cho bạn bè. Nếu tới nhà hàng đó, họ sẽ phát hiện ra một cách gián tiếp đâu là thức ăn ngon và dịch vụ tốt mà tôi đã nhận được.

Thực chất, trong trường hợp này tôi đã sử dụng chiến lược Ăn miếng trả miếng của Rapoport, nhưng theo lối gián tiếp chứ không trực tiếp. Tác dụng gián tiếp này có thể cho phép sự hợp tác lan rộng ra cộng đồng bằng cách lan truyền danh tiếng của một lượng người đủ lớn làm người hợp tác. Vấn đề khi sử dụng Ăn miếng trả miếng là chỉ một sự gian lận có thể mang đến một chu trình gian lận Ăn miếng trả miếng không ngừng, khiến nó có vẻ giống sự trả đũa vĩnh cửu trong địa ngục của Dante hơn là cuộc sống trong một xã hội công bằng và hợp lý. (Địa ngục còn tệ hơn nữa vì sự gian lận không có hồi kết có thể đến từ một sai lầm chứ không chỉ từ một hành động chủ ý).

Chiến lược hợp tác liên tục

Liệu chúng ta có thể cải thiện chiến lược Ăn miếng trả miếng để biến nó thành một chiến lược giúp duy trì và khuyến khích hợp tác hay không? Câu trả lời là có. Martin Nowak và Karl Sigmund đã phát hiện ra một cách tiếp cận mới khi họ chỉ ra rằng chiến lược Thắng ở lại, thua thay đổi thậm chí còn hoạt động hiệu quả hơn TIT FOR TAT trong trò chơi máy tính của Axelrod và rằng nó gần hơn với hành vi thông thường của chúng ta trong đời thực. TIT FOR TAT vô hồn và không khoan nhượng, thích hợp hơn với một thế giới ảo. Chương trình của Nowak và Sigmund – được gọi là PAVLOV theo tên của nhà khoa học Nga nổi tiếng từng nghiên cứu về phản xạ có điều kiện ởđộng vật – dùng chiến lược Thắng ở lại, thua thay đổi để đưa ra mô hình hành vi con người về sự tha thứ và hy vọng. Chương trình này tiếp tục hợp tác miễn là chương trình khác còn hợp tác, nhưng, khác với TIT FOR TAT, nó vẫn sẽ mời gọi hợp tác nếu cả hai chương trình đều thất bại vì cả hai đều gian lận trong lần đối đầu trước, với hy vọng chương trình kia được thiết kế để tiếp tục hợp tác nếu có lời mời hợp tác. Nói theo cách chuyên môn như Nowak và Sigmund thì nó “thể hiện một sự phản ứng gần giống với phản xạ đối với phần thưởng: nó lặp lại bước đi cũ nếu… được thưởng, nhưng chuyển đổi hành vi nếu… bị phạt”.

Đó chính là điều mà anh bạn cùng mua sách giảm giá với tôi đã làm sau khi tôi phát hiện ra anh ta đã gian lận trong quá trình hợp tác giữa chúng tôi. Bằng cách phản ứng với sự hợp tác mới một cách vô thức, anh ta đã sử dụng chiến lược PAVLOV. Những người khai sinh ra chiến lược này diễn giải sự thành công của nó như sau:

Thành công của chiến lược Tit for Tat (TFT) một phần nằm ở hệ thống máy tính. Trong tự nhiên, các sai sót [và những nhiễu loạn ngẫu nhiên] thường xảy ra… [và] những sai lầm giữa hai người tham gia vào TFT sẽ dẫn tới tình trạng cả hai bên cùng chơi xấu nhau. (Những sai lầm như vậy có rất nhiều trong cuộc sống; ngay cả con người cũng thường có xu hướng trút giận vào những ngườingoài cuộc vô tội)…

PAVLOV có hai lợi thế quan trọng so với TFT: (1) Sai lầm không cố ý giữa hai người tham gia vào chiến lược PAVLOV… dẫn tới việc cả hai bên cùng quay lưng lại với nhau rồi sau đó lại trở về trạng thái hợp tác chung [và] (2)… Trong chiến lược PAVLOV, người ta sẵn sàng lợi dụng kẻ khờ khạo…

Bản thân chúng ta cũng có thể quan sát hành vi thuộc dạng PAVLOV trong cuộc sống hằng ngày. Thông thường, một sự hiểu nhầm sẽ dẫn tới một cuộc cãi vã, sau đó hoạt động hợp tác lại được tiếp tục; và lời khuyên “đừng ngại lợi dụng những gã khờ” thường được áp dụng.

PAVLOV chỉ là một trong số nhiều biến thể của chiến lược Ăn miếng trả miếng đang được nghiên cứu sâu sát ngày nay. Chiến lược Ăn miếng trả miếng ban đầu hiện được phân loại thành chiến lược kích hoạt, tương đồng với những cuộc đọ súng ở miền Tây hoang dã (chí ít là theo cách miêu tả của Hollywood), trong đó nếu một bên nổ súng, bên kia có thể nổ súng đáp trả. Ngày nay các lý thuyết gia trò chơi đã nhận diện được rất nhiều chiến lược kích hoạt và tất cả đều đi theo nguyên tắc của BàLàm sao chịu vậylà sự bất hợp tác sẽ bị trừng phạt bằng một hoặc nhiều sự bất hợp tác đáp trả.

Chiến lược mạnh nhất trong số này làKích hoạt Grimvới lời đe dọa: “Chỉ cần anh không hợp tác với tôi một lần, tôi sẽ không bao giờ hợp tác với anh nữa”. Việc người vợ/chồng đe dọa ly hôn sau khi hai người cãi vã là một biểu hiện của chiến lượcKích hoạt Grim. Mối đe dọa về trả đũa hạt nhân đang tồn tại trên thế giới cũng vậy.

Một chiến lược kích động đỡ khắc nghiệt hơn là chiến lược Ăn miếng trả miếng hào phóng, trong đó sự hợp tác được đáp lại bằng sự hợp tác, nhưng đôi khi sự phản bội cũng được đáp lại bằng lời mời tiếp tục hợp tác. Chẳng hạn, người vợ/chồng sau khi bỏ đi lại quay về và cho nửa kia một cơ hội thứ hai. (Nếu họ chỉ quay về khi người bạn đời thay đổi, thì đó chỉ là chiến lược Ăn miếng trả miếng đơn thuần).

Các chiến lược trên đều có thể thành công hoặc thất bại. Chiến lược Ăn miếng trả miếng hào phóng có tính trừng phạt ít hơn chiến lược trả đũa của Bà Làm sao chịu vậy, bởi vì đôi khi nó cũng sử dụng chiến lược tha thứ của Bà Muốn người làm sao thì ta làm vậyđể phá vỡ các chu trình trả đũa lẫn nhau. Có vẻ như đây là phương pháp thực tế hữu dụng nhất đối với nhiều vấn đề trong cuộc sống.

Theo các chuyên gia tâm lý học về các mối quan hệ mà tôi từng cùng bàn luận về vấn đề này, đây là chiến lược có sự tương ứng gần gũi nhất với chiến lược dựa trên tâm lý học là “cứng rắn, nhưng hãychuẩn bị tâm lý tha thứ”. Tuy nhiên, những chiến lược mô phỏng trên máy tính lại thể hiện rằng PAVLOV có thể tốt hơn, bởi với chiến lược PAVLOV một bên có thể tiếp tục hợp tác khi nào bên kia vẫn hợp tác, nhưng máy tính cũng tự động đưa ra lời mời hợp tác nếu cả hai bên đều thua cuộc do cùng phản bội lẫn nhau trong lần hợp tác trước.

Tôi đã có cơ hội thử nghiệm chiến lược PAVLOV tại một buổi tiệc cocktail. Tôi và một người bạn cùng tới đó và cả hai đều đã thỏa thuận cùng giúp nhau tránh uống rượu vì còn phải lái xe về nhà. Nhưng rồi người bạn tôi không cưỡng lại được cơn thèm rượu, khi ấy tôi nghĩ: “Nếu anh ấy uống rượu, mình cũng sẽ uống”. Ngay khi chúng tôi nhìn thấy nhau đang phản bội lại sự hợp tác đã thống nhất, mỗi người đều thực hiện ngay chiến lược PAVLOV là không uống rượu nữa nếu người kia cũng không uống, nhờ đó mà tình huống này được cứu vãn.

Thắng ở lại, thua thay đổi– tức chiến lược mời hợp tác khi cả hai bên đều thua cuộc do lừa gạt – dường như là chiến lược kích hoạt hiệu quả nhất được nghiên cứu tính đến nay. Tất cả các chiến lược này đều dựa vào sức mạnh của các lần tương tác lặp đi lặp lại nhằm khích lệ và duy trì sự hợp tác. Tuy nhiên, có một nhân tố khác không liên quan gì tới lần tươngtác trước đó giữa hai bên.

Nhân tố gần gũi

Sự tiến hóa trong mô hình hợp tác không chỉ áp dụng cho các chiến lược. Khi con người trở thành hàng xóm của nhau, sự gần gũi về mặt địa lý chắc chắn cũng có tác động tới sự tiến hóa trong mô hình hợp tác của họ. Sự gần gũi về địa lý có thể tạo ra những nhóm người hợp tác (tức là các cá nhân sử dụng hợp tác làm chiến lược chủ đạo), sẵn sàng duy trì sự hợp tác trước sự có mặt của những kẻ trở mặt. Trong các làng xã và các thị trấn nhỏ, người dân thường tập hợp nhau lại và cùng hợp tác để bảo vệ nhau trước sự tấn công và xâm lược của người ngoài. Hiện tượng này cũng xảy ra trong các tổ chức nghề nghiệp, chẳng hạn như tổ chức nghề nghiệp của bác sĩ và luật sư. Nó cũng xảy ra trong các thể chế, trong đó có những thể chế học thuật nơi tôi từng làm việc. Và hiện nay, nó đang xảy ra trong các máy tính; chi tiết về quá trình này đang dần được các lý thuyết gia trò chơi khám phá.

Một trong những phát hiện lớn của họ là sự hợp tác có thể được duy trì nhờ vào sự gần gũi về mặt địa lý của những người trong cuộc, dù rằng có thể không có ghi nhớ về việc họ đã cư xử ra sao trong các tương tác trước đó – đây vốn là một điều kiện tiên quyết để sử dụng các chiến lược Ăn miếng trả miếng . Tất cả những gì cần thiết ở đây là hai nhóm, một là nhóm hợp tác và một là nhóm phản bội, cả hai bên đều nhất nhất tuân theo các chiến lược của mình, cũng giống như mẹ tôi và bà tôi.

Trong vòng mô phỏng đầu tiên trên máy tính, các thành viên của hai nhóm được sắp xếp ngẫu nhiên trên một mô hình giống như một bàn cờ khổng lồ. Từng người chơi được đặt vào các ô vuông và chỉ được phép tương tác với tám người chơi ở vị trí gần nhất. Điểm số của từng người chơi là tổng điểm từ các lần tương tác với những người “hàng xóm” này; và điểm số được sắp xếp theo thứ tự thông thường của Thế lưỡng nan của người tù. Trong vòng tiếp theo, người chơi nào có điểm số cao nhất ở vòng trước sẽ được giữ lại, nếu không, người này sẽ bị thay thế bởi người “hàng xóm” có điểm số cao nhất. Đây là trò chơi vô cùng đơn giản và cũng mang lại rất nhiều thông tin hữu ích.

Video cho thấy những xu hướng lên xuống khi cuộc chiến giành ưu thế giữa nhóm hợp tác và nhóm phản bội mỗi lúc một trở nên gay gắt hơn. Những người thực hiện thí nghiệm ngạc nhiên khi thấy rằng không nhóm nào có thể loại bỏ hoàn toàn được nhóm kia. Chung cuộc, trong số những người chơi còn lại, 1/3 thuộc nhóm hợp tác và 2/3 thuộc nhóm phản bội. Tuy tỷ lệ kẻ phản bội chiếm ưu thế, song những người hợp tác cũng vẫn sống sót, một phần là vì họ ởgần nhau, một phần là vì chiến lược lừa gạt của nhóm phản bội sẽ mang lại thất bại cho chính họ khi họ tập trung lại gần một chỗ và tự loại lẫn nhau.

Kết hợp: tương tác lặp lại, sự gần gũi về địa lý và sự tiến hóa của mô hình hợp tác trong thế giới thực

Tất cả những điều này có ý nghĩa gì đối với quá trình tiến hóa của sự hợp tác trong thế giới thực? Các nghiên cứu mà tôi đã nêu ra một số gợi ý như sau:

Hiệu quả của sự gần gũi về mặt địa lý cho thấy, các cộng đồng nhỏ sống dựa vào sự hợp tác với nhau có cơ hội duy trì sự hợp tác đó lớn hơn so với các cộng đồng lớn và phân tán hơn, tuy rằng các nghiên cứu trên máy tính đã chỉ ra rằng sự lừa gạt có thể tồn tại và phát triển đến quy mô đáng báo động trong những cộng đồng nhỏ.
Dễ tạo ra sự hợp tác hơn khi tồn tại khả năng lặp lại sự tương tác giữa các cá nhân. Chẳng hạn, trộm cắp là hành vi lừa gạt (vì kẻ trộm đặt nhu cầu và mong muốn cá nhân lên trên nhu cầu và mong muốn của cộng đồng), nhưng nhiều nghiên cứu đã chỉ ra rằng hành vi trộm cắp sẽ ít tái diễn hơn nếu trong hình phạt dành cho tội trộm cắp có điều khoản bao gồm việc buộc kẻ trộm phải gặp mặt và đối diện với cácnạn nhân của mình.
Trong bối cảnh rộng hơn, mối đe dọa về hành vi trả đũa cũng đủ ngăn chặn các hành vi phản xã hội và thuyết phục mọi người tuân thủ các thông lệ xã hội, đặc biệt khi sự trả đũa có thể không chỉ xuất phát từ những người bị ảnh hưởng trực tiếp mà còn từ bất kỳ thành viên nào trong xã hội.
Danh tiếng là một động lực quan trọng, thậm chí đôi khi nỗi xấu hổ khi bị bắt quả tang đang phá vỡ một thông lệ xã hội cũng là điều kiện đủ để ngăn chặn hành vi phạm tội. Một trường hợp được đưa vào nghiên cứu là tỷ lệ rửa tay của nam giới ở các phòng vệ sinh công cộng cho thấy, nam giới có xu hướng rửa tay nhiều hơn nếu có sự hiện diện của người khác, bởi họ không muốn nhận lấy ánh mắt không hài lòng của người quan sát khi thấy họ không rửa tay.
Chiến lược hiệu quả nhất để thiết lập và duy trì sự hợp tác là chiến lược kết hợp các yếu tố hợp tác và trả đũa, tức là chủ động mời hợp tác ngay cả khi đối phương chưa hợp tác, song vẫn luôn duy trì phương án ngưng hợp tác nếu đối phương không chịu hợp tác. Phương châm “nói nhẹ mà ảnh hưởng lớn” của cựu Tổng thống Teddy Roosevelt là chiến lược đi theo đường lối này, song các mô phỏng trên máy tính của lý thuyết trò chơi lại cho thấy sẽ hiệu quả hơn nếunhấn mạnh vào ý “nói nhẹ”, tức là chủ động mời hợp tác ngay sau khi cả hai bên đều phản bội.
Martin Nowak gần đây đã tổng hợp tất cả những yếu tố này thành một tổng kết tuyệt vời gọi là “5 quy tắc đối với sự tiến hóa của mô hình hợp tác”. Tổng kết này được xây dựng dựa trên quan điểm rằng người hợp tác là người chịu chi phí (c) để cá nhân khác được hưởng lợi từ chi phí đó (l). Có thể cá nhân người hợp tác thua cuộc, nhưng chúng ta đều biết rằng dân số của nhóm hợp tác có tỷ lệ tồn tại và sinh trưởng trung bình cao hơn so với nhóm phản bội. Vậy để sự hợp tác tồn tại và phát triển được thì đâu là mối quan hệ lý tưởng giữa chi phí và lợi ích?

Nowak đưa ra 5 cơ chế khác nhau liên quan tới sự tiến hóa của mô hình hợp tác, mỗi cơ chế đều có một mối quan hệ chi phí – lợi ích khác nhau:

Lựa chọn gần gũi: Hệ số liên quan (hệ số này càng cao khi hai cá nhân có mối quan hệ càng gần gũi) phải cao hơn tỷ lệ chi phí/lợi ích (c:l).
Tương tác lặp lại (trao đổi trực tiếp): Cơ hội tương tác trong tương lai giữa hai cá nhân phải lớn hơn tỷ lệ chi phí/lợi ích (c:l) của hành vi vị lợi.
Trao đổi gián tiếp: Đây là điểm mà hànhđộng của chúng ta chịu ảnh hưởng từ tác động của chính nó lên danh tiếng của chúng ta trongcộngđồng. Nowak kết luận rằng trao đổi gián tiếp chỉ có thể thúc đẩy sự hợp tác nếu xác suất biết danh tiếng của một người lớn hơn tỷ lệ c:l.
Trao đổi trong mạng lưới: Điều này liên quan đến ảnh hưởng của việc người hợp tác và kẻ phản bội sống ở gần nhau, và điều cần thiết duy nhất để tạo ra sự hợp tác là số lượng người “hàng xóm” phải lớn hơn tỷ lệ c:l.
Lựa chọn nhóm: Một nhóm người hợp tác có thể sẽ thành công hơn một nhóm người phản bội – đây là trường hợp của thế lưỡng nanSăn nai. Trường hợp này phức tạp hơn, bởi theo thời gian, các nhóm sẽ sinh trưởng và gia tăng về số lượng, thậm chí các nhóm này còn bị phân tách thành những nhóm nhỏ hơn. Trong giới hạn thuận tiện về mặt toán học, trong đó việc lựa chọn hợp tác yếu thế hơn và các nhóm hiếm khi chia nhỏ ra, vẫn có một kết quả đơn giản đến đáng ngạc nhiên: sự hợp tác vẫn tiến triển nếu tỷ lệ lợi ích-chi phí (l:c) lớn hơn [1+([quy mô nhóm lớn nhất]/[số lượng nhóm])].
Tổng kết quan trọng của Nowak cho thấy chúng ta có thể giải quyết các thế lưỡng nan xã hội – và tạo điều kiện cho hợp tác phát triển – nếu có thể vận hành một trong năm cơ chế trên, và nếu có thể tìmra cách thúc đẩy tỷ lệ lợi ích/chi phí trong tình huống thực tế lên trên một giá trị thiết yếu. Tổng kết này đã đưa nhiều chiến lược mà tôi phân tích trong cuốn sách này vào một khung thống nhất. Tuy nhiên, vẫn còn một chiến lược để giải quyết các thế lưỡng nan xã hội, đó là thay đổi bản thân trò chơi để sức hấp dẫn của việc lừa gạt, vốn nằm trong tâm điểm của mọi thế lưỡng nan xã hội, được giảm thiểu hoặc triệt tiêu hoàn toàn. Trong chương sau tôi sẽ bàn đến một số cách thức thực hiện điều này, trong đó bao gồm việc ứng dụng khoa học cơ chế lượng tử; đây là môn khoa học có thể dùng để tháo gỡ nhiều tình huống khó khăn thường gặp trong các thế lưỡng nan xã hội.

Kéo Búa Bao

Nguồn: Internet

BÌNH LUẬN

Please enter your comment!
Please enter your name here