Bản chất bất toàn của thế giới: Cái nhìn qua lăng kính lý thuyết trò chơi
Những dòng trên của Adam Smith đã được trích lại nhiều lần. Chúng khái quát một tinh thần chủ đạo trong kinh tế học. Mọi phần tử đều hành xử vì lợi ích bản thân. Đa số những hoạt động mà chúng ta thấy trong xã hội đều được tham gia bởi những cá nhân với mục tiêu tối ưu hoá lợi ích riêng. Bữa tối ngon lành mà chúng ta được hưởng là kết quả của nỗ lực kiếm lời của anh hàng thịt, người nấu rượu, chị hàng bánh. Không phải vì lòng nhân từ mà họ tạo ra sản phẩm tốt nhất, có thể về mặt chất lượng, rẻ nhất có thể về giá cả. Động cơ tối ưu hoá lợi ích bản thân trong cuộc cạnh tranh khốc liệt buộc mọi phần tử phải hành xử như thể đang tối ưu hoá lợi ích chung cộng đồng. Tất cả đều đang ở điểm tối ưu vì không ai là không phải nỗ lực tối ưu. Đó là bản chất khái niệm bàn tay vô hìnhtrong kinh tế học. Tuy nhiên, một cách khách quan ta không thể không đặt ra ba câu hỏi. Thứ nhất, liệu cơ chế hoạt động này của thị trường vẫn có thể có khiếm khuyết nghiêm trọng ngay cả khi bàn tay vô hình đã được phát huy hết hiệu quả của nó. Nói cách khác, có thể nào thế giới vẫn chưa thể ở được điểm tối ưu dù tất cả mọi phần tử đều ở trong tình trạng lý tưởng để có thể nỗ lực tối ưu? Nếu sự khiếm khuyết này tồn tại thì đây quả thực là một bản chất quan trọng gây ra sự bất toàn của thế giới trong quá trình phát triển. Nó ngăn cản các cộng đồng và xã hội đạt được sự tối ưu Pareto (2). Và nếu vậy thì thật cần thiết đặt ra câu hỏi thứ hai, đâu là bản chất nguyên nhân gây ra sự bất toàn này. Cả hai câu hỏi đều liên quan trực tiếp tới ý nghĩa kinh tế của lý thuyết trò chơi.
Vai trò của Chính Danh
Tính duy lợi và vị kỷ của con người từng là nền tảng tư tưởng của những nhà pháp gia phương Đông, đại diện là Hàn Phi. Cũng như Adam Smith, Hàn cho rằng quá trình tối ưu hoá lợi ích của một cộng đồng không nhất thiết đòi hỏi bằng cách ép buộc con người hành xử khác so với bản chất vị kỷ cố hữu. Trái lại, người cầm quyền (hay người tổ chức xã hội trong ngôn ngữ kinh tế học hiện đại) nên vận dụng bản chất ấy một cách phù hợp. Cụ thể là cần phải chính danh giữa lời nói và việc làm. Pháp luật phải tạo ra sự ràng buộc, khiến mọi phần tử hành xử đúng theo trách nhiệm mà xã hội trông cậy ở họ. “Cho nên nhờ dây dọi thẳng mà cây cong bị đẽo. Nhờ mực nước bằng mà chỗ cao, chỗ nghiêng bị gọt. Nhờ treo cái cân lên mà lấy bớt được từ cái nặng, cho thêm được vào cái nhẹ. Nhờ xác lập cái đấu, cái thạch mà lấy bớt được từ cái nhiều, cho thêm được vào cái ít” (Hàn Phi Tử, Quyển VI, Thiên II) (3). Như vậy, Hàn Phi đi xa hơn những nhà pháp gia đương thời khi ông chỉ ra lợi ích thực tiễn to lớn của sự chính danh trong hình pháp. Cùng một bản chất như vậy, trong kinh tế, tính chính danh có được khi mà giá cả mọi hàng hoá thể hiện được giá trị của chúng. Khi giá cả xác tín, mọi phần tử đều có cơ sở để tối ưu hoá sự mưu sinh của bản thân. Bàn tay vô hìnhkhi ấy sẽ tự động tối ưu hoá lợi ích của cả cộng đồng.
Ngược lại, khi sự chính danh không tồn tại, các phần tử đều không có được những thông tin đáng tin cậy cần thiết cho sự tính toán riêng của họ. Quá trình tối ưu hoá lợi ích chung sẽ hoàn toàn đổ vỡ. Sự thừa và thiếu xảy ra ở mọi nơi. Các nhà kinh tế học cổ điển quy kết đây là một trong những nguyên nhân chính gây ra tình trạng mất cân bằng. Do thông tin sai mà doanh nghiệp đầu tư nhầm lẫn, dẫn tới sự sụp đổ. Công nhân mất việc không tìm được đúng nhà tuyên mộ. Nhà tuyển mộ như vậy cũng chịu thiệt hại do không tìm được đúng người đúng việc. Thị trường hàng hoá mất cân bằng sẽ gây ra tình trạng thiếu hàng, dư tiền, dẫn tới lạm phát leo thang. Tóm l ại, mọi sự mất cân bằng vĩ mô trong kinh tế đều từng bị quy cho sự không trung thực của thông tin cũng như những khó khăn trong việc trao đổi thông tin.
Vì sao có sự không chính danh? Một nguyên nhân quan trọng là thiếu sự cạnh tranh công bằng. Thiếu cạnh tranh công bằng dẫn tới ưu thế độc quyền cho một số ít. Trong một nền kinh tế có cạnh tranh lành mạnh thì các nguồn tài nguyên được sử dụng theo cách tạo ra lợi ích tối ưu cho cộng đồng. Ngược lại, với nền kinh tế thiếu cạnh tranh thì tài nguyên được sử dụng nhằm tối ưu hoá lợi nhuận của nhà độc quyền. Với mục tiêu ấy, nếu cần thiết kẻ độc quyền có thể buộc người tiêu dùng phải trả với giá cả cao vọt. Khi ấy giá cả không còn phản ánh đúng thông tin về mối tương quan giữa chi phí sản xuất với nhu cầu tiêu dùng. Sự chính danh trong kinh tế khi ấy bị bóp méo. Các quá trình tối ưu hoá bị ảnh hưởng tiêu cực, ngoại trừ sự tối ưu hoá lợi nhuận cho nhà độc quyền.
Đó là những nét chính của bức tranh lý thuyết kinh tế thời kỳ đầu thế kỷ 20. Quy luật thị trường tự do được sùng bái. Những sự bất cân bằng trong hoạt động tối ưu hoá trong nền kinh tế đều bị quy cho sự thông tin sai, thông tin không đầy đủ, thị trường thiếu phản ứng cập nhật nhạy bén, và thiếu cạnh tranh công bằng trong những khoảng thời gian ngắn hạn. Cho tới khi lý thuyết trò chơi (game theory) ra đời: Ngày hôm nay, thông qua lý thuyết trò chơi ta có thể chỉ ra rằng ngay cả khi con người có thông tin đầy đủ, phản ứng chính xác theo thay đổi của hoàn cảnh và cạnh tranh một cách bình đẳng, thì sự tối ưu hoá cho lợi ích cộng đồng vẫn không chắc chắn đạt được..
Bản chất sự khiếm khuyết ngay cả khi đã có tính chính danh trong thông tin
Khác biệt mang tính nền móng của lý thuyết trò chơi so với các lý thuyết kinh tế khác là việc linh động hoá vai trò (hay tăng quyền chủ động) của các phần tử trong những mô hình toán tối ưu. Các bài toán tối ưu kinh điển trong kinh tế học trước đây đơn thuần chỉ là một tiến trình trong đó từng phần tử thu nhận những thông tin là các tham số mang tính cố định cho trước (exogenous variables) nhằm dùng vào việc tối ưu hoá lợi ích của mình.
Một ví dụ mang tính thực nghiệm, như trong lĩnh vực mua bán xe hơi chẳng hạn. Người mua xe phải tham khảo các tham số cố định cho trước. Bao gồm thu nhập cá nhân, giá xe, các mức thuế tiêu thụ, chi phí xăng dầu và bảo dưỡng, chất lượng ước đoạn của xe... Tất cả những tham số cố định này tiếp theo sẽ được đưa vào một mô hình phân tích nào đó để đưa ra phản ứng tối ưu. Với giả thiết các tham số không thay đổi, từng mức giá sẽ tương ứng với một phản ứng tối ưu riêng, qua đó xác lập một hàm số biểu thị nhu cầu tiêu dùng. Ngược lại, người bán cần đặt mình vào vị trí người mua để tìm hiểu chi tiết về hàm số nhu cầu đem lại lợi nhuận ước đoán cao nhất.
Bài toán vi mô này khá đơn giản. Nhưng điều quan trọng là nó phác hoạ lại được bản chất của nhiều vấn đề tương tự trong đời sống thường ngày. Bản chất đó là, con người luôn phải đối diện với những bài toán tối ưu. Đa số mọi hành vi đều phục vụ cho một quá trình tối ưu hoá một giá trị biểu hiện một nhu cầu hay lợi ích nào đó, trong khuôn khổ những ràng buộc nhất định. Tuy nhiên, một điều quan trọng đã bỏ qua những bản chất của bài toán này. Đó là, trong hiện thực, các phần tử không chỉ phải cân nhắc dựa trên các tham số cho trước. Chúng còn cần phải cân nhắc về chiến thuật mà đối phương sử dụng nữa. Nhìn bằng đôi mắt toán học, ta thấy rằng mỗi chiến thuật một phần tử sẽ trực tiếp tương ứng với một hệ tham số cho bài toán tối ưu hoá của những phần tử khác . Chỉ cần một phần tử phân vân và không tìm thấy một chiến thuật ưu việt, thì toàn bộ các phần tử khác lâm vào tình trạng không có được một hệ tham số chắc chắn cố định cần thiết cho việc giải quyết các mô hình tối ưu lợi ích cá nhân cho riêng chúng ta.Chính sự khiếm khuyết này sẽ vô hiệu hóa vai trò của bản tay vô hình trong việc tìm ra và đạt đến một điểm tối ưu duy nhất.
Hãy chuyển đổi bài toán mua bán xe kể trên thành một mô hình mang bản chất của lý thuyết trò chơi. Thay đổi chủ chốt ở đây là mối tương quan về giá cả và chất lượng ước đoán sẽ không còn cố định và cho trước nữa. Người bán xe có thể đưa ra chiến thuật giá cả của riêng họ. Chẳng hạn, giá xe có thể cao và chất lượng rất tốt. Hoặc là, giá cao nhưng chất lượng chỉ ở mức trung bình. Những lựa chọn rất khác nhau như vậy về chiến thuật trong giá cả, ng ười bán đương nhiên không nhất thiết thông báo cho người mua được biết. Vì vậy, nhiệm vụ của người mua không còn đơn giản bắt đầu từ việc thu nhận các thông tin mang tính tham số cố định cho trước. Hơn thế họ cần đoán định chiến thuật của người bán. Một trong những phản ứng logic có thể được hình dung như sau. Bước một, định dạng các chiến thuật mà người bán có thể đưa ra. Bước hai, dựa vào mức giá và các thông tin liên quan, xác định ra xác suất gặp phải từng chiến thuật trong những số này. Bước ba, từ đó tìm kiếm một phản ứng phù hợp với kết quả ước đoán từ bước hai. Một cách logic thấy rằng từng loại đối tượng khách hàng mua xe có những cách suy luận và giải quyết vấn đề khác nhau. Khác biệt về mức thu nhập và kinh nghiệm chắc chắn đóng vai trò quyết định ở đây. Vậy thì nhà tiêu thụ xe cũng cần lên một chương trình tối thiểu có ba bước. Bước một dự đoán xác suất cho từng loại đối tượng mà mình sẽ phải tiến hành giao dịch. Bước hai, đặt mình vào vị trí những đối tượng này để nghiên cứu phản ứng tối ưu của họ. Bước cuối cùng mới là đưa ra một chiến thuật giá cả khả thi. Bài toán này có tính chất của một trò chơi mang tên Bayes. Nó hoàn toàn có thể được phức tạp hoá thêm nữa, tuỳ thuộc vào bản chất cụ thể nào của hiện thực mà ta muốn chỉ ra.
Tính chính xác chặt chẽ trong suy luận logic khiến cho mô hình lý thuyết trò chơi trở thành không thể thiếu khi nghiên cứu nhiều vấn đề thực nghiệm phổ biến đa dạng. Có thể là sự tìm hiểu về bản chất trong quá trình tương tác của các tập đoàn kinh tế lớn. Cũng có thể dùng để nghiên cứu hành vi các nhóm lợi ích trong kinh tế chính trị. Hay vận dụng làm xương sống cho lý thuyết chiến lược của các quốc gia có vũ khí hạt nhân. Giải Nobel kinh tế năm 2005 được trao chung cho hai nhà kinh tế lý thuyết trò chơi. Một trong hai người này, giáo sư Thomas C. Schelling có những đóng góp quan trọng trong việc đặt nền tảng lý thuyết cho việc nghiên cứu chiến lược ngăn chặn xung đột chiến tranh hạt nhân (4). Lý thuyết trò chơi cũng được dùng phổ biến trong các chính sách môi trường ở tầm địa phương, quốc gia và toàn cầu.
Trong thực tế, các cuộc giao dịch có thể xảy ra trong vài ngày, vài tuần, nhưng cũng có thể chỉ trong vài phút. Tuy nhiên, chúng có chung một bản chất mô hình mua bán xe hơi nói trên. Đó là, các phần tử trong quá trình tương tác phải tìm ra chiến thuật tối ưu để đối phó với hành động của các phần tử khác. Cung cách thu nhận thông tin của từng phần tử không đơn giản như trong những mô hình kinh tế cổ điển. Cho dù thông tin có thể được chuyển lưu một cách nhanh chóng tức thời và không nhiễu tạp. Cho dù các phần tử cạnh tranh một cách bình đẳng và quyết liệt. Thì việc dự đoán một nghiệm số Pareto tối ưu (2) duy nhất vẫn có thể không đạt được. Có ba lý do gắn với ba mệnh đề. Thứ nhất, bài toán mô phỏng có thể quá phức tạp, khiến việc giải quyết chuẩn tắc không đem lại những phản ánh xác thật cho đời sống hiện thực. Nói một cách khác, con người trong thực tế có thể không đủ điều kiện để hành xử phức tạp và chính xác như logic bài toán đòi hỏi. Thứ hai, bài toán có thể có quá nhiều nghiệm, dẫn đến khó khăn trong việc chỉ ra đáp án đúng. Thư ba, nghiệm số chưa chắc đã tối ưu Pareto. Nghĩa là, từng phần tử tìm cách tối ưu nhưng kết quả đạt được không hề tối ưu. Tuy nhiên, vẫn có cơ sở để phản bác lập luận của mệnh đề thứ nhất và mệnh đề thứ hai. Đáp lại mệnh đề thứ nhất, người ta có thể hi vọng rằng trải qua thời gian, quá trình tương tác và nỗ lực tối ưu hoá của các phần tử sẽ được cải thiện mức độ hiệu quả và dần ổn định về điểm cân bằng có trong lý thuyết. Còn đối với mệnh đề thứ hai, bài toán tối ưu nào cũng có thể được thêm vào các ràng buộc để giúp quy về một số ít nghiệm số hợp lý nhất. Nhưng cuối cùng, khi đứng trước mệnh đề thứ ba thì ai cũng phải thừa nhận rằng đây là một vấn đề hiển nhiên không thể phủ định. Nó quả thực là sự phản bác mạnh mẽ khái niệm bàn tay vô hình kỳ diệu của Adam Smith.
Ta có thể viết lại vấn đề mà mệnh đề thứ ba đã đưa ra như sau: Có khi mọi phần tử tối ưu lợi ích cá nhân một cách hiệu quả nhưng điều ấy vẫn không thể giúp chúng đạt được một kết quả tối ưu.Đây cũng là nội dung cốt yếu về bản chất sự bất toàn của thế giới mà bài viết này đề cập từ phần mở đầu. Ví dụ minh họa điển hình phản ánh là bài toán Bi Kịch Người Tù (The Prisoners – Dilema). Ở bài toán này, mỗi tên tội phạm đều có hai lựa chọn. Hoặc là im lặng hoặc tố giác đồng bọn. Có hai giả thiết cốt yếu cho bài toán này. Thứ nhất, nếu tất cả cùng im lặng (dẫn tới không đủ cơ sở để chính thức tuyên án) thì hình phạt sẽ nhẹ hơn so với nếu tất cả cùng thú tội. Thứ hai, đối với từng tên tội phạm thì lựa chọn im lặng sẽ buôn bị trừng phạt nặng hơn so với tố giác, bất kể kẻ đồng bọn có lựa chọn thế nào. Nghĩa là, nếu đồng bọn thú tội, tôi tốt hơn nên thú tội. Và tương tự, nếu đồng bọn im lặng tốt hơn là tôi vẫn nên thú tội. Hệ quả tất yếu sẽ là, cả hai tên tội phạm cùng nhau thú tội, nếu như chúng cùng suy luận logic và đều đơn thuần cố gắng tối ưu hoá lợi ích cá nhân. Nghịch lý của kết quả này có thể được chỉ ra thật dễ dãi. Lẽ ra chúng ở vào tình thế tốt hơn nếu như chúng cùng nhau im lặng.
Vài điều luận bàn và nhận định khách quan
Bài toán Bi kịch Người tù chỉ ra bi kịch chung của con người trong những hoàn cảnh khác nhau, mà bản chất chung là sự bất hợp tác hoặc không đủ cơ sở khả thi để hợp tác trong nỗ lực tối ưu hoá lợi ích riêng. Đó là bản chất nguyên nhân của bi kịch khi con người bị đẩy vào tình thế cùng nhau khai thác tài nguyên môi trường tới kiệt quệ. Hoặc cùng nhau chạy đua vũ trang hạt nhân, bất chấp mối nguy hiểm diệt vong luôn tiềm tàng. Như ta thấy, con người tự nó không thể giải quyết tình trạng này đơn thuần bằng suy luận logic, bằng thông tin hoàn hảo, hay bằng cạnh tranh công bằng. Trong bài phân tích về tương lai chiến tranh hạt nhân, J. B Wiesner and H.F. York đã kết luận cô đọng: “ Cả hai phía trong cuộc đua vũ trang... đều đối diện với bi kịch phải liên tục gia tăng trang bị quân sự trong khi sự an ninh của quốc gia lại không ngừng suy giảm. Kết luận chuyên môn của chúng tôi là bi kịch này không thể có một giải pháp thuần kỹ thuật. Nếu các quốc gia tiếp tục tìm kiếm giải pháp qua khoa học và công nghệ, họ sẽ chỉ càng tiếp tục làm xấu thêm tình hình” (5).
Trên đây, chúng ta đã điểm qua những nguyên nhân gây khó khăn trong việc đạt được kết quả tối ưu ngay cả khi đã áp đặt những giả thiết mạnh mẽ nhất có thể nhằm thiết lập những tiến trình tương tác trơn tru và công bằng. Bản chất của những nguyên nhân này vì vậy hoàn toàn nằm trong những vấn đề mang tính nội tại của con người và xã hội. Theo cái nhìn sơ khai và mềm dẻo từ phương Đông thì sự bất toàn không thể đảo nghịch này của thế giới đơn giản chứa ở trong 2 chữ Thời, Thế. Cho dù chính danh vô cùng quan trọng, khi không có chính danh thì thiên hạ sẽ tất loạn. Nhưng khi đã ở vào tình thế hiểm hóc thì dù có chính danh thiên hạ vẫn cứ loạn như thường. Khổng Tử là người đề xướng và trung thành với thuyết chính danh. Chỉ trong khoảng thời gian ngắn hạn ở nước Lỗ, ông đã xây dựng nên được một xã hội dân sự tạm thời ổn định. Với tham vọng mở rộng sự ứng dụng cho học thuyết của mình, Khổng Tử tìm sang các quốc gia lân cận. Nhưng ông đã thất bại. Đơn giản là các vị vua và đại thần của các nước này không thể ứng dụng trí tuệ của Khổng Tử cho những cuộc mưu cầu quyền lợi riêng tư. Nhìn bằng con mắt kinh tế hiện đại thì Khổng Tử đã không thể giải được bài toán giữa các nhóm lợi ích ra một kết quả theo chiều hướng như ông ta mong muốn. Chính vì bản chất duy lợi vị kỷ của con người mà Hàn Phi khi đề cao ý nghĩa của chính danh trong pháp luật thì vẫn không quên vai trò của thuật trị nước. “Nhà vua không có thuật trị nước thì ở trên bị che đậy; bầy tôi mà không có pháp luật thì cái loạn sinh ra ở dưới. Hai cái không thể thiếu cái nào, đó đều là những công cụ của bậc đế vương” (Hàn Phi Tử, Quyển XVII, Thiên XLII) (6). Chính danh là cơ sở đầu tiên xây dựng một xã hội ổn định, nhưng xã hội sẽ không phát triển ổn định nếu nhà tổ chức thất bại trong việc nhìn ra những quy luật vận hành và tương tác giữa các nhóm lợi ích.
Nhìn lại lịch sử các lý thuyết về kinh tế và chính trị, ta thấy rằng Adam Smith đã khởi đầu cho việc chỉ ra lợi ích to lớn của sự tương tác tự do giữa các phần tử bất chấp bản năng vị kỷ của chúng. Nhìn sâu hơn nữa thì sẽ thấy rằng lợi ích này có thể đạt được là nhờ sự cạnh tranh công bằng và sự xác tín của thông tin. Tuy nhiên, cả hai điều kiện đó vẫn còn chưa đủ đảm bảo cho một nền kinh tế hay một xã hội vận hành hiệu quả. Trong nhiều kịch bản thường gặp, yếu tố tiên quyết dẫn tới chính sách đúng đắn là việc ước đoán chính xác kết quả của sự tương tác giữa các nhóm lợi ích. Lý thuyết trò chơi là công cụ không thể thiếu của con người khi đối diện với thách thức này. Nó có thể chỉ ra hướng đi khi việc giải quyết vấn đề là khả thi. Ngược lại khi việc giải quyết là bất khả thi, lý thuyết trò chơi giúp chỉ ra bản chất toán học của sự bất khả thi ấy.
Tài liệu tham khảo:
(1) Adam Smith, ANInquiry into the Nature and Causes of the Walth of Nations (1776), Quyển I, Chương II.
(2) Một điểm tối ưu Pareto tồn tại không thể điều chỉnh tăng lợi ích cho một cá thể mà không gây tổn hại lợi ích cho một cá thể khác.
(3) (6) Hàn Phi, Hàn Phi Tử, Phan Ngọc dịch từ cuốn Hàn Phi Tử Lập Thích xuất bản năm 1958 tại Bắc Kinh.
(4) Thông tin thêm về giáo sư Thomas C. Schelling: http://www.bsos.umd.edu/econ/efaculty/profiles/schellling.html.
(5) J. B. Wiesner và H. F. York, Scientific American 211 (No. 4), 27, (1964).