在國際公開的大型杯賽體系中,國際上合法博彩集團扮演了制定游戲規(guī)則這個重要的角色,對整個體育產(chǎn)業(yè)資本都有著舉足輕重都影響。每次大型世界賽事,例如世界杯足球賽,博彩公司給出所有參賽球隊的賠率,而全球的球迷會根據(jù)自己的喜好,選擇各自的球隊進行投注。[ 1 ]
這其中的賠率設定涉及到非常復雜的數(shù)學分析設定,是整個競技博弈中的核心。正因為賠率是根據(jù)參賽隊的實力、球員當前狀態(tài)、球隊歷史表現(xiàn)等一系列指標進行加權(quán)計算,由博彩公司主觀的給出。對博彩公司最理想的狀況是任意一個比賽的結(jié)果,玩家的籌碼勝負結(jié)果可以互相抵消,博彩公司賺取無風險的手續(xù)費,這是非常理想也是完全正常的商業(yè)模式。
然而因為競技體育存在著很多偶然性,并且球迷會有天然的傾向,在某些時候,涉及到全球關(guān)注的重要比賽,全球投注的巨大金額,會出現(xiàn)大量的押注單一方向。結(jié)果會導致一旦比賽爆冷,大部分玩家猜錯了,博彩集團會有超額收益,少部分壓中玩家也會獲得巨大收益,但一旦大部分玩家壓中,博彩集團將面臨巨額賠付。
盡管今天的賠率制度已經(jīng)發(fā)展到了非常復雜的數(shù)學模型以及通過互聯(lián)網(wǎng)實現(xiàn)了實時調(diào)整賠率的動態(tài)機制,但有時候球迷對某些球隊對喜愛是會嚴重影響真實實力對。很多極端的情況,會導致博彩集團面臨風險。例如 2014 年世界杯半決賽德國對巴西,兩個隊排名和水平接近,理論上賠率應該相差不大,但巴西有主場優(yōu)勢,并且 2014 年的巴西隊群星閃耀,得益于互聯(lián)網(wǎng)在全球的快速發(fā)展,使得巴西隊擁有海量的熱愛者,這導致當時出現(xiàn)了歷史罕見的一邊倒押注,絕大多數(shù)的籌碼都放在巴西最終獲勝晉級決賽上面,博彩公司面臨大賺和大虧的兩難選擇,被迫成為絕大多數(shù)資金的對手盤,這對任何博彩集團來說,都是不可接受的。雖然沒有證據(jù)表明比賽被操縱,但在歷史上這次比賽中,德國隊在巴西主場以 7 : 1 的比分,大勝具有主場優(yōu)勢的奪標最大熱門巴西隊,獲勝晉級,這個賽前無法想象的比分也幾乎沒有玩家猜中。從結(jié)果來看,博彩公司是最大的獲益者。而在國際所有賽事中,球迷都總結(jié)出一個沒有科學依據(jù)的規(guī)律,“大熱必死”,但其實這背后是由于零和博弈帶來的巨大風險,讓“大熱”的隊伍“死亡”是降低商業(yè)風險最無奈的辦法。而這條樸素的,由球迷們總結(jié)出來的規(guī)律是如此的不符合概率學,也間接證明了,存在信息不對稱干預比賽的結(jié)果。
傳統(tǒng)的博彩集團,雖然從商業(yè)模式上,不是以下場參與對賭為目的,但單純的賠率投注方法,一定有概率需要博彩集團賠出更多的賭注,想要從源頭上遏制人為干預比賽,絕不是制定法律法規(guī)嚴格執(zhí)法去杜絕人為干預,而是需要從機制上改變傳統(tǒng)的由莊家主動給出賠率的博弈方式。隨著區(qū)塊鏈技術(shù)的日益成熟,利用區(qū)塊鏈技術(shù)的透明性、去中心化性、可編程性,能夠?qū)崿F(xiàn)讓游戲規(guī)則不可被任何人篡改,通過多個標準協(xié)議的組合,本文提出了一種基于均值場博弈理論的全新博弈合約 CP 505 協(xié)議。
Pierre-Louis Lions 等人在 2006 至 2007 年提出的均值場博弈理論[ 2 ],為大量同質(zhì)智能體參與的博弈提供了均衡解。該理論在數(shù)學上描述了在大量參與者的系統(tǒng)中,個體如何基于其他參與者的統(tǒng)計學上的行為來做出最優(yōu)決策。
博弈論[ 3 ]是研究具有沖突和合作特征的決策者之間互動的數(shù)學理論。它為理解和預測賽會制博彩游戲中的策略行為提供了框架。
市場機制設計關(guān)注如何設計市場規(guī)則以實現(xiàn)特定的經(jīng)濟目標,如效率、公平性和透明度。
加密貨幣和區(qū)塊鏈技術(shù)提供了一種去中心化的價值轉(zhuǎn)移機制,它為創(chuàng)建透明和不可篡改的博彩游戲平臺提供了技術(shù)基礎(chǔ)。[ 5 ]
行為經(jīng)濟學結(jié)合了心理學和經(jīng)濟學,研究人們在經(jīng)濟決策中的非理性行為,這對于理解和設計博彩游戲的用戶互動具有重要意義。[ 6 ]
對賽會制博彩市場的分析,包括賠率設定、市場流動性和信息效率,為設計博彩游戲提供了實證研究基礎(chǔ)。[ 7 ]
一個經(jīng)典的二人非合作博弈模型,其中每個參與者的從個體最優(yōu)選擇出發(fā)的決策,導致了對所有參與者都較差的結(jié)果。這個概念最早由阿爾伯特·W·塔克在 1950 年提出。[ 8 ]
隨著博弈參與者數(shù)量的增加,找到均衡解的難度顯著增加。這是因為博弈的策略空間隨參與者數(shù)量呈指數(shù)增長,導致計算均衡變得更加復雜。[ 9 ]
在多人博弈中,納什均衡可能不存在或難以找到,這是因為每個參與者的最優(yōu)響應策略依賴于其他所有參與者的策略,而每個人的策略選擇空間都很大。[ 10 ]
如果用戶的每一份投注都可以變成無數(shù)的碎片進行交易,由市場來對碎片自由定價,而這些碎片又能自由的實現(xiàn)全新的投注,這就將傳統(tǒng)的賠率方式,轉(zhuǎn)化為了一種金融方式。而問題從分析研究用戶的投注問題,轉(zhuǎn)化為分析用戶的金融行為,進而轉(zhuǎn)化為近乎無限的同質(zhì)對手的博弈策略問題。
在經(jīng)典的博弈論中,游戲發(fā)生在場景中的對手之間,通常只涉及兩個人,比如著名的囚徒困境問題。涉及三個對手的游戲在計算上是非常困難的,很難達到均衡,這就是為什么西部片《好人、壞人和丑陋的人》如此經(jīng)典。如果參與游戲的人數(shù)達到四個、五個或更多,從數(shù)學上來說是無法解決的,這里面所說的無法解決,是指沒有所謂的最佳策略,因此游戲的參與人無法采用趨同的策略。
然而,如果游戲中的對手數(shù)量可以被認為是無限的,從數(shù)學上來說是有解的。法國數(shù)學家、菲爾茲獎得主 Pierre-Louis Lions 和其他幾位數(shù)學家在 2006 年至 2007 年提出均值場博弈理論,對于一個近乎無限的同質(zhì)對手參與的游戲,可以從數(shù)學上得到均衡狀態(tài)下的概率分布,從而得到游戲參與者在均衡點處的最佳策略。
當均值場博弈理論在剛開始被提出時,人們并沒有認為這個理論在金融領(lǐng)域有任何應用。建立均值場博弈理論的前提是游戲的對手是同質(zhì)的,而在傳統(tǒng)金融市場中,游戲?qū)κ值哪芰皖愋屯耆煌?有具有內(nèi)幕知識和實際執(zhí)行力的公司管理層,有機構(gòu)和大賬戶,還有許多個人投資者,正因為游戲的對手不同質(zhì),所以總是存在操縱,例如股價不是一個公平博弈的結(jié)果,掌握內(nèi)幕消息的大股東或者管理層,或者看清了籌碼分布的大資金,這些通常是股價的操縱者。
均值場博弈(mean field game,MFG)理論專門探討數(shù)量龐大的智能體(agent)在競爭環(huán)境下所使用的策略,每個智能體都會因應身邊其他智能體所采取的行動而隨之應變,務求令自可獲得最大利益。
智能體的假設通常包括以下幾點:
1.同質(zhì)性:所有智能體都是同質(zhì)的,即它們具有相同的偏好和決策能力。
2.大量智能體:系統(tǒng)中存在大量的智能體,以至于單個智能體的行為對整個系統(tǒng)的影響可以忽略不計。
3.相互作用的簡化:智能體之間的相互作用通過智能體行為的平均效應(即均值場)來簡化表示,而不是通過個體間的直接相互作用。
4.連續(xù)時間:智能體的行為和決策過程通常在連續(xù)時間框架下進行建模。
5.理性:智能體被假設為理性的,即它們會根據(jù)自身的利益最大化目標來選擇最優(yōu)策略。
6.信息結(jié)構(gòu):在某些模型中,智能體可能具有不同的信息結(jié)構(gòu),例如完全信息或不完全信息。
7.策略選擇:智能體會根據(jù)其他智能體的平均行為來調(diào)整自己的策略,以實現(xiàn)個體效用的最大化。
8.穩(wěn)定性和均衡:智能體的行為會趨向于某種均衡狀態(tài),如納什均衡,這是 MFG 理論分析的重點之一。
9.分布式?jīng)Q策:智能體的決策過程是分布式的,沒有中央?yún)f(xié)調(diào)機構(gòu)。
在傳統(tǒng)賠率制中,由于賠率是博彩公司制定的,所以,所有的球迷投注,僅僅是出于自己對球隊的喜愛程度或者客觀估計,以及博彩公司制定的賠率是否存在套利空間,大部分用戶的個人行為是無法影響其他人的行為,而其他人的投注行為,也不會影響我的投注行為。而當由于大量用戶的行為導致賠率有變化時,投注用戶也不能撤回投注,改變自己策略,一旦下定之后,就沒有任何反悔的機會。這就不符合均值場博弈的假設。
但當應用區(qū)塊鏈技術(shù)和智能合約技術(shù),允許每一個用戶將自己的投注都可以碎片化,形成強流動性的交易品,由市場用戶二次決定碎片價格,進而間接實現(xiàn)用戶改變自己的策略,進而影響他人的策略,這些用戶的行為,就非常接近均值場博弈理論中的智能體的行為。
一旦我們的模型能夠有機會使大量參與用戶成為近似的智能體,那么,根據(jù)均值場博弈理論,是有可能會有最優(yōu)解出現(xiàn)的,這個最優(yōu)解往往是一組復雜的納什均衡。
1.非合作性:在非合作博弈中,每個智能體獨立選擇自己的最優(yōu)策略,不考慮其他智能體的利益。
2.策略組合:納什均衡是所有智能體策略的一個特定組合。在均衡狀態(tài)下,每個智能體的策略是對其他智能體策略的最佳響應。
3.穩(wěn)定性:納什均衡是一種穩(wěn)定狀態(tài),即在沒有外部干預的情況下,沒有智能體會從改變自己的策略中獲益。
4.預測性:在博弈論中,納什均衡提供了一種預測博弈結(jié)果的方法,因為它代表了一種自我強化的策略狀態(tài)。
5.可能的多重均衡:在某些博弈中,可能存在多個納什均衡,每個均衡都代表了一種可能的博弈結(jié)果。
6.理性假設:納什均衡的成立基于智能體是理性的,即它們會根據(jù)自身的利益最大化目標來選擇策略。
7.效用最大化:在均衡狀態(tài)下,每個智能體在給定其他智能體策略的情況下,選擇了能夠最大化自己效用的策略。
大量玩家參與的博彩游戲,在沒有莊家的情況下,這些大數(shù)量的玩家屬于同質(zhì)智能體,符合均值場博弈的成立條件。同時這些玩家無法與數(shù)量眾多的其他玩家達成合作博弈,因此均值場博弈也屬于非合作博弈。
納什均衡帶給我們一個重要的價值,也就是在這個模型下的所有用戶不再是一種“賭博”,因為用戶在非合作條件下,如果他是理性的,只能采取某個確定的策略,或者叫支配型策略,這個策略對自己最有利。納什均衡通常對小數(shù)量的玩家有效,理性玩家都采取支配型策略,達成了某種均衡。均值場博弈與納什均衡的前提都是非合作博弈,均值場博弈所達成的均衡可以理解為無數(shù)個納什均衡的組合結(jié)果。
傳統(tǒng)的賠率博彩,只能是在給定賠率下的零和博弈,一旦最大的參與方(博彩集團)發(fā)現(xiàn)有巨額賠償風險,就極有可能通過各種方式干預比賽結(jié)果,進而出現(xiàn)極大的不公平。而在