時間:2023-08-30 16:25:57
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇博弈分析方法范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
關鍵詞:博弈論圖書館數字資源資源共享
中圖分類號:G251 文獻標識碼:A 文章編號:1009-3044(2016)29-0017-03
隨著大數據時代的到來,信息的互聯互通成為提高信息服務能力的重要前提,任何一個圖書館都難以同時滿足不同學科專業、不同層次用戶的信息需求,也不可能實現對所有資源的收集和管理,數字信息資源共享就是為了解決個體圖書館信息資源的有限性和信息需求無限性的矛盾而采取的圖書館間合作建設與發展的策略?,F階段,我國文獻信息資源共享的理論研究主要集中在文獻資源的布局和配比方面,因此多將信息資源共享效率低下的癥結歸于管理體制的不完善、技術手段的落后和宏觀調控的缺乏。信息資源共享是追求自身效用最大化的過程,是一種分析投入成本和產出收益的博弈過程,通過借鑒博弈論的研究方法,從圖書館個體利益和共享集體利益的關系出發進行研究,可以進一步認識阻礙數字信息資源共享的因素,并找到解決這些問題的方法和措施。
1博弈論概述
1.1博弈論的涵義
博弈論,也稱對策論,英文為Game Theory,是根據信息分析及能力判斷,研究多個決策主體之間行為的相互影響作用,以取得收益或效用最大化的一種對策理論。其中的“博弈”是指個人、隊伍或組織,在一定的環境條件及規則下,同時或先后、一次或多次,根據環境和競爭對手的情況變化,從各自允許的行為或策略中進行選擇、加以實施,并從中取得相應結果的過程。中國早在幾千年以前就已存在博弈思想,田忌賽馬的故事就是較好的博弈論案例。自20世紀80年代,博弈論得到了廣泛的應用,尤其對信息經濟學的發展做出了重要的貢獻。
1.2博弈論“囚徒困境”經典模型分析
博弈論經典模型囚徒困境建立在一個假設之上,即甲、乙兩人被懷疑是合伙的偷盜犯,警方雖逮捕了他們但沒有掌握充分證明兩人犯罪行為的證據,警方將其分開單獨審問,雙方不能進行信息的交流。警方對這兩個嫌疑犯的量刑原則是:如果一方坦白,另一方不坦白,則坦白者從寬處理,判刑1年;不坦白者從重處理,判刑7年。如果兩人都坦白,則每人判5年刑。如果兩人都不坦白,則警方由Tile據不足,只能對每個人各判刑2年。表格1中的框圖體現了這個博弈的分析過程,左方是甲的可選擇策略,上方是乙的可選擇,雙方均可做出坦白和不坦白兩種選擇。其中包含數字的格對應甲乙的一個策略組合,每格第一個數字代表甲的報酬,第二個數代表乙的報酬。比如第二個數字格是指當甲坦白,乙采取不坦白的策略時,甲的報酬為-1,乙的報酬也是-7。圖中的報酬均為負數,以表示判刑的年數。
在警方交待了量刑原則以后,會從自身利益出發進行分析,選擇坦白或不坦白的策略,此時雙方展開了博弈的過程。首先分析甲的思考過程,當甲進行決策選擇的時候一定會先考慮乙的想法。根據圖表1的矩陣圖可見,當囚犯乙選擇了坦白的策略時,囚犯甲坦白則獲刑5年,不坦白獲刑7年。由此,當乙選擇坦白時,甲必然選擇坦白(因為5
如果仔細分析囚徒困境報酬矩陣,甲乙雙方若都作出不坦白的決定,會得到更好地結果,即各判刑2年。可是因為沒辦法進行信息溝通,每一方都會擔心對方坦白但自己不坦白時會受到重判(即對方坦白獲刑1年,自己不坦白則被判7年)。因此,每個囚犯都從個人利益出發考,最終的結果都會選擇坦白坦白,(坦白,坦白)便是囚徒困境博弈模型必然的均衡結果。
囚徒困境的結論折射出的道理發人深省,從個體的視角思考做出的占優策略決定(-5,-5),顯然劣于做出合作策略的選擇(-2,-2)。換句話說,從單個個體的角度出發得出的占優策略,從整體而言得出的卻是最不理想的結局。囚徒困境最終達到的策略均衡,體現出了個人理性和集體理性的矛盾沖突。目前,圖書館在數字信息資源共享問題上也存在著類似的矛盾,我們將“囚徒困境”的博弈分析方法運用到資源共享問題上,也可以解釋合作的不穩定性及相關問題。
2圖書館數字信息資源共享的博弈分析
2.1數字信息資源共享的靜態博弈
數字信息資源共享一直是圖書情報界關注的重大課題,每個圖書館都有資源共享的愿望,圖書館信息資源的共享,可以實現整體效用的最大化。假定參與共享合作博弈的圖書館為A、B兩個,分析圖2矩陣可以發現,如果A、B館都選擇合作策略,每個參與者均可獲得收益為10,總報酬最大為20;如果A、B兩者中有一方選擇合作,而另一方選擇不合作,參與者報酬分另4為6、12,總報酬為18;倘若A、B兩館都做出不合作的選擇,那么各館報酬都是8,總報酬16是最小值??梢姡ê献?,合作)策略是團體利益最大的策略選擇(20>16)。
事實上,一些圖書館為了自身的利益,往往從個人理性角度出發,最終與團體利益沖突,陷入“囚徒困境”。類似于囚徒甲、乙的決策過程,A館會根據B館的決策選擇策略,當B選擇合作策略時,A若選擇合作可得10,A若選擇不合作,既省去了共享資源需付出的成本,又無償享受了B館提供的信息資源,報酬是12。因此,A必然不會合作(顯然12>10)。同理可推得,B做出了不合作的選擇時,A仍然會選擇不合作策略(因為8>6)。顯而易見,無論B做出合作或者不合作的選擇,A都會采取不合作策略。同樣的分析結果對B館也是適用的,最后的博弈結果為(不合作,不合作),這時總報酬16,小于最優策略的總報酬20。
這一博弈矩陣可以看出,大家最初都希望達到(合作,合作)總報酬為20的結果,但是通過報酬矩陣分析可見,即便已經簽訂合作協議,各自館也會抱有“搭便車”的心理,就是如果你合作我不合作,我就可以占到便宜(12>10),于是各自違背共享約定,形成了圖書館資源共享博弈的(不合作,不合作)結果。
上述兩種博弈均為一次性博弈,參與博弈者都只能進行一次選擇決定,另外博弈參加者在做出自己決定的時候并不清楚對方的決定,大家都是同時決定自己的一次性策略選擇。處在這樣的前提之下,參與者都做出了自己的策略選擇時便已完成了一個完整的博弈過程,并得出了最終結論,這種博弈稱為靜態博弈。在靜態博弈中,出于個人理性的策略選擇往往導致了從整體而言的最壞結果。一方面,在達成合作協議以后,參與者都會有投機的心理,并從自身利益出發暗地選擇了不合作的做法。另一方面,對于一次性的博弈,只要參與者做出了最終決定便完成了博弈過程,對于違反約定的行為沒有補救和懲罰的有效措施,無法通過后續的博弈進行調整和制約。
2.2數字信息資源共享的動態博弈
實際上,博弈通常為一系列重復進行的運動,即相對靜態博弈而言的動態博弈,在連續進行的動態博弈中,上面結果會有所不同。
2.2.1數字信息資源共享的無限次重復博弈
無限次重復博弈是指相同結構的博弈可以無限次地重復進行下去。如果設定在數字資源共享的無限次重復博弈中,不管哪一方圖書館在其中的一輪合作博弈中采取了不合作的行動,在以后的博弈中便會遭到其他館“不合作”的報復策略,而且這一不合作策略會在未來的所有博弈中重復下去,長此以往,首先違約的一方便永遠失去了與另一方合作的機會。因為在無限次重復博弈中,存在著對欺騙和違約行為報復的機會,因此參與合作的各方會擔心采取不合作策略給自己帶來的長期損失,不會主動選擇不合作的策略,使得數字信息資源共享合作得以維持。
繼續用圖2加以說明,對于圖書館A,各館如果一直處于合作的狀態,便可以長期獲得報酬10,累積起來10+10+10+…,但如果抱有機會主義的想法,打破約定選擇了不合作的策略,他的確獲得了一次性的利益,得到報酬為12,但在以后的無限次重復博弈中,均會受到對方不合作的報復行動,收益只能為8。為了一次性的好處,使得日后的收益從原來合作策略時的10+10+10+…下降為不合作策略時的8+8+8+…。顯然,任何一個圖書館在數字信息資源的無限重復博弈中,為防止被報復而喪失長期的經濟效益,都會遵守協議,采取合作的策略。
2.2.2數字信息資源共享的有限次重復博弈
在有限次重復博弈中,假設事先約定只合作5次,用逆推法進行分析,各方均知道第5輪博弈是最后一輪博弈,因此這一輪博弈便同靜態博弈無異。根據前面的分析,這一輪的違約不可能在以后受到懲罰和損失,那么,每個圖書館出于個人理性出發選擇的占優策略就是不合作的結果。逆推到第4輪,因為大家都可以推算出第5輪不合作的結果,因此第4輪博弈也會采取不合作的策略。由此類推直到第1輪,都可以得到同樣的結果。顯然,在有限次重復博弈中,圖書館數字信息資源的共建合作是不穩定的,博弈的最終均衡策略為(不合作,不合作)。
3用博弈論的思想解決數字信息資源共享問題
在現實生活中,參與博弈的各方合伙的機會必然是有期限的,信息組織間的合作共享是否根本無法實現呢?顯然在現實生活中是存在著長期合作的共同體。事實上,無限次重復博弈的主要界定標準在于參加者均不清楚哪一輪博弈會是最后一輪,合作各方擔心違約會遭到日后的“報復”便會把合作策略堅持下去。在有限次的重復博弈中,如果合作雙方不確定哪一輪是最后一輪,參與者會認為日后還要繼續打交道、博弈狀態會繼續維持,這便同無限次重復博弈無異。所以,在不能確定終止期的有限次重復博弈的圖書館數字信息資源共享博弈中,合作解是可以存在的。當然,為了維護合作模型的穩定性,更好的實現團體利益的最大化,必須配合以必要的措施。
3.1建立信任機制
圖書館信息資源共建共享機制的成功建立,取決于成員間的相互信任和對于聯盟內部規則的遵守程度,能夠取得收益同時實現持續的發展,其中成員館之間的信任是至關重要的。成員間除了應相互理解對方的行為和立場,尊重對方的觀點,還應加強組織內的交流,達成對某些問題的認識。另外,信任評審機制的建立也十分必要,通過建立完備的綜合性、長期性評估測試標準系統,對成員的聯盟策略及行動影響因素進行持續地跟蹤測評,通過完善細致公平的執行制度,形成穩定可靠的運行機制。
3.2建立監督機制
對于合作中的各館,都希望采取最優于自己的策略,以期得到最好的結果,因此為了達到合作團體利益的最大化,應該對各成員進行有效監督,維護合作協議的順利執行。要在建立領導協調組織和健全監督機制上下工夫,在明確各成員權利義務的基礎上,監督各成員的行為。對于損人利己的傾向和行為,及時采取措施,必要時對違反合作協議的成員進行制裁,甚至終止合作。
3.3建立保障機制
因為各圖書館之間的規模與發展水平不均等,建設規模大、信息豐富的圖書館往往很難與信息量相對較少的圖書館實現資源共建共享,另外數字信息資源共建共享經常發生“搭便車”的問題,這些都需要通過建立保障機制加以制約。在內部評估制度規范的基礎上,對貢獻大的圖書館要采用獎勵的辦法進行收益補償,同時針對慵懶的圖書館,通過采取懲罰的方式實現督促作用。
在具體的實施上,以懲罰措施為例,在成員館簽訂共享協議時,規定不合作的一方會受到經濟制裁,報酬減3,在矩陣圖2的基礎上可以得到新的報酬矩陣(見圖3)。按“囚徒困境”的分析思路,如果A館選擇共享,B館選擇了不共享,B得報酬為9而不是原來的12,因為B館不共享受到了事后的經濟制裁(12-3=9),小于(共享,共享)中的報酬10,可見,B怕受到懲罰得不償失必然選擇共享。對于A的分析也是如此,最后的博弈均衡狀態一定是(共享,共享),克服了欺騙或違約行為,達到了信息資源共享的目的。
一、博弈論思想與納什均衡
“博弈”,為“對策”之意。具體而言,博弈就是一些個人或組織,面對一定的環境條件,在一定的規則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進行選擇并加以實施,并從中取得相應結果的過程。博弈論關注決策主體之間行為的相互影響及決策均衡問題,博弈中的任何一個局中人的決策都會受到其他局中人行為的影響,反過來他的行為也成為其他局中人決策的基礎。在博弈過程中,博弈各方可能會達成一定的協議。美國數學家、經濟學家納什提出了著名的“納什均衡”。“納什均衡”是一種比較滿意的均衡,即如果所有的參與者都預測到某個均衡會發生,所有參與者都不會故意去違背它,沒有愿望不去遵守它,體現了戰略博弈行動的穩定狀態。
二、審計博弈均衡分析方法的提出
(一)審計博弈均衡分析方法的內涵。博弈論是一種方法,一種觀念,可以將博弈論思想及納什均衡應用到審計理論及實踐問題的分析研究上,于是便形成了審計博弈均衡分析方法。審計博弈均衡分析法主要用來分析審計決策主體的行為發生直接相互作用時的決策組合以及決策組合的均衡問題,即一個審計決策主體是如何影響其他審計決策主體以及又是如何受到其他決策主體的影響,進一步研究審計決策主體之間的行為能否達到一種相對穩定的均衡狀態及其條件,以及當達到一種有利的均衡狀態時如何維持該均衡狀態。
(二)審計博弈均衡分析方法的基本程序。審計博弈均衡分析方法的基本程序分為五步,具體如下(基本程序的運用本文在后面將給出一個典型的例子):第一步:定位審計問題(審計矛盾或沖突),判斷并描述博弈特征;第二步:在約束條件下給出支付矩陣;第三步:進行審計博弈均衡計算結果;第四步:給出審計博弈分析結論;第五步:針對該審計問題(審計矛盾或沖突),設計有效的制度安排。
三、審計博弈均衡分析方法的應用
審計博弈均衡分析方法作為一種新的審計研究方法,對于審計工作、審計研究中的相關問題,可以從一個新的角度和視野來分析和研究它們,真正找到解決問題的根本途徑。下面筆者以審計監管問題為例,采用審計博弈均衡分析方法,分析審計監管問題的癥結,并提出解決監管問題的合理化建議。
(一)模型建立與分析。加強審計監管,可以從會計師事務所與上市公司博弈、會計師事務所與監管機構博弈、上市公司與監管機構博弈中進行分析。
1、基本假設。建立模型成立的基本假設,具體有:
(1)上市公司、會計師事務所以及監管機構均為理性的經濟人,均追求利潤最大化。
(2)由于本文主要探討監管機構的行為和政策,可假設會計師事務所有足夠的能力發現上市公司的舞弊行為,即不存在著審計風險。所以,在被審計單位舞弊的情況下,會計師事務所有兩種可能的策略,即合作與不合作。
(3)監管機構的監管成本與監管效果正相關,即監管機構花費越多的時間和精力,監管效果越好。監管機構有兩種可能策略,即高度監管和低度監管。
(4)只有當上市公司存在著披露虛假財務報告的企圖時,會計師事務所才有可能默認其造假行為或與之串謀進行造假。
2、兩方博弈模型
(1)會計師事務所與上市公司。假定會計師事務所有足夠的能力發現上市公司管理當局舞弊。會計師事務所可能的做法就有:合作和不合作;被審計單位(上市公司)有兩種策略:舞弊和不舞弊。
設P為監管機構發現的概率,q1為監管機構對會計師事務所的罰款(或處罰),q2為監管機構對上市公司的罰款(或處罰),r為被審計單位的賄賂,W為被審計單位支付的審計費用,d為上市公司的舞弊收益。(表1)
可見,在信息不對稱的困境中,會計師事務所的行動取決于舞弊、合作下的得益:w+r-p×ql。如果它的得益大于w,即:w-w時,上市公司會選擇舞弊,即納什均衡為(舞弊,合作),而這是監管機構所不愿意看到的。
這種情況下:w0
從這種分析中會發現,會計師事務所的選擇與上市公司的賄賂、監管機構發現舞弊的概率的大小及懲罰力度有關。而上市公司當舞弊收益一定時,他的行為受到賄賂的多少及監管機構發現舞弊概率的大小及懲罰力度的影響。因此,一個自然的想法便是加大監管的力度及懲罰量。
以上的模型是短期的一次性博弈,當注冊會計師較為注意長期的利益,而且會計師事務所還考慮誠信帶來良好聲譽的收益,那么上面的模型可變化為表2。(表2)
表2中的B代表注重長期利益,良好聲譽所帶來的收益。
如果w+B>w+r-p×q1時,那么會計師事務所存在不合作這個上策,上市公司便會選擇不舞弊,新的均衡將為(不舞弊,不合作),這是監管機構所愿意看到的。
但是,如果w+B-w時,上市公司便會選擇舞弊。
這種情況下:w+B0
從這種分析中會發現,會計師事務所的選擇與上市公司的賄賂、監管機構發現舞弊概率的大小及懲罰力度和長期形成誠信的良好聲譽的收益有關。而上市公司當舞弊收益一定時,他的行為受到賄賂的多少及監管機構發現舞弊概率的大小及懲罰力度的影響。因此,與前面相比,除了加大監管的力度及懲罰量還可以引導社會及會計師事務所對誠信的認同度,從而通過加強會計師事務所的行業自律來防止合謀。
(2)會計師事務所與監管機構。在這種博弈中,會計師事務所的策略有:串通和不串通。監管機構的策略有:高度監管和低度監管。這里假設監管機構的監管成本與監管效果正相關,即監管機構花費越多的時間和精力,監管效果越好。那么,高監管下,發現舞弊的概率P1較大,但是監管成本C1較高;低度監管下,發現舞弊的概率P2較小,但是監管成本C2較低。同樣假設q1為監管機構對會計師事務所的罰款(或處罰),r為被審計單位的賄賂。(由于無論何種情況,會計師事務所總可以得到一份穩定的審計費用收入w,故在此可簡化令w=0)。那么,會得到以下的博弈矩陣。(表3)
這時對會計師事務所而言,他的策略選擇受r-q1×p1的影響(這里注意到r-q1×p10,那么也有r-q1×p2>0,會計師事務所存在上策,他會選擇串通,而如果q1×p1-C1>q1×p2-C2時,監管機構會選擇高度監管,因此他們的均衡為(高度監管,串通);如果q1×p1-C1
如果r-q1×p2>0(有r-q1×p1
如果r-q1×p10,那么會計師事務所不存在上策。這時如果q1×p1-C10,且r-q1×p2
綜上所述,會計師的行為受到管理當局的賄賂大小、監管機構罰款以及監管機構的效率(發現錯誤的概率以及監管的成本)的影響。并不像我們平時所認識到的高監管就會不串通、低監管就會串通。
(3)上市公司與監管機構。和會計師事務所與監管機構的博弈類似,上市公司與監管機構的博弈表示為表4的博弈矩陣。還是假設監管機構對上市公司的罰款(或處罰)為q2,r為被審計單位的賄賂,d為上市公司的舞弊收益。這里仍假設監管機構的監管成本與監管效果正相關,即監管機構花費越多的時間和精力,監管效果越好。那么,高監管下,發現舞弊的概率P1較大,但是監管成本C1較高;低度監管下,發現舞弊的概率p2較小,但是監管成本C2較低。(由于無論何種情況,上市公司總要支付一份穩定的審計費用w,故在此可簡化,令w=0)(表4)
與上文分析類似,對上市公司而言,他的行為受到舞弊的利益、賄賂的費用、監管機構罰款以及監管機構的效率(發現錯誤的概率以及監管的成本)的影響,并不像我們平時所認識到的高監管就會不串通、低監管就會串通。
(二)提出建議
1、加強監管機構在博弈中的力量。一種做法是增大罰款的金額,那么上市公司和審計師事務所都會采取合法的策略。還有一種做法是提高監管的效益,在一定的成本下,努力提高監管機構發現舞弊的概率,這對監管機構要求較高。這就要求我國提高監管機構的整體素質,采用科學合理的監管手段。也可以同時采取增大罰款金額和提高監管效益的做法。
2、提高監管機構監管的動機。給予監管機構一定的壓力,使得他們不得不設法主動改變博弈中他們不利的地位,從而充分發揮他們的主動性,設法提高監管的效率及效果。比如,如果上市公司和會計師事務所一方運作不合法時,可以給予監管機構一定的壓力,使他們不會安于現狀。也可以通過立法規定監管機構的職責,給予他們一定壓力;同時,給予監管機構一定的認可,從而增加博弈中他們在上市公司不舞弊時的得益。比如,當上市公司和會計師事務所都良好運作時,可以對監管機構的努力給予一定的社會認可。
博弈論又稱為“對策論”,一種使用嚴謹數學模型來解決現實世界中的利害沖突的理論。由于沖突、合作、競爭等行為是現實世界中常見的現象,因此很多領域都能應用博弈論,例如軍事領域、經濟領域、政治外交,解決諸如戰術攻防、國際糾紛、定價定產、兼并收購、投標拍賣甚至動物進化等問題。
博弈論的研究開始于本世紀,1944年諾依曼和摩根斯坦合著的《博弈論和經濟行為》一書的出版標志著博弈理論的初步形成,隨后發展壯大為一門綜合學科。1994年三位長期致力于博弈論研究實踐的學者納什、海薩尼、塞爾頓共同獲得諾貝爾經濟學獎,使博弈論在經濟領域中的地位和作用得到權威性的肯定。
2. 博弈論的基本原理和方法
文獻[1][2]用淺白的語言敘述了博弈論的思想精髓和基本概念。文獻[3][4]更注重理論上的分析和數學的嚴謹。概括起來,博弈論模型可以用五個方面來描述
G={P, A, S, I, U}
P: 為局中人,博弈的參與者,也稱為“博弈方”,局中人是能夠獨立決策,獨立承擔責任的個人或組織,局中人以最終實現自身利益最大化為目標。
A: 為各局中人的所有可能的策略或行動的集合。根據該集合是否有限還是無限,可分為有限博弈和無限博弈,后者表現為連續對策,重復博弈和微分對策等。
S:博弈的進程,也是博弈進行的次序。局中人同時行動的一次性決策的博弈,成為靜態博弈,如齊威王和田忌賽馬;局中人行動有先后次序,稱為動態博弈,如下棋。
I: 博弈信息,能夠影響最后博弈結局的所有局中人的情報,如效用函數,響應函數,策略空間等。打仗強調“知己知彼,百戰不殆”,可見信息在博弈中占重要的地位,博弈的贏得很大程度依賴于信息的準確度與多寡。得益信息是博弈中的重要信息,如果博弈各方對各種局勢下所有局中人的得益狀況完全清楚,稱之為完全信息博弈(game with complete information),例如齊威王和田忌賽馬,各種馬的組合對陣的結果雙方都不嚴而喻。反之為不完全信息博弈(game with incomplete information),例如投標拍賣,博弈各方均不清楚對方的估價。在動態博弈中還有一類信息:輪到行動的博弈方是否完全了解此前對方的行動。如果完全了解則稱之為“具有完美信息”的博弈(game with perfect information),例如下棋,雙方都清楚對方下過的著數。反之稱為“不完美信息的動態博弈”(game with imperfect information)。由于信息不完美,博弈的結果只能是概率期望,而不能象完美信息博弈那樣有確定的結果。
U:為局中人獲得利益,也是博弈各方追求的最終目標。根據各方得益的不同情況,分為零和博弈和變和博弈。零和博弈中各方利益之間是完全對立的。變和博弈有可能存在合作關系,爭取雙贏的局面。
還有另一類型博弈稱為多人合作博弈,例如安理會投票表決,OPEC聯合限產保價等問題。這類問題重點放在聯盟利益的分配上,它的理論和方法廣泛應用于利益損失的共同分擔問題。多人合作博弈的研究方法主要是特征函數模型。以個可能的聯盟為定義域,特征函數表示各個聯盟的得益(N是局中人的數目),它的分配解必須符合一定的合理性和穩定性,它的解的概念也發展成多種多樣,包括穩定集、核心、核仁、Shapely值等。解的多樣性符合現實世界復雜多樣的需要,針對不同的問題選擇或創造合適的解的概念是博弈論深入研究的課題。
不管博弈各方是合作、競爭、威脅還是暫時讓步,博弈論模型的求解目標就是使自身最終的利益最大化,這種解建立在對方也采取各自“最好策略”為前提,各方最終達到一個力量均衡,也就是說誰也無法通過偏離均衡點而獲得更多的利益。這就是博弈論求解的本質思想。
3、博弈論與電力市場
博弈論是研究市場經濟的重要工具。電力作為特殊的商品,它的生產、運輸、銷售和消費也逐漸走向市場化。世界范圍內很多國家的電力工業走向放松管制、引進競爭的進程中,遇到很多前所未有的新課題,運用博弈論來分析解決其中一些問題是一個研究方向。 用博弈論模擬電力市場,模擬的結果可能更加接近實際,為市場模式設計提供依據。另外,電廠或用電用戶作為市場的參與者,可以用博弈論來分析市場,研究如何報價獲利最大。
正確運用博弈論關鍵要針對電力市場的特點正確選擇模型和解的概念。例如:力量相當的兩個區域電網之間交換功率的情形比較適合用古諾模型和Nash談判解方法;而自備電廠與公用電網之間的交易可能更適合用Stackleberg模型。還有局中人結盟問題:如何識別合作伙伴,結盟利益如何在聯盟內分配。電力市場環境下,電網輸電作為一項服務,它的網損、固定資產投資如何在網絡使用者之間分擔。這些分配問題有不同的概念的解:穩定集,核心,核仁,Shapely值等,如何合理選擇或創造最接近實際的解的概念也是面臨的課題。
博弈的結果是依賴于擁有的信息,采用什么樣的信息披露政策是設計電力市場模式的一個方面。例如:電廠競價上網,一個成功的報價不僅取決于自己的實力,還有賴于他人如何報價。但是各方往往不清楚互相之間成本、報價等信息,因為這些信息都是各自的商業秘密。如何處理這種信息既不完全也不完美的博弈是一個重要的課題。反過來,博弈的實驗結果也為電力市場披露怎樣的信息提供依據。
博弈論和電力市場理論都是很年輕的科學,兩者都有廣闊的發展天地,兩者的結合可以互相促進。
4、博弈論在電力市場中的應用
4.1自備電廠與公用電網之間的交易
開放發電市場的進程中,擁有自備電廠的用戶是一類特殊的市場參與者,它既是用電用戶,也可以是電力的供應者。隨著電力市場深入發展和工業的進步,自備電廠將成長為一支生力軍。
文獻[5]用博弈論來分析評價在分時定價的環境下擁有自備電廠的用戶(NCP)對定價的影響作用。NCP既可以從公用電網購電,也可以自己發電來滿足自身需求。為解決兩者的沖突,作者提出了三種博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者構造了三個局中人:公用電網,普通用戶,帶自備電廠的用戶(NCP),并且假設它們的需求函數、邊際成本、收益函數等均是線性的,通過數字模擬得出了一些有趣的結果:①NCP的加入促使公用電網降低出售給NCP的電價;②沖突還使普通用戶得到更多益處。該文為解決自備電廠與公用電網的相互作用提供了很有用的分析思想。但是尚有三點可以進一步改進:①該文尚未考慮NCP將自己多余的自發電賣給公用電網的情況;②該文將公用電網和NCP置于平等的市場地位可能不符合實際市場,如果公用電網規模很大,NCP數目很多但規模小,考慮Stackerlberg模型更符合兩者實際;③該文假設公用電網的目標函數是整個社會利益最大化,而并非是自身利益最大化,這個假設不符合電力市場需要解除管制的發展方向。
文獻[ 6]部分解決了以上問題,它重點放在自備電廠和公用電網相互作用的方式的選擇:公用電網回購NCP多余電力(buy-back system)或者公用電網收取NCP運轉電力的過網費(wheeling charges)。該文分析了在不同市場環境下,各方的得益情況,得出了一些可能只有用博弈論才能得出的結論。
4.2區域間輸電交易分析
互聯網間短期電力交換是一種經濟運行的手段。白曉民等在文獻[7]中應用Nash博弈論來分析簡單的兩區域系統單時段交易分析,得出雙方都可接受的交換功率和交易價格。在此基礎上,文獻[8]提出了一種兩階段迭代計算方法來處理外部交易計劃與內部經濟調度的協調。該文所用的博弈模型是二人非零和對策,采取合作型對策,應用 Nash談判公理作為仲裁程序,決策出雙方都可接受的交換功率和交易價格。應該指出,白曉民等的分析是基于完全信息的博弈也即博弈雙方均對對方在各種情況下的得益了解非常清楚。如果缺少這方面的信息,又應該如何分析處理呢?這個問題值得進一步深入探究。
4.3轉運市場中電網的固定成本分攤問題
運轉市場中一個難題是網絡輸電服務定價,這個定價能夠給網絡使用者一個信號,以達到全網最優化;并且能夠補償網絡的投資者,網損、變動成本、固定成本等費用在網絡使用者中合理分攤;同時能夠正確激勵網絡增容。節點實時價格(nodal spot price)制度可以解決網損和網絡阻塞問題。但是文獻[9]的作者認為節點實時價格制度不能完全回收輸電系統的固定投資,為了解決雙邊貿易中輸電系統固定成本公正分攤問題,作者提出了基于多人合作博弈模型,可以計算出逐條線路逐筆交易的分攤費用。文中使用“核仁”作為模型的解。該方法的優點:①使用“核仁”而不用Shapely值,因為“核仁”處于核心,分配值更加穩定和易于被各方接受;②提供了一種激勵,減輕線路過載。
4.4 基于Pool或PX模式的多邊貿易市場
電力市場環境下的博弈具有行動策略隨機性、信息隱蔽性,這些特點都給建模和計算造成困難,從而限制了實際應用。各種文獻在處理這種不確定信息環境下的決策問題中,通常需要假設或者估計對方的信息,方法各有特色。
在文獻[10]作者認為在完全競爭的市場環境下,市場參與者相對于市場規模都顯得很小,市場影響力很小。在這種情況下,優化報價決策不需要博弈的思想。文中作者認為電力市場屬于不完全競爭市場,單個市場參與者對市場是有影響力的,其模型本質上屬于不完全信息的非合作博弈。例如:每個參與者只知道自己的成本信息,而不知道對方的成本等信息。在這種情況下作者提出了這樣的一個問題:在無法完全了解對方的信息情況下,參與者如何投標(選擇高價投標還是低價投標)才能使自己收益最大。該文通過轉化的方式把不完全信息的博弈變為信息完全但不完美的動態博弈來求解。每個市場參與者均對自己的對手可能的出價進行分類,并對每一類的可能性進行概率估計,形成一個概率意義上的期望收益矩陣,用Nash平衡點的概念求解矩陣,得到問題的解。
文獻[11][12]作者提出了一種談判模型。每一個局中人進行決策時,都同時執行以下兩個步驟:①對可能的合作對象按照一定的指標進行優先排序;②按照談判優先順序,逐一進行討價還價,談判的規則與程序是預先設定好的。該文的特色是談判對象的優先順序表的形成。排序的準則基于該局中人A對關于他人的信息的了解程度。先分別對其他局中人的成本信息進行分類,并對每一類出現的可能性進行概率估計。然后假設與某局中人B進行合作,互相交換共享所擁有的信息,聯合成博弈的一方,剩下的局中人結合為博弈的另一方。這樣的博弈模型的Nash平衡點是概率意義上的期望值,作為與B合作的優先指標。對每個局中人都進行一遍以上計算,得到了A的談判對象優先順序表。每個局中人都有自己的一張優先順序表。最后按照預先設定的談判規則與程序,各方同時進行合作談判,談判要解決如何合理分配或均衡比單干多出的利益。
該文關鍵的一點:正確掌握對方的成本、策略等信息。各方可能從每一次博弈的結果中得到有用的反饋信息,并用這種反饋來更新自己的知識庫,提高對他人了認識。遺憾的是作者并沒有提到如何實現這樣重要的學習過程。該文的模擬算法中的一個缺點:計算量隨局中人的數目和每個局中人類型的數目的增長呈指數增長。
對于多邊貿易模式的電力市場,文獻[13]提出了多理論模型,解決貿易合作問題,文中的模型基于完全信息的博弈模型。模擬的過程包括四個階段:①確定自身成本等信息;②與對方互相交換信息,互相尋求合作伙伴;③按照預先設定的準則和協議進行聯合分組,形成一個談判對象優先順序表,這個順序表獲得方法于[11][12]的方法不一樣。作者采用公平性合作標準和Shapely值來確定這個順序表;④按照優先順序表進行雙邊談判。作者認為這四個階段可以反復迭代進行,直至沒有人愿意改變合作格局為止或者達到預先設定的計算時間。作者在文中考慮了多種情況,但是模型仍偏于簡單。
4.5用博弈論解釋和實現算法
文獻[14]用博弈論來解釋拉格朗日松弛法法解決機組經濟組合的算法。該文認為在電力市場的環境下,競爭各方均以實現自身利益最大化為目標,旋轉備用的約束變得軟起來,PX(power exchange)機構可能通過松弛這一約束進一步降低成本。該文提出了一種基于博弈論的算法獲取最優的旋轉備用。
作者認為拉格朗日松弛法的拉格朗日乘子是有經濟含義的,松弛旋轉備用的乘子 被看作是提供備用的價格信息,各時段的旋轉備用根據這個信息不斷在規定的高低兩種備用水平之間調整(例如:為t時段負荷)。根據優化原理,如果拉格朗日函數存在鞍點,則鞍點是原問題的最優解。
鞍點的概念與博弈論中的Nash平衡點有非常相似之處,如以上公式所示?;诖讼敕?,作者構造了兩廠商博弈模型。其中一局中人P代表整個實際電網的利益,它控制的決策變量是p,u(p向量表示各機組分配的有功,u向量表示機組啟停),目標是使整個系統成本最低。另一個局中人Q,是一個假想的發電商,它以價格向P銷售備用容量和有功容量。雙方就旋轉備用交易進行討價還價,最終達到一個平衡的交易量和交易價格。作者證明以上博弈過程的Nash平衡解就是拉格朗日函數的解。基于以上結論,作者設計了自適應的次梯度算法尋求平衡點,其中一個關鍵技術作者設計了廠商P對廠商Q備用容量報價的反應函數 該函數將 映射到備用容量的兩種水平之間(例如:5%Dt-%Dt,Dtt時段負荷),形成一個隨價格信息變動的備用容量。根據廠商Q是否了解廠商P的反應函數,模型可細分為兩種:Nash模型(不了解對方反應函數)和Stackelberg模型(Q了解P的反應函數),作者認為后一種模型掌握的信息較多,因此收斂的速度和優化的效果梢好于前一種模型。
用博弈論來解釋并且設計一些算法是一個新鮮而具有挑戰性的課題。博弈論本身就是帶有優化功能的一門嚴謹的數學,不過它更具有人的邏輯思維的色彩,融合了一些用別的方法難以表達的信息。
[關鍵詞]博弈論;認知無線電;頻譜共享
中圖分類號:TM743 文獻標識碼:A 文章編號:1009-914X(2015)22-0287-01
無線頻譜是十分有限的資源,為了實現多種無線應用服務,頻譜管理部門采用固定頻譜接入方法排除了其他干擾因素,即將頻譜分配給多個用戶,讓其單獨應用,因此,只有經過授權的用戶有資格使用頻譜,對于大部分非授權用戶而言,根本就無法應用頻譜。通信技術的發展,使人們對無線頻譜的需求量大量增加,由于可用頻譜已經被完全分配,從而使頻譜成為十分稀缺的資源。此外,由于頻譜利用率比較低,大部分頻譜都被白白浪費,由此可見,頻譜短缺的問題除了資源少之外,還包括其較低的利用率。本文通過闡述認知無線電技術的現狀,對其頻譜共享問題進行分析。
一、認知無線電與頻譜管理
認知無線電(CR)提出后,受到了人們的廣泛關注。美國將認知無線電定義為能夠隨時根據無線環境變化,而發生動態改變、發射參數的無線電技術。因此,認知無線電可以密切感受附近環境的無線頻譜狀態,并且自動搜集利用率較低的頻譜,按照相應的算法將其改變工作參數進行改變,以便適應外部環境的變化,使頻譜的利用率得到提高。認知無線電通過接入空閑頻譜(頻譜空穴),能夠對頻譜合理進行利用,實現了DSA,具體如圖1所示。
認知無線電技術能夠在很大程度上提高頻譜利用率,因而產生了認知無線電網絡,其研究內容比較多,包括高層協議、網絡社交,并成為了未來產業化研究的趨勢。對認知無線電網絡中的頻譜管理進行進一步研究,可以使頻譜資源得到更高效的應用。一般情況下,頻譜管理的主要內容有頻譜感知、判決、共享以及切換。
對于認知無線電的頻譜共享問題,常選擇基于圖論的圖著色的方法、基于注水算法以及基于博弈論的拍賣等方法。下文主要以博弈理論為前提,對認知無線電技術發展過程中存在的頻譜共享問題進行分析。
二、認知無線電頻譜共享
目前,存在很多動態頻譜接入技術,分級接入模型和頻譜管理政策是最兼容的,尤其是襯底式頻譜共享可以機會式的使用空閑頻譜,避免對網絡用戶造成影響。用經濟學的方法分析頻譜問題,可以提高空閑頻譜共享的積極性,提高其利用率。博弈論方法能夠更加清楚的分析認知無線電頻譜共享問題,使其利用率最大化。
1.博弈論基本內容
博弈論的概念是有經濟學中發展而來的,上世紀40年代后期,逐漸形成了合作博弈理論,通過對個體合作進行假設,對其最優策略進行分析。博弈論最初被應用在生物領域,之后逐漸發展為更多領域,包括工程學、社會科學以及計算機科學等,成為了分析個體之間合作、競爭性關系的十分有效的工具。傳統博弈分析里邊有一個基本假設條件,也就是參與者是完全理性的。一條信息P是共同知識,指群體G當中每個參與者都知道“P”,并且每個參與者都知道“每個參與者都知道‘P’”……不斷循環。理性即參與者選擇使自身效用最大化時的行動。在上述假設下,博弈的解便是參與者預測的結果。完全理性的接設條件在現實中很難滿足,但博弈論的應用對象主要為計算機,因此可將其看做理性范圍。
一般情況下,博弈類型主要為合作博弈、非合作博弈。非合作博弈是參與者根據效用函數選擇的理智行動,每個參與者都需要利己,選擇各自的策略。而非合作博弈的內容很多,可以應用在很多領域中。一個博弈之中,某個參與者的自身信息也許不被其他參與者知道,因此根據參與者彼此的了解程度可以將博弈分為兩類,即不完全信息博弈、完全信息博弈。除此之外,一個博弈里邊,參與者可能一起行動,也可能有順序的行動,因此可以根據其行動次序分為動態博弈、靜態博弈。靜態博弈是參與者在不知道他人選擇的情況下做出的策略決策,參與者完成決策后,表明博弈結束;動態博弈中,參與者難以獲得參與者的全部信息,即為不完全信息動態博弈。
2.博弈論應用在頻譜共享的可行性
因為頻譜資源是十分有限的,但在通訊技術的發展下,人們對無線頻譜的需求越來越大,而采用頻譜共享技術解決這一供需矛盾,具有十分重要的意義。要想實現頻譜共享問題,就要解決很多實際問題,比如網絡基礎設施差異、用戶移動性及不同用戶的行為等。在整個認知無線電系統中,網絡授權系統和認知系統是共存的,每個系統中的用戶都存在不同的行為,有些網絡用戶是互相協作的關系,在網絡拓撲中能夠完成傳輸任務,有些用戶僅完成自己的通信任務,個別用戶甚至肆意破壞別的用戶的通信狀況。只有系統分析網絡用戶的行為及相互作用,才能更好的實現頻譜共享。博弈論主要研究彼此競爭或者合作的個體,和動態頻譜共享問題的研究內容一樣??梢圆捎貌┺恼摲治鲱l譜共享問題,并得到解決措施。結合認知無線電技術進行動態頻譜共享時,博弈包括的要素主要有參與者、策略空間以及效用函數。
參與者是授權網絡或者認知網絡,也可以是兩者的組成,根據參與者構成內容及數量,組成相應類型的博弈。因此,采用博弈論可以更好的解決認知無線電的頻譜貿易問題。
三、性能仿真分析
1.參數設置
文章主要對重復庫諾特頻譜共享博弈模型進行分析。由主用戶、次用戶共享15MHz頻譜的認知無線電環境,所有認知用戶的目標BER均為,博弈動態模型為下列公式:
上述公式中,bi(t)是某個時刻t次用戶i可以分到的頻譜;ai是次用戶i速度調整參數,ri是此用戶i的收益,公式中則是此用戶的傳輸速率;k是頻譜密度效率,x與y都是非負常數,c大于等于1。主用戶價格函數采用X=0,Y=1,c根據環境評估予以調整。主用戶頻譜價格w=1,則次用戶收益ri=10。
2.仿真結果分析
由于信道質量存在較大差異,因此納什均衡在不同點上,因為使用的是自適應調制技術,次用戶能夠在頻譜一樣的情況下,得到更好的傳輸速率及收益,對于次用戶而言,要動態庫諾特博弈中頻譜共享軌跡能夠說明次用戶i速度參數為ai=az=0.14;在速度相同的參數下,納什均衡點信道質量良好,能夠使曲線出現更大變化。
圖2是不同信道質量和穩定區域的關系,不同信道質量穩定范圍在a1~a2上,若此范圍的數值設置在此區域,可以確保頻道共享的穩定性;若超出此范圍,則說明共享不穩定,容易出現較大波動。
三、結語
認知無線電技術的發展,已經受到行業人士的廣泛關注,其發展應用能夠為通信技術做出重要貢獻。進一步研究認知無線電技術,通過借助博弈論的相關內容,能夠減少頻譜資源有限帶來的通信束縛,從而使無線通信技術得到更好的發展。
參考文獻
關鍵詞:博弈論;博弈模型;旅游;綜述
中圖分類號:F2文獻標識碼:A文章編號:1672-3198(2012)15-0009-02
隨著旅游業的蓬勃發展,國內旅游研究也經歷了近30年的快速發展歷程。期間,學者們不斷引進各大學科的方法和理論,以充實旅游研究的理論基礎。近年來,博弈論作為旅游研究的重要方法被廣泛使用,豐富了旅游研究的內容。本文主要從博弈模型運用的角度對博弈論在旅游研究中的文獻加以梳理,希望對相關研究者有所裨益。
1 綜述基礎和主要領域
1.1 綜述基礎
筆者以“旅游、博弈”為關鍵詞或者題名在維普科技中文全文數據庫檢索,檢索期從1989年至2011年12月29日,共有全部期刊文獻225篇,其中在核心期刊上發表的共有67篇,其中有效文獻(有效文獻指真正運用具體博弈模型的文獻)58篇,具體分布如表1:
從表1可以看出,博弈論在旅游研究中的運用開始于1996年,至今已有15年,由最初的零星運用期演化到至今的相對穩定期。其中核心期刊上的論文分布與總體趨勢相吻合,故筆者主要對核心期刊上的67篇文獻進行仔細研讀,對其中58篇有效文獻進行詳細的分析和梳理。
1.2 博弈論在旅游研究中的主要運用領域
縱觀近15年的旅游博弈研究,學者們著眼于旅游業的各個領域,透過不同角度進行研究。其中主要的研究領域如圖1所示:
由圖1可知,區域旅游是旅游博弈論研究中運用最多的領域,共有14篇,占全部文獻的24.13%。該領域的文獻主要集中于“長三角”、“泛珠三角”、“京津冀”、“紅三角”等國內主要的經濟區,從區域旅游的競爭合作入手,指出區域內政府間合作的必要性和重要性并且提出相應對策。其次是旅游市場的博弈研究,其主要分析買賣雙方之間由于信息不對稱而導致旅游市場的低效率,并且從政府和企業兩方面提出改善產品質量和信譽機制的建立等提高旅游市場效率的方案。再則,鄉村旅游的博弈研究是近期關注的焦點之一,主要從社區參與的角度研究鄉村旅游的發展,關注社區農民的利益保障問題,而鄉村旅游中的環境保護問題也是學者的關注點。另外,環境保護、旅游商品供應鏈、景區開發等問題也是博弈方法運用的主要領域。
2 旅游博弈研究中的博弈模型運用情況
運用博弈論研究旅游最主要是博弈方法和模型的運用對旅游現象的解釋和說明,所以對博弈模型運用的梳理顯得尤為重要。筆者將以博弈的基本分類為基礎解讀博弈模型的使用情況,具體分布如圖2:
2.1 非合作博弈模型的運用
(1)完全信息靜態博弈的運用。
完全信息靜態博弈是是四種類型中相對簡單也是運用最普遍的類型,故運用這一博弈類型的文獻共有34篇,占全部文獻的58.62%。
完全信息靜態博弈的經典模型有囚徒困境、智豬博弈、斗雞博弈、市場爭奪戰博弈、古諾模型和勃特蘭寡頭博弈等,通常以矩陣形式展現。在旅游研究的文獻中運用這一博弈的類型的學者多數是將這些經典模型運用到具體領域中。
①囚徒困境:囚徒困境模型是在這類博弈中運用最普遍的模型,通常用來證明博弈雙方在各自理性的情況下無法達到帕累托最優。于巖平運用此模型解釋旅游企業和核心員工之間的忠誠度問題,得出一次雙方唯一的均衡解是各自不忠誠,一次博弈難以維系兩者之間心理契約的忠誠締結。呂興洋等分淡旺季在旅游供應商和中間商之間的合作與否進行單次博弈,無法達到帕累托最優。羅富民等通過此模型說明區域旅游合作中的政府公共產品供給不足的問題的存在,又通過斗雞博弈模型證明公共產品供給失衡問題的存在。另外,此模型也可以運用到新景區開發以及旅游產品價格競爭問題等。
②智豬博弈:此模型主要運用于實力不均衡的博弈主體之間弱者的搭便車現象。如在旅游地形象促銷問題中,運用此模型說明大企業著力促銷而小企業搭便車收益的問題。
③勃特蘭寡頭博弈:將此模型運用于旅游研究中一般體現在旅游產品的價格競爭和決策問題上。任寧寧等將此模型運用于旅游商品的生產企業之間,說明旅游企業的價格競爭,得到的均衡解為兩企業以最低價格生產并均分市場。
④古諾模型:此模型的運用主要解決博弈主體所提品的量的選擇問題。王居鳳等運用此模型解釋兩寡頭生產產量的選擇方式并且將此擴展到n個企業,說明為了維持聯盟穩定性而建立協議的必要性。
⑤Hotellin品決策模型:李洪娜等通過對此模型的具體表述和分析闡述了同質旅游產品間的競爭問題,分別提出了通過產品差異化策略和打造品牌旅游產品來提高競爭能力。
(2)完全信息動態博弈的運用。
完全信息動態博弈的經典模型有海盜分寶博弈、斯塔爾伯格寡頭博弈、蜈蚣博弈等。運用該類型的文獻有13篇,占文獻的22.4%。
①斯塔爾伯格寡頭模型:此模型其實是古諾模型的動態化,將同時決策的倆寡頭演變為先后決策的領導者和跟隨者之間的產量決策博弈。楊樹等將此模型改良后運用到旅行社的服務質量決策問題中,并且分析得到在一次次的質量決策博弈后總能得到最優策略。
②海盜分寶博弈:饒勇等將此模型運用到旅游開發商和社區居民間對旅游資源收益的分配問題上,但是僅僅闡述了模型,沒有對此進行詳細分析和解答。
[關鍵詞]進化 博弈 文獻綜述
一、進化博弈的基本理論
進化博弈論的研究起源于生物學領域,其目的是為了解決動物和植物的沖突及合作,為達爾文的自然選擇過程提供數理基礎。進化博弈理論結合經典博弈理論及生態理論研究成果,以有限理性的參與人群體為研究對象,利用動態分析方法把影響參與人行為的各種因素納入其模型之中,并以系統論的觀點來考察群體行為的進化趨勢。正是基于其在生物物種與種群的競爭進化演變規律分析中的成功,眾多學者紛紛將其概念和前提加以修正,將其廣泛應用于經濟領域、社會領域來解釋并預測人的群體決策行為。
二、進化博弈理論的應用研究
1.社會行為領域
Conlisk利用帶滯后項及隨機項的離散時間動態來分析參與人是否總是行為的最優者。它假定有“最優化”及“模仿”兩個純策略,其中非最優化者有一個二次損失函數,在此基礎上,他尋求一個滿足非最優化者損失函數等于最優化者正的常數成本的均衡群體比率,從而得出結論:當群體中幾乎都是最優化者時,模仿比最優化策略更合算,因此,群體中非最優化者在群體中最優化者所占比例并不漸進地收斂于1。Peyton Young認為現實中每個參與人都是在前人給定的經驗知識基礎上選擇策略,個人選擇策略是一個適應性的學習過程。個體在做出選擇時,盡管參與人存在一定的慣性及犯錯誤的可能性,經過行為的長期進化,這個適應性學習過程也會收斂于一個有效率的傳統或合約。Sandholm對個體行為偏好的進化進行了動態分析。Juang從進化的視角研究了規則的進化與均衡的選擇問題。Nyborg和Rege探討了有關吸煙行為的社會規范的深化,并運用挪威的經驗數據對結論進行了檢驗。
2.制度的演化
青木昌彥等運用進化博弈理論分析了社會經濟體制的變遷。他們認為:任何一種經濟體制的產生都具有一定的慣性,并隨著經濟所處的外部環境與所積累的內部環境的變化一起逐漸地進化。吳炯、彭飛以進化博弈的復制動態方法為工具解釋了公司治理結構演進過程中的“兩極化”現象。邱中華等通過演化博弈模型考察委托人和人在委托過程中行為策略的自發演化過程,發現這一博弈過程的所有均衡都是鞍點,從而得出委托人和人之間的監察博弈沒有進化穩定策略。Kandori和Rafael運用進化博弈理論研究了兩種具有網絡外部性的技術之間競爭的博弈過程,提出了解決“花車效應”問題的對策,論證了后發技術取代主導技術的可能性。
3.經濟行為的演化
Routledge基于Grossman和Stiglitz提出的經濟模型,探討了金融市場上個體行為人是如何通過適應性和進化學習來發現內生變化并運用這種內生關系的一種學習模型。他通過模仿過程和經驗過程來對個體的投資行為建模,而不是運用傳統上的顯性最優化方法放松關于知識和理性的假設。Cowen和Kroszner利用進化博弈理論研究了在自由競爭易貨貿易經濟中,在存在交易成本的情況下,交易媒介的選擇問題。羅發友等對集群內企業技術創新行為構建了鷹鴿博弈、鷹鴿反擊者博弈和鷹鴿應變者博弈三個模型,并得出集群內企業創新行為不存在純策略進化穩定均衡,但存在混合策略進化穩定均衡和行為策略進化穩定均衡,反映了集群內企業創新行為的協同競爭性以及這種協同競爭創新行為的進化穩定特性。
三、借鑒意義
1.進化博弈論從有限理性人出發,強調系統達到均衡的過程而非均衡本身。進化博弈理論是完全摒棄傳統理論中非現實的“理性人”假設,直接從有限理性參與人群體出發而提出的一種全新的動態分析方法,該方法認為經濟系統達到均衡需要一個長期的漸進過程,均衡結果依賴于達到均衡的過程。
2.進化博弈論納入了系統到達均衡的時間因素,有利于決策者控制系統向目標的進化。進化博弈理論的動態分析方法中一個顯著特征就是把參與人的決策過程時間及因素互動的時間納入到其基本模型之中,強調系統達到均衡的過程。這樣有利于決策者控制經濟系統使之朝向既定的目標前進,也有利于決策者尋找能夠最大限度地促進系統向意愿均衡轉化的因素,使系統盡快達到有效率的均衡。
3.進化博弈理論引入突變因素較好的解決了多重均衡的選擇問題,即系統最終會趨于哪一個均衡依賴于系統的初始狀態。進化博弈理論的基本均衡概念――進化穩定均衡,描述了當經濟系統一旦進入到某一均衡的吸引域內,系統就會對其他的突變策略具有一定程度的抵抗力。
參考文獻:
[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)
[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998
[3] 青木昌彥 奧野正寬:經濟體制的比較制度分析.中國發展出版社,1999
[4]邱中華 金翔:基于進化博弈論研究的一類監察博弈. 南京郵電大學學報(自然科學版),2006,26
一 博弈理論簡介
(一)博弈論的名稱
博弈論,英文名稱為Game theory是研究各方策略相互影響的條件下,理性決策人的決策行為的一種理論。博弈論剛被介紹至我國時,曾有過多種譯法。有的學者根據其英文名稱,直譯為游戲理論;有的學者則從該理論本身的研究對象出發,轉譯為對策論或對策運籌論。近年來,學術界越來越多地接受了博弈論這一名稱。這除了由于博弈這個帶有文言味的詞本身的學究氣濃郁而給人的第一印象較為深刻外,更重要的是博弈一詞能更準確、全面地體現策略選擇、依策而動以及最終結果三者的統一。
(二)博弈的要素
一個完整的博弈應包含如下四項要素:1,博弈的參加者(player)。也稱局中人或博弈方。是指博弈中能獨立決策、獨立行動并承擔決策結果的個人或組織。小到一個人,大到一個跨國公司乃至一個國家,只要能獨立決策和行動,都可視作一個博弈方。比如柯達與富士公司的競爭,就可看作一個有二個博弈方的博弈。一般說來, 博弈的參加者越多,情況就越復雜,結果越難預料。2,策略空間(strategy space)。是指各博弈方可選擇策略的集合。strategy直譯應為戰略,不過戰略一詞對大多數博弈來講顯然過于抽象和寬泛了。每一個策略都對應一個相應的結果。因此每個博弈方可選的策略數量越多,博弈就越復雜。3,進行博弈的次序(the order of play)。博弈中各博弈方行動的順序對于博弈的結果是非常重要的。同樣的博弈方、同樣的策略空間,先后決策并行動和同時決策行動,其結果是大相徑庭的。 4,博弈的信息(information)。知己知彼、百戰不殆??梢娦畔Σ┺牡闹匾怨湃嗽缫阎?。博弈中最重要的信息是有關對手策略以及各博弈方得益的信息。例如,在各博弈方同時決策的博弈中,必須保證不能讓對手知道自己采取何種策略,否則自己將永遠是博弈的輸家。得益(play off),也稱支付,是指博弈方策略實施后的結果。有關得益的信息是促使某博弈方選擇某種策略的關鍵參考值。理性的博弈方總是選擇能使自己獲得最大得益的策略。一旦確定了以上四要素,一個博弈也就隨之確定了。值得注意的是,博弈論特別強調“理性人”的前提假定,即參加博弈的各博弈方始終以自身利益最大化為惟一目標。除非為了實現自身最大利益的需要,否則不會考慮其他博弈方或社會利益。
(三)博弈論的結構
由于一個完整的博弈需具備上述四要素,因此博弈可以從不同的角度劃分成不同類別:1,按博弈方劃分,可分為單人博弈和多人博弈。單人博弈因為只有一個博弈方,所以它已退化為一般的最優化問題。經濟學中常見的求最優問題,實際上是博弈的特例。多個博弈方的博弈較單人博弈復雜,而且兩人以上的博弈會出現合作博弈問題。這樣,多方博弈又將分為合作博弈與非合作博弈。因為在社會與經濟關系中,競爭與不合作是基本方面。所以當前的博弈論主要研究的是非合作博弈。1994年諾貝爾經濟學獎三位得主的主要貢獻,即在非合作博弈方面。2,按策略空間劃分,可分為有限策略博弈和無限策略博弈。因為每一種策略都相應地對應一個得益結果,所以從理論上講,有限策略博弈的結果必然是有限的,而無限策略博弈的結果則有無窮多種可能。3,按進行博弈的次序劃分,可分為靜態博弈和動態博弈。各博弈方可同時決策并行動的博弈稱為靜態博弈。當然,嚴格講各博弈方在非常精確的同一時點同時決策是不可能的。因此,同時決策是指可近似地看作同時作決定的過程,如乒乓球團體賽的出場順序,雖雙方決策可能有早有晚,但一旦敲定便誰也不許變更,因而可看作同時決策。各博弈方不是同時決策,而是先后、依次決策、行動的博弈叫動態博弈。弈棋就是一種典型的動態博弈,雙方的每一步都將取決于前面的情勢。4,按信息劃分,如按得益信息分類,可分為完全信息博弈與不完全信息博弈。完全(complete)信息,是指各方對自己每種策略的得益情況完全清楚,否則是不完全信息;在動態博弈中,如按博弈進程信息分類,可分為完美信息動態博弈與不完美信息動態博弈。完美(perfect)信息,是指博弈方在決策前對其他博弈方的行為完全了解,否則是不完美信息。5,按得益情況劃分,可分為零和博弈、常和博弈和變和博弈。一方收益必來自另一方的損失,這樣的博弈叫零和博弈,零和博弈的博弈方始終是對立關系;各方都會有收益,但收益總和是一固定常數,這樣的博弈為常和博弈;各方不同的策略組合會有不同的收益,這樣的博弈稱變和博弈。顯然,零和博弈是常和博弈的特例,常和博弈是變和博弈的特例。6,綜合分類。綜合分類是將博弈次序與博弈信息結合起來的一種分類方法。按這兩個標準,可將博弈分為:完全信息靜態博弈、不完全信息靜態博弈、完全且完美信息動態博弈、不完全但完美信息動態博弈、完全不完美信息動態博弈以及不完全不完美信息動態博弈。這種分類方式有助于針對不同特性的博弈進行研究和求解。
博弈論 (Game Theory),是研究決策主體的行為發生直接相互作用時候的決策以及這種決策的均衡問題。因此,博弈論又稱為“對策論”,也就是說當一個主體,比如一個人或一個企業的選擇受到其他人、其他企業選擇的影響,而且反過來影響到其他的人、其他企業的決策問題和均衡問題。正是在這個意義上,博弈理論又譯為“決策理論”。博弈論創立于20世紀40年代,到50年代博弈論的研究達到了頂峰。博弈論研究的決策不僅包括經濟學領域,而妾包括政治學、軍事、外交、國際關系、公共選擇等各個領域,因而博弈論又被稱之為方法論。本文擬將這種方法引入到反壟斷法領域,具體分析反壟斷法規則的制定過程。
二、反壟斷法的博弈分析
(一)政府和企業之間的博弈分析
1, 政府和企業博弈的根源
企業,作為市場運行主體,在市場經濟中具有強烈的追求利潤的理性意識;企業的理性就是實現利潤的最大化。企業一切經濟活動的出發點和歸宿都要以這個目標為指導。在利潤最大化目標的指導下,企業必須研究市場上其他主體的戰略并確定自己的戰略,從而市場上各個經濟主體都是企業博弈的對象。企業決策往往具有局部性、個體性和短期性的特點。與之相對,政府作為市場運行的監管主體,是社會理性的當然代表,其決策往往帶有全局性、整體性和長遠性。由于政府制定的各種市場運行規則客觀上限制了企業理性的發揮;尤其是當社會理性和企業理性發生沖突時,作為被管理者的企業只能尋求“次優方案”。當然,企業也并非只是一味地妥協,也可以與政府進行博弈從而影響相應的法律、法規的制定。由政府所代表的社會理性和企業理性的沖突及其在現實經濟生活中的具體表現——政府所代表的社會利益與企業追求自身利潤最大化的矛盾,決定了二者都將對方視作自己的博弈對象,從而使具體的法律、法規,尤其是反壟斷法的制定過程,表現為政府和企業的博弈過程。
2,政府和企業參與博弈的目的
企業,作為盈利性的經濟組織,是以實現利潤最大化為其根本宗旨的;并且在這一根本宗旨的指導下組織各種經濟活動。只要能夠降低企業的生產成本,提高企業的利潤,企業都不惜一試,包括采取壟斷的方式。但是,壟斷的存在,不僅侵害了廣大的消費者的利益(具體表現是通過壟斷價格,將相當大的一部分消費者剩余轉化為超額利潤。),而且憑借其“市場勢力”阻礙了有效的競爭,打破了市場競爭的均衡狀態。政府,作為社會利益的代表,具有保護消費者的合法權益和維護市場有效的競爭秩序的當然職能;其可通過制定法律影響著企業決策的“可選擇集”,即企業只能在法律許可的范圍內進行選擇。顯然,“可選擇集”越大,對企業越有利;而決定企業“可選擇集”大小的恰恰就是政府。因為政府通過確定其產業政策和競爭政策的具體內容和相互關系,影響認定壟斷的界限,并通過反壟斷立法決定了企業可選擇范圍的大小,從而間接地決定了企業的盈利空間。企業參與博弈的目的就是通過影響政府的反壟斷法規,實現對企業行為的有效規制,進而最大限度地保護社會公眾的利益。
3,反壟斷法的博弈分析
反壟斷法指的是國家為了保護競爭,針對一些限制競爭行為所規定的法律規范的總稱。其目的就是政府通過法律的手段限制企業有礙于競爭的經濟行為。政府在決定是否將一種企業的經濟行為列入受限制之列前,政府要作如下的博弈分析:保持企業退出
政府面對一種限制競爭行為有兩種選擇:干預,即將其限制于合理的范圍之內;或者放任自流。政府要進行干預需要支出相應的費用,設費用為5,占總收益10的一半,那么經政府干預給社會帶來的凈收益是5(總收益10減去干預費用5)。此時,企業針對政府的干預政策有兩種策略:其一是保持原有的狀態不變,繼續從事具有壟斷性質的經濟活動。但是,由于法律的強制性,如果企業采取此策略無異于自取滅亡。此時,企業不但不會盈利,相反還會被強制清除出場。其二是企業選擇退出。此時,企業只需要付出沉淀成本,設其為收益的一半為5;在這種情況下,企業的收益為-5.政府還有另外一種選擇,就是放任自流。這樣,如果企業保持原來的壟斷狀態,就將獲得全部的利潤所得,社會公共利益為0;如果企業選擇退出,那么全部利潤將自動流向政府所代表的社會公眾,此時,企業還要支付相應的沉淀成本。由于政府干預經濟的目的就是為了將“壟斷利潤”返還給廣大的消費者,(0,10)所代表的狀態正是政府介入的原因,并且是政府所要竭力改善的初始狀態。(10,-5)所代表的是企業自動放棄高額的壟斷利潤,并且還要為此承擔相應的前期投入,即沉淀成本。這是不符合企業追求利潤最大化的理性目標的,因而是不現實的。由此,政府只能選擇干預策略。企業根據其對政府選擇的分析判斷政府介入的可能性,然后在(5,-10)、(5,-5)和(0,10)三種狀態中進行選擇。由于(5,-10)的高成本和(0,10)的不現實性及由此決定的高風險性,迫使理性的廠商選擇(5,-5)所代表策略。這樣,可以將損失降低到最低。政府經過上述博弈分析,最終決定將該經濟行為納入禁止之列;而企業也會選擇放棄該壟斷行為。至此,反壟斷法的目的得以實現。
4 對反壟斷法進行經濟分析的意義。
對反壟斷法進行博弈分析的意義在于揭示反壟斷法的制定過程從某種意義上講就是政府和企業的博弈的過程,反壟斷法律規范的具體規范則是政府和企業的博弈結果在法律上的認定。所以,在反壟斷法的制定過程中,應該站在企業的立場上考慮企業可能做出的策略選擇,然后再確定法律是否對該行為進行規制及如何規制。這樣,才能保證制定出的法律能有效地規制企業的行為,有效地保證競爭。
(二)企業間通過價格等壟斷協議的博弈分析
在寡頭市場上,當寡頭數量很少時,從理論上說,他們很容易通過談判實行勾結定價,即像一個壟斷者那樣用高價格來宰消費者。這樣做,交易費用(寡頭進行價格勾結談判達成協議所需要的費用)并不高,而勾結定價可以為參與者帶來共同的利益。但為什么這種勾結定價在現實中成功的很少呢?盡管許多國家“反壟斷法”中有禁止勾結定價的條款,但實際上這個條款的作用極為有限,因為寡頭之間可以采用不易被發現的隱蔽性勾結——默契。我們可以用博弈論的分析來說明現實中的勾結定價難以成功的原因。
我們假設某地牛奶市場由兩家寡頭瓜分,這是寡頭中最簡單的寡頭——雙頭,也是最容易達成價格勾結協議的寡頭市場。如果這兩家寡頭(A與B)之間沒有任何勾結,各自按成本最低時產量進行生產,各生產3000磅牛奶,成本為每磅6元。這時,市場總供給量為6000磅牛奶,價格為6元。各家都沒有經濟利潤(經濟利潤為零)。
現在這兩家寡頭達成價格勾結。要實現高價必須減少產量?,F實中寡頭之間的價格勾結總是以限產為前提的(以后要談到的歐佩克就是這樣)。如果這兩家寡頭把產量確定為 2000磅牛奶,這時成本為每磅8元。市場總供給量減少為4000磅牛奶,需求并沒有變,價格上升至每磅9元。在這種價格時,每家寡頭可獲得經濟利潤 2000元。當然,勾結起來對雙方都是有利好的。
如果達成協議方有一方違約會有什么結果呢?如果一方違約,生產3000磅牛奶,它的每磅牛奶成本約為6元,另一方守約生產2000磅牛,每磅牛奶成本為8元。這時市場總供給量為5000磅牛奶,價格為7.5元。市場價格只有一個,是整個市場的供求總量決定的。違約的一方,成本僅6元,價格為7.5元,每磅牛奶的利潤為 1.5元,總計經濟利潤為4500元。守約的一方,成本為8元,價格也是7.5元,每磅牛奶虧損0.5元,2000磅牛奶共虧損1000元。
這兩個寡頭的價格勾結協議的實施并沒有法律保障,因為這種協議是非法的。守約的一方無法對違約的一方提出訴訟,即缺乏有效的懲罰。是否守約完全取決于各自的意愿。他們是否會守約呢?一方守約與否的結果還取決于對方是否守約,協議并沒有保證對方守約的硬約束,因此,各方都有守約與違約兩種選擇,而對方到底會選擇什么,無法確定,這時就可以用博弈論來分析各自的決策了。
我們來看A的決策過程。A要分析在B不同的選擇下,自己的選擇會有什么結果。A先假設B是守約的,這時A選擇守約可以賺2000元,如果選擇不守約可以賺4500元。兩者相比,A守約時,B的占優戰略是不守約。A再假設B不守約,這時A選擇守約要虧損1000元,如果選擇不守約可以不賠不賺(經濟利潤為零)。兩者相比,A不守約時,B的占優越略也是不守約。A的結論是,無論B守約還是違約,對自己最有利的還是不守約。B的分析方法和結論與A完全一樣。結果A、B都選擇了不守約,價格協議成了一張廢紙。
在這種情況下,A、B如何才能實現勾結呢?研究者發現,如果就是這兩個寡頭,同樣的博弈會多次進行。雙方最終會發現,達成勾結的條件是采用一報還一報的策略,即對方這次守約,我下次也守約,如果對方這次不守約,我下次也不守約。這種情況下,雙方會發現,從多次博弈的結果看,違約是不利的,從而自覺守約。這種一報還一報就成為有效的懲罰。但在現實中這種情況極為罕見——只有兩個寡頭,而且多次重復同樣的博弈。在常見的多頭博弈,而且同樣的博弈很少反復進行的情況下,價格勾結就難以成功了。
這種分析與現實一致嗎?一個最常用的例子就是歐佩克(石油輸出國組織)的價格勾結。歐佩克是一個限制產量并提高石油價格的寡頭價格聯盟(又稱“卡特爾”)。他們在70 年代的成功更多的是共同的政治動機。但經濟利益在長期中是高于政治的。隨著時間流逝,博弈論分析的情況就出現了。各成員國都想,無論其他國家是否守約,我違約對自己是有利的,于是紛紛打破限產規定,增加生產,結果到80年代,石油價格就大幅度下跌了。以后的石油價格上升不是價格協議起作用,而是供求關系變動的結果
在任何一種市場上,決定價格的最基本因素還是供求關系。在供大于求的情況下,任何價格勾結都不能長遠地提高價格。在供小于求的情況下,無需價格勾結,價格也會上升。在價格決定中,價格勾結是無用的。過去我國出現過的汽車行業自律價和民航的禁折令等形式的價格勾結,哪一個實現了?人為的價格勾結當然阻擋不了供求決定價格的客觀規律。博弈論分析的結論與現實是一致的。企業還是不要玩這種小權術,老老實實提高自己的市場競爭。
三、小結
本文通過對反壟斷法的制定過程進行簡要的博弈分析,旨在說明法律的制定不僅是立法機構的單方行為,還是一個規制者與被規制者——政府和企業相互博弈的互動的過程。如果在法律的制定過程中忽略了這一點,就很容易導致法律對于現實生活的無效和“無能為力”,從而不能有效地實現其價值。
參考文獻
[1]張維迎。博弈論與信息經濟學[M].上海人民出版社,1996。
[2]馮濤。程瑜。微觀經濟學[Z].西北大學出版社,1998。