作為習(xí)慣權(quán)利的形成和演化論文參考
【摘要】對(duì)民俗的田野觀察與對(duì)人類學(xué)文獻(xiàn)的深入研究無疑為習(xí)慣和習(xí)慣法研究提供了洞察力的源泉。但一個(gè)根本性的問題是被觀察或發(fā)現(xiàn)的習(xí)慣已經(jīng)存在了。對(duì)于研究者來說習(xí)慣是既定的,習(xí)慣究竟是如何產(chǎn)生的則并不清楚。如果不能揭開習(xí)慣產(chǎn)生的“黑箱”,習(xí)慣法一直依賴既定習(xí)慣的狀況在邏輯上可能會(huì)導(dǎo)致一直追溯歷史的無限遞歸。新制度經(jīng)濟(jì)學(xué)和演化博弈論的結(jié)合使得揭開制度“黑箱”成為可能。因此這一融合后的理論也許是習(xí)慣法研究的一種新進(jìn)路。
【關(guān)鍵詞】小費(fèi)博弈;重復(fù)博弈;習(xí)慣
一、引言
在歐美社會(huì),一個(gè)人在諸如餐館之類的消費(fèi)場(chǎng)所消費(fèi)后一般會(huì)給侍者一些小費(fèi),后者也不會(huì)有任何覺得不好意思的地方。消費(fèi)者給服務(wù)者一定的小費(fèi),服務(wù)者提供優(yōu)質(zhì)服務(wù),這在很多場(chǎng)合成為了一項(xiàng)清晰的習(xí)慣,并具有規(guī)范效力。
任何習(xí)慣的生成固然有自己的歷史,但這并非說我們要了解某一習(xí)慣的內(nèi)在演化機(jī)理就必須回到它當(dāng)初的歷史當(dāng)中。從理論上說,如果我們理解了習(xí)慣的內(nèi)生機(jī)理,那么不僅可以解釋既存的習(xí)慣,而且可以了解某一習(xí)慣產(chǎn)生的條件,甚至可以在一定程度上預(yù)測(cè)習(xí)慣的變遷。
二、小費(fèi)博弈:習(xí)慣的演化
(一)小費(fèi)博弈的構(gòu)建
我們構(gòu)建一個(gè)小費(fèi)習(xí)慣博弈模型來說明該習(xí)慣產(chǎn)生的過程。根據(jù)博弈理論,一個(gè)博弈是由參與人、規(guī)則、信息、策略、效用函數(shù)和時(shí)間等要素構(gòu)成的結(jié)構(gòu)化系統(tǒng),或者說一個(gè)博弈就是一個(gè)制度。但演化博弈論不是從既定規(guī)則出發(fā),而是經(jīng)過博弈產(chǎn)生規(guī)則。這和我們欲求的習(xí)慣生成機(jī)制是完全兼容的。
假設(shè)1:假定存在一個(gè)封閉的社區(qū),有一個(gè)不大的小餐館,服務(wù)方和消費(fèi)者幾乎全是該社區(qū)的成員。這樣交易就是在人格化關(guān)系的社會(huì)網(wǎng)絡(luò)中展開的。
假定消費(fèi)者來這里就餐有兩種需求:一是消費(fèi)到價(jià)廉物美的美食;二是服務(wù)員的優(yōu)質(zhì)服務(wù),也就是說他們就算很滿意餐館提供的美食也仍然希望享受到“微笑”服務(wù)。
那么沒有規(guī)則的博弈是從偶然開始,畢竟有無數(shù)的事物的產(chǎn)生和發(fā)展都是源于歷史的偶然。小費(fèi)博弈也同樣開始于歷史的偶然。
我們假定:一個(gè)女服務(wù)員獲得了愛情,在她服務(wù)時(shí)對(duì)顧客露出了迷人的微笑,這使顧客如沐春風(fēng),獲得了異乎尋常的美好就餐體驗(yàn)。他也十分偶然的用“小費(fèi)”[1]來表示自己的補(bǔ)償,就是說在支付價(jià)格之外又給了她一張小額鈔票作為對(duì)她服務(wù)的額外支付。這次偶然的巧合對(duì)服務(wù)交易雙方來說均是一次十分愉快的經(jīng)歷。由于這是一個(gè)封閉的社區(qū),交易是在人格化的社會(huì)關(guān)系網(wǎng)絡(luò)中進(jìn)行的,因而顧客和服務(wù)員可能會(huì)記住彼此的行為。如果這樣的巧合只發(fā)生一次,或者雖然再一次發(fā)生但間隔期太長(zhǎng)以至于上一次的巧合已被完全遺忘,那么的確小費(fèi)博弈不能開始進(jìn)行。如果巧合又一次發(fā)生了,間隔還在記憶容許的范圍內(nèi),那么雙方就可能對(duì)小費(fèi)和微笑的交易有一個(gè)模糊的初步認(rèn)識(shí)。
在接下來的日子里當(dāng)他們?cè)俅蜗嘤鰰r(shí),服務(wù)員可能會(huì)想如果我微笑顧客是否會(huì)支付小費(fèi),而如果顧客不支付小費(fèi)我為什么要微笑。同樣顧客也可能會(huì)想如果我支付小費(fèi)服務(wù)員是否會(huì)微笑,而如果她不微笑我為什么要支付小費(fèi)。于是現(xiàn)在的問題就是對(duì)小費(fèi)和微笑的交易已經(jīng)有了初步認(rèn)識(shí)的交易雙方如何選擇行為策略的問題。
一個(gè)類似囚徒困境的小費(fèi)博弈可以建構(gòu)了。下面是該博弈策略組合矩陣:
小費(fèi)博弈
小費(fèi)博弈
觀察這個(gè)博弈,可以發(fā)現(xiàn)有兩個(gè)納什均衡:(5,5)和(0,0)。代表小費(fèi)習(xí)慣的(5,5)是我們想要的均衡,代表維持原狀的(0,0)是我們不想要的均衡。那么小費(fèi)習(xí)慣有可能演化出來嗎,答案似乎令人沮喪。因?yàn)樵谠摬┺闹校?,0)是雙方占優(yōu)策略組合的均衡,當(dāng)然也就是說更有可能是維持原狀了。
(二)小費(fèi)博弈的重復(fù)博弈
演化經(jīng)濟(jì)學(xué)家羅伯特?薩格登在論證交通博弈[3]時(shí)說明因?yàn)榕既辉蜃呱狭巳我粋€(gè)均衡路徑就會(huì)在重復(fù)博弈的過程中通過反饋而自我強(qiáng)化,所以即便存在一些干擾,但從長(zhǎng)期趨勢(shì)來說,習(xí)慣是自我實(shí)施的、穩(wěn)定的,因而可以獲得規(guī)范的效力。
薩格登解決偶然因素對(duì)習(xí)慣的演化使用了一個(gè)發(fā)人深省的概念――突出性。薩格登借用突出性這個(gè)概念想要說明的是像交通博弈的這類博弈,有著兩個(gè)均衡發(fā)展路徑,具體往哪一個(gè)方向發(fā)展則可以通過突出性解決。所以像“靠左或右行使”的交通規(guī)則在經(jīng)過重復(fù)博弈后究竟是靠右行駛的習(xí)慣演化出來還是靠左行使的習(xí)慣演化出來,則依賴某一地區(qū)人民自身當(dāng)中的突出性因素。
這里引入突出性的原因要表達(dá)的意思是試圖對(duì)習(xí)慣進(jìn)行分類,畢竟小費(fèi)習(xí)慣只是眾多的習(xí)慣之一。交通博弈代表的習(xí)慣是一種類型,它要求在博弈的重復(fù)進(jìn)行條件上求解,通過參與人的社會(huì)學(xué)習(xí)來使習(xí)慣自發(fā)演化出來。而小費(fèi)博弈代表的小費(fèi)習(xí)慣是另一種類型,它的困境的解決不僅需要博弈重復(fù)進(jìn)行,還需要參與人通過社會(huì)學(xué)習(xí)發(fā)現(xiàn)和接近這類博弈困境的解決機(jī)制――一報(bào)還一報(bào)(tit-for-tat)的策略組合。這是博弈論專家阿克賽洛德發(fā)現(xiàn)的解決有效率比較囚徒困境的策略機(jī)制。
接下來就討論小費(fèi)博弈的重復(fù)進(jìn)行過程中參與人是否能發(fā)現(xiàn)并內(nèi)化一報(bào)還一報(bào)的策略機(jī)制。不過這要求我們把參與人的策略類型進(jìn)行分類。利用薩格登的策略類型分類,稍微加以變通后,我們假定顧客和服務(wù)員的策略有下面幾個(gè)類型:
第一種是完全理性型[4]。這種類型的參與人,或者是天使或者是魔鬼,小費(fèi)習(xí)慣或者一下子就演化成功或者永遠(yuǎn)不能成功。這是因?yàn)橥耆硇缘娜诵枰闹皇抢硇浴⑿畔⒑瓦壿嫞恍枰魏瘟?xí)慣。 第二種是無知自私型。只要有一方是自私的且只“俯視腳下”,那么另一方就算是天使也可能無濟(jì)于事。只有在天使自覺選擇低效用的策略、無知自私的參與者選擇高效用的策略時(shí)才能避免(0,0)的策略均衡。如果沒有天使,上面的支付矩陣表明,不論是(0,8)還是(8,0)的策略組合都不可能在普通人中演化成穩(wěn)定的習(xí)慣。
第三種是自利型。這樣的人一方面是自私的,但同時(shí)是理智的,也就是說盡管他們可能會(huì)盡可能地利用一切機(jī)會(huì)投機(jī)牟利,不過當(dāng)需要與他人合作甚至需要利他才能更好地滿足自己的需求的時(shí)候,他們也是會(huì)毫不猶豫地去利他,目的只是惟利是圖。
這樣的策略類型對(duì)于習(xí)慣的演化來說,習(xí)慣是否能形成就取決于嚴(yán)格的初始條件和驚人的好運(yùn),也就是說這個(gè)封閉社區(qū)內(nèi)的顧客和服務(wù)人員一開始就選擇了(小費(fèi),微笑)并一直持續(xù)保持,因而不斷自我強(qiáng)化,最后演化成清晰普遍有效力的規(guī)范。
第四種類型是自利包容型。這是對(duì)自利型假定的放寬(普通人性要求的類型),也就是說這種策略類型允許隨機(jī)的偏離,因?yàn)殄e(cuò)誤、試驗(yàn)、變異等有限理性條件下不可避免地會(huì)出現(xiàn)這些問題。那么這種策略類型是否可能使欲求的習(xí)慣形成呢?博弈論專家阿克賽洛德對(duì)重復(fù)囚徒困境的研究表明,一報(bào)還一報(bào)的策略組合是可以被重復(fù)博弈的參與人學(xué)習(xí)后發(fā)現(xiàn)和掌握的,從而在近似無限期的重復(fù)博弈中演化出某一習(xí)慣,不過它在帕累托意義上是次優(yōu)的。
假定獲得愛情的女服務(wù)員因?yàn)閻矍榱α吭诓┺拈_始的幾個(gè)周期比如5期內(nèi)是不求小費(fèi)回報(bào)的,即不管顧客是否給予小費(fèi),她總是在服務(wù)時(shí)向顧客微笑。這樣對(duì)于前5期的博弈來說,顧客的最優(yōu)策略是選擇不給小費(fèi)以使自己的效用最大化。而當(dāng)服務(wù)員的愛情發(fā)燒期退熱后,她發(fā)現(xiàn)自己的微笑并沒有換來應(yīng)有的回報(bào)(小費(fèi))后,她就決定在下一次的博弈中板起臉來讓顧客嘗嘗懲罰的滋味。而在下一次博弈時(shí)顧客看到她的冷臉后覺得更沒有理由支付小費(fèi)了。于是這期博弈的結(jié)果是(無小費(fèi),不微笑)。在緊接下來的再次博弈中,如果雙方記憶只有上一期的結(jié)果并以之為決策的根據(jù)的話,那么從此每期博弈結(jié)果就都是(無小費(fèi),不微笑),習(xí)慣不可能形成。
發(fā)燒期內(nèi)女服務(wù)員總是選擇微笑,顧客如果每一期都選擇給小費(fèi),這樣雙方博弈結(jié)果總是帕累托最優(yōu)。如果一直不偏離的話,那么(小費(fèi),微笑)的美好體驗(yàn)持續(xù)強(qiáng)化一段時(shí)間后就會(huì)使小費(fèi)習(xí)慣比較快速地演化出來。
如果前5期內(nèi)顧客總是選擇不給小費(fèi),情況就比較復(fù)雜了。這需要顧客和服務(wù)員雙方都認(rèn)識(shí)到博弈中存在懲罰和回報(bào)的一報(bào)還一報(bào)的策略機(jī)制才可能形成。我們假定在前5期內(nèi)女服務(wù)員總是選擇微笑,顧客總是選擇不給小費(fèi)。現(xiàn)在假定在第6期女服務(wù)員還是選擇微笑(愛情發(fā)燒和退熱的過渡期不明確),而顧客可以選擇給小費(fèi)或者不給小費(fèi)。如果顧客不給小費(fèi),那么本期博弈結(jié)束后他的效用是8單位而她是0單位。如果接下來連續(xù)幾期他仍然像以前一樣選擇不給小費(fèi),那么愛情已經(jīng)退熱的她就不會(huì)再選擇無償?shù)奈⑿α恕<俣ㄟ@發(fā)生在博弈的第10期,那么本期博弈結(jié)束后雙方的效用都為0。這對(duì)她來說倒沒什么損失,但對(duì)他來說大不一樣,前10期他的每期效用都是8單位,現(xiàn)在從8單位下降到0單位,損失很明顯啊。如果(無小費(fèi),不微笑)的結(jié)果再連續(xù)發(fā)生幾期,損失明顯就更加確定。如果他還有記憶能力的話,他也許就要停下來問問為什么了。通過回憶以前的好日子他可能會(huì)想到每期8單位的效用不是免費(fèi)的午餐,而是她選擇微笑的結(jié)果。那么她現(xiàn)在不微笑了的同時(shí)他的效用明顯下降了,這是否是她對(duì)自己的懲罰呢?
認(rèn)識(shí)到懲罰的他在接下來的博弈中就要看看是否有承擔(dān)責(zé)任的精神了。如果沒有這樣的精神而繼續(xù)選擇不給小費(fèi),因而她也繼續(xù)不微笑的話,那么從此進(jìn)入惡性循環(huán),小費(fèi)習(xí)慣不可能形成。
假定認(rèn)識(shí)到了懲罰的他愿意承擔(dān)責(zé)任或者說雖然沒有承擔(dān)責(zé)任的意識(shí)但他(有限理性的人)在連續(xù)的博弈中無心地犯了錯(cuò)或者試驗(yàn)等而在博弈的第12期選擇了給小費(fèi)。博弈結(jié)果是他的效用為0單位,而她的效用為8單位。這使她立即意識(shí)到從第1期到第10期的所有微笑終于有了回報(bào),而(小費(fèi),不微笑)的策略組合導(dǎo)致的結(jié)果連續(xù)發(fā)生幾次的話,她的回報(bào)意識(shí)就增強(qiáng)了,使她可能認(rèn)識(shí)到博弈中存在回報(bào)。假定這發(fā)生在博弈的第14期。
所以認(rèn)識(shí)到懲罰的她在接下來的博弈中就要看看是否有承擔(dān)責(zé)任的精神了,這和上面對(duì)顧客懲罰――責(zé)任機(jī)制的分析是一樣的。但不一樣的是在她選擇承擔(dān)責(zé)任甘愿接受懲罰的同時(shí),他的每期效用是8單位,因而這使他能夠認(rèn)識(shí)到回報(bào)。
至此顧客和服務(wù)員都認(rèn)識(shí)到了無限重復(fù)的博弈中存在著懲罰和回報(bào)機(jī)制,在繼續(xù)的博弈中社會(huì)學(xué)習(xí)可能使他們認(rèn)識(shí)到懲罰的限度,用后驗(yàn)的觀察修正自己主觀的估計(jì),從而無限接近博弈內(nèi)在邏輯決定的客觀的懲罰限度。當(dāng)主觀懲罰限度客觀化后,一報(bào)還一報(bào)的策略組合就形成了。
當(dāng)這個(gè)策略組合被認(rèn)識(shí)到并在持續(xù)的博弈中被接近和利用后,小費(fèi)習(xí)慣最終就可能演化出來。
本文來源:http://www.nvnqwx.com/shiyongwen/2625833.htm