fbpx
วิกิพีเดีย

สมดุลแบบแนช

สมดุลแบบแนช (อังกฤษ: Nash equilibrium) เป็นแนวคิดในวิชาทฤษฎีเกมที่อธิบายสถานการณ์ที่ผู้เล่นแต่ละคนเลือกทางเลือกที่ดีสุดสำหรับตัวเองเมื่อพิจารณาถึงทางเลือกของผู้เล่นอื่นในจุดสมดุลนั้น ผู้เล่นแต่ละคนจึงไม่สามารถได้ประโยชน์มากขึ้นด้วยการเปลี่ยนทางเลือกของตัวเองแต่เพียงฝ่ายเดียวได้ในจุดสมดุล สมดุลแบบแนชเรียกตามชื่อของจอห์น แนช นักคณิตศาสตร์ซึ่งเป็นผู้นิยามสมดุลในลักษณะนี้

ประวัติ

ชื่อแนวคิดสมดุลแบบแนชมีที่มาจากจอห์น แนช ผู้ที่นิยามแนวคิดสมดุลในรูปแบบที่ใช้กันในปัจจุบันเมื่อปี 1950 แต่การใช้แนวคิดที่มีลักษณะของสมดุลแบบแนชนั้นย้อนไปได้ถึงงานเขียนของอ็องตวน-โอกุสแต็ง กูร์โน ที่ตีพิมพ์ในปี 1838 ในหนังสือ Recherches sur les principes mathématiques de la théorie des richesses (ฝรั่งเศส: งานวิจัยว่าด้วยหลักคณิตศาสตร์ของทรัพยศาสตร์) กูร์โนได้เขียนถึงวิเคราะห์การแข่งขันระหว่างผู้ผลิตสินค้าในตลาดผู้ขายน้อยราย (เรียกภายหลังว่าเป็นแบบจำลองการแข่งขันแบบกูร์โน) ในแบบจำลองนี้ กำไรของผู้ผลิตสินค้าแต่ละราย ไม่เพียงขึ้นอยู่กับปริมาณการผลิตของตัวเอง แต่ขึ้นอยู่กับการผลิตของคู่แข่งด้วย ผลลัพธ์ของแบบจำลองของกูร์โนเป็นจุดสมดุลแบบแนชรูปแบบหนึ่ง แต่กูร์โนไม่ได้ขยายความให้แนวคิดมีนัยทั่วไปกับสถานการณ์อื่นๆ

แนวคิดทฤษฎีเกมในแบบที่ใช้กันในปัจจุบัน มีรากฐานจากงานของจอห์น ฟอน นอยมันน์และอ็อสคาร์ มอร์เกินสแตร์น ในหนังสือ The Theory of Games and Economic Behavior (อังกฤษ: ทฤษฎีว่าด้วยเกมและพฤติกรรมทางเศรษฐกิจ) ซึ่งตีพิมพ์ครั้งแรกในปี 1944 ได้นิยามเกมและแนวคิดกลยุทธ์แบบผสม ซึ่งเป็นหมายถึงการที่ผู้เล่นในเกมเลือกแจกแจงความน่าจะเป็นที่จะใช้ทางเลือกแต่ละทางที่ตนเองมี หนังสือยกตัวอย่างแนวคิดกลยุทธ์แบบผสมในเกมเป่ายิ้งฉุบว่า "สามัญสำนึกจะบอกได้ว่าวิธีที่ดีที่จะเล่นเกมนี้คือการเลือกทางเลือกทั้งสามทางด้วยความน่าจะเป็นแต่ละทางเท่ากับ 1/3" ฟอนนอยมันน์กับมอร์เกินสแตร์นได้เสนอแนวคิดคำตอบของเกมที่มีกลยุทธ์แต่ผสม แต่แนวคิดนี้ใช้ได้เฉพาะกับเกมผลรวมเป็นศูนย์

ในปี 1950 จอห์น แนชได้นิยามกลยุทธ์แบบผสมสำหรับเกมใดๆ ที่ผู้เล่นมีทางเลือกจำกัด และพิสูจน์ว่าสมดุลชนิดนี้มีอยู่ในเกมลักษณะดังกล่าวใดๆ ที่ผู้เล่นสามารถใช้กลยุทธ์แบบผสม บทพิสูจน์ในตอนแรกของแนชใช้ทฤษฎีบทจุดตรึงของคาคูทานิ ถัดมาในปี 1951 แนชได้ตีพิมพ์บทความวิชาการอีกบทความหนึ่งซึ่งใช้ทฤษฎีบทจุดตรึงของเบราเวอร์ในการพิสูจน์แทน

นิยาม

ในทางทฤษฎีเกม การนิยามเกมแบบพื้นฐานประกอบไปด้วยองค์ประกอบสามอย่าง ได้แก่ ผู้เล่น ทางเลือกของผู้เล่นแต่ะละคนในเกม (เรียกในทฤษฎีเกมว่า "กลยุทธ์") และความพึงพอใจของผู้เล่นแต่ละคนที่มีต่อผลลัพธ์แต่ละแบบของเกม ซึ่งมักเขียนในรูปแบบที่เรียกว่าฟังก์ชันอรรถประโยชน์ ค่าของอรรถประโยชน์ของผู้เล่นแต่ละคน ขึ้นอยู่กับกลยุทธ์ของผู้เล่นทุกคนในเกม หากเขียนด้วยสัญลักษณ์ทางคณิตศาสตร์ นิยามพื้นฐานของเกมสามารถกำหนดได้ดังต่อไปนี้

  • เซตของผู้เล่น  
  • เซตของกลยุทธ์   สำหรับผู้เล่น   แต่ละคนในเซตผู้เล่น
  • ค่าอรรถประโยชน์   สำหรับผู้เล่น   แต่ละคนในเซตผู้เล่น ที่อิงจากกลยุทธ์   ที่ผู้เล่นแต่ละคนเลือก

โพรไฟล์กลยุทธ์ (อังกฤษ: strategy profile) หมายถึงเวกเตอร์ที่ระบุกลยุทธ์ของผู้เล่นทุกคน นั่นคือ   และใช้สัญลักษณ์   หมายถึงโพรไฟล์กลยุทธ์ของผู้เล่นทุกคนยกเว้น   ค่าอรรถประโยชน์ของผู้เล่น   จึงสามารถเขียนได้เป็น  และ   ด้วย

จากนิยามเกมข้างต้น โพร์ไฟล์กลยุทธ์   ถือว่าเป็นจุดสมดุลแบบแนช ถ้ากลยุทธ์   ที่ผู้เล่น   เลือก เป็นกลยุทธ์ที่ให้อรรถประโยชน์สูงสุดแก่ผู้เล่น   เมื่อผู้เล่นคนอื่นๆ เลือกเล่นกลยุทธ์ที่ระบุใน   กล่าวอีกทางหนึ่งคือ ผู้เล่นแต่ละคนในเกมไม่สามารถทำให้อรรถประโยชน์ของตัวเองสูงขึ้นด้วยการเลือกกลยุทธ์อื่นที่ไม่ใช่   ตราบใดที่ผู้เล่นคนอื่นทุกคนเลือกกลยุทธ์ของตัวเองตามที่กำหนดในโพรไฟล์กลยุทธ์   เงื่อนไขนี้เขียนด้วยสัญลักษณ์ทางคณิตศาสตร์ได้ว่า  

ทฤษฎีบทของแนชพิจารณาเกมที่สามารถมีกลยุทธ์แบบผสมได้ กลยุทธ์แบบผสม หมายถึงการที่ผู้เล่นแต่ละคนเลือกความน่าจะเป็นที่จะเลือกทางเลือกแต่ละทางให้แก่ทุกสมาชิกในเซตกลยุทธ์ (ความน่าจะเป็นของสมาชิกแต่ละอันอาจจะเป็น 0 หรือ 1 ได้) โดยผลรวมของความน่าจะเป็นของทุกตัวเลือกเท่ากับ 1 ตามนิยามของการแจกแจงความน่าจะเป็น ในกรณีนี้ เซตกลยุทธ์ที่เป็นกลยุทธ์แบบผสม จะกลายเป็นมีลักษณะเป็นซิมเพล็กซ์แทน

การมีอยู่ของสมดุลแบบแนช

แนชพิสูจน์ว่า ถ้าหากเกมมีจำนวนผู้เล่นจำกัด และผู้เล่นแต่ละคนมีเซตกลยุทธ์ที่จำกัด และเราพิจารณากลยุทธ์แบบผสม เกมนั้นจะมีสมดุลแบบแนชในกลยุทธ์แบบผสมอย่างน้อยหนึ่งจุดเสมอ แต่หากเราไม่อนุญาตให้มีการผสมกลยุทธ์แล้ว (นั่นคือ มีเพียงเซตกลยุทธ์ที่เป็นเซตจำกัด) เกมนั้นอาจไม่มีสมดุลแบบแนชก็ได้ ในกรณีนี้ เรียกว่าเกมนั้นไม่มีกลยุทธ์แบบแท้

วิธีพิสูจน์ด้วยทฤษฎีบทจุดตรึงที่แนชใช้นั้น สามารถใช้พิสูจน์ทฤษฎีบทที่มีนัยทั่วไปกว่านั้นได้ กล่าวคือ ถ้าหากว่าเกมนั้นมีเซตกลยุทธ์เป็นเซตย่อยของปริภูมิแบบยุคลิดที่กระชับ คอนเวกซ์ และไม่เป็นเซตว่าง และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละคนเป็นฟังก์ชันต่อเนื่องในเซตโพรไฟล์กลยุทธ์ และกึ่งเว้าต่อกลยุทธ์ของตัวเอง เกมนั้นก็จะมีจุดสมดุลแบบแนชอย่างน้อยหนึ่งจุด เกมที่มีกลยุทธ์แบบผสมถือเป็นกรณีเฉพาะอันหนึ่งของเกมในนัยทั่วไปนี้

อ้างอิง

  1. Kreps, David M. (2018) [1987]. "Nash Equilibrium". ใน Macmillan Publishers (บ.ก.). The New Palgrave Dictionary of Economics (ภาษาอังกฤษ) (3 ed.). Palgrave Macmillan. pp. 9251–9258. doi:10.1057/978-1-349-95121-5_963-1. ISBN 978-1-349-95188-8.
  2. Watson, Joel (2018) [2008]. "Nash, John Forbes (Born 1928)". ใน Macmillan Publishers (บ.ก.). The New Palgrave Dictionary of Economics (ภาษาอังกฤษ) (3 ed.). Palgrave Macmillan. pp. 9276–9283. doi:10.1057/978-1-349-95121-5_1957-1. ISBN 978-1-349-95121-5.
  3. Von Neumann, John; Morgenstern, Oskar (1953). Theory of Games and Economic Behavior (ภาษาอังกฤษ) (3 ed.). Princeton: Princeton University Press. OCLC 10006173.
  4. Nash, John F. (1950). "Equilibrium points in n-person games". Proceedings of the National Academy of Sciences. 36 (1): 48–49. doi:10.1073/pnas.36.1.48. ISSN 0027-8424. PMID 16588946.
  5. Nash, John (1951). "Non-cooperative games". Annals of Mathematics. 54 (2): 286–295. doi:10.2307/1969529. ISSN 0003-486X. JSTOR 1969529.
  6. Fudenberg, Drew; Tirole, Jean (1991). Game Theory (ภาษาอังกฤษ). Cambridge, Massachusetts: MIT Press. ISBN 978-0-262-06141-4.

สมด, ลแบบแนช, งกฤษ, nash, equilibrium, เป, นแนวค, ดในว, ชาทฤษฎ, เกมท, อธ, บายสถานการณ, เล, นแต, ละคนเล, อกทางเล, อกท, ดสำหร, บต, วเองเม, อพ, จารณาถ, งทางเล, อกของผ, เล, นอ, นในจ, ดสมด, ลน, เล, นแต, ละคนจ, งไม, สามารถได, ประโยชน, มากข, นด, วยการเปล, ยนทางเล, อก. smdulaebbaench xngkvs Nash equilibrium epnaenwkhidinwichathvsdiekmthixthibaysthankarnthiphuelnaetlakhneluxkthangeluxkthidisudsahrbtwexngemuxphicarnathungthangeluxkkhxngphuelnxunincudsmdulnn phuelnaetlakhncungimsamarthidpraoychnmakkhundwykarepliynthangeluxkkhxngtwexngaetephiyngfayediywidincudsmdul smdulaebbaencheriyktamchuxkhxngcxhn aench nkkhnitsastrsungepnphuniyamsmdulinlksnani enuxha 1 prawti 2 niyam 3 karmixyukhxngsmdulaebbaench 4 xangxingprawti aekikhchuxaenwkhidsmdulaebbaenchmithimacakcxhn aench phuthiniyamaenwkhidsmdulinrupaebbthiichkninpccubnemuxpi 1950 aetkarichaenwkhidthimilksnakhxngsmdulaebbaenchnnyxnipidthungnganekhiynkhxngxxngtwn oxkusaetng kuron thitiphimphinpi 1838 1 inhnngsux Recherches sur les principes mathematiques de la theorie des richesses frngess nganwicywadwyhlkkhnitsastrkhxngthrphysastr kuronidekhiynthungwiekhraahkaraekhngkhnrahwangphuphlitsinkhaintladphukhaynxyray eriykphayhlngwaepnaebbcalxngkaraekhngkhnaebbkuron inaebbcalxngni kairkhxngphuphlitsinkhaaetlaray imephiyngkhunxyukbprimankarphlitkhxngtwexng aetkhunxyukbkarphlitkhxngkhuaekhngdwy phllphthkhxngaebbcalxngkhxngkuronepncudsmdulaebbaenchrupaebbhnung aetkuronimidkhyaykhwamihaenwkhidminythwipkbsthankarnxun 2 aenwkhidthvsdiekminaebbthiichkninpccubn mirakthancakngankhxngcxhn fxn nxymnnaelaxxskhar mxrekinsaetrn inhnngsux The Theory of Games and Economic Behavior xngkvs thvsdiwadwyekmaelaphvtikrrmthangesrsthkic sungtiphimphkhrngaerkinpi 1944 idniyamekmaelaaenwkhidklyuththaebbphsm sungepnhmaythungkarthiphuelninekmeluxkaeckaecngkhwamnacaepnthicaichthangeluxkaetlathangthitnexngmi hnngsuxyktwxyangaenwkhidklyuththaebbphsminekmepayingchubwa samysanukcabxkidwawithithidithicaelnekmnikhuxkareluxkthangeluxkthngsamthangdwykhwamnacaepnaetlathangethakb 1 3 3 fxnnxymnnkbmxrekinsaetrnidesnxaenwkhidkhatxbkhxngekmthimiklyuththaetphsm aetaenwkhidniichidechphaakbekmphlrwmepnsunyinpi 1950 cxhn aenchidniyamklyuththaebbphsmsahrbekmid thiphuelnmithangeluxkcakd aelaphisucnwasmdulchnidnimixyuinekmlksnadngklawid thiphuelnsamarthichklyuththaebbphsm bthphisucnintxnaerkkhxngaenchichthvsdibthcudtrungkhxngkhakhuthani 4 thdmainpi 1951 aenchidtiphimphbthkhwamwichakarxikbthkhwamhnungsungichthvsdibthcudtrungkhxngebraewxrinkarphisucnaethn 5 niyam aekikhinthangthvsdiekm karniyamekmaebbphunthanprakxbipdwyxngkhprakxbsamxyang idaek phueln thangeluxkkhxngphuelnaetalakhninekm eriykinthvsdiekmwa klyuthth aelakhwamphungphxickhxngphuelnaetlakhnthimitxphllphthaetlaaebbkhxngekm sungmkekhiyninrupaebbthieriykwafngkchnxrrthpraoychn khakhxngxrrthpraoychnkhxngphuelnaetlakhn khunxyukbklyuththkhxngphuelnthukkhninekm hakekhiyndwysylksnthangkhnitsastr niyamphunthankhxngekmsamarthkahndiddngtxipni estkhxngphueln N 1 2 n displaystyle N 1 2 dots n estkhxngklyuthth S i displaystyle S i sahrbphueln i displaystyle i aetlakhninestphueln khaxrrthpraoychn u i s 1 s 2 s n displaystyle u i s 1 s 2 dots s n sahrbphueln i displaystyle i aetlakhninestphueln thixingcakklyuthth s 1 s 2 s n displaystyle s 1 s 2 dots s n thiphuelnaetlakhneluxkophriflklyuthth xngkvs strategy profile hmaythungewketxrthirabuklyuththkhxngphuelnthukkhn nnkhux s s 1 s 2 s n displaystyle s s 1 s 2 dots s n aelaichsylksn s i displaystyle s i hmaythungophriflklyuththkhxngphuelnthukkhnykewn i displaystyle i khaxrrthpraoychnkhxngphueln i displaystyle i cungsamarthekhiynidepnu i s displaystyle u i s aela u i s i s i displaystyle u i s i s i dwycakniyamekmkhangtn ophriflklyuthth s s 1 s 2 s n displaystyle s s 1 s 2 dots s n thuxwaepncudsmdulaebbaench thaklyuthth s i displaystyle s i thiphueln i displaystyle i eluxk epnklyuthththiihxrrthpraoychnsungsudaekphueln i displaystyle i emuxphuelnkhnxun eluxkelnklyuthththirabuin s displaystyle s klawxikthanghnungkhux phuelnaetlakhninekmimsamarththaihxrrthpraoychnkhxngtwexngsungkhundwykareluxkklyuththxunthiimich s i displaystyle s i trabidthiphuelnkhnxunthukkhneluxkklyuththkhxngtwexngtamthikahndinophriflklyuthth s displaystyle s enguxnikhniekhiyndwysylksnthangkhnitsastridwa i N s i S i u i s u i s i s i displaystyle forall i in N forall s i in S i u i s geq u i s i s i 6 thvsdibthkhxngaenchphicarnaekmthisamarthmiklyuththaebbphsmid klyuththaebbphsm hmaythungkarthiphuelnaetlakhneluxkkhwamnacaepnthicaeluxkthangeluxkaetlathangihaekthuksmachikinestklyuthth khwamnacaepnkhxngsmachikaetlaxnxaccaepn 0 hrux 1 id odyphlrwmkhxngkhwamnacaepnkhxngthuktweluxkethakb 1 tamniyamkhxngkaraeckaecngkhwamnacaepn inkrnini estklyuthththiepnklyuththaebbphsm caklayepnmilksnaepnsimephlksaethn 6 karmixyukhxngsmdulaebbaench aekikhaenchphisucnwa thahakekmmicanwnphuelncakd aelaphuelnaetlakhnmiestklyuthththicakd aelaeraphicarnaklyuththaebbphsm ekmnncamismdulaebbaenchinklyuththaebbphsmxyangnxyhnungcudesmx 4 aethakeraimxnuyatihmikarphsmklyuththaelw nnkhux miephiyngestklyuthththiepnestcakd ekmnnxacimmismdulaebbaenchkid inkrnini eriykwaekmnnimmiklyuththaebbaethwithiphisucndwythvsdibthcudtrungthiaenchichnn samarthichphisucnthvsdibththiminythwipkwannid klawkhux thahakwaekmnnmiestklyuththepnestyxykhxngpriphumiaebbyukhlidthikrachb khxnewks aelaimepnestwang aelafngkchnxrrthpraoychnkhxngphuelnaetlakhnepnfngkchntxenuxnginestophriflklyuthth aelakungewatxklyuththkhxngtwexng ekmnnkcamicudsmdulaebbaenchxyangnxyhnungcud 6 ekmthimiklyuththaebbphsmthuxepnkrniechphaaxnhnungkhxngekminnythwipnixangxing aekikh Kreps David M 2018 1987 Nash Equilibrium in Macmillan Publishers b k The New Palgrave Dictionary of Economics phasaxngkvs 3 ed Palgrave Macmillan pp 9251 9258 doi 10 1057 978 1 349 95121 5 963 1 ISBN 978 1 349 95188 8 Watson Joel 2018 2008 Nash John Forbes Born 1928 in Macmillan Publishers b k The New Palgrave Dictionary of Economics phasaxngkvs 3 ed Palgrave Macmillan pp 9276 9283 doi 10 1057 978 1 349 95121 5 1957 1 ISBN 978 1 349 95121 5 Von Neumann John Morgenstern Oskar 1953 Theory of Games and Economic Behavior phasaxngkvs 3 ed Princeton Princeton University Press OCLC 10006173 4 0 4 1 Nash John F 1950 Equilibrium points in n person games Proceedings of the National Academy of Sciences 36 1 48 49 doi 10 1073 pnas 36 1 48 ISSN 0027 8424 PMID 16588946 Nash John 1951 Non cooperative games Annals of Mathematics 54 2 286 295 doi 10 2307 1969529 ISSN 0003 486X JSTOR 1969529 6 0 6 1 6 2 Fudenberg Drew Tirole Jean 1991 Game Theory phasaxngkvs Cambridge Massachusetts MIT Press ISBN 978 0 262 06141 4 ekhathungcak https th wikipedia org w index php title smdulaebbaench amp oldid 8570159, wikipedia, วิกิ หนังสือ, หนังสือ, ห้องสมุด,

บทความ

, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม