ความลำบากใจของนักโทษ (อังกฤษ: prisoner's dilemma) เป็นปัญหาพื้นฐานในทฤษฎีเกมซึ่งแสดงให้เห็นว่าเหตุใดคนสองคนจึงอาจไม่ร่วมมือกันแม้ว่าทั้งสองจะได้รับผลประโยชน์มากที่สุดในการร่วมมือกันนั้น เดิมปัญหาดังกล่าวคิดขึ้นโดยเมอร์ริลล์ ฟลัด และเมลวิน เดรชเชอร์ ซึ่งกำลังทำงานอยู่ที่ RAND ในปี ค.ศ. 1950 อัลเบิร์ต ดับเบิลยู. ทักเกอร์ทำให้เกมดังกล่าวเป็นระเบียบแบบแผนด้วยการกำหนดโทษจำคุกและให้ชื่อว่า "ความลำบากใจของนักโทษ"
ตัวอย่างคลาสสิกของความลำบากใจของนักโทษมีดังนี้
ผู้ต้องสงสัยสองคนถูกตำรวจจับกุม ตำรวจมีหลักฐานไม่เพียงพอที่จะพิสูจน์ว่ามีความผิด ตำรวจแยกผู้ต้องสงสัยทั้งคู่ออกจากกัน และเสนอข้อเสนอเดียวกันแก่ผู้ต้องสงสัยทั้งคู่ หากคนหนึ่งให้การเป็นพยานต่ออีกคนหนึ่ง (แปรพักตร์) และอีกคนหนึ่งยังคงไม่ให้การ (ร่วมมือ) ผู้แปรพักตร์จะถูกปล่อยตัวไปแต่ผู้สมคบคิดที่ไม่ให้การจะได้รับโทษจำคุกเต็มหนึ่งปี หากทั้งคู่ไม่ให้การ นักโทษทั้งสองจะถูกตัดสินจำคุกเพียงหนึ่งเดือนด้วยข้อหาเล็กน้อย หากทั้งสองให้การ แต่ละคนจะได้รับโทษสามเดือน นักโทษแต่ละคนต้องเลือกที่จะทรยศอีกฝ่ายหนึ่งหรือปฏิเสธที่จะให้การ แต่ละคนต่างก็รู้ว่าอีกฝ่ายหนึ่งไม่อาจรู้ได้ถึงการทรยศก่อนการสืบสวนจะสิ้นสุด นักโทษควรทำอย่างไร
หากผู้เล่นแต่ละคนต่างสนใจลดเวลาในการถูกจำคุกลงให้เหลือน้อยที่สุด เช่นนั้นแล้วความลำบากใจของนักโทษก็จะเป็นเกมที่มีผลรวมไม่เป็นศูนย์ซึ่งผู้เล่นทั้งสองอาจร่วมมือกันหรือแปรพักตร์จากผู้เล่นอีกคนหนึ่ง ในเกมนี้ เช่นเดียวกับทฤษฎีเกมส่วนมาก ผู้เล่นแต่ละคน (นักโทษ) ต่างก็ต้องการให้ตนเองได้รับผลประโยชน์มากที่สุด โดยไม่คำนึงถึงผลประโยชน์ของผู้เล่นอีกคนหนึ่ง สมดุลเฉพาะของเกมนี้คือ สภาวะเลวกว่าอุตมภาพแบบพาเรโต (Pareto-suboptimal solution) นั่นคือ ทางเลือกนำให้ผู้เล่นทั้งสองเลือกที่จะแปรพักตร์ทั้งคู่ ถึงแม้ว่าผู้เล่นแต่ละคนจะได้รับผลประโยชน์มากกว่าหากทั้งสองรวมมือกัน
ในรูปแบบคลาสสิกของเกมนี้ การแปรพักตร์เป็นกลยุทธ์เด่นเหนือกว่าการร่วมมือกัน ดังนั้นสมดุลที่เป็นไปได้ของเกมนี้คือผู้เล่นทุกคนเลือกจะแปรพักตร์ ไม่ว่าผู้เล่นอีกฝ่ายจะเลือกอะไร แต่ผู้เล่นจะได้รับผลประโยชน์สูงสุดโดยการเลือกแปรพักตร์ เพราะว่าในสถานการณ์ใด ๆ การเลือกแปรพักตร์ได้ประโยชน์มากกว่าจะร่วมมือกัน ผู้เล่นทุกคนจึงเลือกแปรพักตร์ และผลที่ได้ก็จะออกมาเท่ากัน
กลยุทธ์สำหรับความลำบากใจของนักโทษคลาสสิก ความลำบากใจของนักโทษแบบคลาสสิกสามารถสรุปได้ดังนี้
| นักโทษ ข ปฏิเสธจะให้การ (ร่วมมือ) | นักโทษ ข สารภาพ (แปรพักตร์) |
---|
นักโทษ ก ปฏิเสธจะให้การ (ร่วมมือ) | ทั้งสองรับโทษ 1 เดือน | นักโทษ ก: 1 ปี นักโทษ ข: ปล่อยตัวเป็นอิสระ |
---|
นักโทษ ก สารภาพ (แปรพักตร์) | นักโทษ ก: ปล่อยตัวเป็นอิสระ นักโทษ ข: 1 ปี | ทั้งสองรับโทษ 3 เดือน |
---|
ลองจินตนาการดูว่าคุณเป็นผู้เล่น ก หากผู้เล่น ข ตัดสินใจปฏิเสธจะให้การเกี่ยวกับอาชญากรรม คุณก็จะได้ผลประโยชน์มากกว่าหากคุณสารภาพ เพราะคุณจะถูกปล่อยตัวเป็นอิสระ เช่นเดียวกัน หากผู้เล่น ข สารภาพ คุณก็จะได้รับผลประโยชน์มากกว่าถ้าคุณสารภาพ เพราะคุณจะได้รับโทษเพียง 3 เดือน แทนที่จะเป็น 1 ปี จากมุมมองนี้ ไม่ว่าผู้เล่น ข จะเลือกอะไร ผู้เล่น ก ก็จะได้รับผลประโยชน์มากกว่าถ้าสารภาพ มีผู้กล่าวว่าการสารภาพ (แปรพักตร์) เป็นกลยุทธ์เด่นของเกมนี้
หากคุณเป็นนักโทษ ก คุณสามารถกล่าวได้ว่า "ไม่ว่านักโทษ ข จะเลือกอย่างไร ผม/ดิฉันก็จะได้เปรียบถ้าจะสารภาพกว่าเลือกที่จะไม่ให้การ ดังนั้น เพื่อเห็นแก่ตัวผม/ดิฉันเอง ผม/ดิฉันควรจะสารภาพ" อย่างไรก็ตาม หากผู้เล่นอีกคนหนึ่งทำแบบเดียวกัน คือ ทั้งสองคนเลือกจะสารภาพ แล้วทั้งสองก็จะได้รับโทษมากกว่าที่คุณและอีกฝ่ายหนึ่งจะได้รับหากเลือกที่จะไม่ให้การทั้งคู่ นั่นคือ การตัดสินใจที่ดูเหมือนว่าจะให้ประโยชน์แก่ตนเองมากที่สุดกลับไม่ได้ให้ผลประโยชน์ที่ดีที่สุด ดังนั้นจึงกลายเป็นที่มาของความลำบากใจ ในทฤษฎีเกมนี้เป็นตัวอย่างเกมที่มีผลรวมไม่เป็นศูนย์ว่า สมดุลของแนชไม่จำเป็นจะต้องเป็นอุตมภาพของพาเรโต
แต่แม้ว่าพวกเขาไม่ได้รับอนุญาตให้สื่อสารระหว่างกัน หากนักโทษต่างก็เชื่อมั่นในตัวอีกฝ่าย ทั้งสองก็สามารถเลือกที่จะไม่ให้การได้ ซึ่งจะลดโทษแก่พวกเขาทั้งสอง
รูปแบบทั่วไป รูปแบบทั่วไปของเกมได้ถูกใช้บ่อยครั้งในเศรษฐศาสตร์ทดลอง ตัวอย่างเกมเป็นดังนี้
มีผู้เล่นสองคนกับนายธนาคาร ผู้เล่นแต่ละคนมีไพ่คนละสองใบ ใบหนึ่งมีคำว่า "ร่วมมือ" ส่วนอีกใบหนึ่งมีคำว่า "แปรพักตร์" ผู้เล่นแต่ละคนหมอบไพ่หนึ่งใบไว้ตรงหน้านายธนาคาร ผู้เล่นแต่ละฝ่ายไม่มีโอกาสรู้ล่วงหน้าเลยว่าอีกฝ่ายหนึ่งหมอบไพ่อะไร (อันที่จริงเปิดไพ่ก็ไม่ได้มีผลกระทบต่อการวิเคราะห์กลยุทธ์เด่นแต่อย่างใด) ในตอนท้ายของรอบ นายธนาคารหงายหน้าไพ่ทั้งคู่และจ่ายค่าตอบแทนตามนั้น
กำหนดให้มีผู้เล่นสองคน "แดง" และ "น้ำเงิน" หากผู้เล่นแดงแปรพักตร์และผู้เล่นน้ำเงินร่วมมือ ผู้เล่นแดงจะได้รับผลประโยชน์จากการแปรพักตร์นั้น 5 แต้ม ขณะที่ผู้เล่นน้ำเงินได้รับผลประโยชน์ 0 แต้ม หากผู้เล่นทั้งสองร่วมมือกันจะได้รับรางวัลแห่งความร่วมมือคนละ 3 แต้ม หากผู้เล่นทั้งสองแปรพักตร์ ทั้งสองจะได้รับผลประโยชน์เพียงคนละ 1 แต้ม ตารางผลลัพธ์เป็นดังนี้
ตัวอย่างตารางผลได้ | ร่วมมือ | แปรพักตร์ |
---|
ร่วมมือ | 3, 3 | 0, 5 |
---|
แปรพักตร์ | 5, 0 | 1, 1 |
---|
หากจำกัดความด้วยคำว่า "แพ้" หรือ "ชนะ" ตารางจะดูเหมือนแบบนี้
| ร่วมมือ | แปรพักตร์ |
---|
ร่วมมือ | ชนะ-ชนะ | แพ้มากกว่า-ชนะมากกว่า |
---|
แปรพักตร์ | ชนะมากกว่า-แพ้มากกว่า | แพ้-แพ้ |
---|
ความลำบากใจของน, กโทษ, บทความน, ไม, การอ, างอ, งจากแหล, งท, มาใดกร, ณาช, วยปร, บปร, งบทความน, โดยเพ, มการอ, างอ, งแหล, งท, มาท, าเช, อถ, เน, อความท, ไม, แหล, งท, มาอาจถ, กค, ดค, านหร, อลบออก, เร, ยนร, าจะนำสารแม, แบบน, ออกได, อย, างไรและเม, อไร, งกฤษ, prisoner. bthkhwamniimmikarxangxingcakaehlngthimaidkrunachwyprbprungbthkhwamni odyephimkarxangxingaehlngthimathinaechuxthux enuxkhwamthiimmiaehlngthimaxacthukkhdkhanhruxlbxxk eriynruwacanasaraemaebbnixxkidxyangiraelaemuxir khwamlabakickhxngnkoths xngkvs prisoner s dilemma epnpyhaphunthaninthvsdiekmsungaesdngihehnwaehtuidkhnsxngkhncungxacimrwmmuxknaemwathngsxngcaidrbphlpraoychnmakthisudinkarrwmmuxknnn edimpyhadngklawkhidkhunodyemxrrill fld aelaemlwin edrchechxr sungkalngthanganxyuthi RAND inpi kh s 1950 xlebirt dbebilyu thkekxrthaihekmdngklawepnraebiybaebbaephndwykarkahndothscakhukaelaihchuxwa khwamlabakickhxngnkoths twxyangkhlassikkhxngkhwamlabakickhxngnkothsmidngni phutxngsngsysxngkhnthuktarwccbkum tarwcmihlkthanimephiyngphxthicaphisucnwamikhwamphid tarwcaeykphutxngsngsythngkhuxxkcakkn aelaesnxkhxesnxediywknaekphutxngsngsythngkhu hakkhnhnungihkarepnphyantxxikkhnhnung aeprphktr aelaxikkhnhnungyngkhngimihkar rwmmux phuaeprphktrcathukplxytwipaetphusmkhbkhidthiimihkarcaidrbothscakhuketmhnungpi hakthngkhuimihkar nkothsthngsxngcathuktdsincakhukephiynghnungeduxndwykhxhaelknxy hakthngsxngihkar aetlakhncaidrbothssameduxn nkothsaetlakhntxngeluxkthicathrysxikfayhnunghruxptiesththicaihkar aetlakhntangkruwaxikfayhnungimxacruidthungkarthryskxnkarsubswncasinsud nkothskhwrthaxyangir hakphuelnaetlakhntangsnicldewlainkarthukcakhuklngihehluxnxythisud echnnnaelwkhwamlabakickhxngnkothskcaepnekmthimiphlrwmimepnsunysungphuelnthngsxngxacrwmmuxknhruxaeprphktrcakphuelnxikkhnhnung inekmni echnediywkbthvsdiekmswnmak phuelnaetlakhn nkoths tangktxngkarihtnexngidrbphlpraoychnmakthisud odyimkhanungthungphlpraoychnkhxngphuelnxikkhnhnung smdulechphaakhxngekmnikhux sphawaelwkwaxutmphaphaebbphaerot Pareto suboptimal solution nnkhux thangeluxknaihphuelnthngsxngeluxkthicaaeprphktrthngkhu thungaemwaphuelnaetlakhncaidrbphlpraoychnmakkwahakthngsxngrwmmuxkninrupaebbkhlassikkhxngekmni karaeprphktrepnklyuththednehnuxkwakarrwmmuxkn dngnnsmdulthiepnipidkhxngekmnikhuxphuelnthukkhneluxkcaaeprphktr imwaphuelnxikfaycaeluxkxair aetphuelncaidrbphlpraoychnsungsudodykareluxkaeprphktr ephraawainsthankarnid kareluxkaeprphktridpraoychnmakkwacarwmmuxkn phuelnthukkhncungeluxkaeprphktr aelaphlthiidkcaxxkmaethaknklyuththsahrbkhwamlabakickhxngnkothskhlassik aekikhkhwamlabakickhxngnkothsaebbkhlassiksamarthsrupiddngni nkoths kh ptiesthcaihkar rwmmux nkoths kh sarphaph aeprphktr nkoths k ptiesthcaihkar rwmmux thngsxngrboths 1 eduxn nkoths k 1 pinkoths kh plxytwepnxisrankoths k sarphaph aeprphktr nkoths k plxytwepnxisrankoths kh 1 pi thngsxngrboths 3 eduxnlxngcintnakarduwakhunepnphueln k hakphueln kh tdsinicptiesthcaihkarekiywkbxachyakrrm khunkcaidphlpraoychnmakkwahakkhunsarphaph ephraakhuncathukplxytwepnxisra echnediywkn hakphueln kh sarphaph khunkcaidrbphlpraoychnmakkwathakhunsarphaph ephraakhuncaidrbothsephiyng 3 eduxn aethnthicaepn 1 pi cakmummxngni imwaphueln kh caeluxkxair phueln k kcaidrbphlpraoychnmakkwathasarphaph miphuklawwakarsarphaph aeprphktr epnklyuththednkhxngekmnihakkhunepnnkoths k khunsamarthklawidwa imwankoths kh caeluxkxyangir phm dichnkcaidepriybthacasarphaphkwaeluxkthicaimihkar dngnn ephuxehnaektwphm dichnexng phm dichnkhwrcasarphaph xyangirktam hakphuelnxikkhnhnungthaaebbediywkn khux thngsxngkhneluxkcasarphaph aelwthngsxngkcaidrbothsmakkwathikhunaelaxikfayhnungcaidrbhakeluxkthicaimihkarthngkhu nnkhux kartdsinicthiduehmuxnwacaihpraoychnaektnexngmakthisudklbimidihphlpraoychnthidithisud dngnncungklayepnthimakhxngkhwamlabakic inthvsdiekmniepntwxyangekmthimiphlrwmimepnsunywa smdulkhxngaenchimcaepncatxngepnxutmphaphkhxngphaerotaetaemwaphwkekhaimidrbxnuyatihsuxsarrahwangkn haknkothstangkechuxmnintwxikfay thngsxngksamartheluxkthicaimihkarid sungcaldothsaekphwkekhathngsxngrupaebbthwip aekikhrupaebbthwipkhxngekmidthukichbxykhrnginesrsthsastrthdlxng twxyangekmepndngni miphuelnsxngkhnkbnaythnakhar phuelnaetlakhnmiiphkhnlasxngib ibhnungmikhawa rwmmux swnxikibhnungmikhawa aeprphktr phuelnaetlakhnhmxbiphhnungibiwtrnghnanaythnakhar phuelnaetlafayimmioxkasrulwnghnaelywaxikfayhnunghmxbiphxair xnthicringepidiphkimidmiphlkrathbtxkarwiekhraahklyuththednaetxyangid intxnthaykhxngrxb naythnakharhngayhnaiphthngkhuaelacaykhatxbaethntamnn kahndihmiphuelnsxngkhn aedng aela naengin hakphuelnaedngaeprphktraelaphuelnnaenginrwmmux phuelnaedngcaidrbphlpraoychncakkaraeprphktrnn 5 aetm khnathiphuelnnaenginidrbphlpraoychn 0 aetm hakphuelnthngsxngrwmmuxkncaidrbrangwlaehngkhwamrwmmuxkhnla 3 aetm hakphuelnthngsxngaeprphktr thngsxngcaidrbphlpraoychnephiyngkhnla 1 aetm tarangphllphthepndngni twxyangtarangphlid rwmmux aeprphktrrwmmux 3 3 0 5aeprphktr 5 0 1 1hakcakdkhwamdwykhawa aeph hrux chna tarangcaduehmuxnaebbni rwmmux aeprphktrrwmmux chna chna aephmakkwa chnamakkwaaeprphktr chnamakkwa aephmakkwa aeph aeph ekhathungcak https th wikipedia org w index php title khwamlabakickhxngnkoths amp oldid 5821175, wikipedia, วิกิ หนังสือ, หนังสือ, ห้องสมุด,
บทความ
, อ่าน, ดาวน์โหลด, ฟรี, ดาวน์โหลดฟรี, mp3, วิดีโอ, mp4, 3gp, jpg, jpeg, gif, png, รูปภาพ, เพลง, เพลง, หนัง, หนังสือ, เกม, เกม