This site is not complete. The work to converting the volumes of സര്‍വ്വവിജ്ഞാനകോശം is on progress. Please bear with us
Please contact webmastersiep@yahoo.com for any queries regarding this website.

Reading Problems? see Enabling Malayalam

ഗെയിം സിദ്ധാന്തം

സര്‍വ്വവിജ്ഞാനകോശം സംരംഭത്തില്‍ നിന്ന്

17:37, 17 ജനുവരി 2016-നു ഉണ്ടായിരുന്ന രൂപം സൃഷ്ടിച്ചത്:- Technoworld (സംവാദം | സംഭാവനകള്‍)

ഗെയിം സിദ്ധാന്തം

Game Theory

ഗണിതശാസ്ത്രതത്ത്വങ്ങള്‍ മത്സരരംഗത്ത് ഉപയോഗിക്കുന്നതിനു വേണ്ടി ആവിഷ്കൃതമായ സിദ്ധാന്തം. ഒരു മത്സരത്തിന്റെ അവസാനഫലം അതില്‍ പങ്കെടുക്കുന്ന ഓരോരുത്തരുടെയും നീക്കങ്ങളെ ആശ്രയിച്ചിരിക്കുമെങ്കില്‍ അതിനെ ഒരു ഗെയിമായിക്കരുതാം. ഇത്തരം മത്സരരംഗങ്ങള്‍ സാമ്പത്തികമോ കളികളുമായി ബന്ധപ്പെട്ടതോ രാഷ്ട്രീയമോ യുദ്ധസംബന്ധമോ ആവാം.

ഗെയിം സിദ്ധാന്തത്തിന്റെ ഉപജ്ഞാതാവ് ജോണ്‍ ഫൊണ്‍ ന്യൂമാന്‍ ആണ്. ഇതിന്റെ രൂപരേഖ ആദ്യമായി വെളിച്ചം കണ്ടത് 1928-ല്‍ നോട്ടിങ്ഗാമിലെ ഗണിതശാസ്ത്രസമിതിയോഗത്തില്‍ ഇദ്ദേഹം അവതരിപ്പിച്ച ഒരു പ്രബന്ധത്തിലാണ്. 1944-ല്‍ ജോണ്‍ ഫൊണ്‍ ന്യൂമാനും ഓസ്കാര്‍ മോര്‍ഗെന്‍സ്റ്റയ്നും ചേര്‍ന്നവതരിപ്പിച്ച പ്രസിദ്ധമായ തിയറി ഒഫ് ഗെയിംസ് ആന്‍ഡ് ഇക്കണോമിക്സ് ബിഹേവിയര്‍ എന്ന പ്രസിദ്ധീകരണത്തെത്തുടര്‍ന്നാണ് ഇതിന്റെ വിപ്ലവകരമായ വളര്‍ച്ച. വലിയ നഷ്ടങ്ങളില്‍ ചെറുതു തിരഞ്ഞെടുക്കുക (minimax principle) എന്ന അടിസ്ഥാന ആശയമാണ് ന്യൂമാന്‍ ഉപയോഗപ്പെടുത്തിയത്. ഗെയിമുകളുടെ അമൂര്‍ത്തമായ മാതൃകാരൂപങ്ങളിലാണ് ഈ സിദ്ധാന്തം കരുപ്പിടിപ്പിച്ചിരിക്കുന്നത്. ആദ്യകാലങ്ങളില്‍ ചതുരംഗം, പോക്കര്‍, ബ്രിഡ്ജ്, പകിടകളി തുടങ്ങിയവ അപഗ്രഥിക്കാനാണിതുപയോഗിച്ചത്. ഇപ്പോള്‍ ധനതത്ത്വശാസ്ത്രം, രാഷ്ട്രമീമാംസ, സാമൂഹിക ശാസ്ത്രം, മാനേജ്മെന്റ് വിജ്ഞാനീയം, ലീനിയര്‍ പ്രോഗ്രാമിങ്, ഓപ്പറേഷന്‍സ് റിസര്‍ച്ച് തുടങ്ങിയ ഒട്ടേറെ മേഖലകളിലും, മിക്കവാറും എല്ലാ ശാസ്ത്രശാഖകളിലും ഗെയിം സിദ്ധാന്തം ഉപയോഗിച്ചുവരുന്നു. ഒരു ഗെയിം ജയിക്കാനുള്ള പ്രാവീണ്യം, കരുനീക്കങ്ങള്‍ എന്നിവ ഇതില്‍ പ്രതിപാദിക്കുന്നില്ല. മറിച്ച് ഒരു ഗെയിം തുടര്‍ച്ചയായി കളിച്ചാല്‍ അവയുടെ ഭാവവും പ്രവര്‍ത്തനക്രമവും ഫലവും എങ്ങനെയായിരിക്കണമെന്നുള്ള പഠനമാണിത്. ബീജഗണിതം, മെഷര്‍ തിയറി തുടങ്ങിയ ഗണിതശാസ്ത്ര ശാഖകളിലെ ആശയങ്ങള്‍ ഇതില്‍ ഉള്‍ക്കൊണ്ടിട്ടുണ്ട്.

ഗെയിം സിദ്ധാന്തമനുസരിച്ച് ഒരു മത്സരരംഗം ഗെയിം ആകണമെങ്കില്‍ അവ ഇനിപ്പറയുന്ന വ്യവസ്ഥകള്‍ക്ക് വിധേയമായിരിക്കണം. 1. പങ്കെടുക്കുന്നവരുടെ എണ്ണം പരിമിതമായിരിക്കണം. 2. ഓരോ കളിക്കാരനും പരിമിതമായ നീക്കങ്ങളുടെ ഒരു പട്ടിക ലഭ്യമായിരിക്കണം. രണ്ടു കളിക്കാരുടെ പട്ടിക ഒരുപോലെ ആയിരിക്കണമെന്നില്ല. 3. പട്ടികയിലെ നീക്കങ്ങളില്‍നിന്ന് ഓരോ നീക്കം കളിക്കാര്‍ ഉപയോഗിക്കുന്നു. എതിരാളിയുടെ നീക്കം എന്തായിരിക്കുമെന്ന് മുന്‍കൂട്ടി അറിയാന്‍ മാര്‍ഗമുണ്ടായിരിക്കില്ല. 4. ഓരോ നീക്കത്തിനും ഒരു പ്രതിഫലവിഹിതം കളിക്കാര്‍ക്കു ലഭിക്കും. പ്രതിഫലം നഷ്ടമാണെങ്കില്‍ ഋണസംഖ്യ (negative number) കളായി കാണിക്കും.

എത്ര ആളുകള്‍ വേണമെങ്കിലും ഒരു ഗെയിമില്‍ പങ്കെടുക്കാം. രണ്ടു പേരുള്ള ഗെയിമാണ് കൂടുതല്‍ ഗവേഷണവിധേയമായിട്ടുള്ളത്. കൂടുതല്‍ ആളുകളുണ്ടെങ്കില്‍ കൂട്ടം പിരിച്ച് രണ്ടുപേരുള്ള ഗെയിമാക്കിമാറ്റാന്‍ മിക്കപ്പോഴും സാധിക്കും.

രണ്ടുപേരുള്ള ഗെയിമില്‍ ഒരാള്‍ക്കു ലഭിക്കുന്ന പ്രതിഫലത്തുകകള്‍ ഒരു 'മാട്രിക്സ്' രൂപത്തില്‍ എഴുതാന്‍ കഴിയും. പ്രതിഫലമാട്രിക്സ് തന്നിട്ടുണ്ടെങ്കില്‍ ഗെയിമിന്റെ പൂര്‍ണരൂപംതന്നെ മനസ്സിലാക്കാന്‍ കഴിയും. ഒരാള്‍ക്കു കിട്ടുന്ന പ്രതിഫലം മറ്റേയാളുടെ നഷ്ടമാകുമ്പോള്‍ ആ ഗെയിമിനെ 'പൂജ്യം-തുക-ഗെയിം' (zero-sum-game) എന്നു പറയുന്നു. ഉദാ. 1. രണ്ടുപേര്‍ നാണയമെറിഞ്ഞു കളിക്കുന്നു എന്നിരിക്കട്ടെ. ഒരുപോലെ തലവശം വീണാല്‍ രണ്ടാമതു കളിക്കുന്ന ആളിന് എട്ട് രൂപയും ഒരുപോലെ മറുവശം വീണാല്‍ അഞ്ച് രൂപയും പ്രതിഫലം കിട്ടും. അല്ലാത്തപക്ഷം മൂന്ന് രൂപ ഒന്നാമതു കളിക്കുന്ന ആളിന് കൊടുക്കണം. പ്രതിഫല മാട്രിക്സ് താഴെക്കൊടുത്തിരിക്കുന്നു.

ചിത്രം:Pg 258 Vol 10 sc1.png

ഇത് ഒരു 2 x 2 പൂജ്യം-തുക-ഗെയിമാണ്. കോളങ്ങള്‍ B യുടെ നീക്കങ്ങളും നിരകള്‍ A യുടെ നീക്കങ്ങളും കാണിക്കുന്നു. A യ്ക്കു കിട്ടുന്ന തുകകളാണ് മാട്രിക്സില്‍ ഉള്ളത്; നെഗറ്റീവ് സംഖ്യകള്‍ B യ്ക്കു കൊടുക്കേണ്ടതും. A യ്ക്കു എട്ട് രൂപ കിട്ടുമ്പോള്‍ B യ്ക്കു എട്ട് രൂപ നഷ്ടം വരുമെന്നുള്ളതുകൊണ്ടാണ് ഇത് പൂജ്യം-തുക-ഗെയിമാകുന്നത്. ഇത്തരം ഗെയിമുകളില്‍ B യുടെ മാട്രിക്സ് കിട്ടാന്‍ A യുടെ മാട്രിക്സിലെ സംഖ്യകളുടെ ഋണസംഖ്യകളെഴുതിയാല്‍ മതിയാവും. ഇത്തരം ഗെയിമുകളില്‍ കളിക്കാര്‍ക്കെല്ലാം കൂടിയുള്ള ആകെ ധനത്തില്‍ മാറ്റമൊന്നും വരുന്നില്ല. ഒരു പുതിയ വിനിമയം നടക്കുന്നു എന്നു മാത്രം.

പട്ടികയിലെ നീക്കങ്ങളെ അങ്ങനെതന്നെ ഉപയോഗിക്കുമ്പോള്‍ അവയെ ശുദ്ധതന്ത്രങ്ങള്‍ എന്നു പറയാം. ചെസ്സ് (ചതുരംഗം) ശുദ്ധതന്ത്രങ്ങള്‍ മാത്രമുപയോഗിക്കുന്ന ഒരു ഗെയിമാണ്. നാണയത്തിന്റെ തലവശവും മറുവശവും രണ്ടു ശുദ്ധതന്ത്രങ്ങളാണ്.

അനുകൂല സന്ദര്‍ഭം നിശ്ചയിച്ച് നീക്കം ഉപയോഗിക്കുമ്പോള്‍ അതിനെ മിശ്രതന്ത്രമെന്നു പറയാം. A ക്ക് A1, A2 എന്ന രണ്ടു ശുദ്ധതന്ത്രങ്ങളുണ്ട്; ഒരു നാണയം എറിഞ്ഞ് തലവശം വീണാല്‍ A1 ഉപയോഗിക്കുമെന്നും മറുവശം വീണാല്‍ A2 ഉപയോഗിക്കുമെന്നും വച്ചാല്‍ അതു മിശ്രതന്ത്രമായി. മിശ്രതന്ത്രമാകുമ്പോള്‍ അതിനോടു ചേര്‍ന്ന് സംഭാവ്യതകള്‍ കൂടി കാണും. തുക ഒന്ന് (1) ആയിവരുന്ന 'm' ധനവാസ്തവിക സംഖ്യ (positive real number) കളുടെ ഒരു ഗണമാണ് മിശ്രതന്ത്രം.

1 + x + ... + xm= 1 ... (1)

xi ≥0, i = 1,2, ...m

ആയാല്‍ (x1,x2, ...xm) എന്ന ഗണം ഒരു മിശ്രതന്ത്രം ആകും. 'm' എന്ന സംഖ്യ കളിക്കാരന്റെ ശുദ്ധതന്ത്രങ്ങളുടെ എണ്ണമാണ്.

xr=1 ... (2)

xi=0, j ≠ r എന്നത്

r ശുദ്ധതന്ത്രമാണ്. മേല്‍ക്കാണിച്ച കളിക്കാരന് ശുദ്ധതന്ത്രങ്ങളുടെ എണ്ണം 'm' ആണെങ്കിലും മിശ്രതന്ത്രങ്ങളുടെ എണ്ണം അനന്തമായിരിക്കും എന്ന് ശ്രദ്ധിക്കുക. രണ്ടുപേരുടെ ഗെയിമില്‍ ഒരാള്‍ക്ക് 'm' ശുദ്ധതന്ത്രങ്ങളും മറ്റേ ആള്‍ക്ക് 'n' ശുദ്ധതന്ത്രങ്ങളും ഉണ്ടെങ്കില്‍ പ്രതിഫല മാട്രിക്സിന്റെ വലുപ്പം m x n ആയിരിക്കും.

ഒരു ഗെയിമില്‍ ഏറ്റവും മെച്ചപ്പെട്ട തന്ത്രങ്ങള്‍ ഏതെന്ന് കണ്ടുപിടിക്കുകയാണ് ഗെയിം സിദ്ധാന്തത്തിന്റെ ലക്ഷ്യം. മിനിമാക്സി അല്ലെങ്കില്‍ മാക്സിമിനി രീതികളനുസരിച്ചാണ് മെച്ചപ്പെട്ട തന്ത്രങ്ങള്‍ നിശ്ചയിക്കുന്നത്. ഒരു കളിക്കാരനു കിട്ടാവുന്ന ഏറ്റവും മോശമായ പ്രതിഫലങ്ങള്‍ അവലംബിച്ച് അതിലെ ഏറ്റവും മെച്ചപ്പെട്ടതു തിരഞ്ഞെടുക്കുന്നതാണ് മാക്സിമിനി രീതി. ഓരോ കളിയിലും വരാവുന്ന വലിയ നഷ്ടങ്ങളിലെ ചെറുതു തിരഞ്ഞെടുക്കുന്നതിനെ മിനിമാക്സിരീതി എന്നുപറയുന്നു.

ഉദാ. 2 ഒരു ഗെയിമിന്റെ പ്രതിഫലമാട്രിക്സ് താഴെക്കാണുന്ന പ്രകാരമാണെന്നിരിക്കട്ടെ.

ചിത്രം:Pg 259 scre3 vol10.png

ഓരോ കളിക്കാരനും അവനവന്റെ സ്ഥിതി മെച്ചപ്പെടുത്തത്തക്കവിധമായിരിക്കുമല്ലോ കളിക്കുന്നത്. A യുടെ പ്രതിഫലം കുറവായിരിക്കത്തക്കവണ്ണമേ B കളിക്കുകയുള്ളൂ. A തിരഞ്ഞെടുക്കുന്നത് A1 ആണെങ്കില്‍ B എടുക്കുന്നത് B2 ആയിരിക്കും. A എടുക്കുന്നത് A1 ആയാലും B എടുക്കുന്നത് B2 തന്നെ ആയിരിക്കും. B ഏതെടുത്താലും ഓരോ അവസരത്തിലും മിനിമം പ്രതിഫലത്തുകയെങ്കിലും A ക്കു ലഭിക്കും. നിരയിലെ മിനിമം സംഖ്യകളായിരിക്കും ഇവ. ഇതിലെ മാക്സിമം നേടാനായിരിക്കുമല്ലോ A-യുടെ ശ്രദ്ധ. അതായത്, Aക്ക് എപ്പോഴും മാക്സിമിനി എടുക്കുന്നതാണ് ഗുണകരം.

B യുടെ കണക്കുകൂട്ടലില്‍ B1 കളിച്ചാല്‍ വരാവുന്ന മാക്സിമം നഷ്ടം 9 ആണ്. B2 കളിച്ചാല്‍ 6-ഉം. ഇതില്‍ മിനിമം എടുക്കാനായിരിക്കും ആയുടെ ശ്രദ്ധ. അതുകൊണ്ട് അയാളുടെ മെച്ചപ്പെട്ട തന്ത്രം B2 ആണ്. ഇക്കാര്യം തന്നെ ഗണിതചിഹ്നങ്ങളുപയോഗിച്ച് എഴുതാം.

'm' നിരകളും 'n' കോളങ്ങളുമുള്ള പ്രതിഫല മാട്രിക്സിനെ എന്നു ചിത്രം:Pg259 scr4 vol 10 .png സൂചിപ്പിക്കാം.

ചിത്രം:Pg259 scr4 vol 10-1 .png

എന്നിരിക്കട്ടെ. 'p' നിരയിലെ മിനിമം സംഖ്യയായിരിക്കും ചിത്രം:Pg259 scr4 vol 10-2 .png (p നിരയിലെ മറ്റൊരു സംഖ്യ)

പക്ഷേ, ars 's' കോളത്തിലെ മാക്സിമം സംഖ്യയാണ്

ചിത്രം:Pg 259 scr4 vol 10-3 .png

രണ്ടും കൂടിയാകുമ്പോള്‍ ചിത്രം:Pg 259 scr4 vol 10-4 .png എന്നുവരും.

അതായത്,

ചിത്രം:Pg 259 scr4 vol 10 -5.png


ഇവ രണ്ടും ഒന്നായി വരുന്ന ഗെയിമുകളെ നിര്‍ധാരണം ചെയ്യാമെന്നും ചിത്രം:Pg 259 scr5 vol 10 -4.png-നെ ഗെയിമിന്റെ മൂല്യമെന്നും പറയുന്നു. ചിത്രം:Pg 259 scr5 vol 10-6 .png ആയാല്‍ ഗെയിം ഭേദപ്പെട്ടതാണെന്നു പറയുന്നു.

ഏതൊരു ഗെയിമിനും ചിത്രം:Pg 259 scr5 vol 10-7 .png ആണ് ...(6)

ചിത്രം:Pg 259 scr5 vol 10-8 .png ഇവ ഒന്നായി വരുന്ന ബിന്ദുവിനെ ഗെയിമിന്റെ നിശ്ചിത ബിന്ദു എന്നുവിളിക്കുന്നു. ai0j0 ആണ് നിശ്ചിത ബിന്ദുവെങ്കില്‍ A യുടെ മെച്ചപ്പെട്ട തന്ത്രം i0 യും B യുടെ മെച്ചപ്പെട്ട തന്ത്രം j0 ആണ്. പ്രതിഫലമാട്രിക്സിലെ നിരകളിലെ മിനിമം സംഖ്യകളുടെ മാക്സിമവും കോളങ്ങളിലെ മാക്സിമം സംഖ്യകളിലെ മിനിമവും ആണിത്; ആ ബിന്ദുവില്‍ക്കൂടി കടക്കുന്ന നിരയും കോളവും മെച്ചപ്പെട്ട തന്ത്രങ്ങളും. നിശ്ചിത ബിന്ദുവിലെ സംഖ്യാ ഗെയിമിന്റെ മൂല്യമാണിത്.

നിശ്ചിത ബിന്ദു എല്ലാ ഗെയിമിനുമുണ്ടായിരിക്കണമെന്നില്ല. നിശ്ചിതബിന്ദു വ്യക്തമായി കിട്ടുന്ന ഗെയിമുകള്‍ക്ക് നിര്‍ധാരണം എളുപ്പമാണ്. എന്നാല്‍ നിശ്ചിതബിന്ദു അതുല്യ (unique)മായിരിക്കണമെന്നില്ല.

ഉദാ. 3.

i. രണ്ടുപേര്‍ ഒരു നാണയമെറിഞ്ഞു കളിക്കുന്നു എന്നിരിക്കട്ടെ. രണ്ടുപേര്‍ക്കും ഒരു പോലെയുള്ള വശം ലഭിച്ചാല്‍ രണ്ടാമതു കളിക്കുന്ന ആള്‍ക്ക് ഒരു തുക ലഭിക്കും; ഇല്ലെങ്കില്‍ മറ്റെ യാള്‍ക്കും. പ്രതിഫല മാട്രിക്സ് ഇപ്രകാരമായിരിക്കും.

ചിത്രം:Pg 259 sc6 vol10-9.png

ഇത് ഒരു പൂജ്യം-തുക-ഗെയിമാണ്. നിശ്ചിതബിന്ദു ഇല്ല.

2. ഒന്നാമത്തെ ഉദാഹരണത്തില്‍ പിന്മാറാനുള്ള അവസരം കൂടികൊടുക്കുന്നു എന്നിരിക്കട്ടെ. പിന്മാറുന്ന ആള്‍ക്ക് പകുതി പ്രതിഫലം കിട്ടും. രണ്ടുപേരും മാറിയാല്‍ ആര്‍ക്കുമൊന്നുമില്ല. പ്രതിഫല മാട്രിക്സ് താഴെക്കൊടുക്കുന്നു.

ചിത്രം:Pg 259 scr6 vol10-10.png

ഇപ്പോള്‍ നിശ്ചിതബിന്ദു ഉണ്ട്. ഗെയിം ഭേദപ്പെട്ടതാണ്; മൂല്യം പൂജ്യവും.

3. ഒരു 3x3 ഗെയിം നോക്കാം. 3 പെട്ടികള്‍ 1, 2, 3 എന്ന് അടയാളപ്പെടുത്തിയിരിക്കുന്നു. അവയുടെ അടിവശം മാറ്റാവുന്നതാണ്. A അടയാളപ്പെടുത്തിയ തുകവീതം ഏതെങ്കിലും 2 പെട്ടികളിലിടുന്നു. B ഏതെങ്കിലും ഒരു പെട്ടിയുടെ അടിവശം മാറ്റുന്നു. പരസ്പരനീക്കങ്ങള്‍ അറിയുന്നുമില്ല. 2 പെട്ടികളിലുള്ള പണത്തിന്റെ തുക A യ്ക്കു ലഭിക്കും. അടിവശം മാറ്റിയ പെട്ടിയിലേത് B ക്കും. A ക്ക് ഇടാവുന്ന തുകകളുടെ വ്യത്യസ്ത സാധ്യതകള്‍ 1,2; 1, 3; 2, 3 എന്നിങ്ങനെയാണ്. A യ്ക്കു കിട്ടാവുന്ന തുകകള്‍ മാട്രിക്സ് രൂപത്തില്‍ കൊടുക്കാം.

ചിത്രം:Pg 259 scr7 vol10-11.png

A ഇടുന്ന തുകകള്‍ 1, 2 ആണെന്നിരിക്കട്ടെ. അടിവശം മാറ്റിയപെട്ടി 1 ആണെങ്കില്‍ A ക്കു കിട്ടുന്ന തുക = 1 + 2 = 1. അടിവശം മാറ്റയതു 2 ആണെങ്കില്‍ A ക്ക് കിട്ടുന്ന തുക = 1 2 = 1. അടിവശം മാറ്റിയതു 3 ആണെങ്കില്‍ A ക്കു കിട്ടുന്ന തുക = 1 + 2 = 3. ഇങ്ങനെ മറ്റു കോളങ്ങളും നിറയ്ക്കാം. ഇതിലും നിശ്ചിതബിന്ദു ഇല്ല,

3. രണ്ടു പട്ടാളമേധാവികള്‍ ഒരു പട്ടണത്തിലെത്താന്‍ ശ്രമിക്കുന്നു. A യുടെ കീഴില്‍ 3 കമ്പനികളും B യുടെ കീഴില്‍ 4 കമ്പനികളും ഉണ്ട്. രണ്ടു വഴികളാണ് പട്ടണത്തിലേക്കുള്ളത്. A എത്താന്‍ ശ്രമിക്കുകയും ആ തടയുകയുമാണെന്നു കരുതാം. A ക്കു 3 കമ്പനികളും ഒന്നിച്ചോ വെവ്വേറെയോ അയയ്ക്കാം. ഒരു കമ്പനി മുറിച്ചയയ്ക്കാന്‍ പാടില്ല. B ക്കും ഒന്നിച്ചോ വെവ്വേറെയോ അയാളുടെ 4 കമ്പനികളും പ്രതിരോധത്തിനുപയോഗിക്കാം. ഏതെങ്കിലുമൊരു വഴിയില്‍ A-യുടെ കമ്പനികളുടെ എണ്ണം B യുടേതിനെക്കാള്‍ കൂടിയാല്‍ A-ക്ക് ആ വഴി ഉപയോഗിച്ച് ലക്ഷ്യത്തിലെത്താമെന്നു വയ്ക്കാം. ലക്ഷ്യത്തിലെത്തുമെങ്കില്‍ പ്രതിഫലം 1 എന്നും അല്ലെങ്കില്‍ 0 എന്നും വച്ചാല്‍ പ്രതിഫല പട്ടിക താഴെക്കൊടുത്തിരിക്കുന്ന പ്രകാരമായിരിക്കും.

ചിത്രം:Pg 259 scr8 vol10-12.png

എല്ലാ നിരകളിലും കുറഞ്ഞ സംഖ്യ പൂജ്യവും കൂടിയ സംഖ്യ 1-ഉം ആയതിനാല്‍ നിശ്ചിത ബിന്ദു ഇല്ല.

നിരകളുടെയോ കോളങ്ങളുടെയോ ആധിപത്യം (പ്രമുഖത-dominance) ഉപയോഗിച്ച് വലിയ മാട്രിക്സുകളെ ചുരുക്കാന്‍ സാധിക്കും. താഴെ കൊടുത്തിരിക്കുന്ന പ്രതിഫല മാട്രിക്സ് നോക്കുക.

A ഏതു തന്ത്രമുപയോഗിക്കുമ്പോഴാണ് B-ക്കു കുറഞ്ഞ നഷ്ടം വരുന്നത്. II ഉപയോഗിക്കുമ്പോഴാണ് എന്നു വ്യക്തം. അതുകൊണ്ട് B-യുടെ II-ാം തന്ത്രമാണ് I-നെക്കാള്‍ പ്രബലമായത്. അഥവാ, II-ാം തന്ത്രം I-നെക്കാള്‍ ആധിപത്യമുള്ളതാണ്.

(-2<3, 1<4) B-യുടെ I-ാം തന്ത്രം വലിയ ഗുണമില്ലാത്തതിനാല്‍ എടുത്തുമാറ്റാം. അതുപോലെ III, IV ഇവ പരിശോധിച്ചു നോക്കുമ്പോള്‍ III ആണ് ആധിപത്യമുള്ളത് എന്നു കിട്ടുന്നു. അതുകൊണ്ട് IV നീക്കിക്കളയാം. ഇപ്പോള്‍ മാട്രിക്സ് ചുരുങ്ങി ഇപ്രകാരമാകുന്നു.

ചിത്രം:Pg 260 scr1 vol10-12.png

A-യുടെ ഭാഗത്തു നിന്നു നോക്കുമ്പോള്‍ A യ്ക്കു കൂടുതല്‍ തുക കിട്ടുന്നതാണു നല്ലത്. 1>2, 2>3. അതുകൊണ്ട് A യുടെ II-നാണ് ആധിപത്യം. I മാറ്റിനിര്‍ത്താം. ഇപ്പോള്‍ പ്രതിഫല മാട്രിക്സ്

ചിത്രം:Pg 260 scre10 vol10-13.png

ഇപ്പോള്‍ 1<2. അതുകൊണ്ട് ബലം കുറഞ്ഞ B യുടെ മൂന്നാം തന്ത്രം മാറ്റുക. അങ്ങനെ A-യുടെ II, B-യുടെ II ഇവ മെച്ചപ്പെട്ട തന്ത്രങ്ങളായും 1 എന്നത് ഗെയിമിന്റെ മൂല്യമായും അനുമാനിക്കാം. നിശ്ചിതബിന്ദുരീതി ഉപയോഗിച്ചാലും ഇതുതന്നെ കിട്ടും.

ഒരു ഗെയിമില്‍ നിശ്ചിതബിന്ദു ഇല്ലാതെ വരുമ്പോഴാണ് മിശ്രതന്ത്രങ്ങളുപയോഗിക്കുന്നത്. അപ്പോള്‍ സംഭാവ്യത ഉപയോഗിച്ച് അ യുടെയും ആ യുടെയും പ്രതീക്ഷാമൂല്യങ്ങള്‍ (expected values) കണ്ടുപിടിച്ചശേഷം അവയിലെ മാക്സിമിനിയോ മിനിമാക്സിയോ കണ്ടുപിടിച്ചാണ് ഗെയിം നിര്‍ധാരണം ചെയ്യുന്നത്.

A-യുടെ മിശ്രതന്ത്രം X = (x1, x2, x3....xm)ഉം

B-യുടെ മിശ്രതന്ത്രം Y = (y1, y2, y3....yn)ഉം

ആണെങ്കില്‍

A പ്രതീക്ഷിക്കുന്ന

പ്രതിഫലം = E (X, Y)

ചിത്രം:Pg 260 scr11 vol10-14.png

ചിത്രം:Pg 260 scr14 vol10-15 .png

ന്യൂമാന്റെ അടിസ്ഥാന സൂത്രമനുസരിച്ച് ഏതൊരു ഗെയിമിനും ഒരു മൂല്യം ഉണ്ട്. ഈ മൂല്യത്തിന്റെ മിശ്രതന്ത്രങ്ങള്‍ X0, Y0 ആണെങ്കില്‍ അവയ്ക്കു താഴെപ്പറയുന്ന ഗുണങ്ങളുണ്ടായിരിക്കണം.

1. ഒരു കളിക്കാരന്‍ മെച്ചപ്പെട്ട തന്ത്രം മാത്രം ഉപയോഗിക്കുമ്പോള്‍ മറ്റെയാള്‍ അയാളുടെ മെച്ചപ്പെട്ട തന്ത്രത്തില്‍ നിന്നും വ്യതിചലിച്ചാല്‍ അങ്ങനെ മാറുന്ന ആളുടെ പ്രതിഫലം കുറയുകയേയുള്ളൂ; കൂടുകയില്ല.

2. ഒരു കളിക്കാരന്‍ മെച്ചപ്പെട്ട തന്ത്രം സ്ഥിരമായി ഉപയോഗിച്ചാല്‍ മറ്റെയാള്‍ മിശ്രതന്ത്രങ്ങള്‍ എങ്ങനെ ഉപയോഗിച്ചാലും ഗെയിമിന്റെ മൂല്യത്തിനു മാറ്റം വരികയില്ല.

മിശ്രതന്ത്രങ്ങളുടെ സംഭവ്യതകള്‍ കണ്ടുപിടിക്കാന്‍ സൂത്രങ്ങള്‍ (formulas) തന്നെ ഉണ്ടാക്കിയെടുക്കാം.

2 x 2 ഗെയിം എടുക്കാം.

ചിത്രം:Pg 261 scr1 vol10-16.png

A-യുടെ മിശ്രതന്ത്രം (x1,x2); B-യുടെ മിശ്രതന്ത്രം (y,sub>1</sub>, y2) എന്നിരിക്കട്ടെ. ഗെയിമിന്റെ മൂല്യം m ആണെങ്കില്‍ A യുടെ പ്രതീക്ഷാലാഭം

ചിത്രം:Pg 261 sc2 vol10 -17.png

എന്നാല്‍ ഇവയിലെ സമവാക്യരൂപം തന്നെ ഉപയോഗിച്ചാല്‍

ചിത്രം:Pg 261 scr2 vol10-19.png

പ്രതിഫല മാട്രിക്സ് 2 x 2 നെക്കാള്‍ വലുതാണെങ്കില്‍ ആധിപത്യരീതി ഉപയോഗിച്ച് അതിനെ ചെറുതാക്കി 2x 2 വലുപ്പമാക്കി മേല്പറഞ്ഞ സൂത്രമുപയോഗിച്ചാല്‍ മതിയാകും.

ഉദാ. പ്രതിഫല മാട്രിക്സ്

ചിത്രം:Pg 261 scr3 vol10-20.png

ക, കകക കോളങ്ങളില്‍ 1 < 3, 6 < 7, 55, അതുകൊണ്ട്, ക, കകക ഇവയില്‍ ആധിപത്യമുള്ളത് ക ആണ്.

കക, കകക നിരകളില്‍ 6 > 5, 2 > 1 ആയതുകൊണ്ട് കക ആണ് ആധിപത്യമുള്ളത്.

മുന്‍ സൂത്രങ്ങളുപയോഗിച്ചാല്‍ (12, 13, 14, 15, 16)

ാ = 4 എന്നുകിട്ടും.
   

അ-യുടെ മെച്ചപ്പെട്ട മിശ്രതന്ത്രം യും

ആ-യുടെ മെച്ചപ്പെട്ട മിശ്രതന്ത്രം യും ആണ്.

ഗെയിമിന്റെ മൂല്യം-4.

രണ്ടുപേരുള്ള ഗെയിമില്‍ ഒരാള്‍ക്കു രണ്ടും എതിരാളിക്ക് എത്രവേണമെങ്കിലും തന്ത്രങ്ങളുണ്ടെങ്കില്‍ 2x ി അഥവാ ിx 2 ഗെയിമുകള്‍ ലഭിക്കുന്നു. ഇത്തരം ഗെയിമുകളെ ആധിപത്യരീതിയില്‍ 2x 2 ആക്കി മാറ്റുകയോ ഓരോ 2x 2 ഉപമാട്രിക്സുകളെടുത്ത് അവയുടെ മിശ്രതന്ത്രങ്ങള്‍ ഉപയോഗിച്ച് മെച്ചപ്പെട്ടത് എടുക്കുകയോ ചെയ്യാം. 'ി' വലിയ സംഖ്യ ആണെങ്കില്‍ ഉപമാട്രിക്സുകളുടെ സംഖ്യ കൂടുമെന്നുള്ളതുകൊണ്ട് അപ്രായോഗികത ഉണ്ടാകാം. അത്തരം സന്ദര്‍ഭങ്ങളില്‍ ഗ്രാഫ് രീതിയാണ് മെച്ചം.

ഈ ഗെയിമിന് വ്യക്തമായ നിശ്ചിതബിന്ദു ഇല്ല. ആധിപത്യരീതിയില്‍ ചുരുക്കാനും വിഷമമാണ്. അ, 'ഃ' എന്ന സംഭാവ്യതയോടുകൂടി നീക്കം ക തിരഞ്ഞെടുക്കുന്നു എന്നിരിക്കട്ടെ. അപ്പോള്‍ കക-ന്റെ സംഭാവ്യത 1ഃ ആയിരിക്കുമല്ലോ. ആ, ക എടുക്കുമ്പോള്‍ അ യുടെ പ്രതീക്ഷാ പ്രതിഫലം ്യ=ഃ+2(1ഃ)

                   =2ഃ

ന്റെ വില പൂജ്യത്തിനും 1-നും ഇടയ്ക്കായിരിക്കുന്നതുകൊണ്ട് ഒരു യൂണിറ്റ് അകലത്തില്‍ രണ്ട് ്യ അക്ഷങ്ങള്‍ വരച്ച് അതില്‍ പ്രതിഫലത്തിനുള്ള യൂണിറ്റുകള്‍ അടയാളപ്പെടുത്തി ഗ്രാഫ് വരയ്ക്കാം.

ആ ക-ാം തന്ത്രം ഉപയോഗിക്കുമ്പോള്‍

അ യുടെ പ്രതിഫല രേഖ ്യ=2ഃ ആണ്.

ഈ രേഖ വരയ്ക്കാന്‍x=0, ്യ=2;

ഃ=1, ്യ=1 എന്നു കാണുക.

അതായത് പ്രതിഫലരേഖ അ യുടെ ക-ാം തന്ത്ര അക്ഷത്തില്‍ 1 എന്ന ബിന്ദുവില്‍ക്കൂടിയും കക-ാം തന്ത്ര അക്ഷത്തില്‍ 2 എന്ന ബിന്ദുവില്‍ക്കൂടിയും പോകുന്നു. അതുപോലെ ആ-യുടെ കക-ാം തന്ത്രത്തിനനുസരിച്ചുള്ള അ യുടെ പ്രതിഫലരേഖ യഥാക്രമം 3, 1 എന്ന ബിന്ദുവില്‍ക്കൂടി പോകുന്നു. പ്രതിഫലമാട്രിക്സിലെ സംഖ്യകള്‍ തന്നെയാണിവ. മെച്ചപ്പെട്ട തന്ത്രം തിരഞ്ഞെടുക്കാന്‍ ഈ രേഖകളുടെ സമാഹാരത്തിന്റെ താഴെയുള്ള അതിര്‍ത്തി (ജഝഞട) കണ്ടുപിടിക്കുക. ഏറ്റവും ഉയര്‍ന്ന ബിന്ദുവാണ് എടുക്കേണ്ടത് (ഞ).

B-യുടെ കക, കകക തന്ത്രങ്ങള്‍ക്കനുസരണമായാണ് മെച്ചപ്പെട്ട തന്ത്രങ്ങള്‍ തരുന്നത്.

നേരത്തേ ഉപയോഗിച്ച സൂത്രങ്ങളുപയോഗിച്ചോ ഗ്രാഫില്‍ നിന്നുതന്നെയോ അ യുടെ മെച്ചപ്പെട്ട തന്ത്രങ്ങള്‍

എന്നും

B യുടെ മെച്ചപ്പെട്ട തന്ത്രങ്ങള്‍ എന്നും

ഗെയിമിന്റെ മൂല്യം എന്നും ലഭിക്കും.

ഇതുവരെ കൊടുത്തിട്ടുള്ള രീതികള്‍ ഉപയോഗിച്ചാലും നിര്‍ധാരണം ചെയ്യാന്‍ കഴിയാത്ത ഗെയിമുകള്‍ക്കു ലീനിയര്‍ പ്രോഗ്രാമിങ് തുടങ്ങിയ രീതികളും പ്രയോഗിക്കാറുണ്ട്.

ഇലക്ട്രോണിക്സിന്റെ സഹായത്തോടെ ധാരാളം മെഷീന്‍ ഗെയിമുകള്‍ വിപണിയിലുണ്ട്. കംപ്യൂട്ടര്‍ ഗെയിമുകള്‍ എന്നറിയപ്പെടുന്ന ഇവ മനുഷ്യന്‍ കളിക്കുന്ന ഗെയിമുകളോളം രസമുള്ളവയല്ലെങ്കിലും ഗെയിം സിദ്ധാന്തത്തിലെ പല ചോദ്യങ്ങള്‍ക്കും ഉത്തരം ലഭിക്കാനായി ഭാവിയില്‍ ഉപയോഗിച്ചേക്കാം. ഗെയിം സിദ്ധാന്തത്തിലെ പല ഗവേഷണപ്രശ്നങ്ങളും വളരെ വലുപ്പമുള്ള മാട്രിക്സുകളില്‍ ചെന്നെത്തുന്നതുകൊണ്ട് അതിന്റെ ഭാവിയിലെ പ്രയോജനങ്ങള്‍ തീര്‍ച്ചയായും കംപ്യൂട്ടറിന്റെ കഴിവുകളെ ആശ്രയിച്ചുകൂടിയാണിരിക്കുന്നത്.

(ഡോ. സിസിലി സക്കറിയാസ്)

താളിന്റെ അനുബന്ധങ്ങള്‍
സ്വകാര്യതാളുകള്‍