ഇന്‍ഫർമേഷന്‍ തിയറി

സര്‍വ്വവിജ്ഞാനകോശം സംരംഭത്തില്‍ നിന്ന്

11:50, 5 സെപ്റ്റംബര്‍ 2014-നു ഉണ്ടായിരുന്ന രൂപം സൃഷ്ടിച്ചത്:- Mksol (സംവാദം | സംഭാവനകള്‍)

(മാറ്റം) ←പഴയ രൂപം | ഇപ്പോഴുള്ള രൂപം (മാറ്റം) | പുതിയ രൂപം→ (മാറ്റം)

ഇന്‍ഫര്‍മേഷന്‍ തിയറി

Information Theory

വാർത്താവിനിമയസമ്പ്രദായങ്ങളെപ്പറ്റിയുള്ള ഗണിതശാസ്‌ത്രപരമായ സിദ്ധാന്തം. നിർണയ വിധേയമായ ഒരു കാര്യത്തെ മറ്റു കാര്യങ്ങളിൽനിന്നു വേർപെടുത്തിയെടുക്കുകയെന്നതാണ്‌ ഈ സിദ്ധാന്തത്തിന്റെ അടിസ്ഥാനം. റേഡിയോ, കമ്പിയില്ലാക്കമ്പി, ടെലിവിഷന്‍, കംപ്യൂട്ടർ എന്നിവ തുടങ്ങി മനുഷ്യമസ്‌തിഷ്‌കംവരെയുള്ള ആശയവിനിമയ മാധ്യമങ്ങളുടെ പ്രവർത്തനത്തെ വിശകലനംചെയ്യുന്നതും ഇതിന്റെ പരിധിയിൽവരുന്നു. വാർത്താവിനിമയം എന്ന പ്രവർത്തനത്തിൽ വാർത്ത പ്രക്ഷേപണം ചെയ്യുമ്പോള്‍ അതു മുഴുവനുമായോ ഭാഗികമായോ ലക്ഷ്യത്തിൽ എത്തിച്ചേരാം. ലക്ഷ്യവും ഫലവും തമ്മിലുള്ള ബന്ധം മനസ്സിലാക്കുകയാണ്‌ ഈ പഠനംകൊണ്ട്‌ സാധിക്കുന്നത്‌. സാംഖ്യിക (Statistics)ത്തിലെ സംഭാവ്യതാസിദ്ധാന്ത(Probability Theory) ത്തിന്റെ ഒരു ഭാഗമാണ്‌ ഇന്‍ഫർമേഷന്‍ തിയറി. വളരെ സാങ്കേതികസ്വഭാവമുള്ളതാണ്‌ ഈ സിദ്ധാന്തം.

എല്ലാ ശാസ്‌ത്രീയ ഗവേഷണങ്ങളിലും പ്രയോജനപ്പെടുത്തിവരുന്ന ഒരു സിദ്ധാന്തമാണിത്‌. ഭാഷാശാസ്‌ത്രത്തിൽ ഒരു ഭാഷയുടെ ആശയസംവഹനക്ഷമത, ഒരു എഴുത്തുകാരന്റെ ഭാഷയ്‌ക്കുള്ള പ്രത്യേകത; ഏതെങ്കിലും കൃതിയുടെ അജ്ഞാതകർത്തൃത്വം തുടങ്ങിയ കാര്യങ്ങള്‍ ഈ സിദ്ധാന്തമനുസരിച്ച്‌ കണ്ടുപിടിക്കാവുന്നതാണ്‌. ജീവശാസ്‌ത്രത്തിൽ ജീവികളുടെ ജനിതക സവിശേഷതകളും മറ്റും വിശകലനം ചെയ്യാന്‍ ഈ സിദ്ധാന്തം പ്രയോജനപ്പെടുന്നു. അതുപോലെ ശാസ്‌ത്രതര രംഗങ്ങളിലും ഈ സിദ്ധാന്തം പ്രയോഗിച്ചുവരുന്നു. ആശയങ്ങള്‍ തിരഞ്ഞെടുത്ത്‌ അയയ്‌ക്കുന്ന ഒരു ആരംഭകേന്ദ്രവും അതു സ്വീകരിക്കുന്ന ഒരു ലക്ഷ്യസ്ഥാനവും ഉള്ളതായി കണക്കാക്കുക. ഗണിതശാസ്‌ത്രമുപയോഗിച്ചുള്ള പഠനത്തിനുവേണ്ടി ആരംഭകേന്ദ്രത്തിൽനിന്നും സന്ദേശം സങ്കേത(Code)ഭാഷയിലേക്കു വിവർത്തനംചെയ്‌ത്‌ അയയ്‌ക്കുകയും ലക്ഷ്യസ്ഥാനത്തെത്തുമ്പോള്‍ സങ്കേതം വീണ്ടും സന്ദേശമായി മാറ്റുകയും ചെയ്യുന്നു. സങ്കേതഭാഷയിലുള്ള സന്ദേശം ലക്ഷ്യത്തിൽ എത്തിച്ചേരുന്നതുവരെയുള്ള സമയം, സ്ഥലം മുതലായവയ്‌ക്കെല്ലാംകൂടി "വീഥി' (Channel) എന്നു പറയും. ഇന്‍ഫർമേഷന്‍ തിയറിയിൽ വിനിമയസമ്പ്രദായത്തിന്‌ ഒരു ഗണിതശാസ്‌ത്രമാതൃക ഉണ്ടാക്കുകയാണ്‌ ചെയ്യുന്നത്‌. വിവരങ്ങളുടെ പ്രവാഹത്തെ അളക്കാനുള്ള സമ്പ്രദായം ആദ്യമായി ആവിഷ്‌കരിച്ചത്‌ സി.ഇ. ഷാനണ്‍ എന്ന ശാസ്‌ത്രജ്ഞനാണ്‌. ഒരു പ്രവാഹത്തിലെ വിവരത്തിന്റെ ആകെത്തുക ഒ ആയി സങ്കല്‌പിച്ചാൽ ഒനെ താഴെപ്പറയുന്ന സമവാക്യം ഉപയോഗിച്ച്‌ നിർവചിക്കാം:

ഇവിടെ P1, P2, ... മുതലായവ സൂചിപ്പിക്കുന്നത്‌ സംഭാവ്യതയെയാണ്‌; കുറെ ആശയങ്ങളിൽനിന്നും ഒരു ആശയത്തെ തെരഞ്ഞെടുക്കുന്നതിനുള്ള സംഭാവ്യത. വിവരത്തിന്റെ അളവിനെ ധനസംഖ്യയാക്കാനാണ്‌ ഋണചിഹ്നം കൊടുത്തിട്ടുള്ളത്‌. എന്തെന്നാൽ സംഭാവ്യതകളുടെ ലോഗരിതം നിശ്ചയമായും ഋണസംഖ്യയായിരിക്കും. ഒരു ഉദാഹരണംകൊണ്ട്‌ ഈ വാക്യം വിശദമാക്കാം. അ, ആ, ഇ, ഉ എന്നു നാലുചീട്ടുകള്‍ കമഴ്‌ത്തിവച്ചിരിക്കുന്നു. ഇവയിൽ ഒരെച്ചം സ്‌പേഡ്‌ ഏസ്‌ ആണ്‌. ഓരോ ചീട്ടിനും സ്‌പേഡ്‌ ഏസ്‌ ആയിരിക്കാനുള്ള സംഭാവ്യത മ്പ വീതമാണ്‌. എങ്കിൽ ഈ ചീട്ടുകള്‍ ഓരോന്നും സ്‌പേഡ്‌ ഏസിനെപ്പറ്റി നമുക്കു നല്‌കുന്ന വിവരത്തിന്റെ ശരാശരി അളവ്‌ മേല്‌പറഞ്ഞ സമവാക്യം ഉപയോഗിച്ചു കണക്കാക്കാം. P1, P2, P3, P4 എന്നിവ മ്പ വീതം ആയാൽ, H = log2 4 = 2വിവരത്തിന്റെ അളവ്‌ "ബിറ്റ്‌' എന്ന ഏകകം ഉപയോഗിച്ച്‌ പറയുന്നു. ഓരോ ചീട്ടും നല്‌കുന്ന വിവരത്തിന്റെ ശരാശരി അളവ്‌ 2 ബിറ്റ്‌ ആണ്‌.A, B, C, Dഎന്നീ ചീട്ടുകള്‍ നല്‌കുന്ന വിവരത്തിന്റെ അളവിനെ സങ്കേതഭാഷയിൽ 2 അക്കങ്ങള്‍ ഉപയോഗിച്ചു പ്രകടമാക്കാം. അ, ആ, ഇ, ഉ എന്നിവയ്‌ക്ക്‌ യഥാക്രമം 00, 01, 10, 11 എന്ന സങ്കേതങ്ങള്‍ ഉപയോഗിക്കാം. A എന്ന ചീട്ട്‌ സ്‌പേഡ്‌ ഏസ്‌ ആകുന്നു എന്ന സന്ദേശം "00' എന്ന സങ്കേതമുപയോഗിച്ച്‌ പ്രക്ഷേപണം ചെയ്യാം എന്നർഥം. 8 ചീട്ടുകള്‍ ഉപയോഗിക്കുകയും സംഭാവ്യത തുല്യമായി കണക്കാക്കുകയും ചെയ്‌താൽ ശരാശരി വിവരം 3 ബിറ്റ്‌ ആണെന്നു കാണാം.

ഒരു സന്ദേശത്തെപ്പറ്റിയുള്ള നമ്മുടെ അജ്ഞത കൂടുതലാകുമ്പോള്‍ അതിനെ അറിയുവാന്‍ നാം കൂടുതൽ വിവരം ആവശ്യപ്പെടുന്നു. അറിഞ്ഞതിനെ വീണ്ടും അറിയുവാന്‍ സാധ്യമല്ല. ഉദാഹരണമായി എന്ന ചീട്ട്‌ സ്‌പേഡ്‌ ഏസ്‌ ആയിരിക്കാനുള്ള സംഭാവ്യത 1 ആണെങ്കിൽ ആ ചീട്ട്‌ നമുക്കു നല്‌കുന്ന പുതിയ വിവരത്തിന്റെ അളവ്‌ 1 ഹീഴ21 = 0 ആയിരിക്കും. പുതിയതായി വിവരമൊന്നുമില്ലെന്നർഥം. എല്ലാ ചീട്ടുകളും സ്‌പേഡ്‌ ഏസ്‌ ആകാനുള്ള സംഭാവ്യത തുല്യമാണെങ്കിൽ നമ്മുടെ അനിശ്ചിതത്വം ഏറ്റവും കൂടുതലാകുന്നു. അതിനാൽ ഏറ്റവും കൂടുതൽ വിവരം നാം ആവശ്യപ്പെടുന്നു. മേല്‌പറഞ്ഞ ഉദാഹരണത്തിൽ 2 ബിറ്റ്‌ വിവരം ഏറ്റവും കൂടിയതാണ്‌. ഇന്‍ഫർമേഷന്‍ സിദ്ധാന്തത്തിൽ സന്ദേശങ്ങള്‍ അയയ്‌ക്കുന്ന "വീഥി'യുടെ "ശേഷി' (capacity) പ്രധാനമാണ്‌. ഒരു സെക്കന്‍ഡിൽ n' ചിഹ്നങ്ങള്‍ (symbols) പ്രക്ഷേപണം ചെയ്യാവുന്ന വീഥിയിൽക്കൂടി 2 ബിറ്റ്‌ വിവരം പ്രക്ഷേപണം ചെയ്യുമ്പോള്‍ വീഥിയുടെ ശേഷി 2n ബിറ്റ്‌ ആയിരിക്കും.

ഭാഷകളെപ്പറ്റിയുള്ള പഠനത്തിലും ഇന്‍ഫർമേഷന്‍ തിയറി ഉപയോഗിക്കുന്നുണ്ട്‌. അക്ഷരങ്ങള്‍ ചേർന്നാണ്‌ വാക്കുകള്‍ ഉണ്ടാകുന്നത്‌. വാക്കുകളും വാക്യങ്ങളും അടങ്ങിയതാണ്‌ ഭാഷ. കുറേ ശ്രമകരമാണെങ്കിലും സംഭാവ്യതാതത്ത്വം ഉപയോഗിച്ചുതന്നെയാണ്‌ ഭാഷ വിനിമയംചെയ്യുന്ന ആശയങ്ങളുടെ വിവരം അളക്കുന്നത്‌. കുറേ അക്ഷരങ്ങളുടെ ഗണം ഉപയോഗിച്ച്‌ നിർമിക്കാവുന്ന അർഥപുഷ്‌ടങ്ങളായ വാക്കുകളുടെ എച്ചവും കുറേ വാക്കുകള്‍ ഉപയോഗിച്ചു നിർമിക്കാവുന്ന വാക്യങ്ങളുടെ എച്ചവും കണക്കാക്കുന്നത്‌ എളുപ്പമല്ല. വാക്കുകളുടെ എച്ചം കൂട്ടിയതുകൊണ്ട്‌ ഒരു വാക്യം നല്‌കുന്ന വിവരത്തിന്റെ അളവ്‌ കൂടണമെന്നില്ല. ഇംഗ്ലീഷ്‌ ഭാഷയിൽ ഒരു വാക്കു നല്‌കുന്ന ശരാശരി വിവരം 11.82 ബിറ്റ്‌ ആണെന്നാണ്‌ ഷാനണ്‍ കണക്കാക്കിയിട്ടുള്ളത്‌. ഒരു ഇംഗ്ലീഷ്‌ വാക്കിന്റെ ശരാശരി നീളം 4.5 അക്ഷരങ്ങളാണ്‌. ഇതിൽനിന്നും ഒരു വാക്കിലെ ഓരോ അക്ഷരവും നല്‌കുന്ന വിവരത്തിന്‌ 2.14 ബിറ്റ്‌ മൂല്യം ഉണ്ടെന്നാണ്‌ അദ്ദേഹം കണക്കാക്കിയത്‌. ഓരോ ഭാഷയ്‌ക്കും ഉള്ള ഇത്തരം പ്രത്യേകതകള്‍ പഠിക്കുന്നതുപോലെ ഓരോ എഴുത്തുകാരനും ഉപയോഗിക്കുന്ന ശൈലിയെയും ഗണിതശാസ്‌ത്രപരമായി വിലയിരുത്താം. ഈ മാനദണ്ഡം ഉപയോഗിച്ച്‌ ഗ്രന്ഥങ്ങളുടെ അജ്ഞാതരായ കർത്താക്കളെ അനുമാനിക്കാവുന്നതാണ്‌.

(ടി. സുശീലന്‍)

ഇന്‍ഫർമേഷന്‍ തിയറി

സര്‍വ്വവിജ്ഞാനകോശം സംരംഭത്തില്‍ നിന്ന്

ഇന്‍ഫര്‍മേഷന്‍ തിയറി

Information Theory

താളിന്റെ അനുബന്ധങ്ങള്‍

സ്വകാര്യതാളുകള്‍

ഉള്ളടക്കം

തിരയൂ

പണിസഞ്ചി