Game Theory क्या है ?

गणितीय अनुशासन जिसे “Game Theory” के रूप में जाना जाता है, अक्सर वास्तविक दुनिया की स्थितियों में लागू किया जाता है। हालाँकि, इसका उपयोग गणित के बाहर कई अन्य डोमेन में भी किया जाता है। उदाहरण के लिए, रणनीतिक गेम के नियमों को गेम थ्योरी द्वारा समझाया जाता है। यह स्थापित करता है कि प्रतिभागी कैसे या किस क्रम में आगे बढ़ेंगे। प्रत्येक निर्णायक चरण में, यह खिलाड़ियों के डेटा को ध्यान में रखता है।

खेल सिद्धांत के अनुसार, खिलाड़ी के व्यवहार की अन्योन्या श्रयता से खेल बनता है। गेम में दो अलग-अलग प्रकार की एक साथ और अनुक्रमिक रणनीतिक परस्पर निर्भरता की सुविधा है। जो खिलाड़ी क्रमिक परस्पर निर्भरता में संलग्न होते हैं वे अपने साथी खिलाड़ियों के व्यवहार के प्रति जागरूक रहते हुए ऐसा करते हैं। एक साथ परस्पर निर्भरता में, खिलाड़ी एक दूसरे से स्वतंत्र रूप से कार्य करते हैं। ये युक्तियाँ खेल सिद्धांत का मूल हैं। आइए गेम थ्योरी के बारे में और अधिक सीखना जारी रखें ।

1. What is Game Theory

खेल सिद्धांत की परिभाषा के अनुसार, संभाव्य वितरण रणनीति के विज्ञान पर लागू होता है। यह उन तार्किक और गणितीय चालों को निर्दिष्ट करता है जो खिलाड़ियों को खेल की सफलता की संभावनाओं को अधिकतम करने के लिए करनी चाहिए। शतरंज, टेनिस, पालन-पोषण और टेकओवर कुछ ऐसे खेल हैं जिन्हें Game Theory में खोजा जा सकता है। लेकिन इन सभी खेलों में एक विशेषता समान है: प्रत्येक खिलाड़ी के परिणाम अन्य खिलाड़ियों के सामूहिक कार्यों पर निर्भर करते हैं।

दूसरे शब्दों में, Game Theory का संबंध विवादों के गणितीय प्रतिनिधित्व और तर्कसंगत निर्णय निर्माताओं के बीच सहयोग से है। निर्णय का अध्ययन जिसमें खिलाड़ियों को अन्य खिलाड़ियों के हितों को प्रभावित करने वाली रणनीति चुननी चाहिए, खेल सिद्धांत के रूप में जाना जाता है।

2. Different Game Theory Techniques

Game Theory में खिलाड़ी कुछ बुनियादी गेम-प्लेइंग विकल्पों के बीच चयन कर सकते हैं। हालाँकि, सामान्य तौर पर, यह प्रत्येक खिलाड़ी पर निर्भर है कि वह कितना जोखिम ले सकता है और सर्वोत्तम परिणाम प्राप्त करने के लिए कितनी दूर तक जाना चाहता है।

2.1 Maximax approach

जब भी कोई खिलाड़ी अधिकतम संभव भुगतान प्राप्त करने का प्रयास करता है तो वे मैक्सिमम रणनीति का उपयोग करते हैं। जो खिलाड़ी इस रणनीति को अपनाता है वह सबसे बड़ा परिणाम प्राप्त करने का जोखिम उठाना चाहेगा, भले ही बहुत खराब परिणाम की संभावना हो।

कैदी की दुविधा में, जो खिलाड़ी मैक्सिमम रणनीति को नियोजित करता है वह उस विकल्प को चुनता है जिसके परिणामस्वरूप कम से कम जेल की सजा होती है, चाहे दूसरे खिलाड़ी द्वारा किए गए निर्णय की परवाह किए बिना।

इसकी धारणा के कारण कि खिलाड़ी हमेशा बेहद अनुकूल स्थिति में होगा, जो हमेशा स्थिति नहीं हो सकती है, इस रणनीति की कभी-कभी अनुभवहीन और अत्यधिक आशावादी होने के रूप में आलोचना की जाती है।

2.2  Maximin approach

सबसे खराब भुगतान में से सबसे बड़ा भुगतान वह है जो एक खिलाड़ी मैक्सिमम रणनीति में चुनेगा । जब भी कोई खिलाड़ी किसी पूर्व समझौते को बनाए रखने के लिए अन्य प्रतिभागियों पर पूरी तरह निर्भर नहीं रह सकता, तो वे अक्सर इस विकल्प को चुनते हैं।

कैदी की दुविधा में, अपराध स्वीकार करते हुए पकड़े जाने पर 5 साल का सबसे खराब भुगतान होता है (यह मानते हुए कि दूसरा प्रतिभागी निर्दोष निकलता है), और इनकार करते हुए पकड़े जाने पर 9 साल का सबसे खराब भुगतान होता है (यदि दूसरा खिलाड़ी स्वीकार करता है)।

इसलिए, अधिकतम रणनीति, या सबसे खराब भुगतान, स्वीकार करना है।

2.3 Dominant strategy

इसके बावजूद कि अन्य प्रतिभागी क्या करना चुनते हैं, खिलाड़ी को प्रमुख रणनीति से सबसे अधिक लाभ होगा। कैदी की दुविधा में, हर किसी को स्वीकार करना कार्रवाई का सबसे अच्छा तरीका होगा।

यद्यपि गैर-वैकल्पिक स्थितियों में प्रभावी रणनीति उत्कृष्ट हो सकती है, लेकिन यदि कोई खिलाड़ी कई प्रभुत्व वाली रणनीतियों के साथ खेल खेलता है तो यह कार्रवाई का सबसे अच्छा तरीका नहीं होगा (उदाहरण के लिए, प्रत्येक खिलाड़ी के पास एक प्रमुख रणनीति होती है)।

2.4 Pure Strategy

रणनीतिक निर्णय का अंतिम स्तर शुद्ध रणनीति में होता है, जो केवल अन्य प्रभावों या अन्य लोगों की गतिविधियों के आधार पर एक निर्धारित विकल्प होता है। रॉक-पेपर-कैंची के एक दौर के बारे में सोचें जहां एक खिलाड़ी हर बार एक ही आकार उछालना चुनता है। तकनीक शुद्ध है क्योंकि प्रतिभागी का परिणाम पहले से ही अच्छी तरह से निर्दिष्ट होता है (परिणाम या तो एक निश्चित आकार ले सकते हैं या नहीं)।

2.5 Mixed approach

यद्यपि एक मिश्रित रणनीति संयोग का परिणाम प्रतीत हो सकती है, लेकिन किसी भी तत्व या कार्य को मिश्रित करने से पहले सावधानीपूर्वक योजना बनाने की आवश्यकता होती है। 

उदाहरण के लिए, इस बारे में सोचें कि बेसबॉल पिचर और बल्लेबाज कैसे बातचीत करते हैं। यदि पिचर लगातार एक ही पिच फेंकता है, तो बल्लेबाज अनुमान लगा सकता है कि आगे क्या होगा। इसलिए इसके बजाय, पिचर को अप्रत्याशितता की हवा उत्पन्न करने के लिए पिच से पिच तक अपना दृष्टिकोण बदलना चाहिए जिसका वह लाभ उठाना चाहता है।

3. Examples of Game Theory

खेल सिद्धांत विभिन्न प्रकार के “खेलों” की जांच करता है। इनमें से कुछ पर यहां शीघ्रता से चर्चा की जाएगी।

कैदी की दुविधा

Game Theory का सबसे प्रसिद्ध अनुप्रयोग द प्रिज़नर्स डिलेमा है। उदाहरण के तौर पर दो अपराधियों को लीजिए जिन्हें गिरफ्तारी के बाद हिरासत में लिया गया था। अभियोजन पक्ष के पास अपना अपराध साबित करने के लिए ठोस सबूत का अभाव है। इस बीच, अधिकारी कैदियों को उनकी पृथक कोठरियों से बाहर ले जाते हैं और कबूलनामा लेने के लिए प्रत्येक से अलग-अलग पूछताछ करते हैं। दोनों कैदी एक दूसरे से बात करने में असमर्थ हैं. अधिकारी चार लेनदेन प्रस्तुत करते हैं, जिन्हें अक्सर 2 × 2 बॉक्स के रूप में दिखाया जाता है।

  • यदि वे इसे स्वीकार करते हैं तो उनमें से प्रत्येक को पांच साल की जेल की सजा का सामना करना पड़ेगा।
  • कैदी 1 को तीन साल मिलेंगे, और कैदी 2 को नौ साल मिलेंगे यदि कैदी 1 कबूल करता है लेकिन कैदी 2 नहीं करता है।
  • अगर कैदी 2 कबूल करता है, लेकिन कैदी 1 ऐसा नहीं करता है, तो कैदी 1 को 10 साल की सजा होगी और कैदी 2 को दो साल की सजा होगी।
  • यदि दोनों में से कोई भी स्वीकार नहीं करता है तो प्रत्येक व्यक्ति को दो साल जेल में बिताने होंगे।

कार्रवाई का सबसे अच्छा तरीका चुप रहना है. हालाँकि दोनों में से कोई भी दूसरे की योजना से अनभिज्ञ नहीं है, दोनों ही इसे स्वीकार कर सकते हैं और पाँच साल की जेल की सजा का सामना कर सकते हैं क्योंकि कोई भी दूसरे की रणनीति को नहीं जानता है। नैश संतुलन के अनुसार, कैदी की दुविधा में दोनों खिलाड़ी कार्रवाई का एक ऐसा तरीका चुनेंगे जो उनके लिए अलग से बेहतर हो लेकिन समग्र रूप से सबसे खराब हो।

किसी कैदी की दुविधा को हल करने का सबसे अच्छा तरीका “जैसे को तैसा” वाक्यांश है। अनातोल रैपोपोर्ट ने “जैसे को तैसा” नामक रणनीति बनाई, जिसमें एक पुनरावृत्त कैदी की दुविधा में प्रत्येक खिलाड़ी एक ऐसी कार्रवाई चुनता है जो उनके प्रतिद्वंद्वी की पिछली चाल से मेल खाती है। उदाहरण के लिए, जब किसी खिलाड़ी को उकसाया जाता है, तो वे जवाबी कार्रवाई करते हैं; जब उकसाया नहीं जाता, तो वे सहयोग करते हैं।

4. The Nash Equilibrium

नैश इक्विलिब्रियम का नाम अर्थशास्त्री जॉन नैश के नाम पर रखा गया है, जिन्होंने दावा किया था कि अत्यधिक प्रतिस्पर्धी खेलों में एक “संतुलन” मौजूद होता है, जहां दिशा बदलने से किसी भी पक्ष को फायदा नहीं होगा।

दो या दो से अधिक प्रतिभागियों के साथ एक खेल, जो प्रत्येक अपने लिए सबसे बड़ा परिणाम पसंद करता है, का एक निष्कर्ष होता है जिसे नैश संतुलन के रूप में जाना जाता है। इस संतुलन को प्राप्त करने के लिए प्रतिभागियों को अन्य खिलाड़ियों के व्यवहार को ध्यान में रखना चाहिए।

हम कैदी की दुविधा खेल सिद्धांत का उपयोग करके दोनों कैदियों द्वारा लिए गए निर्णयों का नैश संतुलन निर्धारित कर सकते हैं:

  • यदि कैदी 2 स्वीकार करता है, तो कैदी 1 की कार्रवाई का सबसे अच्छा तरीका स्वीकार करना है, क्योंकि यदि वे अपराधों पर विवाद करते हैं, तो कैदी 1 को 9 साल की सजा सुनाई जाएगी।
  • यदि कैदी 2 अपराधों से इनकार करता है, तो कैदी 1 की सबसे बड़ी कार्रवाई इसी तरह केवल 2 साल की सज़ा पाने से इनकार करना है।

इसलिए, यदि कोई कैदी स्वीकार करता है या इनकार करता है तो नैश संतुलन तक पहुंच जाएगा।

इसके अलावा, जैसा कि पहले उल्लेख किया गया था, कोई भी कैदी यह अनुमान नहीं लगा सकता कि दूसरा क्या करेगा, सबसे खराब स्थिति को रोकने के लिए सबसे प्रभावी रणनीति को स्वीकार करते हुए।

किसी खेल में कभी-कभी एक नैश संतुलन हो सकता है, लेकिन कैदी की दुविधा से पता चलता है कि अक्सर एक से अधिक भी हो सकते हैं।

बार-बार खेले जाने वाले एक साथ खेलों में अंततः असंख्य संतुलन पाए जाते हैं।

नैश इक्विलिब्रियम को “कोई पछतावा नहीं” के रूप में भी संदर्भित किया जा सकता है, क्योंकि चुनाव करने के बाद, खिलाड़ी नतीजों का मूल्यांकन करते समय उस पर पीछे मुड़कर नहीं देखेगा। संतुलन प्राप्त करने में आम तौर पर कुछ समय लगता है; एक बार यह हो जाए तो इसे बदला नहीं जा सकता।

यदि कार्रवाई के वैकल्पिक पाठ्यक्रम पर विचार करने से ऐसी परिस्थिति नहीं बनती है जो तर्क बनाती है, तो व्यक्ति ने नैश संतुलन हासिल कर लिया है।

5. What is the purpose of game theory?

दुविधा वाले खेलों के अलावा, Game Theory का उपयोग जीवन के कई पहलुओं में किया जा सकता है। दैनिक जीवन में उपयोग के उदाहरणों में शामिल हैं:

  • युद्ध रणनीतियाँ और संघर्ष विश्लेषण
  • शेयरधारक और बाजार शेयर
  • व्यापार रणनीति
  • रॉक, पेपर, कैंची खेल
  • शतरंज
  • पोकर

उदाहरण के लिए, जब भी Game Theory को व्यवसाय में लागू किया जाता है तो एक विशिष्ट परिणाम प्राप्त करने की क्षमता कई रणनीतिक निर्णयों द्वारा नियंत्रित होती है।

व्यवसाय कर सकते हैं:

  • आउटपुट और कीमत के बारे में चुनाव करें
  • उत्पादों के बारे में चुनाव करें, जैसे कि मौजूदा मॉडल को जारी रखना है या नए मॉडल बनाना है।
  • उत्पादों को बढ़ावा देने के तरीके के बारे में निर्णय लें, जैसे कि अपना विज्ञापन बजट बढ़ाना है या घटाना है।
  • अपने रणनीतिक निर्णयों से विभिन्न लाभ प्राप्त करें, जिनमें वित्तीय लाभ, जीवित रहने की संभावना में वृद्धि और प्रतिस्पर्धियों का खात्मा शामिल है।

6.  Problems with Game Theory

Game Theory के साथ मूल मुद्दा यह है कि यह इस आधार पर स्थापित किया गया है कि लोग अधिकांश अन्य आर्थिक सिद्धांतों की तरह तर्कसंगत, स्वार्थी, उपयोगिता-अधिकतम करने वाले अभिनेता हैं। सामाजिक प्राणी बनने के कारण, हम अक्सर व्यक्तिगत हानि होने पर भी सहयोग करते हैं। वास्तविकता यह है कि सामाजिक परिवेश और प्रतिभागियों के आधार पर हम कभी-कभी नैश संतुलन में प्रवेश करते हैं और कभी-कभी नहीं, गेम थ्योरी द्वारा समझाया नहीं जा सकता है।

इसके अलावा, Game Theory को अक्सर भक्ति, निष्पक्षता या सहानुभूति जैसी मानवीय विशेषताओं पर विचार करना मुश्किल लगता है। सांख्यिकीय और गणितीय गणनाएँ कार्रवाई का इष्टतम तरीका निर्धारित कर सकती हैं, लेकिन बलिदान या हेरफेर सहित अप्रत्याशित और जटिल स्थितियों के कारण मनुष्य एक अलग रास्ता चुन सकते हैं। जबकि गेम थ्योरी क्रियाओं के एक सेट का मूल्यांकन कर सकती है, लेकिन यह मानव व्यवहार की सटीक भविष्यवाणी नहीं कर सकती है।

Conclusion

गेम थ्योरी अध्ययन करती है कि खिलाड़ी का व्यवहार और प्रतिस्पर्धी तकनीकें किसी स्थिति के परिणाम को कैसे प्रभावित कर सकती हैं। उदाहरण के लिए, गेम थ्योरी का उपयोग व्यवसाय में रणनीतिक अंतःक्रियाओं का वर्णन करने के लिए किया जाता है जहां एक फर्म या सामान की सफलता अन्य संगठनों या सामानों द्वारा लिए गए निर्णयों पर निर्भर करती है और युद्ध, जीव विज्ञान और जीवन के कई अन्य क्षेत्रों पर लागू होती है।

Leave a Comment

Your email address will not be published. Required fields are marked *