نظرية اللعبة: ألعاب بايزي

ألعاب بايزي هي من أسس نظرية اللعبة. تتميز ألعاب بايزي بوضعية مختلفة وهي أن بيانات اللعبة ليست معروفة لجميع اللاعبين. يسمح ذلك بظهور مفاهيم جديدة مثل المعلومات الخاصة والمعلومات السرية. عندما يمتلك لاعب معلومات خاصة، فهو الوحيد الذي يعرف هذه المعلومات، وجميع اللاعبين يدركون معرفته بها. من ناحية أخرى، فإن المعلومة تكتسب سريتها من عدم معرفة جميع اللاعبين الآخرين لمعرفته بها.

فكرة هامة في ألعاب بايزي هي فكرة “النوع”. فبيانات اللعبة غير معروفة عمومًا للاعبين. ويمكن النظر إلى جميع البيانات التي تؤثر على استفادة اللاعب على أنها حالة من الطبيعة (الإجراءات، وتحقيق متغير عشوائي).

قد يكون إطار التعلم غير قابل للتطبيق، وفي هذه الحالة، لن يتلقى اللاعبون عينات أو ردود فعل من بيئتهم، مما يمنعهم من التعلم من التجربة. كما تمتلك ألعاب بايزي بعض الميزات الخاصة التي قد تؤدي إلى استنتاجات مفاجئة يصعب استخلاصها في الألعاب الأخرى حتى مع معلومات وافية.

تعريف

ألعاب بايزي (المعروفة أيضا باسم ألعاب المعلومات غير المكتملة) هي نماذج لحالات اتخاذ قرار تفاعلية يمتلك فيها صناع القرار (اللاعبين) معلومات جزئية فقط عن بيانات اللعبة وحول لاعبين آخرين. هذه هو عادة الأطروحة التي نواجهها وبالتالي يمكن استنتاج أهمية الموضوع من الافتراض الأساسي لنظرية اللعبة الكلاسيكية التي بموجبها تصبح بيانات اللعبة هي المعرفة المشتركة بين اللاعبين.

تكمن أهمية ألعاب بايزي في توفيرها للأدوات والمنهجية اللازمة لاختزال الافتراضات غير قابلة للتصديق. يساعد ذلك في تمكين النمذجة من الأغلبية الساحقة من حالات الحياة الواقعية والتي يمتلك فيها اللاعبين معلومات جزئية فقط حول العوائد. تبين أن هذه المنهجية عميقة ومتطورة، سواء من الناحية المفاهيمية أو الرياضية.

فاعتماد نهج بايزي الكلاسيكي للإحصاءات، يواجه الحاجة إلى التعامل مع التسلسل الهرمي اللانهائي للمعتقدات. فما الذي يعتقده كل لاعب عما يؤمن به اللاعب الآخر (كما ذكرنا في الألعاب السابقة). ليس من المستغرب أن هذه الصعوبة المنهجية كانت عقبة رئيسية في تطوير النظرية، وهذه المقالة مكرسة إلى حد كبير لشرح وحل هذه الصعوبة المنهجية.

اللّعبة هو نموذج رياضي لحالة اتخاذ قرار تفاعلية يتخذها اللاعبين الذين تؤثر قراراتهم في الآخرين. وكان الافتراض الأساسي في الألعاب السابقة هو أن بيانات اللعبة وظروفها والعوائد كانت معروفة لكل اللاعبين. حيث كل لاعب يعرف أن الجميع يعرفون جميع الإجراءات والعوائد. لكن ألعاب بايزي هي نماذج لحالات القرارات التفاعلية حيث كل لاعب لديه معلومات جزئية فقط أو غير مكتملة حول إجراءات اللعبة والمكافئات.

معضلة مأمور البلدة

لفهم الأمر بشكل أكبر، إليك القصة التالية:
في بلدة ما في الغرب الأمريكي القديم، قام مأمور البلدة بمحاصرة متهم (لم تثبت التهمة عليه بعد) يشك المأمور فيما إذا كان هذا الشخص مذنب أم بريء. لكن الوضع على وشك أن يحتدم ويشتعل قتال بالمسدسات “gun fight” بين المتهم والمأمور. وهنا تظهر الاحتمالات للمأمور- مع العلم أن المأمور لا يملك المعلومات الكافية حول المتهم، إذا ما كان مذنب أو لا- لكن علي العكس، يمتلك المتهم معلومات خاصة لا يملكها المأمور ألا وهي أنه يعرف إذا ما كان مذنب فعلًا أم بريء.
نكتب الاحتمالات علي شكل رياضي لتوضيح العائد علي شكل أرقام.

الحالة الأولى: إذا كان المتهم بريء

معضلة مأمور البلدة (إذا كان المتهم بريء)


الحالة الثانية إذا كان المتهم مذنب

معضلة المأمور (إذا كان المتهم مذنب)

ومما تعلمنا سابقًا، ستكون الاستراتيجية المهيمنة للمتهم في حال براءته هي ألا يطلق، والاستراتيجية السائدة إذا كان مذنب أن يطلق النيران تجاه المأمور. ومما تعلمنا سابقًا، ستكون الاستراتيجية المهيمنة للمتهم إذا كان بريء هو أن لا يطلق. والاستراتيجية السائدة إذا كان مذنب أن يطلق.

أما بالنسبة للمأمور، فالأمر معقد لأنه لا يملك المعلومات الكافية. وهنا يبرز توازن بايزي. فبالنظر للاحتمالات الممكنة، تكون أفضل استراتيجية له هي إطلاق النيران على المتهم.

المزادات

أحد اهم تطبيقات العاب بايزي هي المزادات العلنية، حيث هي طريقة قديمة وحالية للظفر ببعض السلع النادرة والقيمة حيث يقوم الأفراد بتقييم تلك السلع.
وفي هذا الموقف تكون المعلومات غير مكتملة، حيث التقدرات بين المشترين المختلفين غير معروفة.
هنالك عدة طريق لإدارة المزدات منها:
“التسعير على أعلى سعر في المظاريف المغلقة – First price sealed bid”: حيث يقدم كل المشترين تسعيراتهم في ظرف مغلق ويتم اختيار صاحب أعلى تسعير ليدفع التسعير الأعلى. (لو أعلى سعر هو 10 عملات فالفائز يدفع 10 عملات)
“التسعير على ثاني أعلى سعر في المظاريف المغلقة- Second price sealed bid”: نفس فكرة الأسلوب الفائت إلا أنه صاحب أعلى تسعير يقوم بدفع ثاني أعلى تسعير تم تقديمه. (لو أعلى تسعر هو 10 عملات وثاني أعلى تسعير هو 7 عملات يقوم من قدم عرض ال 10 عملات بدفع 7 عملات).
وهنا يبرز بشكل واضح تأثير العاب بايزي، حيث المعلومات غير مكتملة وكل مشتري لا يملك معلومات عن تسعيرة المشتري الآخر.

ختام الرحلة

وبهذا نكون قد أتممنا رحلتنا خلال مساق كان بالشيق والممتع كما استفز خلايا أدمغتنا بشكل كبير. ويمكننا القول بأن نظرية اللعبة هي لغة الاقتصاد وينتشر تأثيرها وتطبيقاتها في علوم أخرى.

ونختتم هنا بمقولة:

“الشيء الوحيد الأكبر من قوة العقل هو شجاعة القلب”

جون ناش




نظرية اللعبة: الاستراتيجية المختلطة

مصادر

1-coursera

2-sciencedirect

3-springer

4- MIT

نظرية اللعبة: الاستراتيجية المختلطة

هذه المقالة هي الجزء 5 من 5 في سلسلة مقدمة في نظرية اللعبة

الاستراتيجية المختلطة هو توزيع احتمال واحد يستخدم للاختيار عشوائيًا بين الإجراءات المتاحة من أجل تجنب توقعها. في نظرية اللعبة، تعتمد الاستراتيجية المختلطة على استخدام كل لاعب في اللعبة للاستراتيجية المختلطة التي هي الأفضل بالنسبة له ضد الاستراتيجيات التي يستخدمها اللاعبون الآخرون. وفي التجارب المختبرية، كان سلوك الأشخاص عديمي الخبرة غير متسق عمومًا مع النظرية من جوانب هامة؛ لكن البيانات التي تم الحصول عليها من المسابقات في الرياضات يتوافق بشكل وثيق مع النظرية.

في العديد من الحالات الاستراتيجية، يعتمد نجاح اللاعب على تصرفاته التي لا يمكن التنبؤ بها. الرياضات التنافسية مليئة بالأمثلة. واحدة من أبسط الأمثلة هي ما يحدث مرارًا وتكرارًا في كرة القدم. إذا كان مُسدد ركلة الجزاء يعرف أي جانب سيختاره حارس المرمى فسيركل الكرة في الجانب الآخر، وإذا عرف حارس المرمى إلى أي جانب سيركل اللاعب الكره فيه، فسيختار هذا الجانب للتصدي لها بالطبع. في ضوء نظرية اللعبة، احتمالات 2×2 بسيطة وليس لها استراتيجية نقية.

مفهوم الاستراتيجية المختلطة

قدم فون نيومان مفهوم الاستراتيجية المختلطة باقتراحه وجوب كل لاعب -في مثال كرة القدم لدينا- اختيار التسديد على اليسار أو اليمين بشكل عشوائي، ولكن وفقًا لبعض العمليات الثنائية الخاصة. كل لعبة لشخصين محصلتها صفر، حيث تكون مجموعة الاستراتيجيات المتاحة لكل لاعب محدودة ويجب أن يكون لها قيمة (أو مستوى أمان) لكل لاعب، ويجب أن يكون لكل لاعب استراتيجية واحدة على الأقل – وهي استراتيجية تؤكد أنه بغض النظر عن كيفية لعب خصمه، فإنه سيحقق على الأقل مستوى أمانه للعبة، وسيحقق القيمة المتوقعة. في العديد من هذه الألعاب استراتيجيات “minimax” -أي أقل الخسائر الممكنة- وهي استراتيجيات نقية، لا تتطلب أي خلط. أما في بلدان أخرى، فتعتمد الاستراتيجيات المختلطة.

كما ذكرنا من قبل، قدم جون ناش (1950) فكرة قوية عن التوازن في الألعاب، والتوازن هو مزيج من الاستراتيجيات (واحدة لكل لاعب) حيث استراتيجية كل لاعب هي أفضل استراتيجية بالنسبة له ضد الاستراتيجيات التي يستخدمها جميع اللاعبين الآخرين. وبالتالي فإن التوازن هو مزيج مستدام من الاستراتيجيات، بمعنى أنه لا يوجد لاعب لديه حافز للتغيير من جانب واحد إلى استراتيجية مختلفة. والتوازن بين الاستراتيجيات المختلطة هو التوازن الذي يستخدم فيه كل لاعب استراتيجية مختلطة.

لعبة “تقاسم أو اسرق”

مثال أو اثنين سيكون مفيدا. النظر أولا في لعبة ” تقاسم أو اسرق ” سابقًا. هناك اربع نتائج محتملة: الأول هو أن يختار كلاهما مشاركة الجائزة وبالتالي يتقاسما المال. الثاني هو أن يختار أحدهما أن سرقة الجائزة والآخر يختار تقاسم الجائزة أو العكس، وبالتالي يحصد الشخص الذي اختار سرقة الجائزة كل شيء. الثالث هو أن يختار كلاهما عدم مشاركة الجائزة وبالتالي يخسر كلاهما كل شيء. إن تحديد استراتيجيات اللاعبين المحتملة بشكل كامل أمر معقد إلى حد ما، ولكن أي شخص لعب اللعبة أكثر من بضع مرات يعرف أن كل لاعب لديه استراتيجية تضمن له التعادل بحد أدنى. هذه هي استراتيجية “minimax” . نظرًا لأنها استراتيجيات نقية (لا تتطلب خلطًًا)، فإن لا تناسب لعبة تقاسم أو اسرق.

نمط تسديد ضربات الجزاء

لننظر في بعض البيانات التي جمعها إغناسيو بالاسيوس هويرتا، في عام 2003. حيث قام بتحليل عدة مباريات مختلفة سجلها من التلفزيون، وجمع 1417 ركلة جزاء في الدوري الاسباني، والانجليزي، والايطالي.

تتبع إغناسيو ما إذا كان اللاعبون يركلون إلى اليسار، أو إلى الوسط، أو إلى اليمين. وما إذا كانوا يستخدمون ساقهم اليسرى أو ساقهم اليمنى.

وجد إغناسيو أن في الحالات التي يسدد اللاعب يسارًا ويذهب الحارس يسارًا، ينجح المسدد وتمر الكرة وتسكن الشباك بنسبة 58%، بينما ينجح تصدي حراس المرمى في 42٪ من الركلات. وفي الحالات التي يسدد فيها اللاعب إلى اليسار ويذهب حارس المرمى يمينًا، ينجح المُسدد بنسبة 95٪ وتسكن ركلته الشباك. لكن إذا كان الاعب يسدد إلى اليمين وذهب حارس المرمى إلى اليسار، فإن المسدد يحرز الهدف في 93 ٪ من الركلات. هذه هي الأرقام الفعلية، ونرى بعض النمط والأسس هنا.

نظرية اللعبة في كرة القدم

بناءً على هذه المعطيات، تقوم العديد من الأندية واللاعبين بتعيين متخصصين وباحثين اقتصاد ورياضيات لمساعدتهم تحقيق أكبر استفادة ممكنة والخروج بأقل الخسائر بالاعتماد على نظرية اللعبة ومحاولة تطويعها في مصلحتهم.

نظرية اللعبة : الاستراتيجية المهيمنة I نظرية اللعبة: ألعاب بايزي

المصادر
1-springer
2-coursera
3-palacios-huerta

مقدمة في نظرية اللعبة

هذه المقالة هي الجزء 1 من 5 في سلسلة مقدمة في نظرية اللعبة

ما هي نظرية اللّعبة ؟

سيوفر هذا المساق الأساسيات التي تبني عليها نظرية اللّعبة مثل: تمثيل الألعاب والاستراتيجيات، والشكل الواسع (الذي يسميه علماء الكمبيوتر أشجار الألعاب)، “وألعاب بايزي- Bayesian games” (مثل المزادات)، والألعاب المتكررة والعشوائية، وأكثر من ذلك. سنقوم بتضمين مجموعة متنوعة من الأمثلة بما في ذلك الألعاب الكلاسيكية وعدد من التطبيقات. قد ترى تلك المفاهيم معقدة، لكنك ستكون فكرة مُبسطة عنها عند انتهائك من المساق.

تعريف

على عكس ما نعتقد بمصطلح “الألعاب”، مثل الشطرنج والبوكر وكرة القدم، وما إلى ذلك، فإن نظرية اللعبة تتضمن دراسة وتحليل اتخاذ القرارات مع أخذ تحركات الخصوم بعين الاعتبار والتنبؤ بها. وقد تتضمن تحليل الصراعات بين الدول، والحملات السياسية، والمنافسة بين الشركات، والسلوك التجاري في الأسواق مثل البورصات العالمية. ولتوضيح الموضوع بشكل أكبر، نحتاج إلى تخيل لعبة بسيطة وتطبيقها.

لعبة قاسم أو اسرق

سنأخذ مثال بلعبة الثقة، وشرحها كالآتي. تعتمد اللعبة على وجود جائزة مالية كبيرة، وفردان يحاولان الحصول عليها. وطريقة الحصول عليها بسيطة، وهي عن طريق الاختيار بين إذا ما كنت تريد تقاسم الجائزة مع الفرد الآخر أو تريد أخذها لنفسك.

الاحتمالات الممكنة

  • الأول هو أن يختار كلاهما مشاركة الجائزة وبالتالي يتقاسما المال.
  • الثاني هو أن يختار أحدهما سرقة الجائزة، والآخر يختار تقاسم الجائزة، وبالتالي يحصد الشخص الذي اختار سرقة الجائزة كل شيء.
  • الثالث هو أن يختار كلاهما سرقة الجائزة وبالتالي يخسر كلاهما كل شيء.
Split or steal game

تساؤولات مهمة

من خلال تلك اللعبة هنالك بعض الأسئلة التي تحتاج أن تفكر بها وتستكشف إجاباتها خلال السلسلة. وستكتشف أيضًا علاقة تلك التساؤولات بنظرية اللعبة:

  • ما هو القرار الذي يجب أن يتخذه كل فرد من وجهة نظرك؟
  • هل تتوقع أن يتصرف الأفراد بشكل متماثل في هذه اللعبة؟
  • ما هو القرار الذي يجب أن يتخذه كل فرد لضمان الجائزة؟
  • في حال تعديل بعض قوانين اللعبة بحيث تختلف نسبة المكسب أو الخسارة، هل ستختلف القرارات؟
  • إذا تم السماح بالتواصل بين اللاعبين قبل لعب لعبة الثقة، هل سيغير هذا شيئًا من قرارات المباراة؟
  • في حال إذا قام نفس الفردين باللعب عدة مرات أمام بعضهما البعض، هل سيغير ذلك من قراراتهم؟
  • إذا ما كان المنافس شخص عقلاني أو يطمح للفوز بشتى الطرق، هل سيغير ذلك من شيء؟

قد ترى تلك اللّعبة والتساؤولات لا معنى لهم لكنهم الأساس الذي ستبنى عليه نظرية اللّعبة.

المصادر

1- Game Theory | Coursera
2- Oxford University Press’s

نظرية الألعاب التطورية

نظرية الألعاب التطورية

ما هي نظرية الألعاب؟

هل بوسعك أن تحلل جميع المشاكل الاجتماعية والاقتصادية مستخدمًا إطار وحيد؟

نظرية الألعاب هي فرع من فروع الرياضيات توفر أدوات لتحليل المواقف التي يتخذ فيها اللاعبين قرارات معينة، إذ تصف النظرية القرارات المُثلى للاعبين الذين قد يكون لديهم اهتمامات متشابهة أو متعارضة أو مختلطة وتصنف نتائج تلك القرارات، وتعتمد على استراتيجيات الأفراد الآخرين، ولا يتحكم أي فرد في قرار الأخر.

طُبقت نظرية الألعاب على علوم عدة من العلوم الاجتماعية الإنسانية وعلوم الهندسة الطبيعية. إذ تهتم نظرية الألعاب بالمشاكل الاجتماعية، إذ أنك لست الوحيد المتخذ لقرار ما لانك تتعامل مع آخرين. كل منهم يعتمد على تصرف الخصم. لذلك فإن نظرية الألعاب تتبنى نماذج رياضية لتتنبأ كيف سيتصرف الناس في مثل هذه المواقف الاستراتيجية، فالنظرية تدرس سلوك الناس في المواقف الاستراتيجية.

أمثلة توضيحية

لكن دعني عزيزي القارئ أوضح موضوع نظرية الألعاب، لذا سأطرح عليك سؤالين في البداية:

السؤال الأول، هناك حملة سياسية بين الديموقراطيين والجمهوريين، فمن الذي سيفوز؟ وكيف ستدار سياسة كل منهما؟

السؤال الثاني: ماذا يحدث لو انشأنا طريق جديد بين س وص كيف سيؤثر ذلك على المرور على الطريق الحالي وكيف توفر وقت السفر بين س و ص؟

نظرية الألعاب تقدم لك طريق موحد لكل المشاكل الاجتماعية، فيمكنك وضع العراك السياسي بين الحزبين عن هيئة نموذج رياضي بسيط.

في المثالين السابقين، ستعتمد على حدسك لتجد الإجابة فبذلك تجد نهج موحد يمكن تطبيقه على جميع المشاكل الاجتماعية، فالمشترك بين كل المسائل الاجتماعية هو أن الافراد يحاولون عمل أفضل ما بوسعهم ضد الاخرين ولكن هناك قواعد واجب الالتزام بها كمثال المعركة بين الديموقراطيين والجمهوريين، يمكنهم نداء الناس من خلال منصتهم ولكن لا يمكنهم رشوتهم! لذا فكل مشكلة اجتماعية لديها قواعد.

المشاكل الاجتماعية في قالب رياضي

لنصيغ الآن المشاكل الاجتماعية في شكل نموذج رياضي للعبة، لماذا سنحتاج برأيك؟

نحتاج أن نحدد ثلاث عناصر:

‏الأول: يجب أن نحدد من سيشارك في المسألة/المشكلة الاجتماعية وهم اللاعبون.

‏الثاني: يجب أن تحدد ما يستطيع كل لاعب أن يفعله في المسألة الاجتماعية وما ستحدده يُسمى “الإستراتيجية”، أي لاعب في مسأله اجتماعية يتخذ استراتيجية معينة.

الثالث: تحدد نتائج كل لاعب.

هذه الإستراتجيات ستوضح لنا ما هي نظرية الألعاب التطورية ولكن دعنا نتعرف على العلاقة بين النظرية وعلم الأحياء التطوري.

الحصول على الغذاء

يستخدم علماء الأحياء نظرية الألعاب لتوضيح النتائج التطورية للتفاعلات، إذ يحاول علماء البيئة التطوريون فهم العلاقات السلوكية المعقدة بين الكائنات الحية أثناء تفاعلها للحصول على الموارد (غذائها). إذ تتراوح هذه التفاعلات من العدائية إلى التعاونية، وتحدث أيضًا حالات استغلال وإيثار.

يستثمر الكائن الحي طاقته في مواجهاته اليومية مع غيره من الحيوانات، كما يسثتمرها أيضًا في التعاون مع أفراد نوعه للحصول على الموارد الغذائية المختلفة، مما يجعله يستهلك طاقة للحصول على الطاقة. كما أن تجنب الكائن الحي لاستهلاك الطاقة يمكن أن يكون مكلفًا إذا فَنيت الطاقة ولم يصل الكائن إلى الموارد التي استثمر فيها طاقته مثل ركضه خلف حيوان أسرع منه أو صعوده شجره صعبة للوصول لثمرة في مكان عال.

الطاقة التي تُستغل هي تكلفة على الكائن الحي، والموارد هي الفوائد. تؤدي استراتيجيات التفاعل المختلفة مثل القتال أو التعاون إلى مكافآت مختلفة بناءً على طبيعة التفاعل.

الأعلى لياقة هو من يفوز!

يتعامل علماء البيئة التطورية مع هذه الاستراتيجيات (ولنرجع هنا لإستراجيات النظرية الموضوعة في قالب رياضي ولاحظ التشابهة) على أنها أنماط ظاهرية. تعمل الكائنات الحية الأكثر نجاحًا على زيادة مواردها وزيادة قدرتها على التكاثر. إذ يتميز الكائن الذي يتمتع بأفضل استراتيجية تفاعل بأعلى لياقة. نظرًا لأن استراتيجية التفاعل (النمط الظاهري) يمكن أن ترتبط ارتباطًا مباشرًا باللياقة، إذ يتم تفضيل الاستراتيجية المُثلى في ظل الانتقاء الطبيعي.

يمكن التعامل مع التفاعلات بين الكائنات الحية ذات الاستراتيجيات المتنافسة أو المتطابقة على أنها ألعاب مع لاعبين متعددين. نظرًا لأن التفاعلات البيولوجية تشمل اثنين أو أكثر من صناع القرار (أي الأفراد الذين لديهم استراتيجيات).

كيف بدأت نظرية الألعاب التطورية؟

تم تطوير نظرية اللعبة التطورية لأول مرة بواسطة «رونالد فيشر_Ronald Fisher». أثناء محاولته لشرح المساواة التقريبية لنسبة الجنسين (نسبة الذكور إلى الإناث) في الثدييات. كان اللغز الذي واجهه فيشر هو لماذا تتساوى نسبة الجنسين تقريبًا في العديد من الأنواع. إذ لا تتزاوج غالبية الذكور مطلقًا؟

في هذه الأنواع، يبدو أن الذكور غير المتزوجين هم عبء زائد يحمله بقية السكان، وليس لهم فائدة حقيقية. أدرك فيشر أنه إذا قمنا بقياس اللياقة الفردية من حيث العدد المتوقع للأحفاد. سنجد أن اللياقة الفردية تعتمد على توزيع الذكور والإناث في السكان. عندما يكون هناك عدد أكبر من الإناث في السكان. يكون لدى الذكور لياقة فردية أعلى، وعندما يكون هناك عدد أكبر من الذكور في السكان، تتمتع الإناث بلياقة فردية أعلى.

أشار فيشر إلى أنه في مثل هذه الحالة، تؤدي الديناميكيات التطورية إلى أن تصبح نسبة الجنس ثابتة عند أعداد متساوية بين الذكور والإناث.

حقيقة أن اللياقة الفردية تعتمد على التكرار النسبي للذكور والإناث في السكان تُقدم عنصرًا استراتيجيًا في التطورات. يمكن فهم حجة فيشر من الناحية النظرية، لكنه لم يذكرها بهذه المصطلحات.

قدم «ريتشارد ليوونتين-Richard Lewontin» عام 1961 أول تطبيق صريح لنظرية اللعبة في علم الأحياء التطوري في “Evolution and the Theory of Games”. حدد «ماينارد سميث-Maynard Smith» في عام 1972 مفهوم الاستراتيجية التطورية المستقرة.

ظهر بحث ماينارد سميث الأساسي “التطور ونظرية الألعاب” في عام 1982، ومن بعده بوقت قصير عمل «روبرت أكسلرود-Robert Axelrod» الشهير “تطور التعاون” في عام 1984. ومنذ ذلك الحين، تزايد اهتمام الاقتصاديين وعلماء الاجتماع بالنظرية.

نهجان لنظرية الألعاب التطورية

النهج الأول مستمد من عمل ماينارد سميث وبرايس ويستخدم مفهوم الاستراتيجية المستقرة تطوريًا كأداة رئيسية للتحليل.

يبني النهج الثاني نموذجًا واضحًا للعملية التي يتغير بها تواتر الاستراتيجيات في السكان ويدرس خصائص الديناميكيات التطورية ضمن هذا النموذج.

وبالتالي يمكن أن يوفر النهج الأول تحليلًا مفاهيميًا ثابتًا للاستقرار التطوري. “ثابت” لأنه على الرغم من تقديم تعريفا ت الاستقرار التطوري، فإن التعريفات المتقدمة لا تشير عادةً إلى العملية الأساسية التي تتغير بها السلوكيات (أو الاستراتيجيات) في السكان. على العكس من ذلك، لا يحاول النهج الثاني تحديد مفهوم الاستقرار التطوري. بمجرد تحديد نموذج لديناميكيات السكان، يمكن تطبيق جميع مفاهيم الاستقرار القياسية المستخدمة في تحليل الأنظمة الديناميكية.

تزداد أهمية نظرية الألعاب التطورية مع مرور الوقت وأصبحت ذات أهمية قصوى لدى الاقتصاديين وعلماء الاجتماع وعلماء الأنثروبولوجيا وكذلك الفلاسفة. اهتمام علماء الاجتماع بها مثلًا مربوط بالتطور الذي عالجته نظرية الألعاب وليس من الضروري أن يكون تطورًا بيولوجيًا.

المصادر
Sciencedirect
Nature
Cousera

نظرية اللعبة: اللعب التعاونية

هذه المقالة هي الجزء 4 من 5 في سلسلة مقدمة في نظرية اللعبة

نظرية اللعبة: اللعب التعاونية

وظفت إحدى الشركات تسنيم (مصممة غرافيك) ومحمد (مبرمج) من أجل بناء موقع إلكتروني لها. تمنح الشركات المصممين غالبًا ١٢٠ دولار بينما تمنح المبرمجين ١٥٠ دولار، إلا أن الأمر مختلف بالنسبة لتسنيم ومحمد، لأنهما سيعملان كفريق الآن. ستمنحهما الشركة ٣٠٠ دولار. فكيف سيقوم الاثنان بتقسيم المبلغ بينهما؟

من منظور نظرية اللعبة، يعتبر محمد وتسنيم لاعبان في «لعبة تعاونية-Cooaporative Game» مفادها تقسيم المكافأة. لحل مسألة التقسيم هذه، ستستعمل نظرية اللعبة «قيم شابلي- Shapley Values» ومفهوم آخر يعرف بـ «المساهمة الهامشية-Marginal Contribution».

قيم شابلي والمساهمة الهامشية

المساهمة الهامشية للاعب هي ما يضيفه هذا اللاعب على المجموع. بطريقة أخرى، إذا عمل محمد وحده على البرمجة فسيحصل على ١٥٠ دولار، لكن إذا أضيفت تسنيم إلى الفريق، سيحصل الاثنان على ٣٠٠ دولار. في هذه الحالة تكون المساهمة الهامشية لمحمد ١٥٠ دولار، ولتسنيم ١٥٠ دولار أيضا.

بنفس الطريقة، إذا عملت تسنيم وحدها ستحصل على ١٢٠ دولار، لكن ما أن يضاف محمد إلى الفريق، يحصل الاثنان على ٣٠٠ دولار. مما يعني أن المساهمة الهامشية لتسنيم تقدر ب ١٢٠ دولار، ولمحمد ب ١٨٠ دولار.

لتحديد المبلغ الذي سيحصل عليه كل من تسنيم ومحمد، سنقوم بحساب قيمة شابلي لكل لاعب ولذلك يكفي ضرب كل مساهمة هامشية ممكنة باحتمالية وقوع هذه المساهمة. فمثلا في حالة تسنيم، نقوم بضرب ١٢٠ ب ١/٢، و١٥٠ ب ١/٢، ثم نقوم بحساب المجموع فنحصل على ١٣٥. بنفس الطريقة يحصل محمد على ١٦٥ دولار (لحساب قيمة شابلي، توجد صيغة رياضية أكثر عمومًا نناقشها بالتفصيل في مقال قادم). لاحظ أن مجموع القيمتين يساوي ٣٠٠ دولار.

مسألة الانتخابات كلعبة تعاونية

تهدف هذه المسألة إلى معرفة تأثير كل حزب على نتائج الانتخابات البرلمانية. يتكون البرلمان من ١٠٠ عضو من ٤ أحزاب موزعة كما يلي: ٤٥، ٢٥، ١٥، ١٥ عضوًا. ما قيمة تأثير كل حزب على النتائج إذا تم اعتماد مبدأ الأغلبية (٥١ صوتا على الأقل للمصادقة على القرار) في حالة المصادقة على قرارٍ ما؟ قد تظن أن الإجابة هي: ٤٥٪، ٢٥٪، ١٥٪، ١٥٪. إلا أن استعمال قيم شابلي يظهر نتائج أخرى.

نظرًا لعدد اللاعبين (٤ أحزاب)، سنستعمل هذا الموقع الذي يقوم بحساب قيمة شابلي لكل لاعب، فيكفي إدخال نتيجة التحالفات الممكنة للاعبين. فمثلا، إن تحالف الحزب الأول (٤٥ صوتًا) مع الثاني (٢٥ صوتًا) ، فحتمًا سيتم قبول القرار ولن نحتاج إلى أصوات الآخرين. من جهة أخرى، مجموع صوت أعضاء الحزب الثالث والرابع فقط (١٥، ١٥ صوتًا)، وهو عدد لا يؤدي إلى المصادقة على القرار. سنشير إلى حدث المصادقة على القرار بالقيمة 1، بينما لعدم المصادقة بالقيمة صفر.

بعد ملء الجدول في الموقع، يتبين لنا أن قيمة تأثير الأحزاب هي: ٥٠٪ (٤٥ عضوًا)، ١٦.٦٧٪ (٢٥ عضوًا) ، ١٦.٦٧٪ (١٥ عضوًا) و١٦.٦٧٪ (١٥ عضوًا). هذا راجع إلى العدد الكبير للأصوات للحزب الأول، لكنه بالأساس يعود إلى ضعف عدد أصوات الأحزاب الأخرى.

وأخيرًا بعد أن تطرقنا لمشكلة تقسيم المكافأة ومسألة الانتخابات، لا بد أنك تستطيع التفكير في مواقف تدفعك لاستعمال النظرية في حياتك اليومية (تقسيم جائزة مالية مع باقي أعضاء الفريق، ملاحظة تأثير أصوات دول حق الفيتو في منظمة الأمم المتحدة). ترقب مزيدًا عن اللعب التعاونية وتطبيقاتها في المقال القادم.

اقرأ أيضًا عن نظرية اللعبة

المصادر:

Coursera
Ucdavis
UBC

ما هي نظرية اللعبة ؟

هذه المقالة هي الجزء 2 من 5 في سلسلة مقدمة في نظرية اللعبة

ما هي نظرية اللعبة ؟

تخيل أن الشرطة ألقت القبض على سجينين من أجل جريمة اقترفاها معًا. استُجوِب السجينان على انفراد، حيث عرضت الشرطة عليهما ما يلي:

  •  إذا اعترف أحدهما باقتراف الجريمة بينما لم يعترف الآخر، سيحظى المعترف بالحرية في حين سيُحكم على الآخر ب10 سنوات في السجن.
  •  إذا اعترف كلاهما، سيقضي كل منهما 4 سنوات في السجن.
  •  إذا لم يعترف أي منهما، سيُحكم عليهما بسنتين في السجن.

تصور أنك أحد السجينين، ما القرار الذي ستتخذه علمًا أنك لن تتمكن من معرفة قرار السجين الآخر؟ إذا بدا الأمر محيرًا، لا تقلق، فنظرية اللعبة مصممة لتساعدك. و تسمى هذه المشكلة بـ «معضلة السجين-Prisoner’s Dilemma» وهي من أشهر الأمثلة على تطبيق نظرية اللعبة. 

ما هي نظرية اللعبة؟

تدور نظرية اللعبة حول دراسة التفاعلات بين اللاعبين. يمكن للاعبين أن يكونوا أنت مقابل شركة تستهدفك لتشتري منتجاتها، أو بلدان في حرب ما بينهما، أو شركات تتنافس على الأسواق. فنظرية اللعبة تدرس اتخاذ القرارات مع وضع الخصوم وتحركاتهم بعين الاعتبار.

أساسيات نظرية اللعبة

تدور نظرية اللعبة حول مفهوم اللعبة. اللعبة هي أي تفاعل بين لاعبين أو أكثر وتعتمد نتائجها على تحركات اللاعبين. اللاعبون هم متخذو القرارات، وتتحكم قراراتهم وقرارات اللاعبين الآخرين في محصلتها التي قد تكون إيجابية أو سلبية. فإذا أخذنا على سبيل المثال معضلة السجين، قد يكون اللاعبان هما السجينين، وتحركاتهما هي الاعتراف أم الإنكار، والمكافأة تكون عدد السنوات في السجن، وبالطبع أفضلها هي 0 سنوات لينال أحدهما الحرية.

«الاستراتيجية المهيمنة-Dominant Strategy» و«الاستجابة المُثلى-Best response»

في نظرية اللعبة، يُعرف الاستجابة المثلى بأنها أفضل تحرك يمكن للاعب أن يختاره مقابل تحرك محدد للخصم. فإذا عدنا إلى معضلة السجين وأخذنا تحرك الاعتراف كمثال، سيكون الاعتراف أفضل استجابة يقوم بها أي سجين لأنه إذا لم يعترف، سيقضي عشر سنوات في السجن في الوقت الذي يستمتع فيه السجين الآخر بالحرية. 

إضافة إلى الاستجابة المثلى، تعتبر الاستراتيجية المهيمنة من أهم مفاهيم نظرية اللعبة. وتختلف الاستراتيجية المهيمنة عن الاستجابة المثلى في عدم اعتمادها على تحرك معين للطرف الآخر. تلزم الإشارة هنا إلى أن الاستراتيجية تشير إلى اختيار اللاعب لتحرك ما.

الاستراتيجية المهيمنة هي الاستراتيجية التي تضمن للاعب نتائج مرضية مهما كان تحرك الخصم. بالعودة لمعضلة السجين، تكمن الاستراتيجية المهيمنة لأي لاعب بالاعتراف أيضًا. ذلك لأن عدم الاعتراف قد يؤدي إلى قضاء 10 سنوات في السجن إذا اعترف الطرف الآخر, بينما يؤدي الاعتراف إما إلى 4 سنوات في السجن مناصفة مع الطرف الآخر، وهذا عادل، أو إلى الحرية، وهذا رائع!

«توازن ناش-Nash Equilibrium»

قبل تعريف توازن ناش، لا بد من الإشارة إلى «ملف تعريف الاستراتيجية-Strategy Profile». ملف تعريف الاستراتيجية يضم استراتيجية محتملة لكل لاعب. فعلى سبيل المثال، (اعتراف اللاعب الأول، عدم اعتراف اللاعب الثاني) و (اعتراف اللاعب الأول، اعتراف اللاعب الثاني) تشكل ملفين من ملفات تعريف الاستراتيجية التي يمكن تسجيلها من معضلة السجين.

يحدث توازن ناش عندما يختار اللاعبون استراتيجياتهم بحيث لا يكون من مصلحتهم تغييرها. إذ أن التغيير قد يتسبب في نتائج غير مرضية. بطريقة أخرى، يحدث توازن ناش عندما نمتلك ملف تعريف استراتيجية حيث أن كل استراتيجية هي الاستجابة المُثلى على الاستراتيجيات الأخرى.

الآن، أصبح من الواضح أن ملف تعريف الاستراتيجية الذي يضم عدم اعتراف كلا اللاعبين لا يحقق توازن ناش. فإذا أخذنا عدم الاعتراف كتحرك، سيكون تحرك الاعتراف الاستجابة المُثلى له لأنه يؤدي إلى الحرية. من جهة أخرى، يتحقق توازن ناش عند اعتراف كلا اللاعبين. ذلك لأن الاعتراف هو الاستجابة المُثلى للاعتراف وليس لأي لاعب المصلحة في عدم الاعتراف إن كان الطرف الآخر سيعترف. فمن يريد قضاء عشر سنوات في السجن؟

ربما لاحظت أننا أشرنا سابقًا إلى أن الاعتراف هو الاستراتيجية المهيمنة لكلا السجينين، وأنها أيضًا تمثل توازن ناش إن اختارها كلا اللاعبين. دعني أخبرك عزيزي القارئ(ة) أن هذه ليست صدفة فأي ملف تعريف استراتيجية يتكون كله من الاستراتيجيات المهيمنة التي يمثلها توازن ناش.

تطبيقات نظرية اللعبة

من تطبيقات نظرية اللعبة بشكل عام ومعضلة السجين بشكل خاص، طريقة عمل الشركات المهيمنة على سوق ما. فإذا تعاونت الشركات فيما بينها، فبإمكانها تحديد سعر عال، وبالتالي حصد أرباح كثيرة. لكن في حال قامت إحدى الشركات بالخروج عن الاتفاق بتخفيض أسعارها، ستحصد أكبر عدد من الزبائن وبالتالي أرباحًا عالية على حساب الشركات الأخرى التي ستخسر زبائنها. أيضًا، إن قررت جميع الشركات المشاركة تخفيض الأسعار، ستنزل الأسعار بشكل كبير، وهو الشيء الذي سيؤدي إلى أرباح قليلة لجميع الشركات.

تطبق نظرية اللعبة أيضًا في مجال البيولوجيا لدراسة تعاون الحيوانات فيما بينها من أجل البقاء، وكذلك في مجال السياسة لدراسة العلاقات الدولية.

أخيرًا، بعد أن تطرقنا لأساسيات نظرية اللعبة وتعرفنا على مفاهيم مثل الاستجابة المُثلى، والاستراتيجية المهيمنة، وتوازن ناش، لا بد أنك أيقنت أن الاعتراف هو أفضل قرار تتخذه إن كنت في وضعية أحد السجينين. إلا أن هذا ليس صحيحًا إذا كانت لديك فرصة للتواصل مع الطرف الآخر، حيث يعتبر عدم الاعتراف هو القرار الأمثل. فقد تتفق مع السجين الآخر على عدم الاعتراف و تقضي سنتين عوض 4 سنوات. في هذه الحالة، أصبحت اللعبة تعاونية. ولنظرية اللعبة وسائل ومفاهيم خاصة بالألعاب التعاونية نكتشفها في المقال التالي.

المصادر:

stanford
coursera
stanford

Exit mobile version