איי!

לפני מספר שנים (ליתר דיוק: ב-11/10/2004) פורסמה בעיתון "הארץ" ידיעה שדיווחה על סקר שביצע המגזין "Physics World" במטרה לדרג את הנוסחאות האהובות על קוראיו. אפשר ללעוג מכאן ועד להודעה חדשה על תחרות יופי שכזו (לטעמי, יופי מתמטי או פיזיקלי מוצא את ביטויו ברעיונות, לא במשוואות) אך מכיוון שברור שהסקר לא לקח את עצמו ברצינות, אין טעם לעשות זאת.

המשוואות הזוכות היו משוואות מקסוול הפיזיקליות (שעליהן לא ארחיב כאן), ונוסחת אוילר המתמטית. את נוסחת אוילר ניתן לכתוב בפשטות רבה, כך:

\(e^{ix}=\cos(x)+i\sin(x)\)

זוהי משוואה חשובה ומרכזית בכל הקשור לאנליזה מרוכבת, והיא גם חוסכת הרבה עבודת כתיבה עבור מי שרוצה לתאר מספר מרוכב בצורה פשוטה, אך המשוואה הפכה למפורסמת עוד יותר בשל קוריוז; אם מציבים בה \(x=\pi\) מקבלים, אחרי העברת אגפים, את הזהות הבאה:

\(e^{i\pi}+1=0\)

הניחוש שלי, על סמך הכתבה ב"הארץ", הוא שזהות ספציפית זו (ולא המשוואה הכללית) היא שזכתה במקום הראשון, שכן (על פי "הארץ") "היא מכילה בנוסחה אחת את כל המרכיבים הבסיסיים של המתמטיקה".

לא אכנס כאן לשאלה מדוע הנוסחה נכונה; את זה עושים בכל קורס בסיסי באנליזה מרוכבת, וההוכחה היא טכנית למדי (למעשה, לפעמים כלל לא מוכיחים את הזהות, אלא מגדירים באמצעותה את המשמעות של העלאת e בחזקה מרוכבת) ומסתמכת על הצבת i בתוך טור הטיילור של אקספוננט ופירוקו לשני טורים, אחד של סינוס ואחד של קוסינוס. אם כל זה נשמע לכם כמו ג'יבריש, אל חשש, לא בכך אני רוצה לעסוק.

מה שמעניין אותי בנוסחה הוא אכן חמשת המרכיבים שלה: \(e,i,\pi,1,0\) , שהם אכן הקבועים המוכרים והנפוצים ביותר במתמטיקה. ניתן להתווכח רבות על השאלה האם 1 ו-0 ראויים לתואר "קבועים" יותר מאשר, נניח, 42, ולדעתי הם אכן ראויים יותר, בשל התפקיד המיוחד שהם משחקים במערכת המספרים שלנו בתור איברים "נייטרליים" (אם מחברים מספר כלשהו עם אפס, המספר אינו משתנה; אם כופלים מספר כלשהו ב-1, המספר אינו משתנה).

שלושת הקבועים האחרים, לעומת זאת, מוכרים הרבה פחות לקורא ההדיוט, ואולי בגלל זה מיהר "הארץ" לפרסם כתבת "פרשנות", מספר ימים לאחר מכן, שתציג את מרכיבי הנוסחה ותסביר אותם. הכתבה התהדרה בשם הלא ברור "מטרנסצנדנטלי יוצא ריאלי" ולא עלה בידה לחמוק מאי הדיוקים הבלתי נמנעים שנובעים מכך שכותב הכתבה אינו מתמטיקאי, ולעיתון אין (ככל הנראה) עורך מתמטי. כך למשל נאמר בכתבה ש"במתמטיקה מספר כזה [שבכתיבתו כמספר עם שבר עשרוני אין לו שיעור] קרוי טרנסצנדנטלי." (לא נכון – הוא קרוי אירציונלי. טרנסצנדנטלי הוא מספר שאינו פתרון של אף משוואה פולינומית במקדמים רציונליים), או שפאי הוא "היחס בין הקוטר להיקף המעגל" (בדיוק להפך). לא נורא. אף קורא לא ייפגע מקריאת הכתבה הזו, והדבר החשוב באמת הוא הכוונה הטובה שמאחוריה והרצון הכן להביא את היופי המתמטי לידיעת הציבור.

האמנם?

מה שגרם לפקיעת סבלנותי היה חלקה האחרון של הכתבה, שעסק במספר המדומה i. וכך נאמר שם:

"i הוא בכלל יצור מוזר בתכלית, פרי דמיון מתמטי פרוע, ועל כן קרוי "מספר דמיוני", מושג שכבר הוצע על ידי דקארט במאה השבע עשרה. ומהו מספר זה? לימדו אותנו בעמל ויגע שכאשר מעלים מספר בריבוע התוצאה תמיד חיובית, אבל אמר מי שאמר: למה? הבה נגדיר את השורש של 1- ונקרא לו i. לא מבינים? לא צריך. ככה זה."

גם בפסקה הבודדת הזו, פחות משהשגיאות העובדתיות מפריעות לי (i לא הומצא בידי דקארט; למעשה, דקארט היה ממתנגדיו החריפים והטביע בו לדראון עולם את השם המזלזל "מספר דמיוני") מפריעה לי הנימה הכללית. גישת ה"לא מבינים? לא צריך. ככה זה" היא אכן, למרבה צערי, הגישה שבה נתקלים תלמידי בית הספר בארץ – אבל זו אינה גישת המתמטיקה, אלא גישת המורים למתמטיקה בתיכון. באוניברסיטה כבר שומע כל סטודנט הפוגש במרוכבים זמירות אחרות, וניתן היה לקוות שגם כותב הכתבה ידע זאת.

i אינו "יצור מוזר בתכלית" כי אם מספר הגיוני ולגיטימי לא פחות (ואולי אף יותר) מאשר ידידו פאי. הוא אינו פרי "דמיון מתמטי פרוע" אלא תוצאה של חקירה מקיפה של בעיה מתמטית בסיסית – פתרון משוואות ממעלה שלישית. i הוא הדוגמה הקלאסית למושג מתמטי רחב יותר ומרתק בפני עצמו, של הרחבת שדות, ויש מספר דרכים שונות לבנות אותו בצורה פורמלית מדוייקת. מעל הכל, הוא ממש לא קיים על תקן של "לא מבינים? לא צריך". כן צריך להבין, שכן מי שלא מבין יתקשה להתנער מהתחושה ש"מרמים" אותו, וש-i אינו יותר מאשר משחק בחול של כמה מתמטיקאים מטורפים עם יותר מדי זמן פנוי.

בפוסטים הבאים אנסה להביא מספר דברי סנגוריה לזכותו של i, אך לטעמי הדרך הטובה ביותר לעשות כן היא להתחיל מההתחלה – לבחון את הבניה של מערכות המספרים המוכרות לנו – מהטבעיים, דרך השלמים והרציונליים, עבור בממשיים וכלה במרוכבים – ולראות כיצד כל צעד בסדרת הבניות הארוכה הזו נובע מאותם רעיונות. בתקווה אצליח להראות מדוע החלק הבעייתי והשנוי במחלוקת ביותר בסדרה הוא דווקא המעבר מהרציונליים לממשיים, ולמה דווקא ההוספה של i למערכת סוגרת את השרשרת ונותנת לנו מערכת מספרים שהיא במובנים מסויימים עדיפה על זו שהיא מרחיבה.

ואז, אני מקווה, נוסחת אוילר תהיה מרתיעה פחות, ויפה עוד יותר.

דילמת הבלונדינית האלטרואיסטית

בפוסטים הקודמים הצגתי את שיווי משקל נאש. גם מי שלא שרד אותם יוכל להתעניין (ולהבין!) בדוגמה נוספת שלו, הפעם של הבעיה המפורסמת ביותר מהתחום (עד שזכתה שספר מדע פופולרי העוסק בו יקרא על שמה) – "דילמת האסיר". הבעיה לא הומצאה על ידי נאש אלא מספר שנים לאחר שהציע את מושג שיווי המשקל שלו, והיא מעניינת בכך שהיא מראה שבאופן כללי הוא אינו בהכרח מייצג את הפתרון האופטימלי עבור הצדדים. הבעיה מנוסחת במקור עם אסירים, משטרה ואקשן, אבל לצורך אחידות אנסח אותה קודם בעזרת בלונדיניות וברונטיות (ואקשן!).

ובכן, נניח שרק נאש וחבר אחד שלו נמצאים בפאב, ונכנסות שתי ברונטיות מלוות בבלונדינית ההכרחית. כמקודם, לכל אחד מהשחקנים שתי אסטרטגיות – או ללכת על הברונטית שנושאת חן בעיניו (כל אחד מהם מעוניין בברונטית אחרת) או ללכת על הבלונדינית. כמובן ש"לא להשתתף במשחק" אינה אופציה…

דילמת האסיר ה”בלונדינית”

ברור שהסיטואציה שבה שני הגברברים הולכים על הבלונדינית היא רעה עבור שניהם, כי הם יישארו ללא כלום. ברור גם שהסיטואציה שבה שניהם הולכים על ברונטיות נפרדות היא טובה יחסית – שניהם יזכו במערכת יחסים יציבה ונישואים מאושרים. התחכום שבבעיה הוא דווקא במקרה השלישי, שבו אחד מהגברברים (נניח נאש, מגיע לו) הולך על הבלונדינית, ואילו השני על הברונטית. לכאורה נאש אמור להיות בעננים, בזמן שהשני אמור להיות מרוצה לפחות כפי שהיה מרוצה אם שניהם היו הולכים על ברונטיות מלכתחילה. אלא שכאן נכנסת למשחק הקנאה – איך החבר של נאש יוכל לחיות עם עצמו בזמן שנאש מתהלך כטווס המתהדר בבלונדינית? ולכן הסיטואציה הזו היא הגרועה ביותר עבור השחקן השני – גרועה יותר מלחיות עם ברונטית כשלנאש אין בלונדינית להתהדר בה אלא רק ברונטית סטנדרטית משל עצמו, וגרועה אפילו יותר מהסיטואציה שבה שניהם הולכים על הבלונדינית ויוצאים בידיים ריקות – כי הוא נשאר עצמאי ויכול ללכת לפאבים בלי נאש המעצבן מכאן והבא, במקום שייאלץ להתחתן עם ברונטית ולחלום על הבלונדינית של נאש בלילה.

מכאן עולה התוצאה הפרדוקסלית לכאורה – שיווי המשקל במשחק הוא הסיטואציה שבה שני הגברים הולכים על הבלונדינית, ויוצאים ללא כלום. כדי להיווכח בכך שזה נכון מספיק לראות שלא משתלם לאף שחקן להחליף אם האסטרטגיה שלו (כלומר, ללכת על הברונטית) אם השחקן השני לא מחליף את האסטרטגיה שלו. מכיוון שאמרנו שמי שנתקע עם הברונטית בזמן שלשני יש בלונדינית כבר היה מעדיף שלשניהם לא יהיה כלום, זה מיידי.

אין במשחק נקודות שיווי משקל אחרות – המצב שבו אחד בחר בבלונדינית והשני בברונטית מופר, כאמור, על ידי כך שהבוחר בברונטית יפנה אל הבלונדינית. עם זאת, גם הסיטואציה ה"אופטימלית" במשחק – זו שבה שניהם הולכים על ברונטיות ושניהם מרוצים יחסית – נופלת. נניח שאני חברו של נאש ושנינו הלכנו על ברונטיות. האם משתלם לי להחליף בהינתן שנאש נשאר עם ברונטית? בטח, הרי בלונדינית זה הכי טוב, ונאש לא יפריע לי.

מה שחסר כאן הוא הסכם מחייב כלשהו, שיכריח הן אותי והן את נאש ללכת על ברונטיות, ולא רק ללחוץ ידיים, להסכים על כך, ואז שאחד משנינו יבגוד ברגע האחרון (מה שיקרה, כמובן, הוא ששנינו נבגוד). לכן כל כך חשוב להדגיש שמדובר במשחק לא שיתופי, כלומר משחק שבו כל אחד מהשחקנים פועל רק על דעת עצמו, ורק כדי להשיג מקסימום רווח לעצמו. חשוב להדגיש שהבעיה כאן אינה "חוסר תקשורת" בין שני השחקנים (כפי שלעתים מציגים משחקים לא שיתופיים) אלא חוסר היכולת לכפות שיתוף פעולה בין שניהם (דבר שאכן נובע לעתים מחוסר תקשורת, אך לא בהכרח).

כעת אציג את הבעיה בניסוח המקורי שלה, ויהיה אפשר להיווכח שמדובר באותה גברת בשינוי אדרת (כפי שקורה פעמים רבות במתמטיקה; ציטוט מפורסם אומר כי המתמטיקה היא האמנות של קריאה בשם אחד לדברים שונים, ובשמות שונים לאותו הדבר). שני שודדי בנק נתפסים, כל אחד מוכנס לחדר חקירות ומועבר בפרוצדורת ה"שוטר טוב, שוטר רע". המטרה: שילשין על השני. אם הוא מלשין וחברו שותק, הוא מקבל תוכנית להגנת עדים אי שם על אי טרופי באוקיינוס השקט, וחברו נכנס לכלא להרבה זמן. לעומת זאת, אם שניהם מלשינים, שניהם הולכים לכלא (אבל לפרק זמן פחות ממושך – צרת טיפשים רבים חצי נחמה). אם שניהם שותקים, אין למשטרה כלום עליהם והם משתחררים – אבל אז במקום תוכנית להגנת עדים באוקיינוס השקט יש להם את שיכון ז' ואת המשטרה שרק מחכה לתפוס אותם בפעם הבאה. לא הכי כיף בעולם.

כאן הסיטואציה האופטימלית עבור שני השחקנים היא שתיקה הדדית. עדיף להיות חופשי מאשר להיות בכלא. עם זאת, שיווי המשקל הוא בסיטואציה שבה שני הפושעים מלשינים זה על זה, ונכנסים שניהם לכלא. למה? נסו לבדוק את הסיטואציות השונות ותראו שהניתוח זהה לניתוח של בעיית הבלונדינית.

יש עוד נקודה אחת שאני רוצה להתייחס אליה. פעמים רבות מציגים את דילמת האסיר כאילו היא מראה ש"האנוכיות לא משתלמת" (כפי שנאש עצמו אמר בסרט, "אדם סמית' זקוק לשכתוב"). הרי לכאורה הסיבה לכך ששני האסירים נדפקים בסוף היא העובדה שהם פועלים רק למען הרווח שלהם, מבלי לחשוב על טובת חברם; אם הם רק היו קצת יותר אלטרואיסטים ומתחשבים בו שניהם היו שותקים וכולם היו יוצאים מורווחים.

זו דרך מחשבה יפה (נניח), אבל הבעיה בה היא שהיא שגויה בתכלית. אין לדילמת האסיר שום קשר לאנוכיות. למעשה, דילמת האסיר כלל אינה מתעניינת במטרות ובמניעים של השחקנים; החשיבות היא רק בחוסר שיתוף הפעולה שלהם.

אנסה להצדיק זאת באמצעות הדגמת סיטואציה הדומה לזו שבסיפור הקלאסי של דילמת האסיר, רק שבה שני האסירים הם אלטרואיסטים לחלוטין – כלומר, מתעניינים רק בטובת חברם, מבלי להתעניין כלל בטובתם שלהם. המודל של דילמת האסיר שראינו יתאים בדיוק גם לסיטואציה זו.

אם כן, נניח שחוקרי המשטרה מודעים לכך שהאסירים אלטרואיסטים, והם באים לכל אחד מהם בהצעה הזו: אתה תודה באשמה. אם חברך ישתוק, הוא ישתחרר ונעזוב אותו בשקט, בזמן שאתה תלך לכלא להרבה זמן. לעומת זאת, אם שניכם תודו, שניכם תלכו לכלא (אבל לפחות זמן), ואילו אם שניכם תשתקו שניכם תשתחררו, אבל נמשיך לעקוב אחריכם ולהציק לכם.

מה יכול לקרות בסיטואציה הזו? ברור שהאפשרות שבה שני האסירים שותקים עדיפה עבורם מאשר זו שבה שניהם מודים (כי אם שנינו מודים, אז חברי הולך לכלא לתקופה מסויימת, גם אם קצרה, ואילו אם שנינו שותקים, אז חברי בחוץ). כמקודם, הסיטואציה המעניינת היא זו שבה אחד האסירים מודה ואילו השני שותק. מבחינת האסיר שמודה, הוא בעננים: חברו שוחרר, והמשטרה לא תמשיך להציק לו. אז נכון, האסיר המודה עצמו תקוע עכשיו בכלא לכל החיים, אבל מה אכפת לו? הוא אלטרואיסט, והעיקר שחברו מרוצה.

אלא שכאן נכנס הטוויסט. הרי גם חברו של המודה הוא אלטרואיסט – איך אתם חושבים שהוא מרגיש? הוא אמנם חופשי ומשוחרר (למי אכפת?) אבל חברו נמק בכלא בגללו. איזה מצב נורא. ברור שהוא היה מעדיף להודות בעצמו, ולחסוך לחברו כמה שנים בכלא.

נסו לצייר טבלה עבור ה"משחק" הזה, ותראו שתקבלו בדיוק את אותה טבלה כמו זו של דילמת האסיר הקלאסית. הבעיה, אם כן, אינה האנוכיות אלא חוסר שיתוף הפעולה – חוסר שיתוף פעולה שאינו תלוי ביכולת התקשורת בין שני האסירים: אם חברי היה בא אלי ואומר "שמע, אני מודה בהכל ואתה שתוק", האם הייתי מתרשם מזה? ודאי שלא. אני אלטרואיסט, ולכן הייתי רץ ומודה בעצמי, כדי לחסוך לו זמן בכלא.

כל הדיונים בדילמת האסיר מעלים שאלה מרכזית אחת: אם המודל המתמטי הזה אומר ששני האסירים ילשינו, למה בחיים האמיתיים זה לא קורה ושני האסירים שותקים? התשובה לכך היא, כמובן, שבחיים האמיתיים הסיטואציה מורכבת יותר – מי שמלשין היום יודע שבפעם הבאה שהוא יהיה בסיטואציה דומה, מצבו יהיה רע ומר, בעוד שאם הוא ישתוק היום בפעם הבאה ייתכן שגם חברו ישתוק ושניהם ירוויחו. אם הוא שואב את הידע שלו מהקולנוע, הוא גם יודע שתוכניות להגנת עדים נגמרות רע תמיד…

תורת המשחקים מנסה לטפל גם בסיטואציות המורכבות הללו, אבל זה כבר עניין לדיון נפרד, ארוך הרבה יותר. בינתיים, אשמח לשמוע דוגמאות נוספות לדילמת האסיר שבהן אתם נתקלים בחיי היום-יום שלכם.

נפלאות אי התבונה (חלק ד')

משסיימנו לעסוק במשחקי סכום-אפס, נוכל סוף סוף להציג את המושג של שיווי משקל נאש. הרעיון הבסיסי שבהכללה של נאש מבוסס על אותו רעיון מנחה שקיים גם במשפט המינימקס: למצוא אסטרטגיות ש"לא משתלם" לשחקן להחליף בהינתן מה ששאר השחקנים עושים. "שיווי משקל נאש" הוא פשוט בחירה של אסטרטגיה לכל אחד מהשחקנים כך שלאף שחקן לא משתלם לשנות את האסטרטגיה שלו כל עוד שאר השחקנים לא משנים את שלהם. ההבדל המרכזי שמתחייב מהכללת המשחק לכזה שאינו סכום אפס הוא שייתכנו מספר קומבינציות שכאלו של אסטרטגיות – כלומר, יכולה להיות יותר מנקודת שיווי משקל אחת למשחק.

אנסה להדגים את המושג באמצעות דוגמת הבלונדינית. בפוסט קודם כתבתי שהסיטואציה בה כל חבריו של נאש הולכים על הברונטיות והוא עצמו הולך על הבלונדינית היא דוגמה לשיווי משקל נאש. אנסה כעת להצדיק את הקביעה. ברור שיש כאן בחירה של אסטרטגיה לכל אחד מהשחקנים ("אני אלך על ברונטית" לכל אחד מחבריו של נאש, "אני אלך על הבלונדינית" עבור נאש עצמו), ולאף אחד מהשחקנים לא משתלם לשנות את הבחירה שלו כל עוד האחרים לא משנים את שלהם: לאף אחד מחבריו של נאש לא משתלם להחליף – אם הם יעברו לבלונדינית הם ייקלעו למריבה עם נאש ויגמרו בלי כלום, ובפרט בלי הברונטית שכרגע יש להם. גם לנאש עצמו אין שום סיבה לשנות את הבחירה שלו – הוא עם הבלונדינית, מה יותר טוב מזה?

מושג הסימטריה, שסייע לנו בהבנת משחק האבן-נייר-ומספריים, יכול לסייע לנו גם כאן – בעזרתו רואים בבירור שנקודת שיווי המשקל שתיארנו אינה נקודת שיווי המשקל היחידה במשחק. כל סיטואציה שבה כל השחקנים מלבד אחד הולכים על ברונטיות ואחד מהם (לא בהכרח נאש) הולך על בלונדינית היא שיווי משקל. אלו נקודות שיווי המשקל היחידות – אם אף אחד לא בוחר ללכת על הבלונדינית, לכל אחד משתלם להחליף (כל עוד האחרים לא מחליפים בעצמם), ואם יש יותר ממישהו אחד על הבלונדינית, כבר עדיף למי שהלך עליה לוותר וללכת על ברונטית במקום זה.

אלוהים אדירים, איזו דוגמה סקסיטית. תזכירו לי לספר לכם על משפט החתונה של הול, הוא אפילו יותר גרוע.

 

חשוב לציין שנאש עשה יותר מאשר להמציא את מושג שיווי המשקל – הוא הוכיח משפט שמכליל את משפט המינימקס, ומראה שבכל משחק (מהסוג שעליו אנו מדברים) קיימת נקודת שיווי משקל נאש אחת לפחות. כמקודם, המשפט נכון רק כאשר מתירים בחירה אקראית של אחת מהאסטרטגיות האפשריות. כאן יכולה להתעורר שאלה טבעית – האם שיווי משקל נאש באמת מהווה הכללה של האסטרטגיות האופטימליות שעליהן דיברנו במשחק סכום אפס? בהמשך נראה בעיה נוספת בתורת המשחקים, "דילמת האסיר", שבה נקודת שיווי המשקל היחידה אינה מניבה לאף אחד מהשחקנים את הרווח הגדול ביותר שהיו יכולים להפיק אם היו משתפים פעולה, כך שהמילה "אופטימלית" לא נראית במקום כאן.

עם זאת, לא קשה לראות כי שיווי המשקל הוא אכן הכללה של המושג הקודם. נניח שיש לנו משחק סכום אפס של שני שחקנים (המשחק שבו עסקו פון נוימן ומורגנשטרן). על פי משפט המינימקס יש לכל אחד מהשחקנים אסטרטגיה אופטימלית, והרווח שהאסטרטגיה של השחקן הראשון מניבה הוא בדיוק ההפסד שהאסטרטגיה של השחקן השני מניבה (זכרו כי זה יכול להיות גם מספר שלילי, כלומר השחקן הראשון מפסיד והשני מרוויח).

הבחירה של כל אחד מהשחקנים באסטרטגיה האופטימלית היא בבירור נקודת שיווי משקל של המשחק: נניח שאני משחק נגד נאש, ונניח כי נאש בחר באסטרטגיה האופטימלית וכך גם אני. על פי משפט המינימקס, הרווח שיש לנאש כרגע הוא הרווח המקסימלי שהוא מסוגל להפיק מהמשחק בלתי תלות באסטרטגיה שלי, כלומר לא משנה מה אעשה, לא ייתכן שהרווח שלו יקטן.

כעת, בחירת האסטרטגיות של שנינו לא תהיה נקודת שיווי משקל רק אם משתלם לי להחליף את האסטרטגיה שלי בהינתן שנאש דבק באסטרטגיה שלו. "משתלם לי" פירושו שאני מרוויח יותר – אבל אני במשחק סכום אפס והרווח הנוכחי שלי הוא בדיוק ההפסד הנוכחי של נאש, ולכן כשהרווח שלי יגדל, הרווח של נאש יקטן, בסתירה למה שאמרתי בפסקה הקודמת. מכאן שאכן זוהי נקודת שיווי משקל.

זה כיוון אחד של ההכללה: הפתרון שמובטח על ידי משפט המינימקס הוא נקודת שיווי משקל. הכיוון השני, להיווכח בכך שנקודת שיווי משקל במשחק סכום-אפס לשני שחקנים היא אופטימלית באופן שעליו דיברנו, הוא קל יותר, וכדאי לחשוב עליו עצמאית כדי לוודא שהמושגים ברורים.

נפלאות אי התבונה (חלק ג')

לפני שנעבור לשיווי משקל נאש, השלמה קטנה-גדולה: בתיאור החפיפניקי שלי את משפט המינימקס השמטתי את הנקודה המרכזית והחשובה ביותר בו. כעת אנסה לתקן את המעוות, ולשם כך אגלוש ליותר פורמליזם מתמטי, שגם יסביר מהיכן צצה המילה "מינימקס".

לצורך נוחות, מתארים את התוצאה של כל תרחיש במשחק (כלומר, מה שקורה אחרי שכל אחד משני השחקנים בחר אסטרטגיה) בתור מספר בודד, שהוא הרווח של שחקן מס' 1. מכיוון שאנו במשחק סכום אפס, הרווח של שחקן מס' 1 הוא בדיוק ההפסד של שחקן מס' 2 ולהיפך, לכן די במספר בודד.

כעת, הרווח שנותנת לשחקן מס' 1 האסטרטגיה האופטימלית שלו הוא הערך הגדול ביותר שהוא יכול להשיג בלי תלות במה שעושה שחקן מס' 2. כדי לגלות אותו, אנחנו בודקים כל אחת מהאסטרטגיות של שחקן מס' 1 בנפרד: לכל אחת מהן אנחנו בודקים מהו התרחיש הגרוע ביותר – כלומר, המענה של שחקן מס' 2 שיניב את הרווח הנמוך ביותר לשחקן מס' 1. במילים אחרות, אנחנו מוצאים את מינימום הרווח של שחקן מס' 1, בהינתן שהוא שיחק אסטרטגיה מסויימת.

כעת, כדי למצוא את האסטרטגיה שהכי משתלם לשחקן מס' 1 לשחק, בוחרים את האסטרטגיה שמבטיחה את מקסימום הרווח מכל ערכי המינימום שחישבנו. בקיצור מכנים ערך זה בתור המקסמין של שחקן מס' 1 (כי לוקחים מקסימום על ערכי מינימום). זה אחד מהמקומות שבהם כתיב מתמטי מפשט מאוד את העניינים: אם x הוא משתנה שמייצג אסטרטגיות של שחקן מס' 1, y משתנה שמייצג אסטרטגיות של שחקן מס' 2, ו-f הפונקציה שמתאימה לכל זוג אסטרטגיות את הרווח של שחקן מס' 1, אז המקסמין של שחקן מס' 1 הוא בדיוק

\(\max_x\min_y f(x,y)\)

עבור שחקן 2 המצב הפוך: מכיוון שככל שערך הפונקציה f גדול יותר, כך שחקן 2 מרוויח פחות, המקסמין הופך אצלו למינמקס:
\(\min_y\max_x f(x,y)\)

וכאן אנו מגיעים לנקודה המרכזית: משפט המינמקס מבטיח שאם מרשים הגרלת אסטרטגיות (לא יזיק להציג את השם הרשמי של הרעיון הזה: בחירה כזו של אסטרטגיות מכונה "משחק עם אסטרטגיות מעורבות", מכיוון שהיא מרשה לערב כמה אסטרטגיות שונות באופן הסתברותי) – אז המקסמין של שחקן מס' 1 והמינמקס של שחקן מס' 2 יהיו שווים בערכם.

כדי לראות שהטענה הזו אינה טריוויאלית, נסו למצוא משחק שבו זה לא מתקיים כאשר לא משתמשים באסטרטגיות מעורבות (כבר הצגנו כזה – אבן-נייר-ומספריים – אבל ניתן למצוא משחק פשוט יותר, עם שתי אסטרטגיות בלבד לכל שחקן).

כעת אפשר לחזור לעניין המרכזי שלפנינו – שיווי משקל נאש – ונותרה רק שאלה אחת לפענח לפני כן: למה דווקא מינמקס ולא מקסמין? ולמה "מינימקס" ולא"מינמקס"?

נפלאות אי התבונה (חלק ב')

לפני שנעבור לדבר על שיווי משקל נאש כדאי לומר כמה מילים על מהו ה"משחק" שבו עוסקת תורת המשחקים ומהו "פתרון" עבורו, ולהתמקד במקרה פרטי מעניין שלהם. משחק, בצורה לא מדויקת, הוא סיטואציה שבה נמצאים כמה משתתפים, שלכל אחד מהם מספר דרכי פעולה ("אסטרטגיות") שונות ("אני אלך על הבלונדינית", "אני אלך על הברונטית"). לכל צירוף של דרכי פעולה ("אני הלכתי על הבלונדינית והוא הלך על הברונטית") מותאם ה"רווח" שמקבלים השחקנים מהתרחיש שנובע מדרכי הפעולה שכולם בחרו ("כולנו הלכנו על הבלונדינית, כולנו קיבלנו רווח של מינוס 1 (בגלל ההשפלה)", "אני הלכתי על הברונטית וקיבלתי רווח של 1, הוא הלך על הבלונדינית וקיבל רווח של 3").

חשוב לשים לב לנקודה עדינה כאן: "רווח" אינו בהכרח רווח כספי, או אפילו חומרי. הוא פשוט מספר שמתאימים לסיטואציה כדי להגיד עד כמה השחקן מרוצה מתוצאת הסיטואציה. הוא גם לא מעיד על אנוכיות – אם נאש הוא אלטרואיסט, הרווח שלו יכול להיות הגדול ביותר דווקא כשחברו הטוב זוכה בבלונדינית ולא הוא עצמו. אנסה לתת דוגמה נוספת כאשר אדבר על דילמת האסיר.

במודל של נאש יש מספר הנחות חשובות אחרות: כל שחקן יודע את כל המידע על המשחק – כלומר, מהם כל התרחישים האפשריים, ומה הרווח שכל שחקן יניב מהם. עוד הנחה היא שכל שחקן פועל כדי למקסם את הרווח של עצמו (ושוב – "למקסם את הרווח של עצמו" אין פירושו "לפעול בצורה אנוכית לגמרי", אלא פשוט "לפעול בצורה שתניב את התוצאה הטובה ביותר לדעת השחקן בלי תלות במה שיעשו האחרים").

נאש לא המציא את המודל; זכות הראשונים שמורה למתמטיקאי ג'ון פון נוימן ולכלכלן אוסקר מורגנשטרן, שבספרם "תורת המשחקים והתנהגות כלכלית" המציאו, למעשה, את הענף. פון נוימן ומורגנשטרן עסקו במודל פשוט יותר – משחק סכום אפס שבו משתתפים שני שחקנים בלבד. "סכום אפס" פירושו שכל רווח של השחקן האחד מתבטא בהפסד דומה של השחקן השני. למשל, משחק הימורים לשני שחקנים הוא כזה – את הסכום שהמפסיד מאבד, המנצח מקבל. לעומת זאת, משחק הבלונדינית והברונטיות אינו כזה, שכן אם הארבעה ילכו על הברונטיות, כולם ירוויחו מבלי שאיש יפסיד.

פון נוימן ומורגנשטרן הוכיחו (במשפט שנקרא "משפט המינימקס") כי במשחק סכום אפס לשני שחקנים קיימת תמיד אסטרטגיה "אופטימלית" לכל אחד מהשחקנים – כלומר, כזו שמבטיחה לשחקן כי לא משנה מה הצד השני עושה, הרווח שלו יהיה הגדול ביותר אם ידבק באסטרטגיה שבחר. במבט ראשון, לא ברור מדוע לא מובן מאליו שתהיה אסטרטגיה שכזו, אז אציג מקרה שבו אסטרטגיה כזו (לכאורה) באמת אינה קיימת: אבן-נייר-ומספרים.

אבן-נייר-ומספרים הוא ספורט רציני. אל תזלזלו. הייתה אליפות עולם באבן-נייר-ומספריים בקנדה לפני כמה שנים. אם יש לשחקן ידע כלשהו על הפסיכולוגיה של היריב, הוא יכול לנצל אותו. אבל בגרסה הפשוטה ביותר אין לנו שום ידע כזה, ואין לנו שום מושג מה יעשה היריב.

יש לנו בסך הכל שלוש אסטרטגיות – לשלוף אבן, לשלוף נייר או לשלוף מספריים, אלא שאף אחת משלוש האסטרטגיות הללו אינה אופטימלית על פי הצורה שבה הגדרנו את המושג: למשל, אם נשלוף אבן, קיימת אסטרטגיה של היריב ("שלוף נייר") שתבטיח לנו רווח נמוך מזה שהיינו משיגים אם היינו נוקטים באסטרטגיה אחרת – "שלוף מספריים". אבל גם "שלוף מספריים" אינה אופטימלית, כי היריב יכל לשחק "שלוף אבן", וכן הלאה וכן הלאה. הבעייתיות המעגלית כאן מוכרת מחיי היום יום – בכל פעם שטומנים פח למישהו עולה השאלה "האם הוא יודע שאני טומן לו פח?" והצד השני שואל את עצמו "האם הוא יודע שאני יודע שאני טומן לו פח?" ושוב הראשון שואל "האם הוא יודע שאני יודע שהוא יודע שאני טומן לו פח?" וכן הלאה וכן הלאה.

אז מה הפתרון של פון נוימן ומורגנשטרן שמבטיח שתמיד תהיה אסטרטגיה אופטימלית? הם מרשים להכניס מימד הסתברותי לתמונה – כלומר, לבחור באקראי אחת מהאסטרטגיות שעומדות לרשותנו, כשאסטרטגיות שונות יכולות לקבל משקלים שונים בהגרלה (למשל, כדי לתת משקלים של 2/3 ו-1/3 אפשר להטיל קובייה, לבחור באסטרטגיה הראשונה אם התוצאה קטנה מ-5, ובשנייה אם היא גדולה או שווה ל-5). אם מרשים הגרלה שכזו תמיד קיימת דרך מסוימת להגריל שמבטיחה רווח אופטימלי בלי תלות בבחירה של היריב. במקרה של אבן-נייר-ומספריים הדרך הזו היא פשוט הגרלה בהסתברות אחידה של 1/3 לכל אחת מהאפשרויות. חישוב מהיר מראה שתוחלת הרווח במקרה הזה (אם "ניצחון" שווה נקודה ו"הפסד" שווה מינוס נקודה) היא אפס, כפי שניתן היה לצפות – הרי המשחק סימטרי במהותו, ואין סיבה שלשחקן אחד יהיה יתרון על השני אם שניהם נוקטים בגישה האופטימלית. (למעשה, זו דרך מצוינת לזהות משחק סכום אפס שאינו הוגן – משחק שבו לאחד מהשחקנים מובטח רווח כלשהו אם ישתמש באסטרטגיה האופטימלית).

ואיך כל זה קשור לשיווי משקל נאש? בכך ששיווי משקל נאש הוא ההכללה של משפט המינימקס לסוג כללי יותר של משחקים – משחקים שבהם יכולים להיות יותר משני שחקנים, ואינם בהכרח סכום אפס, כדוגמת משחק הבלונדינית והברונטיות שלנו.