הוצאת מאגנס הוציאה לאחרונה ספר מתמטיקה בעברית העוסק בתורת המשחקים ונכתב בידי שלושה מתמטיקאים ישראלים – שמואל זמיר, אילון סולן, ומיכאל משלר שהזכרתי כבר בפוסט על בעיית "מי שהיה נשוי שלוש נשים" (ונפטר קרוב למועד סיום הספר). איני בקיא בתורת המשחקים ברמה שתאפשר לי לתת ביקורת אמיתית של הספר, אך הוא נראה לי רציני בהחלט ומקיף מאוד את הנושאים הבסיסיים, כך שאני ממליץ עליו בחום לכל מי שרוצה להכיר את הנושא. חשוב לציין שמדובר בספר מתמטי, שעיקרו הגדרות מדוייקות, משפטים והוכחות – לא דיבורים באוויר, כפי שקורה לעתים בספרי מדע פופולרי. מה שאני רוצה לכתוב עליו הפעם הוא דוגמה נאה לצורה שבה המתמטיקה הקונקרטית והקרה "מקלקלת" לנו את השאיפות האידאליסטיות – משפט אי האפשרות של ארו (שמסיבה לא ברורה מכונה לעתים "פרדוקס ארו" – זה כבר ממש זילות של המילה "פרדוקס").
המשפט (שהוכח על ידי הכלכלן קנת ארו בסביבות שנת 1951 – עשרים שנה לאחר מכן זכה ארו בפרס נובל לכלכלה) מהווה פחות או יותר את תחילתו של ענף מעניין בתורת המשחקים – תורת הבחירה החברתית (Social Choice). הבעיה הבסיסית שאיתה מתמודדת התורה היא זו: נניח שיש לנו קבוצה של מצביעים וקבוצה של תוצאות אפשריות. המצביעים מדרגים את התוצאות באופן מסויים – כיצד ניתן לבנות דירוג משותף עבור כל המצביעים מתוך הדירוגים האינדיבידואליים של כל אחד מהם?
מן הסתם לא חסרות דוגמאות מחיי היום יום לסיטואציה הזו. הדוגמה הבסיסית ביותר היא הליך הבחירות – כל מצביע "מדרג" את המפלגות באופן פשוט למדי – הוא בוחר מפלגה אחת שתהיה עדיפה בעיניו על כל שאר האפשרויות, ולשאר האפשרויות הוא "נשאר אדיש". כלומר, אם הצבעתי לכלב חץ לראשות תל אביב, פירוש הדבר המעשי הוא שמבחינת ההצבעה שלי אני אדיש בין חולדאי וחנין.
עוד דוגמה היא המשחקים האולימפיים – לחלק מהתחרויות (למשל, התעמלות) אין מדד אובייקטיבי של איכות (זמן, גובה וכו') אלא מספר שופטים (שאמנם, אמורים לקבל את החלטתם על פי שיקולים אובייקטיביים). כל שופט מדרג את הביצוע של כל אחד מהמתחרים, והדירוג של כלל השופטים משוקלל בצורה מסויימת לדירוג של כל המתחרים.
עוד דוגמה קלאסית סיפקה המורה לתנ"ך שלי. היה עלינו לבחור באיזה יום בשבוע תהיה שעת השלמה – שלישי אחר הצהריים, או שישי בבוקר. המורה נתנה לנו לערוך הצבעה דמוקרטית על האפשרות המועדפת. משהסתמן רוב מוחץ לטובת יום שלישי, המורה אמרה שטוב ויפה אבל בכל זאת שעת ההשלמה תתקיים (כפי שהיא רוצה) ביום שישי. כששאלנו אותה מדוע כל הליך ההצבעה הזה, אמרה לנו שרצתה שנגיע בעצמנו לתוצאה הנכונה.
הדוגמה האחרונה ממחישה את הסיטואציה שבה התוצאה נקבעת על פי ההעדפה של אחד מהמצביעים בלבד, בלי שום התחשבות בהעדפות של שאר המצביעים – למצביע האחד הזה קוראים (באופן מתאים ביותר) "דיקטטור". מה שמשפט אי האפשרות של ארו אומר, פחות או יותר, הוא שדיקטטורה היא הדרך היחידה להבטיח קיום של מספר תכונות בסיסיות (שנראות על פניו טריוויאליות) של הליך הבחירות. אפרט על כך בהמשך.
ראשית, מה הקשר לתורת המשחקים? ובכן, "משחק" הוא באופן כללי כל סיטואציה שבה יש "שחקנים" שצריכים לבחור בין אחת מכמה אפשרויות פעולה, על בסיס העדפות שיש להם, ותוך התחשבות בכך שגם הבחירות של שחקנים אחרים עשויות להשפיע על התוצאה הסופית. במקרה הזה ההעדפות של השחקנים מתבטאות בסדר על קבוצת התוצאות (על כך – עוד רגע) ואילו אפשרות הפעולה שבה הם בוחרים היא ההצבעה שלהם. כדאי לשים לב ששני הדברים הללו (ההעדפות וההצבעה) לא בהכרח זהים (אני רוצה שהכלב חץ ייבחר, אבל בגלל שאני פרקטי אצביע דווקא למישהו אחר ששמו מתחיל בח'). לא אכנס לכך בפוסט הזה, אך מדובר בנושא מרתק בפני עצמו.
כעת, כשאני אומר "סדר על קבוצת התוצאות", למה הכוונה? אפשר לתת לביטוי הזה מספר משמעויות, אך המשמעות היחידה שעליה אדבר (ובה עוסק המשפט) היא של סדר מלא – כלומר, אם נבוא לשחקן כלשהו ונציג בפניו שתי תוצאות אפשריות, הוא יעדיף תמיד אחת מהן על השנייה (ולא יעמוד ויגיד "אה… לא יודע ולא אכפת לי"). כלומר – גם אם חץ בשבילכם במקום הראשון, אתם עדיין חייבים להחליט מי במקום השני – חנין או חולדאי.
האובייקט המרכזי של תורת הבחירה החברתית הוא פונקצית הרווחה החברתית – פונקציה שמקבלת כקלט את ההעדפות של כל השחקנים (מה שמכונה "פרופיל העדפות"), ומוציאה כפלט סידור משל עצמה של קבוצת התוצאות – למשל – חץ במקום ראשון, חנין וחולדאי חולקים את המקום השני, וכו'. לפונקצית הרווחה החברתית כן מותר להיות "אדישה" בין תוצאות (להכניס אותן לאותו מקום) אחרת מהר מאוד יש לנו בעיות: מה קורה אם חצי מהמצביעים שמו את חולדאי במקום הראשון וחצי שמו את חנין? אם אחד משניהם יועדף ממש על השני, זה אומר שפונקצית הרווחה עצמה היא פונקציה מוטה.
פונקצית הרווחה החברתית מוציאה כפלט סידור של כל התוצאות האפשריות – כלומר, היא לא רק תגיד "חולדאי נבחר לראשות העיר", אלא גם תגיד "חץ הגיע למקום האחרון". אם כל מה שמעניין אותנו הוא מי נבחר, יש לפונקציה שזה הפלט היחיד שלה שם אחר – "פונקצית בחירה חברתית". גרסה קצת שונה של משפט ארו תקפה גם עבורה, ולכן לא נרחיב עליה יותר מדי.
אפשר להגדיר פונקציות רווחה חברתיות שונות מכאן ועד להודעה חדשה – המטרה היא כמובן להגדיר פונקציות שהן "הוגנות" עד כמה שרק ניתן – בדיוק בנסיון ההגדרתי הזה עוסק משפט ארו.
כבר הזכרתי את פונקצית הרווחה החברתית ה"דיקטטורית" – באופן פורמלי, היא לוקחת את כל ההעדפות של השחקנים, ומוציאה כפלט את ההעדפות של שחקן אחד ספציפי (תמיד אותו שחקן). המשמעות של פונקציה שכזו היא שהמשחק מכור מראש ואין לשאר השחקנים שום טעם להשתתף בו – לא משנה מה יהיו הבחירות שלהם, הם לא מסוגלים להשפיע על תוצאת המשחק. מכאן שזו לא ממש פונקציה שאנו רוצים לקבל כלגיטימית; ולכן אפשר לסמן בתור תכונה מס' 1 של פונקצית רווחה חברתית את הדרישה "הפונקציה אינה דיקטטורית".
ישנן עוד שתי תכונות סבירות שניתן לדרוש מפונקצית רווחה חברתית (יש הרבה תכונות, אבל שתי אלו מספיקות כדי להרוס הכל). הראשונה שבהן מכונה "פה-אחד" והיא כל כך מובנת מאליה שמביך שצריך לציין אותה במפורש – אם כל השחקנים העדיפו את אפשרות א' על פני אפשרות ב', אז גם בתוצאה הסופית אפשרות א' תהיה עדיפה על אפשרות ב'. כלומר, אם כולם העדיפו את חץ על פני חולדאי, אז חץ צריך להופיע אחרי חולדאי בתוצאה הסופית (בין אם חנין מופיע מעליו, בינו לבין חולדאי או אחרון). פונקצית רווחה חברתית שלא מקיימת את התכונה הזו היא יותר גרועה מדיקטטורית – היא "מרמה" את כולם!
התכונה הנוספת היא כנראה המלאכותית ביותר מבין השלוש, אך גם היא טבעית ומתבקשת מאוד לטעמי – "אי תלות באפשרויות לא רלוונטיות". לפני שאסביר אותה במדוייק, דוגמה פשוטה: נניח שהקרב בין חולדאי וחנין צמוד, ואף אחד לא מתעניין בחץ. דהיינו, אצל כל הבוחרים חץ במקום האחרון, ואילו אצל חלקם חולדאי במקום הראשון וחנין בשני, ואצל אחרים חולדאי במקום השני וחנין במקום הראשון. הבה נניח שבהינתן אוסף בחירות מסויימות פונקצית הרווחה החברתית מחזירה את חנין במקום הראשון, חולדאי בשני וחץ בשלישי. עד כה, הכל נשמע הגיוני.
אבל כעת נניח שחץ צבר פופולריות בקרב חלק מהמצביעים ועלה אצלם מהמקום השלישי לשני – כלומר, חלק מהמצביעים כעת מעדיפים את חץ על פני חולדאי (וחנין עדיין ראשון) ואילו אחרים מעדיפים את חץ על חנין (וחולדאי עדיין במקום הראשון). למרות מעשה הגבורה הזה, פונקצית הרווחה החברתית עדיין מחזירה את חץ במקום השלישי… אבל במקום הראשון היא שמה את חולדאי, לא את חנין. כלומר, ההתחזקות של חץ פגעה בחנין, למרות שהיא לא רלוונטית בכלל להעדפה של הבוחרים בין חולדאי וחנין – אף אחד לא הפסיק להעדיף את חנין על חולדאי רק בגלל שהוא התחיל להעדיף את חץ יותר מאשר את חולדאי!
ברור לנו היטב שבבחירות אמיתיות התופעה הזו מופיעה כל הזמן. המקרה המפורסם ביותר הוא כנראה של רוס פרו, מיליארדר אמריקאי שרץ כמועמד עצמאי בבחירות ב-1992 (גם ב-1996 אבל זה פחות חשוב) ויש טענות שהשפיע על תוצאות הבחירות (שבהן זכה במפתיע קלינטון הדמוקרטי ולא בוש הרפובליקני) למרות שכמובן שהגיע אחרון (באופן דומה הואשם גם ראלף ניידר בהפסד של אל גור לבוש הבן).
מבחינה פורמלית, התכונה הזו מוגדרת כך – אם יש לנו שני פרופילי העדפות, כך ששתי תוצאות מדורגות בהן באותו האופן האחת ביחס לשניה (כלומר, אם חנין מדורג מעל חולדאי באחת, הוא מדורג מעליו באחרת, וההפך), אז הדירוג היחסי של שתי התוצאות הללו זהה בפלט של פונקצית הרווחה החברתית עבור שני פרופילי ההעדפות הללו.
התכונה הזו היא המסמר האחרון בארון של פונקצית הרווחה החברתית. משפט ארו אומר בפשטות כך – כל פונקצית רווחה חברתית שמקיימת את התכונות "פה-אחד" ו"אי תלות באפשרויות לא רלוונטיות" ומדרגת לפחות שלוש תוצאות אפשריות, היא בהכרח דיקטטורית. לכן אי אפשר לבנות פונקצית רווחה חברתית לא דיקטטורית שמקיימת את שתי התכונות הפשוטות והמתבקשות הללו. כמה אכזרי מצד המתמטיקה. הוכחת המשפט אינה מסובכת במיוחד אך היא טכנית ולא אביא אותה כאן כרגע.
צריך להעיר הערה קטנה על ה"שלוש תוצאות אפשריות" שהגנבתי פתאום בניסוח שלעיל. אם יש רק שתי אפשרויות, תכונת ה"אי תלות באפשרויות לא רלוונטיות" הופכת בעצמה ללא-רלוונטית (אם יש רק שתי בחירות אפשריות, אף אחת מהן אינה "לא רלוונטית"). במקרה זה אין בעיה להגדיר פונקציות לא דיקטטוריות שיקיימו את "פה-אחד" – למשל, הצבעת הרוב (אם הרוב מעדיף את חולדאי על חנין, חולדאי ייבחר). זוהי ללא ספק נחמה כלשהי, שכן לעתים קרובות הבחירה היא רק בין שתי אפשרויות.
ישנם נושאים מרתקים רבים אחרים בספר של מאגנס ואני מקווה לפרט עליהם בפוסטים הבאים. אתם בהחלט מוזמנים לפרט בתגובות את סדר ההעדפות שלכם עבור הנושאים שאתם רוצים שאעסוק בהם תחילה – ואני מניח שאתם מבינים גם מה תהיה פונקצית הרווחה החברתית שבה אשתמש כדי להחליט.
הדוגמא הבולטת ביותר לבחירות שהושפעו ממועמד שלישי הן הבחירות בארה"ב בשנת 2000. בבחירות ב-92 פרו לא השפיע על התוצאה הסופית כי הבוחרים בו לו היו בוחרים בבוש בשום אופן. בוש היה אז בשפל גדול וקלינטון היה מנצח בכל מקרה. דווקא בשנת 2000, למרות שרק אחוז או שניים בחרו בנאדר דירוג היה כנראה שולח את גור לבית הלבן. בוחרי נאדר היו הרבה יותר אנטי בוש מאנטי גור וזה היה מתבטא בבחירות צמודות כל כך.
אני בעד דירוגים אבל הבעייה היא שזה לא יקרה כנראה לעולם. גם ככה בחירות די מסובכות ויש להרבה אנשים להבין את התהליך עצמו, אז דירוגים יהיו הרבה יותר מסובכים עבורם.
אני לא חושב שבחירות הן כל כך מסובכות. קשה אולי להבין את פונקצית הרווחה, אבל בפועל הבחירות הן די פשוטות – קח את הפתק שמתאים למפלגה שאתה הכי רוצה, ושים בקלפי.
אני חושב שדירוגים הם בעייתיים מסיבה שונה – זה פשוט כאב ראש להתחיל לדרג את כל המפלגות. לא רוצה שתכריחו אותי להחליט אם אני מעדיף את הכלב חץ או את החתול נץ. אם יכריחו אותי, סתם אלחץ על כפתורים באקראי, ואז מה?
אבל אולי יש מקום להוספת אפשרות להעדפות כלשהן (מקום ראשון חובה, מקום שני אופציונלי וכו'). אמנם אפשר לחשוש שאנשים יתבלבלו, אבל זו באמת האחרונה שבבעיותינו, עם כל שאר בעיות האבטחה שיש בבחירות.
יש בעיה נוספת עם דירוגים (ואני לא מספיק מכיר את המשפט של ארו כדי לדעת אם זה משנה את התמונה או לא). דירוגים לא באמת ממדלים העדפה באופן מעמיק. הם למשל לא מאפשרים הבעה של הפרש. כלומר אני מעדיף את חנין בהפרש קטן על חץ אבל הרחק מאחור נמצא חולדאי. במלים אחרות – העדפות הן תמיד תמורה, או פונקציה שממפה N מועמדים לקבוצה 1,2,…N
נניח שאני מאפשר העדפות שמאפשרות לבטא העדפה כפונקציה מN לקטע [0,1], ומנסח את הכללים באופן כזה כך שפונקצית ההעדפה החברתית במובן מסויים תיצור מרחק מינימלי מההעדפות של המשתתפים – אני מניח שיש כזו פונקציה.
בחירות בהחלט יכולות להיות מסובכות בייחוד בארה"ב. בארץ הבחירות באמת פשוטות אבל בארה"ב אתה בוחר נשיא, קונגרס, שופטים ועוד אלף ואחת משאלים. אתה צודק שמפלגות יהיה מאוד מסובך לדרג. יש גם בעייה נוספת: מה אם מישהו מדרג את כל המועמדים ואילו אחר מדרג רק שניים? איזה ניקוד יקבל השלישי?
זה דווקא קל. מאחר שאין ניקוד מספרי (זו הבעיה שעמית מדבר עליה) אז אם דירגתי שניים, השלישי יהיה במקום השלישי…
מה לגבי מערכת בחירות עם סיבובים? כלומר – כל עוד אף מועמד לא מקבל רף מסוים (שמסמל את העובדה שיותר מחצי מהבוחרים רוצים אותו במקום הראשון) ממשיכים לנפות מועמדים עד שמגיעים לבחירה בין 2 מועמדים בלבד?
בבחירות לסנאט השנה באלסקה, לדוגמה, נבחר הדמוקרט בזכות מועמד שלישי ש-"גנב" קולות מהמועמד הרפובליקני הותיק (שגם הורשע בפלילים, אבל זה סיפור אחר). בבחירות בג'ורג'יה, לעומת זאת, המועמד הרפובליקני המוביל לא הצליח לעבור 50%, שוב בשל מועמד שגנב קולות ממנו ופחות מיריבו הדמוקרטי, ולכן הבחירות עוברות לסיבוב שני (לפי חוקי מדינת ג'ורג'יה).
אגב – אם זהו אכן פתרון, אפשר לממש זאת ישר באלגוריתם ההצבעה. לאחר סיכום התוצאות הראשוני, אם אף מועמד לא עבר את הרף הדרוש, פשוט זורקים מכל הפתקים את המועמד שקיבל הכי מעט קולות ובודקים כעת את התוצאות, עד שמגיעים למצב בו יש זוכה ברור.
מסתבר שיש שם לשיטה שהצעתי בסוף – Instant Runoff Voting:
http://instantrunoff.com/
כל עוד השיטה שאתה מציע לא דורשת מהמצביעים להצביע שוב (או אם, כשהם מצביעים שוב, המיקום היחסי של כל שני פריטים בפרופיל ההעדפות המצומצם שלהם לא משתנה) נראה לי שאנחנו עדיין בסיטואציה המקורית – אנחנו הרי לא מתעניינים בצורה שבה מחשבים את פונקצית הרווחה החברתית, אלא רק בתוצאה הסופית שלה.
אבל פונקציית הרווחה החברתית שאתה מתאר צריכה לספק סדר מלא לכל המועמדים (עד כדי שוויון בין שני מועמדים). אני לא מעוניין בפונקציה כזו במקרה הזה. מה שאני מעוניין בו הוא במנצח אחד ברור, כאשר הסדר של האחרים לא משנה לי ולא אכפת לי עד כמה הוא נאמן להעדפות המצביעים. זה עדיין לא משנה? אתה יכול אולי להפנות אותי להוכחה של המשפט כדי שאבין בעצמי מה ההנחות ומהן הנקודות המרכזיות בה (או לפרט אותן בצורה יותר ריגורוזית בעצמך)?
הממ. עכשיו כשאני חושב על זה אז ההנחה המקלה שלי לא ממש עוזרת. תמיד אפשר לעשות את התהליך ההפוך ולהראות שאם ניתן לבחור מנצח ברור עבור N מועמדים בשיטה הזו, אז אפשר פשוט לזרוק אותו ולסדר היטב גם את המקום השני, וכך הלאה. לכן השיטה הזו באמת מתיימרת ליצור פונקציית רווחה חברתית שמקיימת את כל הדרישות, מה שמוביל לסתירה, כנראה.
כפי שאמרתי בפוסט, אפשר לדבר גם על "פונקצית בחירה חברתית", שמקבלת פרופילי העדפות ובוחרת "מנצח", בלי לדרג את היתר. יש גרסה דומה של משפט ארו גם עבור פונקציות בחירה שכאלו (האקסיומות שלה טיפה שונות, כמובן, אבל זהות ברוחן).
חשבתי שהספר (המתמטי והאיכותי) שאליו אני מקשר בתחילת הפוסט נחשב ל"הפניה"…
יובל: קל מאוד לראות את הבעייתיות של ההצעה שלך. בוא נניח בחירות ישירות בין לבני, ברק, ונתניהו (ונניח שברק נמצא משמאל ללבני). עכשיו נניח שבסיבוב הראשון כל אנשי השמאל המובהק (35%) מצביעים לברק, כל אנשי הימין המובהק (40%) מצביעים לנתניהו והמתנדנדים (25%) מצביעים ללבני. לסיבוב הבא יעלו ברק ונתניהו. עכשיו שים לב, ברור שנתניהו היה מפסיד ללבני בבחירות שבהן שניהם היו מתמודדים (אותו דבר נכון גם לגבי ברק כמובן) אבל בסופו של דבר דווקא שני אלה הם שיתמודד בסיבוב השני.
בצורה שאני למדתי את המשפט, האקסיומות הוגדרו קצת אחרת. אני מניח שזה שקול:
1. שיקוף העדפות הפרט: אם הפונקציה שלנו נותנת במצב כלשהו לחנין ערך גבוה מלחולדאי, אז בכל מצב אחר המתקבל על ידי כך שניקח את המצב הנתון, ונשפר את מעמדו של חנין על פני חולדאי בעיני הציבור, אז הפונקציה תמשיך לתת לחנין ערך גבוה מלחולדאי.
2. אי תלות בתוצאות לא רלוונטיות – מה שאמרת.
3. ריבונות אזרחית: כל תוצאה היא אפשרית – כלומר, קיים פרופיל של הבוחרים, שיוביל לתוצאה הזאת. את זה לא הזכרת. זה בטח מתחבא איפשהו בתוך הניסוח שלך לאקסיומה הראשונה.
עד כמה שידוע לי, האקסיומות שהצגתי אינן גוררות את האקסיומות שהצגת באופן מלא – הן חלשות יותר, ולכן השימוש בהן הופך את המשפט ל"חזק" יותר, כלומר מניח פחות. ייתכן שיש הוכחה פשוטה יותר עבור סט האקסיומות שהצגת ולכן בחרו ללמד את המשפט דווקא עבורן – אני לא בקיא בהוכחות השונות של המשפט.
פינגבאק: לוזון דיקטטור בחסות תורת המשחקים « מד' עד ת'
אהבתי מאוד את הספר ההוא.
איפה אפשר להשיג עוד ספרים כאלו(במובן של ספרים פורמליים ומתמטיים)?
בעברית? לא חושב שיש עוד, לפחות לא כאלו שנתקלתי בהם.
באנגלית? ובכן, העולם רחב, אם כי בארץ אפילו בחנויות האקדמיות המצב לא מזהיר.
פינגבאק: שאלות ותשובות – מקבץ מס’ 8 « לא מדויק