בחר לך דיקטטור

הוצאת מאגנס הוציאה לאחרונה ספר מתמטיקה בעברית העוסק בתורת המשחקים ונכתב בידי שלושה מתמטיקאים ישראלים - שמואל זמיר, אילון סולן, ומיכאל משלר שהזכרתי כבר בפוסט על בעיית "מי שהיה נשוי שלוש נשים" (ונפטר קרוב למועד סיום הספר). איני בקיא בתורת המשחקים ברמה שתאפשר לי לתת ביקורת אמיתית של הספר, אך הוא נראה לי רציני בהחלט ומקיף מאוד את הנושאים הבסיסיים, כך שאני ממליץ עליו בחום לכל מי שרוצה להכיר את הנושא. חשוב לציין שמדובר בספר מתמטי, שעיקרו הגדרות מדוייקות, משפטים והוכחות - לא דיבורים באוויר, כפי שקורה לעתים בספרי מדע פופולרי. מה שאני רוצה לכתוב עליו הפעם הוא דוגמה נאה לצורה שבה המתמטיקה הקונקרטית והקרה "מקלקלת" לנו את השאיפות האידאליסטיות - משפט אי האפשרות של ארו (שמסיבה לא ברורה מכונה לעתים "פרדוקס ארו" - זה כבר ממש זילות של המילה "פרדוקס").

המשפט (שהוכח על ידי הכלכלן קנת ארו בסביבות שנת 1951 - עשרים שנה לאחר מכן זכה ארו בפרס נובל לכלכלה) מהווה פחות או יותר את תחילתו של ענף מעניין בתורת המשחקים - תורת הבחירה החברתית (Social Choice). הבעיה הבסיסית שאיתה מתמודדת התורה היא זו: נניח שיש לנו קבוצה של מצביעים וקבוצה של תוצאות אפשריות. המצביעים מדרגים את התוצאות באופן מסויים - כיצד ניתן לבנות דירוג משותף עבור כל המצביעים מתוך הדירוגים האינדיבידואליים של כל אחד מהם?

מן הסתם לא חסרות דוגמאות מחיי היום יום לסיטואציה הזו. הדוגמה הבסיסית ביותר היא הליך הבחירות - כל מצביע "מדרג" את המפלגות באופן פשוט למדי - הוא בוחר מפלגה אחת שתהיה עדיפה בעיניו על כל שאר האפשרויות, ולשאר האפשרויות הוא "נשאר אדיש". כלומר, אם הצבעתי לכלב חץ לראשות תל אביב, פירוש הדבר המעשי הוא שמבחינת ההצבעה שלי אני אדיש בין חולדאי וחנין.

עוד דוגמה היא המשחקים האולימפיים - לחלק מהתחרויות (למשל, התעמלות) אין מדד אובייקטיבי של איכות (זמן, גובה וכו') אלא מספר שופטים (שאמנם, אמורים לקבל את החלטתם על פי שיקולים אובייקטיביים). כל שופט מדרג את הביצוע של כל אחד מהמתחרים, והדירוג של כלל השופטים משוקלל בצורה מסויימת לדירוג של כל המתחרים.

עוד דוגמה קלאסית סיפקה המורה לתנ"ך שלי. היה עלינו לבחור באיזה יום בשבוע תהיה שעת השלמה - שלישי אחר הצהריים, או שישי בבוקר. המורה נתנה לנו לערוך הצבעה דמוקרטית על האפשרות המועדפת. משהסתמן רוב מוחץ לטובת יום שלישי, המורה אמרה שטוב ויפה אבל בכל זאת שעת ההשלמה תתקיים (כפי שהיא רוצה) ביום שישי. כששאלנו אותה מדוע כל הליך ההצבעה הזה, אמרה לנו שרצתה שנגיע בעצמנו לתוצאה הנכונה.

הדוגמה האחרונה ממחישה את הסיטואציה שבה התוצאה נקבעת על פי ההעדפה של אחד מהמצביעים בלבד, בלי שום התחשבות בהעדפות של שאר המצביעים - למצביע האחד הזה קוראים (באופן מתאים ביותר) "דיקטטור". מה שמשפט אי האפשרות של ארו אומר, פחות או יותר, הוא שדיקטטורה היא הדרך היחידה להבטיח קיום של מספר תכונות בסיסיות (שנראות על פניו טריוויאליות) של הליך הבחירות. אפרט על כך בהמשך.

ראשית, מה הקשר לתורת המשחקים? ובכן, "משחק" הוא באופן כללי כל סיטואציה שבה יש "שחקנים" שצריכים לבחור בין אחת מכמה אפשרויות פעולה, על בסיס העדפות שיש להם, ותוך התחשבות בכך שגם הבחירות של שחקנים אחרים עשויות להשפיע על התוצאה הסופית. במקרה הזה ההעדפות של השחקנים מתבטאות בסדר על קבוצת התוצאות (על כך - עוד רגע) ואילו אפשרות הפעולה שבה הם בוחרים היא ההצבעה שלהם. כדאי לשים לב ששני הדברים הללו (ההעדפות וההצבעה) לא בהכרח זהים (אני רוצה שהכלב חץ ייבחר, אבל בגלל שאני פרקטי אצביע דווקא למישהו אחר ששמו מתחיל בח'). לא אכנס לכך בפוסט הזה, אך מדובר בנושא מרתק בפני עצמו.

כעת, כשאני אומר "סדר על קבוצת התוצאות", למה הכוונה? אפשר לתת לביטוי הזה מספר משמעויות, אך המשמעות היחידה שעליה אדבר (ובה עוסק המשפט) היא של סדר מלא - כלומר, אם נבוא לשחקן כלשהו ונציג בפניו שתי תוצאות אפשריות, הוא יעדיף תמיד אחת מהן על השנייה (ולא יעמוד ויגיד "אה... לא יודע ולא אכפת לי"). כלומר - גם אם חץ בשבילכם במקום הראשון, אתם עדיין חייבים להחליט מי במקום השני - חנין או חולדאי.

האובייקט המרכזי של תורת הבחירה החברתית הוא פונקצית הרווחה החברתית - פונקציה שמקבלת כקלט את ההעדפות של כל השחקנים (מה שמכונה "פרופיל העדפות"), ומוציאה כפלט סידור משל עצמה של קבוצת התוצאות - למשל - חץ במקום ראשון, חנין וחולדאי חולקים את המקום השני, וכו'. לפונקצית הרווחה החברתית כן מותר להיות "אדישה" בין תוצאות (להכניס אותן לאותו מקום) אחרת מהר מאוד יש לנו בעיות: מה קורה אם חצי מהמצביעים שמו את חולדאי במקום הראשון וחצי שמו את חנין? אם אחד משניהם יועדף ממש על השני, זה אומר שפונקצית הרווחה עצמה היא פונקציה מוטה.

פונקצית הרווחה החברתית מוציאה כפלט סידור של כל התוצאות האפשריות - כלומר, היא לא רק תגיד "חולדאי נבחר לראשות העיר", אלא גם תגיד "חץ הגיע למקום האחרון". אם כל מה שמעניין אותנו הוא מי נבחר, יש לפונקציה שזה הפלט היחיד שלה שם אחר - "פונקצית בחירה חברתית". גרסה קצת שונה של משפט ארו תקפה גם עבורה, ולכן לא נרחיב עליה יותר מדי.

אפשר להגדיר פונקציות רווחה חברתיות שונות מכאן ועד להודעה חדשה - המטרה היא כמובן להגדיר פונקציות שהן "הוגנות" עד כמה שרק ניתן - בדיוק בנסיון ההגדרתי הזה עוסק משפט ארו.
כבר הזכרתי את פונקצית הרווחה החברתית ה"דיקטטורית" - באופן פורמלי, היא לוקחת את כל ההעדפות של השחקנים, ומוציאה כפלט את ההעדפות של שחקן אחד ספציפי (תמיד אותו שחקן). המשמעות של פונקציה שכזו היא שהמשחק מכור מראש ואין לשאר השחקנים שום טעם להשתתף בו - לא משנה מה יהיו הבחירות שלהם, הם לא מסוגלים להשפיע על תוצאת המשחק. מכאן שזו לא ממש פונקציה שאנו רוצים לקבל כלגיטימית; ולכן אפשר לסמן בתור תכונה מס' 1 של פונקצית רווחה חברתית את הדרישה "הפונקציה אינה דיקטטורית".

ישנן עוד שתי תכונות סבירות שניתן לדרוש מפונקצית רווחה חברתית (יש הרבה תכונות, אבל שתי אלו מספיקות כדי להרוס הכל). הראשונה שבהן מכונה "פה-אחד" והיא כל כך מובנת מאליה שמביך שצריך לציין אותה במפורש - אם כל השחקנים העדיפו את אפשרות א' על פני אפשרות ב', אז גם בתוצאה הסופית אפשרות א' תהיה עדיפה על אפשרות ב'. כלומר, אם כולם העדיפו את חץ על פני חולדאי, אז חץ צריך להופיע אחרי חולדאי בתוצאה הסופית (בין אם חנין מופיע מעליו, בינו לבין חולדאי או אחרון). פונקצית רווחה חברתית שלא מקיימת את התכונה הזו היא יותר גרועה מדיקטטורית - היא "מרמה" את כולם!

התכונה הנוספת היא כנראה המלאכותית ביותר מבין השלוש, אך גם היא טבעית ומתבקשת מאוד לטעמי - "אי תלות באפשרויות לא רלוונטיות". לפני שאסביר אותה במדוייק, דוגמה פשוטה: נניח שהקרב בין חולדאי וחנין צמוד, ואף אחד לא מתעניין בחץ. דהיינו, אצל כל הבוחרים חץ במקום האחרון, ואילו אצל חלקם חולדאי במקום הראשון וחנין בשני, ואצל אחרים חולדאי במקום השני וחנין במקום הראשון. הבה נניח שבהינתן אוסף בחירות מסויימות פונקצית הרווחה החברתית מחזירה את חנין במקום הראשון, חולדאי בשני וחץ בשלישי. עד כה, הכל נשמע הגיוני.

אבל כעת נניח שחץ צבר פופולריות בקרב חלק מהמצביעים ועלה אצלם מהמקום השלישי לשני - כלומר, חלק מהמצביעים כעת מעדיפים את חץ על פני חולדאי (וחנין עדיין ראשון) ואילו אחרים מעדיפים את חץ על חנין (וחולדאי עדיין במקום הראשון). למרות מעשה הגבורה הזה, פונקצית הרווחה החברתית עדיין מחזירה את חץ במקום השלישי... אבל במקום הראשון היא שמה את חולדאי, לא את חנין. כלומר, ההתחזקות של חץ פגעה בחנין, למרות שהיא לא רלוונטית בכלל להעדפה של הבוחרים בין חולדאי וחנין - אף אחד לא הפסיק להעדיף את חנין על חולדאי רק בגלל שהוא התחיל להעדיף את חץ יותר מאשר את חולדאי!

ברור לנו היטב שבבחירות אמיתיות התופעה הזו מופיעה כל הזמן. המקרה המפורסם ביותר הוא כנראה של רוס פרו, מיליארדר אמריקאי שרץ כמועמד עצמאי בבחירות ב-1992 (גם ב-1996 אבל זה פחות חשוב) ויש טענות שהשפיע על תוצאות הבחירות (שבהן זכה במפתיע קלינטון הדמוקרטי ולא בוש הרפובליקני) למרות שכמובן שהגיע אחרון (באופן דומה הואשם גם ראלף ניידר בהפסד של אל גור לבוש הבן).

מבחינה פורמלית, התכונה הזו מוגדרת כך - אם יש לנו שני פרופילי העדפות, כך ששתי תוצאות מדורגות בהן באותו האופן האחת ביחס לשניה (כלומר, אם חנין מדורג מעל חולדאי באחת, הוא מדורג מעליו באחרת, וההפך), אז הדירוג היחסי של שתי התוצאות הללו זהה בפלט של פונקצית הרווחה החברתית עבור שני פרופילי ההעדפות הללו.

התכונה הזו היא המסמר האחרון בארון של פונקצית הרווחה החברתית. משפט ארו אומר בפשטות כך - כל פונקצית רווחה חברתית שמקיימת את התכונות "פה-אחד" ו"אי תלות באפשרויות לא רלוונטיות" ומדרגת לפחות שלוש תוצאות אפשריות, היא בהכרח דיקטטורית. לכן אי אפשר לבנות פונקצית רווחה חברתית לא דיקטטורית שמקיימת את שתי התכונות הפשוטות והמתבקשות הללו. כמה אכזרי מצד המתמטיקה. הוכחת המשפט אינה מסובכת במיוחד אך היא טכנית ולא אביא אותה כאן כרגע.

צריך להעיר הערה קטנה על ה"שלוש תוצאות אפשריות" שהגנבתי פתאום בניסוח שלעיל. אם יש רק שתי אפשרויות, תכונת ה"אי תלות באפשרויות לא רלוונטיות" הופכת בעצמה ללא-רלוונטית (אם יש רק שתי בחירות אפשריות, אף אחת מהן אינה "לא רלוונטית"). במקרה זה אין בעיה להגדיר פונקציות לא דיקטטוריות שיקיימו את "פה-אחד" - למשל, הצבעת הרוב (אם הרוב מעדיף את חולדאי על חנין, חולדאי ייבחר). זוהי ללא ספק נחמה כלשהי, שכן לעתים קרובות הבחירה היא רק בין שתי אפשרויות.

ישנם נושאים מרתקים רבים אחרים בספר של מאגנס ואני מקווה לפרט עליהם בפוסטים הבאים. אתם בהחלט מוזמנים לפרט בתגובות את סדר ההעדפות שלכם עבור הנושאים שאתם רוצים שאעסוק בהם תחילה - ואני מניח שאתם מבינים גם מה תהיה פונקצית הרווחה החברתית שבה אשתמש כדי להחליט.