ילדים (הסתברותיים) זה שמחה

תורת ההסתברות היא כר פורה לחידות שונות ומשונות שמעוררות ויכוחים מזוויעים, גם בקרב מתמטיקאים, מהטעם הפשוט שקיים פער גדול בין ניסוחים מתמטיים-פורמליים של בעיות, ובין ניסוחים מילוליים שלהם. הרבה פעמים המודל המילולי פשוט אינו מוגדר היטב וניתן למספר ניסוחים מתמטיים שונים ולא שקולים, והשאלה באיזה ניסוח מתמטי יש לבחור הופכת ל"פילוסופית" – ופילוסופיה (בפרט כשהיא נוחתת על מתמטיקאים) גורמת תמיד לויכוחים מזוויעים.

במקור נתקלתי בבעיה הזו כאשר באחת התגובות בבלוג קישרו לאתר שהציג אותה. באתר התפתח ויכוח ארוך כאורך הגלות שלא קראתי את כולו. אני צידדתי בפתרון שבאתר, ולא חשבתי עוד על השאלה עד שנתקלתי בה שוב לפני מספר ימים, הגעתי למסקנה שאפשר לכתוב עליה פוסט קצר ונחמד בבלוג, והתחלתי לכתוב. באמצע שמתי לב לכך שכל מה שחשבתי לא נכון, ושיש לחידה הזו עוקץ בעייתי יותר משנדמה. אם כן, נעבור לאקשן.

החידה הולכת כך: לחברכם הטוב יש שני ילדים, אך אין לכם שמץ של מושג מה מינם. אתם באים לביתו ודופקים על הדלת. את הדלת פותחת בת. מה ההסתברות שהילד השני הוא בן? באתר שקישרתי אליו לא הולכים לבית ודופקים על דלת אלא החבר עצמו מספר שאחד מילדיו הוא בת.

כמובן שיש בחידה הזו נתון מובלע – אנחנו מניחים שכאשר ילד נולד, בהסתברות $latex \frac{1}{2}$ הוא יהיה בן, ובהסתברות $latex \frac{1}{2}$ הוא יהיה בת. האינטואיציה שלנו אומרת לנו שאין תלות בין הלידה של הילד שפתח לנו את הילד והלידה של הילד השני – ולכן ההסתברות שהילד השני יהיה בת היא $latex \frac{1}{2}$. זה נשמע הגיוני, אלא שאז באים המתמטיקאים (והאתר) וטוענים שההסתברות היא בכלל $latex \frac{2}{3}$. איך זה ייתכן?

ובכן, הנימוק המתמטי ה"יבש" הוא זה: אפשר לחשוב על הרכב הילדים במשפחת החבר כאיבר במרחב הסתברותי שמכיל בסך הכל ארבעה איברים: $latex \left\{ GG,GB,BG,BB\right\} $, כש-$latex BG$ אומר "בן בכור, בת צעירה", $latex GB$ אומר "בת בכורה, בן צעיר" וכדומה. מה ההסתברות לקבלת כל איבר במרחב? בדיוק $latex \frac{1}{4}$; למשל, ההסתברות של $latex GB$ היא מכפלת ההסתברויות של "הילד הראשון יהיה בת" ($latex \frac{1}{2}$) ושל "הילד השני יהיה בן" (גם כן $latex \frac{1}{2}$). אנו כופלים את ההסתברויות שכן מאורעות אלו הם בלתי תלויים (כפי שכבר אמרתי – מינו של אחד הילדים לא משפיע על מינו של השני).

כעת, השאלה שלנו היא "בהינתן שידוע שאחד מהילדים היא בת, מה ההסתברות שהילד השני הוא בן"? וזוהי שאלה קלאסית בהסתברות מותנית. אם נסמן ב-$latex A$ את המאורע "יש בן במשפחה" וב-$latex B$ את המאורע "יש בת במשפחה" אז ההסתברות של $latex A$ בהינתן ש-$latex B$ נכון נתונה על ידי $latex \frac{P\left(A\cap B\right)}{P\left(B\right)}$. ההסתברות $latex P\left(A\cap B\right)$ היא בעצם ההסתברות של אחד משני האיברים $latex GB,BG$, כלומר $latex \frac{1}{2}$; וההסתברות $latex P\left(B\right)$ היא ההסתברות של אחד משלושת האיברים $latex GB,BG,GG$ (כל איבר פרט לזה שמייצג את "יש רק בנים במשפחה"), כלומר $latex \frac{3}{4}$. לכן סה"כ מקבלים הסתברות של $latex \frac{1/2}{3/4}=\frac{2}{3}$, וסיימנו. או שלא?

בואו ננסה להבין שוב מה הלך כאן כרגע. אמרתי "בהתחלה היו ארבע אפשרויות להרכב המשפחה. אפשרות אחת נפלה, כי אנחנו יודעים שיש בת במשפחה, ולכן כל אחת משלוש האפשרויות הנותרות סבירה באותה מידה, ובשתיים מהן יש בן במשפחה, אז הסיכוי לבן הוא $latex \frac{2}{3}$". לא יודע מה אתכם, אבל לי זה נשמע משכנע בהחלט. רק חבל שזה לא נכון.

הסיבה שזה לא נכון היא שיש נתון נוסף מאחורי הקלעים, שעד כה התייחסנו אליו באופן מאוד מאוד מובלע. הנתון הזה הוא השאלה "איך נבחר מי שיפתח את הדלת?" (או לחילופין, השאלה "איך החבר שמספר לך על הילדים בוחר על מי ומה לספר?"). כדי לראות שהשאלה הזו היא קריטית, הבה נבחן כמה סיטואציות אפשריות. אם, למשל, הבית שוביניסטי ויש בו חוק לפיו אם דופקים בדלת, אז בן זכר חייב לפתוח אלא אם אין בנים כאלו, אז אם בת פתחה לנו את הדלת ההסתברות שהילד השני הוא בן היא אפס, שהרי אם הוא היה בן, זה הוא שהיה פותח לנו את הדלת. הסתברות $latex 0$, ולא $latex \frac{2}{3}$; כבר אנחנו רואים שיש כאן בעיה.

אם, לעומת זאת, החוק היה "הילד הבכור תמיד פותח את הדלת", ההסתברות הייתה בבירור $latex \frac{1}{2}$, כי המין של הילד הבכור אינו תלוי במין של הילד הצעיר. פורמלית, המאורע "הבן הבכור שפתח את הדלת הוא זכר" מורכב מהאיברים $latex BG,BB$, והמאורע "הבן הבכור שפתח את הדלת הוא זכר והילד הנוסף הוא בת" מורכב מהאיבר הבודד $latex BG$, כך שההסתברות המותנית היא חצי, גם מבחינה מתמטית מדוייקת.

אם כן, היה לנו אפס והיה לנו חצי. לאן נעלם השני-שליש? אה, הוא חוזר אם אנחנו מניחים שהבית הוא פמיניסטי ואם יש בת, היא זו שפותחת את הדלת. במקרה זה, המאורע "בת פתחה את הדלת" מורכב מהאיברים $latex GB,BG,GG$ (כל האפשרויות פרט ל"יש רק בנים במשפחה"), וכאן שני שליש מהמאורעות אכן מייצגים משפחות עם בן, ולכן מקבלים הסתברות של $latex \frac{2}{3}$.

בקצרה, ההסתברות שמקבלים תלויה באופן קריטי בבחירה מסויימת שמתרחשת מאחורי הקלעים. אבל אף אחת משיטות הבחירה שהצגתי אינה "טבעית"; מה קורה אם שיטת הבחירה היא הפשוטה ביותר שניתן להעלות על הדעת בהקשר הזה, ולכן גם זו שכנראה רוב האנשים מניחים באופן בלתי מודע – ילד שנבחר באקראי משני הילדים פותח את הדלת? במקרה הזה עלינו להרחיב קצת את מרחב ההסתברות שלנו, כי מבוצעת בו שתי הגרלות – גם מגרילים את הרכב המשפחה, וגם מגרילים איזה ילד יפתח את הדלת. הדבר קצת דומה למה שקרה בוריאציה שהצגתי על בעית מונטי הול, זו שעסקה באסירים שעומדים להיות מוצאים להורג – גם שם, האופן שבו השומר בחר לספר דברים לאסירים השפיע על ההסתברות המותנית שלהם להיתלות.

אם כן, מרחב ההסתברות שהצגתי קודם היה טיפה "מזוייף". מרחב יותר מדוייק יכיל זוגות מהצורה $latex \left(BB,1\right)$ וכדומה, כשהמספר אומר מהו מספרו של הילד שפתח לנו את הדלת. במרחב הזה יש שמונה איברים (אילו?) שכולם שווי הסתברות. כעת, המאורע של "בת פתחה לנו את הדלת" הוא הקבוצה $latex \left\{ \left(GG,1\right),\left(GG,2\right),\left(GB,1\right),\left(BG,2\right)\right\} $. המאורע של "בת פתחה את הדלת וגם הילד השני הוא בן" הוא הקבוצה $latex \left\{ \left(GB,1\right),\left(BG,2\right)\right\} $. כלומר, ההסתברות היא $latex \frac{1}{2}$, כמו שהאינטואיציה אומרת. זו הבעיה המרכזית בחידה הזו – הניתוח המתמטי הפשטני (זה שפשוט חוטף את המאורע $latex \left\{ GB,BG,GG\right\} $ ללא הצדקה) נותן תוצאה שונה מהאינטואיציה ולכן החידה מקבלת הילה מונטי-הולית סביבה. יש כאן לקח טוב – אם כבר מנסים ללכת באופן מתמטי ומדויק, צריך ללכת עם זה עד הסוף ולא להשאיר אף הנחה קבורה מתחת לפני השטח.

24 תגובות על הפוסט “ילדים (הסתברותיים) זה שמחה

  1. אכן מעולה, אבל אני חולק על המסקנה שלך, או לפחות על אופן ההצגה.
    אתה צודק, כמובן, בטענה המרכזית לגבי ניסוח רשלני או לפחות לא מוגדר היטב של בעיות מתמטיות בשפה טבעית, אבל השינוי הקל שערכת (פתיחת דלת במקום מסירת מידע) משנה את החידה לטעמי, ואת הפרשנות המתמטית הסבירה למידע החדש.
    בפתיחת דלת אין ספק שהפרשנות הראויה היא להניח שאחד הילדים פתח את הדלת באופן אקראי, כאשא ההורה מוסר מידע הפרשנות הסבירה היא שהשאלה האם יש לו בת אחת לפחות עלתה בשיחה ולכן, בפועל אנחנו נמצאים במצב של "בית פמיניסטי".

  2. מה שאתה אומר רק מדגים עד כמה הניסוח המילולי הוא "רגיש לרעש". אם למשל מה שהאב הגאה היה עושה היה לשלוף תמונה של אחד מהילדים ולהראות לך, שוב אפשר היה להגיד שהילד נבחר באקראי. לא ברור מה הנסיבות שבהן האב מוסר מידע, וכו'. המסקנה הפשוטה היא שאי אפשר להסיק עוד מידע מהנתון הבודד בלי לדעת את ההקשר שלו.

    בכל מקרה הפואנטה היא לא מה הפרשנות ה"נכונה" אלא זה שיש צורך בבחירה חד משמעית של פרשנות. מה ש"הרגיז" אותי וגרם לי לכתוב את הפוסט הזה הוא שנתקלתי במספר מקומות שבהם מצדדי ה-2/3 אמרו למצדדי ה-1/2 "אתם טועים" בלי שיטרחו לציין במפורש את הפרשנות שהם מניחים (או אולי אפילו בלי שהבינו שהם מניחים אותה). מין עריצות מתמטית שכזו.

  3. מעולה! הכרתי את הבעיה, ואפילו לימדתי אותה כמה פעמים, אבל שכנעת אותי במאה אחוז.

  4. יפה ונכון (כמובן שאם שואלים את האב האם אחד מילדיך הוא בת והתשובה חיובית הסיכוי שישנו בן הוא 2/3, יחי ההבדל הדק שהדגשת). אעיר שגם בבעיית מונטי היל יש הנחה שלעיתים נותרת סמוייה בהסברים רשלניים לגבי אופן פעולת המנחה. אם בבעייה זאת נופל וילון בטעות ורצה המקרה ווילון זה אינו הוילון עליו הצביע המשתתף ואין מאחוריו פרס אזי ההסתברות שהפרס הוא מאחורי הוילון המקורי נותר 1/2.

  5. גם אני מאומרי המעולה.
    לא הכרתי את הבעיה ואכן האינטואיציה הראשונה שלי הייתה בהשראת המונטי הול כלומר 2/3. לקח עוד כמה שניות (וכמה שורות מנחות) כדי לעלות על זה של GG יש הסתברות גבוהה יותר ( מלBG או מלGB) לפתיחת הדלת ע"י G. באמת בעיה יפה.

  6. מעולה.
    חבר שאל אותי שאלה טורדת מנוחה ואולי לך יהיה רעיון איך, אם בכלל, אפשר לפתור אותה.
    נניח שאני בוחר בין שתי מעטפות, הסכומים לא ידועים, אבל באחת יש סכום כפול מהשניה.
    בחרתי מעטפה ונותן המעטפה מאפשר לי להחליף. (זה לא מונטי הול. רגע!).
    להבנתי שווה לי להחליף כי התוחלת של ההחלפה חיובית: סכום גדול כפול 50% גדול מסכום קטן כפול 50%. אני מרוויח במקרה הטוב יותר משאני נפגע במקרה הלא טוב.
    עד פה אחלה.
    עכשיו שוב מאפשרים לי להחליף. בגלל שההגיון לעיל נשמר, אני אחליף שוב. ושוב. ושוב.
    פ ר ד ו ק ס ??

  7. תודה רבה.
    (אני לא בטוח שהבנתי מספיק כדי להיות מסוגל להירדם בלילה, אבל תודה!)
    אגב, לא קיבלתי אימייל עדכון על כך שהגבת לי, נראה לי שכדאי להגדיר תגובה אוטואטית שכזו ….

  8. יפה לראות איך תחת הנחת בחירה אקראית של פותח הדלת, חוזרת ההצדקה לאינטואיציה המקורית, לפיה מין הילד שפותח את הדלת איננו נותן מידע נוסף על מין הילד הנסתר, ומכאן התשובה היא חצי.

  9. לא חשבתי על הענין עם חוקי הבחירה האפשריים, אבל כיוון שהנחתי שהבחירה היא אקראית זה ברור שהאפשרות GG שונה מBG וGB, וגם שאיפהשהו בהסבר יש טעות כיוון שברור שההסתברות היא 1/2.

    בנוסף, אני לא מקבל את ההסבר שלך לבעית המעטפות, אבל הפתרון שלה הוא העובדה שבשביל חישוב התוחלת של ההחלפה הראשונה השתמשת בשיקול הסתברותי מסוים, שאם אתה מסתכל עליו אתה רואה שלא כדאי לך להחליף בפעם השניה. לכן, כיוון שההחלפה השניה זהה באופן מהותי להחלפה הראשונה, לא כדאי להחליף בכלל.

  10. אני מכיר את הוריאציה הזו ולא חושבת שהיא מעניינת במיוחד לכשעצמה – הניתוח הוא אותו ניתוח. הפתרונות שם מתעלמים מהבעייתיות האמיתית שחבויה בבעיה, וחבל ("הפתרון שלי מבוסס על תורת הקבוצות" מכיל את אותה הנחה סמויה שנגדה אני יוצא בפוסט).

  11. אני לא מסכים עם ה"זה רק מראה", אבל בשביל לנהל דיון על הנושא תצטרך לעבוד קצת יותר כדי לתת ניסוח מדויק לטענה שלך.

  12. מה רע בהסבר פשוט יותר:
    בהנחה שבחירת הילד הפותח את הדלת ומין הילד הנולד הם מאורעות בלתי תלויים (כפי שהראית – הנחה חשובה) – ההסתברות לכל אחד מן המינים של הילד השני היא 1/2.
    ?

  13. זה לא נכון לומר ש"ההסתברות היא 2/3 משום שיש 2 אפשרויות בהן הילד השני הוא בן ואפשרות אחת בה הילד השני הוא בת", כיוון שאם בוחרים אחת מהאפשרויות, מיד מתבטלת אפשרות אחרת מתוך השלוש, ואנו נשארים עם שתי אפשרויות. אני אנסה להסביר.
    אם נתון שאחד הילדים הוא בת, ההסתברות שגם הילד השני יהיה בת היא חצי כיוון שהבת הנתונה יכולה להיות או בת בכורה, או בת צעירה. וכאן בעצם כולם נפלו כשניגשו לפתור את החידה. עכשיו, כשהסברתי את זה, נרחיב את האפשרויות ל-4. או שהיא הבת הבכורה מבין שתי בנות, או הבת הצעירה מבין שתי בנות, או שהיא אחות צעירה לאח בכור, או אחות בכורה לאח קטן.
    אז במצב שבו נתונה בת, יהיה נכון יותר לכתוב ככה:
    Bb / Bg / Gg / Gb
    ולאחר שנסנן את Bb, כיוון שמקרה בו ישנם שני בנים אינו רלוונטי לשאלה מאחר ונתונה בת, נישאר עם:
    Bg / Gg / Gb
    כאמור, הבת הנתונה מוכרחה להיות או בכורה (G), או צעירה (g), כי הרי לא יכול להיות שהיא גם וגם, לכן בכל פעם שנעסוק בהגדרה מסוימת, בכורה או צעירה, ניאלץ מיד להוציא מן המשוואה את המקרה שאינו עונה להגדרה.
    לכן, אם הבת הנתונה היא בכורה (G), נעסוק רק במקרים בהם היא עונה להגדרה בכורה, והם:
    Gg / Gb
    אז הילד השני הוא או b, או g. לכן ההסתברות היא חצי.
    ואם הבת הנתונה היא צעירה (g), נעסוק רק במקרים בהם היא עונה להגדרה צעירה, והם:
    Bg / Gg
    אז הילד השני הוא או B, או G. לכן ההסתברות היא חצי.
    הסיבה שגם ההסתברות הכוללת היא חצי, היא שאלו שני מאורעות היפותטיים שונים אשר כל אחד בפני עצמו מייצג את המציאות בנסיבות מסוימות ולכן אין ביניהם כל קשר.

  14. אפשר גם להסתכל על זה כך:
    הסיכוי שהבת תהיה בכורה הוא חצי, והסיכוי שהילד השני הוא בן הוא גם חצי, לכן הסיכוי לכך שגם הבת בכורה וגם הילד השני הוא בן, הוא חצי כפול חצי, שזה רבע.
    בנוסף, הסיכוי שהבת תהיה צעירה הוא חצי, והסיכוי שהילד השני הוא בן הוא גם חצי, לכן הסיכוי לכך שגם הבת צעירה וגם הילד השני הוא בן, הוא חצי כפול חצי, שזה רבע.
    נחבר רבע ועוד רבע, נקבל סך הכול חצי.
    אני בשום אופן לא מקבל את זה שהסיכוי לכך הוא שני שליש. זו פשוט טעות, בלי קשר לאיך שהשאלה מנוסחת.

  15. זה בדיוק מה שניסיתי להסביר, שגם לניסוח שהבאת התשובה היא חצי.
    במציאות אחת, לא ייתכן שהילדה שפתחה את הדלת היא גם בכורה וגם צעירה, לכן הטענה שיש 2 אפשרויות מתוך שלוש היא שגויה. יש רק אפשרות אחת מתוך שתיים, בכל מציאות. תנסה לחשוב על מה שאמרתי בלי לפחד לסתור את ה"מתמטיקאים". לדעתי הם סתם ניסו להתחכם.

  16. תודה על החידה והניתוח המעניין.
    אחת האמירות שחוזרות גם בניתוח וגם בתגובות שקראתי ושמעתי, היא: "האינטואיציה אומרת שמין הילד שפותח את הדלת איננו נותן מידע נוסף על מין הילד הנסתר, ומכאן התשובה היא חצי – שזו ההסתברות שהילד הנסתר הוא בת בלי קשר לכלום".

    הטיעון הזה, לדעתי, בעייתי.
    אדגים.
    במדינת "זכריסטאן", יש תופעה מוזרה אך עקבית – בכל משפחה, הילד הראשון הוא בן בהסתברות 2/3, ובת בהסתברות 1/3. לעומת זאת, בילד השני ההסתברויות חוזרות להיות "טבעיות", כלומר 1/2 לבן ו-1/2 לבת.
    כמו כן בואו נניח שבכל המשפחות יש שני ילדים בדיוק, ללא תאומים.
    במקרה זה, אם נתפוס ילד אקראי ברחוב בבירת זכריסטאן (שאני מניח ששמה הוא "פינסק"), הרי שההסתברות היא 7:5 , או 7/12, שתפסנו בן.
    עכשיו נחזור לשאלה המקורית – הלכנו לבקר חבר בזכריסטאן, ואת הדלת פתחה בת.
    אם נפעיל את הנימוק האינטואיטיבי, אז "אין לנו מידע לגבי מין הילד השני, לכן ההסתברות היא 7:5 שזה בן".
    אך אם נציין את המאורעות לפי שיטתך, אזי המאורעות (BG2, GB1, GG1, GG2) אינם שווי-הסתברות – BG2 הוא סביר יותר מהאחרים, בדיוק פי שניים. כך מתקבל שהילד השני הוא בת בהסתברות 2/5 (40%), ולא 5/12 (41.6%) כפי שהאינטואיציה מטעה אותנו לחשוב.

  17. לדן: המרחב שאתה תיארת אינו סותר את האינטואיציה כי ההסתברות שבת תפתח את הדלת אינה שוות ערך להסתברות שבן יפתח את הדלת ולכן היא משפיעה על התוצאה

  18. יוסי:

    "מה קורה אם שיטת הבחירה היא הפשוטה ביותר שניתן להעלות על הדעת בהקשר הזה, ולכן גם זו שכנראה רוב האנשים מניחים באופן בלתי מודע – ילד שנבחר באקראי משני הילדים פותח את הדלת? במקרה הזה עלינו להרחיב קצת את מרחב ההסתברות שלנו, כי מבוצעת בו שתי הגרלות – גם מגרילים את הרכב המשפחה, וגם מגרילים איזה ילד יפתח את הדלת."

    יש כאן שלוש הגרלות בלתי תלויות:
    1) מין הילד הראשון.
    2) מין הילד השני.
    3) מספר הילד שפותח את הדלת.

    בכל אחת משלוש ההגרלות הללו, ההסתברות לכל אפשרות היא 1/2. לכן BB1 היא בעלת הסתברות 1/8.

    אם אתה לא מסכים, תצטרך להסביר קצת יותר.

כתיבת תגובה

האימייל לא יוצג באתר.