הפרדוקס של בנך-טרסקי (חלק ג' ואחרון)

תקציר הפרקים הקודמים: הראיתי את פרדוקס האוסדורף, או כפי שהעדפתי לקרוא לו, "פרדוקס כמעט בנך-טרסקי". פרדוקס האוסדורף אמר כי ניתן לקחת את ספירת היחידה במרחב התלת ממדי \(S^{2}\) (פניו של כדור שרדיוסו 1), להעיף מתוכה קבוצה בת-מניה של נקודות \(D\), והתוצאה \(S^{2}\backslash D\) תהיה קבוצה פרדוקסלית, כלומר ניתן יהיה לפרק אותה לשתי משפחות של תת קבוצות שכל אחת בנפרד מרכיבה את \(S^{2}\backslash D\), אחרי שמפעילים על איבריה אי-אלו איזומטריות.

פרדוקס בנך-טרסקי עצמו הוא אותו הדבר, רק שבמקום \(S^{2}\backslash D\) הקבוצה שאותה תוקפים היא כדור היחידה עצמו. בפוסט הזה נסתום את החורים שבפרדוקס האוסדורף, תרתי משמעי, ונקבל את בנך-טרסקי.

הרעיון הבסיסי הוא שאין צורך להוכיח את בנך-טרסקי במפורש עבור \(S^{2}\); מספיק שנראה שאפשר לפרק את \(S^{2}\), להפעיל על הפירוק איזומטריות ולקבל את \(S^{2}\backslash D\). בואו נטפל ברעיון הזה בצורה קצת יותר כללית. נאמר ששתי קבוצות \(A,B\) הן חופפות בחלקים אם אפשר לפרק אותן לשתי סדרות של קבוצות זרות \(A=A_{1}\cup A_{2}\cup\dots\cup A_{n},B=B_{1}\cup B_{2}\cup\dots\cup B_{n}\) כך שלכל \(i\) מתקיים \(g_{i}\left(A_{i}\right)=B_{i}\) עבור איזומטריה \(g_{i}\) כלשהי. די פשוט לראות שחפיפה בחלקים היא יחס שקילות – \(A\) בוודאי חופפת בחלקים לעצמה (קחו כל פירוק שתרצו ואת איזומטריות הזהות). אם \(A\) חופפת ל-\(B\) אז \(B\) חופפת ל-\(A\) (כי אם \(g_{i}\left(A_{i}\right)=B_{i}\) אז \(g_{i}^{-1}\left(B_{i}\right)=A_{i}\)). רק תכונת הטרנזיטיביות – שאם \(A\) חופפת ל-\(B\) ו-\(B\) חופפת ל-\(C\) – מהווה קצת אתגר. הרעיון הוא לקחת את שני הפירוקים של \(B\) – זה שמותאם לחפיפה ל-\(A\) וזה שמותאם לחפיפה ל-\(C\), ו"לחתוך" אותם (כל חתיכה בפירוק לפי \(A\) לחתוך לפלחים כשכל פלח שייך לחיתוך של החתיכה עם חתיכה בפירוק לפי \(C\)). מי שסקרן לא יתקשה להשלים את הפרטים בעצמו. שימו לב שאם בפירוק של \(A,B\) יש \(n\) חתיכות ובפירוק של \(B,C\) יש \(m\) חתיכות, אז בפירוק של \(A,C\) יש \(mn\) חתיכות, כלומר מספר החתיכות עשוי לגדול (ולמקרה שזה מסקרן אתכם, נסו למצוא דוגמה נגדית שמוכיחה כי "חופף ב-\(n\) חלקים" איננו יחס שקילות בדיוק בגלל בעיה זו).

נסמן \(A\sim B\) אם \(A,B\) חופפות בחלקים. אז ראשית, שימו לב שקל לתאר כעת מהי קבוצה פרדוקסלית: זוהי קבוצה \(E\) כך ש-\(E=A\uplus B\) ו-\(A\sim B\sim E\). שנית, את מה שאני רוצה להוכיח אפשר לתאר כעת בתור – אני רוצה להוכיח שאם \(A\sim B\) ו-\(B\) פרדוקסלית, כך גם \(A\), ואני רוצה להוכיח ש-\(S^{2}\sim S^{2}\backslash D\).

נתחיל מהטענה הראשונה. נניח ש-\(B\) פרדוקסלית עם פירוק ל-\(B_{1},B_{2}\). ניקח את הפירוקים של \(A,B\) שמראים את החפיפה שלהם, וכמו שעושים בהוכחה של הטרנזיטיביות – נפרק אותם עוד – כל חתיכה נפרק לשני חלקים, החלק האחד כולל את מה ששייך ל-\(B_{1}\), והשני את מה ששייך ל-\(B_{2}\). נקבל מזה פירוק של \(A\) לשתי קבוצות זרות \(A_{1},A_{2}\) כך ש-\(A_{1}\sim B_{1}\sim B\sim A\) ואותו הדבר עבור \(A_{2}\). זה מראה את הפרדוקסליות של \(A\).

נותר להוכיח כי \(S^{2}\sim S^{2}\backslash D\). התעלול שבו משתמשים פה הוא פשוט אך מחוכם ויפה; כדי להבין אותו בואו ניזכר קודם כל במקום אחר שבו משתמשים בתעלולים שכאלו ודיברתי עליו לא מזמן – המלון של הילברט. במלון של הילברט היה חדר לכל מספר טבעי וכל החדרים היו תפוסים, ואז הגיע אורח חדש. כדי לפנות לו מקום, את האורח בחדר 0 (בואו נניח שהטבעיים מתחילים מ-0; זה ישתלם בהמשך) העברנו לחדר 1 ואז התפנה לאורח החדש מקום בחדר 0. לרוע המזל, עכשיו נוצרה התנגשות בחדר 1 בין הדייר החדש והדייר הישן, אז העברנו את הדייר הישן של חדר 1 לחדר 2, וכן הלאה עד אינסוף. בואו נכתוב פורמלית את מה שעשינו פה – גם זה ישתלם לנו בקרוב. כדי לעשות את הסיטואציה עוד יותר דומה לזו שלנו, נניח שהמלון של הילברט גדול עוד יותר משמספרים לכם, ויש בו חדר לכל מספר רציונלי, כך שכל הטירוף של שיכון האורח החדש מתרחש בסך הכל באחד המסדרונות שלו ורוב האורחים במלון לא שמים אליו לב. אסמן את כל החדרים במלון ב-\(H\) (מלשון הילברט, או Hotel, איך שתרצו), ב-\(D\) את הקבוצה \(D=\left\{ 0\right\} \), וב-\(g\) את הפונקציה \(g\left(n\right)=n+1\), שמזיזה את האורחים במסדרון של הטבעיים חדר. לסיום אסמן ב-\(\overline{D}\) את ה"סגור" של \(D\) ביחס לפונקציה \(g\), כלומר את הקבוצה \(\overline{D}=\left\{ g^{n}\left(D\right)|n\in\mathbb{N}\right\} \).

מכיוון ש-\(g\) היא פונקציה חד חד ערכית, אז \(\overline{D}\) שווה בגודלו ל-\(g\left(\overline{D}\right)\). אבל מהו \(g\left(\overline{D}\right)\)? זה בסך הכל \(\overline{D}\) כשהוצאנו ממנו את \(D\) המקורי, כלומר את חדר מספר 0. עכשיו ניתן לתאר מתמטית את התעלול שעשינו בתור \(H=\left(H\backslash\overline{D}\right)\cup\overline{D}\cong\left(H\backslash\overline{D}\right)\cup g\left(\overline{D}\right)=H\backslash D\). במילים: המלון \(H\) "חופף" למלון \(H\) כאשר החדר \(D\) בו פנוי. אולי אתם תוהים למה הייתי צריך להסתרבל כל כך כדי לכתוב את הטריק הפשוט הזה של הילברט – ובכן, מכיוון שמה שנעשה עכשיו עם בנך-טרסקי הוא אותו הדבר בדיוק. עד לרמת הסימונים.

נחזור לבנך-טרסקי. הקבוצה \(H\) אצלנו היא \(S^{2}\). הקבוצה \(D\) אצלנו היא תת-קבוצה בת מניה כלשהי של \(S^{2}\) (פרט לכך שהיא בת מניה שום דבר לא מעניין אותנו בה). בואו נניח שהצלחנו רגע למצוא איזומטריה של המרחב \(g\) כך שהקבוצות \(D,g\left(D\right),g^{2}\left(D\right),\dots\) יהיו זרות זו לזו (חשבו על \(D\) בתור האורחים החדשים במלון, על \(g\left(D\right)\) בתור האורחים שפונו כדי לפנות להם חדר, על \(g^{2}\left(D\right)\) בתור האורחים שפונו כדי לפנות לאורחים שפונו חדר וכו'). נגדיר \(\overline{D}=\left\{ g^{n}\left(D\right)|n\in\mathbb{N}\right\} \) כמו קודם, ונקבל ש-\(g\left(\overline{D}\right)\) זהה ל-\(\overline{D}\) ללא \(D\) (בשביל זה הכרחי ש-\(g\) לא תגרום ל"התנגשות" – לכך שאם מפעילים אותה על איבר כלשהו ב-\(\overline{D}\) מקבלים מישהו מתוך \(D\)). לכן נקבל ש-\(S^{2}=\left(S^{2}\backslash\overline{D}\right)\cup\overline{D}\sim\left(S^{2}\backslash\overline{D}\right)\cup g\left(\overline{D}\right)=S^{2}\backslash D\) – כאן החפיפה היא בדיוק עם שני חלקים, \(S^{2}\backslash\overline{D}\) ו-\(\overline{D}\).

הסבר מילולי קצר של מה שהלך כאן – השתמשנו בתעלול תורת-קבוצותניקי פשוט כדי להראות ש-\(S^{2}\) חופפת ל-\(S^{2}\backslash D\) – "החבאנו" את האיברים של \(D\) אי שם בתוך \(S^{2}\). לצורך כך היינו חייבים "לפנות" חלק מהאיברים של \(S^{2}\), אז העברנו אותם למקום אחר ב-\(S^{2}\), ואת התושבים שלו פינינו, וכן הלאה עד אינסוף. כמו במלון של הילברט כך גם כאן, התוצר הכולל של התהליך האינסופי הזה הוא שלכולם יש חדר וכולם מרוצים. ההבדל המהותי היחיד בין המלון של הילברט לסיטואציה הנוכחית הוא שהסיטואציה הנוכחית היא גאומטרית וה"הזזה" של איברים הייתה חייבת להיות באמצעות פונקציה שמכבדת את הגאומטריה הזו – איזומטריה \(g\). כל שנותר להסביר הוא איך מוצאים כזו בכלל. כאן העובדה ש-\(D\) בת מניה חוזרת להיות חשובה.

האופן שבו מוצאים את \(g\) הוא לא קונסטרוקטיבי. פשוט יש המון איזומטריות שאפשר לבחור ורק מספר קטן (בן מניה) שלהן הן לא מוצלחות. בוחרים ישר כלשהו שעובר דרך הראשית ולא פוגע ב-\(D\) (יש כזה כי יש מספר לא בן מניה של ישרים שעוברים דרך הראשית, ורק מספר בן מניה של נקודות ב-\(D\)). עכשיו מסתכלים על אוסף כל הסיבובים שאותו ישר הם ציר הסיבוב שלהם – שוב, יש מספר לא בן מניה של סיבובים שכאלו, כי יש מספר לא בן מניה של זוויות \(\theta\) שבהן אפשר לסובב. נסמן סיבוב בזווית \(\theta\) בתור \(g_{\theta}\).

בגלל שציר הסיבוב לא פוגע ב-\(D\), כל שני סיבובים בזווית בין 0 ל-360 מעלות פועלים בצורה שונה על כל אברי \(D\) (במילים אחרות, אם \(g_{\theta_{1}}\left(p\right)=g_{\theta_{2}}\left(p\right)\) עבור \(p\in D\) כלשהו, אז \(\theta_{1}=\theta_{2}\); אם ציר הסיבוב היה דרך נקודה ב-\(D\) אז היא הייתה עוברת לעצמה עבור כל סיבוב בכל זווית ולכן זה לא היה עובד). זה מאפשר לנו לתחום בצורה פשוטה את כל הסיבובים ה"רעים": \(\theta\) היא זווית רעה לסיבוב אם קיים \(n>0\) טבעי וקיימות נקודות \(p,q\in D\) כך ש-\(g_{\theta}^{n}\left(p\right)=q\) – כי, כאמור, אנחנו רוצים לוודא ש-\(g\) שאנו בונים לא יכולה לשלוח נקודה מ-\(D\) חזרה אל \(D\) ולא משנה כמה פעמים מפעילים אותה.

נשים לב שהשלשה \(\left(n,p,q\right)\) קובעת באופן יחיד את \(\theta\), בגלל התכונה שתיארתי לפני רגע. מספר השלשות הללו הוא בן מניה שכן \(n\) הוא מספר טבעי ואילו \(p,q\) שניהם איברים של קבוצה בת מניה. מכאן שיש רק מספר בן מניה של זוויות \(\theta\) "רעות", ומכיוון שיש מספר לא בן מניה של זוויות \(\theta\) שאפשר לבחור, קיימת אחת שאיננה רעה. \(g_{\theta}\) עבורה תהיה האיזומטריה \(g\) המבוקשת. זה מסיים את הוכחת פרדוקס בנך-טרסקי.

רגע, רגע, איך זה מסיים את זה? בנך-טרסקי, כזכור, מתואר בדרך כלל עבור כדור, לא עבור ספירה, שהיא רק המעטפת של הכדור. אז כאן יש עוד שני טריקים קטנים שצריך לבצע. בתור התחלה, שימו לב לכך שההוכחה של בנך-טרסקי עבור ספירה לא השתמשה בשום מקום בכך שהספירה היא מרדיוס 1; ההוכחה עובדת עבור ספירה מכל רדיוס, והאיזומטריות שבהן משתמשים בפירוקים הפרדוקסליים של הספירות הן בדיוק אותן איזומטריות. כעת, שימו לב שאפשר לחשוב על כדור כעל אוסף של אינסוף ספירות – כדור היחידה, למשל, הוא איחוד כל הספירות מרדיוס קטן או שווה מ-1, ועוד הנקודה שבראשית הצירים. נסמן את הכדור ב-\(B\), אז פורמלית ניתן לומר כי \(B\backslash\left\{ 0\right\} =\bigcup_{r\le1}S^{2}\left(r\right)\), כאשר \(S^{2}\left(r\right)\) היא הספירה מרדיוס \(r\).

אם כן, \(B\backslash\left\{ 0\right\} \) היא קבוצה פרדוקסלית – כדי לקבל את הפירוק הפרדוקסלי שלה, פשוט ניקח את איחוד הפירוקים הפרדוקסליים של כל הספירות שמרכיבות אותה. זה כמעט מסיים את ההוכחה, רק שעדיין יש לנו את נקודת האמצע החסרה הזו. האם אתם יכולים לנחש באיזה טריק נשתמש כדי להיפטר ממנה? בדיוק באותו טריק שבו השתמשנו קודם כדי להיפטר מה-\(D\) שהציקה לנו. כאן ראשית הצירים היא האורח החדש במלון של הילברט, ו-\(B\) הוא המלון עצמו. פורמלית, ניקח איזומטריה \(g\) שהיא סיבוב בזווית אי רציונלית ביחס לאיזה שהוא ישר המפספס את ראשית הצירים. העובדה שהזווית היא אי רציונלית גורמת לכך ש-\(g\) תהיה מסדר אינסופי, כלומר \(g^{n}\left(x\right)\ne g^{m}\left(x\right)\) לכל \(n\ne m\). נגדיר \(D=\left\{ 0\right\} \) ו-\(\overline{D}=\left\{ g^{n}\left(0\right)|n\ge0\right\} \) וההוכחה שהראינו למעלה תעבוד שוב ותראה ש-\(B\backslash\left\{ 0\right\} \sim B\). סיימנו את בנך-טרסקי.

מה שלא הוכחתי הוא את הגרסה הפופולרית של בנך-טרסקי: "ניתן לפרק את כדור היחידה לחמישה חלקים, ו…". אם תעקבו אחרי ההוכחה שלי בפירוט, השימושים התכופים שלי בכך ששתי קבוצות הן חופפות מאלצות אותי להשתמש ביותר חלקים. ניתן לצמצם את המספר לחמש באמצעות תעלולים טכניים, אבל אני מעדיף בהרבה את ההוכחה ה"נקייה" שנתתי, גם אם מספר החלקים בפירוק (שהוא עדיין סופי) איננו עגול ויפה כמו 5. לכן אעצור כאן.

לסיום, אני רוצה לסכם את ההוכחה, כדי שנבין בדיוק את כל השלבים שמובילים לפרדוקס.

  1. הראינו שהחבורה החופשית עם שני יוצרים היא פרדוקסלית. הפרדוקסליות של החבורה הזו היא הבסיס לפירוקים פרדוקסליים רבים, לא רק זה של בנך-טרסקי.
  2. הראינו (או יותר נכון, נפנפתי בידיים בנקודה הזו) שחבורת האיזומטריות של המרחב מכילה תת-חבורה חופשית עם שני יוצרים.
  3. הראינו שיש קבוצה \(D\) כך ש-\(S^{2}\backslash D\) היא בעלת התכונה שאותה תת-חבורה חופשית של איזומטריות אינה כוללת נקודות שבת ב-\(S^{2}\backslash D\) (פשוט העפנו אותן – זה היה \(D\)).
  4. הראינו משפט כללי יותר, שאם חבורה פרדוקסלית פועלת על קבוצה ואין לפעולה נקודות שבת, אז גם הקבוצה פרדוקסלית. מכאן הסקנו ש-\(S^{2}\backslash D\) פרדוקסלית.
  5. הראינו ש-\(S^{2}\backslash D\sim S^{2}\) ולכן גם \(S^{2}\) פרדוקסלית.
  6. הראינו ש-\(B\backslash\left\{ 0\right\} \) פרדוקסלית כי ניתן להציג אותה כאיחוד של \(S^{2}\)-ים מרדיוסים שונים.
  7. הראינו ש-\(B\backslash\left\{ 0\right\} \sim B\) ולכן גם \(B\) פרדוקסלית.

בשלב 4, בהוכחת המשפט הכללי השתמשנו השתמש באקסיומת הבחירה (זה השלב היחיד בהוכחה שבו אנו נזקקים לו), וזאת כדי לבחור נציגים למסלולים של הפעולה של החבורה על הקבוצה. אותם נציגים הם ה"גרעין" שממנו נבנות החתיכות בפירוק הפרדוקסלי; כלומר, אקסיומת הבחירה נדרשה בדיוק בשביל השלב שבו אנחנו מפרקים את הספירה לחתיכות – אפשר, אינטואיטיבית, לחשוב על זה כאילו החתיכות הללו כל כך מוזרות ומעוותות, שהבניה שלהן היא בהכרח לא קונסטרוקטיבית. אפשר לחשוב כך, אבל כאמור – זו דרך חשיבה מסוכנת, כי הראיתי פרדוקס דמוי בנך-טרסקי שבו כן יש לנו בניה קונסטרוקטיבית.

אם כן, לסיום, איך אני מסביר את המוזרות של בנך-טרסקי? איך ייתכן שאנחנו מכפילים כך את המסה של כדור? התשובה המיידית היא שהחתיכות בפירוק הן לא בעלות מסה מוגדרת (הן חסרות מידה, במובן המתמטי של המילה "מידה"), ולכן לא מפתיע שאחרי שמרכיבים אותן מחדש קורים דברים מוזרים; עם זאת, אני חייב להודות שלי הפרדוקס כבר לא נראה לא כל כך פרדוקסלי, וגם לא כל כך מוזר. ככה זה כשמתגוררים יותר מדי זמן במלון של הילברט.

הפרדוקס של בנך-טרסקי (חלק ב')

הפוסט הקודם שלי על פרדוקס בנך-טרסקי עורר זעם רב בציבור הקוראים ואולי בעולם כולו – למרות שכבר בשורת הפתיחה של הפוסט הבהרתי בדיוק מהו פרדוקס בנך-טרסקי, הטענה הייתה שהפוסט בכלל לא התעסק בבנך-טרסקי אלא בכל מני שטויות לא קשורות. ובכן, לחלק מהשטויות הלא קשורות הייתה חשיבות בכך שבנך-טרסקי נבנה עליהן, והחלק האחר נועד לתת אינטואיציה ורעיונות שיעזרו בהסבר של בנך-טרסקי עצמו. גם בפוסט הזה לא נגיע לבנך-טרסקי אלא נוכיח פרדוקס אחר – פרדוקס האוסדורף – אבל פרדוקס האוסדורף מכיל את כל הרכיבים המרכזיים של בנך-טרסקי ומהווה את הצעד המרכזי בהוכחה של בנך-טרסקי עצמו; להבין את האוסדורף זה שלב הכרחי בדרך להבנת בנך-טרסקי.

מה אומר פרדוקס האוסדורף? ש-\(S^{2}\backslash D\) היא קבוצה פרדוקסלית (ניתנת לפירוק לכמה חלקים זרים, שאחרי הפעלת איזומטריות כלשהן עליהם מרכיבים שני עותקים של הקבוצה המקורית), כאשר \(S^{2}\) היא ספירת היחידה, ו-\(D\) קבוצה בת מניה. מה אומרים המושגים הללו? אסביר עוד מעט. האוסדורף "כמעט" מראה שספירת היחידה היא פרדוקסלית; בנך-טרסקי מתגברים על מכשול ה"כמעט" הזה, ומראים איך ממנו נובעת הטענה גם עבור כדור היחידה.

ההוכחה של האוסדורף היא יישום ישיר של הטענה שהראיתי בפוסט הקודם, לפיה החבורה החופשית עם שני יוצרים היא פרדוקסלית. האבחנה הראשונה היא שלחבורת האיזומטריות של המרחב \(\mathbb{R}^{3}\) קיימת תת-חבורה חופשית מסדר 2 שכזו. השלב הבא הוא "להרים" את הפרדוקסליות של אותה תת-חבורה לפרדוקסליות של אותה \(S^{2}\backslash D\). אתחיל דווקא בתיאור שלב ההרמה הזה, ואתאר אותו בצורה כללית מעט יותר. לדעתי, זה השלב החשוב ביותר בכל עניין בנך טרסקי, ואולי גם הכי מבלבל להבנה; וזה, כצפוי, השלב שבו אקסיומת הבחירה צצה.

באופן הכי כללי בעולם, אם יש לנו קבוצה \(X\) וחבורה \(G\) שפועלת עליה, מה זה אומר? זה אומר שכל \(g\in G\) מגדיר פרמוטציה כלשהי על אברי \(X\), ושכלל הכפל בחבורה מתורגם להרכבה של הפרמוטציות הללו. בניסוח המתמטי הפורמלי לכל \(g\in G\) מתאימה פונקציה מ-\(X\) אל \(X\), כך שאם \(g,h\in G\) אז \(g\left(h\left(x\right)\right)=\left(g\cdot h\right)\left(x\right)\) (באגף שמאל יש לנו את \(g\) שמופעל על התוצאה של הפעלת \(h\) על \(x\); באגף ימין יש לנו הפעלה של האיבר \(g\cdot h\) על \(x\)). כמו כן דורשים שאיבר היחידה בחבורה יהיה ההעתקה שמעבירה כל איבר לעצמו – \(e\left(x\right)=x\). למי שכל זה אבסטרקטי מדי בשבילו, תחשבו על \(X\) כעל נקודות במרחב, ועל \(G\) בתור חבורת האיזומטריות של המרחב.

\(G\) פרדוקסלית, כלומר אפשר לפרק אותה לקבוצות הזרות \(A_{1},\dots,A_{n}\) ו-\(B_{1},\dots,B_{m}\) ויש איברים \(g_{1},\dots,g_{n}\) ו-\(h_{1}.\dots,h_{m}\) כך ש-\(G=\bigcup g_{i}\left(A_{i}\right)=\bigcup h_{i}\left(B_{i}\right)\). אנחנו רוצים לקבל מהפירוק הזה פירוק של \(X\) – לכל קבוצה \(A_{i}\) להתאים קבוצה \(A_{i}^{*}\subseteq X\) וכנ"ל עבור ה-\(B_{i}\) כך ש-\(X=\bigcup g_{i}\left(A_{i}^{*}\right)=\bigcup h_{i}\left(B_{i}^{*}\right)\). בפוסט הקודם ראינו את זה נעשה בפרדוקס סרפינקי-מזורקביץ'; שם התעלול היה לקחת איבר ספציפי \(x\in X\) (אצלם זה היה \(0\)), ולהגדיר \(A_{i}^{*}=A_{i}\left(x\right)\), כאשר \(A_{i}\left(x\right)\) זה סימון מקוצר עבור \(\left\{ g\left(x\right)|g\in A_{i}\right\} \), כלומר ההפעלה של כל האיברים ב-\(A_{i}\) על \(x\). זה גם הרעיון הכללי של האוסדורף (אם כי הוא המציא אותו באופן בלתי תלוי בסרפינקי-מזורקביץ'). עם זאת, יש שתי בעיות לא פשוטות עם הרעיון הזה: ראשית, אנחנו לא בהכרח תופסים ככה את כל \(X\); ושנית, אף אחד לא מבטיח לנו שה-\(A_{i}^{*}\) וה-\(B_{i}^{*}\) שנקבל יהיו קבוצות זרות. שתי אלו הן בעיות כבדות משקל למדי. נראה עכשיו איך מתמודדים עם הבעיה הראשונה בעזרת אקסיומת הבחירה; ההתמודדות עם הבעיה השניה אצל האוסדורף היא מעין רמאות (בערך כמו שסרפינקי-מזורקביץ' "מרמים" בהתמודדות עם הבעיה הראשונה), והיא תיפתר רק על ידי בנך-טרסקי עצמו.

כדי להבין את הבעיה בואו נחשוב על המקרה שבו \(G\) היא חבורה חופשית עם שני יוצרים, ו-\(X\) הוא, נאמר, כדור היחידה ב-\(\mathbb{R}^{3}\). ב-\(G\) יש רק מספר בן מניה של איברים (כי כל איבר הוא סדרה סופית של אותיות מתוך קבוצה סופית). בשיטה שלנו, לכל איבר ב-\(G\) מותאם בדיוק איבר אחד ב-\(X\) – מה שקורה כשמפעילים את האיבר ב-\(G\) על איבר נתון מראש אחד ב-\(X\) (למשל, 0). מכאן שאוסף כל הקבוצות שנקבל יכיל רק מספר בן מניה של נקודות, ואין שום סיכוי שדבר כזה ירכיב את כל הכדור, שיש בו מספר לא בן מניה של נקודות. לא רק שאנחנו לא תופסים את כל הכדור, אנחנו אפילו ממש ממש לא קרובים.

באופן כללי בתורת החבורות, אם \(G\) פועלת על \(X\) ויש לנו איבר \(x\in X\), אז לאוסף כל האיברים שאפשר להגיע אליהם מ-\(x\) על ידי הפעולה של \(G\) קוראים המסלול (Orbit) של \(x\) ביחס לפעולה של \(G\). פורמלית זו פשוט הקבוצה \(\left\{ g\left(x\right)|g\in G\right\} \). הבעיה שלנו היא שלא בהכרח קיים \(x\) שהמסלול שלו הוא כל \(X\). למעשה, לא קשה לראות שאם קיים \(x\) שהמסלול שלו הוא כל \(X\), אז המסלול של כל איבר ב-\(X\) הוא \(X\); הסיבה לכך היא שהיחס "\(x\) ו-\(y\) נמצאים באותו מסלול" הוא יחס שקילות . זו נקודה חשובה אז בואו נקדיש לה כמה דקות.

נסמן \(x\sim y\) אם קיים \(g\in G\) כך ש-\(g\left(x\right)=y\). מייד רואים ש-\(e\left(x\right)=x\) ולכן \(x\sim x\); ושאם \(x\sim y\), כלומר \(g\left(x\right)=y\), אז \(g^{-1}\left(y\right)=g^{-1}\left(g\left(x\right)\right)=\left(g^{-1}g\right)x=e\left(x\right)=x\) ולכן \(y\sim x\). אם \(x\sim y\) ו-\(y\sim z\) אז \(g\left(x\right)=y\) ו-\(h\left(y\right)=z\) עבור \(g,h\in G\) מסויימים, ולכן \(hg\left(x\right)=h\left(g\left(x\right)\right)=h\left(y\right)=z\), כלומר \(x\sim z\). שלוש התכונות הללו, שבעברית נקראות רפלקסיביות, סימטריות וטרנזיטיביות, הופכות את \(\sim\) ליחס שקילות. המסלולים של פעולת \(G\) על \(X\) הן בדיוק מחלקות השקילות של היחס הזה.

המשמעות של זה עבורנו היא פשוטה: אם נפעיל את \(G\) על \(x\), האיברים שנקבל יהיו בדיוק האיברים ששקולים ל-\(x\), ואם נפעיל את \(G\) על אחד מאותם איברים נקבל שוב את האיברים ששקולים ל-\(x\) ולא שום דבר אחר. לכן ברור שאם אנחנו רוצים לתפוס את כל \(X\) על ידי הפעלה של אברי \(G\), נצטרך להפעיל את \(G\) לא על איבר בודד מתוך \(X\), אלא על איבר אחד מכל מסלול של \(G\). לכן בואו נגדיר קבוצה \(M\), שהאיברים שלה הם נציגים של המסלולים; יש בה בדיוק איבר אחד מכל מסלול. אפשר לראות בקלות ש-\(G\cdot M=X\) (\(G\cdot M\) היא ההפעלה של כל איבר ב-\(G\) על כל איבר ב-\(M\)). אם זה לא ברור לכם מייד, נסו להוכיח זאת.

כמה מסלולים יש ל-\(G\)? יכולים להיות המון, זו הנקודה. אם \(G\) בת מניה ו-\(X\) לא בת מניה (כמו שקורה במקרה של בנך-טרסקי), אז יש מספר לא בן מניה של מסלולים. זה אומר ש-\(M\) עשויה להיות ענקית למדי. כך אנחנו מצליחים להתגבר על הבעייתיות בכך ש-\(G\) הייתה קטנה מדי מכדי שתוכל לתפוס את כל \(X\) על ידי פעולה על איבר אחד בלבד. מכאן המשך ההוכחה טריוויאלי: \(A_{i}^{*}=A_{i}\cdot M\), \(B_{i}^{*}=B_{i}\cdot M\), וקל לבדוק ש-\(\bigcup g_{i}\left(A_{i}^{*}\right)=\bigcup h_{i}\left(B_{i}^{*}\right)=X\). כמקודם, אם זה לא ברור לכם מייד, לנסות לכתוב את ההוכחה בעצמכם יעזור להבין מה הולך כאן הרבה יותר מכל מה שאני יכול לכתוב פה.

נותרה רק בעיה אחת לטפל בה – אולי ה-\(A_{i}^{*},B_{i}^{*}\) הללו לא זרות – יש שתי קבוצות שיש להן איבר משותף. בפועל זה אומר שיש \(g,h\in G\) כלשהן ו-\(x,y\in M\) כלשהם כך ש-\(g\left(x\right)=h\left(y\right)\). אבל רגע אחד – \(M\) נבנתה כך שיש בה נציג אחד בדיוק מכל מסלול, ואם \(g\left(x\right)=h\left(y\right)\) אז \(x=\left(g^{-1}h\right)\left(y\right)\), כלומר הם באותו מסלול, ולכן בהכרח \(x=y\). כלומר, \(g\left(x\right)=h\left(x\right)\), כלומר \(x=g^{-1}h\left(x\right)\). במילים אחרות, יש ב-\(G\) איבר שונה מ-\(e\) שבפעולה שלו על \(X\) יש נקודות שבת. אז בואו ננקוט עכשיו בגישה הבוגרת והאחראית להתמודדות עם הסכנה בכך שהקבוצות שנבנה לא יהיו זרות – נניח מראש שהפעולה של \(G\) על \(X\) היא כזו שאין לאף איבר שאינו הזהות נקודות שבת, והבעיה נפתרה!

לסיכום, הוכחנו את המשפט הבא: אם \(G\) פרדוקסלית ופועלת על \(X\) ללא נקודות שבת לא טריוויאלית, אז \(X\) פרדוקסלית ביחס לפעולה של \(G\). רק מה? אולי לא שמתם לב, אבל השתמשנו כאן באקסיומת הבחירה.

אקסיומת הבחירה אומרת (בניסוח שלה שהכי מתאים לנו כאן) את הדבר הבא: בהינתן אוסף של קבוצות זרות ולא ריקות, קיימת קבוצה שמכילה בדיוק איבר אחד מכל אחת מהקבוצות. נשמע מוכר? זו בדיוק \(M\) שלנו, והקבוצות הזרות-אך-לא-ריקות הן המסלולים של פעולת \(G\) על \(X\). בהוכחה שלי הנחתי במובלע ש-\(M\)קיימת; לרוע המזל, זה פשוט לא מובן מאליו, אם מנסים להיות פורמליים. אם הולכים לפי אקסיומות תורת הקבוצות, אין לנו דרך להבטיח שקבוצה כמו \(M\) אכן תתקיים; הסיבה לכך היא שבתורת הקבוצות האקסיומטית ממש לא כל דבר שניתן לתאר במילים הוא אכן קבוצה; זה מונע בעיות דוגמת הפרדוקס של ראסל, אבל גם מכריח אותנו להיות הרבה יותר זהירים בהנחות שאנחנו מניחים כלאחר יד.

האם יכלתי להסתדר כאן בלי אקסיומת הבחירה? זו שאלה מצויינת, והתשובה הקצרה היא שאני לא יודע, ושתשובה מדויקת לשאלה תיקח אותי רחוק מדי גם מתוכן הפוסט הזה וגם מתחום הדברים שאני עוד קצת בקיא בהם. לכן נצטרך לדחות את השאלה הזו לפעם אחרת.

בואו נעבור עכשיו להחלת המשפט הכללי שלנו על המקרה של איזומטריות בתלת מימד. האבחנה הראשונה היא שחבורת האיזומטריות של \(\mathbb{R}^{3}\) מכילה תת חבורה חופשית עם שני יוצרים; ליתר דיוק, שיש שתי איזומטריות סיבוב שהן בלתי תלויות זו בזו (אף מילה בתת החבורה שנוצרת על ידי שתיהן אינה שווה ל-\(e\) מלבד המילה הריקה). יש כמה וכמה דוגמאות שאפשר לתת; הדוגמה שלי היא של סיבוב בזווית \(\arccos\frac{1}{3}\) סביב ציר ה-\(z\), וסיבוב באותה זווית סביב ציר ה-\(x\). ההוכחה ששתי האיזומטריות הללו בלתי תלויות היא… ובכן, טכנית ולא כל כך מעניינת. נעזוב אותה לעתה ואם יהיה ביקוש אדיר מהקהל אולי אציג אותה.

אם כן, יש לנו חבורה חופשית על שני יוצרים \(G\) של איזומטריות. מה מונע מאיתנו להפעיל אותה על כדור היחידה ולקבל את בנך-טרסקי, אם אנחנו מוכנים להניח את אקסיומת הבחירה? בעיה אחת בלבד – יש בחבורה הזו איזומטריות עם נקודות שבת. חשבו למשל על סיבוב סביב ציר \(z\); סיבוב שכזה מקבע את כל ציר \(z\). אפשר עם קצת עבודה להראות שבאופן כללי, כל איבר ב-\(G\) מקבע בדיוק את כל הנקודות על ישר כלשהו שעובר דרך ראשית הצירים. בקיצור, בעיה.

מה האוסדורף עושה? ראשית, הוא לא מדבר על כדור היחידה אלא על ספירת (Sphere) היחידה \(S^{2}\) – ה"מעטפת" של כדור היחידה, אוסף כל הנקודות שמרחקן מהראשית הוא 1 בדיוק. זה אותו הבדל כמו ההבדל שבין מעגל לעיגול. כל איבר של \(G\) מקבע רק שתי נקודות על הספירה, כי כל ישר העובר דרך הראשית חותך את הספירה בשתי נקודות בדיוק. יש רק מספר בן מניה של איברים ב-\(G\), ולכן קבוצת כל הנקודות שאברי \(G\) מקבעות, \(D\), היא בת מניה, ולכן קטנה וחסרת חשיבות בהשוואה ל-\(S^{2}\). אם נזרוק את הנקודות הללו לפח ונביט בקבוצה \(X=S^{2}\backslash D\) (\(X\) היא כל הנקודות ב-\(S^{2}\) שאינן ב-\(D\)) נוכל להפעיל את המשפט מקודם באופן חלק, ולקבל ש-\(S^{2}\backslash D\) פרדוקסלית. זהו פרדוקס האוסדורף. בפוסט הבא (והאחרון!) נעבור ממנו לבנך-טרסקי המלא, אבל כפי שכבר אמרתי – מה שראיתם עכשיו זה לב ההוכחה של בנך-טרסקי.

לסיום, בואו נפעיל את כל עניין הפרדוקסליות הזה על מקרה קצת שונה ממה שראינו עד כה. \(X\) יהיה מעגל היחידה, \(S^{1}\), ואילו \(G\) תהיה \(\left(\mathbb{Q},+\right)\) – החבורה החיבורית של הרציונליים. הפעלה של \(q\in\mathbb{Q}\) על אברי \(X\) תהיה סיבוב בזווית \(2\pi\cdot q\) (\(2\pi\) כי זה מעגל שלם). \(G\) איננה פרדוקסלית במובן הרגיל שלנו אבל במובן מאוד קרוב היא כן – אפשר לפרק אותה לשתי סדרות אינסופיות של קבוצות זרות, \(A_{1},A_{2},\dots\) ו-\(B_{1},B_{2},\dots\), כך שכל אחת מהסדרות נותנת את כל \(G\) אחרי פעולות מתאימות עליה. את החלוקה אפשר לבצע באופן שרירותי לגמרי – מתבקש לבנות כל קבוצה כך שתכיל בדיוק רציונלי אחד (יש מספר בן מניה של רציונליים ולכן זה אפשרי). ההוכחה שאפשר לקבל מהסדרה \(A_{1},A_{2},\dots\) את כל \(G\) נובעת מכך שאפשר לקבל כל רציונלי על ידי חיבור של מספר רציונלי אחר (אתם ב-\(q\) ורוצים להגיע ל-\(p\)? חברו לו את המספר הרציונלי \(\left(p-q\right)\)!) ולכן אפשר להעביר את האיבר של \(A_{1}\) אל הרציונלי הראשון במספור כלשהו שלנו, את \(A_{2}\) אל הרציונלי השני וכן הלאה.

כעת בואו נמשיך כמו קודם – \(M\) תהיה אוסף כל הנציגים של המסלולים של פעולת \(G\) על \(X\) (כלומר, אוסף הנציגים של כל מחלקות השקילות של היחס "אפשר לסובב את \(x\) בזווית שהיא כפולה רציונלית של \(2\pi\) ולקבל את \(y\)"), נגדיר \(A_{i}^{*}\) ו-\(B_{i}^{*}\) כמו קודם, וקיבלנו שמעגל היחידה הוא פרדוקסלי אם מרשים פירוק אינסופי בן-מניה. על פניו זו סתם עוד דוגמה נחמדה, אבל אני מביא אותה כי הרעיון כאן הוא אותו רעיון כמו בהוכחה שאין מידה אינוריאנטית להזזות על הישר הממשי, שכבר הראיתי כאן פעם: גם שם בנינו את אותה \(M\) בדיוק (שם דיברנו על הקטע \(\left[0,1\right]\) עם הזזה מודולו 1, אבל זה אותו הדבר כמעט כמו מעגל היחידה עם סיבובים), ובנינו את הקבוצות \(A_{i}^{*}\) ו-\(B_{i}^{*}\) (שם קראתי להן פשוט \(A_{i}\) כי לא ניסינו לבנות שום דבר פרדוקסלי בסגנון בנך-טרסקי) והבעיה נבעה מכך שהמידה של כל ה-\(A_{i}^{*},B_{i}^{*}\) הללו הייתה צריכה להיות שווה לזו של \(M\) המקורי, והאיחוד של כולן (מבלי שנעשה עליהן מניפולציות נוספות) היה צריך להיות מצד אחד \(\left[0,1\right]\) ולכן בעל מידה 1, ומצד שני היו אינסוף קבוצות ולכן אם המידה שלהן (של כל אחת בנפרד) הייתה גדולה מאפס, המידה של האיחוד שלהן הייתה חייבת להיות אינסופית. הפרדוקסליות מאפשרת לנו לראות זאת בדרך טיפה שונה שלא מערבת מידה אינסופית – ראינו שבאמצעות הזזות, שהמידה לכאורה אינוריאנטית להן, הצלחנו "להכפיל" את \(\left[0,1\right]\) ולכן גם את המידה שלו. זה גם הדבר המוזר שקורה בבנך-טרסקי – באמצעות פעולות שהן לכאורה משמרות מידה אנחנו מצליחים להכפיל את הנפח של כדור.

מה המסקנה? פשוט מאוד – שלקבוצה \(M\) שלנו אין מידה. גם בבנך-טרסקי (וגם בהאוסדורף), הסוד הגדול הוא שהפלחים שנבנים הם פשוט לא מדידים (להבדיל מסרפינקי-מזורקביץ' שבו הם היו מדידים, אבל פשוט ממידה אפס). זה אולי שופך קצת אור על המוזרות של בנך-טרסקי – אם הצלנו לפצל את הכדור לכמה חלקים שכל אחד בפני עצמו הוא בכלל חסר מידה מוגדרת, פלא שכשמחברים את הכל מחדש מקבלים דברים מוזרים?

בפוסט הבא אני מקווה להציג את המעבר הסופי מפרדוקס האוסדורף אל בנך-טרסקי ובכך לסיים את התופעה המוזרה הזו, שפוסט בודד על פרדוקס בודד הצליח להכפיל את עצמו לשלושה פוסטים על אותו נושא.

הפרדוקס של בנך-טרסקי (חלק א')

פרדוקס בנך-טרסקי הוא אולי הדרך הטובה ביותר להמחיש להדיוטות כמה מוזרה המתמטיקה. בפשטות, הפרדוקס אומר את הדבר הבא: ניתן לקחת כדור, לחתוך אותו ל-5 חתיכות, להזיז אותן טיפה (ולסובב, ולשקף וכאלה) ולבנות מהן שני כדורים באותו הנפח של הכדור המקורי.

רגע, מה?

ברוכים הבאים למתמטיקה, העולם שבו קורים דברים מוזרים. מן הסתם אחרי תיאור הפרדוקס צריכה לבוא הסתייגות כלשהי שבאה להסביר למה זה לא יכול לקרות "בעולם האמיתי", ולרוב נשלפת בשלב הזה החשודה המיידית – אקסיומת הבחירה הידועה לשמצה. מהי אקסיומת הבחירה? אסביר זאת בהמשך (וגם הסברתי זאת בעבר), אבל לדעתי האישית התפקיד שהיא ממלאת בכל העניין הזה הוא שולי יחסית והיא אינה הגורם המרכזי לפרדוקסליות. ה"פרדוקסליות" של הפרדוקס איננה כה מפתיעה כפי שהיא נדמית ממבט ראשון, וכפי שאמרתי – היא צצה ועולה במתמטיקה כל הזמן. מה שמוזר בבנך-טרסקי הוא לא הקונספט של "לקחת אובייקט ולשכפל אותו", אלא העובדה שאותו אובייקט הוא כדור ושהשכפול מתבצע על ידי חיתוך למספר סופי של פלחים וביצוע הזזות וסיבובים וכדומה. כלומר, השכפול נדמה "פשוט" מדי – וכמובן שיש לזה מחיר, והמחיר הוא שאותם חמישה פלחים הם די מסובכים (וכאן אקסיומת הבחירה נכנסת לעניין).

בואו נתחיל בקטן. איפה במתמטיקה אפשר למצוא שכפול דומה לבנך-טרסקי שלא יהיה לנו כה מוזר? המספרים הטבעיים, \(\mathbb{N}\), הם דוגמה יפה. הבה נפצל את \(\mathbb{N}\) לשתי קבוצות – קבוצת הזוגיים, שאסמן ב-\(\left\{ 2,4,6,\dots\right\} \), וקבוצת האי זוגיים, שאותה אסמן ב-\(\left\{ 1,3,5,\dots\right\} \). עכשיו בואו נתעלל בהן באופן הבא: כל איבר בקבוצת הזוגיים נחלק ב-2, ולכל איבר בקבוצת האי זוגיים נחבר 1 ואז נחלק ב-2. בשני המקרים נקבל את הקבוצה \(\left\{ 1,2,3,4,\dots\right\} \), שהיא פשוט \(\mathbb{N}\) עצמה. אז מה קרה פה? לקחנו את \(\mathbb{N}\), פירקנו אותה לשתי קבוצות זרות, הפעלנו על כל קבוצה מניפולציות כלשהן שלא מוסיפות איברים חדשים לקבוצה, וקיבלנו שני עותקים של \(\mathbb{N}\). בצורה ציורית אפשר לתאר את העסק כך: \(\mathbb{N}=A\uplus B\) (הסימון הזה בא לציין איחוד זר – זה אומר ש-\(\mathbb{N}\) מורכב בדיוק משתי הקבוצות \(A,B\) ושאין להן איברים משותפים), וכמו כן \(\mathbb{N}=\frac{A}{2}\) ו-\(\mathbb{N}=\frac{B-1}{2}\) (זה לא סימון סטנדרטי אבל אתם מבינים את הכוונה).

למי מכם שזה מוזר להם – ברכותי, ברוכים הבאים למתמטיקה, לכו וקראו את הפוסט על המלון של הילברט ואז באמת יהיה לכם מוזר. אבל לכל היתר, שכבר רגילים לעסק הזה, יש לי שאלה קטנה – מה ההבדל המהותי בין זה ובין בנך-טרסקי? אני מודה שהבדל מהותי אני לא רואה. בכל זאת, הבדל משמעותי אחד הוא שבנך-טרסקי הוא פרדוקס גאומטרי – הוא מתעסק ביצור גאומטרי פשוט, כדור, ובפעולות שלכאורה משמרות את הנפח של הכדור ולכן לא יכולות לגרום להכפלה שלו. אבל מה המשותף לבנך-טרסקי ולמה שהראיתי כרגע? מה בעצם ההגדרה הכללית?

ובכן, נאמר שקבוצה \(X\) היא פרדוקסלית (ביחס לסט פעולות מסויים) אם אפשר לפרק את \(X\) לחלקים – \(A_{1},A_{2},\dots,A_{n}\) ו-\(B_{1},B_{2},\dots,B_{m}\), כך שכל החלקים זרים – אין לאף חלק איברים משותפים עם איברים אחרים – ואפשר להפעיל פעולות מסויימות (מתוך הסט המדובר) על כל אחת מסדרות החלקים בנפרד, כך שה-\(A_{i}\)-ים, לאחר שביצענו עליהם את הפעולות, יתנו לנו את \(X\) המקורית, וכך גם ה-\(B_{i}\)-ים. הדרישה שכל החלקים יהיו זרים היא קריטית, כמובן, אחרת היינו בוחרים \(A=B=X\), ואז מה עשינו? אין שום דבר מפתיע בשכפול שכל מה שעושים בו הוא לספור את אותו הדבר פעמיים.

למי שהדוגמה של הטבעיים לא עשתה עליו רושם, בואו נעבור לדבר על משהו הרבה יותר מהותי שגם בו צצה פרדוקסליות דומה: חבורות. בניגוד לדוגמת הצעצוע הקודמת, הדוגמה הנוכחית היא חשובה ביותר, כי על בסיס מה שקורה בה נבנה גם פרדוקס בנך-טרסקי עצמו.

לא אחזור כאן על ההגדרה של חבורה, אלא אתאר מייד את החבורה שמעניינת אותנו – החבורה החופשית עם שני יוצרים \(a,b\). זו קבוצה שכל איבר בה הוא סדרה של תווים מבין ארבעת הבאים: \(\left\{ a,b,a^{-1},b^{-1}\right\} \). הכלל הוא ש-\(a\) ו-\(a^{-1}\) "מצמצמים" זה את זה – אם שניהם נכתבים בסמיכות הם נמחקים מהמילה. כנ"ל לגבי \(b,b^{-1}\). כלומר, \(aba^{-1}b^{-1}\) זו מילה חוקית בחבורה, אבל המילה \(abb^{-1}a\) היא בעצם דרך מסורבלת לכתוב את \(aa\). בנוסף, יש מילה בת 0 תווים – המילה הריקה – שאסמן ב-\(e\). אם יש לנו שתי מילים אפשר לשרשר אותן: למשל, השרשור של \(aa\) ושל \(bbb\) הוא \(aabbb\), והשרשור של \(ab\) ו-\(b^{-1}a\) הוא \(abb^{-1}a\), כלומר \(aa\).

יש הצגה גרפית יפה לחבורה הזו:


אפשר לחשוב על החבורה הזו כעל "פתית שלג" שמחולק לארבע ענפים עיקריים – הענף של המילים שמתחילות ב-\(a\), אלו שמתחילות ב-\(b\), אלו שמתחילות ב-\(a^{-1}\) ואלו שמתחילות ב-\(b^{-1}\). באמצע יש את האיבר הגלמוד \(e\). בואו נסמן את החבורה כולה ב-\(F\) (מלשון Free), ואת קבוצת "האיברים שמתחילים ב-\(a\)" ב-\(F\left(a\right)\) (ובדומה, \(F\left(b\right)\), \(F\left(a^{-1}\right)\) ו-\(F\left(b^{-1}\right)\)). עכשיו מגיע הקסם: מהי \(a\cdot F\left(a^{-1}\right)\), כלומר הקבוצה שמתקבלת כאשר לוקחים את \(F\left(a^{-1}\right)\) וכופלים את כל האיברים שבה מצד שמאל ב-\(a\) (דהיינו, משרשרים את \(a\) משמאל להם)? לא קשה להשתכנע שזו קבוצת כל האיברים ב-\(F\) שאינם מתחילים ב-\(a\), כי מה שקורה הוא שה-\(a\) שכפלנו בו משמאל מבטל את ה-\(a^{-1}\) שבו התחילה המילה; ואם המילה התחילה ב-\(a^{-1}\) אז האות הבאה יכולה להיות כל אות למעט \(a\) (אחרת שתי האותיות הראשונות היו מבטלות זו את זו). המסקנה היא ש-\(F=F\left(a\right)\cup aF\left(a^{-1}\right)\). באותו אופן, \(F=F\left(b\right)\cup bF\left(b^{-1}\right)\). מה קרה כאן? לקחנו את \(F\), ופירקנו אותה לחמישה חלקים: \(F=F\left(a\right)\cup F\left(b\right)\cup F\left(a^{-1}\right)\cup F\left(b^{-1}\right)\cup\left\{ e\right\} \). זו חלוקה לקבוצות זרות, כמובן. את החלק של \(\left\{ e\right\} \) הגלמוד זרקנו לפח. את היתר חילקנו לשני זוגות. עכשיו עשינו להטוט כלשהו עם כל אחד מהזוגות – לקחנו קבוצה אחת, הפעלנו עליה מניפולציה כלשהי (כפל ב-\(a\) או כפל ב-\(b\)), איחדנו עם הקבוצה השניה וקיבלנו מחדש את \(F\) המקורית.

למה בעצם זה כל כך חשוב? ובכן, חבורות הן לא סתם אובייקטים שלא קשורים לכלום. לעתים קרובות מאוד, ובפרט בדיון הנוכחי, חבורות צצות כאובייקט שפועל על אובייקטים מתמטיים אחרים. אנחנו מזהים אוסף של פעולות שמבצעים על אובייקט, ואז שמים לב לכך שלאותו אוסף יש מבנה של חבורה – אפשר "להכפיל" שני איברים ממנו בצורה בעלת משמעות (לרוב על ידי הרכבה של הפעולות – הפעלה של אחת מהן ולאחר מכן השניה). הרעיון המרכזי הוא שאם יש לנו חבורה שהיא עצמה פרדוקסלית ופועלת על אובייקט מסויים, אז ייתכן שניתן יהיה "להרים" את הפרדוקסליות של החבורה אל פרדוקסליות של האובייקט שעליו היא פועלת (אך צריך להניח עוד דבר או שניים – ארחיב על כך בהמשך).

במקרה של בנך טרסקי, החבורה הרלוונטית היא חבורת האיזומטריות של המרחב. איזומטריה היא העתקה ששומרת על מרחקים; איזומטריה שמופעלת על קבוצה משמרת את "המבנה הפנימי" של הקבוצה. איזומטריה היא בדיוק מה שדיברתי עליו קודם כשדיברתי על "הזזות, סיבובים, שיקופים". כדי להבהיר איך העסק רלוונטי אלינו אתחיל בתיאור של פרדוקס דומה לבנך-טרסקי: פרדוקס סירפינקי-מזורקביץ'. ההבדלים העיקריים בינו ובין בנך-טרסקי: הוא מתרחש במישור, לא במרחב; הוא לא מתבסס על החבורה החופשית עם שני יוצרים אלא על משהו פשוט טיפה יותר; הקבוצה שבה הוא מתעלל היא לא יפה כמו כדור; והוא לא דורש את אקסיומת הבחירה. למעשה, הפירוק הפרדוקסלי שהוא מציג הוא קונסטרוקטיבי למדי. בנוסף, הפרדוקס הזה קודם היסטורית לבנך-טרסקי.

הפרדוקס מתעסק בקבוצה במישור, \(\mathbb{R}^{2}\), ולכן החבורה שמעורבת בסיפור, שאסמן ב-\(G\), היא חבורת האיזומטריות של המישור. עוד מעט אראה איך אפשר למצוא שני איברים \(\tau,\rho\in G\) שמקיימים את התכונה הבאה: קיים \(x\in\mathbb{R}^{2}\) (למעשה, הוא יהיה \(\left(0,0\right)\)) כך שכל שתי מילים ב-\(\tau,\rho\) (כלומר, מילים שמכילות רק את שני הסימנים הללו; לא את \(\tau^{-1}\) ו-\(\rho^{-1}\)) שהאחת מתחילה ב-\(\tau\) והשניה מתחילה ב-\(\rho\) מעבירות את \(x\) לאיברים שונים כשהן מופעלות עליו. במילים אחרות, אם יש סדרת פעולות של \(\tau\) ו-\(\rho\) שמפעילים על \(x\), אז סדרה שמסתיימת ב-\(\tau\) תניב פעולה שונה בהכרח מסדרה שמסתיימת ב-\(\rho\) (כשמפעילים מילה כלשהי על \(x\), קודם כל פועל על \(x\) מה שנמצא בסוף המילה; אלו עניינים טכניים-הגדרתיים לא קריטיים).

אם נמצא שני איברים שכאלו, כמעט מייד אפשר למצוא תת-קבוצה פרדוקסלית של \(\mathbb{R}^{2}\). בואו נסמן ב-\(E\) את אוסף כל האיברים ב-\(\mathbb{R}^{2}\) שמגיעים אליהם באמצעות כפל במילה שמורכבת מ-\(\tau\) ו-\(\rho\). עכשיו, ממה שאמרתי קודם נובע שלכל שתי מילים שכאלו \(w_{1},w_{2}\), מתקיים ש-\(\tau w_{1}\left(x\right)\ne\rho w_{2}\left(x\right)\). מכאן שהקבוצות \(\tau\left(E\right)\) ו-\(\rho\left(E\right)\) הן זרות. למה? ובכן, איך נראה איבר בקבוצה \(\tau\left(E\right)\)? הוא נראה כמו הפעלה של \(\tau\) על איבר מ-\(E\). ואיך נראה איבר ב-\(E\)? הוא נראה כמו הפעלה של מילה \(w\) כלשהי על \(x\), כלומר מה שסימנו ב-\(w\left(x\right)\). מכאן שהאיבר נראה בסך הכל כמו \(\tau\left(w\left(x\right)\right)\), אבל פעולת הכפל בחבורה שלנו היא בדיוק הרכבת האיזומטריות, כלומר \(\tau\left(w\left(x\right)\right)=\tau w\left(x\right)\).

אם כן, פירקנו את \(E\) לשתי קבוצות זרות, \(\rho\left(E\right)\) ו-\(\tau\left(E\right)\) (\(x\) המסכן נותר בחוץ). עכשיו כל מה שנותר לשים לב אליו הוא ש-\(\tau^{-1}\left(\tau\left(E\right)\right)=E\) וגם \(\rho^{-1}\left(\rho\left(E\right)\right)=E\). כלומר, אפשר לקחת את \(E\), לפרק אותו לשתי תת-קבוצות זרות, להפעיל על כל אחת מהן איזומטריה ולקבל את \(E\) המקורית. אז למה על בנך-טרסקי כולם מדברים ועל הפרדוקס הזה לא?

ובכן, \(E\) היא קבוצה "לא מעניינת" – לא ברור איך היא נראית והיא בוודאי לא משהו פשוט כמו כדור והיא מכילה רק מספר בן מניה של נקודות. התחמנות שלנו בפרדוקס הזה יותר מדי גלויה לעין, ו-\(E\) היא יותר מדי מלאכותית מכדי שיהיה לפרדוקס עוקץ של ממש במקרה הזה. אם לתת נימוק קצת יותר מתמטי, המידה של \(E\) היא אפס (מה זו מידה אפס? דיברתי על זה קצת כאן) כי היא בת מניה; אז זה שהצלחנו לשכפל את \(E\) לא נראה בעייתי כי בסך הכל הראינו ש-\(2\cdot0=0\). אם נעשה את אותו הדבר לקבוצה בעלת מידה גדולה מאפס, אז זה יתחיל להיות מוזר. אלא שלרוע המזל זה בלתי אפשרי במישור – ניתן להוכיח שכל קבוצה ב-\(\mathbb{R}^{2}\) בעלת פנים לא ריק (כלומר, שקיימת נקודה בקבוצה ש"מוכלת עמוק בתוכה" – יש לה סביבה שכולה בתוך הקבוצה) אינה יכולה להיות פרדוקסלית.

טוב, בואו נחזור אל הוכחת הפרדוקס. מה שנשאר לי לעשות הוא לתאר שתי איזומטריות של המישור \(\tau,\rho\) כך ש-\(\tau w_{1}\left(0\right)\ne\rho w_{2}\left(0\right)\) לכל \(w_{1},w_{2}\). כאן צריך לגלוש, מה לעשות, לגאומטריה ולדברים טכניים, ולכן שמרתי את זה לסוף. עם זאת, אל תוותרו כל כך מהר! ההוכחה גם נחמדה, גם מכילה רעיונות מעניינים, והיא גם קונסטרוקטיבית לגמרי.

דרך מאוד נוחה מבחינה טכנית לדבר על \(\mathbb{R}^{2}\) וטרנספורמציות עליו היא באמצעות המספרים המרוכבים, \(\mathbb{C}\). המספר המרוכב \(a+bi\) מתאים לקוארדינטה \(\left(a,b\right)\), והיתרון שבדיבור על מרוכבים הוא שקל לתאר איזומטריות באמצעות פעולות אריתמטיות במרוכבים. בואו נבחר מספר מרוכב \(u\) שנמצא על מעגל היחידה, ולכן התיאור שלו בהצגה הקוטבית של המרוכבים הוא \(u=e^{i\theta}\) עבור זווית \(\theta\) לבחירתנו. נבחר את \(\theta\) כך ש-\(u\) יהיה מספר טרנסנדנטלי, כלומר לא יהיה אף פולינום במקדמים רציונליים שמאפס אותו (אפשר להראות שקיים כזה משיקולי ספירה; יש מספר לא בר מניה של \(\theta\)-ות שאפשר לבחור אבל רק מספר בן מניה של מספרים אלגבריים). עכשיו בואו נגדיר \(\tau\left(z\right)=z+1\) – זוהי איזומטריה של הזזה – ו-\(\rho\left(z\right)=uz\) – זוהי איזומטריה של סיבוב.

בואו ניקח שתי מילים \(w_{1},w_{2}\) כך ש-\(w_{1}\) מתחילה ב-\(\tau\) ו-\(w_{2}\) מתחילה ב-\(\rho\). את \(w_{1}\) אפשר לכתוב באופן המבהיל הבא: \(w_{1}=\tau^{a_{1}}\rho^{a_{2}}\tau^{a_{3}}\rho^{a_{4}}\dots\tau^{a_{t}}\) – זוהי פשוט מילה ב-\(\tau,\rho\) וה-\(a_{1},a_{2},\dots\) מציינים כמה \(\tau\)-ים רצופים יש בהתחלה, ואז כמה \(\rho\) רצופים יש עד ה-\(\tau\) הבא וכן הלאה. שימו לב שאני מניח כאן באופן מובלע שהמילה גם נגמרת ב-\(\tau\). זאת מכיוון שסוף המילה הוא גם הפעולה הראשונה שמופעלת כשמפעילים את המילה על איבר כלשהו, והאיבר שעליו אנחנו הולכים לפעול כאן הוא \(0\), ו-\(\rho\left(0\right)=0\) ולכן מופעים של \(\rho\) בסוף המילה יהיו מיותרים.

אז איך נראה \(w_{1}\left(0\right)\)? ובכן, תעשו את החשבון… תקבלו ש-\(w_{1}\left(0\right)=a_{1}+a_{3}u^{a_{2}}+a_{5}u^{a_{2}+a_{4}}+\dots+a_{t}u^{a_{2}+a_{4}+\dots+a_{t-1}}\). לא יפה, אבל לא נורא (מי שבאמת בוער לו להוכיח את זה – קדימה, באינדוקציה).

מה שמעניין ביצור הזה הוא שבסופו של דבר, הוא פולינום ב-\(u\). באותו אופן מראים גם ש-\(w_{2}\left(0\right)\) הוא פולינום ב-\(u\), אבל כזה שהמקדם החופשי שלו הוא אפס, כי הפעולה האחרונה ש-\(w_{2}\) מבצע היא \(\rho\), שמתוארת על ידי כפל ב-\(u\). זה מבדיל את הפולינום הזה מ-\(w_{1}\left(0\right)\) שהמקדם החופשי שלו הוא בהכרח לא אפס (כי \(a_{1}\ne0\); אחרת \(w_{1}\) הייתה מתחילה ב-\(\rho\)). לכן \(w_{1}\left(0\right)-w_{2}\left(0\right)\) הוא פולינום במקדמים שלמים ב-\(u\) שאינו פולינום האפס, ולכן הוא אינו יכול להיות שווה אפס, כי בחרנו את \(u\) להיות טרנסנדנטי. לכן \(w_{1}\left(0\right)\ne w_{2}\left(0\right)\), כפי שרצינו.

איפה אקסיומת הבחירה פה? בשום מקום. האיזומטריות \(\tau,\rho\) הוצגו באופן מפורש, ולכן גם \(E\) נתונה באופן מפורש: היא אוסף הפולינומים ב-\(u\) עם מקדמים טבעיים (למה לא שליליים? נסו להבהיר זאת לעצמכם), והחלוקה של \(E\) גם היא מפורשת – מפרידים לפולינומים עם מקדם חופשי 0, ועם מקדם חופשי שונה מאפס. בנימה האופטימית הזו סיימנו עם סירפינקי-מזורקביץ'. בפוסט הבא אציג פרדוקס אחר, פרדוקס האוסדורף, או בשמו היותר מדויק – פרדוקס כמעט-בנך-טרסקי. הרעיונות המרכזיים של בנך-טרסקי נמצאים כבר בו ומה שהולך שם מעניין לטעמי יותר מהתיקון שיידרש אחר כך כדי להפוך את האוסדורף לבנך-טרסקי של ממש.