לא מדויק – הפורום

ברשותכם, פוסט פרסומי ולחלוטין לא מתמטי.

אתמול הודיע אתר "האייל הקורא" על סגירתו הממשמשת ובאה. הייתי פעיל באייל במשך תקופה ארוכה למדי, וזה היה המקום היחיד באינטרנט העברי שבו חשתי בנוח לקיים דיונים על מתמטיקה. לא שהאייל היה אתר מתמטי; התקיימו בו דיונים על כל הנושאים שבעולם בערך, וגם למתמטיקה היה שם מקום (אף שאני בטוח שדיוני המתמטיקה שפלשו לכל חלקה טובה גרמו אי נוחות לחלק מהקוראים). למרות שהדיון הזכור ביותר בענייני מתמטיקה היה זה שתחת המאמר שעסק בטרחנים מתמטיים כפיתיים, ודיון זה היה ארוך הרבה יותר מהנדרש, היו גם דיונים מרתקים רבים נוספים.

בצירוף מקרים מוזר, האייל נסגר בדיוק כשאני מנסה לפתוח מערכת פורומים עבור הבלוג. המניע המיידי היה משחק הציטוטים שאני מנסה לארגן, ונראה לי שיהיה יותר נוח לקיים אותו בפורום (ולכתוב פוסט עם "התוצאות" לכשיהיו). המניע השני הוא התחושה שלי שהדיונים בתגובות רחוקים מלמצות את פוטנציאל הדיונים שיש באתר – בפורום אפשר לדון על נושאי הפוסטים מבלי חשש לגלישה; אנשים יכולים לפתוח שרשורים משל עצמם על נושאים מתמטיים מעניינים; קל להציע הצעות לפוסטים חדשים; אני אוכל להכיר יותר טוב את קהל קוראי הבלוג ומה שהם רוצים לשמוע עליו; וכן הלאה וכן הלאה. זה כמובן מצריך השתתפות של כמות סבירה של אנשים, ובאותה המידה (ואף יותר) סביר שהפורום יהפוך למקום שבו אני מדבר לעצמי. אבל אפשר לנסות.

הסיבה האחרונה שבגללה פתחתי את הפורומים היא גם הפשוטה ביותר – כי אני יכול. מאז המעבר לשרת העצמאי, נהיה לי קל מאוד לפתוח מערכת פורומים. יהיה חבל לא לתת לזה צ'אנס.

לעת עתה החוק העיקרי הוא שבאנו כדי להינות, ולכן אין חוקים. אם יתחילו מהומות וניצול לרעה וכן הלאה, כנראה שיהיו חוקים. נראה מה יקרה. מראש אצהיר שהפורומים לא אמורים להיות דמוקרטיה אלא דיקטטורה נאורה, כזו שבה גם לטרחנים כפייתיים יהיה מותר לחיות ולדבר. לפחות קצת.

הכתובת:

http://www.gadial.net/forum

מקווה לראות אתכם שם.

קבוצת קנטור, ואיך לכל הרוחות המימד שלה הוא בערך 0.63?

מהו מימד? זו שאלה שכבר התייחסתי אליה בעבר, ואז אמרתי כי "יש הגדרות שונות לאותו מושג אינטואיטיבי, שמנסות להשיג מטרות שונות". אז עסקתי בהגדרה הנאיבית והפשוטה ביותר של מימד, ואילו הפעם אני רוצה לדבר על הגדרה מסובכת יותר, שנוטה לגרום לאנשים לחוש תחושת "מה לעזאזל" כשהם שומעים לראשונה על תוצאותיה – מימד פרקטלי. ומדוע "מה לעזאזל"? כי המימד הפרקטלי של קבוצות עשוי שלא להיות מספר טבעי – למעשה, ברוב המקרים הוא אינו טבעי, אלא מספר אי רציונלי כלשהו. כך למשל קבוצת קנטור, שאותה אציג בפוסט הזה, היא בעלת מימד פרקטלי של בערך \(0.63\). מה ההגיון שמאחורי דבר כזה?

נתחיל בהגדרת קבוצת קנטור. ההגדרה נראית מוזרה למדי, וקרוב לודאי שתתהו בשביל מה כל זה טוב; ובכן, לצורך כך יהיה צורך בפוסט נפרד שמתאר את האופן שבו גאורג קנטור גילה את תורת הקבוצות, על המוזרויות שבה, כחלק ממחקר "קלאסי" באנליזה מתמטית. השימוש שלו בקבוצת קנטור (שלא התגלתה על ידו) היה כדי לתת דוגמה פתולוגיות ונוגדת אינטואיציה, בשל התכונות המעניינות שלה שעל חלקן אדבר כאן.

ובכן, מהי קבוצת קנטור? הבניה שלה ניתנת לתיאור באופן אלגוריתמי למדי. מתחילים עם הקטע \(\left[0,1\right]\) בישר הממשי, שאותו נסמן \(C_{0}\). כעת מורידים ממנו את השליש האמצעי, אך מותירים את נקודות הקצה. כלומר, מורידים מ-\(C_{0}\) את \(\left(\frac{1}{3},\frac{2}{3}\right)\). התוצאה? \(C_{1}=\left[0,\frac{1}{3}\right]\cup\left[\frac{2}{3},1\right]\).

כעת קיבלנו קבוצה, \(C_{1}\), אשר מורכבת משני קטעים. הבה ונתעלל בהם באותו האופן שבו התעללנו ב-\(C_{0}\) – מכל אחד משניהם נוריד את השליש האמצעי. כלומר, מ-\(\left[0,\frac{1}{3}\right]\) אנחנו מורידים את \(\left(\frac{1}{9},\frac{2}{9}\right)\), ואילו מ-\(\left[\frac{2}{3},1\right]\) אנחנו מורידים את \(\left(\frac{7}{9},\frac{8}{9}\right)\). התוצאה? \(C_{2}=\left[0,\frac{1}{9}\right]\cup\left[\frac{2}{9},\frac{1}{3}\right]\cup\left[\frac{2}{3},\frac{7}{9}\right]\cup\left[\frac{8}{9},1\right]\). קיבלנו כעת ארבעה קטעים. שימו לב שכולם מאותו האורך, ולמעשה – שקל לתאר במפורש מהם. לצורך כך אכתוב את \(C_{2}\) שוב, בצורה אחידה יותר: \(C_{2}=\left[\frac{0}{9},\frac{1}{9}\right]\cup\left[\frac{2}{9},\frac{3}{9}\right]\cup\left[\frac{6}{9},\frac{7}{9}\right]\cup\left[\frac{8}{9},\frac{9}{9}\right]\). אפשר אם כן לחשוב על \(C_{2}\) כעל מה שמתקבל כאשר קוצצים את \(\left[0,1\right]\) לתשעה חלקים שווי אורך, מעיפים לפח את חלקם ומשאירים את היתר.

השלב הבא יניב את \(C_{3}\), שתהיה מורכבת משמונה קטעים, כל אחד מאורך \(\frac{1}{27}\) (כי ב-\(C_{2}\) היו ארבעה קטעים וכל אחד מהם חולק לשלושה חלקים שהאמצעי מביניהם נזרק). ב-\(C_{4}\) כבר יהיו 16 קטעים מאורך \(\frac{1}{81}\), ובאופן כללי: \(C_{n}\) תורכב מ-\(2^{n}\) קטעים, כל אחד מאורך \(\frac{1}{3^{n}}\). מה קיבלנו? סדרת קבוצות, \(C_{0},C_{1},C_{2},\dots\) כך שכל קבוצה מוכלת בקודמת – \(C_{0}\supset C_{1}\supset C_{2}\supset\dots\). קבוצת קנטור מתוארת בתור מה שמתקבל "בסוף" התהליך האינסופי הזה; כדי להגדיר זאת באופן מתמטי מדוייק, מגדירים אותה בתור החיתוך של כל אינסוף הקבוצות הללו, דהיינו \(C=\bigcap_{i=0}^{\infty}C_{i}\). במילים – קבוצת קנטור \(C\) תכיל את כל הנקודות שאינן מסולקות אף פעם מ-\(\left[0,1\right]\), בכל התהליך שתיארנו – אלו בדיוק הנקודות שנמצאות בכל קבוצה \(C_{n}\) שמתקבלת במהלך התהליך. השאלה היא מהן הנקודות הללו, ואם הן בכלל קיימות.

הנה ציור המדגים את שלבי הבניה הראשונים של הקבוצה:

ציור של האיטרציות הראשונות בבניית קבוצת קנטור

כמו שאפשר לראות, מהר מאוד הקבוצה הופכת להיות דלילה למדי, בלי קטעים "שמנים". דרך פורמלית לתאר זאת היא על ידי חישוב המידה הכוללת של כל הקטעים שמוצאים מתוך הקבוצה. מידה של קטע, לצורך הדיון הזה, תהיה פשוט אורכו – אין לנו צורך בהגדרה מורכבת יותר. באיטרציה הראשונה מסולק מ-\(C_{0}\) הקטע \(\left(\frac{1}{3},\frac{2}{3}\right)\) שאורכו \(\frac{1}{3}\); באיטרציה השניה מסולקים הקטעים \(\left(\frac{1}{9},\frac{2}{9}\right)\) ו-\(\left(\frac{7}{9},\frac{8}{9}\right)\) – שני קטעים שאורכם \(\frac{1}{9}\); ובאופן כללי, באיטרציה ה-\(n\) מסולקים \(2^{n-1}\) קטעים שאורכם \(\frac{1}{3^{n}}\) כל אחד, ולכן האורך הכולל שלהם הוא \(\frac{2^{n-1}}{3^{n}}\). שימו לב שכל הקטעים הללו זרים זה לזה, ולכן המידה של האיחוד של כולם שווה לסכום המידות שלהם, ולא סתם מהווה חסם עליון עבורו, ומכאן שניתן לחשב אותה במדוייק: המידה הכוללת של כל הקטעים שאותם מוציאים מקבוצת קנטור היא \(\sum_{n=1}^{\infty}\frac{2^{n-1}}{3^{n}}\), או בסימון פשוט מעט יותר, \(\sum_{n=0}^{\infty}\frac{2^{n}}{3^{n+1}}\). אלא שאת הסכום הזה ניתן לחשב במדוייק, אם שמים לב לכך שזהו פשוט טור הנדסי אינסופי מתכנס: \(\sum_{n=0}^{\infty}\frac{2^{n}}{3^{n+1}}=\frac{1}{3}\sum_{n=0}^{\infty}\left(\frac{2}{3}\right)^{n}=\frac{1}{3}\cdot\frac{1}{1-\frac{2}{3}}=\frac{1}{3}\cdot\frac{1}{\frac{1}{3}}=1\).

אם כן, מה שקיבלנו הוא שבמהלך בניית קבוצת קנטור, הוצאנו מ-\(\left[0,1\right]\) את "כל האורך". זה גורר מיידית שמידת קבוצת קנטור היא אפס, שכן \(\mu\left(C\right)+\mu\left(\overline{C}\right)=\mu\left(C\cup\overline{C}\right)=\mu\left(\left[0,1\right]\right)=1\) (למעשה, זה תלוי בהגדרה שלנו של מידה, כי ייתכן שקבוצת קנטור לא תהיה מדידה – אך עם מידות סטנדרטיות, ובפרט מידת לבג שהיא מה שאני חושב עליו כל הזמן, אין בעיה שכזו).

התוצאה הזו אינה מוזרה לכשעצמה, והיא אף מסתדרת עם האינטואיציה שלנו לגבי האופן שבו כל הקטעים ה"שמנים" סולקו מ-\(C\); אולם הזבנג הראשון מגיע כשבודקים מי הנקודות שנותרו ב-\(C\) ומגלים שנותרו המון מהן – למעשה, \(C\) מכילה מספר שאינו בן מניה של נקודות. במילים אחרות, ה"גודל" של \(C\) שווה ל"גודל"של \(\left[0,1\right]\)! אפשר לתת התאמה חד-חד ערכית ועל בין כל נקודה של \(\left[0,1\right]\) ובין כל נקודה של \(C\)! זוהי המחשה חזקה מאוד לאופן שבו מושג ה"גודל" (או יותר במדוייק – העוצמה) של קבוצה הוא מנותק ממושג המידה של קבוצה (הוא אינו בלתי תלוי לחלוטין – כבר הראיתי כאן בעבר כי קבוצה בת מניה היא בהכרח ממידה אפס; מה שמפתיע כאן הוא שגם קבוצות שאינן בנות מניה עשויות להיות ממידה אפס).

בואו נבדוק איך נקודה יכולה לשרוד את הבניה של קבוצת קנטור. למשל, הנקודה \(\frac{1}{3}\). בסיבוב הראשון היא נותרת בחיים כי היא נקודת הקצה הימנית של הקטע השמאלי מבין השניים שמתקבלים; בסיבוב השני הקטע הזה נחתך במרכזו לשתי חתיכות, ו-\(\frac{1}{3}\) תהיה בקצה החתיכה הימנית, הרחק משדה הקטל. גם בסיבוב הבא החתיכה שבה היא נותרה תיחתך לשניים, אבל \(\frac{1}{3}\) תהיה בקצה, הרחק משדה הקטל; וכן הלאה וכן הלאה. כלומר, הסכנה האמיתית ל-\(\frac{1}{3}\) נשקפה לה רק בסיבוב הראשון, שם היא הייתה על קצה שדה הקטל; אבל משם ואילך אין לה שום סכנה, והיא תמיד מרוחקת מרחק כלשהו מהקטל – מרחק של \(\frac{1}{3^{n}}\). אמנם, זה מרחק ששואף לאפס, אבל זה מבטיח ש-\(\frac{1}{3}\) תהיה בכל קבוצה \(C_{n}\), ולכן תהיה לבסוף גם ב-\(C\).

אבל \(\frac{1}{3}\) היא דוגמה משעממת, שכן היא מתקבלת מתישהו כנקודת קצה של אחד מהקטעים ב-\(C_{n}\) כלשהי (במקרה שלנו, ב-\(C_{1}\)). המשחק המחשבתי שעשינו מראה שכל נקודת קצה כזו תישאר, אבל מספר הנקודות הללו הוא זניח – בן מניה. הסיבה לכך היא שב-\(C_{n}\) יש בסה"כ \(2^{n+1}\) נקודות קצה שכאלו (ב-\(C_{n}\) יש \(2^{n}\) קטעים, כל אחד עם \(2\) נקודות קצה), ולכן מספר נקודות הקצה הכולל לכל \(C_{n}\) הוא סופי, ולכן מספר נקודות הקצה הכולל לכל ה-\(C_{n}\)-ים ביחד הוא בן מניה (איחוד בן מניה של קבוצות סופיות הוא בן מניה). בקיצור, הרוב המוחץ של הנקודות ב-\(C\), אם היא אכן לא בת מניה כפי שאני טוען, מגיע מנקודות שאינן נקודות קצה. זה כבר משוגע למדי ונוגד אינטואיציה בצורה חריפה – הרי אמרנו שמסלקים מ-\(C\) את כל ה"תוכן"- אנחנו מוציאים מתוכה קווים שאורכם הכולל הוא 1 – איך ייתכן שיוותרו ב-\(C\) נקודות שאינן נקודות קצה? אינטואיטיבית הן צריכות להיות ב"אמצע" הדרך בין שתי נקודות קצה, כלומר על קו כלשהו!

הבה ונתבונן בנקודה \(\frac{1}{4}\). מכיוון ש-\(\frac{1}{4}<\frac{1}{3}\), הרי ש-\(\frac{1}{4}\) נופלת בתוך \(\left[0,\frac{1}{3}\right]\) ושורדת את הסיבוב הראשון. מה קורה בסיבוב השני? ובכן, חייבים לעשות כאן חשבונות קטנוניים. אנחנו רוצים להשוות את \(\frac{1}{4}\) לנקודות מהצורה \(\frac{k}{9}\), והדרך לעשות זאת היא עם מכנה משותף – \(\frac{1}{4}=\frac{9}{36}\), ואילו \(\frac{k}{9}=\frac{4k}{36}\), ולכן קל לראות ש-\(\frac{2}{9}<\frac{1}{4}<\frac{3}{9}\), כלומר הוא שורד גם את הסיבוב השני – הוא נמצא בחלק הימני של \(\left[0,\frac{1}{3}\right]\). בסיבוב הבא \(\frac{1}{4}\) שורד כי הוא בקטע \(\left[\frac{6}{27},\frac{7}{27}\right]\), שהוא החלק השמאלי של \(\left[\frac{2}{9},\frac{3}{9}\right]\). אתם אולי כבר יכולים לנחש מה יקרה מכאן ואילך – \(\frac{1}{4}\) יתפספס פעם אחת כי הוא יימצא בחלק הימני ובפעם הבאה כי הוא יהיה בחלק השמאלי של הקטע שחותכים; הסיבה שהוא שורד היא שהוא אף פעם לא נמצא בקטע האמצעי. כיצד ניתן לתאר זאת בצורה מדוייקת? לצורך כך אנו מכניסים לתמונה מושג חדש – הפיתוח הטרינרי של איברי \(\left[0,1\right]\).

כזכור, פיתוח עשרוני של מספר הוא פשוט סדרת ספרות בין 0 ל-9. לצורך העניין אנחנו מדברים רק על מספרים בתחום \(\left[0,1\right]\), כך שלכולם יש פיתוח מהצורה \(0.a_{1}a_{2}a_{3},\dots\); הפיתוח הזה מסמל שהמספר הוא בדיוק \(\sum_{n=1}^{\infty}\frac{a_{n}}{10^{n}}\). באופן דומה, פיתוח טרינרי של מספר ישתמש בספרות 0,1,2 בלבד, ואז הסכום המתאים יהיה \(\sum_{n=1}^{\infty}\frac{a_{n}}{3^{n}}\).

בואו ונחזור ל-\(\frac{1}{4}\). איך מגלים מה הפיתוח שלו בבסיס טרינרי? ובכן, ספרה-ספרה. האם הספרה הראשונה היא 0, 1 או 2? אם היא הייתה \(1\), אז \(\frac{1}{4}\) היה מהצורה \(\frac{1}{3}\) ועוד משהו; ואם היא הייתה \(2\) הוא היה מהצורה \(\frac{2}{3}\) ועוד משהו. מכיוון שהוא קטן משניהם, אז הספרה הראשונה חייבת להיות \(0\). באופן כללי, אם אנחנו מחפשים את הפיתוח של \(a\), אז הספרה הראשונה נקבעת לפי השאלה האם \(a\in\left[0,\frac{1}{3}\right]\) (ואז היא 0) או ש-\(a\in\left[\frac{1}{3},\frac{2}{3}\right]\) (ואז היא 1) או ש-\(a\in\left[\frac{2}{3},1\right]\) (ואז היא 2). בוודאי שמתם לב למשהו מוזר בטיעון שלי – אם \(a=\frac{1}{3}\), אז מהי הספרה הראשונה שלו? 0 או 1? התשובה היא ששתי הספרות אפשריות, אבל המשך הפיתוח יהיה תלוי בכך – אם היא תהיה 1, אז המשך הפיתוח יהיה כולו אפסים, ולכן הפיתוח יהיה סופי. אני מעוניין לדבר כאן על פיתוחים אינסופיים בלבד, ולכן לא ארשה את הסיטואציה הזו. במילים אחרות, תמיד אקח את הספרה הקטנה יותר מבין אלו האפשריות.

נניח שהסכמנו שהספרה הראשונה היא \(a_{1}\), מה שאומר ש-\(a\in\left[\frac{a_{1}}{3},\frac{a_{1}+1}{3}\right]\). מה תהיה הספרה השניה, \(a_{2}\)? לצורך כך נחלק את הקטע \(\left[\frac{a_{1}}{3},\frac{a_{1}+1}{3}\right]\) שוב לשלושה חלקים, ו-\(a_{2}\) תיקבע לפי המיקום של \(a\) בחלוקה הזו – \(a_{2}=0\) אם הוא בחלק השמאלי, \(a_{2}=1\) אם הוא באמצעי, ו-\(a_{2}=2\) אם הוא בימני.

כל זה מבלבל למדי, ולכן מומלץ למי שלא הצליח לעקוב לחשוב על דוגמה פשוטה יותר במספרים טבעיים. נניח, המספר \(153\) בבסיס עשרוני. היכן הוא נמצא? ראשית, אם נחלק את התחום \(\left[0,1000\right]\) לעשרה חלקים שווים, נגלה שהוא נמצא בשני מביניהם – החלק \(\left[100,200\right]\); לאחר מכן נחלק תחום זה לעשרה חלקים שווים ונקבל שהמספר נמצא בחלק השישי – \(\left[150,160\right]\); ואז נחלק תחום זה לעשרה חלקים שווים ונקבל שהוא ברביעי מביניהם, \(\left[153,153\right]\). במילים אחרות, כל ספרה נוספת של המספר "משפרת את הדיוק" שלנו בנוגע לתחום שבו המספר עשוי להימצא, כשבכל פעם התחום הזה קטן פי עשרה (או במקרה של פיתוח טרינרי, פי שלושה).

כעת קל לאפיין את כל הנקודות שנמצאות בקבוצת קנטור – אלו בדיוק הנקודות שאף פעם לא נופלות באמצע קטע, בשום שלב בפיתוח שלהן. לכאורה "ליפול באמצע קטע" פירושו שמופיע 1 בפיתוח הטרינרי של הנקודה, אבל זה לא בהכרח אומר שהנקודה אכן נופלת באמצע; אם אחרי ה-1 מופיעים רק 0-ים או 2-ים, אז הנקודה לא נמצאת באמת באמצע קטע אלא "בקצה של קטע אמצעי" כלשהו (חשבו על הנקודה 2/3; אפשר לחשוב עליה כנמצאת בקצה הימני של הקטע האמצעי מבין השלושה שמתקבלים בתחילת הבניה של קבוצת קנטור; וכמובן, אפשר לחשוב עליה גם כנמצאת בקצה השמאלי של הקטע הימני מבין השלושה). אם בפיתוח של נקודה מופיע 1 אבל לאחר מכן רק סדרה אינסופית של 0 או סדרה אינסופית של 2, אז אפשר להחליף את הפיתוח הזה בפיתוח אחר שבו לא מופיע 1 (כי 1 ואז אינסוף אפסים אפשר להחליף באפס ואז אינסוף 2-ים; ו-1 ואז אינסוף 2-ים אפשר להחליף ב-2 ואז אינסוף אפסים). לכן הקריטריון לשייכות לקבוצת קנטור הוא זה: כל נקודה שיש לה פיתוח טרינרי שבו לא מופיע 1, שייכת לקבוצת קנטור.

כעת קל לראות כי קבוצת קנטור איננה בת מניה – פשוט שמים לב לכך שמספר הסדרות האינסופיות שאבריהן הן \(0,2\) איננו בן מניה, וחסל. זוהי תוצאה מפתיעה מאוד, אך בסופו של דבר אני סבור שהאינטואיציה יכולה להסתדר איתה.

כעת נעבור לדבר על המימד של קבוצת קנטור, ולצורך כך יש להסביר את ההגדרה שבה אני עומד להשתמש – מימד פרקטלי. מימד פרקטלי הוא מקרה פרטי של מושג כללי וחזק יותר, שנקרא מימד האוסדורף; מכיוון שהגדרתו מסובכת למדי לא אציג אותו כאן בשלב זה.

הגדרות למימד מנסות בדרך כלל להזדהות עם ההגדרה הנאיבית שלנו למימד של קבוצות "רגילות". במימד 1, היא קו; בשני מימדים, ריבוע הוא הקבוצה הרגילה הפשוטה ביותר שהיא ממימד 2, ובשלושה מימדים – קובייה, וכן הלאה. מה מבדיל בין היצורים הללו? הנה דרך יפה לחשוב על כך: אם ניקח קו ישר ונחתוך אותו באמצע, נקבל שני קווים ישרים שאורך כל אחד מהם הוא חצי מאורך הקו המקורי. כלומר, אפשר לחשוב על הקו כאילו הוא מורכב משני עותקים של עצמו, שגודל כל אחד מהם הוא חצי מגודל הקו המקורי. לעומת זאת, אם ניקח ריבוע ונחתוך אותו באמצע, נקבל שני מלבנים, שאינם דומים לריבוע; אבל אם נחתוך גם אותם באמצע, מה שנקבל הוא ארבעה ריבועים שנראים כמו הריבוע המקורי, פרט לכך שהם כווצו "פי 2" הן מבחינת אורכם והן מבחינת רוחבם. ואם ניקח קוביה וננסה לבנות אותה מקוביית קטנות יותר שכווצו "פי 2"נראה שאנו נזקקים לשמונה קוביות. אפשר גם לחשוב על כך בכיוון ההפוך – נניח שניקח קוביה (או ריבוע, או קו) ונכפיל את גודלו "פי 2"- כמה עותקים של היצור המקורי נקבל? לא קשה להוכיח כי נקבל \(2^{d}\) עותקים, כש-\(d\) הוא המימד של הקבוצה המדוברת (זכרו, אנחנו עדיין עוסקים בקבוצות פשוטות – קוביות \(d\) מימדיות).

המספר 2 נכנס לסיפור הזה בצורה שרירותית לגמרי. מה היה קורה אם היינו מנפחים את הריבוע פי 3 ולא פי 2? אז היינו מקבלים 9 עותקים של הריבוע המקורי, במקום 4. במילים אחרות , אם מנפחים פי 3, מקבלים \(3^{d}\) עותקים. ואם מנפחים פי \(k\) באופן כללי, מקבלים \(k^{d}\) עותקים.

מכאן הדרך להגדרה כללית אינה קשה. אם אנו לוקחים אובייקט ומנפחים אותו פי \(a\), ומקבלים \(b\) עותקים של האובייקט המקורי, איך ניתן להגדיר את המימד באמצעות \(a,b\)? ובכן, אנו מצפים שיתקיים הקשר \(b=a^{d}\), כלומר \(d=\log_{a}\left(b\right)\). מכיוון שבמתמטיקה קל לבטא לוגריתם בבסיס כלשהו באמצעות הלוגריתם הטבעי \(\ln\) (למעשה, אפשר לבטא בקלות לוגריתם בבסיס כלשהו באמצעות לוגריתם בבסיס אחר) כותבים הגדרה זו בתור \(d=\frac{\ln b}{\ln a}\). כמובן שמתעוררת השאלה האם לכל ניפוח ב-\(a\) אכן נקבל \(b\) שהוא \(a^{d}\), או שעבור ערכים שונים של \(a\) נקבל ערכים של \(b\) ש"מתנהגים מוזר" ואינם בהכרח \(a^{d}\) עבור אותו \(d\) כל הזמן; אבל לקבוצות שעליהן אדבר, התכונה הזו כן מתקיימת. למרות שדיברתי על ניפוח, אפשר לחשוב על כך גם באופן ההפוך – \(a\) מתאר פי כמה אנחנו מקטינים את הקבוצה, ו-\(b\) מתאר כמה עותקים של הקבוצה המוקטנת מרכיבים את הקבוצה המקורית.

המימד הזה נקרא "מימד פרקטלי" שכן הגדרתו מדברת על יצורים שהם פרקטלים – יצורים שאפשר לחשוב עליהם כאילו הם מורכבים מעותקים קטנים יותר של עצמם. בדרך כלל כשמדברים על פרקטלים לא חושבים על יצורים משעממים כמו קו או ריבוע, ואני מקווה לכתוב מתישהו פוסט שיציג פרקטלים יותר ברצינות.

כעת הבה ונחיל את ההגדרה הזו על קבוצת קנטור. גם על קבוצת קנטור אפשר לחשוב כאילו היא מורכבת מעותקים קטנים יותר של עצמה, כלומר שהיא פרקטל – מדוע? כי הבה ונסתכל במה שקורה לקבוצת קנטור אחרי האיטרציה הראשונה, כלומר בקבוצה \(C_{1}\); היא מורכבת משני קטעים, כל אחד מהם באורך \(\frac{1}{3}\), שמעתה והלאה מה שעומדים לעשות איתם הוא לסלק להם את האמצע, ולשאריות יסלקו את האמצע, וכו' וכו' – כלומר, יופעל עליהם אותו תהליך שהופעל על קבוצת קנטור המקורית. במילים אחרות, אפשר לחשוב על קבוצת קנטור כאילו היא מתקבלת מאיחוד של שתי קבוצות קנטור קטנות יותר. כמה קטנות יותר? פי 3, שהרי אורך הקטע שממנו הבניה מתחילה עבור הקבוצות הקטנות יותר הוא קטן פי 3 מאורך הקטע שבו התחילה הבניה המקורית. במילים אחרות, במקרה שלנו \(a\) הוא 3, ואילו \(b\) הוא 2. מכאן שהמימד הוא \(d=\frac{\ln2}{\ln3}\). אבל מספר זה לא רק שאינו שלם, הוא אף אינו רציונלי. אם ניקח את הספרות הראשונות שלו נקבל \(0.6309297\dots\), וזה המספר שהבטחתי בהתחלה.

כלומר, קבוצת קנטור היא לא אפס ממדית – היא "גדולה יותר"מיצור אפס-ממדי, כלומר מנקודה. זה משתלב טוב עם האינטואיציה שלנו שהקבוצה היא "גדולה" כי יש בה מספר לא בן מניה של נקודות. מצד שני, קבוצת קנטור היא גם לא 1-ממדית – היא "קטנה יותר" מיצור חד-ממדי, כלומר מקו. זה משתלב טוב עם האינטואיציה שלנו שהקבוצה היא "קטנה" כי המידה שלה היא 0 והוצאנו ממנה את כל ה"אורך". במילים אחרות, המימד הפרקטלי שהצגתי כאן מאפשר לנו יכולת הבחנה חדה יותר בין קבוצות "קטנות" ו"גדולות".

אני מקווה שזה משכנע אתכם שיש טעם לדבר על מימדים מסוג זה, ושיש הגיון רב בדיבור על מימדים לא שלמים. אותי, לפחות, זה משכנע.

משחק – תחרות ציטוטים

יוסי גורביץ פתח בבלוג שלו במשחק ציטוטים. הרעיון פשוט – נתונות מספר קטגוריות, וכל אחד יכול לשלוח לינקים לציטוטים המתאימים לקטגוריות השונות. גם אני רוצה לקיים משחק דומה, אך מן הסתם כזה שקשור לנושאים מתמטיים. את הקישורים לציטוטים אפשר יהיה להשאיר בתגובות לפוסט הזה, או לשלוח לי במייל (שהוא gadial בג'ימייל). לעת עתה אני מציע את הרשימה הלא מחייבת הבאה של קטגוריות, אך אתם מוזמנים להציע עוד:

פרס פיינמן – לטענות בסגנון "אין שום טעם במתמטיקה בלי פיזיקה/תחום יישומי אחר". לדוגמה:

Physics is to math what sex is to masturbation

שמיוחס לריצ'ארד פיינמן.

פרס הארדי – לטענות בסגנון "הדבר הכי טוב במתמטיקה הוא שלא מיישמים אותה לכלום". לדוגמה:

Mathematicians may be justified in rejoicing that there is one science at any rate, and that their own, whose very remoteness from ordinary human activities should keep it gentle and clean.

של ג'. ה. הארדי.

כאמור, רצוי שהציטוטים עצמם ילוו בלינק למקום שבו הם נאמרים, אך אפשר גם לצטט מתוך ספר. אין חשיבות לתאריך הציטוט – ציטוטים מלפני יומיים יתקבלו בברכה בדיוק כמו ציטוטים מהמאה ה-17. המגבלה העיקרית שלי – הציטוט צריך להיות בעברית או באנגלית (או מתורגם לאחת משפות אלו, כמובן).

פרס "השמועה אומרת ש…" – לטענות שמציגות משפט מתמטי, רצוי מתוך כוונה ליישם אותו למטרה מטא-מתמטית כלשהי, אך מתארות את המשפט בצורה שגויה להחריד. דוגמה:

גם במרחב הארבעה-ממדי לכל ספירה, ולכל עצם שיכול להפוך לספירה באמצעות כיווץ, הרחבה או עיקום, יש את התכונה, שלפיה כל לולאה המותווית על המעטפת שלו ניתנת לצמצום לנקודה. זוהי השערת פואנקרה.

כאן זוהי דוגמה שלא באה מתוך כוונת יישום, אמנם, אלא מתוך כוונה חיובית מאוד להציג את השערת פואנקרה לציבור הרחב ב"הארץ". לרוע המזל, מה שמתואר בתור השערת פואנקרה הוא אבחנה טריוויאלית – ההשערה עוסקת בכיוון השני (העיתון מציג את ההשערה כאילו היא אומרת "עורבים הם שחורים" כשבפועל היא אומרת "כל מה ששחור הוא עורב" – כמובן, בהקשר המתמטי המתאים).

הפרס שקל לראות – פרס לטענה שנטענת על ידי מתמטיקאי רציני, בדבר פשטות הפתרון של בעיה/הוכחה/תרגיל, שבעטיה הוא לא טורח לציין אותו במפורש. דוגמה קלאסית במיוחד (אם כי לא מדוייקת לחלוטין) היא הציטוט המפורסם של פרמה על "המשפט האחרון" שלו:

בידי הוכחה נפלאה לטענה זו אך שולי ספר זה צרים מלהכילה.

וכמובן, איך אפשר בלי: פרס הטרחן הכפייתי – פרס לטענה שמחריבה עדי יסוד את המתמטיקה ה"רגילה", מוקיעה אותה כשגויה, או פותרת בעיה מתמטית פתוחה/שהוכחה כבלתי פתירה, ועושה זאת על ידי חוסר הבנה מוחלט של מהי מתמטיקה, או על ידי כשל רעיוני בסיסי ביותר. דוגמה:

No formal language capable of expressing non-trivial mathematical problems can be consistent and complete. Therefore, no consistent and complete definition of the set NP is possible.

שלקוחה מכאן.

מי הזיז את הטור שלי?

יותר מכל, המתמטיקה של זמננו זוכה לתדמית "מדוייקת", "פורמלית", אפילו צרת מוחין. טענה נפוצה בדיונים היא ש"החיים זה לא מתמטיקה" ואין טעם לבקש להכל הגדרות מדוייקות והסברים ברורים. אלא שהמתמטיקה הזו היא צעירה יחסית; אפילו המתמטיקה של המאה ה-19 לא הייתה כזו בדיוק. המתמטיקה ה"פורמלית" היא תוצר של תהליך בן אלפי שנים, שהתרחש שלא במקרה אלא מתוך הכרח.

נהוג לציין את תחילת המתמטיקה ביוונים הקדמונים. לא שחישובים לא בוצעו קודם לכן, והדוגמאות הבולטות הן המצרים והבבלים, שידעו לבצע חישובים לא טריוויאליים כלל, בהתחשב בכך שהמתמטיקה לא הייתה קיימת אז – למשל, פתרון משוואות ריבועיות. אלא שאצלם לא היה מושג כזה, "משוואה ריבועית" – היו בעיות קונקרטיות, לרוב גאומטריות במהותן, והיו אלגוריתמים שהותאמו למקרים מאוד ספציפיים ופתרו אותם. המושג של "הוכחה" לא היה קיים כלל – הנכונות של האלגוריתמים לא עניינה אף אחד (עד כמה שניתן להבין זאת מהשרידים שנותרו…), אלא רק שהם עובדים בפועל. היוונים הם אלו ששינו את התפיסה הזו והכניסו לתמונה את מושג ההוכחה – גזירה של תוצאות כלליות מתוך קבוצת אקסיומות בסיסיות שעבור היוונים, נכונותן הייתה "מובנית מאליה", וכללי גזירה פשוטים. אלא מה – האקסיומות של היוונים לא היו בדיוק מובנות מאליהן (בפרט, אקסיומה אחת – "אקסיומת המקבילים" – הייתה שנויה במחלוקת במשך אלפי שנים; כבר סיפרתי על כך בעבר כאן טיפה, ואולי ארחיב בעתיד), ובימינו הן לא היו עומדות במבחן הדקדקני של המתמטיקה בת זמננו.

לאחר תקופת היוונים עיקר העיסוק (ראשית בארצות האיסלאם בתקופת ימי הביניים, ולאחר מכן באירופה של תקופת הרנסנס) התמקד בפתרון משוואות אלגבריות, אם כי רוב המתמטיקאים עדיין השתמשו בגאומטריה עבור אינטואיציה ועבור הצדקה לנכונות הפתרונות שלהם. ואז הגיעה המאה ה-17, שבה פקדה את המתמטיקה תקופת פריחה שלא פסקה עד היום, והביאה עמה בין היתר את אחד מעמודי התווך המרכזיים של המתמטיקה: החשבון האינפיניטסימלי, שראשיתו בבעיות גאומטריות מעשיות כדוגמת חישוב המשיק לעקום, או שטח החסום על ידי עקום. החשבון האינפיניטסימלי הומצא בנפרד על ידי ניוטון ולייבניץ, ושניהם התבססו על רעיונות ותוצאות מוקדמות יותר (למעשה, אפילו מתקופת היוונים, ובפרט מהשיטות של ארכימדס). אלא שאצל שניהם הביסוס היה רעוע למדי, והמושג המרכזי – האינפיניטסימל – היה פשוט סתירתי; כשהיה נוח התייחסו אליו כאפס ולכן ניתן היה להתעלם ממנו, וכשלא היה נוח (למשל, כשחילקו בו) התייחסו אליו כאל מספר שונה מאפס. במהלך המאה ה-18 המשיכה המגמה ה"לא פורמלית" להתקיים אצל העוסקים במתמטיקה, והדוגמה הבולטת ביותר היא של אוילר, מתמטיקאי פורה באופן יוצא דופן, שעם זאת שיטותיו לא בוססו עד הסוף ובסטנדרטים המחמירים של ימינו לא היו מתקבלות על הדעת (אם כי סביר להניח שאוילר היה מושך בכתפיו, מתאמץ עוד טיפה ומציג הוכחות פורמליות שהקהילה הייתה מקבלת ללא עוררין). הצגתי דוגמה לכך בפוסט שעסק בפאי – אוילר עסק בטור חזקות אינסופי, והניח שניתן להציג אותו כמכפלה באותו האופן שניתן לעשות זאת לפולינום סופי – ללא שום הצדקה.

התפנית הגיעה במאה ה-19, כששני התורמים המרכזיים לה היו קושי ו-ויירשטראס. קושי, שפעל בתחילת המאה, ניסה לתת פורמליזציה קונקרטית יותר לחשבון האינפיניטסימלי; אצלו ניתן למצוא גרסה בסיסית של מושג הגבול, שהפך למושג המרכזי שעליו מתבסס החשבון האינפיניטסימלי (במקום האינפיניטסימל). ויירשטראס פעל יותר קרוב לסוף המאה, וגישתו למתמטיקה הייתה פורמלית עוד יותר משל קושי. הוא זה שהמציא את אופן הסימון המדוייק שבו אנו מגדירים גבולות כיום (מה שמוכר לסטודנטים בתור "אפסילון-דלתא", על שם שני הסימנים הסטנדרטיים שמופיעים בהגדרה), ולימד אותו באוניברסיטה שבה הרצה. בין תלמידיו היו מתמטיקאים משפיעים רבים, וה"אופנה" התפשטה במתמטיקה במהירות. תרמה לכך ככל הנראה העובדה שויירשטראס נהג למצוא להנאתו דוגמאות נגדיות למשפטים של עמיתיו, ששמו לצחוק את ההנחות הסמויות שהניחו בשל מחסור בפורמליזציה מלאה מספיק. על דוגמה נגדית שכזו אני רוצה לדבר בפוסט הזה, אם כי במקרה זה מדובר על משפט של רימן, לא של ויירשטראס (על הדוגמה הנגדית המפורסמת ביותר של ויירשטראס – פונקציה שרציפה בכל מקום אך אינה גזירה בשום מקום – כדאי להרחיב בפוסט נפרד) – משפט שעוסק בטורים אינסופיים, ושם לצחוק בצורה קיצונית את האינטואיציה שלנו ("שלנו", במקרה זה, מתייחס למי שאינו מפחד ממתמטיקה) לגביהם.

תזכורת קטנה לגבי מהם טורים (יש לי גם פוסט בנושא). טור סופי הוא סכום מהצורה \(a_{1}+a_{2}+\dots+a_{n}\), או בקיצור \(\sum_{i=1}^{n}a_{i}\), כאשר \(a_{i}\) הם, נניח, מספרים ממשיים. למרות שהביטוי נראה פשוט, יש תחכום כלשהו בו – פעולת ה"חיבור" אינה מוגדרת על \(n\) איברים אלא רק על שניים בכל פעם, ולכן המשמעות של \(\sum_{i=1}^{n}a_{i}\) היא כשל תוצר של תהליך: ראשית כל מבצעים את החיבור \(a_{1}+a_{2}\), מקבלים תוצאת ביניים שאכנה \(s_{2}\), ואז מחברים \(s_{2}+a_{3}\) ולתוצאה קוראים \(s_{3}\), וכן הלאה וכן הלאה. החיבור הוא פעולה אסוציאטיבית, מה שאומר שאם קודם כל מחברים את \(a_{2}\) ו-\(a_{3}\), ורק לתוצאה הזו מחברים את \(a_{1}\), נקבל עדיין את אותו הדבר: \(\left(a_{1}+a_{2}\right)+a_{3}=a_{1}+\left(a_{2}+a_{3}\right)\). בדומה, החיבור הוא גם פעולה קומוטטיבית, במובן זה ש-\(a_{1}+a_{2}=a_{2}+a_{1}\). משני אלו עולה, באמצעות אינדוקציה, שאם ניקח את \(a_{1}+a_{2}+\dots+a_{n}\) ונערבב את האיברים שלו בכל צורה שרק נרצה (למשל, את \(a_{1}+a_{2}+a_{3}+a_{4}\) נהפוך ל-\(a_{3}+a_{2}+a_{4}+a_{1}\)) עדיין נקבל את אותו הסכום – מה שהגיוני ומתאים לתפיסה שלנו לפיה \(\sum_{i=1}^{n}a_{i}\) תופס את כל האיברים "בבת אחת".

באופן דומה ניתן לגשת במתמטיקה לטיפול בסכום שיש בו אינסוף איברים (וזו אכן ההגדרה המקובלת ביותר, אם כי לא היחידה), כלומר טור מהצורה \(\sum_{n=1}^{\infty}a_{n}\), למשל \(\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{16}+\dots+\frac{1}{2^{n}}+\dots\), שהוא הטור המוכר מפרדוקס אכילס. הדרך הסבירה להגדיר סכום של טור שכזה היא שוב באמצעות "תוצאות ביניים": מסמנים בתור \(S_{n}=\sum_{i=1}^{n}a_{i}\), כלומר את סכום \(n\) האיברים הראשונים בטור, ואז מסתכלים על סדרת המספרים \(S_{n}\) שהתקבלה – אם היא שואפת לגבול מסויים, על פי ההגדרה הסטנדרטית של גבול (שראויה לפוסט משל עצמה – וגם קיבלה כזה – ולכן לא אחזור עליה כאן במדוייק), אז \(\sum_{n=1}^{\infty}a_{n}\) יהיה אותו הגבול. למשל, \(S_{n}\) עבור הטור של אכילס שהצגתי הוא הסכום הרגיל של סדרה הנדסית סופית, כלומר \(\frac{1}{2}\cdot\frac{\left(\frac{1}{2}\right)^{n}-1}{\frac{1}{2}-1}=1-\frac{1}{2^{n}}\), וסכום זה בבירור שואף ל-1, כך שמגדירים \(\sum_{n=1}^{\infty}a_{n}=1\). האם המספר הזה אכן ראוי לתואר הסכום של \(a_{1},a_{2},\dots\)? זוהי שאלה פילוסופית מצויינת, שדורשת קודם כל הסבר לגבי משמעות המושג "סכום". בעבר הגנתי בחירוף נפש על הזכות של הגדרה זו לתאר את הסכום; בפוסט הזה אני לא צריך להתגונן בפני אף אחד ולכן אציג דווקא ספק או שניים שעשויים להתעורר כאשר מנסים לחשוב על ההגדרה הזו כעל ההגדרה ה"נכונה".

מרגע שהגדרנו סכום, אנחנו רוצים להתחיל לחקור את התכונות שלו, והתכונה המהותית שאני רוצה לדבר עליה בפוסט הזה היא שינוי סדר האיברים בסכימה – מה שכבר ראינו שניתן לבצע ללא חשש לטורים סופיים. אינטואיטיבית לא נראה שאמורה להיות בעיה עם זה – הרי סכום תופס את כל האיברים "בבת אחת", אז מה זה משנה אם יש אינסוף איברים בטור? ואכן, כל עוד היחס לאינפי היה לא ריגורוזי, שינויים כאלו בוצעו בלי הרבה הסתבכויות. אלא שאנחנו פדנטים, וכל דבר שרוצים לעשות – צריך להוכיח במפורש.

אם ננסה לקחת את ההוכחה שלנו עבור טורים סופיים ולהחיל אותה על טורים אינסופיים, אנחנו בבעיה. מה בעצם ההוכחה שלנו הייתה? ראינו כי אפשר לקחת זוג איברים סמוכים בטור ולהחליף את מקומם מבלי לשנות את סכום הטור. בעזרת סדרת החלפות שכזו ניתן לבצע כל פרמוטציה שרק נרצה על אברי הסכום (כל פרמוטציה סופית ניתנת לכתיבה כמפלה סופית של החלפות). אלא שעבור טורים אינסופיים אנחנו בצרות – כל מה שאנחנו יכולים להראות הוא שניתן להחליף את מקומם של מספר סופי של איברים בטור ולא לשנות את סכומו. הרי זה מה שהוכחה באינדוקציה עושה: אנחנו יכולים להראות כי לכל \(k\) טבעי, אחרי שמבצעים \(k\) החלפות על הטור, סכומו אינו משתנה; אבל לא נובע מכך שעבור אינסוף החלפות סכום הטור יישאר זהה. כדי לטעון טענה בסגנון הזה – טענה שמסוגלת לקפוץ מנכונות-למספר-סופי אל נכונות-עבור-אינסוף צריך להשתמש בגרסה חזקה יותר של מושג האינדוקציה – האינדוקציה הטרנספיניטית – אלא שכדי להשתמש בה צריך להוכיח טענות יותר חזקות (בפרט, צריך יהיה להוכיח "בידיים" שאם לכל \(k\) טבעי זה עובד, אז גם עבור הסודר האינסופי הקטן ביותר – \(\omega\) – זה עובד) ולכן היא לא רלוונטית כרגע. השורה התחתונה – ההוכחה למקרה הסופי לא תופסת את המקרה האינסופי כמו שצריך. עלינו לחפש הוכחה אחרת.

במקרה אחד (מרכזי) הוכחה אחרת אכן קיימת ואינה מסובכת במיוחד – אם כל האיברים \(a_{n}\) הם אי שליליים (\(a_{n}\ge0\) לכל \(n\)). הבה ונקרא \(b_{n}\) לאיברים של \(a_{n}\) אחרי שעברו "סידור מחדש" כלשהו (גם כזה שכולל הזזה של אינסוף איברים). מה שאנחנו רוצים להראות הוא ש-\(\sum_{n=1}^{\infty}a_{n}=\sum_{n=1}^{\infty}b_{n}\). הבה ונסמן \(s_{n}=\sum_{i=1}^{n}a_{n}\) ובדומה \(t_{n}=\sum_{i=1}^{n}b_{n}\), וכמו כן נסמן \(S=\lim_{n\to\infty}s_{n}\) (כלומר, \(S=\sum_{n=1}^{\infty}a_{n}\)). אז הדרך הפורמלית לומר ש-\(S=\sum_{n=1}^{\infty}b_{n}\) היא לומר כי לכל \(\varepsilon>0\) קיים \(M\) כך שלכל \(m>M\) מתקיים \(\left|S-t_{m}\right|<\varepsilon\). בואו ונראה למה, בהינתן \(\varepsilon>0\) שכזה, אכן קיים \(M\) המבוקש.

האינטואיציה היא זו: מכיוון ש-\(a_{n}\) הם חיוביים, אז \(S\) חייב להיות מורכב מסכום של כמה איברים "גדולים" שהם אלו שתורמים את עיקר הגודל ל-\(S\), ומספרם סופי, ועוד אינסוף איברים "קטנים". אם נבחר \(M\) גדול מספיק כך שגם אחרי הסידור-מחדש של \(b_{n}\), \(t_{m}\) כבר מכיל בסכום את כל אותם איברים "גדולים", אז \(S-t_{m}\) יהיה חייב להיות קטן. זה הרעיון, וכעת אפשר לפרמל אותו.

מכיוון ש-\(s_{n}\to S\), אז על פי הגדרת הגבול קיים \(N\) כך שמתקיים \(\left|S-s_{N}\right|<\frac{\varepsilon}{2}\) (למה חצי? ראיית הנולד שתכף תתבהר). \(s_{N}\) כולל בתוכו את כל האיברים ה"גדולים", ולכן האיברים ה"קטנים" יהיו כל ה-\(a_{N+1},a_{N+2}\) וכן הלאה. כעת ניקח \(M\) כך ש-\(b_{1},b_{2},\dots,b_{M}\) מכילים בתוכם בפרט את כל האיברים \(a_{1},a_{2},\dots,a_{N}\) (במילים אחרות, \(M\) הוא המקסימום על קבוצת האינדקסים של "לאן \(a_{1}\) עובר? ולאן \(a_{2}\) עובר?" וכו'). כעת ניקח \(m>M\), ומטרתנו בחיים היא להראות ש-\(\left|S-t_{m}\right|<\varepsilon\) – אם נצליח, סיימנו. כדי לעשות זאת משתמשים בתעלול אינפי סטנדרטי: \(\left|S-t_{m}\right|=\left|S-s_{N}+s_{N}-t_{m}\right|\le\left|S-s_{N}\right|+\left|s_{N}-t_{m}\right|<\frac{\varepsilon}{2}+\left|s_{N}-t_{m}\right|\). מה שנותר, אם כן, הוא להראות ש-\(\left|s_{N}-t_{m}\right|<\frac{\varepsilon}{2}\). הרעיון מאחורי זה: \(t_{m}\) כולל כבר את כל אברי \(s_{N}\), ולכן \(\left|s_{N}-t_{m}\right|\) הוא בעצם גודלם של כל האיברים שנותרו ב-\(t_{m}\) מעבר לכך, ואמרנו שהם קטנים יחסית.

אם כן, מהו \(\left|s_{N}-t_{m}\right|\)? כאמור, \(t_{m}\) כבר כולל את כל אברי \(s_{N}\), ולכן כדי לחסום את ההפרש אפשר להשתמש בכל יתר אברי הסדרה המקורית, \(a_{n}\). במילים אחרות, \(\left|s_{N}-t_{m}\right|\le\left|a_{N+1}\right|+\left|a_{N+2}\right|+\dots\). כאן סוף סוף נשתמש בכך שהסדרה חיובית: \(\left|a_{i}\right|=a_{i}\) לכל \(a_{i}\), כך שקיבלנו כי \(\left|s_{N}-t_{m}\right|\) חסום על ידי זנב של הטור \(\sum_{n=1}^{\infty}a_{n}\). אבל הרי אמרנו כי \(\left|S-s_{N}\right|<\frac{\varepsilon}{2}\), ו-\(\left|S-s_{N}\right|=\left|a_{N+1}+a_{N+2}+\dots\right|=a_{N+1}+a_{N+2}+\dots\) הוא בדיוק גודלו של זנב הטור המבוקש, כך שסיימנו.

כמו שקורה לעתים קרובות במתמטיקה, ההוכחה שלנו כוונה למקרה פרטי מסויים – טור חיובי – אבל למעשה היא עובדת עבור מחלקה רחבה יותר של טורים: כל טור שעבורו \(\sum_{n=1}^{\infty}\left|a_{n}\right|\) מתכנס. השינוי שצריך לעשות בהוכחה כדי שתעבוד גם במקרה זה הוא עדין אך מחוכם: את \(N\) צריך לבחור כך שיתקיים בו זמנית כי \(\left|S-s_{N}\right|<\frac{\varepsilon}{2}\) (וכך אכן בחרנו את \(N\) קודם) וכמו כן יתקיים ש-\(\sum_{i=1}^{\infty}\left|a_{i}\right|-\sum_{i=1}^{N}\left|a_{i}\right|<\frac{\varepsilon}{2}\), כלומר שהזנב של טור הערכים המוחלטים יהיה קיים. קודם קיבלנו תכונה זו בחינם, מכיוון שטור הערכים המוחלטים היה שווה לטור המקורי, אבל באופן כללי זה לא כך.

טור כזה, שעבורו \(\sum_{n=1}^{\infty}\left|a_{n}\right|\) מתכנס, נקרא טור מתכנס בהחלט (Absolutely convergent), וזה שם מתאים ביותר. נסכם אם כן את מה שראינו עד כה: אם טור מתכנס בהחלט, אז אפשר לשנות ללא חשש את סדר הסכימה של איבריו ומובטח שנקבל את אותו הסכום. אבל מה קורה אם יש לנו טור שהוא מתכנס, אך לא מתכנס בהחלט – האם גם אז ניתן לשנות את סדר הסכימה? והאם קיימים בכלל טורים כאלו? התשובה לשאלה השנייה היא "כן" ותכף נראה דוגמה; והתשובה לשאלה הראשונה היא משפט רימן המדובר, והיא "לא" זועק.

הטור \(1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\dots\) מכונה "הטור ההרמוני" (לא חשוב כרגע למה). הוא הדוגמה הפשוטה ביותר לטור שמצד אחד, האיבר הכללי שלו (\(\frac{1}{n}\)) שואף לאפס, ועם זאת הוא אינו מתכנס אלא שואף לאינסוף – כלומר, לכל \(M\) טבעי, אם נסכום מספיק איברים של הטור, נעבור את \(M\). דרך נאה לראות זאת היא באמצעות קיבוץ איברים: \(1+\frac{1}{2}>\frac{1}{2}\), כמובן; \(\frac{1}{3}+\frac{1}{4}>2\cdot\frac{1}{4}=\frac{1}{2}\) (כי שני האיברים בסכום גדולים או שווים ל-\(\frac{1}{4}\)); \(\frac{1}{5}+\frac{1}{6}+\frac{1}{7}+\frac{1}{8}>4\cdot\frac{1}{8}=\frac{1}{2}\); וכן הלאה וכן הלאה. בכל פעם נקבץ קבוצה גדולה פי 2 של איברים, ונוסיף \(\frac{1}{2}\) לסכום שלנו, ומכאן שהסכום גדל עוד ועוד עד אינסוף, אם כי בקצב שהולך ונעשה איטי יותר ויותר עם הזמן – כמות האיברים שצריכים לקבץ בכל פעם כדי להגדיל את הסכום ב-\(\frac{1}{2}\) שווה לכמות כל האיברים שקיבצנו עד כה. למי שזה נשמע לו מוכר בצורה כלשהי, זה לא מקרי; אפשר להראות שהסכום הזה מתנהג בערך כמו \(\ln x\), שגם היא פונקציה ששואפת לאינסוף, אך לאט.

כעת אפשר להכניס לתמונה משפט של לייבניץ מתורת הטורים – אם \(a_{n}\) היא סדרת מספרים חיוביים ששואפת מונוטונית לאפס, אז הטור \(\sum_{n=1}^{\infty}\left(-1\right)^{n+1}a_{n}\), שמתקבל על ידי כך ששמים לסירוגין סימן חיובי וסימן שלילי על המספרים, מתכנס. לא אוכיח את המשפט כרגע (הוכחה טכנית ואינה קשה במיוחד), אלא אתמקד בשורה התחתונה: הטור \(1-\frac{1}{2}+\frac{1}{3}-\frac{1}{4}+\frac{1}{5}-\dots\) מתכנס, וזאת למרות שאם לוקחים את הערכים המוחלטים של אברי הטור מקבלים את הטור ההרמוני, שאינו מתכנס. דהיינו – מצאנו טור שמתכנס אך אינו מתכנס בהחלט. אגב, לא רק שהטור מתכנס, אנחנו יודעים אפילו את סכומו, בעזרת פיתוח טיילור של \(\ln\): \(\ln\left(1+x\right)=x-\frac{x^{2}}{2}+\frac{x^{3}}{3}-\frac{x^{4}}{4}+\dots\) כאשר \(-1<x\le1\), ולכן על ידי הצבת \(x=1\) בטור מקבלים שסכום הטור ההרמוני המתחלף הוא \(\ln\left(2\right)\).

וכעת הבה ונראה דבר מה מוזר. נסמן את סכום הטור ההרמוני המתחלף ב-\(A\) (כאמור, \(A=\ln2\) אבל למה להסתבך). כעת בואו ונשנה את סדר הסכימה של הטור ההרמוני המתחלף לדבר המוזר הבא: \(1-\frac{1}{2}-\frac{1}{4}+\frac{1}{3}-\frac{1}{6}-\frac{1}{8}+\frac{1}{5}-\frac{1}{10}+\dots\). במילים אחרות – ראשית כל איבר אחד חיובי מהטור, ואז שני איברים שליליים. אז האיבר החיובי הבא, ואז שני האיברים השליליים הבאים, וכן הלאה. שימו לב לכך שבסכום הזה, האיבר החיובי תמיד שווה לפי 2 האיבר השלילי שבא אחריו (נסו להוכיח זאת לעצמכם), כך שמתקבל הטור \(\frac{1}{2}-\frac{1}{4}+\frac{1}{6}-\frac{1}{8}+\frac{1}{10}-\dots\). האם הטור הזה נראה מוכר? בוודאי: הוא שווה ל-\(\frac{1}{2}\left(1-\frac{1}{2}+\frac{1}{3}-\frac{1}{4}+\dots\right)\), כלומר לחצי הטור ההרמוני המתחלף, ולכן סכומו הוא \(\frac{A}{2}\). אבל רגע אחד – איך זה ייתכן? נובע מכך ש-\(A=\frac{A}{2}\) וזה קורה רק אם \(A=0\), אבל כבר אמרנו שלא זה המצב. מכאן ששינוי סדר הסכימה של הטור שינה את סכומו של הטור. באנג! האינטואיציה שלנו הלכה לפח ברגע זה ממש.

אם כן, כשיש לנו טור שמתכנס אך לא מתכנס בהחלט, הסדר שבו סוכמים את הטור הוא קריטי למציאת סכום הטור. זה אומר שקשה, אולי בלתי אפשרי, לחשוב על סכום הטור הזה כעל מה שמקבלים כאשר מחברים את כל איבריו "בבת אחת" – חיבור בבת אחת שכזה אמור להתעלם מהסדר שבו מחברים איברים פרטניים של הטור. אם כן, במקרה זה הטור שלנו לא מצליח לייצג סכום במובן הרגיל שבו אנחנו מבינים אותו, אלא לכל היותר לתאר תהליך מסויים.

משפט רימן מראה שהאנומליה הזו היא לא מקרית, ושלא מדובר כאן על איזו התחכמות אד-הוקית. הניסוח שלו הוא פשוט: אם \(\sum_{n=1}^{\infty}a_{n}\) הוא טור שמתכנס אך לא מתכנס בהחלט, אז ניתן על ידי שינוי סדר איבריו לקבל טור \(\sum_{n=1}^{\infty}b_{n}\) שמתכנס לאן שאנחנו רוצים. דהיינו, אם \(t\) הוא מספר ממשי כלשהו, אז אפשר לשנות את סדר הסכימה ולקבל טור שמקיים \(\sum_{n=1}^{\infty}b_{n}=t\); וכמו כן אפשר על ידי שינוי סדר הסכימה לקבל \(\sum_{n=1}^{\infty}b_{n}=\infty\) או \(\sum_{n=1}^{\infty}b_{n}=-\infty\); ואפשר גם שהטור לא יתכנס כלל אלא "יזפזפ" בין כמה ערכים שונים. בקיצור, אם מרשים לשנות את סדר הסכימה של טור מתכנס שאינו מתכנס בהחלט, אפשר לקבל כל דבר שרוצים.

מי היה מאמין שמוקש כל כך מטורף מסתתר לו מאחורי פעולה תמימה יחסית כמו שינוי סדר הסכימה של טור? מי היה מאמין שהאינטואיציה שאנחנו מקבלים מהמקרה הסופי יכולה להישבר בכזו אכזריות? יש כאן לקח חשוב מאוד, לטעמי, ולא רק למתמטיקה אלא לחיים בכלל – לא לקחת דברים כמובנים מאליהם. תמיד לחקור, לשאול שאלות, לאתגר, ולהיזהר מאוד ממה שמרגיש לנו אינטואיטיבית "דומה". האינטואיציה שלנו היא חבר נאמן והיא גם הכלי הראשון שאנחנו מפעילים בהתמודדות עם כל בעיה שהיא; אבל ההסתמכות העיוורת עליה מסוכנת בצורה יוצאת דופן, ולכן היא גם צריכה להיות הדבר הראשון שבו אנו מטילים ספק תמיד. המתמטיקה זרועה במוקשים דומים, ולטעמי אחד מסימני ההיכר של המתמטיקה המודרנית היא הסירוב העקשני להיכנע לאינטואיציה, במאמץ לחשוף את המוקשים הללו, טריוויאליים ככל שייראו. זו גם הסיבה למאמץ הכביר שהשקיעו מתמטיקאים בתחילת המאה ה-20 בנסיון למצוא פורמליזציה מלאה למתמטיקה – הסרת החשש ממוקשים שכאלו. אם אכן ניתן להשתמש במתמטיקה כדי לחנך לערכים, זהו הערך שאני רוצה ללמד כאן.

אחרי כל הנאום הזה, מתבקש להוכיח במפורש את משפט רימן. לא אציג הוכחה פורמלית כי היא פשוט ניסוח טכני לא מחכים יותר מדי של הרעיון אותו אציג, שהוא פשוט אך יפה. הרעיון בבסיסו הוא לחשוב על הטור כמורכב משני טורים – טור אחד של כל האיברים החיוביים, וטור שני של כל האיברים השליליים. שני הטורים הללו הם אינסופיים ואינם מתכנסים, שכן כבר ראינו שטור שכל איבריו חיוביים ומתכנס גם מתכנס בהחלט (כי אין שום הבדל בין הטור ובין טור ערכיו המוחלטים), ובדומה גם טור שכל איבריו שליליים ומתכנס חייב גם להתכנס בהחלט (למה?). במילים אחרות, טור האיברים החיוביים שואף לאינסוף, וטור האיברים השליליים שואף לאינסוף.

בואו נניח שאנחנו רוצים להשאיף את הטור שלנו ל-\(\pi\). מה שנעשה יהיה כך: ראשית ניקח איברים מטור הערכים החיוביים עד שסכומם יעבור את \(\pi\) (מכיוון שהטור שואף לאינסוף, אחרי שניקח מספיק איברים מובטח לנו שנעבור את \(\pi\)). כעת ניקח איברים מטור האיברים השליליים עד שנרד שוב מתחת ל-\(\pi\); ועכשיו שוב ניקח איברים מטור האיברים החיוביים עד שנעלה מעל ל-\(\pi\), וכן הלאה וכן הלאה. סדרת הסכומים החלקיים של הטור שאנו בונים מבצעת ריקוד סביב \(\pi\) – עולה מעליו, ואז שוב יורדת, ואז עולה מעליו, ואז שוב יורדת. הפאנץ' הוא שגודל התנודות שהסדרה מבצעת חייב לקטון עם הזמן, מכיוון שאיברי שני הטורים החלקיים קטנים עם הזמן, וגודל התנודה חסום על ידי גודל האיברים הללו.

כל מי ששיחק גולף ודאי מבין מה הולך כאן. כדי להגיע לחור \(\pi\) אנחנו נותנים סדרת חבטות לכדור שלנו, שהולך ומתקרב אל החור, בסופו של דבר אנחנו מאוד קרובים אל החור ונותנים עוד חבטה אחת אחרונה – אבל היא חזקה קצת יותר מדי, והכדור עובר את החור ומגיע לצידו השני. עכשיו אנחנו צריכים לתת סדרת חבטות מהכיוון השני, ושוב – החבטה האחרונה מפספסת את החור וכן הלאה. מה שחשוב הוא שה"טעות" שלנו – גודל התנודה – נקבע רק על פי החבטה האחרונה, שמקפיצה אותנו לצד השני של החור – ומכיוון שהחבטות הולכות ונחלשות עם הזמן, גם גודל התנודה קטן עם הזמן. וזהו.

באופן דומה בונים סדרה ששואפת לאינסוף. הפעם אפשר לנקוט בתעלול הבא: נניח שהאיברים השליליים ממוספרים כ-\(c_{1},c_{2},c_{3},\dots\), אז ראשית כל נחבר מספיק איברים חיוביים כדי לעבור את \(1-c_{1}\) (שימו לב: \(c_{1}\) שלילי, כך ש-\(1-c_{1}\) גדול יותר מ-1) ואז נוסיף את \(c_{1}\) כך שנרד לכל היותר עד 1; ועכשיו נחבר מספיק איברים כדי לעבור את \(2-c_{2}\), וכן הלאה; באופן כללי אחרי שהוספנו את \(c_{n-1}\) נחבר מספיק איברים חיוביים כדי לעבור את \(n-c_{n}\), מה שמבטיח שהסדרה שלנו עולה עוד ועוד לאינסוף ואף פעם לא גולשת למטה "יותר מדי". לסיום, כדי לגרום לטור פשוט לא להתכנס נזפזפ בין שני ערכים – נניח, \(\pi\) ו-0.

זוהי כל ההוכחה, ואחרי שכבר מכירים אותה היא נראית טבעית ופשוטה מאוד יחסית. האינטואיציה שלי לפחות חיה איתה טוב מאוד. ועם זאת, אותה אינטואיציה סירבה בתוקף להכיר בקיום המשפט לפני שראיתי את ההוכחה. אם כן, זה המסר שאני רוצה להעביר – אינטואיציה זה חשוב, אבל רק כשמקיימים איתה דיאלוג. גם היא מסוגלת להודות בטעותה. זכרו זאת בפעם הבאה שמישהו יבקש מכם ללכת עם האינטואיציה עד הסוף ולא לחשוב בכלל.

נוסחת אוילר, ואיך היא קשורה למתנד הרמוני

הנוסחה \(e^{i\pi}+1=0\) זכתה לפופולריות רבה בתור "הנוסחה היפה ביותר במתמטיקה", ואני נוטה להסכים – יש משהו מאוד אלגנטי ונאה בנוסחה הזו (אמנם, אני חושב שבמתמטיקה מגיעים מתישהו לשלב שבו היופי האמיתי לא נמצא בנוסחאות, אלא ברעיונות מורכבים יותר – וכשמגיעים לשם, נוסחת אוילר מחווירה לעומת חלק מהדברים שאפשר לגלות). מה שמרשים בה הוא האופן שבו היא קושרת את חמשת הקבועים ה"בסיסיים" במתמטיקה – \(0,1,e,\pi,i\). בפוסט הזה אני מקווה להסביר מעט על האופן שבו הנוסחה הזו צצה ומדוע היא אינה עד כדי כך בלתי צפויה – במילים אחרות, מדוע סביר שיהיה קשר בין ערכים אלו דווקא. אני מקווה שאחרי היכרות קצרה עם מאחורי הקלעים של הנוסחה הזו, היא תהיה רק יפה יותר.

נתחיל מתיאור קצר של מרכיבי הנוסחה, שיושפע מהפוסטים שכתבתי לא מזמן על פונקצית האקספוננט ופונקציות הסינוס והקוסינוס. את \(1\) אין צורך להכיר לאף אחד – הוא היה קיים משחר ההיסטוריה, ומהווה את הצעד הראשון בדרך לבניית המספרים הטבעיים. לעומתו, \(0\) היה שנוי במחלוקת אלפי שנים והפך לחלק מהסטנדרט רק בסוף המאה ה-19. שניהם חשובים בהיותם מספרים "נייטרלים" ביחס לאחת מפעולות האריתמטיקה: \(0+x=x\) ו-\(1\cdot x=x\). במבנים אלגבריים שמנסים להכליל את השלמים תמיד יהיה מצוי איבר שמתפקד כ-\(0\) ואיבר שמתפקד כ-\(1\). בפרט, בהגדרה של שדה תמיד נדרש קיומם של \(0,1\) ושיהיו שונים אלו מאלו – לא נדרשים שום איברים אחרים, ובפרט גם הקבוצה \(\left\{ 0,1\right\} \) מהווה בעצמה שדה. מכאן ש-\(0,1\) הם אכן "טבעיים" ולא סתם מספרים שנבחרו שרירותית לנוסחה הזו.

המספר \(e\) הוצג בפוסט שעסק באקספוננט: כזכור, אקספוננט (\(\exp\left(x\right)\)) היא הפונקציה היחידה שנגזרתה שווה לעצמה וערכה ב-\(0\) (אחד מהמספרים ה"טבעיים" שדיברנו עליהם) הוא \(1\) (המספר ה"מעניין" השני). הראיתי בפוסט ההוא שניתן לחשוב על הפונקציה הזו כעל העלאה בחזקה של מספר מסויים: \(e\). כלומר, \(\exp\left(x\right)=e^{x}\) (ולכן \(e=\exp\left(1\right)\)).

המספר \(\pi\) כמעט ולא זקוק להצגה – הוא מוכר ביותר בתור היחס שבין היקף מעגל לקוטרו (בגאומטריה אוקלידית). בפוסטים שבהם הצגתי את הפונקציות הטריגונומטריות – סינוסים וקוסינוסים – הוא צץ באופן חצי-טבעי, תרתי משמע: הראיתי שהפונקציות הללו הן מחזוריות, עם מחזור של \(2\pi\). אם כן, מדוע הסימן המיוחד הוענק דווקא ל-\(\pi\) ולא ל-\(2\pi\) (למשל, היה אפשר לתת סימון מיוחד ליחס בין היקף מעגל לרדיוסו)? נימוק מעניין אחד הוא ששטח עיגול היחידה הוא \(\pi\) (ואכן, לפעמים נהוג להגדיר קבוע זה באמצעות שטח עיגול היחידה). נימוק מטופש אחר – אם נותנים את הסימון ל-\(\pi\), נוסחת אוילר יוצאת יפה יותר.

\(i\) הוא בכלל יצור מוזר בתכלית… אה, רגע, לא. \(i\) הוא מספר מרוכב המקיים \(i^{2}=-1\). כבר עסקתי באופן שבו המרוכבים נבנים באופן "טבעי" מהממשיים, כך שאיני הולך לחזור על הדיון הזה כעת. שאלה קצת יותר מעניינת היא מדוע הנציג ה"טבעי" ביותר של המספרים המרוכבים הוא דווקא שורש \(-1\); למה לא לקחת, למשל, שורש יחידה מסדר 3? יש שני מספרים מרוכבים לא ממשיים שכשמעלים אותם בחזקת 3 מקבלים 1: \(\omega=\frac{-1+\sqrt{-3}}{2}\) ו-\(\omega^{2}=\frac{-1-\sqrt{-3}}{2}\). המספרים הללו מעט יותר מסורבלים מאשר \(i\), שכן העלאה שלהם בריבוע לא נותנת מספר ממשי, ובכלל – הם דורשים הוצאת שורש למספר ממשי שאין לו שורש שלם (\(\sqrt{3}\)) וגועל נפש. לכן ככל הנראה יותר טבעי לבנות את המרוכבים בעזרת \(i\), שהוא שורש יחידה מסדר 4.

אם כן, אלו כל מרכיבי הנוסחה. איך מתרחש הפלא שכולם מתחברים יחד? שורש העניין נעוץ בשאלה מה בכלל המשמעות של העלאת \(e\) בחזקת מספר דמיוני – \(i\) כפול משהו. על העלאה בחזקה ממשית דיברתי די הרבה, אבל איך המרוכבים יכולים בכלל להיכנס לסיפור? זו נשמעת כמו רמאות. אני מכיר רק דרך אחת להסביר את העניין ולכן אשתמש בה, למרות שהיא מעט טכנית ועלולה להבהיל אנשים – הגרסה המלאה של נוסחת אוילר, \(e^{i\theta}=\cos\theta+i\sin\theta\). זו נוסחה שחושפת את הקשר העמוק שבין אקספוננט ובין הפונקציות הטריגונומטריות, וגם תסגור לנו פינה שנותרה פתוחה עד כה: הפתרון הכללי של משוואה דיפרנציאלית מסדר שני במקדמים קבועים (כשאין שורש מרובה – זה מקרה מסובך לכשעצמו שאין טעם לדבר עליו כעת).

נתחיל בהוכחה "יבשה" (שהיא לדעתי יפהפיה) לנוסחה הזו, ואז ננסה לתת אינטואיציה. כזכור, אנחנו עדיין תקועים עמוק בשלב שבו אנו מחפשים הגדרה בעלת משמעות ל-\(e^{i\theta}\). כזכור, ראינו כי ניתן לתאר את \(e^{x}\) באמצעות טור חזקות אינסופי: \(e^{x}=1+x+\frac{x^{2}}{2}+\frac{x^{3}}{3!}+\frac{x^{4}}{4!}+\dots\). מכיוון שקל מאוד לדבר על טורי חזקות גם בהקשר של מספרים מרוכבים, והתיאוריה עובדת גם שם פחות או יותר בשלמותה (למעשה, במובן מסויים התיאוריה יותר שלמה עבור מרוכבים, אך לא אכנס לכך כעת ברצינות – דוגמה היא התכנסות הטור של \(\frac{1}{1+x^{2}}\), שרדיוס התכנסותו הוא 1 אך בלי לדעת על קיומם של מרוכבים לא ברור מדוע), מתבקש להגדיר את \(e^{i\theta}\) גם כן באמצעות טורי חזקות – פשוט נציב \(i\theta\) במקום \(x\) ונראה מה נקבל. התוצאה היא טור שעדיין מתכנס, אבל כעת נראה שונה למדי מהטור ה"רגיל" – פתאום מתחילים לצוץ בו מינוסים, ומופעים של \(i\). אנחנו מקבלים: \(e^{i\theta}=1+i\theta-\frac{\theta^{2}}{2!}-i\frac{\theta^{3}}{3!}+\frac{\theta^{4}}{4!}+\dots\). כעת אפשר לבצע מניפולציות לטור ולפרק אותו לשני טורים. צריך לומר כאן אזהרה כלשהי – לא ניתן לעשות זאת לכל טור מתכנס. משפט מפורסם של רימן מראה שאם יש טור שמתכנס אך אינו מתכנס בהחלט (כלומר, \(\sum a_{n}\) מתכנס אך \(\sum\left|a_{n}\right|\) אינו מתכנס) אז אפשר, על ידי שינוי של סדר הסכימה של הטור, לקבל איזה סכום שרק נרצה, וגם להראות שסכום הטור שואף לאינסוף או "מזפזפ". המשפט המטורלל הזה ראוי לפוסט משל עצמו ואני מקווה לכתוב כזה בקרוב, אך עבור הטור "שלנו" זה לא תקף. וכך נוכל לקבל את הנוסחה הבאה: \(e^{i\theta}=\left(1-\frac{\theta^{2}}{2!}+\frac{\theta^{4}}{4!}-\dots\right)+i\left(\theta-\frac{\theta^{3}}{3!}+\frac{\theta^{5}}{5!}-\dots\right)\). מי שזוכר את הפוסט על הפונקציות הטריגונומטריות ודאי זוכר שהראיתי כי הטור שבסוגריים השמאליים הוא הטור של \(\cos\theta\), והטור בסוגריים הימנים הוא הטור של \(\sin\theta\), וזהו סוף הסיפור.

מכאן שההגדרה ה"טבעית" ל-\(e^{i\theta}\) מניבה את נוסחת אוילר. בנוסחה הזו יש לנו לעת עתה רק שני קבועים "חשובים" – \(e\) ו-\(i\). אם כן, הכל מתחיל מכך שאנו בוחרים להשתמש ב-\(e\) בתור הבסיס שלנו – אפשר היה אמנם לבחור בסיס אחר, אך כבר הסברתי מדוע הגיוני לבחור דווקא ב-\(e\). כעת, אלמלא \(i\) היה השורש של \(-1\), הנוסחה הייתה הולכת לאבדון – הפירוק המקסים של הטור של \(e^{i\theta}\) לשני טורים היה משתבש לגמרי. שימו לב מה היה הכרחי לעשות כדי לקבל מהטור של \(e^{x}\) את הטורים של \(\cos\) ו-\(\sin\): היינו צריכים להשאיר איבר אחד כמות שהוא, את הבא אחריו לכפול במספר מרוכב כלשהו \(z\), את הבא אחריו לכפול ב-\(-1\) אבל לא בשום דבר אחר, ואת הבא אחריו לכפול ב-\(-z\), ואז חוזר חלילה להתחלה. יש רק שני מספרים מרוכבים שמקיימים את התכונה הזו, שבעצם שקולה ל-\(z^{2}=-1\), והם \(i\) ו-\(-i\) (ואכן, אפשר היה באותו אופן להוכיח "נוסחת אוילר" עבור \(-i\); היינו מקבלים \(e^{-i\theta}=\cos\theta-i\sin\theta\), אבל זה לא שונה מהותית מהנוסחה שכבר יש לנו, ומכל אחת ניתן לגזור את השניה).

כעת נעבור לקצת אינטואיציה גאומטרית. על המספרים המרוכבים אפשר לחשוב באופן גאומטרי כמישור – המספר \(a+bi\) מייצג את הנקודה \(\left(a,b\right)\) במישור. המרחק של נקודה מראשית הצירים, אם מודדים מרחק באופן האוקלידי הרגיל, הוא \(\sqrt{a^{2}+b^{2}}\), ועל כן אפשר להגדיר את מעגל היחידה במישור המרוכב בתור כל המספרים \(a+bi\) כך ש-\(a^{2}+b^{2}=1\). כעת, הפלא ופלא: נתבונן במספר המרוכב שמוגדר על ידי \(a=\cos\theta\), \(b=\sin\theta\) עבור \(\theta\) כלשהו – כלומר, על \(e^{i\theta}\). המספר הזה מקיים \(a^{2}+b^{2}=\cos^{2}\theta+\sin^{2}\theta=1\) (זוהי אחת מהנוסחאות הבסיסיות ביותר הנוגעות לסינוס וקוסינוס, והוכחתי אותה באופן לא-גאומטרי "טהור" בפוסט שעסק בהם). מכאן ש-\(e^{i\theta}\) נמצא על מעגל היחידה, לכל \(\theta\). יותר מכך – לא קשה להשתמש ברציפות של \(\sin,\cos\) כדי להראות שכל נקודה על מעגל היחידה ניתנת להצגה בתור \(e^{i\theta}\) שכזה. יותר מכך – אם אנחנו כבר מוכנים לקבל גם את המשמעות ה"גאומטרית" של \(\sin,\cos\), אפשר להראות ש-\(e^{i\theta}\) הוא הנקודה שנמצאת על מעגל היחידה והזווית שיוצרים הישר שמחבר אותה עם הראשית והישר שמהווה ציר \(x\) היא בדיוק \(\theta\) (יש שתי זוויות כאלו, בעצם; אני מדבר על הזווית שמהווה את "כמות הסיבוב" שנדרש כדי להביא את ציר \(x\) לנוח על הקטע שמחבר את הראשית עם \(e^{i\theta}\)).

זה פותח פתח לתיאור של מספר מרוכב באופן כללי באמצעות אקספוננט: המספר \(re^{i\theta}\), כאשר \(r\ge0\) ממשי, מייצג את המספר המרוכב שמרחקו מהראשית הוא \(r\) (דהיינו, \(r=\sqrt{a^{2}+b^{2}}\)) והזווית שלו ביחס לציר \(x\) היא \(\theta\). דרך הצגה זו מכונה "ההצגה הקוטבית" (או ההצגה הטריגונומטרית) של מספרים מרוכבים, ולעתים קרובות היא נוחה יותר מן ההצגה ה"רגילה" של \(a+bi\) (למשל, לצורך העלאה בחזקה). באופן כללי במתמטיקה נוח לעתים לעבור למערכת קוארדינטות קוטבית שכזו, שבה נקודה נמדדת על ידי מרחק מהראשית וזווית ולא על ידי מרחק בשני צירים מאונכים זה לזה, כך שזוהי אינה הצגה בלעדית למספרים מרוכבים. אגב, בבית הספר לעתים קרובות משתמשים בקיצור \(cis\theta\) כדי לתאר את \(\cos\theta+i\sin\theta\) במקום \(e^{i\theta}\); החסרון של דרך הצגה זו היא שבהצגת האקספוננט אפשר להמשיך ולבצע את כל פעולות חשבון החזקות הרגילות; כך למשל \(e^{i\theta}\cdot e^{i\tau}=e^{i\left(\theta+\tau\right)}\) (כמובן, יש להוכיח זאת; אך אם תעיפו מבט בהוכחה לכך שנתתי בפוסט העוסק באקספוננט תראו שהיא עובדת ככתבה וכלשונה גם כאן – ולמעשה, היא יותר כללית אפילו מאשר עבור "רק" מספרים מרוכבים; מה קורה אם ה-\(x\) של האקספוננט הוא מטריצה?).

שימו לב שההגדרה שלי של \(e^{i\theta}\) "עובדת" גם אם אני לא יודע מהם סינוסים וקוסינוסים – נוסחת אוילר היא משפט, ולא סתם הגדרה (אף כי בספרים רבים מעדיפים דווקא כן להגדיר את \(e^{i\theta}\) באמצעות הנוסחה). מכאן עולה דרך נוספת ומעניינת להגדיר את סינוס וקוסינוס: אלו הפונקציות שמתארות את ההיטל של \(e^{i\theta}\) על הציר הממשי והציר המדומה. כלומר, אפשר לחשוב על סינוס וקוסינוס (שהן פונקציות ממשיות) כנובעות לא מגאומטריה ולא ממשוואות דיפרנציאליות, אלא מאנליזה מרוכבת! למעשה, זוהי אפילו הגדרה לא רעה בכלל – בעזרת נוסחת אוילר מיידית מקבלים את טורי הטיילור של סינוס וקוסינוס, ומכאן נוסחאות הגזירה שלהם נובעות מיידית, ומכאן שאר התכונות מתקבלות במהירות. יותר מכך – ניתן להשתמש בתכונות של \(e^{i\theta}\) כדי לגזור תכונות של סינוס וקוסינוס. הנה דרך חדשה להוכיח את נוסחת הסכום: מכיוון ש-\(e^{i\left(\theta+\tau\right)}=e^{i\theta}\cdot e^{i\tau}\), אפשר לכתוב את הנוסחה הזו גם בעזרת סינוסים וקוסינוסים, ומקבלים:

\(\cos\left(\theta+\tau\right)+i\sin\left(\theta+\tau\right)=\left(\cos\theta+i\sin\theta\right)\left(\cos\tau+i\sin\tau\right)=\left(\cos\theta\cos\tau-\sin\theta\sin\tau\right)+i\left(\sin\theta\cos\tau+\cos\theta\sin\tau\right)\)

והשוואת המקדמים הממשי והמדומה של שני האגפים נותנת את נוסחאות הסכום ה"רגילות". זו הוכחה נחמדה למדי כי בה קל מאוד לזכור איך קורה שהסכום עבור קוסינוס מורכב ממכפלות "הומוגניות" ויש בו מינוס, ואילו עבור סינוס הסכום הוא "מעורבב" (כמובן, בתנאי שזוכרים איך מתנהג כפל מרוכבים).

ובכן, נוסחת אוילר הכללית, \(e^{i\theta}=\cos\theta+i\sin\theta\) היא מרתקת ומעניינת ויפה – אעז לומר שאפילו יותר יפה מהנוסחה ה"פרטית" של \(e^{i\pi}+1=0\), בדיוק בגלל שיש יותר דברים מעניינים שמתקשרים אליה, אבל כעת הגיע הזמן לחזור לנוסחה ה"פרטית" ולהבין איך הקבוע שנותר בחוץ עד כה – \(\pi\) – נכנס לעסק.

ובכן, כפי שכבר אמרתי, \(\pi\) קשור בקשר הדוק לסינוס וקוסינוס, שכפי שראינו, צצים באופן טבעי כשעוסקים באקספוננט מרוכב, וכפי שראינו – הם קשורים בקשר עמוק למעגלים, כך שאין פה הפתעה של ממש. \(e^{i\pi}\) היא הנקודה שמתקבלת כשהולכים בדיוק חצי מעגל (כי מחזור שלם של סינוס וקוסינוס, שמציין חזרה לנקודת ההתחלה, הוא \(2\pi\)) ומכיוון שהטיול מתחיל ב-\(\left(1,0\right)\), אחרי הליכה של \(\pi\) "צעדים" נגיע לקצה השני של המעגל, \(\left(-1,0\right)\). על כן \(e^{i\pi}=-1\). לעתים מסתפקים בהצגת הנוסחה הזו בתור "נוסחת אוילר היפה", אבל שיפור קוסמטי מתקבל על ידי חיבור 1 לשני האגפים וקבלת \(e^{i\pi}+1=0\), ובכך השגנו שתי ציפורים במכה אחת – עברנו מ-\(-1\) ה"לא טבעי" ל-\(0,1\) ה"טבעיים"שקשקשתי כל כך הרבה על למה הם טבעיים בתחילת הפוסט. כלומר, יש משהו מלאכותי בהעברת הנוסחה לצורה ה"יפה" שלה. שימו לב ש-\(e^{i2\pi}=1\), כך שאם היינו משתמשים בסימון מיוחד לא עבור \(\pi\) אלא עבור \(2\pi\) היינו מקבלים נוסחה דומה ובמובנים מסויימים יפה יותר, כי אין בה את העברת האגפים ה"מלאכותית".

כעת לסגירת החוב שלי בנוגע למשוואות דיפרנציאליות. כזכור, עסקתי במשוואות מהצורה \(af^{\prime\prime}+bf^{\prime}+f=0\) (כש-\(a,b,c\) מקדמים ממשיים קבועים), וטענתי שהפונקציה \(e^{\lambda x}\) מהווה פתרון למשוואה זו, כאשר \(\lambda\) הוא שורש של המשוואה הריבועית \(ax^{2}+bx+c=0\), וכל עוד יש למשוואה זו שני פתרונות שונים זה מזה, הכל אחלה כי אנחנו מקבלים שני פתרונות שונים מהותית למשוואה הדיפרנציאלית, שבאמצעותם ניתן לבנות כל פתרון אחר. הבעיה צצה כשלמשוואה \(ax^{2}+bx+c=0\) לא היה פתרון ממשי כלל – למשל, המשוואה \(x^{2}+1=0\). במקרה זה, כמו שאמרתי קודם, יהיו למשוואה בהכרח שני פתרונות מרוכבים שונים זה מזה, כך שהאחד הוא הצמוד של השני. כאן "נתקעתי" כי לא היה לי מושג מהו \(e^{\lambda x}\) במקרה זה, ובכל מקרה לא הייתה לי סיבה להניח שהפונקציה הזו עדיין תקיים את המשוואה.

למרבה המזל, עכשיו אנחנו חכמים יותר. חקרנו את המשוואה \(f^{\prime\prime}+f=0\) (שמתאימה ל-\(x^{2}+1=0\)) באופן עצמאי וגילינו באופן זה את קיום הפונקציות \(\cos,\sin\) שפותרות אותה. נוסחת אוילר השלימה את החקירה הזו, כשקשרה את הפונקציות הללו שמצאנו לפונקציית האקספוננט שפתרה לנו את המשוואה במקרה הממשי. לכן משתלם לנו להגדיר את \(e^{\lambda x}\) באמצעות נוסחת אוילר: דהיינו, אם \(\lambda=r+i\theta\), אז \(e^{\lambda x}=e^{rx}\cdot e^{i\theta x}=e^{rx}\left(\cos\theta+i\sin\theta\right)\). אם תנסו לגזור את היצור הזה על פי כללי הגזירה הרגילים של פונקציות ממשיות תגלו כי אכן \(\left(e^{\lambda x}\right)^{\prime}=\lambda e^{\lambda x}\), כפי שאנו מצפים מאקספוננט (קודם כל גזרו את \(e^{ix}\) ותראו שאכן מקבלים \(ie^{ix}\); מכאן זה עניין של חוקי האריתמטיקה הרגילים של נגזרות). לכן כשמציבים את \(e^{\lambda x}\) בנוסחה מקבלים \(\left(a\lambda^{2}+b\lambda+c\right)e^{\lambda x}\) שאכן שווה ל-\(0\), כנדרש.

הבעיה עם \(e^{\lambda x}\) בתור פתרון הוא שאין מדובר על פתרון ממשי – הרי זוהי פונקציה מרוכבת. זה אמנם לגיטימי לכשעצמו ואפילו מעניין – הנה צצים פתרונות מרוכבים במקומות שבהם לא ציפינו להם – אבל אנחנו מעדיפים פתרונות ממשיים. הפאנץ' הוא שאפשר "לשלוף" את סינוס וקוסינוס מתוך הפתרונות \(e^{\lambda x}\) שמצאנו – גם הם מהווים צירוף לינארי כלשהו שלהם (כשמרשים מקדמים מרוכבים). לשם כך, ראשית כל שימו לב לכך ש-\(e^{-i\theta}=\cos\theta-i\sin\theta\) (לא קשה לראות זאת) ועל כן \(e^{i\theta}+e^{-i\theta}=2\cos\theta\), כלומר \(\cos\theta=\frac{e^{i\theta}+e^{-i\theta}}{2}\), ובדומה \(\sin\theta=\frac{e^{i\theta}-e^{-i\theta}}{2i}\). אם תרצו, אלו הנוסחאות ה"הפוכות" לנוסחת אוילר, והן יפות בפני עצמן; כשאני מדבר על הגדרה של סינוס וקוסינוס באמצעות האקספוננט המרוכב, זו השורה התחתונה שאני מדבר עליה – להגדיר את הפונקציות הללו באמצעות המשוואות הללו (וזו אכן דרך נפוצה למדי להגדיר אותן). הנוסחאות כמובן תקפות גם אם נכפול את שני האגפים שלהם במספר ממשי כלשהו, ומכאן נובעת הנוסחה הכללית: אם \(\lambda=r+i\theta\) אז \(e^{rx}\cos\left(\theta x\right)=\frac{e^{\lambda x}+e^{\overline{\lambda}x}}{2}\), ובדומה עבור סינוס, \(e^{rx}\sin\left(\theta x\right)=\frac{e^{\lambda x}-e^{\overline{\lambda}x}}{2}\). מכיוון ששתי הפונקציות הללו התקבלו כצירוף לינארי של שני פתרונות למשוואה הדיפרנציאלית המקורית, גם הם מהווים פתרון – אבל פתרון ממשי, ולא קשה להראות שהם "בלתי תלויים" במובן זה שכל פתרון אחר ניתן לכתיבה באמצעות צירוף לינארי שלהם (כמובן שפתרון מרוכב ידרוש צירוף לינארי עם מקדמים מרוכבים).

כאן הבה וניישם את מה שלמדנו למקרה שהבאתי כמוטיבציה לכל זה – תנועה הרמונית פשוטה.

כזכור, עבור תנועה הרמונית פשוטה הגענו למשוואה \(f^{\prime\prime}=-\frac{k}{m}f\), כאשר \(f\) הייתה פונקציה שמתארת את מיקום האובייקט שנע בתנועה הרמונית פשוטה, \(k\) תיאר את "קבוע הקפיץ" שמושך אותו – ככל שהוא יותר גדול, על הגוף מופעל יותר כוח – ו-\(m\) תיאר את מסת הגוף, כלומר את התנגדותו להאצה, אבל אפשר לחשוב על המערכת גם במובנים יותר מופשטים, לכל \(f\) (לא רק של מרחק) שמקיימת משוואה כזו. לכן נוח לכרוך את \(k,m\) לפרמטר אחד שמאפיין את המערכת, ועם קצת ראיית הנולד הכי טוב להגדיר \(\omega^{2}=\frac{k}{m}\) ולקבל את המשוואה \(f^{\prime\prime}=-\omega^{2}f\). מדוע ריבוע? שכן המשוואה האופיינית שמתקבלת מהמשוואה הדיפרנציאלית הזו היא \(x^{2}=-\omega^{2}\), ופתרונותיה הם \(\lambda=\pm i\omega\), וכך חמקנו מלהכניס שורשים לתמונה. מכיוון שפתרונות המשוואה האופיינית הם מדומים טהורים, אקספוננט ממשי הוא לא חלק מהפתרון; קיבלנו פתרונות פרטיים של \(\cos\left(\omega x\right)\) ו-\(\sin\left(\omega x\right)\). לכן הפתרון הכללי למשוואה הוא \(a\sin\left(\omega x\right)+b\cos\left(\omega x\right)\), וסיימנו.

אלא שעוד לא סיימנו, כי הפתרון הזה לא "יפה" מספיק – הוא סכום של שתי פונקציות, וקשה לנו לצייר את האופן שבו התנועה הזו מתנהגת בראש אם היא שני גלים שנלחמים אחד נגד השני. לכן גם כאן הכי נוח לעבור להצגה קוטבית. חשבו שנייה על הנקודה במישור \(\left(a,b\right)\); אפשר לחשוב עליה כעל נקודה שנמצאת במרחק \(A\) מראשית הצירים ויוצרת זווית \(\phi\)עם ציר \(x\), ממש כמו שהיה עבור מספרים מרוכבים. במקרה זה מתקיים \(a=A\cos\phi\) ו-\(b=A\sin\phi\), ולכן אנחנו מקבלים דרך אחרת לכתוב את הפתרון הכללי למשוואה: \(A\cos\phi\sin\left(\omega x\right)+A\sin\phi\cos\left(\omega x\right)\). זה כבר נראה דומה באופן חשוד לנוסחת הסכום של סינוסים, ואכן – זה שווה ל-\(A\sin\left(\omega x+\phi\right)\), וזהו הפתרון הכללי שבדרך כלל אוהבים לתת. הסכום של סינוס וקוסינוס הפך לגל סינוס בודד, שמתאפיין על ידי שלושה פרמטרים: \(\omega\), שמגדיר את התדירות של התנודה, כלומר כמה מהר היא מתחילה לחזור על עצמה; \(A\), שמגדיר את המשרעת של התנודה, כלומר מה הגדלים המקסימלים שאליהם היא עשויה להגיע (כמה רחוק העצם עשוי להגיע מנקודת שיווי המשקל), ו-\(\phi\) שמתאר את הפאזה של המערכת – מדד כלשהו ל"כמה עמוק בתוך התנודה" המערכת הייתה כשהתחלנו למדוד את הזמן. שימו לב למשהו שעשוי לבלבל כאן – אני משתמש באות \(x\) לסימון המשתנה של הפונקציה, אך חשוב להבין שמשתנה זה מתאר את הזמן – מלכתחילה הפונקציה שרצינו היא פונקציה שמתארת את מיקום האובייקט כתלות בזמן. לכן יותר ברור לכתוב \(A\sin\left(\omega t+\phi\right)\) בתור הפונקציה שלנו.

מה שעשינו עד כה היה לכתוב פתרון כללי למשוואה. כדי למצוא פתרון פרטי צריך למצוא את הפרמטרים \(A,\phi\) שמתאימים למקרה שאנחנו ממדלים; שימו לב ש-\(\omega\) כבר ידוע מראש. לצורך כך אפשר למדוד את מצב המערכת בזמן \(t=0\). כזכור, אנחנו רוצים לדעת הן את ערך הפונקציה עצמה ב-\(t=0\), והן את ערך הנגזרת הראשונה שלה ב-\(t=0\), כלומר מצב המערכת נקבע על ידי מיקום ומהירות האובייקט בזמן \(t=0\). המיקום הוא \(A\sin\left(\phi\right)\), והמהירות היא \(\omega A\cos\left(\phi\right)\). שימו לב למשהו מעניין שנובע מהמשוואות הללו – \(\omega\) אינו תלוי לא במיקום ההתחלתי של המערכת, ולא במהירות ההתחלתית שלה; הוא מושפע רק מקבועים "פנימיים" שלה. זו למשל הסיבה מדוע שעון מטוטלת הוא מדוייק: מטוטלת מתנהגת כמו מתנד הרמוני (לא באופן מושלם כי העולם האמיתי לא מושלם, אבל מספיק טוב – כל עוד אפשר להזניח את החיכוך עם האוויר וכל עוד גודל הזווית שיוצרת המטוטלת קטן דיו), ולכן אין זה משנה כמה נרים אותה לפני שניתן לה להתנדנד, או מה המהירות שבה נדחוף אותה – קצב ההתנדנדות שלה יהיה תלוי רק בקבועים "פנימיים" (במקרה הזה, הוא תלוי באורך החוט של המטוטלת ובכוח המשיכה של כדור הארץ; דבר נאה נוסף שעולה ממשוואות המטוטלת הוא שלמסת המטוטלת אין השפעה על קצב התנודה). מהו קצב התנודה? ובכן, מכיוון שהמחזור של \(\sin\) הוא \(2\pi\), ומכיוון ש-\(t\) מוכפל ב-\(\omega\), הרי שנשלים מחזור בכל פעם שבה \(\omega t\) יהיה כפולה של \(2\pi\), כלומר המחזור הוא \(T=\frac{2\pi}{\omega}\). הנה צץ לו פאי שוב, במערכת שאין לה שום קשר לגאומטריה של המישור (הרי המתנד ההרמוני המקורי שהבאתי כדוגמה – הגוף המחובר לקפיץ – היה חד ממדי).

ובכן, הגענו לסיומה של סאגת פאי-אקספוננט-סינוס-קוסינוס. אני מקווה שהצלחתי לשכנע לפחות חלק מהקוראים שפאי איננו יצור גאומטרי בלבד – וחשוב מכך, שהצלחתי להראות לקוראים שוב עד כמה המתמטיקה עוסקת בקשרים בין דברים שנראים שונים ולא קשורים זה לזה, אך בפועל הקשר ביניהם חזק והדוק מאוד: "האמנות של קריאה באותו שם לדברים שונים, ובשמות שונים לאותו הדבר".

חינוך לערכים במתמטיקה

לא מזמן קראתי על מחקר שנערך בפקולטה להוראת המדעים בטכניון ועסק באופן שבו ניתן להשתמש בשיעורי המתמטיקה להנחלת ערכים חברתיים דוגמת כבוד לזולת, שיתוף פעולה, סובלנות, שוויון בין המינים וכדומה. כך למשל ניתן להפוך שאלה שעוסקת ברוטב סלט שמשתמש בחומץ, שמן וסויה ביחס של 1:2:3 לשאלה על מיטל, אורית ודני שחוסכים כסף כדי לעשות ביחד מעשים טובים; או למשל, בעת הוראת מושג המכנה המשותף באלגברה המורה יכול לעצור ולהקדיש זמן מה להרחבת המושג מכנה משותף ולחשיבותו בחיינו, ולבקש מהתלמידים להגדיר את המכנה המשותף בינם לבין ילדי עובדים זרים או ילדי הכפר הערבי הסמוך. מכיוון שמדובר ברעיון מדהים, שנותן זווית התבוננות שלא חשבתי עליה על המתמטיקה, הייתי רוצה להציע כמה רעיונות משל עצמי:

  1. סינוסים וקוסינוסים: ברוח הפוסט הקודם, אני סבור שניתן להשתמש במושגי הסינוס והקוסינוס על מנת לעסוק באנשים בעלי לקויות למידה ותפקידם בחברה. על ידי הקבלת התלמיד "הרגיל" לקוסינוס והתלמיד בעל הלקויות לסינוס ניתן לאפשר לתלמידים להבין כי אין הבדל בין השניים פרט לכך שהקוסינוס מקדים את הסינוס בפאזה של \(\frac{\pi}{2}\). הפרש זה גורם לנקודת מבט מעוותת של הקוסינוס על הסינוס – כאשר זה למעלה, השני למטה; וכאשר הסינוס עולה למעלה, בזכות סיוע שמגישה לו החברה, הקוסינוס הקנאי "יורד למטה" וחושב שהדבר הוא באשמת הסינוס. ניתן לחנך את התלמידים לכך שמטרתנו בחיים צריכה להיות צמצום פאזת ההפרש בין הסינוס והקוסינוס.
  2. אקספוננט: ניתן להשתמש בפונקצית האקספוננט כדי להמחיש את ההבדלים בין קפיטליזם לקומוניזם. בעוד האקספוננט הממשי \(e^{x}\) (שהצגתי לא מזמן) הוא בולעני ודורסני, וצובר עוד ועוד ערכים ככל ש-\(x\) גדל ולעולם אינו יודע שובע, האקספוננט המרוכב \(e^{i\theta}\) הוא הרמוני עם סביבתו ונוטה למחזוריות ולהשלמת מעגל החיים. יתר על כן, לכל \(\theta\) אפשרית, \(\left|e^{i\theta}\right|=1\), כך שהאקספוננט מגשים את החלום על "כולם שווים"; ועם זאת, כל אחד הוא יחיד ומיוחד בדרכו שלו, שכן ערכה של \(\theta\) קובע את הזווית שאותה הוא בוחר לעצמו בחייו. בנוסף, הגדלה מופרזת של \(\theta\) מובילה בסך הכל לחזרה אל נקודת ההתחלה, וכך ילמדו התלמידים ענווה מהי.
  3. קבוצות, חבורות וחוגים: ניתן להמחיש לתלמידים כי כל עוד הם אוסף מבודד של אינדיבידואלים הם אינם "מעניינים", ועל כן יש להשית עליהם מבנה – למצוא "פעולה" משותפת שהם יכולים לקיים, מה שיהפוך אותם לחבורה מגובשת. חשוב להמחיש את תפקיד האסוציאטיביות של פעולה זו: מכיוון ש-\(\left(a\cdot b\right)\cdot c=a\cdot\left(b\cdot c\right)\), האסוציאטיביות מבטיחה כי לא יווצרו "קליקות" לא שוויוניות, כי כאשר אין חשיבות לשאלה מי משחק עם מי קודם לכן, מובטח לנו כי \(b\) יהיה מוכן לשחק הן עם \(a\) והן עם \(c\) במידה שווה. כאשר עוברים לדון בחוגים יש להדגיש כי פעולה אחת – החיבור – היא פעולה פנימית שמבצעים התלמידים בינם לבין עצמם, בעוד שפעולת הכפל היא פעולה שבה תורמים התלמידים לסביבה, ושתרומה זו לסביבה היא שמקדמת את התלמידים ממעמד של "חבורה" למעמד של "חוג" (חוג חברתי, יש להדגיש). מכיוון שמפעולת הכפל נדרש הרבה פחות מאשר מפעולת החיבור, חשוב להדגיש בפני התלמידים כי את הדרישות עליהם לדרוש מעצמם. כך למשל בכל כיתה יש לעודד את התלמיד המצטיין לקחת על עצמו את תפקיד איבר היחידה, הכוח המניע את החוג כולו.
  4. עקרון שובך היונים: כאשר מלמדים את העיקרון ניתן להשתמש בדוגמה של מעמדות חברתיים במקום שובכים, ותלמידים במקום יונים. כך יבינו התלמידים את השרירותיות שבה הם מחולקים למעמדות חברתיים שונים, ואת העובדה ששייכות שני תלמידים לאותו מעמד חברתי אינה נובעת ממעשי התלמידים עצמם אלא מכורח מתמטי. כך ילמדו התלמידים לראות לא רק באחיהם לשובך שותפי גורל, אלא לאמץ את כל השובכים לחיקם.
  5. האלכסון של קנטור: במקום לעסוק בהבדלה השרירותית בין מספרים טבעיים לממשיים, ראוי לעסוק בקושי של סיוע לנזקקים. ניתן להראות לתלמידים כיצד הנזקקים שאנו מסוגלים לסייע להם הם תמיד קבוצה בת מניה, בעוד שהנזקקות היא רצף שלעולם לא נוכל לתפוס בשלמותו. בפרט ניתן לשחזר את הוכחתו של קנטור ולהדגים לתלמידים כיצד בכל תוכנית סיוע לנזקקים שנבנה, תמיד יהיה נזקק אשר נותר מאחור. כמובן, יש לשים עובדות אלו בקונטקסט המוסרי המתאים ולהבהיר לתלמידים שהדבר רק מחזק את החובה המוסרית לסייע לנזקקים באופן שפורץ את הגבולות התבניתיים שמכתיבה המתמטיקה.
  6. משפטי אי השלמות של גדל: כאשר מלמדים אותם, כדאי לעצור ולהקדיש זמן לשאלת השלמות בחיינו – האם אנו מרוצים מהם? האם איננו סבורים כי יש מקום לשפרם? מאחר ומשפטי אי השלמות של גדל מראים כי בחיינו טבועה אי-שלמות אינהרנטית, שמקורה באינטרוספקציה שאנו מבצעים לעצמנו, המסקנה היא שכדי לגרום לחיינו להיות שלמים ככל הניתן עלינו להפסיק לעסוק בעצמנו ולטפל במצוקותיהם של אחרים.
  7. טופולוגיה: הטופולוגיה היא ככל הנראה התחום החשוב ביותר להמחשת העובדה שכולנו בני אדם, בשל ההצבעה שלה על כך שכולנו זהים לחלוטין, עד כדי שינויים חסרי חשיבות כמתיחה, כיווץ ועיקום. בעת לימודי הטופולוגיה יש להבהיר לתלמידים מדוע נמוכים וגבוהים הם זהים, שמנים ורזים, כפופי קומה וזקופי גו, יפים ומכוערים – כולנו הומיאומורפיים לספל קפה בלי ידית.
  8. משפט ארבעת הצבעים: כאשר מלמדים על המשפט כדאי לתת לתלמידים לצבוע את מפות האיזור, על מנת שילמדו על השטחים השנויים במחלוקת וההקשרים ההיסטוריים והחברתיים שלהם. את הקושי של הוכחת משפט ארבעת הצבעים ניתן להמשיל לקושי להביא שלום לאיזורנו, ובהוכחה שלו באמצעות מחשב ניתן להשתמש כאנלוגיה להתערבות האמריקאית (אמריקה כמייצגת אומה טכנולוגית ו"ממוחשבת") שבסופו של דבר תביא שלום ורווחה, על אף השמרנים מכל צד שמסרבים לקבלה כהוכחה לגיטימית.
  9. אינטגרל רימן: בעת שמלמדים על אינטגרל רימן זוהי הזדמנות פז ללמד על שיתוף פעולה ועבודה משותפת. אינטגרל רימן הוא סכום של מחוברים שכל אחד מהם לכשעצמו הוא בעל השפעה אפסית, אך כאשר מאחדים את כולם לכדי שלמות מתקבל שינוי עצום וממשי. כדאי להדגיש כי אינטגרל שבו חלק מהמחוברים מנסים "להתבלט" ושואפים לאינסוף הוא אינו ראוי (Improper) וכי הדרך היחידה להעריך את ערכו האמיתי של אינטגרל היא "לרדת לשטח", לפרק אותו לקטעים קטנים ולדבר עם האדם הפשוט בכל אחד מהם. לכן עדיפה הוראת האינטגרל דרך סכומי רימן, המתמקדים באדם הפשוט האקראי בכל קטע, ולא דרך סכומי דרבו אשר יוצרים קיטוב בדברם על המינימום והמקסימום בכל קטע.
  10. אנליזה נומרית: רצוי ללמד מחצית השיעור ואז להפסיק הלימוד באחת, ולהעלות את השאלה מדוע באמת אנו מעוניינים בחישוב מדוייק של פונקציות, ומה טעם יש במרדף חסר התוחלת אחר עוד ועוד ספרות דיוק. בשלב זה ניתן להפסיק את השיעור ולצאת החוצה, אל השמש האביבית, ולהמחיש לתלמידים כמה יפים החיים ללא חישובים מיותרים, ומדוע 3.14 הוא קירוב טוב דיו לפאי לכל צורך מעשי. בעצם, שיהיה 3, חבל להקשות על החיים עם שברים לא אסתטיים.

אני ודאי רק מגרד את קצה הקרחון כאן – אנא הוסיפו עוד רעיונות, למען עתיד טוב יותר (ומוסרי יותר, ואולי גם מתמטי יותר) לנו ולילדינו.