בעיית המעגל של גאוס (וגם קצת על טרחנות)

הפנו אותי לאתר הבא, שבו מציג כותב ישראלי משהו בשם "Q-space theory" שהיא "An attempt to intuitively unify physics". ובכן, אתם ודאי יכולים לנחש מה אני חושב כשאני רואה משהו כזה. רוב תוכנו של האתר הוא קישורים לסרטוני יוטיוב שכבר הוסרו, אבל הסיבה שבגללה קישרו אותי אליו היא קובץ שבו מדובר על "התכנסות לערכו של פאי דרך הפתרונות הפיתגוראיים הטבעיים". ובכן, אתם ודאי יכולים לנחש מה אני חושב כשאני רואה משהו כזה. אבל, כמו תמיד בעניינים הללו, לא הייתי טורח לכתוב על זה אם לא הייתה מתמטיקה מעניינת בפנים.

אם לסכם את המטרה של הקובץ, אחרי שמוצג בו מה שמוצג, הכותב כותב ש"הכפפה למתמטיקאי או למתמטיקאית היא: נסו לנסח את הממצא הנ"ל בשפה ובסטנדרטים הנדרשים על מנת לפרסם את הממצא באקדמיה". ומהו אותו ממצא? ובכן, הכותב מתחיל עם הגדרה: הוא אומר ש-"\(i\) הוא "פתרון פיתגוראי טבעי" של \(a\) ו-\(b\) אם סכום ריבועים של \(a\) ו-\(b\) שווה ל-\(i\)". בעולם המתמטי הרגיל קוראים ל-\(i\) כזה בדרך כלל "סכום ריבועים". סכומי ריבועים, שלא יהיה לכם ספק, הם תחום מרתק ביותר בתורת המספרים שלעת עתה לא דיברתי עליו מספיק אם כי כבר דיברתי עליו קצת.

כעת, הכותב אומר שהוא "צפה את הקשר הבא מתוך שיקולים פיסיקליים", וברשותכם אביא את הניסוח המקורי שלו:

בהינתן מספר טיבעי כלשהו \(n\), היחס בין מספר הפתרונות הפיתגוראיים הטבעיים שבהם סכום ריבועי הניצבים קטן או שווה ל-\(n\) (עם חשיבות לסדר הניצבים) לבין מחצית ערכו של \(n\) מתכנס לערך פאי חלקי 2 ככל ש-\(n\) גדל.

בנוסף, הוא מצרף קוד של תוכנית מחשב קצרה שמראה את ההתכנסות הזו. ברשותכם אמנע מלהציג אותו כאן, אבל הקוד בהחלט עובד והתוצאה שהוא מתאר בהחלט נכונה, וזה בהחלט נחמד שהוא גילה אותה באופן עצמאי. אז מה הבעיה כאן? שמדובר על ניסוח מחדש של בעיה בת 250 שנה לערך ושנפתרה כבר בידי גאוס – "בעיית המעגל של גאוס". אמנם, צריך להיזהר קצת כי למרות שהאבחנה שיש פה התכנסות לפאי היא דבר אלמנטרי שנובע ממה שגאוס הראה, הבעיה האמיתית היא קצת יותר מורכבת ואין לה פתרון מלא עד היום.

אז מה הולך כאן ואיך מעגל נכנס לתמונה? ובכן, תשכחו מ"פתרון פיתגוראי טבעי" ותחשבו באופן גיאומטרי. אם \(a^{2}+b^{2}\le n\) ("הפתרונות הפיתגוראיים הטבעיים שבהם סכום ריבועי הניצבים קטן או שווה ל-\(n\)") זה אומר שהנקודה \(\left(a,b\right)\) במישור \(\mathbb{R}^{2}\) היא במרחק לכל היותר \(\sqrt{n}\) מראשית הצירים, כלומר היא נמצאת בתוך העיגול שרדיוסו \(\sqrt{n}\). מכיוון שלא נוח לערב שורשים, בואו נדבר על עיגול ברדיוס \(n\) ולכן המשוואה היא \(a^{2}+b^{2}\le n^2\). בנוסף, מכיוון שהוא מדבר רק על מספרים טבעיים הוא מדבר רק על הרבע הימני-עליון של העיגול – בואו נדבר על העיגול כולו, כלומר נרשה ל-\(a,b\) להיות גם שליליים (אבל עדיין מספרים שלמים). אז השאלה היא כזו: בתוך עיגול שרדיוסו \(n\), כמה נקודות יש שהקואורדינטות שלהן הן מספרים שלמים?

אפשר להגדיר את זה הכי פורמלית בעולם כך: \(N\left(n\right)=\left|\mathbb{Z}^{2}\cap\left\{ \left(a,b\right)\in\mathbb{R}^{2}|a^{2}+b^{2}\le n^{2}\right\} \right|\). בסימונים הללו, ההשערה שהועלתה היא שמתקיים \(\lim_{n\to\infty}\frac{N\left(n\right)}{n^{2}}=\pi\). את זה אפשר גם לסמן בצורה קצת שונה, שמתאימה קצת יותר לאופי של בעיות מסוג זה בתורת המספרים: \(N\left(n\right)=\pi n^{2}+o\left(n^{2}\right)\), או במילים: \(N\left(n\right)\) שווה ל-\(\pi n^{2}\) ועוד שגיאה שגדלה בקצב אסימפטוטי נמוך ממש יותר מ-\(n^{2}\), ובמילים אחרות אם מחלקים אותה ב-\(n^{2}\) ומשאיפים את \(n\) לאינסוף מקבלים אפס.

זו תוצאה יפה למדי; היא מראה, באופן אינטואיטיבי, שמספר הנקודות השלמות בתוך עיגול ברדיוס \(n\) הוא קירוב טוב לשטח של אותו עיגול. למה זה לא מפתיע ואפילו צפוי? ובכן, בגלל שאפשר לקרב את שטח עיגול היחידה באופן הבא: נגזור מעיגול היחידה ריבועים בעלי אורך צלע 1. כל ריבוע כזה הוא בעל שטח 1, ולכן שטח עיגול היחידה הוא מספר הריבועים שאנחנו יכולים לגזור ממנו "ועוד קצת" ממה שהולך בשוליים. הריבועים שנגזור יהיו בדיוק הריבועים שמוכלים בעיגול היחידה וגם קואורדינטות הקודקודים שלהם שלמות (למשל הריבוע עם הקודקודים \(\left(0,0\right),\left(0,1\right),\left(1,0\right),\left(1,1\right)\)) ואפשר למשל לזהות כל ריבוע עם הקואורדינטה הימנית-עליונה ביותר שלו (הריבוע שבדוגמה יזוהה עם \(\left(1,1\right)\)). בצורה הזו רוב הנקודות השלמות שבתוך העיגול יגדירו ריבוע שכולו בתוך העיגול למעט כמה מהנקודות שהן על השפה, אבל ככל ש-\(n\) גדול יותר כך מספר הנקודות הבעייתיות הופך לקטן יותר ביחס למספר הנקודות הכולל בעיגול (אינטואיטיבית: בגלל שהנקודות הבעייתיות הן באיזור השפה החד-ממדית, והנקודות ה"בסדר" הן באיזור הפנים הדו-ממדי) ולכן הקירוב ישתפר. זו אינטואיציה גסה מאוד אבל לטעמי היא מאפשרת להבין היטב מה הולך כאן.

מה גאוס הוכיח? ובכן, נסמן \(N\left(n\right)=\pi^{2}n+E\left(n\right)\) כש-\(E\left(n\right)\) היא פונקציית ה"שגיאה"; גאוס הוכיחש-\(\left|E\left(n\right)\right|\le2\sqrt{2}\pi n\) (לפחות על פי ויקיפדיה; ברפרנס שהם מביאים בכלל לא מדובר על הקבוע), ומכאן קל לראות ש-\(E\left(n\right)=o\left(n^{2}\right)\) וזה נותן את התוצאה שדובר עליה מייד. זה לא מסיים את הסיפור כי החסם של גאוס הוא עדיין גס למדי ויש חסמים טובים יותר; ההשערה היא ש-\(E\left(n\right)=O\left(n^{\frac{1}{2}+\varepsilon}\right)\), כלומר חזקה של \(n\) שהיא הרבה פחות מ-1 כמו בחסם של גאוס, אבל כיום החזקה הטובה ביותר שהגיעו אליה (על פי ויקיפדיה) היא \(0.6298\dots\). בקיצור, חסם טוב על גודל השגיאה הוא עדיין אתגר פתוח במתמטיקה.

אני ארצה להוכיח כאן את התוצאה של גאוס, אבל לפני כן, עוד מילה אחת על "הכפפה למתמטיקאי": כבר אמרתי כאן בעבר כי אחד מהמאפיינים של הטרחנים המתמטיים הוא הנטייה להמציא מחדש את הגלגל, לתת לו שם מפוצץ וכנראה לחשוב שאף אחד לא חשב על זה לפניך. כאן יש לנו מקרה קלאסי של הבעיה הזו – נותנים את השם המפוצץ "פתרונות פיתגוראיים טבעיים" למשהו שלא ממש זקוק לשם נוסף, מנסחים מחדש אבחנה שהיא כבר עתיקה למדי (בניסוח מילולי מסורבל) ומציגים את זה בתור "אתגר" לקהילה המתמטית. זה לא רציני. הדבר הראשון שצריך לעשות מישהו שמגלה תוצאה זו או אחרת במתמטיקה הוא לבדוק האם כבר שמעו עליה לפני שהוא מתחיל לפמפם אותה בתור תגלית שלו בתוספת אתגר למתמטיקאים שיואילו נא לנסח פורמלית ולהוכיח אותה. איכשהו אנשים סבורים לפעמים שניתן לעסוק במתמטיקה בלי ללמוד מתמטיקה כלל; אבל אפילו רמנוג'אן קרא ספרי מתמטיקה – ורובנו, מה לעשות, לא רמנוג'אן. מישהו שמצד אחד מתיימר לפתור את הבעיה המרכזית של עולם הפיזיקה כיום (תיאוריה מאוחדת) אבל מצד שני מראה שהוא לא מסוגל לעשות סקר ספרות אלמנטרי של בעיות מתמטיות פשוט לא יכול להילקח ברצינות.

הנה דרך נחמדה לבצע סקר ספרות שכזה. נניח שכבר הבנתם שמה שמעניין פה הוא העיגול כולו ולא רבע העיגול. אז אחד מהדברים שאפשר לעשות הוא לספור ממש כמה נקודות יש בו. הנה קוד בשפה Sage (שמבוססת על פייתון – ויסלח לי אלוהי הפייתון, אבל הבלוג מסרב להציג כאן רווח/טאב בתחילת שורה) שעושה את זה:

def N(n):
return len([(a,b) for a in range(-n,n+1) for b in range(-n,n+1) if a^2+b^2<=n^2])
print [N(n) for n in range(10)]


שימו לב כמה העסק פשוט כאשר עובדים בשפה המתאימה – נדרשת בערך שורה אחת (שהיא אפילו קריאה, עבור מי שמכיר את השפה) כדי לעשות את החישוב שב"כפפה" דרש הרבה יותר קוד. כעת, אם מריצים את הקוד הזה יתקבל הפלט \([1,5,13,29,49,81,113,149,197,253]\), ומה שעושים עם דבר כזה הוא ללכת לאנציקלופדיה האלקטרונית של סדרות מספרים. הסדרה מופיעה שם, כמו גם קישור לבעיית המעגל של גאוס. זו כמובן לא הדרך היחידה שאפשר לנקוט בה, אבל אני חושב שראוי להציג אותה כי לפעמים אנשים מפספסים את העובדה שסדרה של מספרים קונקרטיים שהיא לכאורה לא מעניינת לכשעצמה (כי מה אכפת לנו אם זה 197 שם ולא 196?) יכולה להיות מאוד מועילה כשמגששים באפלה של בעיה מסויימת (כמו גם שפת תכנות נוחה עבור מי שרוצה לחשב דברים "ביד", אם כי צריך להיזהר ולא להגזים עם זה כי אינטואיציות באות לפעמים דווקא כשעושים את החישובים באמת ביד).

בואו נעבור להוכחת הטענה של גאוס (עם קבוע קצת יותר גדול ממה שנטען בויקיפדיה) באופן פורמלי יותר, אבל עדיין לא פורמלי עד הסוף כי אשתמש בשיקולים גיאומטריים שיהיו רבע נפנוף ידיים. ראשית, תמונה אחת שווה כאן אלף מילים:

העיגול שלנו מסומן בקו האחיד. הרעיון הוא זה שאמרתי קודם – יש התאמה בין ריבועי היחידה שקודקודיהם הם בעלי קואורדינטות שהן מספר שלם, והנקודות עם קואורדינטות שלמות במישור – לכל ריבוע פשוט מתאימים את הקודקוד הימני-עליון שלו. כעת, כל ריבוע שמוכל כולו בתוך העיגול, בפרט גם הקודקוד הימני-עליון שלו נמצא בתוך העיגול, ולכן התרומה של הריבוע לשטח (1) נספרת בהתאמה עם זה שהקודקוד של הריבוע נספר. אז מתי משהו יכול להשתבש? ברור שלא בריבועים שכולם מחוץ לעיגול – גם הקודקוד הימני-עליון שלהם מחוץ לעיגול ולכן איננו נספר. בעיה יכולה להתקיים באחד משני מקרים: או ריבוע שחלקו בתוך העיגול אבל הקודקוד הימני-עליון שלו בחוץ, ואז הוא תורם חלקית לשטח העיגול אבל לא לספירת הנקודות שבעיגול; או ריבוע שחלקו בתוך העיגול כולל הקודקוד הימני-עליון, אבל לא כולו בתוך העיגול ואז הוא לא תרם מספיק לשטח העיגול כדי לכסות על זה שהוא תרם נקודה לספירה.

מה שנעשה יהיה לבחור בגישה הכי נאיבית לחסימה של השגיאה כאן: על כל ריבוע שחלקו בתוך העיגול וחלקו מחוץ לעיגול, נגיד שגודל הטעות שהריבוע גרם לה הוא המקסימלי – 1. כל מה שעלינו להראות הוא שלא יכולות להיות הרבה טעויות, כלומר אנחנו רוצים לספור את הריבועים הבעייתיים. אלו בדיוק הריבועים שמצויירים באיור.

כעת, ריבוע שאורך צלעו יחידה הוא בעל אלכסון שאורכו \(\sqrt{2}\) (משפט פיתגורס). זה אומר שהמרחק המקסימלי בין כל שתי נקודות בריבוע הוא \(\sqrt{2}\). כעת, בואו ניקח ריבוע שחלקו בתוך העיגול אבל יש בו נקודה מחוץ לעיגול, ונמתח קו ישר ממרכז העיגול אל הנקודה בתוך הריבוע שהיא המרוחקת ביותר ממרכז העיגול. מרגע שהקו הזה מגיע אל הגבול של העיגול ועד שהוא מגיע אל הקודקוד הבעייתי הוא יכול לעבור רק מרחק של \(\sqrt{2}\) לכל היותר (כאן צריך קצת יותר הצדקה ואני מחפף), ולכן אם נצייר עיגול שרדיוסו גדול ב-\(\sqrt{2}\) מרדיוס העיגול המקורי שלנו, הוא יכיל את כל הריבועים הבעייתיים. העיגול הגדול יותר הזה הוא הגדול מבין שני העיגולים המקווקווים.

באופן דומה, הבה וניקח ריבוע שחלקו בתוך העיגול אבל לא כולו, אז אפילו הנקודה בו שמרחקה ממרכז העיגול הוא הקטן ביותר לא יכולה להיות במרחק גדול מ-\(\sqrt{2}\) משפת העיגול, אחרת כל הריבוע היה בפנים. לכן אפשר לצייר עיגול פנימי שרדיוסו קטן ב-\(\sqrt{2}\) מרדיוס העיגול – זה העיגול המקווקו השני. אם מסתכלים על השטח של העיגול המקווקו החיצוני, שממנו מחסירים את השטח של העיגול המקווקו הפנימי, מקבלים טבעת. כל הריבועים הבעייתיים נמצאים בשלמותם בתוך הטבעת הזו, ולכן שטח כל הריבועים הבעייתיים קטן או שווה לשטח הטבעת. רק ששטח טבעת קל לחשב – פשוט מחסרים משטח העיגול המקווקו החיצוני את שטח העיגול המקווקו הפנימי, ומקבלים:

\(\pi\left(n+\sqrt{2}\right)^{2}-\pi\left(n-\sqrt{2}\right)^{2}=4\pi\sqrt{2}n\)

וזהו ההפרש המקסימלי בין שטח העיגול (\(\pi n^{2}\)) ובין מספר הנקודות השלמות שבו (\(N\left(n\right)\)), מה שמסיים את ההוכחה וסוגר את עניין ה"כפפה".

האם הטור ההרמוני מתכנס ל-137?

בדיחה גסה ידועה (למתמטיקאים) מספרת על שני מתמטיקאים העומדים בקצה האחד של חדר כאשר בקצה השני נמצאת בחורה נאה, והם חפצים להגיע אליה. הראשון אומר "כדי לעבור את החדר צריך לעבור קודם את מחציתו; ואחרי שאגיע למחציתו, אצטרך עוד להגיע למחצית של המחצית הנותרת; ואחרי שאעבור אותה אצטרך להגיע למחצית של הרבע הנותר וכן הלאה – וכך עד אינסוף, ומכאן שלעולם לא אגיע אל הבחורה". המתמטיקאי השני עונה לו "כן; אבל תתקרב מספיק לכל צורך מעשי" (בגרסאות מסויימות ה"מעשי" הוא פיזיקאי, אך אני מוחה נגד כך בתוקף – ההתמודדות עם הסיטואציה שמתוארת בבדיחה היא המצאה של מתמטיקאים).

מה הלך כאן? נניח שאורך החדר הוא 1. המתמטיקאי הראשון תיאר את מעבר החדר כסדרה של "צעדים", שבה בכל צעד עוברים את חצי הדרך שעברנו בצעד הקודם. כלומר, אחרי צעד אחד עברנו \(\frac{1}{2}\), אחרי שניים עברנו \(\frac{1}{2}+\frac{1}{4}\), אחרי שלושה עברנו \(\frac{1}{2}+\frac{1}{4}+\frac{1}{8}\) וכן הלאה. הסכומים הללו הם מקרים פרטיים של טור הנדסי ולכן קיימת לנו נוסחה פשוטה שנותנת את ערכם: \(1-\frac{1}{2^{n}}\) הוא המרחק שנעבר עד וכולל הצעד ה-\(n\) (למי שאינו מאמין – שיציב \(n=1,2,3\) בנוסחה וישווה זאת לסכומים שכתבתי למעלה). לא קשה לראות שלא משנה איזה ערך של \(n\) אציב בנוסחה הזו לא אוכל לקבל 1, כך שהמתמטיקאי הראשון לא יגיע אף פעם אחרי מספר סופי של צעדים אל הקצה השני של החדר (באופן המאוד מוזר שבו אנחנו בוחרים למדוד "צעדים"). מה שהשני אומר הוא שאנחנו לא באמת חייבים להגיע ל-1 כדי לקטוף את הפירות של מעבר החדר; נניח שכל מה שאנחנו צריכים הוא שהמרחק בינינו ובין הבחורה יהיה \(0.0000001\); אז לא קשה למצוא \(n\) שהוא גדול כל כך עד שהמרחק שלנו מהבחורה קטן מה-\(0.0000001\) הזה (תרגיל למשועממים – מצאו \(n\) שכזה). על סיטואציה שכזו אומרים שהסדרה \(1-\frac{1}{2^{n}}\) שואפת ל-1; היא לא בהכרח מגיעה ל-1, אבל לכל רמת קרבה שרק נרצה שהיא תתקרב בה ל-1 מבלי שתגיע אליו ממש, מובטח לנו שמתישהו זה יקרה (התנאי המדוייק שמגדיר שאיפה למספר כלשהו הוא טיפה יותר מורכב וכבר פירטתי עליו בעבר).

הסיטואציה שמתוארת בבדיחה היא הלעגה של אחד מהפרדוקסים של זנון, ש"מוכיח" שאכילס לא מסוגל לחצות חדר. על הפרדוקסים כתבתי כבר בפוסט נפרד ולא אחזור על כך כאן – הבאתי את הבדיחה בתור חימום לנושא האמיתי של הפוסט, שהוא סכום תמים למראה באופן דומה, אך מטעה וחמקמק למדי.

נניח שכעת אנחנו מנסים למדוד את צעדינו באופן הבא: בצעד הראשון נפסע מרחק של 1. בשני מרחק של \(\frac{1}{2}\). בשלישי מרחק של \(\frac{1}{3}\); ברביעי מרחק של \(\frac{1}{4}\) ובאופן כללי, בצעד ה-\(n\) נפסע מרחק של \(\frac{1}{n}\). די ברור שאחרי צעד אחד כבר נעבור מרחק של 1; גם ברור שאחרי ארבעה צעדים נעבור מרחק של 2, אבל מכאן ואילך המאמץ שנדרש מאיתנו כדי לעבור את 3 הוא גדול למדי, והמאמץ לעבור את 4 גדול עוד יותר, וכן הלאה וכן הלאה. אם כן, מה המספר המקסימלי שעוד נצליח לעבור? איזה חדר הוא גדול מספיק כדי שלא נוכל להגיע לקצה השני שלו? זו השאלה שלפנינו. בניסוח פורמלי, מדברים על הסכום \(1+\frac{1}{2}+\frac{1}{3}+\dots+\frac{1}{n}+\dots\), שמכונה "הטור ההרמוני" ונכתב בקיצור כ-\(\sum_{n=1}^{\infty}\frac{1}{n}\) ושואלים מהו סכום הטור הזה – למה הוא שואף באותו מובן של קודם.

כאן אפשר לחלק את בני האדם לשלושה סוגים: יש את אלו שאומרים שמובן מאליו שסכום הטור יהיה אינסוף כי יש בו אינסוף איברים. אלא שכבר ראינו דוגמה לטור שבו הטענה הזו שגויה בתכלית – \(\sum_{n=1}^{\infty}\frac{1}{2^{n}}\) שעליו דיברנו קודם מתכנס ל-1 ולא לאינסוף. לכן מי שטוען שהטור אינסופי מסיבה זו פשוט אינו "משתתף במשחק" שלנו ואינו דובר את אותה שפה כמונו; כבר עסקתי פעם בבלוג באדם מסוג זה.

הסוג השני, המתמטיקאי, יגיד שסכום הטור הזה הוא אינסוף, אבל שהדבר אינו מובן מאליו כלל וכלל, ויש להוכיח זאת. והוא גם יציג הוכחה או שתיים. אני מתעתד לעשות זאת בפוסט הזה. כדי להבהיר עד כמה הטענה הזו בלתי מובנת מאליה רק אעיר שעבור הטור \(\sum_{n=1}^{\infty}\frac{1}{n^{\alpha}}\) כאשר \(\alpha\) הוא מספר ממשי כלשהו הגדול ממש מ-1 (\(\alpha>1\)), הטור כן מתכנס ("מתכנס" פירושו שסכומו קטן מאינסוף). כלומר, \(\sum_{n=1}^{\infty}\frac{1}{n}\) הוא "כמעט" מתכנס וזה לא מובן כלל מאליו שהוא מתקלקל כך.

ויש את הסוג השלישי של אנשים, שיטענו שהטור מתכנס, ואולי אף יציגו מספר שהוא סכום הטור. בפורום של הבלוג התפתח דיון שכזה עם אדם הטוען שסכום הטור ההרמוני הוא 137 – דיון שאין דרך לסווג אותו מלבד "דיון קלאסי עם טרחן מתמטי כפייתי". אנסה להציג משהו מהטיעונים שלו אחרי שיסתיים החלק המתמטי של הפוסט הזה.

הבה ונעבור להסבר מדוע הטור אינו מתכנס. ראשית, אינם חייבים לסמוך עלי – במהלך הדיון בפורום ניתן קישור למאמר שמציג 20 הוכחות שונות לתוצאה הזו. שנית, צריך להסביר מה בעצם אני מנסה להוכיח. לומר שהטור מתכנס לאינסוף פירושו (במקרה הספציפי הזה; ההגדרה הכללית היא מעט יותר מסובכת) שלכל מספר טבעי \(k\) שרק תגידו לי, אוכל לתת לכם מספר איברים כלשהו \(n\) כך שאחרי שסוכמים \(n\) איברים מקבלים סכום שגדול מ-\(k\). למשל, עבור \(k=137\), שהוא הסכום המשוער שהזכרתי קודם, אפשר לראות שאם נסכום \(2^{300}\) איברים נקבל תוצאה שגדולה מ-137. איך? למה? מאיפה המספר הזה הגיע? זה מה שנראה עכשיו. ראשית כל, הנה המחשה ציורית של ההוכחה, שמציגה בבירור את הרעיון המרכזי בה – קיבוץ איברים:

\(1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\frac{1}{5}+\frac{1}{6}+\frac{1}{7}+\frac{1}{8}+\dots>\)

\(1+\frac{1}{2}+\left(\frac{1}{4}+\frac{1}{4}\right)+\left(\frac{1}{8}+\frac{1}{8}+\frac{1}{8}+\frac{1}{8}\right)+\dots=\)

\(1+\frac{1}{2}+\frac{1}{2}+\frac{1}{2}+\dots\)

כעת נעבור לתיאור יותר מדויק של מה שקורה כאן. לצורך נוחות, הבה ונסמן ב-\(H_{n}\) את מה שמקבלים אחרי שסוכמים את \(n\) האיברים הראשונים של הטור. המספר הזה נקרא "המספר ההרמוני ה-\(n\)-י". לא קל לחשב במדוייק את הערכים של ה-\(H_{n}\)-ים ולכן במקום זה נותנים להם חסם תחתון – משהו שמובטח ש-\(H_{n}\) יהיה גדול ממנו. ההוכחה הפשוטה ביותר לכך שהטור ההרמוני אינו מתכנס, שנמצאה כבר במאה ה-14, מתבססת על שיטה פשוטה ויפה לתת חסם תחתון ל-\(H_{n}\)-ים: נסתכל רק על ה-\(n\)-ים שהם חזקות של 2, כלומר \(H_{2^{n}}\), לכל \(n\ge0\) . כדי לקבל תחושה, הבה ונתבונן באיברים הראשונים:

\(H_{2^{0}}=1\)

\(H_{2^{1}}=1+1\cdot\frac{1}{2}\)

\(H_{2^{2}}=1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}>1+\frac{1}{2}+\left(\frac{1}{4}+\frac{1}{4}\right)=1+2\cdot\frac{1}{2}\)

רגע, רגע, רגע – מה עשינו עבור \(H_{2^{2}}\)? ויתרנו על חישוב מדוייק שלו ובמקום זה הלכנו על חסם תחתון. אמרנו שאפשר לקחת את \(\frac{1}{3}+\frac{1}{4}\) ולהשתמש בשיקול הבא: \(\frac{1}{3}\) הוא גדול מ-\(\frac{1}{4}\) ולכן \(\frac{1}{3}+\frac{1}{4}>\frac{1}{4}+\frac{1}{4}=\frac{1}{2}\). הצמצום הזה עוזר לנו לחשב את החסם. כדי לראות זאת יותר בבירור הבה ונסתכל על המספר ההרמוני הבא בתור:

\(H_{2^{3}}=H_{2^{2}}+\frac{1}{5}+\frac{1}{6}+\frac{1}{7}+\frac{1}{8}>H_{2^{2}}+4\left(\frac{1}{8}\right)>1+2\cdot\frac{1}{2}+\frac{1}{2}=1+3\cdot\frac{1}{2}\)

מה עשינו כאן? אמרנו ש-\(H_{2^{3}}\) שווה בדיוק ל-\(H_{2^{2}}\) ובנוסף כל האיברים ה"חדשים" שלא הופיעו ב-\(H_{2^{2}}\) – שהם כל האיברים מהצורה \(\frac{1}{k}\) עבור \(2^{2}<k\le2^{3}\). זה כבר מכתיב לנו את הדרך למקרה הכללי: נניח שהוכחנו ש-\(H_{2^{k}}\ge1+\frac{k}{2}\) ואנחנו רוצים למצוא חסם על \(H_{2^{k+1}}\), מה עושים? ראשית, כותבים \(H_{2^{k+1}}=H_{2^{k}}+\frac{1}{2^{k}+1}+\frac{1}{2^{k}+2}+\dots+\frac{1}{2^{k+1}}\). כעת, הסכום \(\frac{1}{2^{k}+1}+\frac{1}{2^{k}+2}+\dots+\frac{1}{2^{k+1}}\) כולל בדיוק \(2^{k+1}-2^{k}=2^{k}\) איברים, והאיבר הקטן ביותר מביניהם הוא \(\frac{1}{2^{k+1}}\), כך שאנו מקבלים את החסם \(H_{2^{k+1}}\ge H_{2^{k}}+\frac{2^{k}}{2^{k+1}}\ge1+\frac{k}{2}+\frac{1}{2}=1+\frac{\left(k+1\right)}{2}\). בעצם הוכחנו כאן באינדוקציה שלכל \(k\) טבעי מתקיים \(H_{2^{k}}\ge1+\frac{k}{2}\), וזהו זה – עבור \(k\) גדול מספיק אפשר לעבור כל מספר טבעי שמפריע לנו.

נחזור לדוגמת ה-137: עבור \(k=300\) מקבלים \(H_{2^{300}}\ge1+\frac{300}{2}=151\). כך שלמעשה, \(2^{300}\) הוא מספר גדול מדי של איברים; אפשר היה להסתפק בהרבה פחות. כמה פחות? בדיוק פתרון המשוואה \(1+\frac{k}{2}>137\), ובמילים אחרות – \(k=273\). אם כן, הוכחנו שהטור ההרמוני עובר את 137 ב-\(H_{2^{273}}\), ובאותה דרך בדיוק נוכל לרמוס כל טענה שהטור ההרמוני מתכנס לסכום סופי אחר.

לאלו מכם שאינם מפחדים מלוגריתמים ואסימפטוטיקה, זוהי הזדמנות לראות שההוכחה הזו גם אומרת לנו משהו על קצב הגידול של \(H_{n}\): אם \(n=2^{k}\) אז \(k=\lg n\) ולכן \(H_{n}\ge1+\frac{\lg n}{2}=\lg\left(2\sqrt{n}\right)\). למעשה, זה חסם תחתון די גרוע – המספרים ההרמוניים מתנהגים בערך כמו \(\ln\left(n\right)\) (ועוד תיקון כלשהו).

ההוכחה הבאה שאציג היא לטעמי לא פחות מיפהפיה, ומספקת הדגמה נוספת לאופן שבו שימוש באקספוננט יכול לפשט בעיות חיבוריות על ידי הפיכתן לכפליות (מוטיב נפוץ למדי בתורת המספרים…). הרעיון הוא לא לחשב את \(H_{n}\) ישירות, אלא את \(e^{H_{n}}\) (כאשר \(e^{x}\) היא פונקצית האקספוננט שכתבתי עליה לא מזמן). גם כאן נצטרך לבצע קירוב כלשהו כדי לקבל נוסחה יפה, ונשתמש בכך ש-\(e^{x}>1+x\) לכל \(x>0\) (אי השוויון מובן מאליו אם זוכרים ש-\(e^{x}=1+x+\frac{x^{2}}{2!}+\frac{x^{3}}{3!}+\dots\) – פשוט לקחנו את שני האיברים הראשונים).

ובכן: \(e^{H_{n}}=e^{\sum_{k=1}^{n}\frac{1}{k}}=\prod_{k=1}^{n}e^{\frac{1}{k}}>\left(1+1\right)\left(1+\frac{1}{2}\right)\left(1+\frac{1}{3}\right)\cdots\left(1+\frac{1}{k}\right)=2\cdot\left(\frac{3}{2}\right)\cdot\left(\frac{4}{3}\right)\cdots\left(\frac{k+1}{k}\right)=k+1\).

השורה האחת הזו מסיימת את הסיפור. למי שלא הבין את המעבר שבו נעלמים הפלוסים -\(1+\frac{1}{k}=\frac{k+1}{k}\) באופן כללי, ולכן כאן מתקבל \(1+\frac{1}{2}=\frac{3}{2}\) וכן הלאה. המעבר האחרון נובע מכך שהמכפלה שקיבלנו היא "מכפלה טלסקופית" שבה כל איבר מצמצם את האיבר הבא: \(2\cdot\frac{3}{2}=3\), ו-\(3\cdot\frac{4}{3}=4\) וכן הלאה.

הוכחה אלגנטית ומקסימה נוספת מתבצעת בשלילה: מניחים שהטור ההרמוני אכן מתכנס למספר ממשי \(S\) כלשהו, ומשתמשים במניפולציות שמותר לבצע על טורים מתכנסים כדי להגיע לסתירה. הרעיון פשוט: אם \(1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\dots=S\) אז אפשר לכפול את שני האגפים בחצי ולקבל \(\frac{1}{2}+\frac{1}{4}+\frac{1}{6}+\frac{1}{8}+\dots=\frac{S}{2}\). שימו לב שבאגף שמאל יש לנו בדיוק את האיברים ה"זוגיים" של הטור ההרמוני והם מתכנסים בדיוק למחצית מסכום הטור ההרמוני. מסקנה? גם האיברים הנותרים, האי זוגיים, מתכנסים למחצית הטור ההרמוני, כלומר \(1+\frac{1}{3}+\frac{1}{5}+\dots=\frac{S}{2}\). אלא מה? כל איבר בטור האי זוגיים גדול ממש מהאיבר המתאים לו בטור הזוגיים: \(1>\frac{1}{2}\), \(\frac{1}{3}>\frac{1}{4}\) וכן הלאה. על כן לא ייתכן שסכום שני הטורים זהה – ההפרש חייב להיות לפחות \(\frac{1}{2}\)! (כי ההפרש בין שני האיברים הראשונים הוא \(\frac{1}{2}\) והאיברים הבאים רק מגדילים אותו).

הערה או שתיים לסיום החלק המתמטי. ראשית, חבל להזכיר את התבדרות הטור ההרמוני בלי להזכיר הקשר רחב יותר שבו הטור ההרמוני מופיע – פונקצית הזטה של רימן, שמוגדרת כ-\(\zeta\left(s\right)=\sum_{n=1}^{\infty}\frac{1}{n^{s}}\) עבור \(s>1\) (ובאופן יותר מחוכם עבור ערכים אחרים של \(s\), כולל מרוכבים). התבדרות הטור ההרמוני מראה כי \(\zeta\left(1\right)=\infty\), ואפשר לנצל את התופעה הזו, למשל, כדי להוכיח (בצורה מסובכת יחסית, אמנם) את קיומם של אינסוף ראשוניים; ווריאציה מחוכמת על ההוכחה הזו מובילה למשפט דיריכילה על ראשוניים בסדרות חשבוניות. בקיצור, מדובר בנושא מעניין.

עוד דבר הוא שיש דברים "חלשים יותר" מהטור ההרמוני שעדיין מתבדרים. הדוגמה הקלאסית היא הטור \(\sum\frac{1}{p}\) שבו משתתפים רק אותם איברים של הטור ההרמוני שמתאימים למספרים ראשוניים. במובן מסויים זה מראה כי יש כמות "אינסופית גדולה יחסית" של ראשוניים (ומצד שני, כדאי לזכור שכמות הראשוניים איננה מאותו סדר גודל של כמות הטבעיים אלא בערך לוגריתמית).

אוקיי, בואו נעבור לטרחנות. כאמור. מה אפשר לומר על מי שטוען שהטור מתכנס? ראשית, צריך לברר איתו האם הוא מדבר על אותו מושג התכנסות כמונו. יש תורה עשירה ויפה שעוסקת בטורים שמתבדרים על פי ההגדרה הקלאסית, אבל קיימות הגדרות מוכללות להתכנסות שעל פיהן הם אכן מתכנסים. כך למשל הטור \(1-1+1-1+1-\dots\) הידוע לשמצה אינו מתכנס בהגדרה הקלאסית, אך כן יש משמעות מסויימת לאמירה שסכומו הוא \(\frac{1}{2}\) (לא אכנס לכך כעת, אבל אינטואיציה כפולה: ראשית, הסכומים החלקיים של הטור הם \(1,0,1,0,\dots\) והממוצע שלהם הוא \(\frac{1}{2}\); שנית, אם מפתחים את \(\frac{1}{1-x}\) לטור פורמלי מקבלים \(1+x+x^{2}+\dots\) וכשמציבים \(x=-1\) מקבלים את הטור המדובר, וכשמציבים ב-\(\frac{1}{1-x}\) את הערך \(x=-1\) מקבלים \(\frac{1}{2}\)).

בדיון עם טרחנים לרוב כאן יקיץ הקץ על המתמטיקה – הם לא יספקו אף פעם הגדרה כלשהי ל"התכנסות", ולו בגלל שהגדרה כזו תקבע כללי משחק שעל פיהם הם מפסידים. בדרך כלל הם יעברו לשימוש בטרמינולוגיה הפרטית שלהם. הבה ונעבור לתיאור קצר של הדיון בפורום, עם אחד המכנה את עצמו א. עצבר (שם שודאי יהיה מוכר לכל מי שעוקב קצת אחרי דיוני מתמטיקה באינטרנט הישראלי), על הטור ההרמוני (דיון שהתפתח מדיון על נושאים אחרים, כמו זה שפאי אינו קבוע אלא משתנה ושאין מספרים אי רציונליים). הטיעון מתחיל ב:

ויש עוד אגדה, והיא טוענת שאין מספר גבול, לסכום מספרי תג שאין להם סוף.

"מספרי תג" בהקשר זה הם פשוט הופכיים של מספרים טבעיים. כלומר, \(n^{\prime}=\frac{1}{n}\). דומני שהסימון הזה איננו המצאה של עצבר, אך בכל מקרה הוא איננו סטנדרטי ואין שום טעם להשתמש בו בהקשר הנוכחי. זו המחשה להבדלי הטרמינולוגיות בין המתמטיקאי והטרחן – בין מי שרוצה שיבינו אותו, ובין מי שלא ברור מה הוא רוצה. כמובן שגם הדיבורים על "אגדה" אינם מבשרים טובות.

הטיעון נמשך ב:

אני מחזיק בדעה כי הטור ההרמוני מתכנס, והשערתי היא שהוא מתכנס ל 137.

זה כמובן לגיטימי לכשעצמו, רק תלוי מהם הנימוקים. אלא שהם כלל לא מגיעים בשום שלב שהוא. אם כן, מתבקש להציג את אחת מההוכחות שלעיל. אז מה שעושים הוא לנסות להציג לעצבר את הגרסה בת השורה האחת של שיטת קיבוץ האיברים (הדבר הראשון שהראיתי). התגובה לכך היא מרתקת:

ההוכחה הזו הופכת דעכן לטור מונוטני, אבל הפיכה זו אינה אפשריתזו אינה הוכחה.

א.עצבר.

שימו לב להכנסת המושג החדש "דעכן" (מושג שאינו קיים בשום מקום, למיטב ידיעתי) ולאופן שבו הפסילה נעשית – הפיכה זו אינה אפשרית, וחסל. כמו תמיד, הקו המפריד בין טרחן ומתמטיקאי אינו כה מובהק – גם מתמטיקאי יכול לפסול הוכחות שמבוססות על מניפולציות של טורים; אלא שהמתמטיקאי ככל הנראה יספק הפניה או אזכור כלשהו של הסיבה לכך שהמניפולציות אינן חוקיות, למשל משפט רימן. מניפולציית כינוס האיברים של הטור ההרמוני היא חוקית לחלוטין, וכבר הראיתי דרך פשוטה לחשוב עליה שאינה כוללת התעסקות עם טורים אינסופיים כלל, כך שהפסילה של עצבר לא קשורה למציאות – אבל היא נחרצת לחלוטין, ופשוט מתעלמת מתוכן ההוכחה.

השלב הבא בדיון עם הטרחן הוא לבקש ממנו, אם כן, להתייחס לתוכן ההוכחה. התגובה שלו פשוטה – חזרה על ההוכחה בטרמינולוגיה שלו, וסיום עם משפט המחץ:

זו בערך ההוכחה שאתה מציג, ואני משאיר לך למצוא לבד את נקודת התורפה שלה.

זו הנקודה שבה אי אפשר שלא להתחיל לתהות האם הטרחן אינו סתם טועה, אלא ממש מנסה ללעוג למתדיינים עמו (אפשרות סבירה בהחלט).

אבל אז הדיון (אחרי עוד כמה וכמה הודעות מבוזבזות) מגיע לתפנית מפתיעה – עצבר כותב פירוט של הנימוק שלו לכך שהטור מתכנס, והנימוק הזה הוא מרתק. אצטט קטע מדיאלוג ארוך שעצבר כותב כדי להמחיש את הרעיון:

לוי: הדעכן ההרמוני הזה 2' 3' 4' 5' 6' 7' 8'מתחיל עם מספרי הדעיכה הבאים 66.0 75.0 8.0 0.833 0.86 0.87

ראובן: אני רואה שמספר הדעיכה מתחיל ב 0.66 והוא נוסק לעבר 1

לוי: אם מספר הדעיכה ישאר 0.66 יש נוסחה לחישוב הסכום

ואם מספר הדעיכה יגיע ל 0.75 וישאר קבוע, יש נוסחה לחישוב הסכום

ואם מספר הדעיכה יגייע ל 0.8 וישאר קבוע, יש נוסחה לחישוב הסכום

לכן, שינוי מספר הדעיכה לא משנה את העובדה שיש לדעכן מספר סכום, אבל כאשר מספר הדעיכה משתנה, אין לנו נוסחה לחישוב הסכום.

מה שמכונה "מספרי דעיכה" הם היחסים בין איברים עוקבים בסכום. אכן, \(\frac{1}{3}/\frac{1}{2}=0.66\dots\), ו-\(\frac{1}{4}/\frac{1}{3}=0.75\dots\) וכן הלאה. עוד אומר עצבר נכון שאם "מספר הדעיכה" של טור הוא קבוע, אז הטור מתכנס – זו דרך מסובכת להציג את המושג המוכר של טור הנדסי מתכנס. למעשה, צריך להיות מדוייקים – "מספר הדעיכה" של הטור צריך להיות קבוע וקטן מ-1 (הטור \(1+2+4+8+\dots\) הוא טור הנדסי בעל "מספר דעיכה" 2 והוא אינו מתכנס). אלא שעצבר מבצע כעת קפיצה מחשבתית איומה: המחשבה שאם עבור מספר דעיכה קבוע הטור מתכנס תמיד, זה אומר שגם עבור מספר דעיכה משתנה הטור מתכנס תמיד – טענה שגויה לחלוטין. והוא עוד מגדיל לעשות ואומר:

כל דעכן דועך אל האפס,יש דעכן הדועך אל האפס במספר דעיכה קבוע

ויש דעכן הדועך אל האפס במספר דעיכה משתנה

ואיזה הבדל עקרוני יכול להיות בינהם ?

איזה הבדל? כל ההבדל שבעולם! ההבדל בין טור מתכנס וטור מתבדר! וזו מהות השגיאה של עצבר – חוסר היכולת לבצע את ההבדלה הזו. הקפיצה הגסה הזו מעל דברים "מובנים מאליהם" שבעצם אינם מובנים כלל מאליהם ודורשים הצדקה קפדנית. זה לב הבעיה – לא השימוש בטרמינולוגיה פרטית וגם לא היוהרה והדיבורים על "אגדות" וכדומה – אלא עצימת העיניים כאשר העובדות לא מסתדרות עם התיאוריה.

לסיום רק אעיר שבאופן כללי הטעות שעצבר מבצע היא טעות נפוצה למדי בקרב מי שעדיין לא פיתח אינטואיציה מתמטית סבירה. עצבר מבצע קפיצה מחשבתית מהצורה "אם משהו מתקיים לכל מספר טבעי, הוא מתקיים גם באינסוף". במקרה שלו – אם "נקפיא" את מספר הדעיכה של הטור אחרי מספר סופי של צעדים, הטור יתכנס; אז אם זה קורה כשמקפיאים בכל שלב, למה שזה לא יתכנס גם כשהולכים לאינסוף?

שגיאה דומה (אבל בלבוש ערמומי יותר) צצה במקומות רבים במתמטיקה שבהם משתמשים באינסוף. אתן דוגמה או שתיים. ראשית, נניח שיש לנו סדרה \(a_{n}\), ומתקיימת התכונה שלכל \(n\) טבעי, מתקיים \(\inf\left\{ a_{1},a_{2},\dots,a_{n}\right\} >0\), כלומר האינפימום של \(n\) האיברים הראשונים בקבוצה הוא גדול מאפס. האם ניתן להסיק מכך שהאינפימום של הקבוצה כולה גדול מאפס? בפירוש לא, והסדרה \(a_{n}=\frac{1}{n}\) מראה זאת בבירור (מה שכן ניתן לעשות הוא לומר שהאינפימום של הקבוצה כולה הוא גדו או שווה לאפס).

דוגמה מתחום שונה לגמרי – בתורת החישוביות מראים כי כל שפה שיש בה רק מספר סופי של מילים היא כריעה (שפה היא קבוצת מילים; להכריע שפה פירושו להריץ אלגוריתם שבהינתן מילה תמיד מסיים את ריצתו עליה ואומר אם היא שייכת לשפה או לא). עכשיו בואו ניקח שפה \(L\) כלשהי ונסתכל על \(L_{n}\) – כל המילים ב-\(L\) שאורכן לכל היותר \(n\). אז כל \(L_{n}\) שכזו היא כריעה, אבל זה ממש לא אומר ש-\(L_{\infty}\) (שהיא בעצם \(L\)) תהיה גם כן כריעה, כי ייתכן מאוד ש-\(L\) המקורית לא הייתה כריעה. כאן שוב הזינוק מ-\(n\) עד לאינסוף הורס לנו את הכל. האינסוף הוא יצור חמקמק.

זה כמובן לא אומר שאף פעם לא ניתן לבצע את הזינוק הזה. דוגמה ידועה היא משפט הקומפקטיות מלוגיקה – אם יש לנו אוסף אינסופי של פסוקים, וכל תת קבוצה סופית שלהם היא ספיקה, אז גם האוסף כולו ספיק. כאן אכן מספיק להבין מה קורה במקרה הסופי כדי לזנק למקרה האינסופי. קיימות עוד תכונות קומפקטיות שכאלו, אך קיומן הוא אף פעם לא מובן מאליו ותמיד צריך להיות זהירים – וזהירות היא בדיוק מה שחסר לטרחנים המתמטיים, לדעתי. זה, ואולי גם בורג.

משפט אי השלמות של גדל – מה הוא ממש, ממש לא

באדיבות הבלוג Good math, bad math נחשפתי לאחד מההסברים הגרועים ביותר – אם לא הגרוע ביותר – שנתקלתי בהם אי פעם למשפט אי השלמות של גדל. כל המאפיינים הקלאסיים של בלבלת גדל מצויים שם – ניסוח שגוי לחלוטין של המשפט, שמעיד על חוסר הבנה מוחלט שלו; ייחוס השלכות "הרסניות" למשפט על המתמטיקה; טענה שהמשפט תקף לאלף ואחד תחומי חיים אחרים ולא רק למתמטיקה; וכמובן, הסקת מסקנות מרחיקת לכת באשר לחיים, ליקום ובכלל. באופן מפתיע, או שלא, המאמר נמצא באתר בשם Cosmic Fingerprints שככל הנראה טורח לשכנע את קוראיו בקיום בורא תבוני ליקום.

לא ברור כיצד הגיע כותב המאמר לתובנות כה שגויות על משפט גדל. יש שתי אפשרויות – או שהוא מבין מצויין את משפט גדל, ומעוות דברים כדי שיסתדרו עם השקפת עולמו, או שהוא אידיוט. מכיוון שאני אוהב אדם ידוע, אניח שלא הייתה כאן מזימה שכזו אלא פשוט חוסר הבנה עמוק. מכיוון שרשימת ה"לקריאה נוספת" שהוא מביא שם כוללת בראשה את הספר של רבקה גולדשטיין על קורט גדל ("ההוכחה והפרדוקס"), אני סבור שזו אכן הבעיה. לספר ההוא עלי להקדיש פוסט נפרד כדי להסביר עד כמה אני חושב שדרך ההצגה שלו של עניינים מסויימים היא שגויה, אבל דיה לצרה בשעתה.

אפשר כמובן לשאול למה אני טורח בכלל לכתוב פוסט על הסברי גדל שגויים, והסיבה פשוטה – כי לדעתי, כדי להבין מה גדל כן אומר, חשוב להבין גם בדיוק מה הוא לא אומר. גם מי שישב וקרא את התיאור של משפט גדל, ואפילו את ההוכחה שלו – לא מובטח שבאמת יבין עד הסוף מה יש ומה אין שם – והמאמר כל כך שגוי, שהוא נותן דוגמאות למכביר של הדברים שאינם שם. כמובן שיש עוד סיבה – מאמרים כאלו מעצבנים אותי מאוד ואני חש צורך טבעי לכתוש אותם. אם כן, הבה ונתחיל – אצטט את החלקים הרלוונטיים מהמאמר.

In 1931, the young mathematician Kurt Gödel made a landmark discovery, as powerful as anything Albert Einstein developed.

In one salvo, he completely demolished an entire class of scientific theories.

Gödel’s discovery not only applies to mathematics but literally all branches of science, logic and human knowledge. It has earth-shattering implications.

מה כן נכון כאן – גדל אכן הוכיח את המשפט ב-1931, כשהיה צעיר יחסית, והמשפט הוא אכן תגלית מרשימה והישג אדיר. מכיוון שאני מעדיף להיות חיובי על פני שלילי, רק אציין שאפשר לראות בהוכחה של גדל את ראשיתה של תורת החישוביות, ואת ערש הולדתם של מדעי המחשב – לא בגלל שגדל הרס משהו, אלא בגלל שהרעיונות שהיו כרוכים בהוכחה שלו היו בבסיסם הגשר שבין הלוגיקה ובין הענף שטרם נולד עדיין שעסק בחישוב.

מה לא נכון כאן – שגדל "השמיד לחלוטין" תיאוריות מתמטיות, או שלתגלית שלו יש השלכות מרחיקות לכת על כל תחומי הידע האנושי. אמנם, התגלית של גדל שמה קץ לתוכנית של הילברט במתכונתה השאפתנית ביותר והפתיעה את המתמטיקאים שסברו כי המתכונת הזו היא אפשרית (בפרט, הילברט עצמו), אך מכאן ועד להשמדה מוחלטת ארוכה הדרך. אפרט בעניין בפוסט עתידי שיעסוק בתוכנית של הילברט. זה הלקח הראשון שצריך ללמוד: בלי פאניקה. לא להגזים עם הבומבסטיות של משפטי גדל. הם לא הורסים את המתמטיקה. אנחנו ישנים בשקט גם איתם.

כעת אנו עוברים לסקירה היסטורית מביכה ביותר:

Mathematicians love proofs. They were hot and bothered for centuries, because they were unable to PROVE some of the things they knew were true.

So for example if you studied high school Geometry, you’ve done the exercises where you prove all kinds of things about triangles based on a set of theorems.

That high school geometry book is built on Euclid’s five postulates. Everyone knows the postulates are true, but in 2500 years nobody’s figured out a way to prove them.

Yes, it does seem perfectly “obvious” that a line can be extended infinitely in both directions, but no one has been able to PROVE that. We can only demonstrate that Euclid’s postulates are a reasonable, and in fact necessary, set of 5 assumptions.

Towering mathematical geniuses were frustrated for 2000+ years because they couldn’t prove all their theorems. There were so many things that were “obviously true,” but nobody could find a way to prove them.

מה שיש כאן הוא חוסר הבנה בסיסי של מושג ההוכחה – חוסר הבנה שהוא הגורם לתפיסה השגויה של משפט גדל שמופגנת בהמשך. יש כאן גם סגנון כתיבה מתנשא ומעצבן כלפי המתמטיקאים וחובבי המתמטיקה, אבל זה בסדר, אנחנו רגילים.

מה שצריך להבהיר הוא שהמתמטיקאים יודעים שהוכחות הן במובן מסויים קרב אבוד. חייבים להתחיל ממערכת אקסיומות כלשהי שתהיה שרירותית, אחרת אי אפשר לעשות שום דבר. לא משנה מאיזו מערכת נתחיל, עדיין יהיה בה משהו שאנחנו חייבים להניח. זה לא רק במתמטיקה, זה בכל דבר – אם אין לך הנחות כלשהן, אין לך כלום. כל השאלה היא בדיוק מהן ההנחות שלך – והמתמטיקאים רוצים הנחות שהן בסיסיות ופשוטות ככל הניתן. זה לא יבטיח שהן "נכונות", אבל זה יהפוך אותן למשהו שיותר נחמד לשחק איתו.

האקסיומות של אוקלידס הן דוגמאות טובות לכך. מרבית האקסיומות התקבלו על דעת המתמטיקאים בלי ויכוח, למשל האקסיומה המצוטטת על הקו שניתן להמשיך לאינסוף. אני לא חושב שיש מתמטיקאי שמוטרד מכך שלא ניתן "להוכיח"את האקסיומה הזו; בפרט, במתמטיקה המודרנית פחות חושבים עליה בתור "עובדה מובנת מאליה שאין צורך להוכיח" ויותר בתור "חלק מחוקי המשחק הגאומטרי". למה זה דומה? לכך שבשחמט אין צורך "להוכיח"שהפרש נע בצורתו המוזרה ויכול לקפוץ מעל יחידות – זו פשוט ההנחה הבסיסית שלנו, כדי שנוכל בכלל לשחק שחמט. הסיבה שאנחנו משחקים שחמט היא שזה כיף ומעניין; הסיבה שאנו משחקים במתמטיקה היא דומה. כמובן שאפשר לטעון גם שהמתמטיקה שימושית לתיאור המציאות הפיזיקלית, אבל זה פועל רק לטובתנו, שכן האקסיומות של הגאומטריה האוקלידית אכן תואמת את תפיסתנו את המציאות הפיזיקלית היומיומית. הן אמנם אידאליות והעולם שלנו לא מתואר על ידן בדיוק מוחלט; ויתר על כן, כשעוזבים את המציאות הפיזיקלית היומיומית ונכנסים לתיאוריות מורכבות יותר, כלל לא ברור שדווקא הגאומטריה האוקלידית היא הנכונה – אבל הן מספקות "קירוב טוב", וזה כל מה שאנחנו מצפים לו ממתמטיקה-בשימוש-המציאות-הפיזיקלית.

המהומה האמיתית סביב האקסיומות של אוקלידס הייתה סביב האקסיומה החמישית, אקסיומת המקבילים. הסיבה לכך הייתה שהאקסיומה הזו נראתה שרירותית ומסובכת מהותית יותר מכל היתר, ולכן התקווה הייתה שהיא תתגלה כדבר מה שניתן להוכיח מהיתר, והתסכול נבע מכך שלמרות שהדבר נראה מתבקש, המתמטיקאים לא הצליחו בכך (או יותר נכון – הצליחו שוב ושוב, ואז התגלו טעויות בפתרונותיהם). העובדה שלא ניתן לעשות זאת התבררה רק לאחר שנבנו גאומטריות לא-אוקלידיות, שהיו תקפות באותה המידה כמו הגאומטריה האוקלידית. זו המחשה נוספת לאופן שבו המתמטיקאים ממילא לוקחים אקסיומות בערבון מוגבל – הם מכירים בכך שאקסיומות הגאומטריה האוקלידית מתארות "עולם" אחד, ואקסיומות לגאומטריה לא אוקלידית מתארות "עולם" אחר, וששני העולמות הללו הם יצורים מתמטיים לגיטימיים. מכאן שאין כלל משמעות ל"הוכחה"של אקסיומת המקבילים – "הוכחה" כזו תהיה דרך להגיד שאחד מהעולמות לא מעניין אותנו ואנו בוחרים להכחיש את קיומו.

כעת הסקירה ההיסטורית עוברת לתוכנית של הילברט:

In the early 1900’s, however, a tremendous wave of optimism swept through mathematical circles. The most brilliant mathematicians in the world (like Bertrand Russell, David Hilbert and Ludwig Wittgenstein) became convinced that they were rapidly closing in on a final synthesis.

A unifying “Theory of Everything” that would finally nail down all the loose ends. Mathematics would be complete, bulletproof, airtight, triumphant.

In 1931 this young Austrian mathematician, Kurt Gödel, published a paper that once and for all PROVED that a single Theory Of Everything is actually impossible. He proved they would never prove everything. (Yeah I know, it sounds a little odd, doesn’t it?)

קצת מוזר לי לראות את ראסל ראשון, את הילברט אחריו ואחר כך את ויטגנשטיין (?). הילברט צריך להיות הראשון בזכות. ראסל צריך להופיע אחריו, יחד עם מתמטיקאים רבים שלא הוזכרו. אני לא בטוח שויטגנשטיין צריך להיות כאן בכלל שכן לא היה מתמטיקאי אלא פילוסוף (שעסק גם בפילוסופיה של המתמטיקה).

מה שנכון הוא שהילברט אכן קיווה להגיע אל מעין "התיאוריה של הכל" במתמטיקה – מערכת אקסיומות סבירה שעליה ניתן יהיה לבנות את כל המתמטיקה בלי חשש לסתירות. זה היה לב לבה של התוכנית שלו, ושאיפה ראויה ביותר. זה אכן גם מה שגדל החריב לחלוטין – התיאור לפיו מה שגדל הראה הוא שתיאוריה שכזו היא בלתי אפשרית הוא נכון. לפרש את זה בתור "הוא הוכיח שלא ניתן להוכיח הכל" זה כבר יותר בעייתי, ומתעלם מכך שהתוכנית של הילברט לא ניסתה להוכיח הכל, אלא ניסתה למצוא מערכת הוכחה טובה עבור המתמטיקה.

כעת אנו עוברים סוף סוף לתיאור שלו את משפט גדל. הוא מנסה לתת תיאור במשפט קצר וקולע, וטועה לחלוטין:

“Anything you can draw a circle around cannot explain itself without referring to something outside the circle – something you have to assume but cannot prove.”

משפט גדל לא מדבר על היכולת של מערכת "להסביר את עצמה". אין שום משמעות לביטוי הזה בכלל. אני מניח שהוא מתכוון לכך שמערכות חייבות אקסיומה מבחוץ כדי להוכיח את עצמן – אבל מה זה בכלל אומר, בעצם? נניח שאנו משתמשים במערכת אקסיומות כדי להוכיח את נכונות מערכת האקסיומות – מה השגנו בזה? הרי כדי להאמין להוכחות במערכת שלנו ממילא חייבים להאמין לאקסיומות, ואז מה? (נתעלם מכך ש"הוכחה" לאקסיומה במערכת ההוכחה שלנו היא בת שורה אחת – האקסיומה עצמה…)

אם כן, מה שהוא מתאר כאן איננו משפט גדל אלא עובדה אלמנטרית – כדי להשתכנע בנכונות אקסיומות של מערכת הוכחה כלשהי, עלינו לעבוד "מחוץ"למערכת ההוכחה הזו (אלא אם חלק מהאקסיומות של המערכת שלנו מיותרות במובן זה שאפשר להוכיח אותן מהיתר). זה קצת מזכיר לי את התיאור שמתארים לפעמים את המשפט היסודי של האלגברה בתור "לכל פולינום ממעלה \(n\) יש לכל היותר \(n\) שורשים" – זה אמנם נכון (כשהפולינום מעל שדה, אם להיות קטנוניים) אבל זה משהו שיחסית קל להוכיח ואינו המהות של המשפט היסודי (שאומר שמעל המרוכבים יש לפולינום בדיוק \(n\) שורשים; זו דרך אחרת להגיד "המרוכבים הם שדה סגור אלגברית").

למה אולי כן התכוונו כאן? למשפט אי השלמות השני של גדל, שבאמצעות שימוש במשפט הראשון מראה כי חלק מהמערכות שעליהן חל משפט גדל הראשון אינן מסוגלות להוכיח את העקביות שלהן עצמן. אלא שזה דבר שונה מהותית מ"להסביר את עצמך" או "להוכיח את עצמך" – עקביות של מערכת אקסיומות בסך הכל אומרת שלא ניתן להסיק מהן סתירה; היא אינה אומרת שהן "נכונות". הגאומטריה האוקלידית עקבית, וגם הגאומטריות הלא אוקלידיות עקביות, למרות שיש להן אקסיומות "הפוכות". כאמור, אני לא חושב שיש כאן בעיה, כי איני מסתכל על אקסיומות הגאומטריה כאמיתות מוחלטות.

טוב, תגידו – מה שהוא כתב זו אנלוגיה, אולי לא הבנתי אותו נכון? ובכן, לא – בציטוט הבא הוא נותן תיאור יותר קונקרטי:

Gödel proved that there are ALWAYS more things that are true than you can prove. Any system of logic or numbers that mathematicians ever came up with will always rest on at least a few unprovable assumptions.

וזה, כאמור, כלל לא מה שמשפט גדל אומר. אחזור בפעם המאה על אותו דבר – כל מערכת אקסיומטית חייבת להסתמך על כמה הנחות לא מוכחות – זה הרעיון שבהוכחה. בנוסף, המשפט הזה מציג תפיסה שגויה לפיה משפט גדל חל על "כל"מערכת לוגית, וגם זה שגוי לגמרי – יש תורות מתמטיות רבות שמשפט גדל לא חל עליהן. הגאומטריה האוקלידית היא אחת מהן; אבל גם על תורות בלוגיקה מסדר שני (תורה שבה ניתן לבצע כימות על קבוצות ולא רק על איברים בודדים) משפט גדל לא בהכרח חל – אפילו התורה שמנסה למדל את המספרים הטבעיים – אריתמטיקת פאנו – משפט גדל אינו חל כשהיא מנוסחת בלוגיקה מסדר שני, אלא רק על אריתמטיקת פיאנו מסדר ראשון. לתורות מסדר שני יש בעיות כבדות משל עצמן; הילברט ניסה בתוכנית שלו למצוא מערכת אקסיומטית שחומקת מאותן בעיות – אבל משפט גדל לא חל עליהן. לטעמי זו נקודה שחשוב מאוד להדגיש, שכן בספרות הפופולרית אוהבים להעמיד פנים שגדל חל על "הכל"(במקרה הרע) או על "כל מערכת מורכבת מספיק" (במקרה הטוב, שבו מכירים בכך שלמשפט גדל יש הנחות, ופשוט לא מתייחסים לכולן).

הכותב ממשיך עם שוונג ה"משפט גדל חל על הכל":

Gödel’s Incompleteness Theorem applies not just to math, but to everything that is subject to the laws of logic. Everything that you can count or calculate. Incompleteness is true in math; it’s equally true in science or language and philosophy.

ועל זה אני יכול רק לומר: לא, לא, לא! משפט גדל הוא משפט מתמטי, שחל על תורות מתמטיות מסויימות שמקיימות תנאים מתמטיים מסויימים. לנסות להחיל אותו על דברים לא קשורים זה שקר ועלבון לאינטליגנציה.

כעת אנו עוברים לתיאור נפנוף-ידיימי מאוד של הוכחת המשפט:


Gödel, in one of the most ingenious moves in the history of math, converted this Liar’s Paradox into a mathematical formula. He proved that no statement can prove its own truth.

You always need an outside reference point.

למעשה, זה מתחיל בתיאור תיאור של האינטואיציה שמאחורי הוכחת המשפט – בנייה פורמלית של טיעון הדומה לפרדוקס השקרן – אבל אז קופצים שוב ל"מסקנה"השגויה, בצורה עוד יותר מרוכזת מקודם – אם קודם דיברנו על מערכות שלא יכולות להוכיח את עצמן, כעת התדהמה היא מכך שמשפטים לא מסוגלים להוכיח את עצמם – אבל שוב, זה משהו מובן מאליו למדי. אם אנחנו לא מאמינים למשפט, איך זה שהוא "מוכיח" את עצמו יעזור לנו להאמין לו? אם מישהו שהוא שקרן מועד אומר על עצמו שהוא דובר אמת, איך זה אמור לשכנע אותנו?

אז רגע, מה כן קורה בהוכחה של משפט גדל? ניסיתי לתאר זאת בפירוט בעבר – השורה התחתונה היא שעבור תורה \(T\) בונים משפט שבדרך מחוכמת ועקיפה מצליח לומר "לא קיימת עבורי הוכחה בתוך התורה \(T\)". מה בין זה ובין משפטים שמוכיחים את עצמם – אין לי מושג.

עכשיו הגיע הזמן לקצור את הפירות – להגיד שעולם ישן עדי יסוד נחרב על ידי משפט גדל:

The Incompleteness Theorem was a devastating blow to the “positivists” of the time. They insisted that literally anything you could not measure or prove was nonsense. He showed that their positivism was nonsense.

Gödel proved his theorem in black and white and nobody could argue with his logic. Yet some of his fellow mathematicians went to their graves in denial, believing that somehow or another Gödel must surely be wrong.

בנוגע לפסקה השניה, אין לי מושג על אילו מתמטיקאים הוא מדבר, והוא לא טורח לציין שמות. הילברט עצמו לא המשיך לחיות את חייו בהכחשה אלא ניסה לעדכן את התוכנית שלו לאור משפט גדל (הוא לא טען בשום צורה שמשפט גדל אינו נכון).

לסיכום החלק הזה, הוא חוזר על הנקודה העיקרית, כשהיא מורחבת בפראות:

A “theory of everything” – whether in math, or physics, or philosophy – will never be found. Because it is mathematically impossible.

שימו לב, שוב, לאופן שבו הוא מקפיץ את משפט גדל לחיסול הפיזיקה והפילוסופיה. גם השימוש במושג המעורפל של "תיאוריה של הכל" לא עוזר, אם כי לפחות היה לו היושר להקיף אותו במרכאות.

המשך המאמר כבר לא עוסק במשפט גדל עצמו אלא עובר לטיעונים סטנדרטיים להוכחת קיום אלוהים. אלא שלקראת הסוף גדל נשלף מהשרוול כקלף מנצח, במה שהוא ככה הנראה השימוש החצוף ביותר שראיתי בו עד היום. הטיעונים להוכחת אלוהים משחקים את משחק האינפורמציה הרגיל – הוא טוען שמתישהו במהלך היסטוריית היקום פתאום צצה והופיעה אינפורמציה – אינפורמציה שבאה לידי ביטוי בקוד הגנטי, למשל, ושאותה אינפורמציה לא יכלה להופיע מתוך המערכת אלא רק "מבחוץ". ריצ'רד דוקינס מבזבז ספרים שלמים בהסבר מדוע המשפט האחרון שגוי, ולכן לא אטרח. אלא שבהמשך הוא מנסה להשתמש במשפט גדל כדי לחזק את הטיעון שלו, וכותב את רצף הפסקאות הבלתי ייאמן הבא:

If you visit the world’s largest atheist website, Infidels, on the home page you will find the following statement:

“Naturalism is the hypothesis that the natural world is a closed system, which means that nothing that is not part of the natural world affects it.”

If you know Gödel’s theorem, you know all systems rely on something outside the system. So according to Gödel’s Incompleteness theorem, the folks at Infidels cannot be correct. Because the universe is a system, it has to have an outside cause.

Therefore Atheism violates the laws mathematics.

לא פחות. משפט גדל מראה שהאתאיזם מפר את חוקי המתמטיקה. אני חושב שאפסיק כאן.

למה הרציונליים הם ממידה אפס (או: הטרחן צועק ולבג צודק)

תודות לבעליו של הבלוג המתמטי העברי החדש "מהומה רבה על לא דבר" גיליתי מכרה זהב טרחני לא מבוטל. הטרחן שבקישור מתהדר בכמה ממוצגי הטרחנות הקלאסיים – "הוכחות" קצרות לבעיות מתמטיות קשות ומפורסמות כמו השערת פואנקרה והשערת רימן, כמו גם הוכחה לכך שאקסיומת הבחירה שקולה להשערת הרצף (ממש ממש לא – השערת הרצף אינה תלויה באקסיומות הרגילות של תורת הקבוצות, גם אם מכניסים פנימה את אקסיומת הבחירה). בנוסף, וגם זה כרגיל אצל טרחנים, הוא מראה כי מתמטיקאים מפורסמים טעו. קנטור הוא הקורבן הראשון, אבל קנטור הוא קורבן לכל טרחן אפשרי בערך, ולכן פחות מעניין כאן. הקורבן השני של הטרחן מעניין יותר – אנרי לבג הצרפתי, הממציא של אינטגרל לבג (ככל הנראה הכללתו החשובה ביותר של האינטגרל ה"רגיל", אינטגרל רימן) ומי שנתן תנופה עצומה להתפתחותה של תורת המידה המתמטית. ולמה הטרחן נטפל? להוכחה המקסימה אך הפשוטה מאוד של לבג לכך שקבוצת המספרים הרציונליים היא ממידה אפס. במאמרו, הטרחן תוקף את הטענה בשלוש דרכים שונות, כולן שגויות באופן מעורר חלחלה. למרבה המזל המאמר קצר מאוד והשגיאות שבו בולטות מאוד לעין כך שניתן לדון בהן, ולדעתי הן מסייעות לשים דגש על מספר נקודות עדינות שאולי לא ברורות דיו למי שזה עתה נתקל בתחום – וכמובן, זה תירוץ טוב להציג את ההוכחה של לבג, שבפני עצמה היא קצרה מדי מכדי שיוקדש לה פוסט עצמאי.

נתחיל קודם כל מהמתמטיקה האמיתית – ההוכחה של לבג. לשם כך צריך להבהיר קודם כל מהי מידה, על קצה המזלג. הרעיון הבסיסי שמאחורי מידה הוא הכללה של שלושה מושגים מוכרים שהם בעצם אותו הדבר בממדים שונים – אורך, שטח, ונפח. כולם מהווים מדד מסויים ל"כמות" או ל"גודל", אף שצריך להיות מאוד זהירים עם הנימוקים האינטואיטיביים הללו, כי יש להם פירושים מתמטיים אחרים שונים בתכלית (בפרט למושג ה"גודל" של קבוצות אינסופיות קיים מושג ה"עוצמה" של קנטור, וישנן דוגמאות לקבוצות שעוצמתן גדולה – לא בת מניה – אך המידה שלהן היא אפס). כדי להגדיר אורך באופן מפורש מתחילים מהגדרת אורך של אובייקט פשוט – קטע סגור \(\left[a,b\right]\) כלשהו, שאורכו מוגדר פשוט בתור \(b-a\). כלומר, אורך הקטע \(\left[0,1\right]\) הוא 1, כמו אורך הקטע \(\left[1,2\right]\), ואילו אורך הקטע \(\left[-2,5\right]\) הוא 7, וכן הלאה. זוהי הגדרה שעליה קשה לחלוק.

בעזרת אורך של קטע אפשר להגדיר שטח של מלבן: אם אורך צלעות המלבן הוא \(x,y\) בהתאמה, אז שטחו יהיה \(x\cdot y\). בדומה אפשר להגדיר נפח של תיבה באמצעות מכפלת אורכי צלעותיה. אך כל אלו הן צורות "פשוטות"- מה עם צורות מורכבות יותר?

כאן נכנסת לתמונה האינטואיציה הנוספת שלנו ביחס למידה – אם יש לנו שתי קבוצות, \(A,B\), הזרות זו לזו (אין להן נקודות משותפות), אז המידה של \(A\cup B\) שווה לסכום המידות של \(A,B\). בצורה זו ניתן להגדיר מידה של קבוצה קצת יותר מתוחכמת, כמו \(\left[0,1\right]\cup\left[3,5\right]\) – האורך של הקבוצה יהיה 3, סכום אורכי שני הקטעים שמרכיבים אותה. באופן דומה אפשר לטפל גם בצורות דו ממדיות ותלת ממדיות שניתן להציג כאיחוד של מלבנים ותיבות. כאן כבר נכנס קושי טכני כלשהו לתמונה – לרוב כשנתונה לנו צורה מורכבת שעדיין ניתנת לחלוקה לאיחוד סופי של מלבנים, המלבנים שבאיחוד יהיו חייבים לגעת זה בזה בשפה שלהם. זו לא בעיה אמיתית מכיוון שהמידה של השפה היא 0 (לא אוכיח זאת כאן, אבל לפחות במקרה החד ממדי זה נובע מיידית ממה שכן אוכיח, שכן השפות במקרה זה יהיו קבוצות בנות מניה של נקודות), ולכן לא אתעכב יותר מדי על נקודה זו. לתכונה שהראיתי כעת, על כך שמידה של איחוד שתי קבוצות זרות שווה לסכום המידות של הקבוצות, קוראים אדיטיביות ("חיבוריות").

אלא שאדיטיביות עדיין לא מספיקה לנו כדי לתאר קבוצות שהן מאוד טבעיות, ובראש ובראשונה עיגול. לא משנה כמה נרצה, לא נוכל לתאר עיגול כמורכב ממספר סופי של מלבנים (נימוק מהיר – השפה של כל מלבן היא קו ישר; אם העיגול יתואר ע"י מספר סופי של מלבנים, אז השפה של אחד מהם תהיה גם שפת העיגול; אבל השפה של עיגול היא אף פעם לא קו ישר). עם זאת, אפשר לקרב מצויין עיגולים על ידי מלבנים – נסו לצייר עיגול ולמלא אותו ככל יכולתכם במלבנים – התוצאה תהיה טובה למדי. למעשה, זה בדיוק הרעיון שמאחורי אינטגרל רימן – קירוב שטחים באמצעות מלבנים. אם מרשים לצייר אינסוף מלבנים, אז ניתן לקבל בדיוק את העיגול כולו, למעט שפתו (שכאמור, מידתה היא 0) – כלומר, אפשר איכשהו למלא את שטח העיגול באינסוף מלבנים כך שכל נקודה בעיגול שאיננה על השפה תוכל באחד המלבנים, וכל המלבנים יהיו זרים (למעט חפיפה בשפות שלהם). אם \(A_{i}\) היא סדרת המלבנים שמקרבת את העיגול, טבעי יהיה להגדיר את שטח העיגול בתור סכום שטח כל המלבנים בסדרה, כלומר \(\mu\left(\bigcup_{i=1}^{\infty}A_{i}\right)=\sum_{i=1}^{\infty}\mu\left(A_{i}\right)\) (כש-\(\mu\) הוא סימון מקובל עבור מידה). סכום אינסופי איננו אובייקט בעייתי במיוחד – בחשבון האיניפינטסימלי יש לו הגדרה מדוייקת ונאה, שמתאימה לאינטואיציה שהצגנו כאן. אם כן, תכונה סבירה לדרוש ממידה באופן כללי היא שאם \(A_{i}\) היא סדרה של קבוצות זרות זו לזו, אז יתקיים \(\mu\left(\bigcup_{i=1}^{\infty}A_{i}\right)=\sum_{i=1}^{\infty}\mu\left(A_{i}\right)\). לתכונה זו קוראים סיגמה-אדיטיביות (ה"סיגמה"בא לציין שמדובר באדיטיביות על קבוצה אינסופית אך בת מניה של מחוברים).

כעת אפשר להוכיח כי מידת הרציונליים היא אפס. על פניו זה נשמע מטופש להחריד, כי עדיין לא הגדרתי מהי מידה! רק תיארתי שתי תכונות שאני מצפה ממידה לקיים (אורך של קטע \(\left[a,b\right]\) הוא \(b-a\), וסיגמה-אדיטיביות). מסתבר שאין צורך בהרבה יותר מכך כדי להוכיח כי כל פונקציה שמקיימת את התכונות הללו תיתן אפס לקבוצת המספרים הרציונליים; התכונה המהותית הנוספת היחידה שאדרוש היא שהמידה של כל קבוצה היא אי-שלילית (היא יכולה להיות אפס או אינסוף). זה כמובן טבעי לחלוטין, כי בהקשר של "אורך"או "נפח" אין משמעות לערך שלילי.

האבחנה הראשונה היא שאם יש לנו שתי קבוצות \(A,B\) כך ש-\(A\subseteq B\), אז \(\mu\left(A\right)\le\mu\left(B\right)\). זאת מכיוון שניתן להציג את \(B\) בתור איחוד זר של \(A\) ושל כל אברי \(B\) שאינם ב-\(A\), כלומר \(\mu\left(B\right)=\mu\left(A\right)+\mu\left(B\backslash A\right)\), ומכיוון ששני המחוברים באגף ימין אי שליליים מתקבלת התוצאה.

האבחנה השנייה היא שאם יש לנו אוסף קבוצות \(A_{i}\) שאינן בהכרח זרות זו לזו, אז אמנם כבר לא ניתן לומר שהמידה של איחודן היא סכום המידות שלהן, אבל סכום המידות שלהן הוא בוודאי עדיין חסם למידה שלה: \(\mu\left(\bigcup A_{i}\right)\le\sum\mu\left(A_{i}\right)\). נסו להוכיח זאת – זה תרגיל פשוט למדי.

המסקנה משני אלו היא שאם יש לנו קבוצה \(A\), ואנחנו מצליחים איכשהו לכסות אותה באמצעות סדרת קבוצות \(B_{i}\), כלומר שיתקיים \(A\subseteq\bigcup B_{i}\), אז \(\mu\left(A\right)\le\sum\mu\left(B_{i}\right)\). לכן ככל שנצליח לכסות את \(A\) על ידי \(B_{i}\) עם מידה קטנה יותר, נקבל חסם טוב יותר על מידת \(A\). ועדיין, איך אפשר להשתמש בזה כדי להוכיח שמידת \(A\) היא ממש אפס? האם לא צריך לשם כך לכסות את \(A\) על ידי קבוצות שמידת כולן אפס? ואילו קבוצות כאלו קיימות? זכרו – כרגע כל מה שאנחנו יודעים את המידה שלו הם קטעים סגורים, אבל המידה של כל קטע סגור לא טריוויאלי גדולה מאפס. אז מה עושים?

כאן נכנס היופי של החשבון האינפיניטסימלי לתמונה במלוא כוחו. כדי להראות ש-\(\mu\left(A\right)\) היא אפס, לא צריך אף פעם להראות את השוויון הזה באופן ישיר – די לנו להראות כי לכל מספר גדול מאפס \(\varepsilon>0\), מתקיים \(\mu\left(A\right)\le\varepsilon\). מכיוון שבנוסף לכך \(\mu\left(A\right)\ge0\) על פי הגדרת מידה, נובע מכך שמידת \(A\), אם היא מוגדרת, חייבת להיות אפס – כי אם היא הייתה גדולה מאפס, נניח \(t\), אז עבור \(\varepsilon=\frac{t}{2}>0\) לא היה מתקיים ש-\(\mu\left(A\right)\le\varepsilon\). הוכחות כאלו הן הלחם והחמאה של החשבון האינפיניטסימלי, והמחשה חזקה מאוד לאופן שבו הוא מצליח, למרות שלכאורה הוא עוסק רק בקירובים והזנחות, לתת תוצאות מדוייקות לחלוטין (כך למשל האינטגרל – מושג שכל כולו קירובים "עקומים"באמצעות מלבנים, מצליח לתת במדוייק ערכים מורכבים רבים – למשל, שטח עיגול).

נעבור כעת לקבוצה הקונקרטית \(A\) של המספרים הרציונליים. למה דווקא הרציונליים? למעשה, ההוכחה שנציג עובדת לכל קבוצה בת מניה (כלומר, שניתן למספר את אבריה במספרים טבעיים בלי חזרות – קבוצת המספרים הממשיים אינה כזו, ולמעשה אף קטע אינו כזה – מספר הנקודות בכל קטע הוא לא בן מניה), והרציונליים הם בעיקר לשם הקוריוז, מכיוון שהם צפופים בישר הממשי – כלומר, כל קטע שרק ניקח, קטן ככל שיהיה, יכיל מספר רציונלי, מה שלכאורה אמור לתת את התחושה שהמידה שלהם דווקא צריכה להיות גדולה, ואף אינסופית.

יהי \(\varepsilon>0\) כלשהו, ונתבונן במניה כלשהי של הרציונליים: \(a_{1},a_{2},a_{3},\dots\). לכל רציונלי \(a_{i}\) נתאים קטע סגור \(B_{i}\) שמכיל את \(a_{i}\), כך שהגדלים של ה-\(B_{i}\) דועכים אקספוננציאלית. או בעברית: \(B_{i}=\left[a_{i},a_{i}+\frac{\varepsilon}{2^{i}}\right]\). על פי ההגדרה, \(\mu\left(B_{i}\right)=\frac{\varepsilon}{2^{i}}\), ועל כן קיבלנו מייד ש-\(\mu\left(\mathbb{Q}\right)\le\sum_{i=1}^{\infty}\mu\left(B_{i}\right)=\sum_{i=1}^{\infty}\frac{\varepsilon}{2^{i}}=\varepsilon\), כאשר המעבר האחרון נובע מהנוסחה הידועה לסכום של טור הנדסי מתכנס – זוהי בדיוק אותה נוסחה של פרדוקס אכילס של זנון.

זהו, נגמרה ההוכחה. כאמור, זו הוכחה קצרצרה, ובזבזנו את רוב הזמן על מבוא ותיאור אינטואיטיבי, אבל מבחינת החישובים, מספיקה חצי שורה, ואין כאן שום דבר מסובך.

ועם זאת, את הטרחן זה לא מספק, והוא משוכנע שלבג טעה כשנתן את ההוכחה הזו. מה שבאמת מחפיר הוא שהטרחן מצטט את ההוכחה של לבג במדוייק, ועדיין טוען כנגדה טענות שגויות לחלוטין.

אז איך כבר ניתן לתקוף את ההוכחה הפשוטה הזו?

הטענה הראשונה שלו כל כך נפלאה שאצטט אותה כאן במדוייק, כמעט מילה במילה:

אם \(\varepsilon\) מושווה לאפס, הסכימה היא על אינסוף קטעים מנוונים מאורך 0, וסכום אורכיהם הוא מהצורה \(\frac{1}{2}\varepsilon+\frac{1}{2^{2}}\varepsilon+\frac{1}{2^{3}}\varepsilon+\dots=0+0+0+\dots=0\cdot\infty\). ואף אחד לא יודע מה פירושו של \(0\cdot\infty\). \(0\cdot\infty\) יכול להיות שווה לכל מספר \(a\), או לאינסוף, או לאפס.

מה שכל כך יפה כאן הוא שהטרחן דווקא נוהג כמתמטיקאי טוב ומזהיר מפני הביטוי המסוכן \(0\cdot\infty\). הוא צודק לחלוטין בכך שהוא אומר שהביטוי הזה יכול להיות שווה לכל דבר – תלוי בהקשר. לרוב \(\infty\)לא צץ מעצמו במערכת המספרים שלנו אלא כתוצר של תהליך גבולי כלשהו. למשל, \(\lim_{x\to0}\frac{1}{x^{2}}=\infty\). הביטוי \(0\cdot\infty\) יכול לצוץ באופן טבעי, אם כך, אם אנחנו מסתכלים על הגבול של מכפלת שתי פונקציות, שאחת שואפת לאפס והשניה לאינסוף. במקרה הזה אכן לא ברור מיידית מה תהיה התוצאה, וזה תלוי מאוד בזהות הפונקציות. אלא מה? אין לזה שום קשר להוכחה של לבג.

המעבר הבעייתי הוא בין \(0+0+0+\dots\) לבין \(0\cdot\infty\). אין לאינסוף שלו שום משמעות קונקרטית כאן – אם יש לנו סכום אינסופי על קבוצת איברים קבועה, זה עדיין לא אומר שהסכום הוא אינסוף כפול האיבר הקבוע של הסדרה, פשוט כי \(\infty\) לא הוגדר בתור אובייקט אלגברי, אי אפשר לכפול בו וכו'. גם אם טורחים להגדיר אותו בתור אובייקט אלגברי (ועושים זאת לעתים קרובות כאשר עוסקים בתורת המידה), זה עדיין לא תקף לגבי הטור הזה, שבו אינסוף לא מייצג כמות אלא את מספר הנסכמים. הדרך הנכונה לטפל בטור הזה היא פשוט על ידי ההגדרה הבסיסית של טורים אינסופיים – מסתכלים על גבול סדרת הסכומים החלקיים. כל סכום חלקי הוא 0, ולכן גבולה של סדרת הסכומים החלקיים הוא 0, ולכן הטור הוא 0, וחסל.

אלא מה? כל הדיון הזה מיותר לחלוטין, מהטעם הפשוט שבכלל לא צריך להציב \(\varepsilon=0\)! שימו לב להוכחה שלי – הוכחתי שלכל \(\varepsilon\) שהוא גדול מאפס, מידת הרציונליים קטנה מאותו אפסילון. בשום שלב לא נזקקתי להצבה \(\varepsilon=0\) – כאמור, כל היופי בחשבון האינפיניטסימלי הוא שכלל לא צריך אותה. אם יורשה לי להיות קיצוני – אדם שלא מבין את הנקודה הזו, לא ייתכן שיוכיח את השערת רימן, ולכן לא אטרח לקרוא את המאמר של הטרחן שבו הוא מתיימר לעשות זאת.

המתקפה השניה של הטרחן על ההוכחה מעניינת הרבה יותר. במקרה זה אקצר מעט את הקשקשת. ראשית כל, הוא מתמקד רק ברציונליים שבקטע \(\left[0,1\right]\), שעליהם דיבר לבג בהוכחה המקורית (מן הסתם זה לא משנה מאום). כעת הוא אומר דבר כזה – ניקח את הקבוצה המשלימה של \(\bigcup B_{i}\) ביחס לקטע \(\left[0,1\right]\) – מה שנקבל הוא, לדבריו: "איחוד של קטעים עם אורך כולל של לפחות \(1-\varepsilon\)". ואז הוא מעלה את השאלה "האם ייתכן שיהיה קטע לא מנוון שאין בו מספרים רציונליים?" והתשובה לכך היא כמובן שלילית, בשל צפיפות הרציונליים. מכאן הטרחן מסיק ש"טענת לבג שהוא מסוגל לשמור את הרציונליים מחוץ לאינסוף קטעים ב-\(\left[0,1\right]\) איננה אמינה". אוי ווי.

מה הבעיה כאן? שהטרחן לא זוכר דברים בסיסיים בתורת הקבוצות. הוא אמנם צודק בכך שהמשלים של \(\bigcup B_{i}\) אינו יכול לכלול בתוכו קטעים כי זה יעמוד בסתירה לצפיפות הרציונליים, אבל הוא לא מבין שאין שום סיבה שהמשלים יכיל קטעים! בפרט, המשלים ממש איננו "איחוד של קטעים"- אם הולכים לפי כללי תורת הקבוצות הבסיסיים מקבלים \(\overline{\bigcup B_{i}}=\bigcap\overline{B_{i}}\), דהיינו מקבלים חיתוך אינסופי של משלימי קטעים (על משלימי קטעים אפשר לחשוב כאיחוד של קטעים). החיתוך הזה הוא שמבטיח שכל קטע אפשרי בתוך \(\left[0,1\right]\) לא ישתתף ב-\(\bigcap\overline{B_{i}}\), והנימוק פשוט – ניקח קטע כלשהו, אז מצפיפות הרציונליים הוא מכיל רציונלי \(a_{i}\), כלומר \(a_{i}\in B_{i}\) כלומר \(a_{i}\notin\overline{B_{i}}\), כלומר \(a_{i}\notin\bigcap\overline{B_{i}}\). כמובן שההוכחה הפורמלית הזו לא עוזרת "לראות" את הקבוצה המוזרה \(\bigcap\overline{B_{i}}\) – חשבו עליה בתור הישר עם המון חורים קטנטנים בתוכו, אבל "לא יותר מדי" – אבל היא מראה שאין שום בעיה פורמלית, בניגוד למה שהטרחן סבור.

ברשותכם, לא אתייחס למתקפה השלישית, שהיא עוד יותר מקושקשת מקודמותיה ואיני מוצא בה תוכן מעניין. אם כן, מה היה לנו? הוכחה יפה ופשוטה של טענה מעניינת (אך בסיסית), ושתי "הפרכות" שלה שמצביעות על בעיות אינטואיציה שאני מניח שלרוב העוסקים במתמטיקה יש, לפחות כאשר הם נתקלים לראשונה בחומר. אבל בעיקר יש כאן מוטיבציה לעיסוק קצת יותר מעניין במידות – בפרט, בפוסט הבא בנושא אוכיח שלמרבה הצער, פשוט לא קיימת מידה משביעת רצון (תחת הגדרה נאיבית של "משביעת רצון") על הישר הממשי.

על טרחני-קנטור וטרחני-טרחני-קנטור

הבלוג המתמטי Good Math, Bad Math עושה עבודה מצויינת בכתיבה הן על מתמטיקה אמיתית ומעניינת, והן על טרחנים מתמטיים ושימושים שגויים של המתמטיקה. אלא שלעתים נכתב בו פוסט אנטי-טרחני שנראה לי טרחני בפני עצמו, כמו הפוסט שעליו אני רוצה לדבר הפעם. העניין שלי הוא גם בטרחן שנגדו הבלוג יוצא, שתוקף את האלכסון של קנטור בדרך שלדעתי היא מעניינת – בכך שהיא מעוררת מעט מחשבה על שיטת האלכסון והדרכים שבהן ניתן לנסות ולתקוף אותה (ומדוע הן נכשלות כשלון צורב).

ובכן, הפוסט ב-GMBM עוסק במאמר שזמין לכל כאן. אין לי מושג מיהו הכותב – לכאורה הוא פרופסור למתמטיקה במכללה כלשהי, אך לא הצלחתי למצוא עליו פרטים נוספים פרט לקישור שהוא מספק במאמר עצמו למה שנראה כמו אתר בית טרחני סטנדרטי. המאמר תוקף את שיטת האלכסון של קנטור, ולכן זו הזדמנות טובה להזכיר מהי, בעצם, מעבר לקישור לפוסט שלי בנושא.

קנטור הוכיח שלא ניתן למנות את כל המספרים הממשיים. "מספר ממשי" לצורך העניין הוא ביטוי מהצורה \(0.a_{1}a_{2}a_{3}\dots\) כשה-\(a_{i}\)-ים הם ספרות בין 0 ל-9, וסדרת הספרות נמשכת עוד ועוד עד אין קץ (למשל \(0.3\) ניתן לכתיבה כ-\(0.3000\dots\)). כמובן שיש עוד מספרים ממשיים פרט למספרים הללו (כאלו שבהם משמאל לנקודה העשרונית יש משהו שאיננו אפס) אך אם נראה כי כבר את המספרים שהצגתי לא ניתן למנות, בוודאי שלא ניתן למנות את כולם. "למנות" פירושו להתאים מספר טבעי ייחודי לכל אחד מהמספרים בתחום (כלומר, לשני מספרים שונים בתחום יותאמו שני מספרים טבעיים שונים).

הדרך שבה קנטור מוכיח זאת היא גאונית בפשטותה. קנטור מניח בשלילה שקיימת מניה לכל המספרים הממשיים מהצורה הזו ואז בונה מספר ממשי "חדש" שניתן להוכיח שהמניה לא מצליחה לתפוס. כדי לראות איך בונים את המספר הזה, נסמן את המספר הראשון במניה של קנטור בתור \(0.a_{1}^{1}a_{2}^{1}a_{3}^{1}\dots\), את המספר השני בתור \(0.a_{1}^{2}a_{2}^{2}a_{3}^{2}\dots\) וכן הלאה – כלומר, \(a_{i}^{k}\) פירושו "הספרה ה-\(i\)-ית במספר ה-\(k\)-י במניה". קצת מבלבל, אך הכרחי לתעלול של קנטור. כעת נגדיר ספרה \(b_{i}\) באופן הבא: אם \(a_{i}^{i}=1\), אז \(b_{i}=0\); ואם \(a_{i}^{i}\ne1\) אז \(b_{i}=1\). במילים אחרות, בנינו את \(b_{i}\) כדי להיות שונה מהספרה ה-\(i\) של המספר ה-\(i\) במניה של הממשיים. כעת המספר של קנטור הוא \(0.b_{1}b_{2}b_{3}\dots\). במילים אחרות, קנטור בנה את המספר כך שהספרה ה-\(i\) שלו תהיה שונה מהספרה ה-\(i\) של המספר ה-\(i\) במניה, ולכן הוא אינו יכול להיות המספר ה-\(i\) במניה – לאף \(i\)! מכאן שהמספר החדש אינו במניה, וסוף הסיפור (אני מרמה כאן באופן קל למדי – יכולה להיווצר בעיה מכך שמספר שנגמר בסדרה אינסופית של \(9\) שקול למספר שנגמר ב-1 ואחריו אינסוף אפסים – אבל אפשר לעקוף את הבעיה הזו בקלות וזה לא פרט שאני רוצה להיכנס אליו כאן). הסיבה שלשיטה הזו קוראים "שיטת האלכסון" היא שאפשר לחשוב על המספרים כאילו הם מסודרים בטבלה, שבה האיבר בשורה ה-\(i\) והעמודה ה-\(j\) הוא \(a_{j}^{i}\), ואז המספר שנבנה, נבנה באופן כזה שהוא יהיה "הפוך" לאלכסון של הטבלה.

אז מה מנסה הטרחן לעשות? ברשותכם, לא אכנס לציטוטים מדוייקים אלא אתאר את הטיעון שלו כפי שאני מבין אותו – ואם אני טועה, אתם מוזמנים לתקן אותי. מה שהטרחן מנסה לעשות הוא ללכת עד הסוף עם השאלה הבסיסית שאני משער שרבים מאיתנו שואלים את עצמם מייד אחרי שהם רואים את ההוכחה של קנטור – "למה זה לא עובד גם עבור רציונליים?"

כי גם רציונליים אפשר לכתוב כפיתוח עשרוני, כמו הממשיים; אבל לעומת הממשיים, קיימת הוכחה (של קנטור עצמו) שהרציונליים כן בני מניה. אם כן, איך ההוכחה של קנטור מתפרקת? ובכן, המספר של קנטור, אותו \(0.b_{1}b_{2}b_{3}\dots\), לא בהכרח יהיה רציונלי בעצמו, כך שלא נגיע לשום סתירה (הסתירה נובעת מכך שבנינו מספר חדש שהיה אמור להשתתף במניה אך בשל אופן בנייתו ברור כי אינו משתתף בה). זה מעלה את השאלה – מה מבדיל מספר רציונלי מאי-רציונלי, בכל הנוגע לפיתוח העשרוני? והתשובה פשוטה – מספר הוא רציונלי אם ורק אם הפיתוח שלו הופך למחזורי החל משלב מסויים – כלומר, צצה איזו סדרת ספרות סופית כך שאת כל המספר מכאן ואילך ניתן לתאר כחזרה אינסוף פעמים על אותו רצף ספרות (למשל, \(0.43223325000\dots\) הוא רציונלי כי הוא מסתיים בסדרת אפסים אינסופית. וגם \(0.12345678901234567890\dots\) הוא רציונלי כי הוא מורכב מאינסוף חזרות על רצף הספרות \(1234567890\)). אין שום סיבה להניח שהמספר \(0.b_{1}b_{2}b_{3}\dots\) שבנינו אכן יקיים את תכונת המחזוריות הזו.

יפה, אומר הטרחן – אם כן, הבה ונהנדס את הבניה של קנטור כך שמספר קנטור כן יקיים את תכונת המחזוריות. ליתר דיוק, נגרום לכך שבאלכסון יצוץ מספר רציונלי, ואז גם כשניקח את "ההפך" ממנו (שזה מה שעושים כשבונים את \(0.b_{1}b_{2}b_{3}\dots\)) נקבל מספר רציונלי (קל למדי להוכיח זאת – נסו!)

בפרט, הטרחן רוצה ליצור באלכסון בדיוק את המספר שתיארתי לעיל – \(0.1234567890\dots\). הדרך שלו לעשות זאת היא על ידי סידור מחדש של השורות. כלומר, אם למשל השורה הראשונה לא מסתדרת עם יצירת המספר הזה, הוא פשוט יחליף אותה עם השורה השניה, וכן הלאה.

איך זה עובד פורמלית? הוא מגדיר "מספר \(n\)-מודולרי", לכל \(n\) טבעי, בתור מספר \(0.a_{1}a_{2}a_{3}\dots\) שהספרה במקום ה-\(n\)-י שלו (כלומר \(a_{n}\)) היא בדיוק \(n\mbox{ mod 10}\) (כלומר, הספרה הימנית ביותר של \(n\) – למשל, אם \(n=123\) אז הספרה היא \(3\)). מספר \(1\)-מודולרי לדוגמה הוא \(0.14345\dots\). מספר \(2\)-מודולרי לדוגמה הוא \(0.3241\dots\) וכן הלאה. העיקרון ברור. עכשיו, אם לכל \(n\), בשורה ה-\(n\)-ית יהיה מספר \(n\)-מודולרי, זה יסיים את ההוכחה של הטרחן: המספר שיווצר באלכסון אכן יהיה רציונלי, וזו תהיה הוכחה לכך שהרציונליים אינם בני מניה (כי אנו מניחים שכל הרציונליים מהצורה \(0.a_{1}a_{2}a_{3}\dots\) משתתפים במניה).

אז איך הטרחן מבטיח שבשורה ה-\(n\)-ית יהיה מספר \(n\)-מודולרי? פשוט מאוד – כאמור, הוא אומר שנסדר את הטבלה מחדש. כאן העניינים מסתבכים. בסעיף 2-9 במאמר שלו, הוא מציע את ה"פרמוטציה" הבאה של הטבלה, שמוגדרת באופן אלגוריתמי כך: מתחילים מטבלת קנטור כלשהי עבור הרציונליים. כעת, עבור השורה ה-\(i\) (החל מ-\(i=1\) וכן הלאה), אם המספר בשורה \(i\) הוא \(i\)-מודולרי עוזבים אותו בשקט. אחרת, מחליפים אותו עם אחת מהשורות שנמצאות אחרי \(i\), שהיא כן \(i\) מודולרית. בפסקה הבאה, 2-10, הטרחן טוען ש"זה מיידי להוכיח שכל שורה של הטבלה הופכת להיות מודולרית כתוצאה מהפרמוטציה", ואני מסכים איתו לחלוטין: התוצר של האלגוריתם הוא טבלה שבה לכל \(n\), השורה ה-\(n\) היא \(n\)-מודולרית. אם כן, איפה נפלה הטעות? זה תרגיל חביב (אם כי לא קשה במיוחד) ואני ממליץ לכם לחשוב עליו קצת בעצמכם לפני שניגש לעניין.

ובכן, אינטואיציה אחת היא שאולי לא תמיד ניתן להחליף שורה שאינה \(i\) מודולרית בשורה שהיא כן \(i\) מודולרית מתוך המשך הטבלה. אלא שהטרחן טרח לדון במפורש בנקודה הזו ולהוכיח שזה אפשרי. בקצרה, הנימוק הוא פשוט: לכל \(i\), יש אינסוף שורות שהן \(i\) מודולריות (כי כל מה שחשוב הוא הספרה במקום ה-\(i\); כל שאר אינסוף הספרות יכולות להיות מה שבא לנו) אבל בכל שלב של סידור הטבלה, סידרנו רק מספר סופי של שורות – לכן יש אינסוף שורות \(i\) מודולריות שעוד לא הגענו אליהן ולכן ניתן לבחור אחת מהן. כמובן, הטרחן מציג זאת בצורה יותר ארוכה ומסובכת, ובפרט מנסה להעניק לה גוון פילוסופי היסטרי משהו: כשהוא מדבר על כך שעבור שורה בטבלה, יש אינסוף שורות שבאות אחריה אבל רק מספר סופי שבאות לפניה, הוא אומר ש-

We will see now a conflictive consequence of this immense and suspicious asymmetry.

קצת מוזר, בהתחשב בכך שאותה א-סימטריה חשודה קיימת גם במספרים הטבעיים (לכל מספר טבעי יש מספר סופי של מספרים טבעיים שבאים לפניו, אבל מספר אינסופי של טבעיים שבאים אחריו).

ובכן, מהי הבעיה עם הבניה? כבר רמזתי על כך קודם: הטרחן טוען שהוא הגדיר "פרמוטציה", אבל התוצר של הבניה שלו איננו פרמוטציה, אלא טבלה "מסוננת", שחסרות בה שורות. דרך פשוטה לראות זאת היא כך: מצד אחד, הטרחן טוען שאחרי שהבניה שלו מסתיימת, כל שורה בטבלה היא \(n\)-מודולרית. אלא שקל מאוד לבנות מספרים שאינם \(n\)-מודולריים, לאף \(n\)! למשל, \(0.0123\dots\) הוא כזה (הספרה במקום מס' 1 היא 0; הספרה במקום מס' 2 היא 1 וכן הלאה). אם כן, לאן המספרים הללו "הולכים" כשמסדרים מחדש את הטבלה? הם פשוט נעלמים ויוצאים ממנה.

זו דוגמה למוזרויות שמתרחשות כשמתעסקים עם האינסוף – דוגמה שלא שונה בהרבה מסיפור המלון של הילברט. לשם המחשה, הנה ה"פרמוטציה" הבאה של המספרים הטבעיים. נתחיל עם קבוצת המספרים הטבעיים כשהיא מעורבבת. כעת נעבור על המספרים בקבוצה לפי סדר הערבוב. אם המספר במקום ה-\(i\) איננו 1, נותיר אותו במקום; אם הוא כן 1, נחליף אותו עם המספר הקטן ביותר מבין כל המספרים שטרם סידרנו. זו בניה שאינה שונה מהותית ממה שהטרחן הציע, וברור שבסיומה 1 לא יהיה בשום מקום בסידור, כי בכל פעם שבה נתקלנו ב-1, העברנו אותו "עוד קצת קדימה". איפה הכשל? השימוש במונח "בסיומה של הבניה" מטעה, כי הבניה נמשכת עד אין קץ, ולכן אם מספר כל הזמן מוזז "קדימה" במהלך הבניה, הוא אף פעם לא יהיה חלק מהפלט של הבניה.

צריך להבהיר שהעובדה שהבניה היא אינסופית לא מונעת מאיתנו לדבר על האובייקט שהוא התוצר ה"סופי" של הבניה, אפילו מבחינה חישובית: בכל פעם שבה אנו רוצים לדעת מה קורה בשורה ה-\(i\) של התוצר הסופי, אנחנו פשוט "מריצים את הבניה" מספיק זמן עד שהיא מסיימת את העבודה על השורה ה-\(i\), ואז מובטח לנו שהשורה ה-\(i\) הזו לעולם לא תשתנה שוב – ומכאן שאנחנו יכולים לקרוא את השורה ה-\(i\) מתוך הטבלה החצי-מוגמרת, וזה יהיה זהה לחלוטין לסיטואציה שבה אנו קוראים את השורה ה-\(i\) מתוך התוצר המוגמר של הבניה. זו דוגמה אחת מני רבות לאובייקטים שנוצרים על ידי תהליך אינסופי, ומוגדרים בתור "גבול" של התהליך הזה – הדוגמאות המפורסמות ביותר הן של פרקטלים, דוגמת קבוצת קנטור, ועקומת פאנו, הראויים לפוסטים בפני עצמם. מה שחשוב לי להדגיש כאן הוא שמדובר בבניה מתמטית לגיטימית – "מותר" לטרחן להגדיר את התהליך שהוא הגדיר ולדבר על התוצרים שלו; הוא פשוט לא יכול להעמיד פנים שהתוצר הוא פרמוטציה. הוא לא, בלי קשר לקנטור או מספרים אי רציונליים או לכל דבר אחר – מספיקה ההבחנה שכל מספר שאיננו \(n\)-מודולרי לאף \(n\) לא מופיע בתוצר, למרות שהוא יכל להופיע במקור. לכן אין זה מפתיע שאחרי ה"סידור מחדש" הזה של הטבלה יהיו מספרים רציונליים שאינם מופיעים בה. למעשה, הטענה של הטרחן הופכת לטריוויאלית – ה-\(0.b_{1}b_{2}b_{3}\dots\) ("היפוך" האלכסון) שנבנה מהטבלה אחרי הסידור מחדש שלה הוא מספר שבבירור איננו \(n\) מודולרי לאף \(n\) (למה?) ולכן מן הסתם הוא לא יופיע בטבלה, שהרי "סיננו" מהטבלה את כל המספרים שאינם \(n\)-מודולריים לאף \(n\)!

ועכשיו אהיה טיפה חריף ואצהיר במפורש שלדעתי, מי שאיננו מסוגל להבין את הטיעון שכתבתי לעיל ואיננו מסוגל לחשוב עליו בעצמו, אסור שיעבוד בהוראת מתמטיקה או יעסוק בה בשום צורה שהיא. לכן אני לא מהסס לקרוא לטרחן "טרחן". ואתן ציטוט נוסף של הטרחן כדי להבהיר עד כמה המאמר הזה מחוצף בעיני, מפסקה 2-5 שלו – הציטוט הזה הוא "המסקנה" שהטרחן מנסה לגזור מהמאמר שלו:

Cantor's diagonal argument and all its formal consequences should be suspended until it is proved the impossibility of defining a rational antidiagonal in all possible reorderings of T's rows.

לא פחות – יש "להשעות" את האלכסון של קנטור עד שיוכיחו לטרחן שאי אפשר לעשות את מה שהוא מנסה לעשות. בדומה יש להשעות את הטענה ש-\(0.999\dots=1\) ואת כל המסקנות ממנה עד שיוכח שאין דרך לחשב את הגבול שמגדיר את \(0.999\dots\) באופן שבו לא יצא 1, ויש להשעות את המשפט היסודי של האריתמטיקה עד שלא יוכח שאין דרך לכתוב מספר כשתי מכפלות שונות מהותית של ראשוניים, וכו' וכו'. יומרנות כזו היא סימן היכר מובהק של טרחנים, שמנסים לבטל בהבל פיהם את כל המתמטיקה כי משהו לא מסתדר להם בראש.

טוב, סיימנו עם הטרחן. אבל למה GMBM כל כך הרגיז אותי? בגלל הצורה שבה הוא עונה לטרחן. גם הוא טוען, כמובן, שהבעיה היא עם הסידור-מחדש של הטבלה. אבל אז הוא מפרט:

Why not? Because the construction of the re-ordering is invalid… The re-ordering is, itself, self-contradictory.

Here's the problem: you're constructing a chosen rational number. That is, you know what rational number you're re-ordering the rows to create. Since it's a rational, it's got to be in the table. And since you know what rational it is, you've got to know what row in the table it's going to be. So go look at that row.

By the definition of the diagonalization, the value of the diagonal must be different from the value of any of the rows by at least one digit. So the rational number that you're forming must be different from itself by at least one digit.

Bzzt. No good. The re-ordered rational diagonalization is self-contradictory. In fact, it's a classic self-referential foulup.

אין כאן שום התייחסות לכשל שהצבעתי עליו. שום דיבור על כך שהפרמוטציה אינה פרמוטציה. שום הסבר לגבי זה שהסידור מחדש זורק שורות לפח. מה שהוא טוען, בפשטות, הוא שהבניה לא עובדת, בגלל… שהיא סותרת את קנטור.

אבל זה בדיוק מה שהטרחן ניסה להוכיח!

מה ש-GMBM אומר הוא שבהינתן המספר הרציונלי של האלכסון (שוב – לא המספר שעל האלכסון בפועל אלא מה שמתקבל ממנו אחרי שמשנים את הספרות בהתאם) יופיע גם בטבלה איפה שהוא; ולכן אם נלך לשורה המתאימה לו בטבלה, נגלה שיש סתירה בשורה הזו (אם זו השורה ה-\(n\)-ית, הסתירה תהיה בספרה ה-\(n\), כרגיל). כל זה טוב ויפה ובדיוק מה שקנטור אומר, אבל זה לא מתייחס לטיעון של הטרחן. אם הבניה של הטרחן הייתה חוקית מכל מבחינה אחרת, אז בשלב הזה היינו מבינים שיש בעיה עמוקה, יסודית, פרדוקסלית בתורת הקבוצות ובטיעון של קנטור. מה ש-GMBM עושה שקול למישהו שמנפנף את הפרדוקס של ראסל בכך ש"הקבוצה שבנית לא הגיונית אז אתה טועה". אי אפשר לפסול כך טיעונים. אפשר להגיד שהם מאוד לא סבירים אם הם סותרים הוכחה פשוטה כמו של קנטור; ואפשר להגיד שאנחנו עצלנים מכדי לטרוח ולחפור במאמר ולחפש את הטעות שבו, כי אין לנו שום סיבה עקרונית להניח שהוא נכון; אבל אי אפשר להגיד שהמאמר לא נכון על בסיס הסתירה הזו – צריך להתייחס לתוכן הדברים.

אני רוצה להבהיר את הנקודה הזו – אף אחד לא חייב לקרוא את הטרחנים. לרוב זו מלאכה סיזיפית וחסרת טעם. בפרט, אם הטרחן כותב מאמר של מאות עמודים, או שהוא משתמש בטרמינולוגיה מקושקשת ולא ברורה, אין סיבה להתאמץ, ואפשר פשוט להתעלם – אבל אם כבר בוחרים לתקוף ולא להתעלם, צריך להתייחס לגוף הטענות של הטרחן (ובמקרה הנוכחי זה קל למדי – המאמר קצר, כתוב בצורה פחות או יותר בהירה, והשגיאה המרכזית בו זועקת לשמיים).

כל זה לא היה מרגיז כל כך, אלמלא עיקר ההתקפה של GMBM על טרחני-קנטור הייתה שהם לא טורחים להתייחס לגופה של ההוכחה של קנטור:

You see, 99 times out of 100, Cantor cranks claim to have some construction that generates a perfect one-to-one mapping between the natural numbers and the reals, and that therefore, Cantor must have been wrong. But they never address Cantors proof. Cantors proof shows how, given any purported mapping from the natural numbers to the real, you can construct at example of a real number which isn't in the map. By ignoring that, the cranks' arguments fail: Cantor's method still generates a counterexample to their mappings. You can't defeat Cantor's proof without actually addressing it.

ולכן השאלה היא – אם לא ניתן להביס את קנטור מבלי להתייחס אליו, האם ניתן להביס טרחנים מבלי להתייחס אליהם? זה מצביע אולי על הבעיה הגדולה ביותר עם טרחנים – הם שוברים את כללי המשחק. אם אני, בתור מישהו שמסכים שקנטור צודק, הייתי מוכיח משפט שסותר את קנטור, הדבר היה מרים אצלי גבה והייתי מחפש את השגיאה אצלי. לעומת זאת, טרחנים מנסים מראש להראות שהשגיאה היא אצל קנטור, ולכן לא ניתן לפטור אותם ב"אבל קנטור צודק". מכיוון שלרוב לפשפש בהוכחה שלהם ולמצוא את השגיאה/ההגדרה הלא נכונה זה עניין מייגע ומתיש, הדרך הנכונה לטפל בטרחנים היא פשוט להתעלם. כל זה תקף כמובן למתמטיקאים "רגילים" – מי שכותב בלוג מתמטי וכולל בו פוסט על טרחן, אבל לא טורח לקרוא את הטרחן, מתקרב בצורה מסוכנת לאיזור הטרחנות בעצמו.

מה קורה כשמחלקים שרלטן באפס? כשזה פומבי זה נהיה מביך

דיברתי כאן בעבר על מורה למתמטיקה ש"פתר את בעית החלוקה באפס" (על ידי כך שבמקום להגיד "אפס חלקי אפס אינו מוגדר" הוא אמר "אפס חלקי אפס הוא כלומיתי"). אותו ברנש גם הקים לעצמו חברה וגייס משקיעים, עם מצגת מפוצצת על היכולות הכבירות שחלוקה באפס נותנות לו.

ובכן, עושה רושם שמדובר במגיפה מדבקת. האתר הבא מעלה את ניצול החלוקה באפס לפתרון כל בעיות העולם לכדי אמנות של ממש. אני מביא את האתר הזה בעיקר מכיוון שהוא כל כך מופרך, עד שהוא ממש משעשע. אני סבור שכל בר דעת שמציץ בו ולו לרגע יבין שמדובר ככל הנראה לא באדם שמשוכנע בצדקת דרכו (כמו טרחן מתמטי סטנדרטי) אלא בתרמית, שמטרתה לעבוד על משקיעים מסכנים שלא מבינים מאומה במתמטיקה להשקיע בחקר הסינגולריקה. מצד אחד, זה נשמע מפגר לחלוטין שאנשים ישקיעו בהבל המוחלט הזה; ומצד שני, מיידוף.

אני חושב שכבר קריאת הפסקאות הראשונות שבאתר מספיקה לכל בר דעת כדי להבין שמדובר ברמאים גמורים:

Such are the accomplishments achieved by the men and women of Singularics. Standing on the shoulders of giants such as Albert Einstein and Bernhard Riemann, we have reached up through nature's veil and seen what lies hidden there more clearly than anyone else before us. Our discoveries have yielded a new mathematical framework, one that provides a profound understanding of nature's basic mechanics. We have discovered The Science of Singularics™, the study of the singularity.

We have already found a variety of important applications of Singularic Technology™, but perhaps the most immediately useful are Neutronic Encryption™, a new theoretically unbreakable public key encryption algorithm and Singularic Power™, a new form of clean power generation.

 

נניח לרגע שאנחנו מוכנים להתעלם מכל הפומפוזיות הזו על הרמת הצעיף של הטבע וכו' – מה בקשקוש ההזוי הזה מספיק כדי לשכנע אדם עם ידע בסיסי בתחומים שעליהם הוא מדבר כי הכל הבל מוחלט? זו חידה חביבה למדי, ואני מציע לכם לנסות ולחשוב עליה קצת.

התשובה פשוטה: הביטוי "theoretically unbreakable public key encryption algorithm", שאינו שונה מהותית מ"ראשוני שמתחלק ב-7 ו-13" או "מעגל שניתן לרבע באמצעות סרגל ומחוגה". אנסה להסביר.

ראשית, חשוב להבהיר שכבר כעת קיימת שיטת הצפנה שהיא בלתי ניתנת לפיצוח מבחינה תיאורטית – שיטה שנקראת "פנקס חד פעמי", והומצאה במקור בידי גילברט ורנם. הצופן הוא פשוט בצורה בלתי רגילה – לכל ביט של ההודעה, מבצעים פעולת XOR שלו עם ביט של המפתח – אך לפשטות יש מחיר בלתי נמנע – המפתח שבו משתמשים הוא חד פעמי וההצפנה היא סימטרית (כלומר, גם המפענח חייב לדעת מראש את המפתח). ההוכחה המתמטית לכך שההצפנה היא מושלמת (וחשוב יותר – ההגדרה הפורמלית והמדוייקת של "הצפנה מושלמת" שכזו) ניתנו בידי קלוד שנון, ממציא תורת האינפורמציה. אם כן, הצפנה מושלמת זה לא עניין חדש, והעובדה שלמרות קיומה עדיין משתמשים בצפנים אחרים, אפילו להצפנה סימטרית, מעידה על כך שהצפנה מושלמת, מעצם טבעה, היא בעייתית ולכן "מושלמות" היא לא בהכרח התכונה שאנו רוצים להדגיש כאשר אנו מתארים את שיטת ההצפנה החדשה והמגניבה שלנו.

אבל כל זה מילא – זה תקף רק עבור הצפנות סימטריות. מה שהאתר המגוחך הזה טוען הוא שהם המציאו הצפנה פומבית שהיא בלתי ניתנת לפיצוח. זה פשוט שגוי מהותית – כל קורס תיאורטי בקריפטוגרפיה מבהיר בדקות הראשונות של הדיון על הצפנה פומבית מדוע זה פשוט בלתי אפשרי, תיאורטית, שתהיה קיימת הצפנה פומבית מושלמת.

תזכורת קטנה (לתזכורת גדולה ראו את הפוסט הזה) – בהצפנה פומבית, להבדיל מהצפנה סימטרית, לכל משתתף יש שני סוגי מפתחות – המפתח הפומבי שלו (הידוע לכל אחד בעולם), והמפתח הפרטי (הידוע רק לבוב עצמו). אם אליס רוצה להצפין הודעה כך שרק בוב יוכל לקרוא אותה, היא מצפינה את ההודעה עם המפתח הפומבי של בוב, ואז שולחת אליו. מרגע שהוצפנה ההודעה אף אחד שאינו בוב – כולל אליס – אינו יכול לפתוח את ההצפנה. רק בוב, באמצעות המפתח הפרטי שלו, מסוגל לעשות כן.

תזכורת נוספת – פונקציית ההצפנה חייבת להיות חד-חד ערכית. כלומר, לא ייתכן שנצפין שתי הודעות שונות ונקבל את אותה תוצאה. הסיבה פשוטה – אם ייתכן ששתי הודעות שונות מתמפות לאותה הודעה מוצפנת אז בוב, כשיבוא לפענח את ההודעה המוצפנת, לא יוכל לדעת איזה משני הפיענוחים הוא הנכון. תכונה זו היא התכונה הקריטית בכל העניין – נסו לחשוב מדוע כעת ברור שהצפנה פומבית מושלמת אינה אפשרית.

הסיבה היא כזו. נניח שאליס הצפינה הודעה עם המפתח הפומבי של בוב ושלחה אליו, וההודעה טורפדה בידי אוסקר הרשע. אוסקר רוצה לדעת מה היה כתוב בהודעה המקורית, אבל כל מה שיש לו ביד הוא הג'יבריש שאליס שלחה. האם הכל אבוד? בוודאי שלא. אוסקר יודע את המפתח הפומבי של בוב. אם כן, הוא יכול לעבור סדרתית על כל ההודעות האפשריות (כלומר, כל הרצפים האפשריים של תווים) ולהצפין כל אחת מהן עד שתתקבל ההודעה הג'יברישית שיש בידו. ברגע שההודעה הזו התקבלה, אוסקר יודע בודאות מוחלטת שההודעה שהצפין וקיבל את הג'יבריש היא ההודעה שאליס שלחה – שהרי אין שתי הודעות שונות שמתמפות לאותו הג'יבריש.

מה אפשר לעשות נגד ההתקפה הזו של אוסקר? כלום! אין שום דרך למנוע אותה. עם זאת, יש שתי דרכים להקשות עליו – ראשית, אפשר לשלוח הודעות שהן יחסית גדולות, כך שקשה מאוד לעבור על כולן. זה אכן מספיק בפועל לצרכים רבים. עם זאת, לפעמים ההודעות שאנו שולחים, אפילו אם הן גדולות, עשויות להיות מאוד "צפויות" מבחינת המבנה שלהן (חשבו למשל על טופס שאתם ממלאים בבנק). אוסקר יכול לוותר על ניחוש כל ההודעות האפשריות ולהתמקד רק בכמות המעטה יחסית של הודעות "צפויות" – דוגמה קיצונית היא הסיטואציה שבה יש רק שתי הודעות שונות אפשריות – "בוב, לאחר שקילת הצעתך בכובד ראש, החלטתי לסרב" אל מול "בוב, לאחר שקילת הצעתך בכובד ראש, החלטתי להסכים". לאוסקר לא ממש לוקח זמן להצפין את שתי אלו. אם כן, מה עושים?

פתרון חביב אחד הוא הרעיון של הצפנה פומבית הסתברותית – בכל פעם שבה מצפינים הודעה, יתבצע גם חישוב הסתברותי כלשהו שיקבע מה יהיה הג'יבריש הסופי. כמובן שעדיין אסור ששתי הודעות יתמפו לאותו ג'יבריש ולא משנה באיזו הסתברות; אבל כעת לכל הודעה יש הרבה מאוד ג'יברישים שהיא עשויה להתמפות אליהם, תלוי בתוצאות ההגרלות שהופעלו במהלך ההצפנה. זה מקשה על אוסקר מאוד את החיים – במקום להצפין פעם אחת, הוא יצטרך להצפין את אותה הודעה שוב ושוב ושוב, בהתאם לכל התוצאות האפשריות של ההגרלה. זה אפשרי בתיאוריה, אבל בפועל זה ייקח לו זמן רב מדי. אגב, שתיים משיטות ההצפנה הפומבית ההסתברותית העיקריות הומצאו בידי שפי גולדווסר הישראלית-אמריקאית.

אם כן, נסכם – אין דרך למנוע מאוסקר לפרוץ את הצופן הפומבי. אפשר רק לעכב אותו – ולמשך המון זמן, זיליארדי שנים – אבל הצופן אינו "unbreakable" ולעולם לא יהיה. אם מישהו טוען שהוא יכול להוכיח תיאורטית שצופן פומבי הוא בלתי שביר, זה מעיד רק על חוסר הבנה בסיסי שלו את התיאוריה.

וקצת טרחנות אולד-סקול לסיום. כשעוברים באתר המזעזע ההוא לחלק ה"מתמטי", נתקלים שם בהשתפכות הבאה:

Today, there are areas of mathematics widely considered to be "undefined", for example where 1 is divided by 0. Just as Sir Isaac Newton once invented Calculus to accomplish the analysis of motion he needed to pursue his interests, so have we at Singularics developed a new branch of mathematics called Neutronics. This contribution to science represent a significant advance in human understanding and makes possible for the first time a method of analysis for the "undefined" point at the singularity.

Our Founder and CTO, Jeff Cook, has also used Neutronics to settle the long outstanding question of Riemann's Hypothesis and has shown conclusively that all non trivial zeros of the zeta function do indeed have Real part one half, ie. the hypothesis has been proven to be true. Click here to download a copy of Jeff Cook's purported proof of the Riemann Hypothesis, now in pre-print.

כמובן. אף טרחן שמכבד את עצמו לא יטען שלא הוכיח את השערת רימן, או דבר מה שקול. המאמר שאליו הוא מקשר הוא בן 63 עמודים – שיהיה בהצלחה למי שיטרח לקרוא אותו.

רוצים לחלק באפס 2 – נקמתו של כלומיתי

בפוסט הקודם דיברתי קצת על למה לא נהוג במתמטיקה להגדיר חלוקה באפס, מתי כן מגדירים חלוקה באפס (למשל, מתי נוח לנו לסמן את החלוקה של אחד באפס כ"אינסוף" ומה המשמעות של זה) ולמה 0/0 היה ונותר ביטוי חסר טעם להגדרה ולכן בתוכנות מחשב מתמטיות דוגמת Matlab נהוג שתוצאת הפעולה 0/0 היא קבוע בשם NaN, שמשמעותו "לא מספר" (Not a Number). קבוע בעל התכונה הסבירה שכל פעולה מתמטית שנעשה עליו לא תשנה אותו (1 ועוד "לא מספר" יהיה "לא מספר", למשל). המוטיבציה לדיון הזה הייתה הסיפור (שכעת הוא כמעט בן שנתיים) על מורה למתמטיקה שלימד את תלמידיו תורה מתמטית חדשה שבה חלוקה באפס היא "אפשרית" ובכך פתר "בעיה בת 1,200 שנים".

הזכרתי כאן בעבר את מושג ה"טרחן מתמטי כפייתי". הגדרתי אותו כ"אדם (לרוב ללא רקע פורמלי במתמטיקה, אך לא בהכרח) שעוסק במתמטיקה בצורה שהיא חסרת תועלת לחלוטין, ולרוב בהתלהבות שעומדת בפרופורציה הפוכה לתועלת שלו." וההגדרה (פרט להערת הסוגריים) מתאימה מאוד למקרה הזה. כמו כן, קישרתי כאן בעבר למאמר של יהודה בלו שעסק בחיפוש "שיטה להוצאת שורש ריבועי" (למרות שקיימות כבר שיטות מצויינות רבות לכך) – אני חושב שיש למקרה ההוא כמה נקודות דמיון בולטות למקרה הזה.

ראשית, הבעיה שיש לתקן. יהודה בלו אמר על בעיית השורש "מסיבה לא ברורה, לא מחפשים המתמטיקאים שיטה למצוא שורש ריבועי או שורש כלשהו. האם יש בידם הוכחה מתמטית שלא מתאפשרת שיטה שכזו? עדיין לא." ומה ג'יימס אנדרסון אומר? ה-BBC מביאים את הציטוט הבא:

"Imagine you're landing on an aeroplane and the automatic pilot's working," he suggests. "If it divides by zero and the computer stops working – you're in big trouble. If your heart pacemaker divides by zero, you're dead."

מילא, תגידו, העיתונות מוציאה מהקשרה. לכן עדיף ללכת ישר למקור – מצגת לא טכנית שהכין אנדרסון למטרות פרסום עצמי. שם הוא מגיע לגבהים חדשים: ראשית, הוא מתחיל ב:

"This presentation is dedicated to the USS Yorktown which was stranded for 2 hours 40 minutes when a division-by-zero error crashed its entire network of computers, causing its engines to stop."

הסיפור המשונה הזו הוא כמובן נכון. ה-USS Yorktown אכן סבלה בשנת 1997 מתקלת מחשב אידיוטית שכזו – אחד מאנשי הצוות הזין 0 לתוך תא במסד הנתונים של הספינה, תא שכנראה לא אמור להכיל אפס, ובכך הוא גרם לתקלה של חלוקה באפס. כשתוכנית מחשב נתקלת בחלוקה באפס, היא לא מושכת בכתפיים וממשיכה הלאה – היא מכריזה על תקלה. אם אף אחד לא מטפל בתקלה (ברמת התוכנית עצמה), התוכנית מפסיקה לרוץ, וזה בדיוק מה שקרה בספינה ההיא. כשזה קורה בתוכנות שאמורות לרוץ כל הזמן ולוקח זמן רב להפעיל אותן מחדש, זו בעיה, וכך הספינה הייתה תקועה במשך כמעט שלוש שעות בלי שהתוכנה המרכזית שלה רצה. הבעיה היא שזו בכלל לא דוגמה לבעייתיות של חלוקה באפס – כפי שאמרתי בפוסט הקודם, גם אם החלוקה באפס הייתה עוברת בשלום, שום דבר לא מבטיח שהתוצאה לא הייתה גורמת לבעיות בשלב מאוחר יותר; עדיף שהספינה תיתקע לשלוש שעות מאשר שתיתקע בקרחון בגלל חישוב כיוון לא נכון, למשל.

הבעייתיות שכן מודגמת בסיפור הזה באופן יפה מאוד היא הכשל של מהנדסי התוכנה של הספינה, שלא הקפידו על אספקט חשוב של הנדסת תוכנה – עמידות (Robustness) – היכולת של המערכת לעבוד גם כשמשליכים עליה קלטים שהיא לא אמורה להתמודד איתם. כל תלמיד תכנות נתקל בזה כבר בתוכנות הראשונות שלו – נניח, הוא כותב תוכנה שמקבלת מהמשתמש שני מספרים וצריך לחבר אותם ולהציג את הסכום; אבל מה אם המשתמש מכניס "כגדכ" ו"כדגד" במקום מספרים? כאן צריך להדפיס הודעת שגיאה מתאימה ולצאת, אבל לרוב לא מקפידים על זה כשרק מתחילים ללמד תכנות – אומרים לתלמיד "תניח שהקלט תקין" וזהו. כנראה שחלק מאותם תלמידים, גם כשהם גדלים, ממשיכים להניח את אותה הנחה, או שאינם מצליחים לזהות סיטואציות "מסוכנות" שבהן קלט שגוי יגרום לתקלות. בתוכנה אמיתית, בכל פעם שבה מבצעים פעולת חלוקה, חייבים לבדוק האם בוצעה חלוקה באפס (אפשר תמיד לבדוק לפני, על ידי בחינת המשתנה שבו מחלקים; אבל אפשר גם אחרי, אם התוכנה תומכת במנגנון החזרת שגיאות, או נכתבת בשפה שבה יש מנגנון אוטומטי שכזה – וכך זה תמיד בימינו, אני מקווה) ולטפל בכך בהתאם אם זה קרה. ב-USS Yorktown פשוט לא עשו זאת. כישלון של הנדסת תוכנה, לא של העובדה שאי אפשר לחלק באפס.

לאנדרסון הדוגמאות הללו לא מספיקות. הוא חייב לתקוף באופן ישיר את כל המתמטיקה שהייתה לפניו כדי להסביר מה הוא תורם, בעצם. לכן הוא כותב שקף בעל הכותרת המפוצצת "מה הבעיה עם האריתמטיקה?" ומפרט את הבעיות, עם עוד הערה בסוגריים לכל אחת מהן: אי אפשר למצוא את הטנגנס של זווית ישרה (אינסוף), את הלוגריתם של 0 (מינוס אינסוף), אי אפשר למצוא את אפס בחזקת אפס (האות היוונית \(\Phi\)), ואי אפשר להסביר "איך מחשבים עובדים" (NaN). יותר חמור – האריתמטיקה המתמטית לא מתארת את האריתמטיקה שבה אנשים משתמשים בחיי היום יום שלהם בתור מתכנתים או משתמשים במחשבים, והיא "Sociologically invalid" (הצבע האדום במקור).

אני לא חושב שאני מבין את משמעות הטענה האחרונה כדי שאוכל להתייחס אליה (אני מנחש שהאדום, מטרתו לשמש כמו באותו נאום מפורסם שבו נכתב בהערת שוליים "נקודה חלשה. להרים את הקול!"). לשאר הטענות קל להתייחס: אפשר להגדיר את הטנגנס של זווית ישרה כאינסוף ואת הלוגריתם של 0 כמינוס אינסוף; פשוט אי אפשר יהיה לעבוד איתם אחר כך באופן אריתמטי, כמו שאי אפשר לעבוד עם אחד חלקי אפס. במקום שהאריתמטיקה תסתבך בתחום הזה היא מותירה אותו בלתי מוגדר, ומאפשרת לחשבון האינפיניטסימלי לנסח טענות מדוייקות ומועילות יותר, דוגמת "כשהזווית שואפת לפאי חלקי 2, הטנגנס שלה שואף לאינסוף". מטלאב ודומיו דווקא כן מחזירים אינסוף ומינוס אינסוף במקרים המדוברים, לטובת מי שהמידע הזה עוזר להם. אגב, חדי העין מביניכם שצלחו את הפוסט הקודם ובקיאים בקצת מתמטיקה ודאי שמו לב שטנגנס הזווית הישרה הוא שם אחר לבעיית ה"ישר בעל שיפוע אינסופי" שדיברתי עליה.

בכל הנוגע לאפס בחזקת אפס, מבחינה פורמלית טהורה אכן הביטוי אינו מוגדר. הסיבה לכך היא כללי החזקות: לכאורה מתקיים \(0^0=0^1\cdot 0^{-1}\) והביטוי הימני מבין השניים כלל אינו מוגדר. עם זאת, לפעמים נוח להגדיר \(0^0=1\). בפרט, בנוסחת הבינום של ניוטון: \((a+b)^n=\sum_{k=0}^n{n\choose k}a^kb^{n-k}\) הכרחי לעבוד עם ההגדרה הזו כדי שהנוסחה תעבוד במקרה שהאחד מהאיברים בסוגריים הוא אפס. לבחירה השרירותית לכאורה הזו יש הגיון עמוק מעט יותר – באופן כללי, אפשר לחשוב על \(a^b\) כאשר \(a,b\) הם מספרים טבעיים בתור מספר הפונקציות מקבוצה בעלת \(b\) איברים לקבוצה בעלת \(a\) איברים. כאשר יש לנו שתי קבוצות ריקות, קיימת בינן פונקציה אחת: "הפונקציה הריקה" (לא אכנס לזה כרגע, אבל מבחינה פורמלית זו פונקציה תקינה לחלוטין). אם לעומת זאת \(b>0\), מקבלים ש-\(0^b=0\) על פי אותה הגדרה בדיוק, כי לא קיימת פונקציה מקבוצה בעלת \(b>0\) איברים אל הקבוצה הריקה (לכל איבר בקבוצת המקור חייבים להתאים איבר מקבוצת היעד – אם אין איברים שאפשר להתאים אליהם, אכלנו אותה).

הטענה שהאריתמטיקה לא מסבירה איך מחשבים עובדים בגלל NaN לא הכי ברורה לי. הרי בשורה התחתונה, את NaN אפשר לקודד באמצעות מספרים וזה בדיוק מה שקורה במחשבים, וכל מה שמחשב עושה בבסיסו (ביחידת העיבוד המרכזית שלו) הוא פעולות אריתמטיות. הטענה האחרונה של אנדרסון שעוד הצלחתי להבין, על כך שהאריתמטיקה המתמטית אינה דומה לאריתמטיקת חיי היום יום, נראית לי פשוט שגויה, על פי ההיכרות שלי עם האריתמטיקה  – ויתר על כן, האריתמטיקה החילופית שהוא מציע בהמשך לא דומה אף היא לכלום.

ובכן, קשקוש בלבוש עד כה. אנדרסון פוסל את האריתמטיקה עד אליו בכמה נפנופי ידיים בלתי מחייבים, שאני חושב שמצביעים על ניתוק גדול למדי מהמציאות (המתמטית) במקרה הטוב, ועל שרלטנות מחושבת היטב במקרה הרע. זה מזכיר לי מאוד את טענתו של יהודה בלו שהמתמטיקאים מתעלמים משום מה מבעיית הוצאת השורש.

התוכן האמיתי מגיע בשקף הבא, שכותרתו היא "מה הבעיה עם מחשבים?" ובו הוא מציג שתי נקודות מהותיות: ראשית, NaN ו-Inf ומינוס Inf, החבר'ה שמייצגים את "בלתי מוגדר" ואת אינסוף ומינוס אינסוף בתוכנות המתמטיקה הסטנדרטיות, הם "לא מספרים" כהגדרתו של אנדרסון. שנית (וזו, לדעתי, הנקודה היחידה שבאמת שווה התייחסות בכל דבריו של אנדרסון), NaN מקיים את התכונה שאינו שווה לעצמו. כלומר, אם תבצעו שני חישובים, אפילו זהים, ותכניסו את התוצאה לתוך משתנים שונים, ושני החישובים יחזירו NaN, ותבצעו השוואה בין המשתנים – תקבלו תשובה שלילית. אנדרסון טוען ש"שוויון פירושו ש-x שווה ל-x לכל x, ולכן אריתמטיקה ממוחשבת היא invalid" (שוב, האדום המביך במקור).

לנקודת "הם לא מספרים" שהעלה אנדרסון אתייחס בקרוב. בינתיים אתייחס לנקודה המהותית – למה NaN לא זהה אפילו לעצמו? לכאורה זה באמת נראה מטופש. אלא שצריך לזכור את המוטביציה לקיום NaN – הוא בא למדל ביטויים כמו 0/0, שהם חסרי משמעות באופן טוטאלי, אפילו בגישת החשבון האינפיניטסימלי, זו שאומרת ש-1/0 ו-2/0 הם זהים במובן מסויים מאוד – הגבול של שתי הפונקציות \(\frac{1}{x},\frac{2}{x}\) הוא זהה כאשר איקס שואף לאפס מימין. כפי שאמרתי בפוסט הקודם, לגבול של שבר שבו גם המונה וגם המכנה שואפים לאפס (או לגבול של מכפלה שבה אחד האיברים שואף לאפס והשני לאינסוף, וכו') יכולים להיות ערכים שונים לגמרי. לכן מבחינה רעיונית זה שגוי להגדיר את NaN כשווה לעצמו, ובכך ליצור זהות כלשהי בין שתי הסיטואציות הללו. מבחינה מעשית זה אולי מעט מסורבל, כי כדי לבדוק האם משתנה מכיל את NaN לא ניתן להשוות אותו ל-NaN; לכן לרוב מוגדרת גם פונקציה בשם isNaN שמבצעת את הבדיקה בשביל המשתמש – ואם אין כזו, הבדיקה x==x ("האם איקס שווה לאיקס?") מאפשרת מייד לזהות האם x הוא NaN או לא – התשובה לה תהיה שלילית אם ורק אם x הוא NaN.

אם כן, מה אנדרסון מציע כדי לפתור את הבעיות הקשות (והלא קיימות) הללו? הוא מרחיב את מערכת המספרים הממשיים למערכת שהוא קורא לה "Transreal" (המצאת שמות מפוצצים לדברים קיימים זו תכונה מאפיינת סטנדרטית של טרחנים כפייתיים – עיינו ב"המספרים הדו חזקתיים" של יהודה בלו). היא מתקבלת מהממשיים על ידי הוספת אינסוף ומינוס אינסוף (עד כאן, הכל בסדר – זה גם מה שיש ב-Matlab וגם בספרי לימוד רבים שעבורם ההרחבה הזו "משתלמת"), ועוד מספר אחד חדש, שמסומן כ-\(\Phi\) ונקרא "Nullity", ובתרגום חופשי לעברית שלי: "כלומיתי". אני קצת מרושע, כי Nullity היא מילה קיימת במתטיקה ובעלת משמעות שונה, ובמשמעות השונה הזו לא היה עולה על דעתי לתרגם אותה כ"כלומיתי", אבל נו טוב. גם לי מותר ליהנות.

אנדרסון לא מפרט את תכונות הכלומיתי שלו במצגת, אבל כן במאמר שגם כן זמין לכל. בואו נקצר עניינים: מדובר ב"מספר" שמוגדר בתור 0/0; שלא ניתן להשוות אותו למספרים אחרים; ושהוא ועוד כל דבר אחר, או כפול כל דבר אחר, שווה לכלומיתי. פרט לכך הוא גם מגדיר הגדרה משונה שם – \(\Phi^{-1}=\Phi\) – "ההופכי של כלומיתי הוא כלומיתי". כיצד זה אפשרי אם כלומיתי כפול כלומיתי הוא כלומיתי, והמשמעות של "הופכי" היא "המספר שכאשר כופלים בו, מקבלים את 1"? תמהני, אבל כמובן שאנדרסון לא מתייחס לזה ולא מגדיר את הסימון הזה של "בחזקת מינוס אחד" בשום מקום. לא קשה לראות שכל ביטוי אריתמטי שיכיל את כלומיתי יהיה שווה לכלומיתי (כי כלומיתי "בולע" כל פעולה חשבונית שמבצעים איתו). אם כן, מה ההבדל בין כלומיתי ו-NaN? יש בדיוק שני הבדלים:

  1. אנדרסון מגדיר את כלומיתי להיות שווה לכלומיתי, להבדיל מ-NaN שמוגדר לא להיות שווה לעצמו (כפי שהזכרתי לעיל).
  2. אנדרסון קורא לכלומיתי "מספר", בעוד ש-NaN, במוצהר (אפילו בשמו!) איננו מספר.

לנקודה מס' 1 התייחסתי כבר וניסיתי להסביר מדוע זה ש-NaN אינו שווה ל-NaN הוא יתרון, לא חיסרון. הגישה הטבעית והנאיבית יותר היא כן להגדיר אותו כשווה לעצמו; האנשים הטובים ב-IEEE שטרחו ועמלו על הסטנדרט של NaN לא סתם בחרו להגדיר אותו כשונה מעצמו. אנדרסון אם כן בא לתקן את מה שאינו מקולקל בכלל, והתיקון שלו הוא מה שמקלקל; אבל "מקלקל" זו הגזמה. אין בעיה מהותית לעבוד עם כלומיתי ששווה לעצמו, כשם שאין בעיה מהותית לעבוד עם NaN שלא שווה לעצמו – המתכנת פשוט צריך להיות מודע לכך שהשוויון יעבוד/לא יעבוד, ולכתוב את הקוד שלו בהתאם.

הנקודה השנייה היא העלובה מכל. אנדרסון, לרוע מזלו, אפילו אינו טרחן כפייתי מעניין; הוא בסך הכל נותן שם חדש לדברים קיימים וחושב שבכך הוא מחולל מהפכה מחשבתית. אז הוא קורא לכלומיתי שלו "מספר" וחושב שבכך נפתרה הבעיה של "0/0 אינו מספר" – אבל מה טיבו של ה"מספר" הזה? באיזה מובן הוא שייך למערכת המספרים? האם ניתן להשוות אותו עם מספרים אחרים? לא. האם פעולה חשבונית כלשהי איתו מסוגלת לתת תוצאה בעלת משמעות? לא (רק "כלומיתי"). אם כן, באיזה מובן הכלומיתי הוא מספר בעוד ש-NaN איננו? במובן אחד בלבד – המובן ההצהרתי. טרחנים כפייתיים חזקים מאוד בתחום ההצהרתי.

לקראת סוף המצגת שלו אנדרסון מגיע לרמה חדשה של עליבות: הוא אומר ש"ב-1,200 השנים האחרונות אף אחד לא הצליח לחשב את אפס בחזקת אפס בצורה אריתמטית. עד כמה זה קשה?" ואז מציג "חישוב" של אפס בחזקת אפס. רובו הוא סטנדרטי לגמרי: \(0^0=0^1\cdot 0^{-1}=\frac{0}{0}\) – זה דבר שברור לכל סטודנט למתמטיקה (וגם לתלמידי תיכון שחושבים על החומר, למען האמת), והבעיה היחידה היא שהביטויים בו אינם מוגדרים היטב – אלא שלאנדרסון יש שם אחר לביטוי הימני של אפס חלקי אפס – ניחשתם נכון, כלומיתי. הפלא ופלא! נפתרה בעיה בת 1,200 שנים! גילינו שאפס בחזקת אפס, שעד כה היה לא מוגדר, הוא… לא מוגדר!
בשלב הבא במצגת שלו אנדרסון כבר גולש למחוזות שגעון הגדלות. הוא מתיימר להיות מסוגל לבנות סופר-מחשבים בעזרת כלומיתי. לא רואים זאת במצגת, אבל במאמרים שלו הוא מציג את הרעיון יותר לעומק – מחשב שיכיל רק פקודה אחת, מסובכת משהו, של חישוב דמוי מכפלה סקלרית. אין ממש טעם להיכנס לשאלה האם היצור הזה הוא מה שנקרא Turing Complete, כלומר חזק כמו המודל המתמטי הסטנדרטי של מחשב – אני מוכן להניח שכן. מה שברור הוא שמבחינה תיאורטית הוא לא חזק יותר כל עוד מידע מיוצג בו בצורה דיגיטלית (כלומר, כל מספר בו מיוצג כרצף סופי של אפסים ואחדים או משהו דומה, כי לא ניתן לייצג כך את כל המספרים הממשיים) – הרי ניתן לסמלץ את כלומיתי בכל שפת תכנות בסיסית (תרגיל למתכנתים – אל תטרחו, יש דברים יותר מגניבים לעשות, כמו פרוייקט אוילר). כמובן שאם המחשב שלו עובד עם כל המספרים הממשיים, זה עשוי לתת לו כוח רב יותר; אבל גם מודלים שכאלו הם לא דבר חדש, ותוספת הכלומיתי, שהיא התרומה היחידה של אנדרסון, לא מוסיפה כלום.

אבל מה? אנדרסון משוכנע שהמחשבים שלו ירוצו בסדרי גודל יותר מהר מאשר המחשבים הקיימים. הרעיון המבריק שהוא מציג בשקף הוא ש"אין צורך בחיווט כדי לבחור או לקודד פקודות, כי יש רק פקודה אחת". זה מטופש, כי מדובר כאן בטאטוא מתחת לשטיח של הסיבוכיות של תוכנית – אוקיי, אז יהיה יותר קל לבחור או לקודד פקודות, מסכים. אבל לך תכתוב תוכנית מחשב סבירה עם הפקודה האחת הזו – תצטרך להשתמש באותה פקודה הרבה מאוד פעמים, עם קלטים שונים, כדי להשיג תוצאות שבמחשבים בני זמננו משיגים בפקודת מחשב אחת שממומשת בצורה יעילה בחומרה, בעזרת אותם חיווטים שאנדרסון יוצא נגדם. כך זה באופן כללי בתכנות – אם יש לך שפת תכנות עם מספר פקודות מצומצם, כנראה שכדי לעבוד איתה בנוחות תצטרך "להרכיב" הרבה פקודות בסיסיות נוספות מתוך מעט הפקודות שיש לך. למעשה, ככל שהזמן עובר כך המחשבים עושים דברים מסובכים יותר ברמת החיווט הבסיסי (למשל, כפל וקטורי) ולא ברמת התוכנה, פשוט כי זה יעיל יותר. להמציא שפת תכנות של פקודה אחת זה בדיוק ההפך ממה שצריך כדי ליצור מחשבים יעילים. כמובן, אולי אני טועה – כשאינטל תפשוט את הרגל בגלל אנדרסון, אודה שטעיתי.

לקראת הסוף חושף אנדרסון לראווה את הטרחן הכפייתי שבו באופן מוחלט – הוא מתיימר לפתור עם הכלומיתי שלו את כל בעיות היקום, או לפחות לנסח מחדש את משוואות מקסוול והגרביטציה הקלאסית, ואז לאחד את האלקטרודינמיקה הקוונטית עם תורת הגרביטציה (אחד מהגביעים הקדושים של הפיזיקה המודרנית, אם איני טועה).

כל זה היה נותר בגדר שעשוע לא מזיק אלמלא התקשורת הקדישה למטורלל הזה זמן מסך יקר (זמן שאפשר היה להקדיש למתמטיקאים אמיתיים, שפותרים בעיות אמיתיות, גם אם לא כאלו שיש להן את תווית 1,200 השנים הסקסית), ואלמלא היו נותנים למטורלל הזה ללמד ילדי בית ספר את תורת הכלומיתי שלו. אמנם, אני לא חושב שהנזק לילדים יהיה גדול ביותר – הם בסך הכל לומדים מה זה NaN בשלב מוקדם מדי, שבו לא באמת צריך לדעת מהו. כשהם יגדלו הם כנראה יתקלו ב-NaN האמיתי, יראו שזה כמעט כמו כלומיתי, ואולי יתעניינו מספיק כדי לחפש הסבר למה הוא לא שווה לעצמו בעוד שכלומיתי כן. אם אנדרסון מעודד כך חשיבה, אולי הוא לא רע באופן מוחלט.

האם יש שיטה למציאת שורש ריבועי? (כן!)

לא מזמן עסקתי במהומה שהקים טרחן מתמטי כפייתי ("Mathematical Crank") שחשב כי ביכולתו לרבע את המעגל, ויצר אגדה אורבנית על חוקים שקובעים שפאי שווה 3. אלון עמית הזכיר לי דוגמה נוספת, רלוונטית הרבה יותר – מקורה בישראל וגילה קצת יותר משנה. למרבה המזל, היא הסתיימה ללא הדים מיוחדים, ועם זאת אני סבור שיש בה עניין בזכות עצמה, והיא גם מהווה פתח לדיון מתמטי מעניין.

הבעיה, כרגיל עם טרחנים מתמטיים, אינה בטרחן עצמו. אין בטרחנות רע מבחינה עקרונית; היא לא מזיקה לאיש פרט אולי לטרחן עצמו, והוא עצמו כנראה נהנה מאוד ממעשה ידיו. הבעיה מתחילה רק כשהוא מנסה לפרסם את עבודתו. לעתים הפרסום מוגבל לחוגים המתמטיים, ואז הנזק שנגרם הוא בזבוז זמנם של כמה מתמטיקאים (ואולי גם שעשוע שלהם). גם זה אינו נורא כל כך. במקרים אחרים, הטרחן מפרסם את תוצאותיו בצורה עצמאית – בעבר הוא נאלץ לשלם הון כדי להוציא ספר, ובימינו עתירי הבלוגים הכל נהיה קל יותר. גם הטרחן שאני מתאר הפעם כתב את הגיגיו ראשית בבלוג (וכך גם הטרחן שכותב שורות אלו מגביל את קשקושיו לבלוג).

גם בלוג ודומיו אינם נוראיים – מי שרוצה, יקרא, ומי שלא – לא. הבעיה מתחילה כשכלי תקשורתי מבוסס יותר פורש את חסותו על הטרחן, במקרה זה – אתר Ynet.

לפני מעט יותר משנה פרסם אתר Ynet מאמר בשם "האם יש שיטה למציאת שורש ריבועי?" פרי עטו של אחד, יהודה בלו. למען הגילוי הנאות אציין שהכרתי את יהודה בלו עוד מלפני כן, שלא באופן אישי, דרך ויקיפדיה העברית, והיו לנו חיכוכים אישיים לא מעטים שם. בלו פרסם את המאמר שנה לפני כן בבלוג האישי שלו, וניתן למצוא אזכור לרעיונות שבו כבר בדף השיחה שלו בויקיפדיה מתחילת 2005. המאמר מעיד, לדעתי, על כשל חמור ביותר של Ynet, משתי סיבות: האחת, המאמר הוא חסר ערך מתמטי לחלוטין, ואין מקום לפרסמו תחת "מתמטיקה" – יותר מכך, הוא פשוט מטעה את הקוראים ומוסר להם מידע שגוי. השניה, המאמר כתוב איום ונורא ויהיה כנראה בלתי מובן ובלתי קריא לאלו שלא יתאמצו לפענחו. התוצאה? הקוראים שאינם מבינים במתמטיקה גם יקבלו מידע מוטעה והבנתם לגבי מתמטיקה תשתבש עוד יותר, וגם יקבלו את הרושם שמאמרים שעוסקים במתמטיקה הם גיבובי מילים בלתי ברורים – עוד הרחקה של המתמטיקה מחיי היום-יום ומקהל הקוראים הלא מתמטי. כשזה מתפרסם בעיתון רשת "מכובד" ונפוץ כמו Ynet, ועוד במדור המדע שלו, הנזק הנגרם הוא ממשי. זה גרוע פי כמה מאותה כתבת "מטרנסצנדנטלי יוצא ריאלי" ב"הארץ" שעליה התקוממתי בעבר.

עוד דבר מביך למדי הוא שמבט במאמר כפי שהוא מופיע בבלוג נותן את הרושם שהוא הושם ב-Ynet מבלי לעבור שום עריכה. קיימת כמובן האפשרות שהמאמר בבלוג נערך אחרי הפרסום ב-Ynet ועל פיו, אבל אני בספק אם זה קרה. המסקנה הפשוטה – מישהו ב-Ynet לקח מאמר מבלוג ושם אותו באתר מבלי לבצע בו חלקיק עריכה (שברור שהיא נדרשת) – אני לא בטוח אם הוא אפילו טרח לקרוא אותו (זה לא המאמר היחיד שבלו פרסם שם). אם הייתם שואלים אותי, הייתי חושד שזו הלצה של האקר.

אם כן, זה למה זה רע. אבל מה זה? להלן סקירה של המאמר.

פסקת הפתיחה (שהתווספה רק במאמר ואינה מופיעה בבלוג) היא המרתקת (והקריאה) ביותר. הנה היא בשלמותה:

"מסיבה לא ברורה, לא מחפשים המתמטיקאים שיטה למצוא שורש ריבועי או שורש כלשהו. האם יש בידם הוכחה מתמטית שלא מתאפשרת שיטה שכזו? עדיין לא. חידת המספרים הראשוניים היא שמונעת מציאת השיטה לכאורה, ועד שלא תיפתר, אין על מה לדבר. ברם, שום ניסיון רציני לתקוף סוגיה זו לא נעשה, ואפילו לא מחפשים דרך כלשהי למצוא שורש ריבועי, של חלק מהמספרים הדו-חזקתיים."

יש כאן מספר לא קטן של מאפייני טרחנות (כפי ש-Underwood Dudley מציג אותם היטב). המאמר מתחיל בפסילת העולם המתמטי הנוכחי בכל הנוגע להקשרי עבודתו של הכותב – המתמטיקאים מתעלמים ממשהו שברור לכותב המאמר שהוא חשוב. הבעיה היא שהמתמטיקאים בעבר חיפשו שיטה למציאת שורש ריבועי או שורש כלשהו, ואפילו מצאו. שיטה למציאת שורש ריבועי הייתה ידועה כבר לבבלים הקדמונים. בימינו יש שיטות רבות כאלו (אני מקווה להציג חלק בפוסט הבא), וכל מחשבון כיס בן זמננו מסוגל להוציא שורש כלשהו.

האמירה הבאה זורקת לחלל האוויר מושג שאינו קיים: "חידת המספרים הראשוניים". ללא ספק, המספרים הראשוניים הם הבסיס לבעיות מעניינות רבות, אבל לא קיימת בעיה בשם "חידת המספרים הראשוניים". מילא, זה לא מאמר מדעי, אבל משתמשים בחידה הלא קיימת הזו בתור נימוק לכך שלא תימצא השיטה שכבר נמצאה.

בשלב הבא ממשיכים להמעיט בערכו של העולם המתמטי: "שום נסיון רציני לתקוף סוגיה זו לא נעשה" – זה אופייני למדי לטרחן, שלעתים קרובות יהיה בור מוחלט במתמטיקה (כבר אמרתי ש-Dudley מביא בפרק אחד את סיפורו הנוגע ללב של טרחן שהמציא שיטה קשה ביותר למציאת שלשות פיתגוריות, מבלי לדעת שקיימת שיטה טריוויאלית למציאתן), לחשוב שאף מתמטיקאי לא התייחס עד כה לבעיה שהוא פונה אליה.

סוף הפסקה עוסק סוף סוף בנושא האמיתי של המאמר: "המספרים הדו-חזקתיים". זה עוד מאפיין לטרחן – להמציא שם חדש ומסובך למושג טריוויאלי ומוכר – במקרה הזה (כפי שמתברר בהמשך המאמר), המספרים הדו חזקתיים הם פשוט מספרים טבעיים שיש להם שורש ריבועי טבעי (בלו מביא את 81, שאחד משורשיו הוא 9, בתור דוגמה).

המשך המאמר מכיל רשימה מפלצתית של "משפטים" ("להלן המשפטים הבאים"), שכל אחד מהם בפני עצמו הוא פשוט ציון עובדה טריוויאלית (טריוויאלית במובן של "רמת בית ספר יסודי", לא במובן של "סטודנט באוניברסיטה מסוגל להשלים את הפרטים בקלות בעצמו"). מטרתם של כל המשפטים הללו היא שני המשפטים האחרונים, ולא ברור בשביל מה היה צריך לציין את הקודמים – הרי הוכחות אין כאן, ובפרט אין טיעונים כדוגמת "המשפט הזה נכון בגלל המשפטים הקודמים לו".

ששת המשפטים הראשונים (ועוד אחד בהמשך) עוסקים בזוגיות ואי זוגיות ובצורה שבה היא משתנה או נשמרת תחת פעולות האריתמטיקה. אפשר לצמצם אותן לטבלאות כפל וחיבור (בלו מדבר על חיסור – אין הבדל) פשוטות:

אי זוגי

זוגי

חיבור

אי זוגי

זוגי

זוגי

זוגי

אי זוגי

אי זוגי

אי זוגי

זוגי

כפל

זוגי

זוגי

זוגי

אי זוגי

זוגי

אי זוגי

"תרגיל" נחמד שעוזר לזכור את זה – החליפו את "זוגי" ב-0 ואת "אי זוגי" ב-1 וראו מה קיבלתם – אלו טבלאות החיבור והכפל מודולו 2 (הקשר, כמובן, אינו מקרי).

בשלב הבא יש שתי תוצאות שנובעות מיידית מלוח הכפל – למשל, שמספר דו חזקתי זוגי הוא בעל שורש זוגי, ועבור דו חזקתי אי זוגי השורש אי זוגי. תרגיל – להבין למה זה נובע מטבלאות הכפל.

משפט אחד אולי נשמע מעניין מבין המשפטים שצצים בשלב הזה: "אין מספר דו-חזקתי אי זוגי שמסתיים בספרה 3" . זה נובע בצורה בלתי נמנעת מטבלת הכפל שלומדים בכיתה א' – מספיק להראות שכל המספרים האי זוגיים הקטנים מ-10 לא נותנים 3 כספרה אחרונה כשמעלים אותם בריבוע. מה שכן, לא ברור מה הקשר של המשפט הזה לשאר המשפטים. כנראה שהוא סתם נוצר אגב משחק.

בהמשך מגיעים לרמות חדשות של טריוויאליות: למשל, "כל מספר זוגי נמצא בין שני מספרים אי זוגיים" וההפך, שמהם נובע מייד (למה?) ש-"בין מספר דו-חזקתי אי זוגי יהיו תמיד שני מספרים דו-חזקתיים זוגיים". עוד משפט תמוה במיוחד הוא "כל מספר הוא שורש ריבועי של מספר דו-חזקתי" ו-"כל מספר זוגי מתחלק לשניים" (זו לא ההגדרה?) וכיוצא בזה.

רק לקראת הסוף מגיע סוף סוף משהו בעל תוכן מהותי יחסית: "תוצאת החלוקה בארבע של כל מספר דו-חזקתי זוגי מהווה מספר דו-חזקתי אחר". גם זו טענה טריוויאלית: אם x הוא דו-חזקתי זוגי, אז גם השורש שלו זוגי, כלומר \(x=(2a)^2=4a^2\) ולכן מן הסתם ניתן לחלק אותו ב-4 ולקבל עוד מספר דו חזקתי. ה"משפט" הבא הוא דרך מסובכת להציג את הדבר הפשוט שכבר ראינו: "מכפלת השורש בשניים של תוצאת החלוקה בארבע של מספר דו-חזקתי זוגי, מהווה את השורש הריבועי של המספר הדו-חזקתי הזוגי" זו פשוט כתיבה מסורבלת של המשוואה \(x=(2a)^2\).

המשפט האחרון הוא עוד וריאציה על הקודם, במקרה שבו אפשר לחלק ב-16 ולא רק ב-4 (זה לא תמיד אפשרי, למשל עבור 4 או 36): "מכפלת השורש בארבע של תוצאת החלוקה ב-16 ללא שארית של מספר דו-חזקתי זוגי, מהווה את השורש הריבועי של המספר הדו-חזקתי הזוגי". תרגיל – לפענח.

מה היה הטעם בכל הרשימה הזו, של עובדות שתלמיד בבית ספר יסודי יכול לגלות בעצמו? זה ניתן בפסקה הבאה: "לפי שני המשפטים האחרונים, ישנה שיטה למצוא שורש ריבועי של מחצית מן המספרים הדו-חזקתיים הזוגיים או רבע מכלל המספרים הדו-חזקתיים". זה נשמע מעניין, בכל זאת. שיטה למציאת שורש היא לא דבר טריוויאלי.

המשפט הבא, לעומת זאת, לחלוטין לא מעניין: "כמו כן, די בכך שתוצאת חלוקה של מספר זוגי בארבע תהא ללא שארית, כדי להצביע על כך שיתכן שהוא מספר דו-חזקתי, קרי שיש לו שורש ריבועי". כאן מסופק מה שמכונה במתמטיקה "תנאי הכרחי" – כלומר, תנאי שאם הוא לא יתקיים, תכונה מסויימת לא תתקיים. ברור מהמשפטים לעיל שאם מספר זוגי הוא דו חזקתי, הוא מתחלק ב-4, כלומר זה הכרחי – אבל זה לא מספיק, ולכן המשפט אומר מעט מאוד. שימו לב למילה "ייתכן" – היא לב העניין כאן. ייתכן. אפשר גם לומר "די בכך שתוצאת חלוקה של מספר בעשרה מספרים אקראיים קטנים ממנו וגדולים מ-1 תהיה עם שארית כדי להצביע על כן שייתכן שהוא ראשוני". האם פתרתי את בעיית בדיקת הראשוניות?

ובכן, כעת אנחנו מצפים בכיליון עיניים לתוצאה הלא טריוויאלית הראשונה במאמר – שיטה למציאת שורש עבור חלק מהמספרים. במקום לקבל אותה, אנחנו מקבלים את הפסקה המופלאה הבאה:

"נשוב על הדוגמה למען התלמידים: הבוקר לאחר שזללתם את הלחמניה ושתיתם את שקית השוקו בקייטנה, נתברר לכם שהביקור בבריכה התבטל. מה לעשות? אתם שואלים את עצמכם. הרי כל החברים שלכם יושבים עכשיו מול הטלוויזיה וצופים בפינוקיו, נילס הולגרסון והלב (כל יום בערוץ מספר אחד בארץ). מיד אתם אצים-רצים הביתה ומגלים ששמשון ויובב חטפו את בלה, שנילס נתפס על ידי השועל, והקוף של מרקו הציל גור של שועל. בלית ברירה, אתם מכבים את הטלוויזיה ופותחים את חוברות החשבון של תמר פיש, שאמא קנתה לכם לחופש הגדול. אך אויה, לאן נעלם פלוטו…כלומר, המחשבון? הכיצד נמצא שורש ריבועי של 20736?"

לא אומר את דעתי המדוייקת על הפסקה הזו. רק אעיר שגם עורך לא-מתמטי בהשכלתו היה צריך להבין שמקומה לא יכירנה במאמר.

אבל כעת, סוף סוף, מגיעים לשיטה. לא אצטט כאן את השיטה עצמה, כי אין בכך טעם רב – מה שבלו מציע לעשות הוא לחלק את המספר ב-4 או ב-16 (אם הוא זוגי), עד שמגיעים למספר שהוא קטן מספיק כדי שנדע במדוייק את השורש שלו. ומה אם המספר אי זוגי? בלו אומר "באם הוא מספר אי זוגי יש לפעול לפי השיטה האי זוגית". לא הצלחתי להבין מהמאמר מהי השיטה האי זוגית – אני מקווה שאחרים יוכלו להסביר לי.

אם כן, לא פתרנו את הבעיה. מה עושים, למשל, עם 283,024? חלוקה ב-16 נותנת את 17,689. לכו תוציאו לו שורש עכשיו בלי שיטה מסודרת (השורש הוא 133, אומר המחשבון שלי). בקיצור, השיטה חסרת תועלת למעט כמה מקרים פרטיים שבהם אפשר לחלק שוב ושוב ב-16 עד שמגיעים למספרים קטנים ממש – בוודאי לא עבור "רבע מהמספרים".

לכאורה כאן המאמר היה צריך להיגמר, אבל הוא נמשך עם עוד כמה תגליות שגילה בלו, כנראה במהלך המשחק שבו המציא את השיטה שלו. זה מתחיל בדברי הלל עצמיים:

"עד כמה שידוע לי, אף אחד מלבדי בעולם לא מתעניין במספרים הללו (מספרים דו-חזקתיים זוגיים), מבחינת התבנית הייחודית הזו כסדרה (ואינני מתכוון לבינאריים), מדוע? למעשה, אני אפילו המצאתי את המונח הזה."

שוב – הפגנת בורות באמצעות הכסות של "עד כמה שידוע לי", וגאווה תמוהה על כך שהוא המציא את המונח ה"חדש" של מספר דו חזקתי. כעת מגיעה שורה של שוויונות זהים ברעיונם, שהאחרון שבהם הוא:

1024=512+256+128+64+32+16+8+4+2+1+1

היופי שבמשוואה הזו כנראה לא חמק גם מעיניו של בלו, אלא שהוא בטוח, משום מה, שהוא הראשון שגילה אותו. למעשה, הוא גילה מקרה פרטי של הנוסחה הסטנדרטית לטור הנדסי: פרט לאחד משני ה-1 שבהתחלה, כל האיברים שהוא מחבר הם איברי הטור ההנדסי \(\sum_{k=0}^{n-1} 2^k \) (הטור שמנתו 2 והאיבר הראשון שלו 1). בחטיבת הביניים לומדים שסכום טור שכזה הוא \(\frac{2^n-1}{2-1}=2^n-1\), ולכן ברור שאם נחבר עוד 1 לסכום נקבל \(2^n\). יפה, בהחלט יפה (ואף מועיל פה ושם), אך ממש לא תגלית חדשה.

זהו המאמר. יש דברים שנותרו סתומים לגמרי, כמו "חידת המספרים הראשוניים" המדוברת. המאמר עורר דיון בויקיפדיה העברית שבו השתתף הכותב – תחילתו כאן והמשכו כאן. מהדיון קיבלתי את הרושם ש"חידת המספרים הראשוניים" מתייחסת לכך שקשה לפרק מספר לגורמים ראשוניים ("קשה" מבחינה חישובית). כמובן שחידה אין כאן – פירוק לגורמים אכן מספק דרך (מאוד לא יעילה) להוציא שורשים. אפרט עליה, ועל כמה מהשיטות האמיתיות להוצאת שורש, בפוסט הבא.

(צ)חוק פאי

גם למתמטיקה האגדות האורבניות שלה. אגדה אחת (שאולי נתנה השראה ליוצרי הסרט "סיפורו של ויל האנטינג") מספרת על סטודנט למתמטיקה שהגיע באיחור להרצאה לאחר שהתרוקנה הכיתה, ראה על הלוח מספר שאלות שנראו לו כתרגיל הבית הראשון, בא למרצה למחרת ואמר שהצליח רק שתיים מבין חמש השאלות, והמרצה המתפלץ סיפר לו שכתב את כל השאלות על הלוח כדוגמה לבעיות קשות במתמטיקה שטרם נפתרו.

לסיפור הזה, מסתבר, יש בסיס שקל לאתר בחיפוש מהיר באינטרנט. גם לאגדות נוספות יש בסיס עובדתי, אך לרוב האמת מסובכת הרבה יותר מהגרעין העובדתי שבבסיס הסיפור – וכך גם במקרה שעליו אני רוצה לדבר הפעם, של "חוק" פאי.

האגדה פשוטה – מסופר כי מדינה כלשהי – ככל הנראה בארה"ב – העבירה חוק שקבע את ערכו של פאי להיות X, כאשר X הוא לרוב 3, אבל לא תמיד (כמובן שהוא תמיד מספר "פשוט" ששונה מערכו האמיתי של פאי). גם הסיבות מגוונות – החל ברצון לעשות את החיים קלים יותר לתלמידים בבית הספר וכלה בכניעה ללחצי כפיה דתית.

מבוא קצר: פאי הוא קבוע מתמטי, מספר שבא לציין את היחס בין היקף מעגל לקוטרו (זה לא מובן מאליו שהיחס הזה קבוע לכל מעגל, אך זה המצב בגאומטריה הסטנדרטית, האוקלידית; ומכל מקום, אפשר להסתפק בלהגדיר את פאי עבור מעגל שרדיוסו באורך 1, מה שנקרא "מעגל היחידה"). כשכותבים את פאי כמספר עשרוני, הוא שווה בערך ל-3.14159 – ואני אומר "בערך" כי פאי הוא מה שמכונה מספר אי רציונלי – אי אפשר להציג אותו בצורות פשוטות כמו שבר (מנה של שני מספרים שלמים), או בהצגה עשרונית שנגמרת מתישהו או לפחות מתחילה לחזור על עצמה. הדבר הוכח במאה ה-18, אם כי פאי עצמו היה בסביבה כבר מימי יוון העתיקה (וארכמידס חישב אותו בדיוק נאה למדי באמצעות שיטת קירוב מבריקה).

אם כן, פאי הוא לא משהו שאפשר לשלוט עליו. אפשר להחליף את ההתחכמות האתאיסטית של "האם אלוהים יכול ליצור אבן שהוא לא יכול להרים" בשאלה הפשוטה יותר, האם אלוהים יכול לשנות את ערכו של פאי (התשובה: לא נראה לי). לכן זה אווילי למדי לנסות לקבוע את ערכו בחוק. מה שכן אולי אפשר לנסות לקבוע זה קירוב "מוסכם" שלו, מעין תקן. כאן זה לא מופרך לגמרי; נניח שנותנים במבחן בבית ספר שאלה בעלת תשובה מספרית שמחייבת שימוש בפאי. אם בבית ספר אחד התלמידים "מתרגלים" להשתמש בשלוש ספרות קירוב, ובבדיקת המבחן מחליט פתאום משרד החינוך לבדוק בחמש ספרות קירוב ולפסול מבחנים של תלמידים, יש לנו בעיה. כמובן שנשמע מופרך שמשרד החינוך ישנה את דעתו בלי להודיע למורים – אבל נו באמת, דברים גרועים מכך כבר קרו.

אלא מה, לקבוע את ערכו של פאי ל-3 בתור "קירוב מוסכם" זה כבר מגוחך. זה יניב תוצאות עקומות לחלוטין בחישובים. פיזיקאים רבים נוהגים להתלוצץ על כך ש"בקורס שלי פאי שווה 3" כדי להראות עד כמה הם מסתמכים על קירובים, אבל אפילו הם מבינים שתוצאות שניתנות בעזרת קירוב כזה יכולות להיות בעייתיות במקרים רבים. אם כבר בוחרים קירוב מוסכם, עדיף לבחור קירוב מדוייק יותר. כמובן ששורש הרוע האמיתי בכל זה הוא העובדה שמבחנים עשויים לדרוש תוצאות סופיות מספריות – מה שמעיד על כמה הם רחוקים מלהיות מבחנים במתמטיקה אמיתית.

על טיעוני "הכפיה הדתית" ראוי לדבר בפוסט נפרד. הסיבה להן פשוטה – טקסט תנ"כי (מלכים א' ז' כ"ג) שממנו ניתן "להסיק" שערכו של פאי "על פי התורה" הוא 3, ולכן התורה "שגויה". זה בפני עצמו הוא קשקוש מוחלט, אבל גרוע עוד יותר הוא הנסיון של כמה אנשים לנצל זאת לטובת הדת דווקא ולהראות איך "תיקון" של הערך שמשתמע מהטקסט הזה נותן קירוב מדוייק מאוד של פאי, ולכן רומז לאלוהיותו של התנ"ך. כאמור, אני מקווה להרחיב על זה בפוסט אחר מתישהו.

חזרה לחוק פאי. הצ'יזבט כאמור קיים, אך בסיס עובדתי – אין. מעולם (עד כמה שידוע לי) לא הועבר אף חוק שניסה לקבוע את ערכו של פאי. אפילו מחוקקים הם לא מטומטמים עד כדי כך, כנראה. מה שכן יש הוא חוק שהועבר באינדיאנה בשנת 1897 ונגנז חיש קל בהתערבותו של מתמטיקאי. החוק לא מנסה בשום צורה לקבוע את ערכו של שום קבוע מתמטי – הוא מנסה להציע מה שהוא מכנה "אמת מתמטית חדשה" כדי שתשתמש את מדינת אינדיאנה "ללא תשלום". בקיצור – מתנה. המתנה היא שיטה לריבוע המעגל (או בשם יותר מדוייק ופחות נפוץ, ריבוע העיגול), ש"הומצאה" בידי מה שמכונה באנגלית Mathematical Crank ובעברית, בהיעדר תרגום רשמי, אכנה "טרחן מתמטי כפייתי", בהתבסס על מאמרו המצויין של אלון עמית.

מבוא שני: בעיית ריבוע המעגל היא בעיה עתיקה, עוד מימי היוונים, שמנוסחת כך: בהינתן עיגול, האם ניתן לבנות ריבוע ששטחו זהה לשטח העיגול? בפרט, אם העיגול שלנו הוא מרדיוס 1 שטחו הוא פאי (תוצאה שאיננה טריוויאלית בפני עצמה) ולכן בעיית ריבוע המעגל ניתנת לצמצום לבעיה של בניית ישר שאורכו שורש פאי (כי אם ישר כזה הוא צלע של ריבוע, שטח הריבוע הוא פאי).

על פניו זה לא בהכרח קשה; האתגר הוא לעשות את זה תוך שימוש בשני כלים מוגבלים למדי – סרגל ומחוגה בלבד, כש"סרגל", בניגוד לסרגלים של ימינו, אינו מסומן בשנתות ואי אפשר למדוד בו אורכים, אלא רק להעביר קווים ישרים.

לא אכנס כאן לכללי המשחק המדוייקים של בניה בסרגל ומחוגה – גם אל הנושא הזה אני מקווה לחזור בעתיד. הנקודה המהותית והחשובה כאן היא שלא עלה בידי אף אחד למצוא שיטה לריבוע המעגל באמצעות סרגל ומחוגה בלבד במשך אלפי שנים, ולבסוף הוכח (לפני 1897) שהדבר פשוט בלתי אפשרי. כמובן שזה לא מנע מהמוני אנשים להמשיך להאמין שהם מצאו שיטה טריוויאלית לריבוע המעגל – לרוב מתוך חוסר הבנה של מה בעצם צריך לעשות, או התעלמות מעובדות מתמטיות אלמנטריות.

וכאן נכנס מושג הטרחן המתמטי הכפייתי לתמונה. טרחן מתמטי כפייתי הוא אדם (לרוב ללא רקע פורמלי במתמטיקה, אך לא בהכרח) שעוסק במתמטיקה בצורה שהיא חסרת תועלת לחלוטין, ולרוב בהתלהבות שעומדת בפרופורציה הפוכה לתועלת שלו. הגדרה טובה תהיה באמצעות דוגמאות, וכאלו לא חסרות – רבות מהן קובצו בספר המצויין של Underwood Dudley שנקרא פשוט "Mathematical Cranks". לא חסרים טרחנים שסבורים שמצאו פתרון פשוט לבעיה שפתרונה סבוך ביותר, או שטרם נפתרה, או שאי אפשר לפתור – למשל, המשפט האחרון של פרמה, השערת גולדבך, ריבוע המעגל (ושני אחיו החורגים, הכפלת הקוביה ושילוש הזווית), משפט ארבעת הצבעים ועוד כהנה וכהנה. לרוב יש בהוכחה שלהם טעות או "רמאות" בסיסית (כלומר, מעבר שאינו מנומק היטב ולא ניתן לנמק אותו) שהם מסרבים לשים אליה לב. טרחנים אחרים משוכנעים שהתורות המתמטיות הנוכחיות שגויות מהותית – למשל, כאלו שטוענים ש"קנטור טעה" ושיטת האלכסון שלו לא מוכיחה כלום. דוגמה לאחד כזה ניתן למצוא בדיון שהתפתח בתגובות למאמר של אלון עמית, ובו נטלתי חלק פעיל, שלא בהכרח לטובתי.

אם כן, העומד מאחורי החוק של אינדיאנה היה טרחן שכזה, שחשב שגילה שיטה לריבוע העיגול ומתוך רצון אלטרואיסטי (נניח) בחר להעניק אותה למדינת אינדיאנה. לפעמים סיפורי נדבות שכאלו עשויים להיות טראגיים – דדלי מביא את סיפורו של טרחן שהקדיש שנים רבות לחיפוש אחר שיטה לייצור שלשות פיתגוריות ולבסוף פרסם ספר (מסובך ובלתי קריא) שבו מוצגת השיטה, כשההקדמה אליו מעידה על נטיות אלטרואיסטיות מרגשות. חבל שאיש לא סיפר לו (או שסיפרו והוא לא הבין) שייצור כל השלשות הפיתגוריות הוא טריוויאלי לחלוטין.

למרבה השמחה, הצעת החוק ניתנת לקריאה באינטרנט לכל דורש. כך ניתן לעמוד על אופיו של טקסט טרחני "קלאסי". אין הרבה טעם לדבר או לנסות לפענח את הטקסט עצמו, למרות שכבר היו כאלו שנרתמו בששון למשימה – אני משאיר לכל אחד את ה"משחק" של לנסות ולהבין מה הולך שם ולבדוק מתי זה מפסיק לשעשע. הסיבה לכך שהחוק הזה (כנראה) הוא שגרם ליצירת האגדה של "חוק פאי" היא שהמאמר מצביע על ערכו של פאי – למעשה, על ערכים רבים ושונים של פאי. הברורים שבהם הם 4, שבא לידי ביטוי במשפט ": It has been found that a circular area is to the square on a line equal to the quadrant of the circumference", ו-3.2, שבא לידי ביטוי במשפט "disclosing the fourth important fact, that the ratio of the diameter and circumference is as five-fourths to four". דדלי מספר על מישהו שהצליח למצוא תשעה ערכים שונים של פאי שניתנים להפקה מהטקסט – די מרשים בהתחשב בכך שהוא אינו ארוך במיוחד ושחלקו השלישי מוקדש לפיאור והילול הצלחותיו הגדולות של המחבר שפורסמו כבר בכתב עת מתמטי נחשב (דדלי טוען שהן אכן פורסמו, אבל על תקן "פרסומת שלא בתשלום" – אולי העורכים חשבו שיהיה זה דבר משעשע לפרסם).

כאמור, בתחילה שקלו חברי המועצה של אינדיאנה ברצינות את העברת החוק. אפשר ללעוג להם, אבל צריך לזכור שהם היו חסרי כל הבנה במתמטיקה, וכנראה שהטרחן הצליח להוליך אותם שולל בהעמדת הפנים שלו כאילו יש מאחוריו גיבוי של מתמטיקאים "נחשבים" (טרחנים נוהגים לעשות זאת; הדבר דומה למה שקראתי רק השבוע ב"הארץ", על איזו "מומחית לתת מודע" שמתהדרת בצילום עם נשיא המדינה שמעון פרס, שמצדו, מתברר, פשוט מצטלם עם כל מי שמבקש, "כמו ג'נטלמן").

בסופו של דבר התערב בכל הפיאסקו מתמטיקאי אמיתי, והחוק נדחה עד אין קץ ולא עבר. נשארנו בעיקר עם הצ'יזבט, ועם דוגמה אחת מני רבות לנוכחותם המזיקה של הטרחנים המתמטיים.