מה הקשר בין מספרים ראשוניים וקריפטוגרפיה?

לפני חודש ומשהו נתגלה המספר הראשוני הגדול ביותר שנתגלה אי פעם (זה קורה אחת לכל כמה שנים), וגילוי שכזה תמיד מעורר שאלות מתבקשות של "בשביל מה זה טוב?". אם ניכנס לטוקבקים במאמר על התגלית ב-Ynet נגלה שבציבור הרחב, התחום שאליו מספרים ראשוניים מתקשרים ישירות הוא קריפטוגרפיה: "למספר יש חשיבות גדולה בהצפנה" אומר אחד. זה לא נכון ואסביר זאת בהמשך. אחר אומר "אין אלגוריתם או תוכנה שמסוגלת לחשב מספרים ראשוניים. לכן זאת נחשבת ההצפנה הטובה ביותר". גם זה לא נכון ואסביר זאת בהמשך. שלישי אומר "כל מערכת ההצפנה במחשבים עובדים על מספרים ראשוניים" שזה קצת יותר נכון אבל עדיין ממש לא נכון, ואסביר זאת בהמשך. מישהו אחר מנסה לצנן את ההתלהבות עם "שיטות הצפנה מבוססים על מספרים ראשוניים אבל לשם כך יש מספיק" – גם כן לא נכון, אבל יותר קרוב לתיאור מצב העניינים. במאמר הזה אני רוצה להבהיר את העניינים ככל הניתן. נתחיל מהשורה התחתונה – מספרים ראשוניים מהווים כיום מרכיב חשוב בחלק ממערכות ההצפנה שלנו; הם בשום פנים ואופן לא המרכיב היחיד ויש מערכות הצפנה שבהן אין כל חשיבות לראשוניים; ובכל הנוגע למציאת ראשוניים יש לנו אלגוריתמים נפלאים כיום שעובדים היטב ובלעדיהם לא הייתה שום הצפנה שמבוססת על ראשוניים, והכי חשוב: לא, לראשוני שנתגלה זה עתה אין כל קשר לכל זה.

מהו מספר ראשוני קל מאוד להגדיר: זה מספר טבעי גדול מ-1 שמתחלק רק ב-1 ובעצמו. למשל 2, או 17, או 131. לעומת זאת 57 אינו ראשוני כי הוא המכפלה של 3 ו-19. למה הראשוניים אמורים לעניין מישהו? ובכן, יש מספר סיבות. המיידית מביניהן היא שכל מספר טבעי גדול מ-1 ניתן להציג בתור מכפלה של ראשוניים באופן שהוא פחות או יותר יחיד. כך למשל את 57 אפשר לתאר בתור 3 כפול 19 או בתור 19 כפול 3, אבל פרט להיפוך הסדר הזה אין שום דבר שאפשר לעשות. כדי להבין מה מיוחד כאן כדאי לחשוב על מספר כמו 60, שאפשר להציג בתור 2 כפול 30 וגם בתור 4 כפול 15 – כלומר, שתי מכפלות שונות – אבל עדיין, הפירוק של 60 למכפלה של ראשוניים בלבד הוא יחיד (2 כפול 2 כפול 3 כפול 5). בשל התכונה הזו נהוג לומר על הראשוניים שהם "אבני הבניין" של כל המספרים הטבעיים. נראה בהמשך עוד תכונות של הראשוניים שהן מעניינות.

המתמטיקאים התעניינו במספרים ראשוניים כבר משחר המתמטיקה; אחת ההוכחות הידועות ביותר במתמטיקה היא ההוכחה של אוקלידס לכך שיש אינסוף ראשוניים (נניח שיש מספר סופי שלהם, אז בואו נכפול את כולם ביחד ונוסיף 1; קיבלנו מספר שאינו מתחלק על ידי אף אחד מהראשוניים במכפלה ומכאן שהוא חייב להתחלק על ידי ראשוני חדש, שונה מכולם) ואחת התוצאות המפורסמות ביותר במתמטיקה היא משפט המספרים הראשוניים, שמתאר במובן מסויים את ה"צפיפיות" של המספרים הראשוניים בתוך קבוצת המספרים הטבעיים. גם הבעיה הפתוחה המפורסמת במתמטיקה, השערת רימן, קשורה בקשר בל ינתק למספרים הראשוניים (היא שקולה לטענה שמהווה חיזוק רב עוצמה של משפט המספרים הראשוניים). עם זאת, לאורך כל תולדותיה של המתמטיקה העיסוק במספרים ראשוניים נותר בגדר עיסוק פנים-מתמטי בלבד, שמטרתו העיקרית היא לספק את סקרנותם של המתמטיקאים. ציטוט ידוע של המתמטיקאי ג'. ה. הארדי, מהמתמטיקאים הבולטים שעסקו בתורת המספרים בחצי הראשון של המאה ה-20, על כך שהוא שמח שהתחום שבו הוא עוסק לא מועיל לשום דבר מעשי ובפרט לא מסייע לשימושים מלחמתיים.

זה השתנה בצורה מוחלטת עם הקריפטוגרפיה של שנות השבעים. אבל קריפטוגרפיה היא תחום עתיק יומין, ותורת המספרים היא שחקן חדש יחסית בו. איך זה קרה?

ראשית, חשוב להעיר שיש תחומים רחבים בקריפטוגרפיה שאינם עושים שימוש במספרים ראשוניים או בתורת המספרים. הדוגמה הבסיסית ביותר היא אלגוריתם ההצפנה AES – דה פקטו אחד מאלגוריתמי ההצפנה הנפוצים בעולם היום, שבו ההצפנה מתבצעת על ידי ביצוע שוב ושוב של סדרה של פעולות פשוטות ביותר על ההודעה שרוצים להצפין. התחום העיקרי (אם כי לא היחיד) שבו תורת המספרים נכנסת לתמונה היא עם שיטות הצפנה ששונות מהותית באופיין מאשר AES. הצפנת AES היא מה שמכונה "הצפנה סימטרית" – כדי לפתוח קובץ שהוצפן עם AES, צריך לדעת את אותה ססמא שבאמצעותה הקובץ הוצפן. זה שימושי מאוד במקרים רבים, אבל לא כאשר רוצים לתקשר עם שרת מרוחק שמעולם לא היה לך קשר אליו עד כה ובוודאי שאין לכם ססמא משותפת. כדי לפתור את הבעיה הזו הומצאו שיטות הצפנה שונות, א-סימטריות: "הצפנת מפתח פומבי". בהצפנה כזו ישנן שתי ססמאות – הפומבית והפרטית. אני מגלה לכל העולם את הססמא הפומבית שלי וכל מי שרוצה להצפין משהו ולשלוח לי עושה זאת באמצעות הססמא הפומבית; אבל כדי לפתוח קובץ שהוצפן באמצעות הססמא הפומבית חייבים את הססמא הפרטית, שאותה יש לי ולי בלבד. בהערת אגב, בעולם האמיתי הצפנות א-סימטריות והצפנות סימטריות עובדות יחד בהרמוניה – משתמשים בהצפנה א-סימטרית כדי להסכים על ססמא משותפת, ואז שאר התקשורת מתנהלת בהצפנה סימטרית (שכן השיטות הסימטריות כיום מהירות ואמינות משמעותית יותר מאלו הא-סימטריות).

הרעיון של הצפנת מפתח ציבורי הוצע באופן פומבי לראשונה בשנת 1976 במאמר של דיפי והלמן, אלא שהם לא הצליחו לגלות שיטה מעשית שתאפשר הצפנת מפתח ציבורי. עם זאת, הם הציעו שיטה לשיתוף מפתחות – שיטה שבה שני צדדים מרוחקים בלי ידע מוקדם מסוגלים ליצור ססמא סודית שתהיה משותפת לשניהם ולא תהיה ידועה לאף אחד שמצותת לתקשורת ביניהם (אבל, וזו החולשה הגדולה של האלגוריתם – אם מישהו יצליח להשתלט על קו התקשורת ביניהם הוא יהיה מסוגל להטעות את שני המשתתפים ולגרום להם לשתף מפתח איתו). השיטה הזו מעניינת במיוחד מכיוון שהיא משתמשת במספרים ראשוניים, ובאופן שמבהיר יפה את השימוש העיקרי שלהם בקריפטוגרפיה: כפל מודולו \(p\) כאשר \(p\) הוא מספר ראשוני.

"כפל מודולו \(p\)" הוא דרך לתאר פעולת כפל רגילה של שני מספרים, שאחריה מחלקים את התוצאה ב-\(p\) ונשארים עם השארית. למשל, אם \(p\) הוא 17, אז 8 כפול 5 מודולו \(p\)יחזיר 6, שכן 8 כפול 5 הוא 40, וכשמחלקים ב-17 מקבלים מנה 2 ושארית 6. כפל מודולרי שכזה קל מאוד לממש במחשב, ויתרונו בכך שהוא נותן מבנה יפה לקבוצת המספרים מ-0 ועד \(p-1\), שאסמן מעתה ואילך ב-\(\mathbb{Z}_{p}\). מבחינה מתמטית המבנה הזה נקרא שדה, וזוהי דרך אחרת לומר שאפשר להגדיר עליהם פעולות של כפל וחיבור (גם חיבור מוגדר מודולו \(p\)) כך שכל כללי החשבון שאנחנו מכירים ואוהבים יתקיימו: כלל החילוף, כלל הקיבוץ וכלל הפילוג, ובנוסף לכך לכל איבר יהיה נגדי ביחס לחיבור (מספר שאם מחברים אותו למספר המקורי מקבלים 0; הנגדיים של המספרים הטבעיים ביחס לפעולת החיבור הרגילה הם המספרים השליליים) וחשוב מכל – לכל איבר יהיה הופכי ביחס לכפל, כלומר אפשר "לחלק". הנה דוגמה: אם אנחנו עובדים מודולו 17, אז כאשר כופלים את 5 ב-7 מקבלים 35, ואחרי חלוקה ב-17 ולקיחת שארית מקבלים 1. זה אומר ש-7 הוא ההופכי הכפלי של 5, ובמקום "לחלק ב-5" (פעולה שלא באמת מוגדרת עבור מספרים שלמים) אפשר לכפול ב-7.

עוד תכונה רלוונטית היא שלכל מספר ראשוני \(p\) קיים מספר \(g\) ששייך ל-\(\mathbb{Z}_{p}\) בעל התכונה שהחזקות \(g^{0},g^{1},\dots,g^{p-1}\), כשמסתכלים עליהן מודולו \(p\), הן בדיוק כל האיברים של \(\mathbb{Z}_{p}\) (למעט 0). מספר \(g\) כזה נקרא יוצר של \(\mathbb{Z}_{p}\).

עכשיו אפשר להסביר איך שיטת החלפת המפתחות של דיפי-הלמן עובדת: שני הצדדים, שאקרא להם אליס ובוב, מסכימים ביניהם על \(p\) ועל \(g\) מתאים עבורו (אין צורך לשמור אותם בסוד). אז אליס מגרילה לעצמה \(x\) ובוב מגריל לעצמו \(y\) ששניהם מספרים בין \(1\) ו-\(p-1\). עכשיו אליס מחשבת ושולחת לבוב את \(g^{x}\) ואילו בוב מחשב ושולח לאליס את \(g^{y}\). כעת כל אחד מעלה את המספר שהוא קיבל מהשני בחזקת המספר שהוא הגריל. למשל, אליס קיבלה את \(g^{y}\), אז היא תעלה את זה בחזקת \(x\), ומחוקי החזקות הרגילים, שמתקיימים גם עבור הכפל של \(\mathbb{Z}_{p}\) יתקיים \(\left(g^{y}\right)^{x}=g^{xy}\). באופן דומה החישוב של בוב יניב את \(\left(g^{x}\right)^{y}=g^{xy}\).

כך קרה שאליס ובוב מחזיקים כעת שניהם במספר משותף – \(g^{xy}\), אבל האם מישהו שציתת לתקשורת ביניהם יודע מהו? הוא יודע מהו \(g^{x}\) ומהו \(g^{y}\), אבל לא ברור איך לגלות מכך מהו \(g^{xy}\). על פניו, אפשר אולי לחשוב שאם התוקף יודע מהו \(g\) (זה הרי מידע פומבי) ויודע מהו \(g^{x}\) הוא יוכל לגלות מכך את \(x\), אבל זו בעיה קשה מבחינה חישובית, ואפילו יש לה שם – בעיית הלוגריתם הדיסקרטי. אפשר, כמובן, לנסות את כל הערכים האפשריים של \(x\) עד שמגיעים לאחד הנכון (להעלות את \(g\) בחזקה שלהם ולראות אם קיבלנו את \(g^{x}\)) ולכן חשוב שיהיו המון ערכים אפשריים של \(x\); כמו כן צריך להתגונן בפני שיטות חיפוש מחוכמות יותר (ויש כאלו) ולכן כדי שהשיטה של דיפי-הלמן תהיה בטוחה חייבים לעבוד עם מספר ראשוני \(p\) שהוא גדול יחסית – בן מאות ספרות (מספרים כמו 2048 ביטים או 4096 ביטים הם סדרי הגודל הנפוצים בימינו בדיבורים על ראשוניים בקריפטוגרפיה).

דיפי-הלמן ממחיש יפה איך ראשוניים עוזרים לנו בקריפטוגרפיה. לב-לבו של האלגוריתם הוא בכך שיש פונקציה שקל לחשב אבל קשה להפוך – העלאת \(g\) בחזקה, במקרה שלנו. התכונה היפה הזו קיימת ב-\(\mathbb{Z}_{p}\) אבל היא לחלוטין לא קיימת במספרים שלמים או ממשיים "רגילים". זו בדיוק הסיבה שהקריפטוגרפים נדחפו להשתמש במשהו כמו \(\mathbb{Z}_{p}\) – זה התגלה בתור "שדה משחק" מתאים לצרכים של הקריפטוגרפיה.

שנה אחרי דיפי והלמן התפרסם מאמר של ריבסט, שמיר ואדלמן (RSA) שהציג מערכת הצפנה פומבית של ממש. הרעיון של RSA היה שימוש בפונקציה מסוג שנקרא Trapdoor Function: פונקציה שקל לחשב ובאופן כללי קשה להפוך, אבל אם יש לך מידע (סודי) נוסף, היפוך שלה הופך לקל. באופן די מעניין, RSA עובד מעל \(\mathbb{Z}_{n}\) עבור \(n\) שאינו ראשוני, מה שאומר ש-\(n\) אינו שדה – לא תמיד אפשר לבצע בו חלוקה – אבל דווקא בגלל שהוא קצת "שבור" יש בו פונקציית מלכודת.

אם כן, הרעיון הוא כזה: נניח שאני רוצה להקים מערכת מפתח פומבי שבה כל העולם יוכל לשלוח לי דברים מוצפנים אבל רק אני אוכל לפענח. מה שאני עושה ראשית כל הוא למצוא שני מספרים ראשוניים גדולים \(p,q\). כעת אני כופל אותם ומקבל \(n=pq\). אחר כך אני מוצא זוג מספרים \(e,d\) בעלי התכונה ש-\(ed-1\) מתחלק ב-\(\left(p-1\right)\left(q-1\right)\). לא אסביר כעת את המתמטיקה המדויקת שמאחורי העניין, אך התכונה הזו של \(e,d\) מבטיחה שיתקיים הדבר הבא: \(\left(M^{e}\right)^{d}=M\), כאשר החשבון מבוצע מודולו \(n\).

כעת, אני מפרסם לעולם כולו את \(n\) ואת \(e\), אבל מותיר את \(d\) סודי. אם מישהו רוצה להצפין ולשלוח לי הודעה \(M\), הוא מחשב את \(M^{e}\) מודולו \(n\) ושולח לי. כדי לפענח, אני מעלה בחזקת \(d\) את מה שקיבלתי. פשוט להחריד. כאן פונקציית ה-Trapdoor היא פשוט העלאה בחזקת \(e\), וה"מידע נוסף" שהופך אותה לקלה להיפוך הוא \(d\).

כעת אנו מגיעים לנקודה שלדעתי גורמת לבלבול הגדול ביותר בקרב הטוקבקיסטים שציטטתי לעיל. כדי לבנות את מערכת ה-RSA, אחרי שמחליטים על \(n\) ועל \(e\) אפשר לחשב את \(d\) מתוך \(e\) ומתוך \(\left(p-1\right)\left(q-1\right)\). במילים אחרות, מי שמכיר את \(\left(p-1\right)\left(q-1\right)\) ואת \(e\) יכול לפרוץ את ההצפנה. קרוב לודאי שאתם מקבלים תחושה ש-RSA מאוד פגיעה בשל כך, אבל כדאי לזכור שב-RSA משתמשים כל הזמן, בכל מקום. אז למה זה עובד? כי גם אם יש לי את \(n=pq\), זה לא אומר שאני יכול לחשב מתוכו בקלות את \(\left(p-1\right)\left(q-1\right)\); הדרך הברורה לעשות זאת היא קודם כל לפרק את \(n\) לגורמים, כלומר למצוא את \(p,q\), אבל בעיית הפירוק לגורמים היא בעיה קשה. שימו לב: בעיית הפירוק לגורמים, לא בעיית בדיקת הראשוניות אלו שתי בעיות שונות, ובעיית הפירוק לגורמים מאז ומעולם נחשבה לקשה יותר.

במבט ראשון לא כל כך ברור למה הבעיות הללו שונות. לכאורה, כדי להראות שמספר הוא לא ראשוני צריך להציג פירוק שלו לגורמים. השיטה הנאיבית הידועה לבדיקת ראשוניות ("עד השורש") פשוט עוברת על המחלקים הפוטנציאליים של המספר אחד אחד עד שהיא מוצאת אחד. אלא שבמתמטיקה יש שיטות מחוכמות הרבה יותר לבדיקת ראשוניות, שיטות שמאפשרות לגלות שמספר אינו ראשוני לא בגלל שמצאנו גורם שלו, אלא בגלל שמשהו ב"עולם" לא מתנהג כמו שצריך – יש איזה שהוא גליץ' במטריקס. אתן דוגמה קטנה לאופן שבו דברים יכולים להשתבש (אם כי בפני עצמה התכונה הזו לא מספיקה כדי לבדוק ראשוניות – צריך לשלב אותה עם עוד משהו).

התכונה נקראת "המשפט הקטן של פרמה" וקובעת שאם \(p\) הוא ראשוני ו-\(a\) הוא מספר כלשהו ב-\(\mathbb{Z}_{p}\), אז \(a^{p-1}=1\) (כשהחשבון הוא מודולו \(p\)). אם נתונים לנו \(p,a\) אז קל ומהיר למדי לבצע את החישוב של \(a^{p-1}\) (איך? זה עניין לפעם אחרת). אם נקבל משהו ששונה מ-\(1\), אז מובטח לנו ש-\(p\) לא היה ראשוני, למרות שאין לנו שום מחלק שלו. וזו רק תכונה אחת מני רבות. אנחנו מסתמכים כאן בצורה חזקה על כך שראשוניים הופכים מבנים מתמטיים ל"יפים", במובן זה שיש תכונות נחמדות מסויימות שמתקיימות בהם, ואם משהו משתבש לעתים קרובות קל לגלות זאת.

אם כן, אם נחזור לטוקבקיסט שאמר "אין אלגוריתם או תוכנה שמסוגלת לחשב מספרים ראשוניים. לכן זאת נחשבת ההצפנה הטובה ביותר", הנה הטעות שלו: דווקא יש אלגוריתמים מצויינים שיודעים למצוא מספרים ראשוניים. יתר על כן: בלעדי אלגוריתמים שכאלו מספרים ראשוניים לא היו בעלי ערך רב בקריפטוגרפיה. שימו לב שבשביל RSA מי שמייצר את המערכת חייב לעבוד עם שני ראשוניים "סודיים" – אסור שיהיה קל למישהו לנחש עם איזה ראשוניים הוא בחר לעבוד. לכן לא נכון לומר ש"יש מספיק" ראשוניים – כל מי שרוצה לבנות מערכת הצפנה צריך להגריל ראשוניים גדולים אחרת הוא מסתכן בכך שיהיה קל לפרוץ אותו. למרבה המזל יש המון ראשוניים בסדרי הגודל המתאימים.

כעת בואו נחזור לראשוני הגדול ביותר שנתגלה עד כה. האם הוא רלוונטי להצפנה בצורה כלשהי? לחלוטין לא. ראשית, הוא גדול מדי. בדוגמאות של דיפי הלמן ושל RSA ראינו שהאופן שבו מנצלים ראשוניים הוא בביצוע פעולות חשבוניות על מספרים שהם בערך מאותו סדר גודל כמו הראשוניים הללו. עכשיו, פעולות חשבוניות פשוטות כמו חיבור, כפל, העלאה בחזקה וכדומה דורשות זמן שהוא פרופורציוני למספר הספרות של המספרים שעליהם מבצעים אותן (או פרופורציוני בריבוע/בשלישית, תלוי איזו פעולה). כלומר, כדי לחבר שני מספרים בני 100 ספרות נצטרך לבצע בערך רק 100 פעולות – לא רע, בהתחשב בכמה שהמספרים הללו גדולים. לרוב שיטות ההצפנה בימינו די לנו במספרים של כמה מאות ספרות, מקסימום אלפי ספרות. לעומת זאת, בראשוני החדש יש בערך שבע-עשרה וחצי מיליון ספרות, מה שאומר שמערכת הצפנה שתתבססס עליו תהיה איטית למדי. האם היא גם תהיה בטוחה הרבה יותר? לא בהכרח, כי הנה החסרון הנוסף של המספר הזה – כולם מכירים אותו. אם עכשיו כולם יתאחדו ויחשבו על דרכים מועילות לפרוץ מערכות הצפנה שמבוססות ספציפי על המספר הראשוני הזה, יש סיכוי שהם יצליחו לגלות תכונות או קיצורי דרך שיעזרו להתגבר עליו. זה נכון, כמובן, לכל מספר ראשוני; ולכן עדיף לעבוד עם ראשוניים אקראיים בכל פעם שבה בונים מערכת הצפנה חדשה ולא להסתמך על אחד קיים (גם זה לא בהכרח מדויק – יש מערכות הצפנה שכן מבוססות על ראשוניים "מוכרים", אבל את הבעיה שתיארתי עדיין צריך להביא בחשבון).

אפשר אולי עוד היה לקוות שגילוי הראשוני החדש יעיד על שיפור משמעותי ביכולת שלנו למצוא מספרים ראשוניים, אבל אפילו זה לא נכון. הראשוני הזה, כמו פחות או יותר כל הראשוניים הגדולים שהתגלו בעשורים האחרונים, הוא מצורה מאוד מיוחדת – \(2^{n}-1\) עבור ערך ספציפי של \(n\). ראשוני כזה נקרא ראשוני מרסן, וידועים בדיוק 48 כאלו – כמעט כלום. אם כן, איך קרה ה"מזל" הזה שהראשוני שנתגלה היה דווקא מהצורה הזו? כמובן שלא במקרה: יש אלגוריתם יעיל מאוד לבדיקה האם מספר מהצורה \(2^{n}-1\) הוא ראשוני או לא – יעיל משמעותית יותר מאלגוריתמים שמטפלים במספרים "כלליים", ולכן מוצלח יותר במציאת ראשוניים גדולים משמעותית מאלו שהשיטות הכלליות יודעות למצוא. אם כן, כדי למצוא "סתם" ראשוניים אקראים למערכת ההצפנה שלנו אין בכלל טעם להשתמש בו – אם אנחנו רוצים ראשוני שהוא מספר מרסן אנחנו פשוט יכולים לבחור מתוך הרשימה של הראשוניים הידועים, ואם חשוב לנו מספר אקראי, נצטרך להשתמש באלגוריתמים הרגילים.

אז אם שואלים אתכם בשביל מה גילוי הראשוני החדש טוב, תגידו שזה בשביל חדות הגילוי המתמטי. לעומת זאת אם שואלים אתכם בשביל מה מספרים ראשוניים טובים באופן כללי, אני מקווה שכעת יותר ברור לכם כיצד הם רלוונטיים לקריפטוגרפיה.

למה לא רציונלי לדבר על לא רציונליים (באינסוף)

עיתון "הארץ" עשה מעשה נאה ופרסם מאמר על מושג האינסוף. על כך יבורך; כל מאמר על נושא מדעי/מתמטי הוא דבר רצוי וראוי. המאמר הוא תרגום של מאמר מהניו-יורק טיימס של אחת, נטלי אנג'ייר, שכבר כתבתי בעבר פוסט נזעם על ספר שלה, "הקנון המדעי", שבו במחי כמה פסקות היא הציגה, לטעמי, את המתמטיקה בצורה השגויה ביותר שניתן להעלות על הדעת, כך שבאתי למאמר הנוכחי משוחד לרעה ובמצב רוח של מציאת שגיאות קטנוניות ככל הניתן.

התאכזבתי. המאמר הוא די בסדר, אם כי שטחי ומפוזר למדי לטעמי אפילו בהתחשב בנסיבות של מאמר בעיתון להמונים. אם רוצים להשתעשע, אפשר ללעוג קצת לציטוט הזה:

יש סוגי אינסוף המוכרים לנו מהיומיום, כמו המספר פאי, עם רצף הספרות האינסופי חסר המחזוריות מימין לנקודה. אבל מה יקרה אם נעגל את פאי ל-3.14159, ואז נגיש פאי תפוחים ב-14 במארס בשעה 1:59?

(מה באמת יקרה? כנראה שנאכל פאי תפוחים).

למרות כל זה, אני חושב שבמאמר יש בלבול שהוא נפוץ ביותר וגם אני לקיתי בו בעבר, שכדאי לשים עליו את האצבע. לא כדי ללעוג לאנג'יר על טעויות מביכות, כי זה בלבול נסלח בהחלט; פשוט בגלל שלטעמי הנקודה הזו מעניינת ומי שקורא את המאמר מחמיץ אותה לחלוטין.

המדובר על הציטוט הבא:

ביוון העתיקה "אימצו גישה חשדנית ועוינת למושג האינסוף", אומר א. וו. מור, מרצה לפילוסופיה באוניברסיטת אוקספורד ומחבר הספר The Infinite (1990). היוונים העדיפו מספרים רציונליים, שלפי הגדרתם יכולים להיכתב כשבר, כפי ש-0.75 שווה ל ¾ בדיוק, על פני מספרים אי-רציונליים כמו השורש הריבועי של 2, שהם בעלי עשרות ספרות חסרות מחזוריות.

איני רוצה להיכנס לדיון ההיסטורי על היחס של היוונים למספרים אי רציונליים, בפרט כי איני בקיא בו. אני כן רוצה לתהות על עירוב המספרים הללו יחד עם דיון על מושג האינסוף. ראשית אעיר כי מספרים אי רציונליים סובלים מבעיה "סופית" לחלוטין – אי אפשר להציג אותם כמנה של שני מספרים שלמים, או בניסוח שאולי יותר הולם את גישתם של היוונים, אם יש לנו קטע שאורכו הוא מספר שלם, וקטע שאורכו הוא מספר אי רציונלי, אין לשני הקטעים הללו מידה משותפת – אין קטע שלישי, קטן משניהם, שנכנס בכל אחד מהקטעים מספר פעמים שלם (להבדיל, למשל, מ-¾ ו-5, שהקטע שאורכו רבע הוא מידה משותפת לשניהם כי הוא נכנס שלוש פעמים ב-¾  ועשרים פעמים ב-5). אני סקרן לדעת האם ההתנגדות של היוונים לאי-רציונליים (בהנחה שאכן הייתה כזו – אני יודע על פיתגורס אבל לא יותר) נבעה מנימוקים של חוסר מידה משותפת או מנימוקים של "אינסוף".

מה שאני כן רוצה לטעון כאן הוא שבעייתי מאוד לזהות את המספרים האי-רציונליים עם "אינסוף" בעזרת הטיעון של "אינסוף ספרות" (או "עשרות ספרות" בלשונה הציורית של אנג'יר). נתחיל מכך שאנג'יר עושה לעצמה חיים קלים בכך שהיא מביאה את ¾ כדוגמה. הוא אכן ניתן לכתיבה יפה בתור 0.75, אבל לא כל המספרים הרציונליים כאלו! הדוגמה הפשוטה ביותר היא שליש, 1/3, שכאשר ננסה להציג אותו בבסיס עשרוני נקבל את המספר …0.333 שהוא בעל אינסוף חזרות של 3 על עצמו (זו המשמעות של שלוש הנקודות).

יתר על כן, אין מקריות בתופעה הזו – זה לא שלשליש יש איזו תכונה "רעה" ולשלושת-רבעי יש תכונה "טובה" מקרית. לא קשה להוכיח שבאופן כללי, הייצוג העשרוני של מספר רציונלי הוא סופי אם ורק אם המכנה שלו הוא מכפלה של מספר כלשהו של 2 ו-5 בלבד. למה דווקא 2 ו-5? כי אלו המחלקים הראשוניים של 10, שהוא המספר שבבסיס הספירה העשרונית. זה מעביר אותנו לפאנץ' הראשון: בבסיס ספירה אחר, למשל בבסיס ספירה עם 9 ספרות בלבד, המספר ¾ דווקא יהיה בעל ייצוג האינסופי …0.666, בעוד 1/3 יהיה בעל הייצוג הסופי 0.3 (אגב, אפשר גם להעיר שייצוג "סופי" כמו 0.3 הוא גם כן אינסופי, שהרי אחרי ה-3 מגיעות עוד אינסוף ספרות שכולן 0).

בשלב הזה קרוב לודאי שחלקכם כבר ממש מרוגזים עלי ומתכננים פוסט שישמיץ אותי. הרי בכל הדיון הזה על בסיסי ספירה אני מתעלם מנקודה עקרונית שאנג'יר דווקא כן הזכירה, ומבדילה מספרים רציונליים מאי-רציונליים: לא חשוב אם יש אינסוף ספרות או אין, חשוב אם אותן אינסוף ספרות הן מחזוריות או לא. ואנג'יר מדברת, שחור על גבי לבן, על כך שבמספרים אי רציונליים יש "עשרות ספרות חסרות מחזוריות". בכך היא צודקת לחלוטין – אפשר להוכיח (וזה גם לא קשה במיוחד) שמספר הוא רציונלי אם ורק אם הספרות שלו בפיתוח עשרוני (או פיתוח לפי כל בסיס ספירה אחר) הן מחזוריות. אבל למה, בעצם, שזה יהיה משנה מבחינת ה"אינסופיות" שלו?

ובכן, אנג'יר כמובן לא נותנת תשובה למהות ההבדל בין אינסוף מחזורי ואינסוף לא מחזורי, מה שלטעמי מעיד על רדידות המאמר שלה ומותיר לי רק את האפשרות של לנחש את הבעיה. אני מנחש שהתשובה הטבעית ביותר היא שאינסוף ספרות שהן מחזוריות אפשר לכתוב בצורה סופית. כך למשל …0.333 היא בעצם שיטת כתיבה סופית בהחלט למספר שליש: שלוש הנקודות אומרות "מכאן והלאה תחזור על התבנית שכבר ראית" (כדי להיות ממש מדוייקים, בכתיבה כללית של מספרים רציונליים שבהם ההתחלה יכולה לכלול חלק לא מחזורי נהוג למתוח קו מעל קבוצת הספרות הסופית שחוזרת על עצמה, אבל זה לא חשוב כרגע).

מה הקאץ'? שגם לשורש 2 קיים ייצוג מחזורי. לא ייצוג עשרוני, כמובן, אלא ייצוג בתור שבר משולב אינסופי. למי שמעוניין לקרוא על שברים משולבים יש לי שני פוסטים שמציגים אותם. כאן לא אכנס לפרטים הטכניים אלא אסתפק בשורה התחתונה: כל מספר ממשי אפשר לייצג על ידי שבר משולב אינסופי, כאשר בתכל'ס הקידוד הזה מבוצע על ידי סדרה של מספרים טבעיים. מספר הוא רציונלי אם ורק אם הסדרה הזו היא סופית; אבל זה לא אומר שלמספרים האי-רציונליים יש בהכרח שבר משולב לא מחזורי: תוצאה יפהפיה של לגראנז' (מתמטיקאי איטלקי-צרפתי בן המאה ה-18 – הרבה אחרי היוונים הקדמונים) מראה כי כל מספר אי רציונלי שהוא פתרון של משוואה ממעלה שניה במספרים רציונליים הוא בעל שבר משולב אינסופי מחזורי, וגם ההפך נכון (כל מספר בעל שבר משולב אינסופי מחזורי הוא פתרון של משוואה שכזו). בפרט שורש 2 הוא פתרון של משוואה שכזו – \(x^2-2=0\) ולכן יש לו הצגה כשבר משולב מחזורי אינסופי, שמיוצג על ידי סדרה פשוטה למדי: …1,2,2,2. אגב, המספר שמיוצג על ידי הסדרה האינסופית-מחזורית הפשוטה ביותר שניתן להעלות על הדעת – …1,1,1,1 – הוא ידידם הטוב ביותר של סופרי המתמטיקה הפופולרית – יחס הזהב (האי-רציונלי למהדרין).

ייתכן שקשה לכם להסכים עם ההכנסה של שברים משולבים למשחק, בפרט אם מעולם לא נתקלתם בהם עד כה. אולי אתם לא מוכנים להכיר בהם בתור ייצוג חוקי בכלל. ובכן, אני מזמין אתכם לקרוא את הפוסטים בנושא ולהבין מדוע לטעמי הם ייצוג לגיטימי; למעשה, במובן מסויים שברים משולבים הם ייצוג יותר טוב ויותר נכון למספרים מאשר הייצוג העשרוני. למשל, גם ייצוג עשרוני וגם ייצוג על ידי שברים משולבים מגדירים בשורה התחתונה סדרה של קירובים רציונליים למספר המיוצג; ניתן להוכיח (ואני עושה זאת בפוסטים) שסדרת הקירובים שהשבר המשולב נותן היא הטובה ביותר האפשרית בעוד שזו של ייצוג עשרוני – לא.

אם כן, עלינו להחליט. האם ייצוג של משהו על ידי אינסוף ספרות הוא רע או טוב? אם אינסוף ספרות זה אוטומטית רע, הרציונליים בבעיה; אם אינסוף ספרות זה לא רע כל עוד הן מחזוריות, אז גם חלק מהאי-רציונליים הם במצב טוב, למשל שורש 2 שאנג'יר השתמשה בו כדוגמה. כדאי גם להעיר שאפילו חלק מהמספרים טרנסנדנטיים כמו e הם בעלי הצגות נחמדות כשברים משולבים: הסדרה שמתאימה ל-e היא …2,1,1,4,1,1,6,1,1 שאיננה מחזורית במובן הפשטני של המילה אבל בבירור היא מתוארת על ידי תבנית קצרה ופשוטה. זה מנוגד לחלוטין לתפיסה הרווחת של המספרים האי-רציונליים ככאלו שאין מנוס מלהציג אותם בצורה "מבולגנת", כפי שעשוי להתקבל הרושם כאשר מסתכלים על הייצוג העשרוני הרגיל של שורש 2, …1.41421356237.

מיותר לציין שבמאמר של אנג'יר כל זה לא מופיע ולו ברמז. קשה להתלונן על כך – זה הרי מאמר שטחי שנוקט בגישת "תפסת מרובה לא תפסת" ומנסה להציג כמה שיותר תחומים וגישות. הוא לא יכול להתעמק באף אחת מהן. מה שרציתי להראות בפוסט הזה הוא שחוסר ההתעמקות הזה מוביל לעתים קרובות לפספוס מוחלט של הפואנטה, להטעיית הקורא, וגרוע מכל – להמנעות מהצגת הדברים המגניבים באמת שנוגעים לתחום שעליו מדברים.

ההרצאות שלי בפסטיבל אייקון 2012

בשעה טובה עלו לאינטרנט סרטוני וידאו של ההרצאות שלי בפסטיבל אייקון, שהזכרתי כאן.

שתי ההרצאות מיועדות לקהל הרחב, כלומר אינן מניחות שום ידע קודם במתמטיקה. אני מקווה שהן גם הצילחו לעמוד בייעוד הזה. מבין שתיהן, ההרצאה על הגיאומטריות הלא-אוקלידיות זכתה לתגובות טובות יותר.

לי עצמי יש לא מעט ביקורת על רמת ההרצאות (בפרט, בזו של הגיאומטריה האוקלידית רואים שאני בקושי מבין משהו בנושא שעליו אני מדבר, ובזו של הקריפטוגרפיה אני שטחי הרבה יותר מדי) אבל אני מקווה שהן ברמה סבירה.

אני מצרף גם את המצגות שהשתמשתי בהן בהרצאות.

 גיאומטריה לא אוקלידית: מלובצ'בסקי ועד קת'ולהו: מצגת ווידאו.

הצופן המדעי – קריפטוגרפיה במדע הבדיוני: מצגת ווידאו.

מבחן טיורינג

אלן טיורינג, שהשנה חגגנו את יום הולדתו ה-100, היה מחשובי המדענים של המאה ה-20. במאמר מ-1936 הוא הניח את היסודות לתיאוריה של מדעי המחשב, ובאותה ההזדמנות גם נתן השראה לחלוצים שמבין בוני המחשבים הפיזיים. בשנות מלחמת העולם השניה הוא היה אחד מהבולטים שבמפצחי הצפנים של אנגליה בבלצ'לי פארק ובכך תרם תרומה חשובה לניצחון בעלות הברית במלחמה. פרט לכך הוא התעסק בעוד המוני דברים אחרים. עם זאת, דומני שאת טיורינג רובו של הציבור הרחב מכיר בראש ובראשונה דרך מבחן טיורינג הנושא את שמו, למרות שאיני בטוח אם טיורינג עצמו היה מחשיב את המבחן לאחד מהחשובים שברעיונותיו. למרות זאת המבחן מעניין והגיע הזמן להקדיש לו פוסט.

המוטיבציה העדכנית שלי מגיעה מ"ליל המדענים" שנערך בישראל ביום שני האחרון, ובמסגרתו שודר שעשועון בשם "אדם מול מכונה" שבלי ספק התקיים בהשראת מבחן טיורינג. מכיוון שבדיווח של Ynet השעשועון זכה לכותרות של "המחשב הצליח להערים על בני האנוש", נכתב כי השעשועון "מדמה מבחן טיורינג" ואפילו שר המדע והטכנולוגיה, המתמטיקאי דניאל הרשקוביץ צוטט כאומר ש"ניתן להגיד בהסתייגות זהירה כי המחשב עבר את מבחן טיורינג, לפחות בשעשועון זה", אני חושב שלא יזיק להעמיד דברים על דיוקם, להסביר מה הרעיון במבחן טיורינג ולמה שעשועון ה"אדם מול מכונה" הוא ממש לא מבחן טיורינג ותוצאותיו לא ממש אומרות משהו.

מבחן טיורינג, בבסיסו, הוא מבחן שבו מתחרים מחשב ובן אדם. הם מתקשרים עם בוחן אנושי באמצעות מסך צ'אט, והבוחן שואל אותם שאלות, כאשר מטרתו היא להבין מי האדם ומי המחשב. אם הבוחן הצליח לגלות מיהו המחשב, המחשב "הפסיד"; אם הבוחן אינו מסוגל להגיע להכרעה או שהוא טועה, המחשב "מנצח", או בלשון היותר נייטרלית שבה אשתמש – עובר את מבחן טיורינג. כמובן שמבחן אחד לא מספיק – צריך לחזור על המבחן עם הרבה בוחנים שונים כדי להגיע למסקנה סבירה כלשהי.

מבחן טיורינג, גרסת xkcd.

את המבחן הזה הציע טיורינג במאמר ששמו Computing Machinery and Intelligence משנת 1950 וניתן לראות כאן. המאמר הוא קריא ולא טכני יחסית (יחסית! יש בו חלקים טכניים באמצע שלטעמי הם מיותרים למדי) ואני ממליץ לכולכם לתת לו צ'אנס. המאמר עצמו פורסם בכתב עת פילוסופי, לא מתמטי, ונכתב בצורה לא-פורמלית למדי; לדעתי טיורינג עצמו לא לקח את המאמר יותר מדי ברצינות, מתוך הכרה בכך שהשאלה שהוא מנסה להתמודד איתה היא כבדה מדי מכדי שתוכל להיות מוכרעת באמצעות המבחן. ומה השאלה הזו? טיורינג פותח איתה את המאמר – זוהי השאלה "האם מכונות יכולות לחשוב?".

זו שאלה קשה, קשה ביותר, ועם השלכות לא פשוטות כלל (למשל, אם מכונות אכן מסוגלות לחשוב, האם יש להן תודעה? אם כן, האם זה מוסרי לכבות אותן?). כפי שטיורינג מציין היטב בפתח המאמר, לב הבעיה בהתמודדות עם השאלה הזו היא שלא ברור לנו מהי "מכונה" (האם אדם איננו בסופו של דבר מכונה מורכבת? והאם מחשב שייבנה מרקמות ביולוגיות עדיין יקרא "מכונה"?) ולא ברור לנו מה פירוש המילה "לחשוב". העובדה שהמילים הללו לא מוגדרות מונעות מראש כל דיון מתמטי בנושא. על כן, טיורינג רצה להתחמק מהשאלה הזו על ידי מעבר לשאלה אחרת שאפשר להתמודד איתה בצורה יותר מדויקת. הרעיון שלו הגיע ממשחק חברה שהיה מוכר בזמנו, שבו גבר ואישה מנהלים שיחה עם "בוחן" – ושוב, דרך צ'אט (בזמנו של טיורינג לא היה צ'אט אז הוא מדבר על חדרים נפרדים ושאלות ותשובות שנכתבות במכונת כתיבה), ומטרת הבוחן היא לגלות מי הגבר ומי האישה. כמובן שהשחקנים לא חייבים להיות דוברי אמת (אחרת הבוחן יכול פשוט לשאול "האם אתה גבר?") וזה מה שמעניק למשחק הזה את העניין שבו. ההנחה היא שאחד השחקנים רוצה לעזור לבוחן להצליח, בעוד שהשחקן השני הוא הנבחן האמיתי, ומטרתו היא להטעות את הבוחן.

אם כן, כל מה שטיורינג הציע הוא לקחת את המשחק הזה ולשחק אותו עם מחשב ובן אדם. את כל זה הוא עושה בעמוד הראשון של המאמר. אם כן, מה הוא עושה בעשרים העמודים הנותרים? בעיקר מנסה לשכנע את הקורא שהמבחן הוא מעניין ולהתייחס להתנגדויות המובנות מאליהן אליו ואל התפיסה שמחשבים יכולים לחשוב (ובאופן מרתק למדי, הוא מכסה פחות או יותר כל טיעון ששמעתי עד היום בנושא; אולם נגיע לכך בהמשך).

טיורינג מעלה מייד כמה נקודות ברורות בנוגע למבחן:

  • המבחן מסנן החוצה כל אספקט "פיזיקלי" של ההבדלים בין אנשים ומכונות. גם בימינו, שישים שנים לאחר המאמר של טיורינג, עדיין אין רובוטים שנראים באופן מושלם כמו בני אדם (אם כי חייבים להודות שהתחום התפתח בצורה מרשימה). כל רובוט בימינו היה כנראה מפסיד את המבחן מייד בשל המראה שלו, בלי קשר לשאלה האם הוא מסוגל לחשוב או לא. לכן עניין ההפרדה ופורמט התשובות (צ'אט) הוא קריטי למדי.
  • המבחן מוטה מאוד לרעת המכונה; בבירור, אם המצב היה הפוך, והמבחן היה כולל אדם שמנסה להתחזות למכונה הוא היה מפסיד מייד, מכיוון שמכונות מסוגלות לבצע חישובים במהירות אדירה בהרבה אפילו מאנשים שהם מחשבונים אנושיים. טיורינג מסכים שההטיה הזו קיימת, אבל הדבר אינו בעייתי באמת כי זה רק אומר שאם מכונה כלשהי תעבור את המבחן, ההישג שלה יהיה מרשים אף יותר (כמו כן, לדעתי ההטייה הזו מעידה על ההבדל בין "חשיבה" ו"חישוב" עבורנו, אף שכלל לא ברור שברמה הבסיסית ביותר אין מדובר על אותו הדבר).
  • לדעת טיורינג, ההנחה לפיה הדרך הטובה ביותר לנצח במשחק היא אכן לענות תשובות שבן אדם היה עונה היא הנחה סבירה מספיק כדי שלא לחקור אפשרויות אחרות. אני אישית נוטה להסכים עם טיורינג ולא זכורה לי ביקורת על המבחן שבאמת הולכת לכיוון הזה.

מה שטיורינג לא אומר הוא שמכונה שעוברת את המשחק אכן מסוגלת לחשוב. זו הסקת מסקנות חפוזה למדי! אם כבר ההפך הוא נכון – מכונה שמסוגלת לחשוב, סביר להניח שתעבור את המבחן.

כעת, בואו נעזוב לעת עתה את המאמר של טיורינג וננסה לראות האם הבנו את הרעיון של המבחן (ולמה הוא כל כך מוצלח) דרך התבוננות במשחק ה"אדם מול מכונה" והבנה של הדרכים הרבות שבהן הוא שונה מהמבחן של טיורינג.

בעיה בסיסית במבחן טיורינג היא שהוא אינו מצטלם טוב. מה, נצלם איש באולפן מקליד שאלות לצ'אט ומקבל תשובות? זה כנראה בלתי נסבל לחלוטין עבור מי שמעוניינים בפופולריזציה של מדעי המחשב, וזו הייתה מטרתם של עורכי המשחק. אין לי ספק שזו מטרה ראויה ביותר, וגם אין לי ספק שהבחירה בפופולריזציה הזו על חשבון התוכן האמיתי של המבחן הייתה מכוונת; לא אחזור על ההבהרה הזו בכל פעם מחדש. אני לא מעוניין למתוח ביקורת על המשחק עצמו, אלא רק להבהיר למה הוא שונה ממבחן טיורינג (ולכן אני כן מעוניין למתוח ביקורת על כל מי שניסו להקביל אותו למבחן טיורינג, בציטוטים שהבאתי).

ב"אדם מול מכונה" שינו את הפורמט של המבחן כדי שיהיה מעניין יותר. במקום בוחן מול צ'אט, יש באופן בוחן מול ארבעה שחקנים. השאלות ניתנות לשחקנים מראש ובשידור עצמו הם רק מקריאים את התשובות שלהם. בנוסף לכך, אחד מהשחקנים הוא "רמאי" והוא אינו מקריא את התשובות שלו אלא את התשובות של המחשב. המטרה של הצופים בבית היא לזהות מי המחשב. בפועל, רק 27 אחוז מהמצביעים הצליחו לזהות נכון את השחקן שהוא המחשב ורוב הקולות הלכו בכלל לשחקן אחר, כך שאין ספק שהמחשב "ניצח" במשחק הזה. אבל האם זו חוכמה?

יש בעיה לא קטנה בלתת לאדם להקריא את התשובות של המחשב כאילו הן התשובות שלו, ועוד שיהיה זה אדם שאנחנו רואים בעיניים ואפילו יודעים מה הרקע שלו. זה מוסיף למשחק את שאלת ההתאמה של תשובות המחשב לתשובות שאנחנו מצפים שהאדם יתן. במקרה או שלא במקרה, התשובות של המחשב ניתנו לילד לא מוכר, שאין לנו ציפיות מוקדמות שכאלו לגביו (לפחות בעיני, הדבר הופך אותו אוטומטית ל"חשוד").

אבל הבעיה העיקרית כאן היא שהעובדה שהשאלות נשאלו מראש מונעת מהדיון להתפתח. אני אישית חושב שעיקר הכוח של מבחן טיורינג היא בכך שהבוחן יכול לשאלות שאלות חדשות בהתבסס על התשובות של הנבחן. זה מאפשר לשאול שאלות עמוקות יותר ולתפוס את הנבחן בסתירות פנימיות. במקרה שלנו, למרות שזה בלתי אפשרי, התחושה שלי הייתה שהמנחה אכן שאל שאלות חדשות בהתבסס על התשובות של הנבחן, אם כי לא רציניות במיוחד; למשל, לשאלה על אישיות נערצת הילד (כלומר, המחשב) השיב "טיורינג" והמנחה שאל "למה" (למרות שהוא לא שאל זאת את המשתתפים האחרים). הילד ענה תשובה כלשהי; אין לי מושג אם זו תשובה שאכן הגיעה מהמחשב עצמו או שהילד המציא אותה בו במקום. רואים את הבעייתיות? אם ה"מקריא" יתחיל לענות תשובות שהוא עצמו ממציא, המבחן כולו הולך לאבדון. זה ממחיש יפה עד כמה פורמט עריכת המבחן שהציע טיורינג הוא אפקטיבי; לצערי, אני לא מסוגל לחשוב על שום דרך טובה לשנות אותו (חוץ מאשר לתת לרובוטים דמויי אדם להקריא את כל התשובות, במקום שנראה חלון צ'אט).

בעיה משמעותית הרבה יותר במבחן היא השאלות עצמן. חצי מהמבחן כלל שאלות טריוויה. בעבר היה ערך לשאלות כאלו כי הן יכלו להצביע על ידע שאנחנו מצפים ש"לכל אדם יהיה" לפחות חלק ממנו אבל למחשבים פשוט לא היה. מהפכת המידע שינתה את כל זה. במאמר של Ynet הזכירו את התוכנה "ווטסון" שפותחה במעבדות IBM. ווטסון מסוגל לענות לשאלות טריוויה שנשאלות בשפה טבעית (כלומר, גם "להבין" בדיוק מה שאלו אותו, וגם למצוא את התשובה) וזאת בסיוע מאגר מידע עצום בגודלו (שכולל, למשל, את כל ויקיפדיה), אם כי בלי חיבור אינטרנט. כמה טוב הוא עושה זאת? טוב מספיק כדי לנצח בשעשועון הטריוויה Jeoprady. זה הישג אדיר של תחום הבינה המלאכותית ואחד מהדברים המגניבים ביותר במדעי המחשב, לדעתי. זה בפירוש לא משהו שעובר את מבחן טיורינג. אפילו לא קרוב. הדבר דומה למחשבים שמשחקים שחמט מצוין – הם מאוד טובים במטלה ספציפית שקיימים אלגוריתמים טובים עבורה; אנחנו עדיין לא קופצים מכך ל"חשיבה" באופן כללי. לכן כל שאלות הטריוויה היו בעלות ערך בדיוק כמו לראות את אחד מהמשתתפים מנצח בשחמט. פרט לכך, היו יחסית מעט שאלות טריוויה ואפילו אם המחשב לא היה יודע לענות על אף אחת מהן, כל עוד הוא היה "מתנצל" בצורה משכנעת כנראה לא היה מתעורר בנו חשד (ואכן, אחת השחקניות לא ידעה לענות על רוב שאלות הטריוויה ואיני חושב שזה גרם למישהו לחשוד שהוא מקריאה תשובות של מחשב).

אם כן, חלק חשוב ממבחן טיורינג הוא בוחן ששואל שאלות טובות. זו לא חוכמה להוליך שולל בוחנים ששואלים שאלות שהן לא משהו. כדאי לשים לב לכך שמחשבים מוליכים אותנו שולל גם בימינו; כבר נרשמו מקרים לא מעטים שבהם אדם שוחח עם רובוט באינטרנט בלי להבין שהוא לא מדבר עם בן אנוש; וכבר בשנות השישים התפרסמה התוכנית ELIZA שהייתה תוכנית שיחה פשטנית ביותר שעדיין הצליחה להוליך שולל לא מעט מהמשוחחים איתה שהאמינו שהם מדברים עם פסיכולוג אמיתי בשר ודם. בנוסף, ראוי שמי שמכריע את המבחן יהיה גם זה ששואל את השאלות (ולכן כנראה שואל את הדברים שהכי עוזרים לו להכריע) – לתת לקהל להחליט, למרות שלא הקהל הוא זה ששאל את השאלות באופן אישי, הוא עוד מרכיב מהבעיה. הרי אם המחשב עובר את המבחן הזה, זה יכול להעיד בעיקר על כך שרצף השאלות הספציפי שנשאל במבחן הוא לא טוב מספיק כדי להכריע בין המחשב והאנשים (ולדעתי הוא אכן היה בעייתי). אני בהחלט מבין למה עורכי המשחק עשו זאת כך – לשתף את הקהל בהכרעה זה מרכיב חשוב של השעשוע – אבל את המבחן עצמו זה מקלקל.

גם במבחן טיורינג לקלינגונים יש בעיות עם השאלות (ותודה ל-Abstrusegoose).

ובכן, איך אמור מבחן טיורינג "אמיתי" עם שאלות טובות להיראות? אני מרשה לעצמי לצטט מתוך ספרו של פרופ' דוד הראל (שהיה מעורב בהכנת "אדם מול מכונה"), "המחשב אינו כל יכול" (אותו הטקסט הופיע בניסוח כמעט זהה גם ב"אלגוריתמיקה" של דוד הראל – ספר שעליו אני ממליץ בחום והוא מה שגרם לי להתעניין במדעי המחשב מלכתחילה) דיאלוג קצר בין הבוחנת איה והמתמודד בועז:

איה: מה זה שלכטיון?
להמשיך לקרוא

2=1+1

בואו נדבר על הקלישאה הגדולה ביותר שמשוייכת למתמטיקה: "\(1+1=2\)". אתם תראו את זה בכל מקום, בתור האמת הנצחית הבסיסית ביותר של המתמטיקה. הדבר הזה שאם מתכחשים לו, מתכחשים לאמת האובייקטיבית שאולי קיימת ואולי לא. העקרון הבסיסי ביותר הזה שאין עוררין עליו. המושג העבש הזה שתוקע אנשים בהלכי חשיבה צרים ומדויקים במקום להיפתח לקוסמוס. ועוד ועוד ועוד.

הטריגר הנוכחי לפוסט הוא המאמר הבא של Ynet, שהציטוט הזה מתוכו מעביר היטב את רוח הדברים:

אותו הלילה נדדה שנתי, וחלום על מתמטיקה טרף אותה. בדמיוני עמדתי בודד ליד לוח והסברתי משוואות לקטנטן, פירקתי אותן עד לנימוק הכי בסיסי, עד שהגעתי לתהום שממנה אין מוצא: 1+1=2. השאלה שממנה כל כך חששתי הגיעה גם הגיעה: "אבא'לה, למה אחד ועוד אחד זה שניים?". התפרקתי לגמרי (בחלום) וצרחתי: "ככה! ככה! לא שמעת על אקסיומות?!".

ובכן – לא. זה לא ככה. זו לא אמת בסיסית שאין עוררין ואין חולקין עליה. המתמטיקה ממש לא נעצרת כאן. להשתעשע עם הקלישאה זה טוב ויפה, אבל נדמה לי שיש אנשים שחושבים ברצינות שעמדת המתמטיקה בנוגע ל-\(1+1=2\) היא ש"זה נכון כי ככה". בפוסט הזה ארצה לתת כמה נקודות מבט מתמטיות שונות על העניין.

השאלה הראשונה שיש לי אל מי שלא מוכן לקבל את \(1+1=2\) כפשוטו היא – כשאתם אומרים "2", למה אתם מתכוונים? המתמטיקה שואלת מה ההגדרה שלכם לסימן \(2\). קרוב לודאי שרובכם תענו ש-\(2\) הוא פשוט סימון מקוצר ל-\(1+1\), ולכן ברור ש-\(1+1=2\); אין בשוויון הזה שום דבר עמוק יותר מלהגיד ש-2 הוא הסימן שבו אתם משתמשים כדי לתאר את אחד ועוד אחד (ושימו לב שבכלל אין חשיבות לשאלה מה זה \(1\) בשבילכם, או אפילו מה זה \(+\)בשבילכם).

רק מה, המתמטיקאים לא מסכימים איתכם.

אחת מיצירות המופת המונומנטליות ביותר בתולדות המתמטיקה היא ה-Principia Mathematica שכתבו המתמטיקאים (והפילוסופים) ברטרנד ראסל ואלפרד נורת' וייטהד בתחילת המאה ה-20. מדובר על יצירה עבת כרס ביותר שניסתה לבסס את כל המתמטיקה על הלוגיקה המתמטית שהייתה בחיתוליה באותם ימים, ולעשות זאת בצורה הפורמלית והמדויקת ביותר האפשרית. מעולם לא קראתי אותה. אני לא מכיר אף אחד שעשה זאת. עם זאת, ציטוט אחד מתוכה זכה לתהילת עולם: אי שם בעמוד 379, אחרי הוכחת טענה שהמראה שלה גורם גם לי להתפלץ, השניים אומרים (ללא ספק בהומור עצמי) ש"מטענה זו ינבע, לאחר שחיבור אריתמטי יוגדר, ש-\(1+1=2\)".


הלקח שיש ללמוד מהסיפור הזה הוא שהשוויון הזה לא מובן מאליו למתמטיקאים – הם לאו דווקא חושבים עליו בתור הגדרה. כמובן, נשאלת השאלה איך הם כן מגדירים את 1, את 2 ואת החיבור. אני לא מכיר את הגישה של ראסל ושל וייטהד, אבל גישה מקובלת למדי במתמטיקה של ימינו היא זו: ראשית מגדירים את המספר 0. כעת מגדירים לכל מספר משהו שנקרא "עוקב". אם \(n\) הוא מספר, אז \(S\left(n\right)\) הוא העוקב שלו. אנו משתמשים בסימון \(1\) כדי לתאר את \(S\left(0\right)\) , ובסימון 2 כדי לתאר את \(S\left(S\left(0\right)\right)\) וכן הלאה. אחר כך מגדירים גם את פעולת החיבור באמצעות עוקב: \(a+0=a\) לכל \(a\), וכמו כן \(a+S\left(b\right)=S\left(a+b\right)\) (מבלבל? מצוין! נסו לחשוב על זה עוד קצת).

עם ההגדרות הללו, הטענה \(1+1=2\) היא בעצם משפט מתמטי: המשפט \(S\left(0\right)+S\left(0\right)=S\left(S\left(0\right)\right)\) , שניתן לתת לו הוכחה שהולכת בערך כך: על פי ההגדרה של +, \(a+S\left(b\right)=S\left(a+b\right)\) ולכן אם \(a=S\left(0\right)\) ו-\(b=0\) נקבל ש-\(S\left(0\right)+S\left(0\right)=S\left(S\left(0\right)+0\right)\). כעת, מכיוון שעל פי ההגדרה של + מתקיים \(a+0=a\) לכל \(a\), אז \(S\left(0\right)+0=S\left(0\right)\) ולכן \(S\left(S\left(0\right)+0\right)=S\left(S\left(0\right)\right)\) והנה הגענו אל מה שרצינו להוכיח. במילים אחרות, \(1+1=2\), מנקודת המבט המתמטית, זו בכלל לא אקסיומה או טענה בסיסית שלא מתווכחים עליה; זו טענה שנובעת מהגדרות יותר בסיסיות וקל להוכיח אותה.

לא מסכימים עם ההגדרות היותר בסיסיות הללו? טוב ויפה, אבל זה בערך כמו לבוא למישהו שאומר "אין גשם היום" ולהגיד לו שהוא טועה כי בעברית שלכם המילה "היום" פירושה "מתישהו בחודש האחרון", ו"אין" פירושה בכלל "יש", ו"גשם" הוא בעצם "פלישה מסיבית של חייזרים שכוללת השמדה של הבית הלבן". ולא ידוע לנו על פלישה שכזו לאחרונה. אם אתם בוחרים לא להבין או לא לדבר את השפה זה לגיטימי לחלוטין, אבל לא מועיל במיוחד.

בכל זאת, אולי אפשר לתת פרשנויות שונות לסימנים ולקבל עולם קוהרנטי שבו \(1+1\) לא שווה \(2\)? התשובה היא חד משמעית: כן, אפשר, והמתמטיקאים גם עושים את זה.

נתחיל מעוד קלישאה אהובה: "מה אם \(1+1=3\)?" שמובאת לפעמים כדוגמה לחשיבה פורצת מסגרות. ובכן, אם \(1+1=3\) , ואם אנחנו מסכימים על כך שגם \(1+1+1=3\), אז קיבלנו ש-\(1+1=1+1+1\). אם אנחנו מסכימים שאפשר לחסר, אז קיבלנו מכך ש-\(0=1\) (אחרי שחיסרנו \(1+1\) משני האגפים), וזה בעצם אומר שהכל אפס. גם אפס, וגם אחד, וגם אחד ועוד אחד וגם כל דבר שהוא. לא הגישה הכי פרודקטיבית לחיים. אז אפשר להגיד שאי שם בדרך רימינו – למשל, שאסור לחסר, אבל אז עולה השאלה מה הטעם בחשבון שבו אחת מהפעולות הבסיסיות ביותר היא אסורה; או ש-\(1+1+1\) לא שווה 3, אבל אז נשאלת השאלה למה הוא כן שווה, והאם \(3\) הוא לא סתם סימון מוזר שלנו למספר שבדרך כלל קוראים לו "שתיים". בקיצור, אי אפשר להגיד ש-\(1+1=3\) בלי שתתחייב מכך זריקה לפח של כל מה שאנחנו מכירים בתור חשבון, והחלפתה במשהו שהוא טריוויאלי ולא מעניין כי לא קורה בו כלום. לי אישית נראה שאלו שאומרים \(1+1=3\) לא באמת חושבים מחוץ למסגרת, אלא פשוט לא חושבים – בפרט לא חושבים עד הסוף על ההשלכות של הטענות שלהם.

מה כן כדאי לעשות, והמתמטיקאים עושים? להגיד ש-\(1+1=0\). זה לא מוביל למסקנה ש-\(0=1\), וזה גם לא דורש מאיתנו לזרוק לפח את פעולות החשבון; ההפך, כל ארבע פעולות החשבון תקפות גם עבור העולם הקטן והנחמד שאנחנו מקבלים כשאנחנו מגדירים ש-\(1+1=0\). במתמטיקה קוראים לעולם הזה \(\mathbb{Z}_{2}\) – זו דוגמה לשדה סופי; במקרה זה, השדה הסופי הקטן ביותר שקיים.

בפני עצמו לא נראה שאנחנו יודעים לעשות הרבה עם השדה הזה כי אנחנו יכולים לייצג מעט מאוד דברים כשיש לנו רק את 0 ו-1; אבל מותר לדבר גם על סדרות של היצורים הללו. למשל, יש 8 סדרות מאורך 3 של אפסים ואחדים, כש-\(\left(1,0,1\right)\) ו-\(\left(0,0,0\right)\) הן שתי דוגמאות. באופן כללי יש \(2^{n}\) סדרות מאורך \(n\) של אפסים ואחדים – וזה כבר הרבה. חיש קל, עבור ערכים לא גדולים במיוחד של \(n\), אנחנו מסוגלים לייצג כמויות אדירות של מידע.

בפועל, זה גם מה שקורה בתוך מחשבים: מחשבים לא יודעים לייצג מספרים מגודל שרירותי. מה שהם עושים ברמת החומרה הוא לייצג באופן אלקטרוני כלשהו ביטים – יצורים שיכולים להתפרש כמכילים רק 0 או 1. על הביטים הללו אפשר לבצע פעולות שונות ומשונות ובפרט את פעולת החיבור שהגדרנו, זו שבה \(1+1=0\) (בעולם האמיתי היא נקראת XOR). פרט לכך יש ל-\(\mathbb{Z}_{2}\) גם מקום של כבוד במתמטיקה באופן כללי, אבל לא אכנס ליותר מדי פרטים כרגע. הנקודה החשובה היא שזה קיים, וזה לגיטימי. אף מתמטיקאי לא יטען שבהכרח \(1+1=2\); קרוב לודאי שהוא יוודא קודם כל שמדברים על מספרים טבעיים ועל פעולת החיבור הרגילה.

ורק עוד הערה לסיום: גם "זו אקסיומה" היא בימינו קלישאה שהקשר בין השימוש בה במתמטיקה לשימוש בה בשפת היומיום הוא שגוי. ביוון העתיקה "אקסיומה" הייתה אמת מובנת מאליה שאין עליה עוררין; מאז עברו אי-אלו אלפי שנים, התברר שכל מני דברים שנראים מובנים מאליהם וללא עוררין הם לא כל כך מובנים מאליהם (למשל, אקסיומת המקבילים המפורסמת) ובימינו "אקסיומה" במתמטיקה היא דרך לתאר הנחת יסוד – הנחה שיכולה להיות נכונה או לא נכונה, אבל אנחנו מוכנים לצורך ה"משחק" להניח שהיא נכונה ולראות מה יוצא מזה. בהחלט לגיטימי לעשות גם את ההפך – להניח שהאקסיומה לא נכונה ולראות מה יוצא גם במקרה הזה. רק שימו לב, כשאתם באים להשתעשע שכך, שקרוב לודאי שמתמטיקאים כבר חשבו על זה לפניכם.

אז מה הקטע עם דילוגי אותיות בתורה? (חלק א')

לפני זמן מה קראתי מאמר ב"הארץ" שעסק ברב שלמה הלבראנץ וקהילתו, "לב טהור" בקנדה. בכל המאמר הארוך הזה, מה שצד את עיני מייד היה זוג הפסקאות הזה:

את תהליך החזרה בתשובה התחיל לפני בר המצווה. לדבריו, "רק מפני שסיקרן אותי לדעת למה אני חי ולמה העולם קיים. רציתי להבין מה המשמעות של כל העניין הזה". הוא מספר שהעלה את התהיות בפני הוריו, מוריו ובפני כל מבוגר שהכיר. גם בספרים שהיו נגישים לו כילד חיפש תשובות. אמו זוכרת שלפחות פעמיים הוזעק שרת בית הספר, לאחר שארז ננעל בסיום יום הלימודים בספרייה.

לדבריו, הוא לא מצא בשום מקום הסברים מספקים עד שפגש את יוסף יגן, שהיה נער חרדי נמרץ וממובילי תנועת החזרה בתשובה שהחלה להתעורר אז בארץ. כיום יגן הוא רב חרדי המתגורר בארצות הברית. שני הצעירים הכירו דרך קרובי משפחה, והחיבור ביניהם היה מהיר. יגן חשף בפני ארז הסקרן את שיטת הקודים בתנ"ך. על פיה, בדילוגי אותיות קבועים מתקבלות מילים בעלות משמעות. "זה היה אולי הדבר הראשון שהדליק אותי", הוא מספר, ומיד מוסיף בצחוק שהוא עוד זוכר "איזה מכות יגן קיבל מאוחר יותר מאבא שלי, שהבין שהוא היה זה שהביא אותי לחזרה בתשובה".

עלי להודות שזה מדהים אותי, לא פחות. אדם שמעלה תהיות ומחפש תשובות בכל מקום – אצל הוריו, מוריו, כל מבוגר שהוא מכיר וכל ספר שנגיש לו, ושום מקום אינו משביע את רצונו – מוצא את התשובה בהבל המוחלט של דילוגי האותיות בתורה?

כפי שאתם מבינים, אני לא אובייקטיבי במיוחד בכל הנוגע לנושא הזה, בדיוק כשם שאיני אובייקטי ביחס לאנשים שטוענים שהם יודעים לרבע את המעגל. עם זאת, אנסה לתת לו סקירה הוגנת יחסית.

הדבר הראשון שצריך לבצע הוא למתוח קו הפרדה חד וברור בין רוב מה שאנחנו מכירים בתרבות הפופולרית בתור "דילוגי אותיות בתורה" – כשהנציג המובהק ביותר של העניין הזה ומי שאני הולך להתייחס אליו הכי הרבה הוא הספר "הצופן התנ"כי" של מייקל דרוזנין – ובין מאמר בנושא של המתמטיקאי אליהו ריפס, דורון ויצטום ויואב רוזנברג, שפורסם בכתב עת מדעי רציני – Statistical Science. השאלות איך ייתכן שמאמר בנושא אכן התפרסם בכתב עת רציני, ומה היה במאמר הזה בעצם – אלו שאלות מצויינות ולכן אני שומר אותן לפוסט אחר. רק אציין שמה שקורה במאמר הזה אכן מחוכם בכמה רמות ממה שבדרך כלל אנחנו מכירים בתור דילוגי אותיות; ולכן גם הפולמוס סביב המאמר (שנכתבו לו מאמרי הפרכה; וריפס וויצטום פרסמו מאמרי המשך; ועוד ועוד ועוד) סבוך בהרבה. לכן נמתין עם זה – לטעמי יש למה לחכות כי זה פולמוס מעניין למדי. בינתיים נדבר על דרוזנין ודברים דומים.

ראשית כל, להגדרה המתמטית. מה זה בכלל דילוג אותיות בתורה? פשוט מאוד: אם ניקח את התורה (בגרסה ללא ניקוד) ונמחק ממנה כל תו שאיננו אות (דהיינו – אין רווחים, אין פסיקים, נקודות, נקודה-פסיק, מקף או כל דבר אחר) נקבל רצף ארוך מאוד של אותיות – 304,805 אם לדייק. כעת, ברצף הזה אנחנו אמורים לקרוא מילים אות-אות, אבל אפשר גם אחרת: למשל, חלק מפסוקים כ"א-כ"ב בבראשית ל"ו הוא "בארץ אדום ויהיו בני לוטן חרי והימם". כעת, אם ניקח את הא' שב"בארץ" ואז נדלג קדימה חמש אותיות, כלומר נפסח על פני ארבע האותיות שבאמצע ("רץאד") ישר אל הו' שאחר כך, ואז שוב נדלג חמש אותיות (ונקפוץ מעל "םויה") נקבל י', ואחרי עוד חמש אותיות נקבל ל', ואחרי עוד חמש אותיות נקבל ר' – והנה, בדילוגים של ארבע בכל פעם גילינו את אוילר, מגדולי המתמטיקאים של כל הזמנים, כשהוא מתחבא לו בתורה! זו התורה כולה; זו כל המשמעות של דילוגי אותיות. רק צריך להעיר שבדרך כלל סופרים גם דילוגים "אחורה": למשל, "ויצו את אשר על ביתו לאמר" (בראשית, מ"ד, א') כולל את אוילר בדילוגים של שתי אותיות, אבל אחורה.

איני בקיא בהתפתחות ההיסטורית של הרעיון לבדוק דילוגי אותיות בתורה דווקא. יחד עם הגימטריה, הרעיון כנראה הומצא כבר לפני מאות שנים על ידי חז"ל. אלא שבניגוד לגימטריה, דילוגי האותיות זכו דווקא לפריחה בזכות המחשב המודרני שאפשר לחפש אותם הרבה יותר בקלות; דה פקטו, המחשב אפשר לבצע חיפושים שהיו בלתי אפשריים לחלוטין בעבר. עם זאת, כנראה שהאדם שהוביל לעיסוק בדילוגי אותיות בימינו היה רב בשם מיכאל וייסמנדל שעסק בנושא בחצי הראשון של המאה ה-20, עוד לפני שהיו מחשבים בנמצא. הוא כנראה סיפק את ההשראה לדורון ויצטום, ומאחר שהמאמר של ויצטום, ריפס ורוזנברג היווה את ההשראה לספר של דרוזנין, נראה לי שאפשר לציין את וייסמנדל בתור המקור הקונקרטי ביותר לעיסוק בדילוגי אותיות בימינו. דורון ויצטום מפרט באתר הבית שלו על מה שוייסמנדל עשה: למשל, וייסמנדל טען (ללא הוכחה) כי ביטויים מסויימים שקשורים למגילת אסתר מופיעים בתורה בדילוגים של 12,111 אותיות (למה המספר הזה? כי זה מספר האותיות במגילת אסתר).

בא ויצטום והחליט לבדוק זאת וגילה את התגלית הבאה: המילה "אסתר" מופיעה בתורה עצמה רק פעם אחת (צריך לציין כאן במפורש שהעניין מתמקד רק בתורה – מכיוון שעליה נטען שהיא נכתבה בידי אלוהים, להבדיל מספרי הנביאים והכתובים). ויצטום אומר כעת ש"הרעיון הפשוט ביותר הוא לבדוק את הביטוי 'מגלת אסתר' עצמו", ואכן הוא גילה שהמילה "מגלת" מצויה בתורה בדילוג של 12,111 אותיות, כשהאות מ' מצויה בסמיכות גדולה ל"אסתר" היחיד שמופיע בתורה כולה. וכעת אומר ויצטום:

יש להזכיר, כי ברשותו של הרב וייסמנדל לא היה מחשב פנטיום מתקפל בהסתתרו מן הנאצים בבונקר בברטיסלבה. כיצד ידע אודות רמזים חשובים בדילוג מיוחד זה? – אין אנו יודעים… לצאת למבצע של ספירה ידנית של 12,111 אותיות, כמה פעמים … ואיך ידע שלא טעה? ושאלה אחרת: מאיפה להתחיל? הרי בוודאי שאי אפשר להעלות על הדעת שהוא השתמש כאן בתהליך של "ניסוי וטעייה".

לא נשמע מרשים ממבט ראשון? נשמע.

אם כן, ויצטום התעניין, הצליח לעניין גם את ריפס, וכל השאר היסטוריה חדשה יחסית; אבל מה שהקפיץ את העיסוק בדילוגי האותיות ללב התודעה הציבורית לא היה המאמר של ויצטום וריפס אלא הספר של מייקל דרוזנין, "הצופן התנ"כי". הספר הזה הוא המייצג של התפיסה הפופולרית של דילוגי אותיות כיום ולכן אתמקד בו לעת עתה. כדאי להעיר שויצטום וריפס עצמם מושכים את ידיהם מכל וכל ממה שדרוזנין עשה.למי שמעוניין הנה ראיון של NRG עם דרוזנין לרגל צאת ספר ההמשך, ב-2002. באופן מעניין למדי דרוזנין מציג את עצמו כאתאיסט, בניגוד לפרשנות המקובלת יותר לפיה הצפנים בתנ"ך מעידים על כך שהוא היה חייב להיכתב בידי אלוהים.

הסיבה המרכזית להצלחה של דרוזנין, לדעתי, היא תחזית אחת מוצלחת שהוא ביצע – ב-1994 הוא שלח מכתב לראש הממשלה בישראל דאז יצחק רבין, שבו הוא הזהיר מפני העובדה שבמקום היחיד בתורה שבה מופיע השם "יצחק רבין" בדילוגי אותיות (דילוג של 4772 החל ממקום 254245), הוא מצטלב עם המשפט "רוצח אשר ירצח" (שמופיע בדילוגים של 1, כלומר בתורה ה"רגילה") – הצ' של יצחק מצטלבת עם הצ' של "ירצח". התחזית הזו מצביעה על שיטת העבודה של דרוזנין (שהיא פשוטה למדי ובהחלט לא מתקרבת לרמת התחכום של ויצטום וריפס) – חפש מספר דילוגי אותיות שמופיעים בסמיכות זה לזה בתורה כאשר כותבים את התורה בתוך מלבן, וזהו; הספר של דרוזנין מלא במלבנים כאלו עם הדגשות של ביטויים שמופיעים בהם. אין שום ניתוח הסתברותי כלשהו ולא פעלולים מחוכמים יותר. למעשה, הספר אפילו מקמץ במידע וכשהוא מציג דילוגים אפילו לא טורח לומר מה גודל הדילוג. דבר אחד שפה ושם כן מקפידים עליו קצת הוא עקרון כלשהו שקבע ריפס לפיו יש חשיבות גדולה במיוחד לביטוי שמופיע בדילוג המינימלי שלו בתורה (למשל, אם "יצחקרבין" היה מופיע גם בדילוג של 2315 אז הדילוג של 4772 היה "מרשים פחות").

אוקיי, אז מה הבעיה עם דרוזנין? ראשית, שהתנ"ך עצמו מזהיר מפניו: הדילוג המינימלי שבו "דרוזנין" מופיע בתורה הוא 2314- (החל מ-224069), והוא מצטלב עם הפסוק "כי צררים הם לכם בנכליהם אשר נכלו להם על דבר פעור ועל דבר כזבי בת נשיא מדין אחותם המכה ביום המגפה על דבר פעור" (במדבר כה יח) – הז' של דרוזנין מצטלב עם הז' של "כזבי". את זה גיליתי על ידי בדיקה זריזה בתוכנית דילוגי אותיות תוצרת בית שכתבתי. זו התורה כולה: קל בצורה בלתי רגילה למצוא דילוגי אותיות בעלי משמעות בתורה, או בכל טקסט ארוך אחר.

בואו נדבר לרגע על המתמטיקה של העניין. כדי לפשט את החישובים אני אניח את ההנחה השגויה לפיה האותיות בעברית מתפלגות באופן אחיד, והתורה בפרט "הוגרלה" כך: כלומר, אם אני הולך לראות מהי האות במקום 235431, יש סיכוי של \(\frac{1}{22}\) לכל אות להופיע (זכרו שאין הבדל מבחינתנו בין אותיות סופיות ואותיות רגילות). אם כבר קבעתי אינדקס התחלתי \(a\) וגודל קפיצה \(b\), אז ההסתברות שמילה \(w\), שאת אורכה אסמן ב-\(\left|w\right|\), תופיע החל מ-\(a\) בקפיצות של \(b\) היא \(\frac{1}{22^{\left|w\right|}}\): זו ההסתברות שב-\(a\) תהיה האות הראשונה ב-\(w\) (\(\frac{1}{22}\)), כפול ההסתברות שב-\(a+b\) תהיה האות השניה ב-\(w\) (\(\frac{1}{22}\)), כפול ההסתברות שב-\(a+2b\) תהיה האות השלישית ב-\(w\) וכן הלאה – פשוט כופלים את \(\frac{1}{22}\) בעצמו \(\left|w\right|\) פעמים. בפועל צריך לכפול לא ב-\(\frac{1}{22}\) אלא בקבוע שתלוי בשכיחות האות הספציפית ב-\(w\), ולרוב זה יהיה מספר גדול יותר מ-\(\frac{1}{22}\) (דווקא "דרוזנין" היא מילה קשה יחסית בגלל ז' הלא שכיח). זה אומר שמילה של שלוש אותיות צפויה להופיע בהסתברות של 1 ל-10,000, בעוד שעבור מילה של ארבע אותיות ההסתברות היא כבר יותר באיזור ה-1 ל-250,000, ועבור מילה מאורך 8 (כמו "יצחק רבין"), ההסתברות היא כבר באיזור ה-1 ל-55 ביליון (ביליון אצלי הוא אלף מיליארדים). נשמע די נמוך, חייבים להודות.

אבל, בל נשכח שזו ההסתברות לכך שעבור זוג ספציפי של \(\left(a,b\right)\) תופיע החל ממקום \(a\) ובקפיצה \(b\) המילה הספציפית \(w\). מה שיותר מעניין הוא כמה פעמים בתוחלת צפויה \(w\) להופיע בטקסט כולו. החישוב ההסתברותי כאן הוא קל: מגדירים משתנה מקרי \(X_{a,b}^{w}\) שמקבל 1 אם המילה \(w\) מופיעה החל מ-\(a\) בקפיצות של \(b\) ואחרת מקבל 0; אז התוחלת של \(X_{a,b}^{w}\) היא בדיוק ההסתברות ש-\(w\) יתקבל באקראי, כלומר \(\mbox{E}\left[X_{a,b}^{w}\right]=\frac{1}{22^{\left|w\right|}}\). כעת, נגדיר משתנה \(X^{w}=\sum_{\left(a,b\right)}X_{a,b}^{w}\) שסופר את מספר המופעים של \(w\) בטקסט כולו; וכעת נשתמש בלינאריות התוחלת כדי לקבל ש-\(\mbox{E}\left[X^{w}\right]=\mbox{E}\left[\sum_{\left(a,b\right)}X_{a,b}^{w}\right]=\sum_{\left(a,b\right)}\mbox{E}\left[X_{a,b}^{w}\right]=\frac{\left|\left\{ \left(a,b\right)\right\} \right|}{22^{\left|w\right|}}\), כאשר \(\left|\left\{ \left(a,b\right)\right\} \right|\) הוא סימון קצת עקום ל"מספר הזוגות \(a,b\) הרלוונטיים לנו". זו המחשה נאה לכוח של תכונת הלינאריות של התוחלת – היא נכונה גם בלי קשר לשאלה עד כמה המשתנים \(X_{a,b}^{w}\) תלויים זה בזה (ורבים מהם תלויים זה בזה בצורה מתוסבכת).

כעת אנחנו צריכים להכניס לתמונה נתון אחד נוסף – אורך הטקסט שלנו, שאסמן \(N\). הגודל המקסימלי האפשרי עבור \(b\) הוא \(\frac{N}{\left|w\right|}\) (מדוע?), ואם בחרנו \(b\) קונקרטי אז \(a\) המקסימלי האפשרי עבורו הוא \(N-\left|w\right|b\) (מדוע?), ולכן מספר הזוגות \(\left(a,b\right)\) החוקיים הוא בערך \(\sum_{b=0}^{N/\left|w\right|}N-\left|w\right|b=N\left(N/\left|w\right|\right)-\left|w\right|\frac{\left(N/\left|w\right|\right)^{2}}{2}\approx\frac{N^{2}}{\left|w\right|}-\frac{N^{2}}{2\left|w\right|}\approx\frac{N^{2}}{2\left|w\right|}\). בקיצור, אחרי כמה הזנחות קטנות מצאתי שמספר המקומות הפוטנציאליים למצוא בהם את \(w\) הוא \(\frac{N^{2}}{2\left|w\right|}\). אם מרשים גם חיפושים אחורה (\(b\) שלילי) המספר מוכפל ולכן \(\frac{N^{2}}{\left|w\right|}\) הוא הביטוי האלגנטי שאנחנו מקבלים בסוף.

אם נציב \(N=300,000\) ו-\(\left|w\right|=8\) נקבל שתוחלת מספר המופעים של מילה כלשהי של 8 אותיות היא 0.2. כלומר, כל מילה מאורך 8 תופיע "חמישית פעם", ובניסוח אחר – אנחנו מצפים שבערך חמישית מהמילים מאורך 8 יופיעו. אם במקום 22 אותיות יש לנו רק 18, התוחלת קופצת ל-1. אם אנחנו מתעסקים עם מילה מאורך 7 (ו-22 אותיות) התוחלת היא 5 וקצת. מילה מאורך 4 כבר צפויה להופיע בסביבות ה-100,000 פעמים. זה אומר לנו שני דברים: ראשית, שמילים קצרות יחסית (עד 6 אותיות, נאמר) יופיעו כל כך הרבה פעמים שהתורה (וכל טקסט אחר) פשוט מוצף בהן, ואפשר יהיה למצוא אותן כמעט בכל מקום שנבחר; ושנית, שגם מילים ארוכות יותר יהיו בשפע. אמנם, אם נבחר מילה ארוכה קונקרטית יש סיכוי שהיא לא תופיע, למרבה צערנו; אבל אם נצליח לחשוב על רשימה של אלף מילים "מעניינות" מאורך 8, אפשר לצפות לכך שלפחות מאתיים מהן יופיעו, ועל כל מופע כזה אפשר יהיה לכתוב פרק בספר, אם נצליח למצוא "סביבו" עוד מופעים מעניינים של מילים (שלרוב יהיו מילים קצרות כי מילים קצרות אפשר למצוא בכל מקום). זו המתמטיקה שמאחורי מציאת "ביטויים מעניינים קרובים זה לזה". הגורם הריבועי, \(N^{2}\), פחות או יותר מבטיח שבטקסטים ארוכים למדי ההסתברויות יקפצו לשמיים.

בואו נעבור להמחשה חביבה שנראה לי שאני הראשון שמצא. ככל הנראה הסיפור המפורסם ביותר של סופר האימה/מד"ב ה.פ. לאבקראפט הוא "קריאתו של קת'ולהו" – הנה לינק לסיפור (לאבקראפט נפטר בשנת 1937 וכל יצירתו זמינה בחינם בפורמט דיגיטלי) עבור מי שרוצה להימנע מספוילרים מינוריים על ידי הקדמת תרופה למכה וקריאת הסיפור.


בקצרה, קת'ולהו הוא יצור מאוד, מאוד, מאוד לא נחמד. אבל ממש לא נחמד. חלקים נכבדים ביצירתו של לאבקרפט עוסקים בזוועות האיומות שמתחבאות בזווית העין שלנו; באותם יצורים מפלצתיים שעקב תקלה בלבד תקועים כעת בפינת ארץ שכוחת אל זו או אחרת וזו הסיבה היחידה שבגללה אנחנו מתקיימים בכלל; אבל יום אחד מישהו יעיר אותם, וכשזה יקרה שום דבר לא יעמוד בפניהם ובפני השמדה מוחלטת של כדור הארץ והמין האנושי, שאינו יותר מאשר זבוב עבורם. באופן לא מפתיע, קיימים ליצורים הללו חסידים שוטים רבים שמטרתם היא בדיוק להעיר את המפלצות הללו; וכל מי שמנסה לעמוד בדרכם מוצא את מותו באופן מסתורי. כאילו שלא די בצרות, היצורים הללו משפיעים גם על החלומות שלנו וגורמים לנו להשתגע. בקיצור, לא חומר קריאה לרכי-לבב (אם כי הסגנון של לאבקראפט נראה קצת מיושן בימינו, יש להודות). קת'ולהו הוא ראש וראשון למפלצות הללו, והוא תקוע באיזו עיר בשם ר'ליה בקרקעית האוקינוס. לא צריך לפרט הרבה יותר מזה – הפירוט הנוכחי נדרש בעיקר כדי להבין למה אני מחפש את מה שאני מחפש.

ובכן, כתבתי סקריפט זריז שעושה את הדבר הבא: ראשית, מחפש מילה ספציפית אחת ומוצא את המופע שלה עם הדילוג קדימה הקצר ביותר בתורה. למה עניין הקצר ביותר? כאמור, זה משהו שריפס וויצטום המציאו ודרוזנין מתיימר להשתמש בו פה ושם, אז מילא, אני מוכן לשחק את המשחק הזה. מן הסתם חיפשתי את קת'ולהו. באופן לא מפתיע (בעקבותה הסטטיסטיקה) מצאתי את קת'ולהו די בקלות: הוא מופיע בתורה בדילוג מינימלי קדימה של 78 החל מ-106478. המיקום שלו כבר יותר משעשע: הוא מופיע בשמות י"ט, כלומר בפרק שמתאר את מעמד הר סיני.

השלב הבא הוא להגיד לסקריפט לחפש מילים קרובות לקת'ולהו. כלומר, לא חיפשתי את המילים בכל התורה (וגם לא הקפדתי על עניין הדילוג המינימלי). בגלל שמצטמצמים לאיזור קרוב לקת'ולהו, חיש קל אפשר לחפש המוני מילים, ולכן כתבתי רשימה ארוכה שלתוכה זרקתי את כל מה שחשבתי שבכלל נשמע קצת רלוונטי לקת'ולהו. למשל: "קריאה", "קריאתו", "רליה", "תמנון", "מפלצת", "מהכוכב", "מהכוכבים", "שקוע", "קוסמי", "משמיד", "נורא", "חולם" וכו' וכו' וכו'. הבנתם את העיקרון. שימו לב שרבות מהמילים הללו הן קצרות למדי, מה שאומר שיש המון מהן פזורות ברחבי התורה, ולכן מתבקש שחלקן יפלו גם קרוב לקת'ולהו. לא התאכזבתי. רוב המילים שחיפשתי לא נמצאו בסביבה של קת'ולהו, אבל כמות נאה דיו של מילים היו קרובות אליו: "קריאה" (דילוג של 103 החל מ-106389), "רליה" (המון מופעים בקרבת קת'ולהו – כפי שמתבקש ממילה קצרה שכזו – למשל 3,105728), "כוכב" (110, 106345), "רשע" (שוב, המון מופעים, כצפוי; למשל 41, 105746), "נורא" (109, 106787), ו-"חולם" (106499, דילוג אחורי של 129).

אם כן, ניסוי קת'ולהו שלי נחל הצלחה מסחררת ואני בטוח שאפשר למצוא עוד מילים מתאימות הסמוכות אליו. האם כל ניסוי דומה יצליח? ודאי שלא, אבל מגוון הניסויים שניתן לבצע הוא כל כך אדיר (בוחן פתע: מצאו חמישה נושאים שיהיה משעשע לחפש אותם בתורה ולדעתכם לא סביר שאלוהים ירצה להצפין שם) שברור שרבים מהם יצליחו. כל הסיפור הזה מאפשר לנו לחדד את הנקודה הקריטית ביותר בכל הסיפור הזה של הדילוגים בתורה, ובהרבה סיטואציות הדומות לו: מה שנכשל לא נכנס לספר. בכל פעם שאנחנו רואים צירוף מקרים שנראה לנו מדהים, אנחנו חייבים לשאול את עצמנו את השאלה – כמה צירופי מקרים פוטנציאליים אנחנו חווים מדי יום ביומו אבל לא מתגשמים? בכל פעם שאנחנו מתקשרים למישהו ש"בדיוק חשב עלינו", האם אנחנו זוכרים את כל הפעמים שבהן התקשרנו למישהו שלא חשב עלינו כלל? הרושם האינטואיטיבי המופרך הזה לפיו צירופי המקרים הם חריגים כל כך עד שאינם יכולים להיות צירופי מקרים הוא בדיוק מה שעומד בבסיס הספר של דרוזנין כולו.

בואו נחזור שניה אל "מגלת" של הרב וייסמנדל. זו מילה בת ארבע אותיות, כך שאפשר לחשוד שהיא תהיה נפוצה למדי. אכן, בדילוגים (גם קדימה וגם אחורה) עד אורך 10,000 היא מופיעה 13,110 פעמים (לא כולל מופעים "אמיתיים" שלה בתורה, כלומר בדילוג של 1). זה אומר שאם תבחרו גודל דילוג כלשהו באופן אקראי, יש סיכוי סביר בהחלט ש"מגלת" יופיע בדילוג הזה. אז עצם העובדה שבדילוג עבור המספר הספציפי 12,111 המילה "מגלת" הופיעה – זה בוודאי לא מעניין. אבל מה שויצטום התלהב ממנו הוא לא רק הופעת המילה "מגלת" בדילוג הזה אלא הסמיכות שלה למילה "אסתר" שמופיעה בתורה רק פעם אחת.

זה מרשים, עד שמתחילים לשאול על הפרטים הקטנים. למשל, למה "מגלת" ולא "מגילת" (שהיא מילה ארוכה יותר ולכן נפוצה פחות – ואכן, לא מופיעה בדילוג של 12,111 בתורה)? הרי אנחנו עובדים עם תנ"ך בכתיב מלא, אז למה לחפש מילה בכתיב חסר דווקא? טוב, התשובה כבר מצויה בסוגריים – כי זה מה שעבד, ועל הנסיון הכושל של "מגילת" לא מספרים לנו. ונניח ש"מגלת" לא היה מופיע ליד "אסתר" אבל "המלכה" כן? או "אחשוורוש" (אפילו יותר מרשים מ"מגלת"), או "בתמרדכי" (למרות ש"בתדודמרדכי" מדויק יותר, אבל מי ישים לב), האם היינו מתפעלים פחות? ואילו עוד טענות טען וייסמנדל שלהן לא הצליחו למצוא תוצאות כל כך יפות? העיקרון ברור. תמיד כשאנו באים לבחון תגליות של דילוגי אותיות צריך להיות מודעים לכל מרחב התמרון שחבוי מאיתנו ולא מתואר באופן מפורש.

האם כאן נגמר הסיפור? ודאי שלא! אפילו עם דרוזנין לא גמרתי. עד כה כל מה שעשיתי היה בתורה – צריך לבדוק גם מה קורה בטקסטים אחרים. ואחרי שנגמור עם דרוזנין עדיין נצטרך לתאר את מה שריפס וויצטום עושים – וזה, כאמור, כבר עניין סבוך בהרבה.

כיצד תעזור לכם המתמטיקה לחמוק מדו"חות תנועה

בימים האחרונים מתרוצץ לו ברשת סיפור משעשע על פיזיקאי מאוניברסיטת סן דייגו, דימיטרי קריוקוב שמו, שקיבל דו"ח תנועה על אי עצירה בתמרור עצור, והצליח לשכנע את השופט לוותר לו על הקנס על ידי הגשת… מאמר מתמטי ש"מוכיח" את חפותו. שלל האתרים שמדברים על הפרשייה מתעקשים כמובן לומר שזה מאמר מתמטי "מלא נוסחאות סבוכות". ובכן, לא סבוכות ולא נעליים – הנה המאמר לכל המעוניין; הוא קריא מאוד, ובניגוד לטענות שצריך "תואר ראשון במתמטיקה או פיזיקה" בשבילו מספיק לדעתי ללמוד קורס אחד ספציפי בסמסטר הראשון של התארים הללו. למי שבכל זאת מפחד מהמאמר, אנסה להסביר כאן בקיצור מה קריוקוב בעצם עשה.

השורה התחתונה של קריוקוב היא מאוד פשוטה: הוא טוען שברגע שבו הרכב שלו הגיע לתמרור העצור, רכב אחר הסתיר אותו מפני השוטר. אז איך השוטר יודע שקריוקוב לא עצר? ובכן, על סמך המהירות שלו מייד לפני ומייד אחרי שהרכב הסתיר אותו. מה שקריוקוב מראה במאמר הוא שבאופן כללי, הסיטואציה שבה רכב נוסע במהירות קבועה על פני תמרור העצור והסיטואציה שבה הוא עוצר ומייד לאחר מכן מאיץ שוב ייראו זהות למתבונן מהצד, אם קיים באמצע פרק זמן שבו הרכב מוסתר. קריוקוב בהתחלה בונה מודל כללי ואחר כך מציב לתוכו מספרים שרלוונטיים לסיטואציה שלו. אם זה באמת עבד על שופט או שזו מתיחת 1 באפריל – לא יודע; מרבית האתרים שבהם קראתי על הסיפור טוענים שהשופט המסכן פשוט התייאש מהנוסחאות ה"סבוכות" ולכן ויתר לקריוקוב.

הידע שכן צריך בשביל להבין על מה קריוקוב מדבר הוא המתמטיקה הבסיסית שעוסקת בתנועה – חשבון דיפרנציאלי ואינטגרלי. למזלי הכינותי מבעוד מועד פוסטים על נגזרות ואינטגרלים, כך שלא אחזור על החומר הזה שוב לעומק. מה שחשוב לענייננו זה שאם יש לנו פונקציה \(x\left(t\right)\) שמתארת את המיקום של הרכב כפונקציה של הזמן \(t\), אז המהירות של הרכב היא הנגזרת שלה; ובכיוון ההפוך, האינטגרל של המהירות בין שתי נקודות זמן מתאר את המרחק שהיא עברה בזמן זה.

הטענה הבסיסית של קריוקוב היא שהשוטר לא מדד בשום זמן את המהירות האמיתית של הרכב; הוא מדד את המהירות הזוויתית שלו ביחס לשוטר. כלומר, אם נמתח קו ישר מהשוטר אל הרכב, השוטר מדד את קצב ההשתנות של הזווית של הקו הזה. קריוקוב מביא כדוגמה רכבת נוסעת – כשהיא נמצאת במרחק רב מאיתנו, נראה שהיא לא זזה בכלל; ככל שהיא מתקרבת כך המהירות שלה נראית לנו גדולה יותר, והשיא הוא בדיוק כשהיא חולפת על פנינו. זאת מכיוון שאנחנו לא רואים את המהירות ה"אמיתית" שלה, אלא את המהירות הזוויתית שלה. מרגע שהבנו את הרעיון הזה, כל היתר הוא חישובים פשוטים. קריוקוב מתחיל עם הדיאגרמה הזו:

כאן \(r_{0}\) הוא המרחק הקבוע של השוטר משלט ה"עצור" (שאותו קובע קריוקוב בתור ראשית הצירים, כלומר \(x=0\) בדיוק בנקודה זו). הקשר בין הזווית \(\alpha\) שבה השוטר רואה את קריוקוב ובין המרחק \(x\left(t\right)\) של קריוקוב משלט ה"עצור" ברגע \(t\) נתון על ידי הקשר הטריגונומטרי \(\tan\alpha\left(t\right)=\frac{x\left(t\right)}{r_{0}}\). קריוקוב רוצה את \(\alpha\left(t\right)\) עצמה, אז הוא מפעיל את הפונקציה \(\arctan\) על שני האגפים ומקבל \(\alpha\left(t\right)=\arctan\left(\frac{x\left(t\right)}{r_{0}}\right)\). כדי לקבל את קצב ההשתנות של \(\alpha\left(t\right)\) צריך לגזור את המשוואה (הפשוטה!) הזו: לגזור פונקציות כאלו זה תרגיל בסיסי בחדו"א. בואו נציג במפורש את האופן שבו אפשר לעשות זאת תוך שימוש בכללי הגזירה הבסיסיים, סתם כדי לראות שאנחנו יכולים (קריוקוב לא טורח).

ובכן, כלל הגזירה הבסיסי והחשוב ביותר כאן הוא כלל השרשרת: אם \(f,g\) פונקציות גזירות אז \(\left(f\left(g\left(x\right)\right)\right)^{\prime}=f^{\prime}\left(g\left(x\right)\right)g^{\prime}\left(x\right)\). בפרט, אם \(g\left(x\right)\) היא פונקציה המקיימת \(f\left(g\left(x\right)\right)=x\) (כלומר, \(g\) היא "הפוכה" ל-\(f\), בדיוק כמו הקשר בין \(\arctan\) ו-\(\tan\)) אז גזירה עם כלל השרשרת נותנת לנו \(f^{\prime}\left(g\left(x\right)\right)g^{\prime}\left(x\right)=1\), כלומר \(g^{\prime}\left(x\right)=\frac{1}{f^{\prime}\left(g\left(x\right)\right)}\) – זו הנוסחה של "נגזרת הפונקציה ההופכית".

כעת, \(\tan x=\frac{\sin x}{\cos x}\). זו אחת מהתכונות היסודיות ביותר של סינוס וקוסינוס שהנגזרות שלהם הן \(\sin^{\prime}x=\cos x\) ו-\(\cos^{\prime}x=-\sin x\). כמו כן כלל בסיסי בגזירה הוא ש-\(\left(\frac{f}{g}\right)^{\prime}=\frac{f^{\prime}g-g^{\prime}f}{g^{2}}\), וכך נקבל ש-\(\tan^{\prime}x=\frac{\cos^{2}x+\sin^{2}x}{\cos^{2}x}=1+\tan^{2}x\). לכן, מנוסחת הגזירה של הפונקציה ההפוכה, \(\arctan^{\prime}x=\frac{1}{1+\tan^{2}\left(\arctan\left(x\right)\right)}=\frac{1}{1+x^{2}}\). הנה לכם איך מגיעים לנוסחה הזו לכל מי שלא מכיר/זוכר.

עכשיו, בואו נחזור אל \(\alpha\left(t\right)=\arctan\left(\frac{x\left(t\right)}{r_{0}}\right)\) ונגזור אותו על פי כלל השרשרת: \(\alpha^{\prime}\left(t\right)=\frac{1}{1+\left(\frac{x\left(t\right)}{r_{0}}\right)^{2}}\cdot\frac{x^{\prime}\left(t\right)}{r_{0}}\). קריוקוב לא כותב את הנוסחה הכללית הזו אלא מציב מראש מקרים פרטיים. יש שני מקרים שמעניינים אותו: הראשון, מה שהשוטר חושב שהוא ראה, שהוא תנועה במהירות קבועה; והשני, מה שקריוקוב טוען שקרה, שהוא תנועה שבה הגוף מאיט בקצב קבוע, ואז מאיץ בקצב קבוע.

במקרה של תנועה במהירות קבועה \(v_{0}\), הפונקציה של מיקום הגוף היא \(x\left(t\right)=v_{0}t\) (אם מסכימים על כך ש-\(t=0\) הוא הרגע שבו קריוקוב היה בסימן ה"עצור", כלומר ב-\(x=0\)). הנגזרת כאן פשוטה במיוחד: \(x^{\prime}\left(t\right)=v_{0}\). לכן על פי הנוסחה שפיתחנו למעלה, מהירות הרכב שהשוטר רואה היא:

\(\frac{v_{0}/r_{0}}{1+\left(\frac{v_{0}}{r_{0}}\right)^{2}t^{2}}\)

במילים אחרות, מה שהשוטר רואה נראה כמו הפונקציה \(f\left(t\right)=\frac{\alpha}{1+\alpha^{2}t^{2}}\) כאשר \(\alpha\) הוא קבוע שתלוי במהירות הרכב ומרחק השוטר משלט ה"עצור". פונקציה כמו \(f\left(t\right)\) הזו היא בבירור לא קבועה: ככל ש-\(t\) גדול יותר כך היא שואפת מהר מאוד לאפס. המקסימום שלה מתקבל כאשר \(t=0\) ואז ערכה הוא \(\alpha\). את הפונקציה קריוקוב מצייר בגרף הבא:

המקרה השני, שבו הרכב קודם מאיט ואחר כך מאיץ, דורש מקריוקוב קצת יותר עבודה כדי למצוא את \(x\left(t\right)\). מה הנתונים שיש לנו הפעם? ובכן, אנחנו יודעים שבזמן \(t=0\) הרכב היה בשלט העצור, ובמהירות אפס, כלומר \(x\left(0\right)=v\left(0\right)=0\) (השוויון הוא של מספרים; היחידות של \(x\left(t\right)\) ושל \(v\left(t\right)\) שונות ולכן אין משמעות פיזיקלית לכתיבה של משהו כמו \(x\left(t\right)=v\left(t\right)\) באופן כללי). אנחנו גם יודעים (ליתר דיוק, מניחים) שהתאוצה קבועה והיא \(a_{0}\) כלשהו. ליתר דיוק, היא \(a_{0}\) אחרי העצירה; לפני העצירה היא \(-a_{0}\) – אותו גודל, אבל האטה במקום האצה. בגלל הסימטריה של העניין מספיק לבחון את מה שקורה אחרי העצירה.

תאוצה היא נגזרת של המהירות, ומהירות היא נגזרת של המיקום, ולכן על ידי ביצוע שתי אינטגרציות נקבל: \(x\left(t\right)=\int\left(\int a_{0}dt\right)dt=\int\left(a_{0}t+c\right)=\frac{a_{0}}{2}t^{2}+ct+d\) כאשר \(c,d\) קבועים. נציב \(t=0\) ונשתמש בכך ש-\(x\left(0\right)=0\) כדי לקבל ש-\(d=0\); בדומה גם \(c=0\) כי \(v\left(t\right)=a_{0}t+c\). לכן קיבלנו ש-\(x\left(t\right)=\frac{a_{0}}{2}t^{2}\) (וכאשר \(t<0\), אז \(x\left(t\right)=-\frac{a_{0}}{2}t^{2}\); במאמר עצמו קריוקוב טיפה מתבלבל פה ופשוט נותן את \(x\left(t\right)=\frac{a_{0}}{2}t^{2}\) בתור הנוסחה הכללית). אם נציב את זה בנוסחה של \(\alpha^{\prime}\) נקבל את הביטוי הלא מצודד הבא:

\(\alpha^{\prime}\left(t\right)=\frac{\left(a_{0}/r_{0}\right)t}{1+\frac{1}{4}\left(\frac{a_{0}}{r_{0}}\right)^{2}t^{4}}\)

במילים אחרות, זוהי פונקציה מהצורה \(g\left(t\right)=\frac{\alpha t}{1+\frac{1}{4}\alpha^{2}t^{4}}\) עבור קבוע \(\alpha\) שתלוי רק בתאוצה ובמרחק השוטר משלט ה"עצור". בגלל ה-\(t^{4}\) שבמכנה כל העסק שואף מהר מאוד לאפס כש-\(t\) גדול או קטן, אבל ה-\(t\) במונה משנה את מה שקורה בסביבות \(t=0\); כאשר \(t=0\) הפונקציה היא ממש אפס (הרי אמרנו שהרכב עוצר…). מצד שני, עבור ערכי \(t\) שאינם גדולים אבל גם אינם אפס, הפונקציה דווקא יכולה להיות גדולה למדי – יש לה שתי נקודות מקסימום משני עברי נקודת המינימום שבאפס. ככה זה נראה:

ככל שהקבוע \(\alpha\) גדול יותר, כך כל העסק פחוס יותר. הנקודה של קריוקוב היא שעבור ערכים מתאימים של \(\alpha\), הגרף הזה נראה ממש כמו הגרף של תנועה במהירות קבועה, למעט בנקודת המרכז והצניחה אל המינימום שמתרחשת סביבה. קריוקוב טוען שאם בפרק הזמן שבו התבצעה הצניחה הזו הרכב שלו הוסתר, הרי שהשוטר היה רואה בדיוק את מה שקורה בסיטואציה של מהירות קבועה, ולכן מסיק מסקנות שגויות.

אז צריך למצוא מה בדיוק המרחק בין ה"פסגות" של פונקצית המהירות שהשוטר ראה. לצורך כך מבצעים חקירת פונקציה – כלומר, גוזרים את הפונקציה שוב ומשווים לאפס. \(\alpha^{\prime}\left(t\right)\) היא שבר וזה סיפור להתעסק עם המכנה, אבל לא צריך; המכנה ממילא לא יכול להתאפס ולכן מספיק לחשב את המונה של הנגזרת השניה, והוא יוצא:

\(\frac{a_{0}}{r_{0}}\left(1+\frac{1}{4}\left(\frac{a_{0}}{r_{0}}\right)^{2}t^{4}\right)-\left(\frac{a_{0}}{r_{0}}t\right)\left(\frac{a_{0}}{r_{0}}\right)^{2}t^{3}=\frac{a_{0}}{r_{0}}+\left(\frac{a_{0}}{r_{0}}\right)^{3}\left(\frac{1}{4}-1\right)t^{4}\)

על ידי השוואה לאפס והעברת אגפים נקבל:

\(\frac{3}{4}\left(\frac{a_{0}}{r_{0}}\right)^{2}t^{4}=1\)

ועל ידי חלוקה והוצאת שורש נקבל:

\(t=\sqrt[4]{\frac{4}{3}}\sqrt{\frac{r_{0}}{a_{0}}}\)

אבל רגע, מה הולך פה? הרי רואים בגרף שלפונקציה של התאוצה יש שלוש נקודות קיצון, לא אחת. איך ייתכן שהחקירה שלנו הניבה אחת בלבד? נסו לחשוב על זה שניה, ובינתיים נדבר על מה שקריוקוב עשה עם הנוסחה הזו. קריוקוב החליט שהוא עצלן ורוצה לעשות לעצמו חיים קלים – הוא הניח ש-\(r_{0}=a_{0}=10\). אני לא יודע מהיכן הוא המציא את הנתון ש-\(r_{0}=10\); אולי אלו היו העובדות במקרה הזה. את \(a_{0}=10\) הוא מנמק בכך שהוא היה מצונן באותו יום והתעטש בדיוק בזמן הבלימה לקראת השלט. אם אני הייתי השופט, בשלב הזה בקריאה (אם הייתי שורד עד אז) הייתי חושד שעושים ממני צחוק. מכל מקום, קריוקוב מקבל שהמקסימום הוא ב-\(\sqrt[4]{\frac{4}{3}}\approx1.07\).

ולמה התקבלה רק נקודת קיצון אחת? כי הפונקציה שאותה חקרנו היא אכן בעלת נקודת קיצון אחת בלבד: כזכור, התעסקנו רק עם מה שקורה עבור \(t\ge0\). כדי לקבל את מה שקורה גם לפני כן צריך "להדביק" לפונקציה הזו את תמונת הראי שלה, \(-\frac{\left(a_{0}/r_{0}\right)t}{1+\frac{1}{4}\left(\frac{a_{0}}{r_{0}}\right)^{2}t^{4}}\) (שנקודת הקיצון שלה היא בערך ב-\(-1.07\)) ונקודת הקיצון השלישית מתקבלת בנקודת ההדבקה שלהן (אבל ממילא זו לא הנקודה שמעניינת אותנו).

החישוב האחרון שעוד נותר הוא של "מתי החלה ההסתרה ומתי היא נגמרה". כאן קריוקוב מציין שאורך המכונית שלו הוא 150 אינצ'ים והוא מעריך את אורך המכונית שהסתירה אותו ב-189 אינצ'ים. עכשיו הוא מגדיר \(x_{p}\) בתור המרחק מ-\(x=0\) שבו נגמרה ההסתרה החלקית, וב-\(x_{f}\) את המרחק שבו נגמרה ההסתרה המלאה. אם מניחים שהרכב השני פשוט עמד ב-\(x=0\) ולא זז, אז \(x_{p}\) הוא סכום האורכים שלהם ו-\(x_{f}\) הוא הפרש האורכים שלהם, כלומר \(8.16\) מטרים ו-\(0.99\)מטרים, בהתאמה. קריוקוב קצת מחליק פה משהו לדעתי – הוא מניח סימטריה מלאה סביב הצירים, כלומר שההסתרה החלקית החלה ב-\(-x_{p}\) וההסתרה המלאה החלה ב-\(x_{f}\), אבל כמובן שזה מניח שכשההסתרה החלקית החלה אז ראש הרכב המסתיר היה ב-\(x=0\), וכשהיא נגמרה אז הזנב שלו היה שם; כלומר, הנחה מאוד ספציפית לגבי תנועת הרכב השני. אני תוהה אם השופט שם לב לזה (או שאני סתם מתבלבל). מילא, יש המון פרמטרים שאפשר לשחק איתם כאן.

קריוקוב מחשב ומוצא ש-\(t_{p}=1.31\) ו-\(t_{f}=0.45\) (שוב, אלו הזמנים שבהם ההסתרות נגמרו, והמינוס שלהם הם הזמנים שבהם ההסתרות החלו). מכאן אנו רואים שהזמן שבו קריוקוב היה בתאוצת שיא הוא זמן שבו קריוקוב כבר היה מוסתר חלקית על ידי הרכב, ושפרק הזמן הקריטי ביותר היה כמובן פרק זמן שבו הוא היה מוסתר לחלוטין. סוף הסיפור.

מה דעתי על כל זה? שזה משחק חביב אבל לא יותר מכך. כרגיל בעניינים מתמטיים שכאלו, המודל אולי חשוב אבל הנתונים שיוצקים לתוכו הם הסיפור האמיתי. כאן קריוקוב הניח לו כל מני הנחות מספריות על הנתונים שאיני יודע מה הקשר בינן ובין המציאות. הוא גם לא הוכיח שהוא עצר בתמרור אלא שהוא היה עשוי לעצור מבלי שהשוטר יבחין בכך. מצד שני, המתמטיקה של קריוקוב תקפה והוא לא מוכיח בשום מקום שפאי שווה 3, כך שאני מקווה שבסופו של דבר הפרשייה הזו נתנה קצת יחסי ציבור חיוביים למתמטיקה.

חוק המספרים הגדולים עושה אותך כזה קטן

הפנו אותי אל מאמר מתוך "דה-מרקר" שבתורו נלקח, לא פחות, מה"ניו-יורק טיימס". המאמר מתהדר בכותרת "סיבה לדאגה לאפל? "חוק המספרים הגדולים יוביל לנפילתה"" ובכותרת המשנה "החוק שהוכיח מתמטיקאי שווייצי בן המאה ה-17 עשוי לבשר על כך שגורלה של אפל יהיה זהה לזה של חברות ענק קודמות" – וזה, מה נאמר, כמו דם במים בשביל כריש.

בואו נתחיל מהטקסט. הוא נפתח בלספר כי אפל היא החברה הגדולה ביותר בעולם כיום ואז מביא נתונים שמראים שאפל מרוויחה בוחטות ונמצאת בעליה מתמדת. ואז מגיע הפאנץ':

אך כאן גם טמונה בדיוק הבעיה של אפל: החברה הפכה לכל כך גדולה כך שחוק המספרים הגדולים החל לפעול נגדה. חוק המספרים הגדולים, שאותו הוכיח המתמטיקאי השווייצי בן המאה ה-17 יעקב ברנולי, קובע כי כל משתנה ילך ויתקרב לממוצע ככל שמדגם התוצאות גדול יותר. במקרה של חברות גדולות, משמעות החוק היא כי ככל שחברות הולכות וגדלות, צפויה האטה בצמיחה החדה ברווחיהן ובעלייה החדה במחיר מניותיהן.

מה כן נכון: קיים משפט מתמטי בשם "חוק המספרים הגדולים". מקרה פרטי בסיסי של חוק המספרים הגדולים אכן הוכח על ידי יעקב ברנולי במאה ה-17 ובכך זיכה את ברנולי, ובצדק, בתואר של אחד ממייסדי תורת ההסתברות. כל השאר שגוי – גם ניסוח המשפט (טוב, זה לא מפתיע) וגם כל הסקת המסקנות ממנו. כמובן, ייתכן מאוד שקיימת תופעה שבה ככל שחברות הולכות וגדלות צפויה האטה בצמיחתן; אבל קשר לחוק המספרים הגדולים – נייט.

הפסקה הבאה קצת שופכת אור על זה:

האנליסט רוברט סירה מחברת אוורקור פרטנרס, המכסה את מניית אפל, אמר השבוע כי חוק המספרים הגדולים כפי שהוא חל על אפל "מהווה מקור לדאגה כבר שנים. עם זאת, בשנתיים האחרונות נרשמה, למעשה, האצה בצמיחת הכנסות החברה, אבל זה לא יכול להימשך לנצח. אם הולכים קדימה עם התחזיות מספיק רחוק, כדי להמשיך לצמוח באותו הקצב תצטרך אפל למכור אייפון לכל גבר, אשה, ילד, בעלי חיים ואבן על פני כדור הארץ".

שימו לב שאותו רוברט סירה לא הזכיר את חוק המספרים הגדולים אפילו ברמז. במקום זה הוא נותן נימוק סביר לכך שהאטה בצמיחה של אפל היא בלתי נמנעת – השוק שלה קטן דווקא בגלל שהיא מצליחה למכור כל כך הרבה. לי אישית זה מעלה בראש משוואות דיפרנציאליות ואת מודל טורף-נטרף ואפילו שמעתי לא מזמן הרצאה יפה של פרופ' דניאל הרשקוביץ (שכרגע מחלטר כשר המדע) שנתנה את שוק הפלאפונים בדיוק כדוגמה לעניינים הללו. מה שזה לא מזכיר לי זה את חוק המספרים הגדולים.

אבל!

חוק המספרים הגדולים של ברנולי כבר חזה, כך נדמה, את נפילתן של חברות אחרות שהחזיקו בתואר החברה הגדולה בעולם במונחי שווי שוק. שווי השוק של סיסקו זינק ל-557 מיליארד דולר – יותר משווי השוק הנוכחי של אפל – בשיאה של בועת ההייטק בחודש מארס 2000. כיום, שווי השוק של סיסקו הוא כ-100 מיליארד דולר, ומחיר מנייתה נמוך בכמעט 80% מהשיא אליו הגיע במארס 2000. שווי השוק של חברות אחרות שהחזיקו בבכורה, דוגמת ג'נרל אלקטריק, מיקרוסופט ואקסון מוביל, נמוך אף הוא כעת משהיה בתקופה בה החזיקו בבכורה.

ובכן: היו חברות שהיו הגדולות ביותר. עכשיו, מטבע הדברים, הן כבר לא. מסקנה: חוק המספרים הגדולים חזה את זה. איכשהו.

וזה מופיע בניו-יורק טיימס? באמת?

טוב, בואו נדבר על "מה כן" במקום על "מה לא" כל הזמן. בניסוח הכי לא פורמלי שאני יכול לתת, מה שחוק המספרים הגדולים כן אומר הוא שאם תטילו קוביה הרבה מאוד פעמים ותנהלו רישום של התוצאה הממוצעת שקיבלתם (כלומר, תחלקו את סכום התוצאות שהיו עד כה במספר ההטלות שהיו עד כה), אז ככל שמספר ההטלות יגדל, כך הממוצע שרשום אצלכם יתקרב לממוצע התיאורטי שאפשר לחזות רק מתוך היכרות עם הקוביה: לממוצע התיאורטי הזה יש שם מתמטי – תוחלת. מה שחוק המספרים הגדולים אומר הוא בעצם שמושג התוחלת עובד. בדוגמה הקונקרטית של קוביה, אותו ממוצע תיאורטי צפוי הוא \(3.5\) (ואסביר עוד מעט בדיוק למה), ואכן אם תכתבו תוכנית מחשב שמטילה לה קוביות וירטואליות ומבצעת את חישוב הממוצע תראו – בודאות! אני מבטיח! – שהממוצע הזה הולך ומתקבע לו בסביבת \(3.5\) ככל שהחישוב מתמשך. בויקיפדיה האנגלית אפילו יש להם גרף יפה שמתאר בדיוק את זה.

כמובן, חוק המספרים הגדולים לא מדבר רק על הטלות קוביה. "הטלת קוביה" כאן היא מטאפורה לכל ניסוי הסתברותי שיש לו כמה תוצאות מספריות אפשריות. לדבר כזה קוראים משתנה מקרי. אפרט עוד קצת בהמשך.

למה זה לא קשור לאפל? ובכן, קודם כל יש את הבעיה הכללית של החלת מודלים מתמטיים על המציאות המבולגנת שלנו: חוק המספרים הגדולים דורש שניקח את הממוצע של חזרה שוב ושוב על אותה הגרלה של אותו משתנה מקרי. לא ברור מהי אותה הטלת קוביה במקרה של חברות – האם לכל חברה יש בדיוק אותם סיכויי הצלחה? וכשמדברים ספציפית על אפל, האם אפל עצמה מטילה קוביה כל יום? חודש? שנה? והאם מותו של סטיב ג'ובס לא שינה את הקוביה שהיא מטילה? האם גם הוא שוקלל פנימה איכשהו? כמו שאתם רואים, אין לנו ברירה אלא לנטוש את המודל המתמטי הפשוט והיפה. מה שאנחנו עדיין יכולים לקוות לו הוא שהמודל המתמטי הפשוט הוא קירוב טוב למה שקורה במציאות, אבל זה מאלץ אותנו להיות זהירים שבעתיים בהסקת המסקנות שלנו מהמודל. אל תסיקו ממה שאמרתי שמודלים סטטיסטיים הם לא שימושיים בעולם האמיתי – ברור שהם שימושיים. אבל להפעיל מודל סטטיסטי בפיזיקה על קבוצה גדולה של חלקיקים שכל אחד מהם זהה לאחרים ולכן אפשר לחשוב עליהם במובן מסויים בתור הטלה שוב ושוב של אותה הקוביה – או אפילו לנתח את הרווחים שיהיו לקזינו משולחן רולטה – שונה מאוד מאשר להפעיל אותה על שוק החברות העולמי.

אבל, זו אפילו לא הבעיה האמיתית עם השימוש בחוק כאן, אלא רק משנה הזהירות שצריך תמיד לנקוט בו. הבעיה האמיתית היא שהחוק מדבר על ממוצע, והמאמר מנסה להסיק ממנו מידע על מקרה בודד.

למרבה הצער, המאמר לא ממש מסביר על מה הוא מפעיל את חוק המספרים הגדולים, ולכן יש שתי אפשרויות שנראות לי טבעיות באותה מידה: או שהוא מפעיל את החוק על השוק כולו, או שהוא מפעיל אותו על אפל ספציפית. נתחיל דווקא מהמקרה השני, שבו אני מניח שהכוונה היא שאפל מטילה קוביה שוב ושוב. חוק המספרים הגדולים אכן אומר שממוצע ההטלות של אפל אכן ישאף לתוחלת; אבל מהי התוחלת הזו? האם אנחנו בכלל יודעים שהיא סופית? האם לא ייתכן שהיא כן משתנה עם הזמן? ויותר מכך – מכיוון שאנחנו מתעניינים רק בממוצע ההטלות, האם לא ייתכן שמדי פעם יתקבלו הטלות גרועות ממש, שיאזנו את ההטלות החיוביות? המאמר מנסה איכשהו להסיק שההטלות של אפל יהפכו להיות קרובות לממוצע – כלומר, שהחל משלב מסויים, כל הטלת קוביה תהיה 3 או 4 כי אלו הערכים שקרובים ל-\(3.5\). זה ממש לא נכון.

ונניח שמדובר כאן על השוק כולו. כאן המצב הוא עוד יותר גרוע. אמנם, יותר סביר להניח במקרה זה שיש איזו "תוחלת שוק" סבירה וקבועה, אבל למה שדווקא אפל תשאף אליה? כל עוד יש מספיק חברות כושלות אחרות שמאזנות את הממוצע, אפל יכולה לנסוק כמה שרק מתחשק לה. במילים אחרות, כל עוד אנחנו מקבלים 1 מספיק פעמים בקוביה אין בעיה שנקבל גם 6 – עדיין נקבל ממוצע \(3.5\).

אני רק רוצה להבהיר – מה שהמאמר מדבר עליו בפועל – האטה בצמיחה של אפל – הוא כנראה משהו שיקרה בפועל, ומשהו מאוד סביר, וגם נתנו לו הסבר סביר בגוף המאמר. אני רק מתקומם על הנסיון לדחוף פנימה באופן בלתי קשור בעליל משפט מתמטי יפהפה. בעצם, כנראה שמה שהכי מפריע לי כאן הוא הנסיון של הכותב לשכנע בצדקתו על ידי שליפת כוח עליון – המתמטיקה – שרוב הקוראים לא יעזו להתווכח איתו. פוי.

לסיום אני רוצה לומר מה המשפט כן אומר, באופן מדויק. לא אוכיח אותו כאן כי ההוכחה לא בהכרח קצרה (תלוי איזו גרסה של המשפט מוכיחים) ובכל מקרה דורשת קצת עבודת הכנה. אבל לנסח אפשר.

ובכן, מבחינה מתמטית יש לנו ברקע של ניסוי הסתברותי תמיד משהו שנקרא מרחב מדגם. על מרחב המדגם הזה מוגדרים משתנים מקריים. ההגדרה של כל אלו לא טריוויאלית באופן כללי, אבל במקרה הפשוט שבו המשתנה המקרי יכול לקבל רק אחד מבין מספר סופי של ערכים, אפשר לתמצת את הסיטואציה לכך: אם \(X\) הוא משתנה מקרי, נסמן ב-\(\mbox{P}\left[X=a\right]\) את ההסתברות (מספר בין 0 ל-1) ש-\(X\) יקבל את הערך \(a\) בהגרלה שאנחנו מבצעים, ומתקיים \(\sum\mbox{P}\left[X=a\right]=1\), כשהסכום נלקח על אותם \(a\)-ים שיש ל-\(X\) הסתברות חיובית לקבל. כעת נגדיר את התוחלת של \(X\) להיות הממוצע המשוקלל של הערכים שלו – משוקלל בהסתברויות שהם יתקבלו. כלומר, \(\mbox{E}\left[X\right]=\sum a\cdot\mbox{P}\left[X=a\right]\). עבור קוביה הערכים האפשריים הם המספרים מ-1 עד 6 וההסתברות לכל אחד מהם היא \(\frac{1}{6}\) ולכן \(\mbox{E}\left[X\right]=\frac{1+2+3+4+5+6}{6}=\frac{21}{6}=3.5\), כמובטח.

כעת בואו נניח שיש לנו לא משתנה מקרי אחד אלא סדרה אינסופית שלהם: \(X_{1},X_{2},X_{3},\dots\). עוד נניח שכולם מתפלגים באותו האופן, ושהם בלתי תלויים אחד בשני (כל אחד מייצג הטלה שונה של אותה הקוביה). בפרט, יש לכולם את אותה תוחלת שנהוג לסמן ב-\(\mbox{E}\left[X_{i}\right]=\mu\) עכשיו נגדיר מהם משתנים חדשים שמייצגים את "הממוצע של כל המשתנים עד כאן", כלומר \(\overline{X}_{n}=\frac{\sum_{i=1}^{n}X_{i}}{n}\). מה שחוק המספרים הגדולים אומר הוא שהסדרה \(\overline{X}_{n}\) מתכנסת ל-\(\mu\). בחשבון אינפיניטסימלי יש לנו מושג מדויק שמתאר התכנסות של סדרות לערכים – מושג הגבול, אבל כאן הסיטואציה קצת יותר בעייתית כי \(\overline{X}_{n}\) היא סדרה של משתנים מקריים; זה אומר שהיא לא סתם סדרה של ערכים קבועים, אלא מייצגת התפלגות כלשהי על סדרות כאלו. לכן צריך גם לתת הגדרות של התכנסות שמביאות את זה בחשבון. יש כמה הגדרות שונות שאפשר לתת, ואנחנו מתפצלים לשתי גרסאות שונות של חוק המספרים הגדולים עבור שתי הגדרות שונות להתכנסות – החוק החלש של המספרים הגדולים, והחוק החזק של המספרים הגדולים. הם נקראים כך כי ניתן להסיק את החוק החלש מתוך החוק החזק, אבל כאמור – שניהם מטפלים בשני סוגי התכנסות שונים.

החוק החלש מטפל במה שנקרא "התכנסות בהסתברות". לא אציג את המושג הכללי אלא רק את משמעותו בהקשר של חוק המספרים הגדולים: לכל \(\varepsilon>0\) מתקיים ש-\(\lim_{n\to\infty}\mbox{P}\left[\left|\overline{X}_{n}-\mu\right|<\varepsilon\right]=1\). מה זה אומר? לכל \(n\) טבעי, נשאל את עצמנו "מה הסיכוי שאם אני מסתכל על הממוצע של \(n\) המשתנים הראשונים, הוא יהיה קרוב לתוחלת עד כדי \(\varepsilon\)?". הסיכוי הזה לא יהיה 1, חלילה; תמיד יש איזה שהוא סיכוי לחריגה אלא במקרים פשוטים ביותר. אבל, ככל שנגדיל את \(n\), כך גם הסיכוי ילך ויתקרב ל-1 במובן הסטנדרטי של שאיפה לגבול.

החוק החזק מטפל במה שנקרא "התכנסות כמעט בודאות". הניסוח כאן יותר פשוט , בלי אפסילונים: \(\mbox{P}\left[\lim_{n\to\infty}\overline{X}_{n}=\mu\right]=1\). במילים אחרות, אם אני מגריל סדרת ממוצעים כלשהי ומסתכל על הגבול של אותה סדרת ממוצעים, הגבול הזה יהיה \(\mu\) כמעט בכל המקרים (הסתברות 1 לא תמיד אומרת "בכל המקרים בודאות", אבל גם זו פינה אפלה שאני לא אכנס אליה כעת). שימו לב להבדל – בחוק החלש הגבול היה על סדרת ההסתברויות, וכאן הגבול הוא של סדרת המשתנים עצמה. זה החוק החזק שאנו חושבים עליו כשאנו אומרים שמושג התוחלת "עובד" – זה אומר שלמעט אולי בכמה מקרים חריגים וזניחים, סדרת הממוצעים שואפת לתוחלת, נקודה.

יעקב ברנולי, למיטב ידיעתי, הוכיח רק את המשפט החלש, וגם זה רק למקרה פרטי של משתנים שמקבלים או 0 או 1 (משתני ברנולי). גם זה היה הישג אדיר בתקופתו, בהתחשב בכך שתורת ההסתברות עוד לא הייתה קיימת וכך גם התשתית שבה משתמשים כדי להוכיח את המשפטים כיום; את הגרסה הכללית ביותר (המשפט החזק, ועבור משתנים מקריים כלשהם) הוכיח מתמטיקאי רוסי – קינצ'ין – רק במאה ה-20. למי מגיע הקרדיט על גרירת החוק לענייני כלכלה אני לא יודע, ואולי טוב שכך.

גבישים כמו-מחזוריים וריצופים כן-מחזוריים

בשעה טובה פרופ' דני שכטמן מהטכניון זכה בפרס נובל על גילוי הגבישים הכמו-מחזוריים, וזו הזדמנות טובה להסביר קצת את ההיבט המתמטי של העניין. במובן מסויים המתמטיקה היא הטיפוס הרע בסיפור הזה: אם לוותר בכוונה על הדיוק למען הרומנטיקה, שכטמן גילה חומר בטבע שמפר את חוקי המתמטיקה. בפועל, כמובן, זה לא בדיוק מה ששכטמן גילה, אבל היחס העוין לשכטמן בשנים הראשונות שלאחר פרסום התגלית אכן היה כאילו הוא טען שאחד ועוד אחד שווה שלוש.

את הסיפור המרתק של שכטמן כבר סיפר "הארץ" לפני כחצי שנה בערך, הרבה לפני מהומת פרס הנובל הנוכחית (אם כי זה שנים רבות שהגילוי של שכטמן כבר הפך לעובדה בלתי מעורערת, וכבר שנים רבות שפרס הנובל היה צפוי). בקצרה, שכטמן עסק בחקר גבישים, ויום אחד ראה דרך המיקרוסקופ שלו תמונה לא סבירה בעליל – גביש בעל סימטריה מחומשת (מה זה? ובכן, אסביר בקרוב, זו מטרת הפוסט). שכטמן מייד הבין שמשהו מאוד מוזר קורה פה, כי אחד מהחוקים הבסיסיים הידועים לכל מי שעוסק בגבישים, זה שהופיע חיש קל בכל ספר לימוד בנושא, היה שמבחינה מתמטית גביש בעל סימטריה מחומשת לא יכול בכלל להתקיים. המסקנה, כמובן, לא הייתה שמשהו מקולקל במתמטיקה, אלא שמשהו מקולקל בקריסטלוגרפיה: שההגדרה של "גביש" לא הייתה מקיפה דיה. כיום זו אכן המסקנה מהתגלית של שכטמן, וההגדרה עצמה (הגדרה שעומדת בבסיס תחום מדעי שלם) עודכנה בהתאם. הסיפור הוא דווקא דוגמה נפלאה של הדרך שבה המתמטיקה עוזרת למדע – אלמלא התוצאה המתמטית לפיה סימטריה מחומשת אינה אפשרית, לא הייתה סיבה להניח שהחומר ששכטמן בחן הוא שונה מהותית מגבישים "רגילים".

גביש "רגיל" הוא חומר שבו הסדר הפנימי של האטומים חוזר על עצמו: יש תבנית בסיסית פשוטה, והאטומים בתוך הגביש חוזרים על התבנית הזו באופן מסודר ואחיד שממלא את המרחב כולו. גבישים הם תלת ממדיים, אבל כדי להבין את הסיפור אפשר להסתפק במקרה הדו ממדי, ובו יש לנו המחשות ויזואליות למה שמדובר עליו – "טפטים". כאן תמונה אחת באמת שווה אלף מילים:


מה שיש לנו כאן הוא תמונה שחוזרת על עצמה שוב ושוב ושוב. כשאנחנו רואים כזה דבר, המילה "סימטריה" כנראה קופצת לנו לראש מייד, אבל מה זה בעצם אומר? מבחינה מתמטית פורמלית, סימטריה של אובייקט היא פעולה כלשהי שניתן לבצע על האובייקט שאחריה הוא נראה כאילו לא בוצע בו שום שינוי. כשאנחנו מדברים על אובייקטים גאומטריים כמו טפטים או גבישים, לרוב אנחנו מגבילים את עצמנו מראש לדיבורים על סימטריות שהן איזומטריות – אם נחשוב על האובייקט כמורכב מנקודות, אז הפעולות שמותר לבצע עליו הן כאלו שבסופן המרחק בין כל זוג נקודות זהה למרחק שהיה ביניהן בהתחלה.

במקום להציג הגדרה יותר מפורשת פשוט אגיד מה זה אומר בפועל – כשמתעסקים עם צורות מישוריות, האיזומטריות היחידות הן הזזה, שיקוף וסיבוב. בואו נשכח משיקופים שלא יהיו כל כך רלוונטיים לצורך הדיון ונדבר רק על הזזות וסיבובים, שאותם אפשר לתאר בדרך אינטואיטיבית למדי. חשבו שאתם עומדים על רצפה שעליה מופיע הציור שהבאתי קודם. אז "הזזה" פירושה שפשוט תלכו מהמיקום הנוכחי שלכם כמה צעדים בכיוון כלשהו; ו"סיבוב" פירושו שפשוט תסתובבו במקומכם (המקום שבו אתם עומדים באותו הרגע הוא ציר הסיבוב). חשבו שהרצפה נמשכת עד לאינסוף בכל הכיוונים באותו האופן. ברור שאם תלכו צעד קטן מאוד או תסתובבו רק טיפה במקום, התמונה שאתם רואים תשתנה מעט; אבל, למשל, אם תסתובבו סיבוב של 90 מעלות בעיניים עצומות, כשתפקחו את העיניים לא תראו שום הבדל בין מה שאתה רואים כעת ומה שראיתם לפני שעצמתן אותן, וזאת למרות שבבירור ביצעתם תזוזה מסויימת. זוהי סימטריה.

צורות בעלות סימטריה לסיבובים לא חסרות. נתחיל מהמעגל, שהוא מושלם מהבחינה הזו – כל סיבוב, בכל זווית שהיא, שצירו הוא מרכז המעגל מותיר את המעגל ללא שינוי. לכן המעגל הוא סימטרי עבור כל סיבוב סביב מרכז המעגל. עוד צורות סימטריות הן המצולעים המשוכללים – מצולע משוכלל הוא מצולע שאורכי כל צלעותיו וכל זוויותיו שוות (למשל – משולש שווה צלעות, ריבוע, משושה משוכלל וכו' וכו'). לא קשה לראות שמצולע משוכלל עם \(n\) צלעות הוא סימטרי ביחס לסיבוב בזווית של \(\frac{360}{n}\) מעלות (למשל: ריבוע סימטרי ביחס לסיבוב בזווית של 90 מעלות). הדוגמה הזו תשמש אותי בטרמינולוגיה בהמשך: "סימטריה ריבועית" היא סימטריה ביחס לסיבוב ב-90 מעלות, כמו במקרה של הריבוע; ולכן "סימטריה מחומשת" תהיה עבור סיבוב בזווית של \(\frac{360}{5}=72\) מעלות, סיבוב שהוא סימטרי עבור המחומש. כעת ברור מה שכטמן ראה: משהו שנראה כמו גביש אבל הפגין סימטריה ביחס לסיבוב בזווית של 72 מעלות (למעשה, הוא הפגין סימטריה ביחס לסיבוב ב-36 מעלות, כלומר כזו שמתאימה למצולע משוכלל עם 10 צלעות, אבל אני מעדיף לשמור את העניינים פשוטים).

בואו נעבור לדבר על צורות בעלות סימטריה להזזה. כאן האינטואיציה היומיומית שלנו כבר קצת פחות רלוונטית, כי על פי ההגדרה היבשה צורות סימטריות להזזה חייבות להיות אינסופיות, שהרי אם הצורה הייתה סופית והיינו מזיזים אותה בכיוון כלשהו בעיניים עצומות, היינו שמים לב לשינוי כשהיינו פוקחים עיניים – הצורה כבר לא הייתה מונחת באותו מקום! לכן סימטריה להזזה בכיוון מסויים פירושו שהצורה היא אינסופית בכיוון הזה (ובכיוון ההפוך לו בדיוק) ומורכבת מעותקים של איזו יחידה בסיסית שכאשר מזיזים אותה בכיוון של הסימטריה ובכמות הדרושה, מכסה בדיוק יחידה בסיסית אחרת. בעולם האמיתי אין דברים כאלו, כמובן, כי צורות הן סופיות; אבל אם אותה תבנית חוזרת על עצמה מספיק פעמים גם בתוך צורה סופית אנחנו מבינים את הקטע ומסוגלים לדמיין את הצורה האינסופית, שבעצם נראית בדיוק כמו הצורה הסופית שלנו, רק שיש יותר ממנה.

אם יש לצורה סימטריה להזזה בכיוון אחד זה נחמד, אבל אם יש לה סימטריה להזזה בשני כיוונים שונים בלתי תלויים (שאינם מנוגדים) זה בכלל נפלא – במקרה זה הצורה חייבת לכסות את המישור כולו (להבדיל מסימטריה בכיוון אחד שבו הצורה יכולה להיות רצועה צרה שנמשכת עד אינסוף רק בכיוון של ההזה והכיוון המנוגד). אם כן, יש לנו תבנית בסיסית כלשהי שחוזרת על עצמה ומכסה את כל המישור – נשמע מוכר? זו בדיוק ההגדרה ל"גביש" שהזכרתי בתחילת הפוסט (שם זה היה על אובייקטים תלת ממדיים אבל הרעיון הוא אותו רעיון). אפשר גם ללכת בכיוון ההפוך – מכיוון שכל גביש בנוי מתבנית שחוזרת על עצמה באופן שמכסה את המישור/מרחב והחזרות עצמן הן מחזוריות (כלומר, כל פעם באותם מרחקים), יש לגביש תמיד סימטריה להזזה בשני כיוונים/שלושה כיוונים (שוב, תלוי אם אנחנו מדברים על המישור או המרחב).

וכעת שואלים את עצמם המתמטיקאים – נניח שיש לנו קבוצת סימטריות של טפט כלשהו, ואנחנו יודעים שיש שם סימטריה להזזה בשני כיוונים; אילו עוד סימטריות עשויות להיות שם? ובכן, לפעמים הכל יכול להיות שם – חשבו על טפט שהוא כולו שחור. כל הזזה או סיבוב יהיו סימטריות שלו, אבל זה בבירור לא מה שאנחנו רוצים. אנחנו רוצים לדבר על סימטריות של אובייקט בדיד, כזה שאפשר לחשוב עליו בתור אינסוף עותקים של יחידה בסיסית כלשהי שהיא עצמה כבר לא סימטרית להזזה.

זה מוביל להגדרה הבאה – קבוצת סימטריות שהסימטריות שלה להזזה נוצרות על ידי שתי הזזות בלתי תלויות נקראת חבורה קריסטלוגרפית מישורית; ואם זו קבוצת סימטריות של גביש בתלת מימד שהסימטריות שלה להזזה נוצרות על ידי שלוש הזזות בלתי תלויות היא נקראת חבורה קריסטלוגרפית מרחבית. ויש עוד שמות – למשל, Wallpaper group עבור חבורה מישורית וסתם Space group עבור חבורה מרחבית, וכדומה. המילה "חבורה" מציינת שקבוצת הסימטריות היא גם בעלת מבנה מסויים – אפשר תמיד להרכיב שתי סימטריות ולקבל סימטריה אחרת (הרכבת סימטריות פירושה הפעלה של אחת הסימטריות ואז הפעלה של השניה – למשל, הזזה בכיוון אחד ואז בכיוון אחר היא עצמה הזזה בכיוון שלישי שהוא תערובות של שניהם, ואם שתי ההזזות שבוצעו הותירו את הצורה ללא שינוי גם ההזזה המעורבת תותיר את הצורה ללא שינוי).

האתגר הראשוני של הקריסטלוגרפיה, אם כן, הוא למיין חבורות קריסטלוגרפיות. להבין אילו חבורות קריסטלוגרפיות יכולות בכלל להתקיים. בכל הנוגע לחבורות קריסטלוגרפיות מישוריות, התשובה היא שקיימות בדיוק 17 חבורות שכאלו ויש; חבורות קריסטלוגרפיות מרחביות יש הרבה יותר – 230 (אפשר גם לדבר על חבורות קריסטלוגרפיות במימדים גבוהים יותר ואז המספר שלהן הולך וגדל). המיון של החבורות הללו הוא בעיה מעניינת מאוד בתורת החבורות, אבל אני לא צריך לדבר עליו כאן; די לי לדבר על המשפט שמופיע בתחילת המיון, "משפט האיסור הקריסטלוגרפי" (Crystallographic restriction theorem), שהוא הצעד הראשון בדרך להבנה מי כן ומי לא יכול להיות חבורה קריסטלוגרפית.

אמרנו כבר שהדרישה הבסיסית מחבורה קריסטלוגרפית מישורית היא שתכיל הזזות בשני כיוונים בלתי תלויים. הסוג האחר של סימטריות שיכול להיכנס לחבורות קריסטלוגרפיות מישוריות הוא סימטריה לסיבובים. כדי להבין את ההבדל, הנה תמונה של טפט שיש לו סימטריה להזזות אך לא לסיבובים:


החצים מראים את ההזות כאן. הנה דוגמה לטפט שיש לו גם סימטריה להזזות וגם סימטריה ל-3-סיבובים, כלומר סיבובים של שליש מעגל, כלומר של 120 מעלות, כלומר של משולש שווה צלעות:


כאן המשולשים מופיעים על צירי הסיבוב.

והנה דוגמה שבה יש (בין היתר) סימטריה ל-4-סיבובים, כלומר של 90 מעלות:


ועכשיו אפשר לדבר על המשפט הכללי: בחבורה קריסטלוגרפית סוגי הסיבובים היחידים שיכולים להופיע הם עבור 2,3,4,6-סיבובים (כלומר: 180,120,90 ו-60 מעלות). סיבובים בזוויות אחרות פשוט לא יכולים לתת סימטריה עבור אובייקט שכבר יש לו סימטריה להזזה בשני כיוונים שונים. זה בדיוק המשפט שהגביש של שכטמן הפר.

אם נסתכל על התמונה שבה שכטמן מדבר עם ראש הממשלה, כנראה שזה בדיוק מה שהוא מסביר לו:


ההוכחה של המשפט הולכת בערך כך: אם קבוצת הסימטריות להזזה שלנו נוצרת על ידי שתי סימטריות הזזה בלתי תלויות, נובע מכך שקיימת הזזה "קצרה ביותר" שמזיזה למרחק גדול מאפס. בלי להוכיח זאת פורמלית, לא קשה להבין את ההגיון – אם לכל מרחק, קטן ככל שיהיה, הייתה לנו סימטריה להזזה שלא עוברת יותר מאת המרחק הזה, אז הצורה שלנו הייתה פשוט נראית אותו הדבר בכל מקום (פורמלית זה נובע מהדרישה שהאובייקט שלנו יהיה בדיד). עכשיו, אם מכניסים לתמונה גם סימטריות של סיבוב, אז אפשר לבנות סימטריות הזזה חדשות על ידי כך שלוקחים את ההזזה הקצרה ביותר ומפעילים יחד עם הפעלת סיבובים, ופתאום מקבלים הזזה קצרה עוד יותר. אני מעדיף להתחמק עכשיו מניסוח מדויק של המשפט כי הפוסט הזה הוא בעיקרו לא פורמלי, והוכחה מדויקת של המשפט דורשת הכנסה של מושגים נוספים.

מה שאני רוצה לדבר עליו עכשיו הוא השאלה המציקה הברורה שעולה כבר מראשית הדיון – איך מה ששכטמן גילה מסתדר עם המתמטיקה? המתמטיקה, כאמור, אומרת חד משמעית שלגביש לא יכולה להיות סימטריה מחומשת. איך שכטמן גילה גביש בעל סימטריה מחומשת?

התשובה היא ששכטמן גילה משהו שנראה כמו גביש, אך מפר את ההנחה היסודית ביותר של הקריסטלוגרפים – שלגביש יש סימטריה להזזות. כבר ראינו שסימטריה להזזות היא דרך שונה לומר "הצורה חוזרת על עצמה באופן מחזורי". שכטמן גילה חומר שחוזר על עצמו באופן לא מחזורי. למה הכוונה? שוב, עדיף לחשוב על ריצוף של המישור. עד כה חשבנו על "ריצוף" בתור צורה מסויימת ("אריח") שחוזרת על עצמה שוב ושוב באופן שבו המישור מכוסה על ידיה; אבל אפשר לדבר על ריצוף גם עם מספר גדול יותר של אריחים. עדיין, האינטואיציה הראשונית היא לחשוב שכל ריצוף, גם עם מספר גדול של אריחים, חייב להיות בעל מחזוריות כלשהי (ולכן בעל סימטריה להזזות). אלא שכבר בשנות השישים הוכיחו שזה לא כך.

זה מתקשר לבעיה מעניינת בתורת החישוביות שהזכרתי בבלוג בעבר – בעיית הריצוף של וואנג. וואנג שקד ומצא אלגוריתם שבהינתן קבוצת אריחים קובע האם אפשר לרצף את המישור בעזרתה או לא. לרוע המזל, האלגוריתם שלו התבסס על ההנחה לפיה ריצוף חייב להיות מחזורי (כלומר, האלגוריתם שלו למעשה עונה על השאלה "האם קבוצת האריחים הזו מסוגלת לרצף את המישור באופן מחזורי?"). זמן מה לאחר מכן הצליח מתמטיקאי בשם רוברט ברגר להראות שבעזרת אריחי וואנג אפשר לבצע סימולציה של חישובים כלליים (לבקיאים בטרמינולוגיה: הוא סימלץ מכונת טיורינג), באופן כזה שתשובה לשאלה "האם קבוצת האריחים הזו והזו מרצפת את המישור?" זהה לתשובה לשאלה "האם תוכנית המחשב הזו והזו עוצרת?" והשאלה השניה היא בלתי כריעה מבחינה חישובית; אין דרך חישובית להכריע עבור כל תוכנית מחשב האם היא עוצרת או לא; כל שיטה שתציעו בהכרח תיכשל על חלק מהקלטים ("תיכשל" אין פירושו בהכרח "תענה לא נכון"; ייתכן שהשיטה פשוט לא תחזיר תשובה).

מה שמובלע בהוכחה של ברגר היא העובדה שקבוצות האריחים שהוא בונה חייבות לרצף את המישור באופן לא מחזורי (כי עבור ריצוף מחזורי האלגוריתם של וואנג עובד). לרוע המזל, קבוצת האריחים שלו הייתה ענקית – 20,000 אריחים נדרשו כדי לממש אפילו תוכניות מחשב פשוטות. זמן מה אחריו רפאל רובינסון הציג הוכחה משופרת שבה היו רק בערך 100 אריחים שמרצפים את המישור באופן לא מחזורי, אבל גם 100 זה המון. מי שחיסל את הבעיה באופן מוחלט היה המתמטיקאי והפיזיקאי רוג'ר פנרוז, שמצא קבוצה של שני אריחים, שכל ריצוף של המישור על ידם אינו יכול להיות מחזורי. האריחים הללו מכונים אריחי פנרוז על שמו (למען האמת, פנרוז גילה כמה קבוצות שכאלו אבל נעזוב את זה). למען ההגינות יש לציין שברגר ורובינסון התעסקו עם אריחי וואנג, שהם מוגבלים יותר באופיים מאשר אריחי פנרוז.

הנה תמונה של אריחי פנרוז:


והנה (חלק מ-) ריצוף על ידי האריחים הללו:


בתמונה הזו אפשר לראות די בבירור סימטריה מחומשת סביב המרכז; באופן מעניין למדי, זו הסימטריה המחומשת היחידה (לא קשה להוכיח שאכן יכולה להיות רק אחת כזו), אם כי כשמסתכלים רק על איזורים קטנים של הריצוף יש בהם סימטריה סיבובית "מקומית".

אם כן, מבחינה מתמטית ריצוף בעל סימטריה מחומשת הוא דבר לגיטימי בהחלט; הדבר היחיד שמתחייב הוא שלריצוף כזה לא תהיה סימטריה להזזות. כך גם עבור הגביש של שכטמן: הוא פשוט לא יכול להיות מחזורי. זה מפר את ההנחה הבסיסית ביותר של הקריסטלוגרפיה, ולכן מעביר את הויכוח מתחום המתמטיקה לתחום הקריסטלוגרפיה עצמה: האם שכטמן אכן גילה סוג חדש של גביש ("כמו-מחזורי") שמפר את הנחות היסוד של התחום (בדומה לגילוי חלקיק שנע מהר ממהירות האור), או שהוא פשוט לא יודע לבצע ניסויים? עם הענקת פרס הנובל לשכטמן, אני מקווה שהתשובה כעת ברורה גם לפקפקנים האחרונים.

עכשיו בחנויות – "גדל, אשר, באך" בעברית!

אני רוצה להקדיש את הפוסט הזה לפרסומת זולה לספר שיצא זה עתה – תרגום עברי ל"גדל, אשר, באך" של דגלאס הופשטטר. על המלאכה הבלתי אפשרית של התרגום חתומים טל כהן וירדן ניר-בוכבינדר. יש לי היכרות כלשהי עם שניהם כך שאתם מוזמנים לראות את חוות הדעת שלי של "רוצו לקנות!!!!!" כסובייקטיבית ומשוחדת לחלוטין, אבל בכל מקרה אני רוצה לדבר קצת על מה העניין בספר הזה.

בבסיסו, זה ספר מדע פופולרי, אבל כזה שכתוב כל כך טוב שהוא מהווה קטגוריה בפני עצמו בספרי המדע הפופולרי. מאז שיצא לאור ב-1979 הוא הפך כמעט לספר קאלט, בקהילות המתאימות. לא בגלל שיש בו תובנות עמוקות ומפתיעות על מהות היקום (למרות שיש בו כמה רעיונות מעניינים מאוד) אלא פשוט כי הדרך שבה הוא בוחר להעביר את אותם רעיונות הופכת את קריאת הספר לתענוג בלתי רגיל.

על מה הספר? הופשטטר, בהקדמה לגרסה של מהדורת 1999 לספר, לעג לתיאור מגוחך לגמרי של הספר שהופיע בניו-יורק טיימס כשהספר הופיע ברשימת רבי המכר בו:

A scientist argues that reality is a system of interconnected braids.

הוא לועג גם לתיאור הרבה יותר נפוץ של הספר, שאומר שהוא

A book that shows how math, art and music are really all the same thing at their core.

אף שהתיאור השני אכן עשוי להישמע על פניו כאילו הוא מתאר את מה שהולך בספר; אבל זו לא הפואנטה. הפואנטה, על פי הופשטטר, היא נסיון להבין כיצד נוצרת התודעה. מהו אותו "קסם" שהופך ערב-רב של ניורונים בודדים שבסך הכל מגיבים לגירויים חשמליים, ל"אני" – ומכאן, האם זה יכול לקרות גם בהקשרים אחרים. לב העניין, על פי הופשטטר, טמון ברעיון ההפניה העצמית. אותה הפניה עצמית עומדת בלב משפטי אי השלמות של גדל, שהיוו את ההשראה הראשונית לכתיבת הספר, וחלק לא מבוטל מהספר מוקדש להסבר (מוצלח! אולי ההסבר המפורט הטוב היחיד שראיתי למשפט בספר שאינו ספר מתמטיקה) של מה קורה בהם.

עם זאת, אפילו עם ההסבר של הופשטטר למטרת הספר אני לא בטוח שאני (ועוד אחרים) מסכים. זה פשוט ספר גדול ומקיף מכדי שאפשר יהיה לתמצת אותו לנושא מרכזי אחד, וכל פרק בו עוסק במשהו אחר. למרות שזה יומרני למדי ולא נראה לי שמישהו אחר טען כך, אני חושב שאפשר לתאר את הספר בתור מבוא (לחלוטין לא פורמלי) לפילוסופיה של מדעי המחשב.

כך למשל, תחילת הספר עוסקת בהרחבה במערכות פורמליות בלוגיקה ובהבדל העמוק שבין הסינטקטיקה של פסוקים במערכות כאלו, והסמנטיקה שלהם (הסינטקטיקה – תחביר – עונה לנו על השאלה "איזה צירוף אותיות יוצר פסוק חוקי? איך בונים פסוק חדש מתוך פסוקים קיימים?" וכדומה; הסמנטיקה – עונה לנו על השאלה "מה המשמעות של הפסוק הזה? האם הפסוק הזה הוא אמיתי או שקרי?" – שימו לב להבדל שבין "חוקי" ובין "אמיתי" או "שקרי"). פרק אחר עוסק ברקורסיה ומופעיה הרבים והשונים בעולם בכלל ובמדעי המחשב בפרט, וכן הלאה וכן הלאה.

פרט לפרקי הספר, שכתובים היטב אבל בסופו של דבר אינם שונים מהותית ממה שתמצאו בספרי מדע פופולרי אחרים (או, להבדיל, בבלוג הזה), כל פרק מלווה גם בדיאלוגים בין דמויות דמיוניות הזויות של הופשטטר, בכיכובם של אכילס והצב (שמקורם בפרדוקסים של זנון, ואת ההשראה לשימוש בהם נטל הופשטטר מדיאלוג דומה שכתב לואיס קארול). מטרת הדיאלוגים הללו היא להמחיש באופן קליל יחסית את הנושאים שעליהם מדבר הספר, והם עמוסים ביותר במשחקי מילים ומשחקים צורניים שונים ומשונים. לתת דוגמאות זה כמעט בחזקת ספוילר, אז אמנע מכך למרות שזה מתבקש.

איך אשר ובאך קשורים לעניין? איני חושב שהם מהותיים במיוחד לתזה של הופשטטר ואפשר היה לכתוב את הספר גם בלעדיהם, אבל הופשטטר משתמש בהם על מנת להמחיש רבות מהנקודות שבספר. הציורים המרהיבים של אשר עמוסים בהמחשות ויזואליות לרעיונות המתמטיים שעליהם הופשטטר מדבר, וכך גם התעלולים המוזיקליים של באך. לאשר ובאך גם השפעה אדירה על הדיאלוגים – המבנה הצורני של הדיאלוגים מחקה לרוב את זה של יצירה כלשהי של באך, ולעתים קרובות יש בהם דיון על ציור רלוונטי כלשהו של אשר (או בסיטואציות יותר מופרעות, הציור עצמו הופך להיות חלק משדה ההתרחשות העלילתי).

בקיצור, הספר מומלץ ביותר. רק שאני קראתי אותו באנגלית, ואני ממליץ לכולם לקרוא אותו באנגלית. אז מה הקשר לתרגום?

מחשבה שקרוב לודאי שחולפת בראש של כל מי שקורא את הספר היא "אי אפשר לתרגם את זה". הספר כל כך גדוש במשחקי מילים מחוכמים שנגזר דינם להיכחד במעבר לכל שפה שאיננה אנגלית, שלא נראה שאפשר לתרגם אותו מבלי לאבד את כל הקסם שלו. כמובן, זה לא עצר את המתרגמים והספר תורגם כבר לשפות רבות, בעידודו הנלהב של הופשטטר עצמו. מכיוון שאין דרך לתרגם באופן ישיר את מה שהולך בספר, התרגום מצריך מהמתרגמים להמציא גרסאות משל עצמם למשחקים שיתאימו לרוח הספר. במילים אחרות, זה יותר דומה לתרגום שירה מאשר תרגום פרוזה. זה הופך את התרגום עצמו למעניין באופן מנותק מהמקור; לי אין ספק שכאשר אקרא את הספר שוב, אקרא הפעם את הגרסה בעברית לצורך גיוון. עם זאת, כפי שניתן להבין, טרם קראתי אותה בעצמי ולכן איני יכול לחוות דעה על איכות התרגום.

אם כן, מה אני ממליץ לכם לעשות? לרוץ לקנות את הספר. אם תשאלו אותי אם בעברית או באנגלית, אגיד ששניהם. אם תתעקשו, אגיד שאלא אם קל לכם משמעותית לקרוא ספרים בעברית, עדיף באנגלית. אבל רק כי זו שפת המקור ואני תומך נלהב של קריאת ספרים בשפת המקור למי שיכול לעשות זאת. אני חושב שחשוב וכדאי שהתרגום יהיה הצלחה אדירה בארץ. זו תהיה עדות כלשהי לכך שהישראלים אוהבים מדע וחשוב להם שיהיו ספרי מדע פופולרי איכותיים בעברית. אבל גם אם כל זה לא מעניין אתכם, אני חוזר שוב על ההמלצה שלי – זה ספר ממש טוב, תקראו.