הגופים האפלטוניים, נוסחת אוילר לפאונים, וכדורגל

כשאומרים "נוסחת אוילר", לרוב מתכוונים לנוסחה \(e^{\pi i}+1=0\), או לניסוח הכללי שלה, \(e^{i\theta}=\cos\theta+i\sin\theta\). לעתים רחוקות יותר מדברים על הנוסחה \(V-E+F=2\), וקצת חבל, כי זוהי נוסחה יפה כמעט באותה מידה – נוסחה שמצביעה על גישה שונה שנקט אוילר ביחס לבעיות שעסקו בהן כבר היוונים הקדמונים, ומצביעה על תובנה שחמקה מעיני המתמטיקה במשך אלפיים שנים לערך – ונוסחה שממחישה איך אוילר היה אבי הטופולוגיה. אז מהי הנוסחה ומה היא אומרת? ניסוח נפוץ בימינו של הנוסחה עוסק בגרפים מישוריים, אך במקור אוילר דיבר על פאונים קמורים, ולכן צריך ראשית כל להציג אותם.

מצולע הוא צורה מישורית שמצויירת בתור קו שבור סגור שאינו חותך את עצמו (אוסף של קווים ישרים המחוברים לזה לזה ואינם חותכים זה את זה). למשל – משולש, ריבוע, מחומש וכן הלאה (השם מעיד על מספר הצלעות של המצולע). הרעיון ניתן להכללה באופן פשוט לשלושה ממדים: פאון הוא אוסף של מצולעים שמודבקים זה על זה באופן מסויים. ההגדרה של "מסויים" באופן מדוייק היא בעייתית למדי כאן ואסתפק באינטואיציה שמתארת את היצורים שמעניינים אותי בפוסט הזה, פאונים קמורים: המטרה היא ליצור גוף דמוי קוביה, במובן זה שכל פאה מוקפת מכל צדדיה בפאות אחרות ואין "חורים" במעטפת של הפאון; והקמירות באה לידי ביטוי בכך שהקו הישר בין כל שתי נקודות על המעטפת עובר כולו "בתוך" הפאון. ההמחשה הטובה ביותר היא, כמובן, תמונה.

דודקהדרון (דוגמה לפאון קמור)

פאונים נחקרו על ידי היוונים הקדמונים, שהמתמטיקה שלהם הייתה בראש ובראשונה גאומטריה. מבין כל הפאונים, עניין מיוחד היה שמור אצלם לפאונים שזכו לכינוי "משוכללים". ראשית, מצולע משוכלל הוא מצולע שבו כל הצלעות מאותו הגודל, וכל הזוויות מאותו גודל. כך למשל ריבוע הוא מצולע משוכלל, אך מעוין (שבו כל הצלעות מאותו גודל אך הזווית לא) איננו, ומלבן (שבו כל הזוויות הן מאותו גודל אך לא הצלעות) איננו. לא קשה להראות שלכל \(n\ge3\) יש בדיוק מצולע משוכלל אחד בעל \(n\) צלעות.

פאון משוכלל הוא הרחבה של הרעיון באופן טבעי. אפשר לסכם את רשימת הדרישות ממנו כך:

  1. הוא מהווה פאון קמור (הקמירות חשובה כאן – אם מוותרים עליה, כל מה שנגיד בהמשך לא בדיוק נכון. עם זאת, מכאן ואילך לא אתייחס אליה במפורש).
  2. כל פאה שלו היא מצולע משוכלל, וכל הפאות שלו הן אותו מצולע משוכלל (אותו גודל, אותו מספר צלעות).
  3. כל קודקוד של המצולע נמצא על אותו מספר פאות (קודקוד הוא "שפיץ" – מקום שבו שלוש או יותר פאות נפגשות).

במובן מסויים אלו הן הצורות התלת-ממדיות הסימטריות ביותר האפשריות. מייד נשאלת השאלה – מי הן, ואיך הן נראות?

ובכן, יש את הקוביה שכולנו מכירים. יש את הטטרהדרון – פירמידה בעלת בסיס משולש (אם הבסיס היה מרובע, הצורה לא הייתה פאון משוכלל, שכן הבסיס היה פאה השונה מהותית משאר הפאות, שהן משולשים). הצורות האחרות אולי מוכרות פחות: האוקטהדרון נראה כמו שתי פירמידות מרובעות שהרכיבו זו על זו – שמונה פאות שהן משולשים. הדודקהדרון הוא בעל 12 פאות שכל אחת מהן היא מחומש; והאיקוסהדרון מורכב מ-20 פאות שכולן משולשים. שחקני מבוכים ודרקונים ומשחקי תפקידים דומים ככל הנראה מכירים היטב את כל הפאונים הללו, שכן משתמשים בהם כקוביות משחק, בנוסף לפאון בעל 10 פאות שאיננו משוכלל (כל פאה שלו היא דלתון, שאיננו מצולע משוכלל).

חמשת הגופים האפלטוניים

והאם יש עוד פאונים משוכללים? ובכן, לא. מי שהוכיח זאת לראשונה היה היווני תאיטיטוס, שהיה אחד מתלמידיו של אפלטון. הוא לא גילה את הפאונים הקיימים לראשונה (חלקם היו מוכרים כבר בתרבויות מוקדמות בהרבה) אך הוא ככל הנראה הראשון שחקר אותם באופן שיטתי – וכאמור, הוכיח שאין עוד. אפלטון עצמו התלהב עד מאוד מהפאונים המשוכללים וביסס עליהם את התיאוריה שלו לגבי מבנה החומר – לכל אחד מהיסודות (מים, אוויר, אש, אדמה) הוא התאים את אחד מהפאונים (הדודקהדרון נותר בחוץ, ויותר מאוחר יוחס ליסוד החמישי – האתר). בשל כך הפאונים המשוכללים זכו גם לשם נוסף – הגופים האפלטוניים (Platonic Solids).

ההוכחה של תאיטיטוס מתבססת על טיעון לא מסובך במיוחד הנוגע לזווית, אך אני רוצה להימנע ממנו לחלוטין ולעסוק במקום זאת בדרך שונה לתקוף את הבעיה – הדרך של אוילר, שמקפיצה אותנו בערך אלפיים שנה קדימה (בדרך אנחנו פוסחים לחלוטין על קפלר, שהיה ככל הנראה התורם החשוב ביותר מאז היוונים לחקר פאונים באופן כללי, וגם ביסס את אחד מהמודלים המוקדמים שלו של מערכת השמש על הגופים האפלטוניים – אולי בפעם אחרת).

התגלית של אוילר תוארה במכתב שלו לידידו גולדבך (מהשערת גולדבך – שגם היא תוצאה של התכתבות של אוילר עם גולדבך, ולמעשה לניסוח הסופי של ההשערה אחראי אוילר, שחיזק השערה פשוטה יותר של גולדבך) שעסק באופן כללי בפאונים ובתכונותיהם. אוילר ניסה לסווג פאונים ולחפש תכונות משותפות שפאונים מקיימים, וההברקה שלו הייתה הרעיון לספור לא רק את הפאות של הפאון, אלא גם את הקודקודים שלו, וגם את הצלעות שלו. צלע היא נקודת המפגש בין שתי פאות; עד לאוילר לא חשבו עליה כיצור בעל חיים עצמאיים.

הגישה של אוילר היא די טבעית במובן מסויים: פאון הוא גוף תלת ממדי, שבנוי מגופים דו ממדיים (המצולעים שמהווים פאות). נקודת המפגש בין כל שני גופים דו ממדיים שכאלו היא יצור חד-ממדי (הצלעות) והמפגש בין כל שני יצורים חד-ממדיים הוא יצור אפס-ממדי (קודקוד). הרעיון של אוילר היה לא להתעלם מאף מימד, והתוצאה הייתה רווחית ביותר. אם נסמן את מספר הקודקודים של הפאון ב-\(V\), את מספר הצלעות ב-\(E\) ואת מספר הפאות ב-\(F\), אז מה שאוילר שם לב אליו הוא שמתקיים, לכל פאון שהוא בדק, ש-\(V-E+F=2\). בויכוח על האם המתמטיקה מתגלית או מומצאת, זו דוגמה נאה במיוחד לקשר שבין שני המושגים: אין ספק שהנוסחה הזו התגלתה על ידי אוילר, ואפילו באמצעות חקירה אמפירית; אבל הרעיון לספור בנפרד את הפאות, הצלעות והקודקודים הוא ללא ספק המצאה של אוילר. מרגע שהומצאה הטרמינולוגיה הנכונה והיה ברור "איפה צריך להסתכל", נחשף לאוויר העולם הקשר שהיה קיים תמיד והיה צריך לגלות.

אוילר לא הצליח להוכיח את הנוסחה באותו מכתב לגולדבך – נדרש לו עוד זמן מה עד שהגיע להוכחה, וגם בה היו כמה בעיות (באופן כללי בזמנו של אוילר עוד לא הייתה הקפדה על הוכחות כשם שיש כיום במתמטיקה). מאז ניתנו לנוסחה עוד הוכחות רבות, ואיני רוצה להציג כרגע אף אחת מהן. תחת זאת אני רוצה להראות כיצד הנוסחה מוכיחה חיש קל כי ישנם רק חמישה גופים אפלטוניים. למעשה, כפי שנראה, הנוסחה לא לוקחת אותנו לאורך כל הדרך וצריך לבצע עוד טיעון גאומטרי אחד או שניים, אבל את הרעיון המרכזי הנוסחה אוכלת בלי מלח.

עלינו לשאול את עצמו מה מאפיין גוף אפלטוני. ברור שמאפיין אחד הוא סוג המצולע שמשמש בתור פאה – זה חייב להיות מצולע משוכלל, אבל אנחנו יכולים לשחק עם מספר הצלעות שלו, שנסמן \(n\). עבור הטטרהדרון \(n=3\); עבור הקוביה \(n=4\); עבור הדודקהדרון, \(n=5\); אבל עבור האוקטהדרון והאיקוסהדרון גם כן מתקיים \(n=3\), כך שברור שזהות המצולע עצמו לא קובעת באופן יחיד את הגוף האפלטוני. צריך קריטריון נוסף.

הקריטריון הנוסף הוא מספר הפאות שנפגשות בכל קודקוד. בטטרהדרון בכל קודקוד נפגשות שלוש פאות; באוקטהדרון נפגשות ארבע; ובאיקוסהדרון נפגשות חמש. נסמן את המספר הזה בתור \(k\). תצטרכו להאמין לי שהזוג \(\left(n,k\right)\) קובע באופן מוחלט איך הפאון המשוכלל אמור להיראות – כלומר, שכל שני פאונים משוכללים שהפאה שלהם היא מצולע משוכלל בעל \(n\) צלעות ושבכל קודקוד שלהם נפגשות \(k\) פאות הם למעשה אותו פאון בדיוק. אם אתם מאמינים לכך, כל מה שנותר לעשות הוא לבדוק אילו זוגות \(\left(n,k\right)\) בכלל יכולים להתקבל במציאות.

וכאן נכנסת נוסחת אוילר לתמונה, יחד עם מספר טיעונים קומבינטוריים פשוטים. הבה ונקבע זוג \(\left(n,k\right)\) וננסה להבין מה נובע מכך על \(V,E,F\). ראשית, כל פאה תורמת \(n\) צלעות לקבוצת הצלעות של הפאון, אך צריך לשים לב לכך שכל צלע נספרת פעמיים שכן כל צלע נמצאת על שתי פאות שונות (צלע, כזכור, היא איזור מפגש בין שתי פאות). לכן מתקיים הקשר \(E=\frac{nF}{2}\). כמו כן, כל פאה תורמת \(n\) קודקודים לקבוצת הקודקודים של הפאון (זכרו – מספר הצלעות והקודקודים של מצולע הוא זהה – למה?), אבל כל קודקוד נספר \(k\) פעמים באופן הזה. לכן מתקיים הקשר \(V=\frac{nF}{k}\). אם נציב את הערכים הללו בנוסחת אוילר נקבל \(\frac{nF}{k}-\frac{nF}{2}+F=2\), כלומר \(F\left(\frac{n}{k}-\frac{n}{2}+1\right)=2\), כלומר \(F\left(\frac{2n-kn+2k}{2k}\right)=2\), כלומר \(F=\frac{4k}{2n-kn+2k}\).

עכשיו, \(F\) הוא מספר טבעי, שערכו לפחות 3 (כי בפאון לא יכולות להיות רק שתי פאות – כדי שהוא יהיה סגור יהיה הכרחי "לעקם" את הפאות לשם כך). לכן הצטמצמנו לשאלה עבור אילו ערכים טבעיים של \(n,k\), המספר \(\frac{4k}{2n-kn+2k}\) הוא מספר שלם גדול מ-3. זו דוגמה קלאסית למשוואה דיופנטית, אך לא משוואה קשה במיוחד, אף שהיא עשויה להיראות מעט מפחיד בהתחלה. האינטואיציה היא ש-\(kn\) גדל מהר מאוד ביחס לשני האיברים האחרים במכנה, שאפשר לכתוב בקיצור \(2\left(n+k\right)\); ואם \(-kn\) שבמכנה גדול מדי, נקבל מספר שלילי והמשחק נגמר. יותר מכך, אנחנו יודעים שמתקיים \(n,k\ge3\) בגלל המשמעות הגאומטרית שלהם – \(k\) הוא מספר הפאות שנפגשות בכל קודקוד, ובכל קודקוד חייבות להיפגש לפחות שלוש פאות (למה? שוב, שיקולים גאומטריים), ו-\(n\) הוא מספר הצלעות של כל פאה, ולמצולע חייבות להיות לפחות שלוש צלעות (למה? שוב, שיקולים גאומטריים). לכן חיפוש ממצה על מרחב כל הפתרונות הסבירים יהיה עניין קצר מאוד.

נתחיל מבדיקת כל הערכים האפשריים של \(n\) אם \(k=3\): במקרה זה נקבל \(F=\frac{12}{2n-3n+6}=\frac{12}{6-n}\). ברור מהמשוואה הזו שהערכים הלגיטימיים היחידים של \(n\) הם \(3,4,5\); (\(2\) לא לגיטימי כי \(n\ge3\)). אם \(k=4\) נקבל \(F=\frac{16}{8-2n}\) ולכן הערך הלגיטימי היחיד של \(n\) הוא \(3\); ואם \(k=5\) נקבל \(F=\frac{20}{10-3n}\) וגם כאן \(n\) יכול להיות רק 3; ואילו עבור \(k=6\) נקבל כבר \(F=\frac{24}{12-4n}\) ועבור \(n\ge3\) נקבל מספר לא חיובי במכנה, וכך יקרה גם לכל ערך גדול יותר של \(k\). סוף המשחק.

לסיכום, קיבלנו שהזוגות האפשריים היחידים הם \(\left(3,3\right),\left(4,3\right),\left(5,3\right),\left(3,4\right),\left(3,5\right)\), והם מגדירים בדיוק את הגופים האפלטוניים – זה משחק פשוט וחביב לבדוק איזה זוג מגדיר כל גוף ומה \(F\) עבורו.

מה שיפה בהוכחה הזו היא שהיא הייתה מאוד לא גאומטרית באופיה; השתמשנו בכמה שיקולים גאומטריים בלתי נמנעים (למשל, אלו שהובילו לכך ש-\(n,k\ge3\)), אבל הגאומטריה שלנו הייתה מאוד "גמישה" – לא התייחסנו לזוויות שהפאות יוצרות זו עם זו או לגודל של כל פאה – רק לקשרים ביניהן – אילו פאות "קרובות" לאילו פאות אחרות, כמה פאות נפגשות בכל נקודת מפגש, וכדומה. קשה לקרוא לדבר הזה גאומטריה (זוויות ומרחקים הם מרכיבים קריטיים בכל הגאומטריות) ואכן, התוצאה הזו של אוילר נחשבת לאחת מאבני הדרך הראשונות בהולדתה של הטופולוגיה (תוצאה נוספת של אוילר, על מסלולים אוילריים בגרף, גם היא נחשבת למבשרת של הטופולוגיה – ראוי לציין כי אוילר לא המציא את מושג הגרף ולא ניסח את הפתרון שלו לבעיה באמצעות גרפים אלא באופן "טופולוגי" יותר).

הצגתי את הנוסחה עבור פאונים, אבל קרוב לודאי שלפחות חלק מהקוראים שכבר שמעו עליה, שמעו עליה דווקא בהקשר של גרפים מישוריים (וגם אני הזכרתי אותה פעם בהקשר זה, כשדיברתי על קריטריון להכרעה אילו גרפים הם מישוריים). הקשר בין השניים הוא מיידי – אפשר לקחת כל פאון, לנקב חור באחת מהפאות, "לקרוע" את הפוליגון ולשטח אותו על הרצפה, והתוצאה שתתקבל תהיה גרף מישורי (כשהפאה שנוקבה היא הפאה "האינסופית" שמקיפה את הגרף). דרך קצת פחות ברברית לעשות זאת היא לקבוע נקודה על הפאון שתשמש בתור "קוטב", ולהעביר קרניים מהקוטב אל הרצפה. באופן הזה כל נקודה על הרצפה מותאמת באופן יחיד לנקודה על הפאון – הנקודה שבה הקרן חתכה את הפאון (רק לקוטב אין נקודה מתאימה). לדבר שכזה קוראים "הטלה סטריאוגרפית". גם התהליך ההפוך אפשרי – מגרף מישורי לפאון – ולכן אין הבדל מהותי בין הנוסחה עבור פאונים והנוסחה עבור גרפים מישוריים.

למעשה, אפשר לחשוב על נוסחת אוילר בתור מקרה פרטי של מאפיין כללי של משטחים. אפשר לשאול את עצמנו באופן כללי מהו \(V-E+F\) עבור משטח (שיש בו מושג של קודקודים, צלעות ופאות…), גם כזה שאיננו של פאון קמור. התוצאה שנקבל לא תהיה בהכרח 2, אבל היא תהיה זהה לכל זוג משטחים שהם הומיאומורפיים – כלומר, שקולים מבחינה טופולוגית (להגדרה המדוייקת לא אכנס כעת). כלומר, קיבלנו אינוריאנטה של משטחים – וזה אחד מהדברים המרכזיים שהעוסקים בטופולוגיה מחפשים, שכן אינוריאנטות שכאלו עוזרות לסווג מרחבים טופולוגיים. בעיה קשה ומרכזית בטופולוגיה היא הבעיה הבאה: בהינתן שני מרחבים טופולוגיים, יש לקבוע האם הם אינם הומיאומורפיים. אין לבעיה פתרונות פשוטים, ושיטת הפתרון הנפוצה היא לחפש אינוריאנטה שיש לאחד מהמרחבים ולשני אין. לאינוריאנטה שעולה ממשפט אוילר קוראים מאפיין אוילר.

לסיום, תרגיל חביב שדומה באופיו להוכחה שראינו קודם לכך שיש רק חמישה גופים אפלוטניים – כדורגל. כדורגל "סטנדרטי" הוא פאון קמור שפאותיו הן מחומשים ומשושים (כל זוג מחומשים זהה זה לזה, וכך גם כל זוג משושים). קריטריון אחד בבניה של הכדורגל הוא שבכל קודקוד נפגשים בדיוק שני משושים ומחומש אחד. מהנתונים הללו ניתן להסיק במדוייק את מספר המחומשים והמשושים מהם מורכב הכדורגל – מהו? (ואתגר נוסף – נסתכל על פאון קמור כלשהו שמורכב ממחומשים וממשושים – הראו שמספר המחומשים בו קבוע, בלי תלות במספר המשושים). בהצלחה!

כדורגל והפאון הקמור המתאים לו

עוד כמה דברים על מספרים p-אדיים

בפוסטים הקודמים הצגתי שתי דרכים, כל אחת טבעית בדרכה שלה, להגיע אל אובייקט מוזר בשם "שדה המספרים ה-p-אדיים" (לכל ראשוני \(p\) יש שדה משלו). כעת אני רוצה לתאר כמה תכונות של היצור הזה כדי להיווכח שהוא אכן מוזר, וגם מעניין למדי.

נתחיל מהנורמה ה-p-אדית. כזכור, הגדרנו אותה על מספרים טבעיים באופן הבא: \(\|a\|_{p}=\frac{1}{p^{\mbox{ord}_{p}\left(a\right)}}\) כאשר \(\mbox{ord}_{p}\left(a\right)\) הוגדר להיות החזקה הגבוהה ביותר של \(p\) שמחלקת את \(a\) (למשל \(\mbox{ord}_{3}\left(54\right)=3\) כי \(3^{3}\) מחלק את 54 אבל לא \(3^{4}\)). ההרחבה שלה למספרים רציונליים (ואחר כך לגבולות של סדרות של מספרים רציונליים) מתבצעת באופן "טבעי" כדי לשמור על התכונות הרצויות של נורמה (כפליות ורציפות). כזכור, אחת הדרישות שלנו מנורמה הייתה קיום סוג של אי שוויון המשולש: \(\|a+b\|_{p}\le\|a\|_{p}+\|b\|_{p}\). מסתבר שהנורמה ה-p-אדית מקיימת תכונה זו בצורה חזקה למדי. החשבון די פשוט: אם \(p^{n}\) מחלק את \(a\) ו-\(p^{m}\) מחלק את \(b\), ונניח ש-\(n<m\), אז \(p^{n}\) מחלק את \(a+b\), ולכן \(\|a+b\|_{p}\le\frac{1}{p^{n}}\) (ייתכן שאת \(a+b\) מחלקת חזקה גדולה יותר של \(p\), אבל אז הנורמה תהיה קטנה יותר מ-\(\frac{1}{p^{n}}\)). באופן כללי ניתן לתאר את האבחנה הזו כך: \(\|a+b\|_{p}\le\max\left\{ \|a\|_{p},\|b\|_{p}\right\} \). כלומר, הנורמה של סכום אינה יכולה להיות גדולה יותר מכל אחת מהנורמות של המחוברים (הסבירו לעצמכם מדוע תכונה זו גוררת מייד את אי שוויון המשולש "הרגיל"). לנורמות שמקיימות תכונה זו קוראים "נורמות לא ארכימדיות". זה תרגיל לא קשה במיוחד להראות גם כשמרחיבים את הנורמה על כל הרציונליים התכונה הזו נשמרת.

כזכור, השתמשנו בנורמות כדי להגדיר מטריקות – פונקציות מרחק, באופן הבא: \(d\left(a,b\right)=\|a-b\|\). בלשון מטריקות, תכונת הלא-ארכימדיות מתורגמת באופן הבא: לכל \(x,y\) ו"נקודת ביניים" \(z\) מתקיים \(d\left(x,y\right)\le\max\left\{ d\left(x,z\right),d\left(z,y\right)\right\} \). במילים אחרות – אם פעם כל מה שאמרנו הוא שהדרך הישירה מ-\(x\) אל \(y\) היא יותר קצרה מכל טיול שעובר בנקודת ביניים \(z\), עכשיו אנחנו אומרים שהיא יותר קצרה אפילו מ"חצי טיול" שכזה! (כמובן שזה לא תיאור מדויק של מה שהולך שם). ההשלכה הראשונה של התכונה הזו היא שכל משולש בעולם שלנו הוא שווה שוקיים: נניח ש-\(a,b,c\) הן שלוש נקודות במרחב. אם \(d\left(a,b\right)=d\left(a,c\right)\) אז המשולש שהן קודקודיו הוא שווה שוקיים על פי הגדרה; לכן נניח ש-\(d\left(a,b\right)\ne d\left(a,c\right)\) ובפרט, בלי הגבלת הכלליות, אפשר להניח ש-\(d\left(a,b\right)>d\left(a,c\right)\) כעת, מהי \(d\left(b,c\right)\)? אנו יודעים כי \(d\left(b,c\right)\le\max\left\{ d\left(a,b\right),d\left(a,c\right)\right\} =d\left(a,b\right)\). מצד שני, \(d\left(a,b\right)\le\max\left\{ d\left(a,c\right),d\left(b,c\right)\right\} \), ומכיוון שידוע לנו שלא מתקיים \(d\left(a,b\right)\le d\left(a,c\right)\) אז בהכרח \(d\left(a,b\right)\le d\left(b,c\right)\). קיבלנו שכל אחד מהמספרים הללו קטן או שווה מהשני ולכן \(d\left(a,b\right)=d\left(b,c\right)\) – משולש שווה שוקיים.

בואו נעבור לתופעה משעשעת נוספת: ניקח נקודה \(a\) ומרחק \(r\in\mathbb{R}\) כלשהו, ונתבונן בקבוצה \(B\left(a,r\right)=\left\{ x|d\left(a,b\right)<r\right\} \) – לקבוצה הזו קוראים "הכדור הפתוח ברדיוס \(r\) סביב \(a\)" כעת בואו ניקח נקודה \(x\in B\left(a,r\right)\) כלשהי ונתבונן בכדור הפתוח ברדיוס \(r\) סביבה. את מה הוא מכיל? אם \(x\in B\left(a,r\right)\) אז \(d\left(a,x\right)<r\). מצד שני, \(d\left(b,x\right)\le\max\left\{ d\left(a,x\right),d\left(a,b\right)\right\} <r\) (כי שני האיברים שעליהם נלקח המקסימום קטנים מ-\(r\)) ולכן \(x\in B\left(b,r\right)\), כלומר \(B\left(a,r\right)\subseteq B\left(b,r\right)\). מאותו שיקול בדיוק \(B\left(b,r\right)\subseteq B\left(a,r\right)\), ולכן \(B\left(a,r\right)=B\left(b,r\right)\). מסקנה: לכל כדור פתוח מתקיימת התכונה שכל נקודה בתוכו יכולה לשמש בתור ה"מרכז" שלו!

הנה עוד תכונה מפתיעה של ה-p-אדיים שנוגעת לאנליזה בהם. תזכורת מהממשיים: הטור \(\sum_{n=1}^{\infty}\frac{1}{n}\) – "הטור ההרמוני" – הוא הדוגמה ה"קלאסית" לטור לא מתכנס (אפשר להראות שהוא גדל בערך באותו קצב כמו \(\ln n\) ככל שמחברים לו איברים). זו דוגמת נגד פשוטה לטענה שטור מתכנס אם האיבר הכללי שלו שואף לאפס – טענה שמייד חושבים עליה כששומעים לראשונה על כך שזהו תנאי הכרחי לכך שטור יתכנס. במחשבה נוספת, זה קריטריון שהוא כמעט טוב מכדי להיות אמיתי; ובמקומו יש המוני מבחני התכנסות שונים ומשונים.

ובכן, במספרים p-אדיים מה שטוב מכדי להיות אמיתי הוא אמיתי. הסיבה לכך היא פשוטה ביותר – שוב, תכונת הלא-ארכימדיות של הנורמה ה-p-אדית. אם אנו לוקחים שני סכומים חלקיים של הטור \(\sum a_{n}\), נאמר \(S_{n}=\sum_{i=1}^{n}a_{i}\) ו-\(S_{m}=\sum_{i=1}^{m}a_{i}\) כש-\(n>m\), אז מקבלים שגודל ההפרש ביניהם מקיים \(\|S_{n}-S_{m}\|_{p}=\|a_{m+1}+\dots+a_{n}\|_{p}\le\max\left\{ \|a_{m+1}\|_{p},\dots,\|a_{n}\|_{p}\right\} \), ומכאן הוכחה שסדרת הסכומים החלקיים היא סדרת קושי היא תרגיל סטנדרטי בחדו"א.

נעבור כעת לתיאור של המספרים ה-p-אדיים שהוא שונה מהתיאורים שנתתי עד כה ונותן ככל הנראה את האינטואיציה הטובה ביותר לגבי האופן שבו הם "נראים" ואיך שחשבון מבוצע בהם. לפני כן, הבה נזכר איך כותבים מספרים ממשיים "רגילים": כשאנו כותבים מספר כמו 123 בבסיס עשרוני, אנו מתכוונים למספר \(1\cdot10^{2}+2\cdot10^{1}+3\cdot10^{0}\). כלומר, יש לנו סכום של חזקות של 10, כשהמקדם של כל חזקה הוא ספרה של המספר שלנו. ספרות שאחרי הנקודה מציינות חזקות שליליות: כך למשל 10.1 הוא המספר \(1\cdot10^{1}+0\cdot10^{0}+1\cdot10^{-1}\). מספר ממשי יכול להיכתב כשיש אינסוף ספרות מימין לנקודה; כך למשל \(0.333\dots\) מייצג את המספר \(3\cdot10^{-1}+3\cdot10^{-2}+\dots\), שניתן גם לכתוב באופן מקוצר בתור \(\sum_{n=1}^{\infty}\frac{3}{10^{n}}\), וחישוב שמשתמש בנוסחת הסכום של טור הנדסי יראה כי זהו אכן המספר \(\frac{1}{3}\) הישן והטוב. בדומה מקבלים גם כי \(0.999\dots\) הוא בעצם 1.

נחזור למספרים p-אדיים. כזכור, ההגדרה ה"אלגברית" שלי עבור שלמים p-אדיים הייתה בתור סדרה \(a_{1},a_{2},\dots\) של מספרים טבעיים כך ש-\(a_{n+1}\equiv a_{n}\left(\mbox{mod }p^{n}\right)\). מבחינה אינטואיטיבית נכון לחשוב על זה בתור "סדרת קירובים" למספר, כמו ש-\(1,1.4,1.41,1.414,\dots\) היא סדרת קירובים לשורש הממשי של 2. ניתן להראות (באופן מעט טכני אבל ממש לא מסובך) שעבור כל שלם p-אדי \(\alpha\) ניתן לבחור סדרה "קנונית" שדומה לסדרת הקירובים של שורש מבחינת גדלי האיברים בה – האיבר \(a_{n}\) יהיה מספר טבעי ששקול ל-\(\alpha\) מודולו \(p^{n}\) בטווח \(0,\dots,p^{n}-1\). אנו רוצים לומר משהו בסגנון "\(a_{n+1}\) הוא כמו \(a_{n}\) רק עם ספרה אחת נוספת"; כדי שזה יעבוד, צריך להציג את המספרים לא בבסיס 10 אלא בבסיס \(p\). כלומר, כותבים \(a_{n}=b_{0}\cdot p^{0}+b_{1}\cdot p^{1}+\dots+b_{n-1}p^{n-1}\) כשכל "ספרה" \(b_{i}\) היא מספר בין \(0\) ל-\(p-1\); ומכיוון ש-\(a_{n+1}\equiv a_{n}\left(\mbox{mod }p^{n}\right)\) נובע חיש קל ש-\(a_{n+1}=b_{0}p^{0}+\dots+b_{n-1}p^{n-1}+b_{n}p^{n}\) כך ש-\(b_{0},\dots,b_{n-1}\) זהים לאלו שהיו ב-\(a_{n}\), ו-\(b_{n}\) היא "הספרה החדשה". כעת אפשר לייצג את \(\alpha\) באופן הבא: \(\alpha=b_{0}p^{0}+b_{1}p^{1}+\dots\), כלומר על ידי סדרת הספרות האינסופית \(b_{0},b_{1},\dots\).

דוגמה פשוטה: המספר "שבע עשרה" יוצג בבסיס \(p\) כאשר \(p=7\) בתור \(23\) (כי הוא שווה ל-\(2\cdot7^{1}+3\cdot7^{0}\)). במקרה הזה הסדרה שלנו היא \(b_{0}=3,b_{1}=2,b_{2}=0,\dots\) וכן הלאה – כל הספרות החל מה-2 הן אפס ולכן לא כותבים אותן במפורש. לכל מספר טבעי זה יקרה – החל ממקום מסויים כל הספרות יהיו אפס ובינתיים לא קרה שום דבר מעניין.

אבל כעת הבה ונגדיר מספר \(\alpha\) באמצעות הסדרה \(a_{n}=1+p+\dots+p^{n}\). קל לבדוק שזוהי אכן סדרה חוקית שמקיימת את התנאי שאנו דורשים, ובמקרה הזה נקבל את סדרת הספרות \(b_{n}=1\) לכל \(n\). כלומר, המספר שלנו נכתב כך: \(\dots111\). במילים אחרות, זהו מספר בעל פיתוח אינסופי לשמאל, במקום לימין. אין כאן בעיה רעיונית שכן הטור \(\sum_{n=0}^{\infty}p^{n}\) שמגדיר את המספר הוא טור מתכנס במספרים p-אדיים (כי \(p^{n}\) הוא קטן יותר על פי הנורמה ה-p-אדית ככל ש-\(n\) גדול יותר; להוכחה פורמלית של התכנסות הטור אפשר להראות שסדרת הסכומים החלקיים היא סדרת קושי).

איך עובד חשבון במספרים p-אדיים? בדיוק כמו חשבון "רגיל" – ספרה ספרה. כך למשל \(\dots111+\dots111=\dots222\). לדוגמה יותר מעניינת הבה נניח ש-\(p=3\) ונתבונן במכפלה \(\dots1112\cdot2\). אם נכפול את שני המספרים בשיטת בית הספר נגלה שהתבנית קבועה – כפול של \(2\) ב-\(2\) נותן \(4\), ומאחר ואנו בבסיס \(p=3\) אז התוצאה היא הספרה \(1\) ועוד יתרה של \(1\) שאותה "מעבירים הלאה" למכפלה הבאה; ומכאן ואילך נקבל \(2\cdot1+1=3\), שמתורגם לספרה 0 ועוד יתרה של 1, ואותה יתרה תביא לכך שגם בהכפלת \(2\) ב-\(1\) הבא בתור נקבל ספרה 0 ויתרה 1, וכו' וכו' עד אינסוף – היתרה "נדחקת לאינסוף" עד שהיא "נעלמת" ואנו מקבלים שתוצאת הכפל היא \(1\) (או יותר מדוייק, \(\dots0001\)). במילים אחרות, \(\dots1112\) הוא ההופכי של \(2\) בחוג השלמים ה-3-אדיים – האיבר המקביל לחצי בשדה המספרים הרציונליים ה"רגילים" (תרגיל למתקדמים: להראות ש-\(\dots1112\) אכן זהה למספר \(\frac{1}{2}\), כשבונים את ה-3-אדיים באמצעות סדרות קושי של מספרים רציונליים – כלומר, שהסדרה הקבועה \(\frac{1}{2},\frac{1}{2},\dots\) והסדרה שמגדירה את \(\dots1112\) מתכנסות לאותו גבול – או במילים אחרות, ההפרש ביניהן שואף לאפס).

עד כה דיברתי על שלמים p-אדיים (וכפי שראינו, מכיוון שגם חצי הוא שלם 3-אדי, המילה "שלם" כאן היא במובן רחב יותר מזה ה"רגיל"). מספרים p-אדיים כלליים ניתנים לתיאור בתור \(p^{n}\varepsilon\) כאשר \(\varepsilon\) הוא שלם p-אדי הפיך, ומכך נובע שההצגה ה"כללית" של מספרים p-אדיים היא בתור ביטוי בבסיס \(p\) שיכול להכיל אינסוף ספרות משמאל לנקודה, אבל רק מספר סופי מימין לה. למשל \(\dots1112.12121\). שימו לב להיפוך – במספרים ממשיים אינסוף הספרות היו מימין לנקודה. שוב, ההבדל נובע מכך שבמספרים ממשיים, הספרות שמימין לנקודה ייצגו מספרים שהגודל שלהם (הנורמה שלהם) הלך וקטן; במספרים p-אדיים הגודל הולך וקטן דווקא כשהולכים שמאלה.

מבלבל? לא אינטואיטיבי? בהחלט. ולכן זה גם מרתק כל כך. הסיבה שדחיתי את הצגת התיאור הזה לשלב הזה של העיסוק ב-p-אדיים (למרות שאפשר להתחיל ממנו) היא שהיה חשוב לי להדגיש שהמספרים הללו, על אופן התיאור הלא אינטואיטיבי והמפתיע הזה שלהם, נובעים בצורה טבעית לחלוטין. הדבר משול להליכה בפארק טבע חדש – יתגלו בו לבטח צמחים משונים ומוזרים, אך לא יהיה ספק בכך שהם תוצר של הטבע ולא מעשה ידי אדם. זהו גם סוג ההרפתקאה שאליה יוצא המתמטיקאי.

מספרים p-אדיים – בניה "אנליטית"

בפוסט הקודם הצגתי דרך "אלגברית" לבניית שדה המספרים ה-p-אדיים. הפעם אני רוצה להציג דרך שונה לחלוטין שמביאה בדיוק לאותה תוצאה, ונתחיל במוטיבציה – בניית המספרים הממשיים מתוך המספרים הרציונליים. יש שתי בניות מפורסמות לממשיים: האחת, של דדקינד, מסתמכת על כך שקיים ברציונליים יחס סדר, כלומר אפשר לדבר על \(a<b\). דדקינד משתמש במושג הסדר כדי ליצור אובייקטים חדשים – "חתכים", כך שכל מספר ממשי מיוצג על ידי קבוצת כל המספרים הרציונליים שקטנים ממנו או שווים לו. זוהי בנייה יפה עם הכללות יפות ואני ממש לא רוצה לדבר עליה הפעם.

הבניה השניה היא של קנטור. קנטור מסתמך על כך שקיים ברציונליים מושג של מרחק. המרחק בין \(a,b\) מוגדר בתור \(d\left(a,b\right)=\left|a-b\right|\), ומרגע שיש לנו פונקצית מרחק שכזו אפשר להגדיר באמצעותה את המושג של סדרת קושי – סדרה שהמרחק בין איבריה הולך וקטן לאפס, ובניסוח מתמטי פורמלי, לכל \(\varepsilon>0\) קיים מקום בסדרה, \(N\), כך שלכל \(n,m>N\) מתקיים \(d\left(a_{n},a_{m}\right)<\varepsilon\). האינטואיציה שמאחורי ההגדרה היא שכל סדרה מתכנסת (שאבריה מתקרבים עוד ועוד עד לנקודה אחת מובחנת, ה"גבול" של הסדרה) מהווה סדרת קושי; ולכן אם ההפך אינו נכון וקיימות סדרות קושי שאינן מתכנסות, טבעי לנסות ו"להשלים" את המרחב שלנו על ידי זיהוי הנקודות שבו עם אוסף סדרות הקושי שמתכנסות אליהן.

כל זה נשמע מבלבל מאוד, עד שמגיעים לשורה התחתונה. איך מיוצג המספר 1? באמצעות הסדרה \(\left(1,1,1,\dots\right)\) (מדוע זו סדרת קושי?) ובאופן דומה מיוצג כל מספר רציונלי. ואיך מיוצג מספר אי רציונלי כמו \(\sqrt{2}\) באמצעות סדרת מספרים רציונליים? ובכן, כבר הראיתי דוגמה בפוסט הקודם: למשל, הסדרה \(\left(1,1.4,1.41,\dots\right)\). כלומר, סדרה שבה כל איבר מקרב את \(\sqrt{2}\) ברמת דיוק של ספרה אחת יותר מהקודמת. הראיתי בפוסט הקודם שבסדרה הזו מתקיים \(d\left(a_{n},a_{n+1}\right)\le\frac{1}{10^{n}}\) ובעזרת קריטריון זה לא קשה להראות שמדובר בסדרת קושי.

וכעת עולה השאלה – האם ההרחבה הזו של הרציונליים היא ההרחבה האפשרית היחידה שמשתמשת בתעלול עם סדרות הקושי? התשובה נעוצה בשאלה האם ניתן להגדיר "מרחק" בצורה אחרת – ולכן, כמובן, בשאלה מהו "מרחק" בהקשר של הרציונליים. במתמטיקה קיים מושג כללי של "מרחק" שמכליל את המרחק הרגיל המוכר לנו; לפונקצית מרחק "כללית" שכזו קוראים מטריקה. פונקציה \(d:X\times X\to\mathbb{R}\) היא מטריקה אם היא מקיימת את שלוש התכונות הבאות:

  1. \(d\left(x,y\right)\ge0\) ו-\(d\left(x,y\right)=0\) אם ורק אם \(x=y\). כלומר: מרחק בין שתי נקודות הוא תמיד חיובי ממש אלא במקרה שבו שתי הנקודות זהות ואז המרחק ביניהן הוא תמיד 0.
  2. \(d\left(x,y\right)=d\left(y,x\right)\), כלומר המרחק הוא סימטרי – המרחק מ-\(x\) ל-\(y\) הוא כמו המרחק מ-\(y\) ל-\(x\) (ולכן הכי פשוט לדבר על המרחק בין \(x\) ו-\(y\)).
  3. אי שוויון המשולש: \(d\left(x,y\right)\le d\left(x,z\right)+d\left(z,y\right)\) לכל \(x,y,z\in X\). במילים: המרחק בין \(x\) ל-\(y\) הוא הקצר ביותר האפשרי; אם ננסה ללכת ב"דרך עקיפה", דרך איזו נקודת ביניים \(z\), סכום המרחקים שנלך יהיה גדול יותר.

הפאנץ' כאן הוא שכל פונקציה שמקיימת את התכונות הללו נקראת "מרחק", למרות שיש פונקציות מאוד מוזרות שממש לא מתנהגות כמו המרחק הרגיל שאנחנו מכירים. דוגמה לפונקציה שכזו היא פונקציה שנותנת 1 לכל \(x,y\) שונים זה מזה ו-0 ל-\(x=y\) – "המטריקה הדיסקרטית". קל לראות ששלוש התכונות שדרשנו מתקיימות עבורה, אבל מה ההגיון כאן? הפונקציה אומרת שהמרחק בין כל שתי נקודות ב"עולם" שלנו הוא 1; אם ה"עולם" שלנו הוא המספרים הרציונליים, הרי שפונקצית מרחק כזו מנותקת לחלוטין מהתפיסות המקובלות שלנו.

לכן אני הולך להשית עוד מגבלה על פונקצית ה"מרחק" שאדבר עליה – אדרוש שהיא תנבע ממושג כלשהו של "אורך", או במתמטית: נורמה. מה שאני הולך לתאר כאן הוא נורמה של שדות – כלומר, של קבוצות שבהן יש פעולת חיבור וכפל של איברים במרחב (ההקשר הנפוץ יותר הוא של מרחבים וקטוריים, אבל ההבדל אינו גדול עד כדי כך מבחינה רעיונית). במקום לקשקש יותר מדי פשוט אגש להגדרה: אם \(x\in\mathbb{F}\) הוא איבר בשדה מסמנים את הנורמה שלו (שהיא מספר ממשי) ב-\(\|x\|\) ודורשים שהיא תקיים תכונות שדי מזכירות את אלו של המטריקה:

  1. \(\|x\|\ge0\) ו-\(\|x\|=0\) אם ורק אם \(x=0\).
  2. \(\|x+y\|\le\|x\|+\|y\|\)
  3. \(\|xy\|=\|x\|\cdot\|y\|\)

תכונת הסימטריה של המרחק נעלמה לה כי נורמה מוגדרת רק עבור איבר בודד, אבל שתי התכונות האחרות נשתמרו באופן מסויים. התכונה השלישית מתארת את התנהגות הנורמה ביחס לפעולת הכפל – הנורמה של מכפלת איברים היא מכפלת הנורמות שלהן. הקשר למטריקות אינו מקרי: אם יש לנו נורמה, אז קל לבדוק שהפונקציה \(d\left(x,y\right)=\|x-y\|\) היא מטריקה. מה שחשוב לשים לב אליו הוא שלא כל מטריקה אפשר לקבל כך! יש מטריקות שלא ניתן לקבל באמצעות נורמות. את המטריקה הדיסקרטית ה"מטופשת" שתיארתי למעלה דווקא כן ניתן לקבל באמצעות נורמות – נגדיר \(\|0\|=0\)ו-\(\|x\|=1\) לכל \(x\ne0\). לנורמה הזו קוראים "הנורמה הטריוויאלית".

חזרה לרציונליים. אנחנו מכירים נורמה אחת עבור הרציונליים – הערך המוחלט, כלומר \(\|x\|=\left|x\right|\). האם אנחנו מכירים עוד נורמות? ובכן, למשל \(\|x\|=\sqrt{\left|x\right|}=\left|x\right|^{\frac{1}{2}}\) גם כן עובדת – נסו להוכיח זאת לעצמכם. למעשה, \(\|x\|=\left|x\right|^{\alpha}\) עבור כל \(1\ge\alpha>0\) ממשי. ויש לנו עוד קבוצה מעניינת במיוחד של נורמות שהן – אולי כבר ניחשתם – הנורמות ה-p-אדיות. אבל אני עדיין לא רוצה להציג אותן אלא לשמור אותן בסוד עד לשלב שבו הן יצוצו באופן טבעי. דווקא דברים שנראים "טבעיים" יחסית כמו \(\|x\|=\left|x\right|^{2}\) לא עובדים: \(\|1+1\|=\left|1+1\right|^{2}=4>\left|1\right|^{2}+\left|1\right|^{2}=\|1\|+\|1\|\) מראה שאי שוויון המשולש לא מתקיים עבור "נורמה" כזו.

בואו נביט שניה על שתי הנורמות \(\|x\|_{1}=\left|x\right|\) ו-\(\|x\|_{2}=\left|x\right|^{\frac{1}{2}}\). ברור שהן נותנות מושג שונה של "גודל", אבל האם הן משפיעות על מה שהיה המושג הבסיסי בדיון שלנו – סדרות קושי? כלומר, האם קיימת סדרה שנחשבת לסדרת קושי על פי הנורמה הראשונה אבל לא על פי השניה? אם שתי הנורמות מגדירות בדיוק את אותן סדרות קושי, נאמר שהן שקולות. זו לא סתם הגדרה שרירותית – אם שתי הנורמות מגדירות את אותן סדרות קושי אז כשנבצע השלמה למרחב ונוסיף לו את כל הגבולות של סדרות הקושי הלא מתכנסות שבו, נקבל בדיוק את אותה התוצאה. על פי ההגדרה הזו, די קל לראות ש-\(\|\|_{1}\) ו-\(\|\|_{2}\) הן שקולות. למי שלא מפחד מאינפי, הנה הוכחה:

ניקח סדרת קושי \(a_{1},a_{2},a_{3},\dots\) על פי הנורמה \(\|\|_{1}\); כדי להראות שהיא קושי על פי הנורמה \(\|\|_{2}\) צריך, בהינתן \(\varepsilon>0\) כלשהו, למצוא מקום בסדרה שהחל ממנו אברי הסדרה קרובים עד כדי \(\varepsilon\) על פי הנורמה \(\|\|_{2}\). לשם כך ראשית נמצא מקום \(N\) בסדרה שהחל ממנו אברי הסדרה קרובים עד כדי \(\varepsilon^{2}\) על פי \(\|\|_{1}\); כלומר, לכל \(n,m>N\) מתקיים \(\|x_{n}-x_{m}\|_{1}<\varepsilon^{2}\). כעת נוציא שורש לשני האגפים ונקבל \(\|x_{n}-x_{m}\|_{1}^{\frac{1}{2}}<\varepsilon\), כלומר \(\left|x_{n}-x_{m}\right|^{\frac{1}{2}}<\varepsilon\), כלומר \(\|x_{n}-x_{m}\|_{2}<\varepsilon\). באופן דומה מטפלים גם בכיוון השני (להראות שסדרה שהיא קושי על פי \(\|\|_{2}\) היא קושי גם על פי \(\|\|_{1}\)).

את ההוכחה הזו ניתן לבצע באותו האופן לכל \(1\ge\alpha>0\), ובכך לראות שכל הנורמות מהצורה \(\|x\|=\left|x\right|^{\alpha}\) שקולות זו לזו – וכשמשלימים את הרציונליים על פיהן, מקבלים את הממשיים. מי נותר?

ובכן, מתברר שהתנהגות הנורמות על הרציונליים נקבעות בצורה חזקה מאוד על פי ערכן על המספרים הטבעיים. עד כדי כך שניתן להוכיח כי אם קיים טבעי \(n\) כך ש-\(\|n\|>1\), אז הנורמה היא בהכרח מהצורה \(\|x\|=\left|x\right|^{\alpha}\). ההוכחה מעט טכנית ולא אכנס אליה, אך היא אינה מסובכת במיוחד. אם כן, הנורמות שנותרו הן אלו שלכל טבעי נותנות ערך לכל היותר 1. זו כבר התנהגות מוזרה – הרי אינטואיטיבית היינו מצפים שככל שהמספר הטבעי יגדל כך גם הנורמה שלו תגדל; אך זה לא נובע מהדרישות שהצבנו לנורמה.

אם כן, הבה וניקח נורמה כלשהי שמקיימת \(\|n\|\le1\) לכל \(n\) ונבין איך היא מתנהגת. אם היא איננה הנורמה הטריוויאלית שנותנת 1 לכל טבעי, אז קיים \(n_{0}\) קטן ביותר עבורו \(\|n_{0}\|<1\), ואותו \(n_{0}\) חייב להיות ראשוני; כי אחרת קיימים שני טבעיים \(a,b<n_{0}\) (ומכיוון שהם קטנים יותר מ-\(n_{0}\) הנורמה שלהם היא 1, כי \(n_{0}\) המינימלי שעבורו זה לא כך) כך ש-\(1=\|a\|\cdot\|b\|=\|ab\|=\|n_{0}\|<1\) – סתירה. שימו לב שכאן השתמשנו בכפליות הנורמה – כלומר, עבור פונקצית מרחק "סתם" ההוכחה נשברת כבר בשלב זה. מכיוון ש-\(n_{0}\) הוא ראשוני, אסמן אותו מעתה בתור \(p\).

השלב הבא הוא להבין איך הנורמה מתנהגת על כל המספרים הטבעיים. הדרך לחקור את כל הטבעיים עוברת לעתים קרובות דרך כל הראשוניים, וכאן נעשה אותו הדבר: ניקח ראשוני \(q\ne p\) ונשאל את עצמנו מהי \(\|q\|\). היעד שלי הוא להראות ש-\(\|q\|=1\), והדרך לכך עוברת בשילוב חביב של אנליזה ותורת המספרים. ראשית, משפט בסיסי בתורת המספרים אומר שאם \(x,y\) שני מספרים שלמים הזרים זה לזה (אין להם מחלק משותף הגדול מ-1) אז קיימים שני מספרים שלמים \(a,b\) כך ש-\(ax+by=1\) (באופן כללי יותר – תמיד ניתן לכתוב את המחלק המשותף המקסימלי של שני מספרים כצירוף לינארי בשלמים שלהם). כעת נשתמש בתעלול אנליטי סטנדרטי. נניח ש-\(\|q\|<1\), אז קיים \(n\) שעבורו \(\|p\|^{n}<\frac{1}{2}\) וגם \(\|q\|^{n}<\frac{1}{2}\) (כי אם \(0<t<1\) אז ככל שמעלים אותו בחזקה גבוהה יותר כך הוא מתקרב יותר ויותר לאפס). עכשיו נשלב את שני אלו לקבלת סתירה:

\(1 = \|1\|=\|ap^{n}+bq^{n}\|\le\|a\|\cdot\|p\|^{n}+\|b\|\cdot\|q\|^{n}<\frac{1}{2}+\frac{1}{2}=1\)

כאן השתמשנו גם בכפליות הנורמה וגם באי שוויון המשולש, וכמובן גם בכך ש-\(p^{n},q^{n}\) זרים (כי הם חזקות של ראשוניים שונים – אם במקום \(q\) היינו לוקחים מספר טבעי "כלשהו" זה לא היה עובד).

מסקנה: \(\|q\|=1\) לכל ראשוני שונה מ-\(p\). מכאן אנחנו מסוגלים להסיק את הערך של הנורמה על כל מספר טבעי \(a\): נכתוב את \(a\) בתור \(a=p^{k}\cdot\prod q_{i}^{k_{i}}\) (\(k\) יכול להיות גם אפס), ואז מכפליות הנורמה נקבל \(\|a\|=\|p\|^{k}\cdot\prod\|q_{i}\|^{k_{i}}=\|p\|^{k}\). בואו נסמן את \(\|p\|\) בתור \(\rho\) ונשתמש בסימון המוזר \(k=\mbox{ord}_{p}\left(a\right)\) כדי לסמן את החזקה הגבוהה ביותר של \(p\) שמחלקת את \(a\); אז קיבלנו ש-\(\|a\|=\rho^{\mbox{ord}_{p}\left(a\right)}\). מכאן ההכללה עבור מספרים רציונליים היא קלה: מתכונת הכפליות של הנורמה עולה שבהכרח \(\|\frac{1}{b}\|=\frac{1}{\|b\|}\), ולכן \(\|\frac{a}{b}\|=\frac{\|a\|}{\|b\|}=\frac{\rho^{\mbox{ord}_{p}\left(a\right)}}{\rho^{\mbox{ord}_{p}\left(b\right)}}=\rho^{\mbox{ord}_{p}\left(a\right)-\mbox{ord}_{p}\left(b\right)}\) (שימו לב שעבור מספרים רציונליים הנורמה עשויה לתת ערכים גדולים מ-1).

ובכן, זוהי הנורמה ה-p-אדית המדוברת. מכיוון ש-\(\rho<1\), היא בעלת התכונה שככל ש-\(a\) מתחלק על ידי חזקה גדולה יותר של \(p\), כך הנורמה שלו קטנה יותר. כדי להבין עד כמה זה מוזר, שימו לב ש-\(\|n!\|\to0\) על פי הגדרת הנורמה הזו. למעשה, עוד לא סיימתי כי לא ברור מיהו \(\rho\), אלא שזה לא משנה: אפשר להראות שעבור כל שני ערכי \(0<\rho_{1},\rho_{2}<1\) הנורמה שנקבל על ידי ההגדרה שלעיל תהיה זהה – הדבר היחיד שמשנה הוא \(p\). לכן כשמגדירים את הנורמה באופן מסודר נוהגים לבחור \(\rho=\frac{1}{p}\) (זו אינה בחירה שרירותית לגמרי – יש בה הגיון "אסתטי" כלשהו שאציג בפוסט הבא).

לסיכום: מה שהראיתי (שמכונה "משפט אוסטרובסקי") הוא שמעל \(\mathbb{Q}\) קיימות, עד כדי שקילות, רק נורמת הערך המוחלט, הנורמה הטריוויאלית והנורמה ה-p-אדית לכל ראשוני \(p\). מכאן שההשלמות האפשריות השונות של \(\mathbb{Q}\) (עבור מטריקות שמושרות מנורמות) הן רק הממשיים (על ידי הערך המוחלט), ההשלמה הטריוויאלית והלא מעניינת שנותנת הנורמה הטריוויאלית, וההשלמות ה-p-אדיות, \(\mathbb{Q}_{p}\), שהם בדיוק – אבל בדיוק – השדות שתיארתי בפוסט הקודם. בפוסט הבא אציג כמה תכונות משעשעות של הנורמה ה-p-אדית שהופכות את האנליזה במספרים p-אדיים למעניינת.

אז מהו שדה המספרים ה-p-אדיים?

בפוסט הקודם דיברתי על משוואות דיופנטיות, והפעם אגש ישר לעניין. נניח שמבקשים מאיתנו לפתור את המשוואה \(x^{2}\equiv2\left(\mbox{mod }7\right)\). אפשר לשאול למה בכלל ידוע שיש למשוואה הזו פתרון, ואפשר לדבר על דרכים כלליות לפתור אותה, אבל לא אכנס לכך כרגע – רק אעיר שבגלל ש-\(7\) ראשוני, יש דרכים שיטתיות לעשות זאת – אריתמטיקה מודולרית היא פשוטה יותר כשאנחנו מודולו מספר ראשוני. במקרה שלנו אפשר לראות ששני הפתרונות (כשאנחנו מגבילים את עצמנו לתחום \(0,\dots,6\), שכל מספר שלם אחר שקול לאיבר מתוכו מודולו 7) הם \(x=3,4\) (אין זה מקרה ש-\(3+4=7\); אפשר לחשוב על \(4\) גם בתור \(-3\), ולכן כשמעלים אותו בריבוע מקבלים אותו דבר כמו \(3\) בריבוע).
האתגר הבא שלנו, כפי שכתבתי בפוסט הקודם, הוא לפתור את המשוואה מודולו \(7^{n}\), עבור כל \(n\ge2\). אם אצליח למצוא שיטה כללית לעשות זאת (ולא רק עבור 7 אלא עבור כל ראשוני), אוכל להשתמש במשפט השאריות הסיני כדי לפתור כל משוואה מודולו כל מספר שלם.
אם כן, נתחיל מלנסות ולפתור את המשוואה מודולו \(7^{2}\). האבחנה הראשונה היא שאם \(a^{2}\equiv2\left(\mbox{mod }7^{2}\right)\), אז \(a\equiv3,4\left(\mbox{mod 7}\right)\) – כלומר, מודולו 7, \(a\) נראה בדיוק כמו אחד הפתרונות של המשוואה המקורית. מדוע? כי אם \(a^{2}\equiv2\left(\mbox{mod }7^{2}\right)\) אז המשמעות של כך, ממש מן ההגדרה, היא \(7^{2}|a^{2}-2\), כלומר \(7^{2}\) מחלק את ההפרש בין \(a^{2}\) ובין 2, כשחושבים על שניהם כמספרים שלמים. אם \(7^{2}\) מחלק את ההפרש, ודאי שגם \(7\) מחלק את ההפרש, ולכן \(a^{2}\equiv2\left(\mbox{mod }7\right)\), כלומר מודולו 7 \(a\) הוא אחד מהפתרונות של המשוואה המקורית, וכבר אמרנו שהם \(3,4\).
אם כן, בואו נחפש את כל הפתרונות ששקולים ל-3 מודולו 7. אפשר לומר שהצורה הכללית של פתרון \(a\) שכזה היא \(a=3+7\cdot k\), כאשר \(k\) הוא מספר שלם כלשהו. בואו נציב את זה למשוואה המקורית ונראה מה קורה: \(2\equiv a^{2}\equiv\left(3+7k\right)^{2}\equiv3^{2}+14bk+7^{2}k^{2}\equiv9+14\cdot3k\left(\mbox{mod }7^{2}\right)\) (\(7^{2}k\) נעלם כשלוקחים את הכל מודולו \(7^{2}\)). אחרי העברת אגפים נקבל ש-\(7+14\cdot3k\equiv0\left(\mbox{mod }7^{2}\right)\), כלומר \(7^{2}|7+14\cdot3k\); אבל אפשר להוציא מאגף שמאל את הגורם המשותף 7, ולכן נקבל ש-\(7|1+6k\), או \(1+6k\equiv0\left(\mbox{mod 7}\right)\), וממשוואה זו קל לחלץ את \(k\): \(k\equiv1\left(\mbox{mod }7\right)\). אם כן, איזה פתרון חדש קיבלנו? את \(a=3+7=10\) (עבור הערך הבא של \(k\), \(k=8\), נקבל \(a=3+7\cdot8=59\equiv10\left(\mbox{mod }7^{2}\right)\)). השיטה שלנו עבדה.
אפשר מן הסתם להמשיך עם השיטה הזו עוד, ועוד, ועוד, כשעל כל פתרון ישן אנחנו מקבלים פתרון חדש. בואו ננסה לתאר את זה בצורה מסודרת: התחלנו ממספר \(a_{1}\) שמקיים \(a_{1}^{2}\equiv2\left(\mbox{mod 7}\right)\), ובנינו ממנו מספר \(a_{2}\) שמקיים \(a_{2}^{2}\equiv2\left(\mbox{mod }7^{2}\right)\); ואותו מספר קיים בנוסף ש-\(a_{2}\equiv a_{1}\left(\mbox{mod }7\right)\). באופן כללי, בהינתן \(a_{n}\) שמקיים \(a_{n}^{2}\equiv2\left(\mbox{mod 7}^{n}\right)\), אפשר לבנות \(a_{n+1}\) שמקיים \(a_{n+1}^{2}\equiv2\left(\mbox{mod 7}^{n+1}\right)\), ובנוסף לכך \(a_{n+1}\equiv a_{n}\left(\mbox{mod }7^{n}\right)\). אפשר לחשוב על המידע על אוסף הפתרונות הזה כאילו הוא מקודד בתור סדרה, \(a_{1},a_{2},\dots\).
הבה ונעבור לרגע לדון במשוואה \(x^{2}=2\) מעל המספרים הממשיים. הפתרון של המשוואה ניתן לכתיבה בתור \(\sqrt{2}=1.4142\dots\), כשהנקודות מציינות שהספרות ממשיכות וממשיכות עד אין קץ, ובלי שתהיה בהן מחזוריות קבועה – זו המשמעות של היות \(\sqrt{2}\) אי רציונלי. המספר שאנחנו כותבים בפועל הוא פשוט קירוב רציונלי ל-\(\sqrt{2}\) האי רציונלי. הבה ונכתוב את האיברים הראשונים בקירוב:
\(b_{0}=1,b_{1}=1.4,b_{2}=1.41,b_{3}=1.414,b_{4}=1.4142\) וכן הלאה (התחלתי הפעם את המספור מ-0 לצורכי נוחות שיתבררו בקרוב).
אם נעלה את \(b_{4}\) בריבוע, נקבל את המספר המגוחך \(1.99996164\). ההפרש בינו לבין 2 הוא \(0.00003836\dots\) – הפרש פצפון. ככל שנתקדם עוד יותר בסדרה נקבל הפרשים עוד יותר קטנים. כלומר, המרחק שבין אברי \(b_{n}\) ובין 2 הולך ושואף לאפס. נהוג לסמן זאת \(\lim_{n\to\infty}\left|2-b_{n}^{2}\right|=0\), ובקיצור: \(\lim_{n\to\infty}b_{n}^{2}=2\). על בסיס הרעיון הזה טבעי להגדיר את \(\sqrt{2}\) מלכתחילה בתור גבול הסדרה \(\lim_{n\to\infty}b_{n}\). זה כמובן מעלה את התמיהה מדוע צריך "להגדיר את \(\sqrt{2}\)" – האם הוא לא היה קיים מאז ומעולם? ובכן, תלוי בגישה שלנו לחיים; אם כל מי שאנחנו מכירים כרגע הוא מספרים רציונליים (שנבנו באופן מסודר מהשלמים, שנבנו באופן מסודר מהטבעיים, שאותם קיבלנו מאלוהים), אז לא – עדיין אין לנו בנמצא מספרים אי רציונליים ויש להגדיר אותם.
שימו לב לתכונה מעניינת נוספת של סדרת הקירובים \(a_{n}\). ההפרש בין שני איברים סמוכים מקיים \(\left|b_{n+1}-b_{n}\right|\le10^{-n}\), כלומר אם נחסר שני איברים סמוכים זה מזה, נקבל מספר עם הרבה אפסים בהתחלה (\(n+1\) במספר). אפשר לומר ששני המספרים הללו קרובים זה לזה עד כדי חזקה קטנה של \(n\).
אם כן, נסכם: אפשר לחשוב על \(\sqrt{2}\) כאילו הוא מקודד סדרה של קירובים הולכים ומשתפרים עבור פתרון למשוואה \(b^{2}=2\), כשהדרך שבה אנחנו מודדים קרבה היא על ידי הערך המוחלט של ההפרש. הסדרה הזו מקיימת את התכונות ש-\(\left|b_{n}^{2}-2\right|\le10^{-n}\) ובנוסף \(\left|b_{n+1}-b_{n}\right|\le10^{-n}\). נראה מוכר?
הפאנץ' הוא שגם על סדרת המספרים שהצגתי קודם, זו שמקיימת \(a_{n}^{2}\equiv2\left(\mbox{mod }7^{n}\right)\) ו-\(a_{n+1}\equiv a_{n}\left(\mbox{mod }7^{n}\right)\) אפשר לחשוב בתור "סדרת קירובים שהולכים ומשתפרים" לפתרון של המשוואה \(x^{2}\equiv2\) מודולו חזקות הולכות וגדלות של 7. יש הגיון רב בגישה הזו: הרי אם \(a_{n}^{2}\equiv2\left(\mbox{mod }7^{n}\right)\), אז גם \(a_{n}^{2}\equiv2\left(\mbox{mod }7^{k}\right)\) לכל \(k<n\) (מאותו נימוק שנתתי קודם, כי \(7^{k}\) מחלק את \(7^{n}\) ולכן מחלק כל מה שמתחלק על ידי \(7^{n}\)), ולכן הפתרון \(a_{n}\) איכשהו כבר מקודד את כל הפתרונות הקודמים, בדומה לאופן שבו \(1.4142\) מקודד את כל הקירובים הקודמים של שורש 2. מן הסתם הסדרה \(a_{n}\) הזו לא נגמרת לעולם, כשם שסדרת הקירובים הרציונליים של \(\sqrt{2}\) שהצגתי לא נגמרת לעולם; אבל אם אפשר לחשוב על "מספר" ממשי, שאפילו מסומן בתור \(\sqrt{2}\), שמייצג את סדרת הקירובים הרציונליים כולה, למה לא לחשוב על מספר שמהווה גבול לסדרה \(a_{n}\) שלנו? אפשר להגדיר מספרים כאלו בדיוק באותו האופן שבו הגדרנו את המספרים הממשיים. ובכן, התשובה לשאלה "למה לא" היא פשוטה – אין סיבה לא לעשות זאת, ואכן עושים זאת, ולתוצאה, במקרה זה, קוראים מספרים \(7\)-אדיים.
מכיוון שכל הדיון הזה עסק במשוואה ספציפית, \(x^{2}\equiv2\left(\mbox{mod }7^{n}\right)\), התמונה הגדולה קצת התפספסה – מה התכונה המאפיינת של \(a_{n}\) שאינה קשורה למשוואה שאותה \(a_{n}\) באה לנסות ולפתור? ובכן, שמתקיים \(a_{n+1}\equiv a_{n}\left(\mbox{mod }7^{n}\right)\). אם כן, זה כל מה שנדרוש. הבה ונגדיר זאת פורמלית: שלם \(7\)-אדי הוא סדרה \(\left(a_{1},a_{2},\dots\right)\) שאבריה מקיימים \(a_{n+1}\equiv a_{n}\left(\mbox{mod }7^{n}\right)\). ובאופן כללי: סדרה שאבריה מקיימים \(a_{n+1}\equiv a_{n}\left(\mbox{mod }p^{n}\right)\) עבור ראשוני \(p\) כלשהו נקראת שלם p-אדי.
שימו לב שקראתי ליצור שהתקבל שלם p-אדי, ולא "מספר" p-אדי. הסיבה לכך היא שעדיין לא הגענו לסוף הסיפור. מן הסתם קבוצה של מספרים איננה מעניינת כל כך לכשעצמה – ברגע שמוגדרות עליה פעולות חשבון היא נהיית מעניינת יותר. הגדרת חיבור וכפל על השלמים ה-p-אדיים נובעת באופן די טבעי: \(\left(a_{1},a_{2},\dots\right)+\left(b_{1},b_{2},\dots\right)=\left(a_{1}+b_{1},a_{2}+b_{2},\dots\right)\) ו-\(\left(a_{1},a_{2},\dots\right)\cdot\left(b_{1},b_{2},\dots\right)=\left(a_{1}\cdot b_{1},a_{2}\cdot b_{2},\dots\right)\) (לא קשה לראות שגם הסכום והמכפלה מקיימים את הדרישה משלם p-אדי). אם כן, השלמים ה-p-אדיים הם חוג; ומכיוון ש-\(\left(a,a,a,\dots\right)\) הוא שלם p-אדי, אפשר לחשוב עליהם כעל חוג שמרחיב את חוג השלמים.
כאשר נתקלים במתמטיקה בחוגי מספרים שכאלו אשר מרחיבים את השלמים, אחד מהגישושים הראשונים שמבצעים כדי להבין איך החוגים "נראים" הוא למצוא את ההכללה המתאימה למשפט היסודי של האריתמטיקה עבורם. עבור שלמים המשפט היסודי של האריתמטיקה אומר שכל מספר ניתן להצגה באופן יחיד כמכפלה של מספרים ראשוניים, עד כדי שינוי של הסדר שלהם והכפלה באיברים הפיכים (בשלמים ההפיכים היחידים הם \(1,-1\)). כך למשל את 15 ניתן להציג כ-\(3\cdot5\), אך גם כ-\(\left(-1\right)\cdot5\cdot\left(-1\right)\cdot3\). די ברור ששתי ההצגות זהות באופן עקרוני.
בחלק מהחוגים שמרחיבים את השלמים המצב כבר לא כך כך נחמד. דוגמה פשוטה היא החוג \(\mathbb{Z}\left[\sqrt{-5}\right]\), החוג שמתקבל מהשלמים על ידי הוספת \(\sqrt{-5}\) למשחק , כך שאברי החוג הם מהצורה \(a+b\sqrt{-5}\) עם \(a,b\in\mathbb{Z}\). זהו אמנם חוג, אך מתקיים בו \(6=2\cdot3=\left(1+\sqrt{-5}\right)\left(1-\sqrt{-5}\right)\), וניתן לבדוק שכל האיברים שמופיעים בפירוקים הללו הם בעצם אי פריקים ("אי פריק" הוא המושג המעניין כאן ולא "ראשוני"; בחוג השלמים שני המושגים הללו מזדהים, ומכאן ה"בלבול" בשמות – לאיברים ראשוניים הגדרה וחשיבות משל עצמם). מצד אחד, זו תוצאה מצערת למדי (שחירבה לחלוטין הוכחה בת המאה ה-19 למשפט האחרון של פרמה). מצד שני, בעיה זו היוותה את הבסיס לתורת המספרים האלגברית – נושא שראוי בעצמו לפוסטים רבים, ולא אגע בו כעת.
למרבה המזל, בשלמים ה-p-אדיים המצב נחמד ופשוט מאוד: כל שלם p-אדי השונה מאפס ניתן להצגה בתור \(\alpha=p^{n}\varepsilon\), כאשר \(\varepsilon\) הוא שלם p-אדי הפיך. זה כמובן מעלה את השאלה מיהם האיברים ההפיכים; התשובה היא פשוטה ונחמדה בעצמה: כל שלם \(\left(a_{1},a_{2},\dots\right)\) שעבורו \(a_{1}\not\equiv0\left(\mbox{mod }p\right)\) (זה תרגיל נחמד להוכיח זאת). מכאן שלמשל, כל המספרים השלמים שאינם מתחלקים בידי \(p\) הם הפיכים בחוג השלמים ה-p-אדיים.
מכיוון שישנה הצגה כל כך פשוטה לשלמים ה-p-אדיים, לא קשה לראות בעזרתה שאין בחוג מה שנקרא "מחלקי אפס" – איברים שונים מאפס שמכפלתם היא 0 (למשל, בחוג \(\mathbb{Z}_{6}\), האיברים \(2,3\) הם מחלקי אפס כי מכפלתם היא אפס). ההוכחה פשוטה: מכפלה של שני שלמים היא מהצורה \(p^{n}\varepsilon_{1}\cdot p^{m}\varepsilon_{2}=p^{n+m}\left(\varepsilon_{1}\varepsilon_{2}\right)\). אם זה שווה לאפס אפשר לכפול בהופכי של האיבר ההפיך \(\varepsilon_{1}\varepsilon_{2}\) ולקבל כי \(p^{n+m}=0\) – סתירה.
כעת הגענו לפאנץ': מכיוון שחוג השלמים הוא ללא מחלקי אפס, ניתן להרחיב אותו באופן כזה שלכל איבר יהיה הופכי, בדיוק באותו תהליך שבו משתמשים כדי לבנות את הרציונליים מתוך השלמים – תהליך של בניית שדה שברים של חוג (גם כאן, מדובר על תהליך סטנדרטי עבור חוגי הרחבה של השלמים). התוצאה מסומנת לרוב ב-\(\mathbb{Q}_{p}\) ונקראת, סוף סוף, "שדה המספרים ה-p-אדיים". הבניה אינה נגמרת כאן – כשם ש-\(\mathbb{R}\) אינו סגור אלגברית (לא לכל פולינום יש שורש) והוא מורחב ל-\(\mathbb{C}\), גם את \(\mathbb{Q}_{p}\) ניתן להרחיב עוד; עם זאת, לא אציג זאת כאן (ההרחבה מסובכת יותר מההרחבה של \(\mathbb{R}\)).
אם כן, אלו הם, באופן בסיסי, המספרים ה-p-אדיים. לפני שאגיד משהו על השימוש שעושים בהם לפתרון משוואות דיופנטיות אציג אותם שוב, והפעם מזווית ראייה שונה. הבניה שהצגתי בפוסט הזה הייתה "אלגברית" במהותה – הגדרתי את המספרים באמצעות סדרות שמקיימות תכונה אלגברית כלשהי של שקילות מודולו חזקות של \(p\), ואת התוצאה הרחבתי לשדה באמצעות בניה אלגברית סטנדרטית. בפוסט הבא אראה איך אפשר להגיע אל המספרים ה-p-אדיים גם מכיוון שונה לגמרי – כיוון אנליטי (שגם הוא, בסופו של דבר, זהה באופיו לבניה של הממשיים מהרציונליים).

משוואות דיופנטיות, ולמה בגללן אנחנו מתעניינים במספרים p-אדיים?

לפעמים מתקבל הרושם השגוי שמה שהמתמטיקאים עוסקים בו הוא "פתרון משוואות". לכן מחשבים אנושיים שמסוגלים לומר מהו השורש השביעי של 5434245346 תוך חלקיק שניה נחשבים מייד לעילויי מתמטיקה. כמובן שהמתמטיקה ה"אמיתית" אינה כזו, ועם זאת העיסוק במשוואות הוא עדיין מרכזי מאוד במתמטיקה – אך באיזה מובן? מה שהמתמטיקאי עושה איננו לפתור משוואות ספציפיות על ידי הפעלה של אלגוריתם ידוע כלשהו – הוא עוסק במציאת דרכים לפתור משוואות, בפיתוח אלגוריתמים חדשים למציאת הפתרון, ובחקירת התכונות של הפתרונות.

הדוגמה הקלאסית היא משוואות ממעלה שניה. כל תלמיד תיכון יודע שכדי למצוא את פתרונות המשוואה \(ax^{2}+bx+c=0\) יש לחשב את \(\frac{-b\pm\sqrt{b^{2}-4ac}}{2a}\), וחלק נכבד מלימודי המתמטיקה בתיכון מוקדש להצבת דברים בנוסחה זו. המתמטיקאי לא מציב בנוסחה זו להנאתו; כשהוא אומר שהוא "פותר משוואות ממעלה שנייה", כוונתו לכך שהוא מוצא את הנוסחה הזו מלכתחילה. ואכן, על פניו לא ברור למה הנוסחה עובדת בכלל; יש כאן מין "קסם", שמהנוסחה המפחידה הזו יוצאים הפתרונות של המשוואה. זהו תפקידו של המתמטיקאי לגלות את הקסם ולתרגם אותו לשיטת פעולה פשוטה יחסית – במקרה זה, הצבה בנוסחה.

בפוסט הזה ובהמשכים שלו אני רוצה להתמקד במחלקה מיוחדת וחשובה ביותר של משוואות – משוואות דיופנטיות. משוואה דיופנטית היא משוואה בנעלם אחד או יותר, שכל המקדמים בה הם מספרים שלמים, והפתרונות שאנו מחפשים גם הם מספרים שלמים (לעתים מרשים גם מספרים רציונליים כי ניתן לתרגם משוואה רציונלית שכזו למשוואה בשלמים, אבל ברשותכם לא אכנס לכך). משוואות דיופנטיות הן טבעיות מאוד, כי המספרים שאנו פוגשים בחיי היום-יום הם מספרים שלמים (ורציונליים), ופתרונות שאינם שלמים לרוב אינם מועילים לנו. דוגמה חביבה לכך היא בעיית כדורי התותח: נשאלת השאלה האם ניתן לקחת קבוצת כדורי תותח המסודרת על הקרקע בריבוע מושלם (כלומר, אין בו חורים של כדורים חסרים), ולבנות מהם פירמידה מושלמת (פירמידה במקרה זה מורכבת מריבוע עם אורך צלע \(k\) של כדורים, שעליו מושם ריבוע עם אורך צלע \(k-1\) וכן הלאה). כלומר, השאלה היא האם קיימים \(k,n\) כך ש-\(\sum_{i=1}^{k}i^{2}=n^{2}\). נוסחה ידועה עבור הסכום שבאגף שמאל נותנת את המשוואה \(\frac{k\left(k+1\right)\left(2k+1\right)}{6}-n^{2}=0\). זוהי משוואה בשני נעלמים עם מקדמים רציונליים – את המקדמים הרציונליים אפשר לבטל על ידי הוצאת גורם משותף, כך שמתקבלת בסופו של דבר המשוואה הדיופנטית הבאה: \(k\left(k+1\right)\left(2k+1\right)-6n^{2}=0\). מן הסתם פתרון שאיננו שלם למשוואה הזו הוא חסר טעם – אנחנו לא יכולים להשתעשע עם מחצית כדור תותח, או עם \(\frac{1}{\pi}\) כדור תותח. אם כן, מהם פתרונות המשוואה? אפשר לגלות על ידי ניסוי וטעייה ש-\(\left(1,1\right)\) ו-\(\left(24,70\right)\) הם פתרונות, אבל האם קיימים עוד? מסתבר שלא, אך ההוכחה אינה פשוטה בכלל.

וכאן אנחנו מגיעים לנקודה המרכזית שלי – העיסוק במשוואות דיופנטיות איננו קל, בכלל. הוא מאוד, מאוד קשה. כל כך קשה, שאפשר לכתוב ספרים שלמים רק על משוואה אחת (אני טיפה מגזים אך תכף אסביר). כל כך קשה שתורות מתמטיות שלמות מפותחות סביב מקרים פרטיים של משוואות. דיופנטיות. כל כך קשה עד שיש הוכחה מתמטית לכך שאין שום אלגוריתם שבהינתן משוואה דיופנטית אומר אם היא פתירה או לא (ומכאן שיש משוואות שאין לנו שום דרך לדעת שאינן פתירות). קשה, קשה, קשה.

דוגמה: המשפט האחרון של פרמה. המשוואה הדיופנטית \(x^{2}+y^{2}=z^{2}\) ניתנת לפתרון – למעשה, יש לה אינסוף פתרונות, וזו שאלה מעניינת (אם כי בעלת תשובה פשוטה יחסית) למצוא את כולם. והנה בא פרמה וטען שהוא סגר את כל המשוואות הדומות: שכל משוואה מהצורה \(x^{n}+y^{n}=z^{n}\) אינה ניתנת לפתרון כאשר \(n\) טבעי גדול מ-2. נדרשו כ-300 שנים להוכחת הטענה הזו, כשבאמצע הדרך מומצא התחום של תורת המספרים האלגברית כדי לטפל במקרים פרטיים שלה. הפתרון מגיע בסופו של דבר מתחום שעוסק בפתרונות של משוואות דיופנטיות אחרות – משוואות מהצורה \(y^{2}=x^{3}+ax+b\) – "עקומים אליפטיים". למעשה, בהקשר של משפט פרמה העניין הוא בפתרונות רציונליים של המשוואה ולא רק שלמים, אך גם לזה לא אוכל להיכנס כרגע.

עוד דוגמה יפה במיוחד היא משוואת פל – משוואה מהצורה \(x^{2}-Dy^{2}=1\) עבור \(D\) שאינו ריבוע (יש עוד הכללות שלה – ה-1 באגף ימין יכול להיות מוחלף במספרים אחרים, במחיר סיבוך של התורה). המשוואה הזו נראית לא מזיקה ממבט ראשון, אבל יש לה נטייה לצוץ בהקשרים רבים ושונים. אחד מהחביבים עלי הוא בחידה מס' 100 מפרויקט אוילר: יש קופסה עם כדורים אדומים וכחולים, ואנו שולפים שניים באקראי. מה צריך להיות הרכב הכדורים בתיבה כדי שההסתברות ששני הכדורים שישלפו יהיו כחולים תהיה בדיוק חצי? הרכב אפשרי אחד הוא של 15 כדורים כחולים ו-6 כדורים אדומים, אבל יש מן הסתם הרכבים רבים נוספים. אפשר לתרגם באופן מסויים את מציאתם למציאת פתרונות עבור משוואת פל מסויימת (עם מינוס 1 באגף ימין ולא 1, אך ההבדל כאמור אינו כה גדול).

למשוואת פל (כפי שראיתם, מדובר בעצם על "משפחה" של משוואות, כתלות ב-\(D\) ואולי גם במה שבאגף ימין) יש תורה מפותחת ויפה, שעליה באמת נכתבו ספרים שלמים. בבסיסה, הרעיון הוא כזה: למשוואה יש אינסוף פתרונות, שאחד מהם, שהוא במובן מסויים הקטן ביותר, "מייצר" את כל היתר (ניתן לחשוב עליהם כעל חזקה שלו, כשחושבים על הפתרונות כאיברים בתוך הרחבה מסויימת של המספרים השלמים). כדי למצוא את הפתרון היסודי הזה משתמשים בשיטות שמערבות את התורה של שברים משולבים. בקיצור, כיף חיים. ארחיב על כך בפוסט נפרד מתישהו.

הסיבה שבגללה אני מזכיר כעת את עולם המשוואות הדיופנטיות היא שאני רוצה להשתמש בהן בתור המוטיבציה להצגת יצורים מתמטיים מעניינים מאוד ומוזרים מאוד במבט ראשון – המספרים ה-p-אדיים. בפרט, המוטיבציה שלי תהיה משפט ידוע של הסה ומינקובסקי על פתרון של משוואות דיופנטיות ריבועיות (ליתר דיוק – תבניות ריבועיות), הקושר בין הפתירות של משוואות כאלו ובין הפתירות שלהן במספרים p-אדיים. חשוב להבהיר שמדובר במוטיבציה בלבד – למספרים ה-p-אדיים שימושים רבים ושונים בתורת המספרים שאת רובם אני בכלל לא מכיר.

ראשית, שימו לב שמשוואה דיופנטית הופכת למעניינת רק מרגע שיש בה שני משתנים או יותר. אם \(p\left(x\right)\) הוא פולינום במשתנה יחיד, אז אין קושי מהותי למצוא את כל השורשים שלו תוך שימוש בשיטות אנליטיות (ניוטון-רפסון, למשל) – ולבדוק פרטנית לכל שורש האם הוא מספר שלם או לא (ניוטון-רפסון נותן רק קירוב וכשאנו עובדים במחשב יש לנו דיוק מוגבל; אבל אם קיבלנו שהשורש הוא בערך 4.0000001, נוכל פשוט להציב 4 בפולינום ולבדוק אם קיבלנו אפס). הסיבה שבגללה זה כל כך קל היא שיש ל-\(p\left(x\right)\) מספר סופי של שורשים (לכל היותר כדרגת \(p\)). לעומת זאת, למשוואה בשני נעלמים ויותר יכולים להיות אינסוף פתרונות (כך המצב במשוואת פל, למשל) ולכן שיטה אנליטית כמו זו שהצעתי עובדת הרבה פחות טוב. אם קיים פתרון, אז המצב לא כל כך גרוע – תמיד אפשר יהיה למצוא אותו, ולו על ידי בדיקה סדרתית של כל ההצבות האפשריות למשתנים; מה שמעניין אותנו הוא לגלות מתי למשוואה אין בכלל פתרון (אני כמובן מגזים – אחד מהדברים החשובים במשוואת פל הוא שכל כך קל לחשב את הפתרונות).

בואו נביט לרגע במשוואה \(2x+4y=3\). האם קיים למשוואה פתרון? מייד אפשר לראות שהתשובה שלילית. למה? כי המספר שבאגף ימין אי זוגי, ואילו לא משנה מה נציב בתור \(x,y\) באגף שמאל, נקבל שם מספר זוגי.

באופן דומה גם למשוואה \(3x^{2}+9y^{17}=5\) אין פתרון, הפעם בגלל תכונת התחלקות ב-3. הדרך לטפל באופן מסודר בכללי האצבע הללו היא להסתכל על המשוואות מודולו מספר כלשהו \(n\).

חשבון מודולו \(n\) דומה לחשבון רגיל, תחת המגבלה שאחרי שאנו מבצעים פעולה כלשהי אנו מחלקים את התוצאה ב-\(n\) ולוקחים רק את השארית. כך למשל אם \(n=7\), אז תוצאת החיבור \(5+3\) היא 1, כי \(5+3=8\) וכאשר מחלקים \(8\) ב-\(7\) מקבלים 1. שני מספרים הם שווים מודולו \(n\) אם הם מחזירים את אותה שארית בחלוקה ב-\(n\); כך למשל \(3\equiv_{7}10\). הרעיון בחשבון מודולו \(n\) הוא להצטמצם לדיון על אוסף השאריות האפשריות בחלוקה ב-\(n\) – בדיוק המספרים \(0,1,2,\dots,n-1\). משוואה דיופנטית שמסתכלים עליה מודולו \(n\) היא קלה הרבה יותר לפתרון ממשוואה דיופנטית רגילה, מהטעם הפשוט שיש רק מספר סופי של הצבות ערכים אפשריות לבדוק (אם אנחנו עובדים מודולו \(n=7\) וכבר הצבנו \(x=3\), אין טעם להציב גם \(x=10\) למשל, כי נקבל את אותה תוצאה). למשל, הבה ונביט במשוואה \(3x\equiv_{7}5\) – אפשר פשוט להציב בה את כל המספרים מ-0 ועד \(6\) ולראות מתי נקבל 5 (למשל, עבור \(x=4\) נקבל ש-\(3x=12\equiv_{7}5\)).

האבחנה המרכזית כאן היא שאם משוואה דיופנטית כלשהי היא פתירה בשלמים, אז היא בוודאי פתירה מודולו \(n\) לכל \(n\) (למה?). לכן אם נצליח למצוא ולו \(n\) אחד ויחיד כך שהמשוואה אינה פתירה מודולו \(n\), ינבע מכך שאין לה פתרון כלל. לרוע המזל, ההפך אינו נכון – קיימות משוואות שהן פתירות מודולו כל \(n\) אך למרות זאת אין להן פתרון בשלמים. עם זאת, זו עדיין התקדמות כלשהי, שגם מציגה את דרך העבודה הכללית בתורת המספרים: כדי להגיד משהו מעניין על המספרים השלמים, אנחנו עוברים לבחון את הבעיה בתוך אוסף מספרים אחר (במקרה הזה, אוסף השאריות מודולו \(n\), שמסומן בדרך כלל ב-\(\mathbb{Z}_{n}\)).

האם באמת צריך לנסות ולפתור את המשוואה מודולו כל \(n\)? ובכן, לא. כאן נכנס לעזרתנו משפט מתורת המספרים – "משפט השאריות הסיני". בבסיסו, המשפט אומר שאם \(n=ab\) כאשר \(a,b\) זרים זה לזה – אין להם מחלק משותף גדול מ-1, אז משוואה היא פתירה מודולו \(n\) אם ורק אם היא פתירה מודולו \(a\) ופתירה מודולו \(b\). למעשה, כיוון אחד כאן הוא טריוויאלי – אם המשוואה פתירה מודולו \(n\) אותו פתרון טוב הן מודולו \(a\) והן מודולו \(b\) – הכוח של המשפט נעוץ בכך שהוא מראה כיצד ניתן לבנות מפתרון אחד למשוואה מודולו \(a\) ומפתרון אחר למשוואה מודולו \(b\) פתרון "משולב" עבור המשוואה מודולו \(n\) (ליתר דיוק, זה לא בדיוק מה שהמשפט אומר אלא תוצאה כמעט מיידית שלו).

הנה דוגמה: נניח ש-\(n=119\), כלומר \(a=7,b=17\) במקרה זה, ואנו מתבוננים במשוואה \(x^{2}=2\). לא קשה לראות שמודולו 7 המשוואה הזו פתירה עם \(x=3\), ואילו מודולו 17 המשוואה הזו פתירה עם \(x=6\). מהו הפתרון מודולו 119? על ידי חיפוש ממצה אפשר לגלות ש-11 הוא פתרון שכזה, אולם משפט השאריות הסיני (שכבר תיארתי בעבר ולכן לא אפרט עליו כעת) נותן לדרך "לבנות" את 11 באופן אלגוריתמי ויעיל מתוך שני הפתרונות הידועים.

המשפט ניתן להכללה ללא קושי עבור כל פירוק של \(n\) לגורמים זרים זה לזה; ולכן הדבר המתבקש ביותר הוא להסתכל על הפירוק ה"מקסימלי" של \(n\), לכמה שיותר גורמים – דהיינו, פירוק לראשוניים. \(n=p_{1}^{k_{1}}\dots p_{t}^{k_{t}}\). מהפירוק הזה עולה שמספיק לבדוק האם המשוואה פתירה מודולו \(p_{i}^{k_{i}}\) לכל \(1\le i\le t\) כדי לגלות אם היא פתירה מודולו \(n\). אי אפשר לפרק גם את \(p_{i}^{k_{i}}\) למכפלות קטנות יותר של \(p_{i}\), שכן אז נקבל מספרים שאינם זרים זה לזה (\(p\) ו-\(p^{2}\) הם בעלי מחלק משותף גדול מ-1: \(p\)).

אם כן, הדיון שלנו הצטצמם כעת לבחינת משוואות מודלו \(p^{n}\) כאשר \(p\) ראשוני ו-\(n\) טבעי כלשהו. האינטואיציה הראשונה היא לעסוק במשוואה מודולו \(p\), ולראות האם בהינתן פתרון מודולו \(p\) ניתן לבנות ממנו פתרון גם עבור מודולו \(p^{2}\), וממנו פתרון עבור \(p^{3}\) וכן הלאה. הסיבה לכך שעבודה מודולו \(p\) היא קורצת כל כך היא שלאוסף המספרים מודולו \(p\), \(\mathbb{Z}_{p}\), יש מבנה מוצלח במיוחד: הם מהווים שדה – סגורים לכל ארבע פעולות החשבון. עבור חזקות של ראשוניים זה כבר לא עובד כך (אלו מכם שלמדו על שדות סופיים ודאי זוכרים שכל שדה סופי מכיל \(p^{n}\) איברים, עבור \(p\) ראשוני ו-\(n\) טבעי, אבל חשוב להבין ש-\(\mathbb{F}_{p^{n}}\) שונה במבנהו מהקבוצה \(\mathbb{Z}_{p^{n}}\); בתור התחלה, ב-\(\mathbb{Z}_{p^{n}}\) ישנם איברים שונים מאפס שמכפלתם נותנת 0, למשל \(p\) ו-\(p^{n-1}\); ב-\(\mathbb{F}_{p^{n}}\) אין דבר כזה).

ובכן, זו התחלה טובה, והיא תיתן לנו אינטואיציה לגבי המשך הדרך – ובסופה של הדרך נגיע לשדה אחר של מספרים, שמכיל בתוכו את המספרים הרציונליים, והאיברים ה"שלמים" בו הם מעין הכללה של המספרים השלמים הרגילים, ואשר מקיים את התכונה שאם משוואה היא פתירה בו בשלמים (ה"שלמים" של אותו שדה, לא השלמים הרגילים) אז אותה משוואה פתירה בשלמים "רגילים" מודולו \(p^{n}\), לכל \(n\). כלומר, אברי השדה הזו מקודדים איכשהו מידע על כל מה שקורה ב-\(\mathbb{Z}_{p^{n}}\), לכל \(n\). לשדה בעל התכונה המעניינת הזו קוראים שדה המספרים ה-p-אדיים (כפי שהשם מרמז, קיים כזה לכל \(p\) ראשוני), ואותו אציג בפוסט הבא.