מספרים p-אדיים - בניה "אנליטית"

בפוסט הקודם הצגתי דרך "אלגברית" לבניית שדה המספרים ה-p-אדיים. הפעם אני רוצה להציג דרך שונה לחלוטין שמביאה בדיוק לאותה תוצאה, ונתחיל במוטיבציה - בניית המספרים הממשיים מתוך המספרים הרציונליים. יש שתי בניות מפורסמות לממשיים: האחת, של דדקינד, מסתמכת על כך שקיים ברציונליים יחס סדר, כלומר אפשר לדבר על \(a<b\). דדקינד משתמש במושג הסדר כדי ליצור אובייקטים חדשים - "חתכים", כך שכל מספר ממשי מיוצג על ידי קבוצת כל המספרים הרציונליים שקטנים ממנו או שווים לו. זוהי בנייה יפה עם הכללות יפות ואני ממש לא רוצה לדבר עליה הפעם.

הבניה השניה היא של קנטור. קנטור מסתמך על כך שקיים ברציונליים מושג של מרחק. המרחק בין \(a,b\) מוגדר בתור \(d\left(a,b\right)=\left|a-b\right|\), ומרגע שיש לנו פונקצית מרחק שכזו אפשר להגדיר באמצעותה את המושג של סדרת קושי - סדרה שהמרחק בין איבריה הולך וקטן לאפס, ובניסוח מתמטי פורמלי, לכל \(\varepsilon>0\) קיים מקום בסדרה, \(N\), כך שלכל \(n,m>N\) מתקיים \(d\left(a_{n},a_{m}\right)<\varepsilon\). האינטואיציה שמאחורי ההגדרה היא שכל סדרה מתכנסת (שאבריה מתקרבים עוד ועוד עד לנקודה אחת מובחנת, ה"גבול" של הסדרה) מהווה סדרת קושי; ולכן אם ההפך אינו נכון וקיימות סדרות קושי שאינן מתכנסות, טבעי לנסות ו"להשלים" את המרחב שלנו על ידי זיהוי הנקודות שבו עם אוסף סדרות הקושי שמתכנסות אליהן.

כל זה נשמע מבלבל מאוד, עד שמגיעים לשורה התחתונה. איך מיוצג המספר 1? באמצעות הסדרה \(\left(1,1,1,\dots\right)\) (מדוע זו סדרת קושי?) ובאופן דומה מיוצג כל מספר רציונלי. ואיך מיוצג מספר אי רציונלי כמו \(\sqrt{2}\) באמצעות סדרת מספרים רציונליים? ובכן, כבר הראיתי דוגמה בפוסט הקודם: למשל, הסדרה \(\left(1,1.4,1.41,\dots\right)\). כלומר, סדרה שבה כל איבר מקרב את \(\sqrt{2}\) ברמת דיוק של ספרה אחת יותר מהקודמת. הראיתי בפוסט הקודם שבסדרה הזו מתקיים \(d\left(a_{n},a_{n+1}\right)\le\frac{1}{10^{n}}\) ובעזרת קריטריון זה לא קשה להראות שמדובר בסדרת קושי.

וכעת עולה השאלה - האם ההרחבה הזו של הרציונליים היא ההרחבה האפשרית היחידה שמשתמשת בתעלול עם סדרות הקושי? התשובה נעוצה בשאלה האם ניתן להגדיר "מרחק" בצורה אחרת - ולכן, כמובן, בשאלה מהו "מרחק" בהקשר של הרציונליים. במתמטיקה קיים מושג כללי של "מרחק" שמכליל את המרחק הרגיל המוכר לנו; לפונקצית מרחק "כללית" שכזו קוראים מטריקה. פונקציה \(d:X\times X\to\mathbb{R}\) היא מטריקה אם היא מקיימת את שלוש התכונות הבאות:

\(d\left(x,y\right)\ge0\) ו-\(d\left(x,y\right)=0\) אם ורק אם \(x=y\). כלומר: מרחק בין שתי נקודות הוא תמיד חיובי ממש אלא במקרה שבו שתי הנקודות זהות ואז המרחק ביניהן הוא תמיד 0.
\(d\left(x,y\right)=d\left(y,x\right)\), כלומר המרחק הוא סימטרי - המרחק מ-\(x\) ל-\(y\) הוא כמו המרחק מ-\(y\) ל-\(x\) (ולכן הכי פשוט לדבר על המרחק בין \(x\) ו-\(y\)).
אי שוויון המשולש: \(d\left(x,y\right)\le d\left(x,z\right)+d\left(z,y\right)\) לכל \(x,y,z\in X\). במילים: המרחק בין \(x\) ל-\(y\) הוא הקצר ביותר האפשרי; אם ננסה ללכת ב"דרך עקיפה", דרך איזו נקודת ביניים \(z\), סכום המרחקים שנלך יהיה גדול יותר.

הפאנץ' כאן הוא שכל פונקציה שמקיימת את התכונות הללו נקראת "מרחק", למרות שיש פונקציות מאוד מוזרות שממש לא מתנהגות כמו המרחק הרגיל שאנחנו מכירים. דוגמה לפונקציה שכזו היא פונקציה שנותנת 1 לכל \(x,y\) שונים זה מזה ו-0 ל-\(x=y\) - "המטריקה הדיסקרטית". קל לראות ששלוש התכונות שדרשנו מתקיימות עבורה, אבל מה ההגיון כאן? הפונקציה אומרת שהמרחק בין כל שתי נקודות ב"עולם" שלנו הוא 1; אם ה"עולם" שלנו הוא המספרים הרציונליים, הרי שפונקצית מרחק כזו מנותקת לחלוטין מהתפיסות המקובלות שלנו.

לכן אני הולך להשית עוד מגבלה על פונקצית ה"מרחק" שאדבר עליה - אדרוש שהיא תנבע ממושג כלשהו של "אורך", או במתמטית: נורמה. מה שאני הולך לתאר כאן הוא נורמה של שדות - כלומר, של קבוצות שבהן יש פעולת חיבור וכפל של איברים במרחב (ההקשר הנפוץ יותר הוא של מרחבים וקטוריים, אבל ההבדל אינו גדול עד כדי כך מבחינה רעיונית). במקום לקשקש יותר מדי פשוט אגש להגדרה: אם \(x\in\mathbb{F}\) הוא איבר בשדה מסמנים את הנורמה שלו (שהיא מספר ממשי) ב-\(\|x\|\) ודורשים שהיא תקיים תכונות שדי מזכירות את אלו של המטריקה:

\(\|x\|\ge0\) ו-\(\|x\|=0\) אם ורק אם \(x=0\).
\(\|x+y\|\le\|x\|+\|y\|\)
\(\|xy\|=\|x\|\cdot\|y\|\)

תכונת הסימטריה של המרחק נעלמה לה כי נורמה מוגדרת רק עבור איבר בודד, אבל שתי התכונות האחרות נשתמרו באופן מסויים. התכונה השלישית מתארת את התנהגות הנורמה ביחס לפעולת הכפל - הנורמה של מכפלת איברים היא מכפלת הנורמות שלהן. הקשר למטריקות אינו מקרי: אם יש לנו נורמה, אז קל לבדוק שהפונקציה \(d\left(x,y\right)=\|x-y\|\) היא מטריקה. מה שחשוב לשים לב אליו הוא שלא כל מטריקה אפשר לקבל כך! יש מטריקות שלא ניתן לקבל באמצעות נורמות. את המטריקה הדיסקרטית ה"מטופשת" שתיארתי למעלה דווקא כן ניתן לקבל באמצעות נורמות - נגדיר \(\|0\|=0\)ו-\(\|x\|=1\) לכל \(x\ne0\). לנורמה הזו קוראים "הנורמה הטריוויאלית".

חזרה לרציונליים. אנחנו מכירים נורמה אחת עבור הרציונליים - הערך המוחלט, כלומר \(\|x\|=\left|x\right|\). האם אנחנו מכירים עוד נורמות? ובכן, למשל \(\|x\|=\sqrt{\left|x\right|}=\left|x\right|^{\frac{1}{2}}\) גם כן עובדת - נסו להוכיח זאת לעצמכם. למעשה, \(\|x\|=\left|x\right|^{\alpha}\) עבור כל \(1\ge\alpha>0\) ממשי. ויש לנו עוד קבוצה מעניינת במיוחד של נורמות שהן - אולי כבר ניחשתם - הנורמות ה-p-אדיות. אבל אני עדיין לא רוצה להציג אותן אלא לשמור אותן בסוד עד לשלב שבו הן יצוצו באופן טבעי. דווקא דברים שנראים "טבעיים" יחסית כמו \(\|x\|=\left|x\right|^{2}\) לא עובדים: \(\|1+1\|=\left|1+1\right|^{2}=4>\left|1\right|^{2}+\left|1\right|^{2}=\|1\|+\|1\|\) מראה שאי שוויון המשולש לא מתקיים עבור "נורמה" כזו.

בואו נביט שניה על שתי הנורמות \(\|x\|_{1}=\left|x\right|\) ו-\(\|x\|_{2}=\left|x\right|^{\frac{1}{2}}\). ברור שהן נותנות מושג שונה של "גודל", אבל האם הן משפיעות על מה שהיה המושג הבסיסי בדיון שלנו - סדרות קושי? כלומר, האם קיימת סדרה שנחשבת לסדרת קושי על פי הנורמה הראשונה אבל לא על פי השניה? אם שתי הנורמות מגדירות בדיוק את אותן סדרות קושי, נאמר שהן שקולות. זו לא סתם הגדרה שרירותית - אם שתי הנורמות מגדירות את אותן סדרות קושי אז כשנבצע השלמה למרחב ונוסיף לו את כל הגבולות של סדרות הקושי הלא מתכנסות שבו, נקבל בדיוק את אותה התוצאה. על פי ההגדרה הזו, די קל לראות ש-\(\|\|_{1}\) ו-\(\|\|_{2}\) הן שקולות. למי שלא מפחד מאינפי, הנה הוכחה:

ניקח סדרת קושי \(a_{1},a_{2},a_{3},\dots\) על פי הנורמה \(\|\|_{1}\); כדי להראות שהיא קושי על פי הנורמה \(\|\|_{2}\) צריך, בהינתן \(\varepsilon>0\) כלשהו, למצוא מקום בסדרה שהחל ממנו אברי הסדרה קרובים עד כדי \(\varepsilon\) על פי הנורמה \(\|\|_{2}\). לשם כך ראשית נמצא מקום \(N\) בסדרה שהחל ממנו אברי הסדרה קרובים עד כדי \(\varepsilon^{2}\) על פי \(\|\|_{1}\); כלומר, לכל \(n,m>N\) מתקיים \(\|x_{n}-x_{m}\|_{1}<\varepsilon^{2}\). כעת נוציא שורש לשני האגפים ונקבל \(\|x_{n}-x_{m}\|_{1}^{\frac{1}{2}}<\varepsilon\), כלומר \(\left|x_{n}-x_{m}\right|^{\frac{1}{2}}<\varepsilon\), כלומר \(\|x_{n}-x_{m}\|_{2}<\varepsilon\). באופן דומה מטפלים גם בכיוון השני (להראות שסדרה שהיא קושי על פי \(\|\|_{2}\) היא קושי גם על פי \(\|\|_{1}\)).

את ההוכחה הזו ניתן לבצע באותו האופן לכל \(1\ge\alpha>0\), ובכך לראות שכל הנורמות מהצורה \(\|x\|=\left|x\right|^{\alpha}\) שקולות זו לזו - וכשמשלימים את הרציונליים על פיהן, מקבלים את הממשיים. מי נותר?

ובכן, מתברר שהתנהגות הנורמות על הרציונליים נקבעות בצורה חזקה מאוד על פי ערכן על המספרים הטבעיים. עד כדי כך שניתן להוכיח כי אם קיים טבעי \(n\) כך ש-\(\|n\|>1\), אז הנורמה היא בהכרח מהצורה \(\|x\|=\left|x\right|^{\alpha}\). ההוכחה מעט טכנית ולא אכנס אליה, אך היא אינה מסובכת במיוחד. אם כן, הנורמות שנותרו הן אלו שלכל טבעי נותנות ערך לכל היותר 1. זו כבר התנהגות מוזרה - הרי אינטואיטיבית היינו מצפים שככל שהמספר הטבעי יגדל כך גם הנורמה שלו תגדל; אך זה לא נובע מהדרישות שהצבנו לנורמה.

אם כן, הבה וניקח נורמה כלשהי שמקיימת \(\|n\|\le1\) לכל \(n\) ונבין איך היא מתנהגת. אם היא איננה הנורמה הטריוויאלית שנותנת 1 לכל טבעי, אז קיים \(n_{0}\) קטן ביותר עבורו \(\|n_{0}\|<1\), ואותו \(n_{0}\) חייב להיות ראשוני; כי אחרת קיימים שני טבעיים \(a,b<n_{0}\) (ומכיוון שהם קטנים יותר מ-\(n_{0}\) הנורמה שלהם היא 1, כי \(n_{0}\) המינימלי שעבורו זה לא כך) כך ש-\(1=\|a\|\cdot\|b\|=\|ab\|=\|n_{0}\|<1\) - סתירה. שימו לב שכאן השתמשנו בכפליות הנורמה - כלומר, עבור פונקצית מרחק "סתם" ההוכחה נשברת כבר בשלב זה. מכיוון ש-\(n_{0}\) הוא ראשוני, אסמן אותו מעתה בתור \(p\).

השלב הבא הוא להבין איך הנורמה מתנהגת על כל המספרים הטבעיים. הדרך לחקור את כל הטבעיים עוברת לעתים קרובות דרך כל הראשוניים, וכאן נעשה אותו הדבר: ניקח ראשוני \(q\ne p\) ונשאל את עצמנו מהי \(\|q\|\). היעד שלי הוא להראות ש-\(\|q\|=1\), והדרך לכך עוברת בשילוב חביב של אנליזה ותורת המספרים. ראשית, משפט בסיסי בתורת המספרים אומר שאם \(x,y\) שני מספרים שלמים הזרים זה לזה (אין להם מחלק משותף הגדול מ-1) אז קיימים שני מספרים שלמים \(a,b\) כך ש-\(ax+by=1\) (באופן כללי יותר - תמיד ניתן לכתוב את המחלק המשותף המקסימלי של שני מספרים כצירוף לינארי בשלמים שלהם). כעת נשתמש בתעלול אנליטי סטנדרטי. נניח ש-\(\|q\|<1\), אז קיים \(n\) שעבורו \(\|p\|^{n}<\frac{1}{2}\) וגם \(\|q\|^{n}<\frac{1}{2}\) (כי אם \(0<t<1\) אז ככל שמעלים אותו בחזקה גבוהה יותר כך הוא מתקרב יותר ויותר לאפס). עכשיו נשלב את שני אלו לקבלת סתירה:

\(1 = \|1\|=\|ap^{n}+bq^{n}\|\le\|a\|\cdot\|p\|^{n}+\|b\|\cdot\|q\|^{n}<\frac{1}{2}+\frac{1}{2}=1\)

כאן השתמשנו גם בכפליות הנורמה וגם באי שוויון המשולש, וכמובן גם בכך ש-\(p^{n},q^{n}\) זרים (כי הם חזקות של ראשוניים שונים - אם במקום \(q\) היינו לוקחים מספר טבעי "כלשהו" זה לא היה עובד).

מסקנה: \(\|q\|=1\) לכל ראשוני שונה מ-\(p\). מכאן אנחנו מסוגלים להסיק את הערך של הנורמה על כל מספר טבעי \(a\): נכתוב את \(a\) בתור \(a=p^{k}\cdot\prod q_{i}^{k_{i}}\) (\(k\) יכול להיות גם אפס), ואז מכפליות הנורמה נקבל \(\|a\|=\|p\|^{k}\cdot\prod\|q_{i}\|^{k_{i}}=\|p\|^{k}\). בואו נסמן את \(\|p\|\) בתור \(\rho\) ונשתמש בסימון המוזר \(k=\text{ord}_{p}\left(a\right)\) כדי לסמן את החזקה הגבוהה ביותר של \(p\) שמחלקת את \(a\); אז קיבלנו ש-\(\|a\|=\rho^{\text{ord}_{p}\left(a\right)}\). מכאן ההכללה עבור מספרים רציונליים היא קלה: מתכונת הכפליות של הנורמה עולה שבהכרח \(\|\frac{1}{b}\|=\frac{1}{\|b\|}\), ולכן \(\|\frac{a}{b}\|=\frac{\|a\|}{\|b\|}=\frac{\rho^{\text{ord}_{p}\left(a\right)}}{\rho^{\text{ord}_{p}\left(b\right)}}=\rho^{\text{ord}_{p}\left(a\right)-\text{ord}_{p}\left(b\right)}\) (שימו לב שעבור מספרים רציונליים הנורמה עשויה לתת ערכים גדולים מ-1).

ובכן, זוהי הנורמה ה-p-אדית המדוברת. מכיוון ש-\(\rho<1\), היא בעלת התכונה שככל ש-\(a\) מתחלק על ידי חזקה גדולה יותר של \(p\), כך הנורמה שלו קטנה יותר. כדי להבין עד כמה זה מוזר, שימו לב ש-\(\|n!\|\to0\) על פי הגדרת הנורמה הזו. למעשה, עוד לא סיימתי כי לא ברור מיהו \(\rho\), אלא שזה לא משנה: אפשר להראות שעבור כל שני ערכי \(0<\rho_{1},\rho_{2}<1\) הנורמה שנקבל על ידי ההגדרה שלעיל תהיה זהה - הדבר היחיד שמשנה הוא \(p\). לכן כשמגדירים את הנורמה באופן מסודר נוהגים לבחור \(\rho=\frac{1}{p}\) (זו אינה בחירה שרירותית לגמרי - יש בה הגיון "אסתטי" כלשהו שאציג בפוסט הבא).

לסיכום: מה שהראיתי (שמכונה "משפט אוסטרובסקי") הוא שמעל \(\mathbb{Q}\) קיימות, עד כדי שקילות, רק נורמת הערך המוחלט, הנורמה הטריוויאלית והנורמה ה-p-אדית לכל ראשוני \(p\). מכאן שההשלמות האפשריות השונות של \(\mathbb{Q}\) (עבור מטריקות שמושרות מנורמות) הן רק הממשיים (על ידי הערך המוחלט), ההשלמה הטריוויאלית והלא מעניינת שנותנת הנורמה הטריוויאלית, וההשלמות ה-p-אדיות, \(\mathbb{Q}_{p}\), שהם בדיוק - אבל בדיוק - השדות שתיארתי בפוסט הקודם. בפוסט הבא אציג כמה תכונות משעשעות של הנורמה ה-p-אדית שהופכות את האנליזה במספרים p-אדיים למעניינת.