עכשיו אפשר באמת להרחיב על הרחבת שדות

בפוסט קודם התחלתי לדבר על המושג המתמטי של שדה הרחבה. חיש קל נתקעתי, שכן קשה לדבר על הנושא בלי לגלוש לקצת אלגברה לינארית, ולכן הפוסט הקודם שלי עסק במושג המימד באלגברה הלינארית - ועל הדרך, גם במושג המרחב הוקטורי. כעת אניח שלקוראים של הפוסט הנוכחי יש את הידע הבסיסי הזה - ולכן הוא עשוי להיות טכני וקשה יחסית למי שאין לו את הידע הזה. לכן אל הפואנטה עצמה - העובדה שאי אפשר לרבע את המעגל וכו' בעזרת סרגל ומחוגה - אגיע רק בפוסט הבא, שינסה שוב להיות לא-טכני במידת האפשרי.

קדימה, לעבודה. אני כבר יכול לדבר במילים גסות, ולכן יכול לומר שאם E הוא הרחבה של F (כזכור, זה מסומן בתור E/F) אז אפשר לראות את E כמרחב וקטורי מעל F, כש”כפל בסקלר מ-F” הוא פשוט פעולת הכפל הרגילה ב-E (כי הרי כל איבר של F הוא גם איבר של E). בדיקה טכנית לא מעניינת מראה שאכן כל האקסיומות של מרחב וקטורי מתקיימות. אם יש לנו מרחב וקטורי E מעל שדה F אפשר לדבר על המימד שלו; אם כן, לכל הרחבה E/F אפשר להתאים גם מימד, שהוא בעצם המימד של E כמרחב וקטורי מעל F. מסמנים את המימד של ההרחבה E/F באופן הבא: \( [E:F] \).

אחד מהמשפטים הראשונים שניתן להוכיח על מימדים של הרחבות עוסק במקרה שבו אנו לוקחים הרחבה קיימת, ומרחיבים גם אותה. כלומר, אם יש לנו הרחבה E/F, ואז אנחנו לוקחים הרחבה של E, שנסמנה K/E, מה קיבלנו? ההרחבה K של E היא בסך הכל שדה שמכיל את E כתת-שדה; אבל E מכיל את F כתת שדה, ולכן K מכיל את F כתת שדה. יוצא מכך שניתן לדבר גם על ההרחבה K/F במנותק מ”שדה הביניים” E שבאמצע. ובכל זאת, אם מכניסים את E למשחק, האם זה יכול לשפוך אור כלשהו על ההרחבה K/F? התשובה חיובית ונתונה במשפט המקסים הבא: \( [K:F]=[K:E][E:F] \). במילים - מימד ההרחבה K/F שווה למכפלת המימדים של ההרחבה K/E וההרחבה E/F.

לא אכנס כאן להוכחה של המשפט - היא טכנית לגמרי, ומבוססת על הדגמה של בסיס להרחבה K/F שנבנה באמצעות בסיסים של K/E ושל E/F (במקרה שבו אחת מההרחבות היא ממימד אינסופי, המשפט נובע עוד יותר בקלות). מה שחשוב במשפט הוא שבעזרת קשר אריתמטי פשוט הוא מסוגל לספק לנו מידע מאוד מעניין ולא טריוויאלי - למשל, אם יש לנו הרחבה K/F ממימד 13, אנחנו יודעים מיידית שאין אף “שדה ביניים” E בין F ובין K, כי אחרת אפשר היה לפרק את 13 לשני גורמים לא טריוויאליים (הדרגות של K/E ושל E/F; אם K/E הוא 1 אז באופן מיידי נובע מכך ש-K=E ולכן E אינו שדה ביניים אמיתי, וכנל אם E/F הוא 1). המפתח לבעיות הסרגל והמחוגה יהיה אבחנה דומה לזו, אם כי מחוכמת מעט יותר.

כעת אפשר לחזור לדון בהרחבות שמתקבלות על ידי הוספת איבר לשדה F ו”סגירת” השדה סביבו לקבלת השדה E. נסמן את האיבר ב-\( \theta \). את ההרחבה הזו נהוג לסמן כ-\( E=F(\theta) \). מתברר שמימד ההרחבה הזו קשור בקשר אמיץ לשאלה האם \( \theta \) אלגברי או טרנסצנדנטי מעל F, כלומר האם יש פולינום עם מקדמים ב-F שמאפס אותו לו לאו.

הבה ונתבונן על קבוצת האיברים הבאה: \( 1,\theta,\theta^2,\theta^3\dots\theta^n \). אלו איברים של השדה E ולכן ניתן לשאול את השאלה האם הם תלויים לינארית - כלומר, אם קיים צירוף לינארי לא טריוויאלי שמקדמיו ב-F שנותן אפס. במילים אחרות, האם יש מקדמים \( \lambda_0,\dots,\lambda_n \) שעבורם מתקיים:

\( \lambda_0\cdot 1+\lambda_1\theta+\dots+\lambda_n\theta^n=0 \)

נניח לרגע שאכן יש כאלו. מה נובע מכך? שקיים פולינום לא טריוויאלי מעל F שמאפס את \( \theta \), הפולינום הבא:

\( \lambda_nx^n+\dots+\lambda_1x+\lambda_0 \)

או, במילים אחרות, ש- \( \theta \) הוא אלגברי מעל F. מכאן ואילך אדבר רק על איברים אלגבריים שכאלו; להרחבות של שדות על ידי איברים לא אלגבריים צריך להקדיש דיון נפרד (בפרט, “סגירת” השדה במקרה שלהם מצריכה יותר מאשר סתם לקיחת כל הצירופים הלינאריים מעל F של חזקות של \( \theta \), אלא גם לקיחת מנות של צירופים שכאלו - וזה מסובך יותר ואין טעם להיכנס לזה).

ניקח כעת את הפולינום בעל הדרגה המינימלית שמאפס את \( \theta \). יש הרבה כאלו, ולכן בוחרים בזה שעבורו המקדם של החזקה הגבוהה ביותר הוא 1 (פולינום בעל התכונה הזו נקרא “פולינום מתוקן”). נניח שהדרגה שלו היא \( n \); נראה כעת כי נובע מכך שמימד ההרחבה \( [F(\theta):F] \) הוא בעצמו \( n \).

מצד אחד, אם הדרגה המינימלית של פולינום שמאפס את \( \theta \) היא \( n \), אז אם ניקח את האיברים \( 1,\theta,\dots,\theta^{n-1} \) נקבל קבוצה בלתי תלויה לינארית (כי אם היא הייתה תלויה לינארית אז הצירוף הלינארי שלה שנותן 0 היה מניב פולינום שמאפס את \( \theta \) ודרגתו \( n-1 \), בסתירה למינימליות). לכן המימד של המרחב הוא לפחות \( n \). כדי להראות שהמימד של המרחב הוא בדיוק \( n \) צריך להראות גם שהאיברים \( 1,\theta,\dots,\theta^{n-1} \) פורשים אותו, כלומר שכל איבר במרחב ניתן להצגה כצירוף לינארי שלהם - זה יראה שהקבוצה הזו היא בסיס, ויסיים את ההוכחה. הצורה שבה אראה זאת תהיה ישירה למדי; יש צורה יותר כללית וחכמה לעשות זאת שגם נותנת הבנה יותר טובה של “מה הולך כאן” אבל גולשת לחומר שאיני רוצה לדבר עליו כעת (חוגי מנה).

בתור התחלה אני רוצה להראות שכל איבר \( \theta^k \) ניתן להצגה כצירוף לינארי של האיברים הנ”ל. נביט רגע בפולינום המינימלי של \( \theta \) - כשמציבים בו את \( \theta \) מקבלים את המשוואה

\( \theta^n+\lambda_{n-1}\theta^{n-1}+\dots+\lambda_1\theta+\lambda_0=0 \)

ולאחר העברת אגפים נובע ממנה:

\( \theta^n=-\lambda_{n-1}\theta^{n-1}-\dots-\lambda_1\theta-\lambda_0 \)

כלומר, את \( \theta^n \) אפשר להציג כצירוף לינארי של הבסיס המיועד שלנו; אבל זה אומר שאפשר להציג כל צירוף לינארי של חזקות חיוביות כלשהן של \( \theta \) בתור צירוף לינארי של איברי הבסיס - פשוט בכל פעם שבה נתקלים ב-\( \theta^k \) כך ש-\( k\ge n \), מחליפים אותו ב-\( \theta^{k-n} \) כפול הצירוף הלינארי הנ”ל. לא קשה להראות שכל החלפה שכזו מורידה את החזק המקסימלית של האיבר שמקבלים ב-1 לפחות, ולכן אפשר להמשיך בה עד שהחזקה המקסימלית יורדת אל מתחת ל-\( n \).

זה עדיין לא מסיים את ההוכחה. אמנם הראיתי שכל ביטוי שהוא פולינום ב-\( \theta \) ניתן לכתיבה כצירוף לינארי של הבסיס, אבל אולי חייבים להיות בשדה \( F(\theta) \) גם ביטויים שאינם פולינומים ב-\( \theta \)? הרי שדה צריך להיות סגור גם להופכי, כלומר לכל איבר בו ששונה מאפס, צריך להיות גם איבר אחר כך שמכפלתם היא 1. למעשה, זהו בדיוק הקושי בשדות הרחבה של איברים טרנסנדנטיים. אם כן, מה שאני צריך להראות הוא שלכל פולינום ב-\( \theta \) שאינו 0 קיים פולינום אחר ב-\( \theta \) כך שמכפלתם היא 1. ההוכחה של הטענה הזו איננה מיידית כלל וכלל; היא מתבססת על כך שהפולינום המינימלי של \( \theta \) חייב להיות אי פריק (וכאן צריך להסביר מה זה “אי פריק” ואיך מוכיחים זאת), ושאי הפריקות של הפולינום גוררת את תכונת ההפיכות המדוברת. הוכחה ישירה לטענות הללו תהיה לדעתי טיפשית מאוד, כי היא טכנית ולא מעניינת, וניתן להפיק אותה בצורה הרבה יותר אלגנטית בעזרת סדרה של טענות כלליות יותר מתורת החוגים; ולכן אתחמק מההוכחה לגמרי.

אם כן, נסכם: אפשר להראות שכל איבר בשדה ההרחבה \( F(\theta) \) שממדו הוא \( n \) הוא מהצורה \( \lambda_{n-1}\theta^{n-1}+\dots+\lambda_1\theta+\lambda_0 \) - צירוף לינארי של כל החזקות הקטנות מ-\( n \) של \( \theta \). בפרט, ממד השדה הוא כדרגת הפולינום המינימלי שמאפס את \( \theta \). זהו קשר נאה מאוד, שיתגלה עוד מעט כמועיל למדי.

עוד טענה מעניינת וחשובה היא ששדה הרחבה ממימד סופי E/F הוא תמיד אלגברי, כלומר כל איבר בו הוא אלגברי מעל F (אפילו אם השדה לא נוצר רק על ידי הוספת איבר בודד). ההוכחה פשוטה להפתיע - נניח שמימד ההרחבה הוא \( n \). ניקח איבר כלשהו \( \alpha \) בשדה. נביט בחזקות \( 1,\alpha,\alpha^2,\dots,\alpha^n \). אלו \( n+1 \) איברים במרחב וקטורי ממימד \( n \) ולכן הם תלויים לינארית; הצירוף הלינארי שלהם שנותן 0 הוא פולינום מעל F שמאפס את \( \alpha \). המסקנה: אם הרחבה E/F מכילה איבר טרנסנדנטי, מימד ההרחבה חייב להיות אינסוף.

וכעת נחזור לבניות בסרגל ומחוגה. כזכור, הבניות עובדות בערך כך - מתחילים מ-1. כעת מותר לבצע את ארבע פעולות החשבון, ואת הפעולה של הוצאת שורש למספר חיובי, כדי להרחיב את אוסף המספרים שלנו. הסגירות לארבע פעולות החשבון פירושה שבכל רגע נתון, קבוצת המספרים שלנו צריכה להוות שדה, ואנחנו מתחילים מהרציונליים (שהם, כזכור, השדה הקטן ביותר ממציין 0). פעולת הוצאת השורש פירושה הרחבה של השדה על ידי הוספת \( \theta \) מסויים, שמתאפס על ידי הפולינום \( x^2-a=0 \) עבור \( a\in F \) כלשהו. כלומר, הרחבנו את השדה על ידי הוספת איבר שהפולינום המינימלי שלו הוא מדרגה 2 (לא ייתכן שהפולינום המינימלי יהיה מדרגה 1, כי אז ינבע מכך שהאיבר כבר כך היה שייך לשדה), ולכן מימד ההרחבה \( [F(\theta):F] \) יהיה 2. אחרי שהרחבנו פעם אחת אפשר להרחיב שוב, ושוב, ושוב - ובכל פעם המימד שלנו יקפוץ פי 2.

הבה נראה דוגמה. התחלנו כאמור מ-\( F=\mathbb{Q} \). נניח שאנחנו מוסיפים את השורשים של 2, 3 ו-5, בהתאמה (שימו לב שאחרי שהוספנו את השורשים של 2 ו-3 קיבלנו “חינם” עוד שורשים - למשל, השורש של 6; שימו לב גם שאפשר להוסיף דברים יותר מחוכמים, למשל אחרי שהוספתי את השורשים של 2 ו-3 אפשר להוסיף גם את השורש של שורש 2 ועוד שורש 3 - הטיעון שלי תקף גם למקרים הללו). את התוצאה המתקבלת מסמנים ב-\( \mathbb{Q}(\sqrt{2},\sqrt{3},\sqrt{5}) \). מה מימד ההרחבה הזו? בודקים זאת על ידי פירוק ההרחבה לתת-הרחבות (למשל, על פי סדר הבניה) ושימוש במשפט המכפלה שהראיתי קודם:

\( \left[\mathbb{Q}\left(\sqrt{2},\sqrt{3},\sqrt{5}\right):\mathbb{Q}\right]=\left[\mathbb{Q}\left(\sqrt{2},\sqrt{3},\sqrt{5}\right):\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)\right]\cdot\left[\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right):\mathbb{Q}\left(\sqrt{2}\right)\right]\cdot\left[\mathbb{Q}\left(\sqrt{2}\right):\mathbb{Q}\right]=2\cdot2\cdot2=2^{3} \)

שימו לב שהשתמשתי כאן במשפט המכפלה פעמיים, וכך פירקתי את מימד ההרחבה למכפלה של מימדי שלוש הרחבות שונות, שכל אחת התקבלה על ידי הוספת שורש חדש לשדה שלנו. אפשר לעשות את אותו הדבר באופן כללי, כל בכל פעם השדה שאנחנו בונים התקבל ממספר סופי של הוצאות שורש; והמסקנה היא שהמימד של כל הרחבה שכזו הוא תמיד חזקה של 2.

כעת לפואנטה. ניקח מספר ממשי כלשהו, \( \alpha \). אז אפשר להסתכל על ההרחבה \( \mathbb{Q}(\alpha) \) ולשאול מה המימד שלה מעל \( \mathbb{Q} \). אם \( \alpha \) ניתן לבנייה, אז קיים איזה שהוא שדה הרחבה E של הרציונליים ש-\( \alpha \) שייך אליו, והתקבל באמצעות שרשרת של הוצאות שורשים. כלומר, \( [E:\mathbb{Q}]=2^k \) עבור איזה שהוא \( k \). מכאן שעל פי משפט המכפלה, \( [E:\mathbb{Q}(\alpha)][\mathbb{Q}(\alpha):\mathbb{Q}]=2^k \). מכיוון שאם מכפלת שני מספרים היא חזקה של 2, כל אחד מהמספרים בנפרד הוא חזקה של 2 (מדוע?) אנו מסיקים ש-\( [\mathbb{Q}(\alpha):\mathbb{Q}] \) הוא חזקה של 2. זוהי אבחנת המפתח כאן, ומה שפותר בעיות שהיו פתוחות במשך 2,000 שנים.

איך? בפוסט הבא.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: