אז מתי אפשר לבנות מצולע משוכלל עם סרגל ומחוגה, ומה הקשר למספרי פרמה?

כעת אני מגיע לפואנטה שחתרתי אליה בפוסטים האחרונים שבהם דיברתי על שורשי היחידה – קריטריון שלפיו ניתן לדעת מתי מצולע משוכלל ניתן לבניה באמצעות סרגל ומחוגה (מהי בדיוק בניה בסרגל ומחוגה תיארתי בפוסט עוד יותר מוקדם). בדומה לבעיות של ריבוע העיגול, שילוש הזווית והכפלת הקוביה, כך גם כאן אנו עוברים די בזריזות מהעולם הגאומטרי לעולם אלגברי של הרחבת שדות. במקרה שלנו, בניית מצולע משוכלל עם \(n\) צלעות שקולה לבניית הנקודות שהן קודקודיו של מצולע בעל "רדיוס" מאורך 1 סביב הראשית, וזה שקול לבניית הנקודות שהן שורשי היחידה מסדר \(n\) (שכזכור, אם חושבים עליהם כעל נקודות במישור, הם בדיוק הקודקודים של מצולע משוכלל בעל \(n\) צלעות). לכן השאלה היא מתי ניתן לבנות נקודות שכאלו.

בניית נקודה שקולה לבניית המספרים שהם קוארדינטות ה-\(x\) וה-\(y\) שלה. מספיק לדבר כאן על קוארדינטת ה-\(x\), כי הטיפול ב-\(y\) דומה. קוארדינטת ה-\(x\) של נקודה שאותה אנו מייצגים כמספר מרוכב \(x+iy\) היא בדיוק החלק הממשי שלו, שסימנו בהתאם בתור \(x\). אם כן, הצטמצמנו לשאלה – מהו החלק הממשי של \(\zeta_n\) ומתי ניתן לבנות אותו?

באופן כללי, אם \(z=x+iy\) הוא מספר מרוכב ו-\(\overline{z}=x-iy\) הוא הצמוד שלו, אז החלק הממשי של \(z\) שווה בדיוק ל-\(\frac{z+\overline{z}}{2}\) (זהו חשבון פשוט להיווכח בכך). במקרה של \(\zeta_n\), הצמוד שלו הוא פשוט \(\zeta_n^{-1}\) (הדרך הפשוטה ביותר שאני מכיר כדי לראות זאת היא לכתוב את \(\zeta_n^{-1}\) בתור סכום של קוסינוס וסינוס – כן, כן, ההצגה שלפני רגע קט, בפוסט קודם, הטפתי כנגדה – ולהשתמש בכך ש-\(\cos(-x)=\cos(x)\) ו-\(\sin(-x)=-\sin(x)\)). אם כן, כדי לבנות את המצולע המשוכלל עלינו לבנות את \(\alpha = \frac{\zeta_n+\zeta_n^{-1}}{2}\).

כעת אפשר להכניס את התוצאות שכבר קיבלנו קודם של תורת השדות. כזכור, אמרנו שאם \(\alpha\) ניתן לבניה, אז מימד ההרחבה \(\mathbb{Q}(\alpha)/\mathbb{Q}\) הוא חזקה של 2. לכן כל שנותר לנו לעשות הוא לקבל מושג טוב יותר לגבי מהו מימד ההרחבה הזו. זאת נעשה בעזרת מה שכבר ידוע לנו על ההרחבה הציקלוטומית, כלומר על \(\mathbb{Q}(\zeta_n)/\mathbb{Q}\); כזכור, טענתי בפוסט הקודם (ללא הוכחה) שמימד ההרחבה הזו הוא \(\varphi(n)\).

במבט ראשון, מפתה להגיד ש-\(\mathbb{Q}(\alpha)=\mathbb{Q}(\zeta_n)\), כלומר שהשדה שמתקבל כשמוסיפים לרציונליים את שורש היחידה, והשדה שמתקבל כשמוסיפים לרציונליים את החלק הממשי שלו, זה אותו שדה. עם זאת, קל להיווכח בכך שזה לא נכון – ב-\(\mathbb{Q}(\alpha)\) אין מספרים מרוכבים (אלא רק ממשיים) ואילו ב-\(\mathbb{Q}(\zeta_n)\) דווקא יש (שורש היחידה עצמו). מצד שני, בבירור השדה \(\mathbb{Q}(\zeta_n)\) מכיל את \(\mathbb{Q}(\alpha)\) ולכן הוא הרחבה שלו – אבל מאיזה מימד? התשובה לכך מיידית – שימו לב ש-\(\zeta_n\) הוא שורש של הפולינום \(x^2-2\alpha x+1\) שהוא פולינום ממעלה שניה, ולכן מימד ההרחבה הוא 2. למי שתוהה מאיפה המצאתי את הפולינום הזה לפתע פתאום – זהו פשוט הפולינום ששורשיו הם \(\zeta_n\) ו-\(\overline{\zeta_n}\); באופן כללי פולינומים ממעלה שניה ששני שורשיהם הם מספר מרוכב והצמוד שלו הם ממשיים (למי שבאמת סקרן – זה נובע מנוסחאות וייטה).

בואו ניזכר בטענה כללית וחשובה שראינו: אם \(E\) מרחיב את \(K\) ואילו \(K\) מרחיב את \(F\), אז הקשר בין המימדים של ההרחבות הוא של מכפלה פשוטה: \([E:F]=[E:K][K:F]\). כשמציבים את הפרמטרים שעליהם דיברתי בפסקאות האחרונות במשוואה הזו, מקבלים \(\varphi(n)=2\cdot 2^k\). במילים אחרות, כל הדיון עד כה מסתכם באבחנה הבאה: כדי שניתן יהיה לבנות את המצולע המשוכלל בעזרת סרגל ומחוגה, \(\varphi(n)\) חייב להיות חזקה של 2.

הכיוון ההפוך גם הוא נכון – אם \(\varphi(n)\) הוא חזקה של 2, אז ניתן לבנות את המצולע המשוכלל בעזרת סרגל ומחוגה. זה משהו שטרם ראינו – עד כה כל ההוכחות שראינו היו של חוסר יכולת לעשות משהו, ואז הטיעון המספרי ה"פשוט" הספיק לנו – אם משהו לא יצא חזקה של 2, נגמר הסיפור. הכיוון ההפוך הוא באופן טבעי מורכב יותר – איך מהיות \(\varphi(n)\) חזקה של 2 נובע שניתן לבנות את המצולע?

בשביל להסביר בדיוק מדוע זה נובע, אזדקק לתוצאות מתורת גלואה, שאין סיכוי להיכנס אליהן כעת. רק אגיד בזריזות את הרעיון הכללי – לכל הרחבת שדות ניתן להתאים חבורה ("חבורת גלואה של ההרחבה"), כך שבין ההרחבה ובין החבורה מתקיים הקשר היפהפה הבא: מספר האיברים בחבורה הוא כמימד ההרחבה, ויש התאמה חד חד ערכית ועל בין תת החבורות של חבורת הגלואה ובין "שדות הביניים" של ההרחבה (השדות שניתן לדחוף "באמצע", בין שני השדות שמהווים את ההרחבה), כך שגודל כל תת חבורה שווה למימד הרחבת הביניים שמתאימה לה, ויחסי ההכלות בין תת החבורות מתאימים ליחסי ההכלות בין ההרחבות.

במקרה שלנו, החבורה של ההרחבה המדוברת היא חבורה אבלית שמספר האיברים בה הוא חזקה של 2. בעזרת מה שידוע על המבנה של חבורות אבליות סופיות (וגם זה נושא לדיון נפרד) אפשר להראות "שרשרת" של תת-חבורות בתוך החבורה הזו, כך שמתאימה להם שרשרת של הרחבות, שמתחילה ב-\(\mathbb{Q}\) ומסתיימת ב-\(\mathbb{Q}(\alpha)\), כך שכל איבר בשרשרת מתקבל על ידי הרחבה ריבועית של קודמו – כלומר, בדיוק סוג ההרחבה שניתן לבצע עם סרגל ומחוגה. זהו הרעיון הכללי, אך הפרטים הקטנים כמובן הכרחיים לצורך הבנה של מה שבאמת הולך שם.

אם כן, הגענו לקריטריון שנראה יחסית מספק – \(\varphi(n)\) הוא חזקה של 2. עם זאת, ניתוח של \(\varphi\) מאפשר להגיע לקריטריון עוד יותר פשוט וברור, שמערב מספרים שנראים לחלוטין לא קשורים – מספרי פרמה.

את פייר דה-פרמה אין צורך להכיר, ולו בזכות הפרסום האדיר שלו זכה "המשפט האחרון" שלו. עם זאת, פרט לכתיבת הערות שוליים שרודפות את העולם המתמטי במשך מאות שנים, פרמה עשה עוד דברים רבים, ונחשב בצדק לאחד מאבות תורת המספרים. בין ההשערות הרבות שהעלה הייתה גם זו הקשורה למספרי פרמה שאציג כעת. פרמה ככל הנראה (אין לי מושג מה קרה במדוייק מבחינה היסטורית) חיפש דרך "לייצר" ראשוניים באופן סדרתי בעזרת נוסחה, משאת נפשם של מתמטיקאים רבים. נוסחה "טבעית" למדי שעולה לראש היא \(2^n+1\) – הרי כל ראשוני גדול מ-2 הוא אי זוגי, ולכן כדי לייצר ראשוני צריך להוסיף 1 למספר זוגי; למה לא לעשות זאת למספר זוגי פשוט ככל הניתן, שיש לו רק גורם ראשוני אחד – 2 עצמו?

קל מאוד לראות (איך?) שאם \(n\) הוא אי זוגי, המספר שיתקבל יתחלק ב-3, כך ש-\(n\) חייב להיות זוגי אם רוצים לקבל מספר ראשוני. אם כן, צריך להגביל את \(n\) בצורה מסויימת. כדי לקבל מגבלה קטלנית בהרבה, צריך להתבסס על הזהות הבאה:

\(a^{m}-b^{m}=\left(a-b\right)\left[a^{m-1}+a^{m-2}b+a^{m-3}b^{2}+\dots+ab^{m-2}+b^{m-1}\right]\)

הנוסחה אולי נראית קצת מפחידה, אבל היא בסך הכל מתקבלת מטור טלסקופי פשוט, די בדומה לפיתוח הסכום של סדרה הנדסית שהראיתי בפוסט הקודם. אין צורך להתעמק בנוסחה אלא רק במסקנה שלה – \(a-b\) מחלק את \(a^m-b^m\). כעת, נניח שניתן לכתוב את \(n\) בתור מכפלה \(n=xy\) כך ש-\(x\) הוא אי זוגי. אז אם נציב במשוואה את \(a=2^y,b=-1,m=x\) נקבל כי \(2^y+1\) מחלק את \(2^n+1\), כלומר \(2^n+1\) לא יכול להיות ראשוני (מבחן עירנות – למה בעצם הכרחי ש-\(x\) יהיה אי זוגי?). מכאן שאם יש לנו תקווה כלשהי ש-\(2^n+1\) יהיה ראשוני, חייבים לדרוש של-\(n\) לא יהיה מחלק אי זוגי – כלומר, שהוא יהיה חזקה של 2. כלומר, ראשוני פרמה (כעת כבר אפשר להשתמש בשם הזה) חייב להיות מהצורה \(F_t=2^{2^t}+1\)

פרמה לא התעצל והציב ערכים של \(t\) בנוסחה הזו. הנה מה שהוא קיבל:

\(F_0=2^1+1=2+1=3\)

\(F_1=2^2+1=4+1=5\)

\(F_2=2^4+1=17\)

\(F_3=2^8+1=256+1=257\)

\(F_4=2^{16}+1=65537\)

וכאן נמאס לפרמה. הוא ראה שכל המספרים שקיבל עד כה היו ראשוניים, התלהב, וטען שמכאן ואילך כל שאר המספרים גם כן יהיו ראשוניים. אפשר להבין אותו – המספר הבא בסדרה הוא 42,94,967,297 ולפני שהיו מחשבים, למי היה כוח להוכיח שמשהו כזה הוא ראשוני? זה היה מקובל למדי אצל פרמה, לטעון טענות כלליות שכאלו ללא הוכחה, או עם הוכחה מעורפלת – לרוב המתמטיקאים שברו את הראש עד שהצליחו להוכיח את הטענה, אבל תמיד התגלו דברים מעניינים בדרך. לרוע המזל, כאן הוא טעה; אוילר (שהקדיש מאמצים לא מעטים למהומות שפרמה השאיר אחריו) הצליח להוכיח שהמספר הזה הוא פריק דווקא; ומאז המשיכו לעסוק במספרים מהצורה \(2^{2^t}+1\), בתחילה באופן ידני ולאחר מכן בעזרת מחשב ואלגוריתמים מחוכמים, עד לימינו, שבהם משתמשים על המספרים הללו באלגוריתמי הפירוק לגורמים המשוכללים ביותר הקיימים.

התוצאה? עד היום הצליחו להכריע סופית את השאלה בעניין 12 מספרי פרמה, עד \(F_{11}\), ולהכריע חד משמעית אם הם ראשוניים או לא; וכולם, פרט לאלו שפרמה גילה, התגלו כפריקים. למספרי פרמה רבים נוספים התגלו גורמים, כך שגם הם אי פריקים. זה כנראה היה הניחוש הלא-מוצלח ביותר שפרמה ביצע בחייו.

הסיפור לא נגמר פה – למרות שטרם התגלה ראשוני פרמה נוסף, זה לא אומר שאין עוד כאלו – טרם ברור אפילו אם יש מספר סופי או אינסופי שלהם, לא כל שכן אם חמשת הראשוניים הם באמת כל מה שיש. גם לא התגלתה שום שיטה יעילה לבדוק ראשוניות של מספרים מהצורה הזו, ובגלל שקצב הגידול שלהם מסחרר, קשה להניח שיצליחו לטפל בהמשך הסדרה בזמן הקרוב. קשה להתאפק ולא להזכיר באותו הקשר את מספרי מרסן – מספרים מהצורה \(2^n-1\) שדומה מאוד לזו של מספרי פרמה, שעבורם דווקא כן ידוע אלגוריתם יעיל יחסית שבודק את הראשוניות שלהם (אלגוריתם לוקאס-להמר למספרי מרסן).

חזרה לענייננו. אמרנו שצריך ש-\(\varphi(n)\) יהיה חזקה של 2. כבר עסקתי בשעתו בחישוב של \(\varphi(n)\); המסקנה הסופית היא ש-\(\varphi(n)\) הוא כפולה של גורמים מהצורה \(p^{k-1}(p-1)\) על כל גורם ראשוני \(p^k\) של \(n\). כל היצורים הללו צריכים להיות חזקות של 2; הדרך היחידה שבה \(p^{k-1}\) יהיה חזקה של 2 כאשר \(p\) הוא אי זוגי היא שיתקיים \(k=1\); וגם אז צריך לדרוש ש-\(p-1\) יהיה חזקה של 2, כלומר שיתקיים \(p=2^n+1\), כלומר ש-\(p\) יהיה ראשוני פרמה.

מכאן שכדי ש-\(n\) יקיים את הקריטריון, וניתן יהיה לבנות מצולע משוכלל עם \(n\) צלעות בעזרת סרגל ומחוגה, \(n\) צריך להיות מכפלה מהצורה \(2^n\cdot p_1\cdots p_t\), כאשר כל \(p_i\) הוא ראשוני פרמה (וכל הראשוניים שונים זה מזה). כך למשל המצולעים עם 4,8,16 צלעות הם ניתנים לבנייה (וגם כל חזקה אחרת של 2); והמשולש ניתן לבניה כי 3 הוא ראשוני פרמה; והמחומש ניתן לבניה כי 5 הוא ראשוני פרמה; והמשושה ניתן לבניה כי 6 הוא מכפלה של 2 ושל 3, שהוא ראשוני פרמה; והמשובע דווקא לא ניתן לבניה כי 7 אינו מספר פרמה, וכו' וכו'. מעניין במיוחד הוא המצולע עם 17 צלעות – הוא כן ניתן לבניה, שכן 17 הוא מספר פרמה, אך לא קל כלל וכלל למצוא בניה כזו; גאוס התפרסם בכך שבגיל 19 עלה בידו לגלות בניה שכזו (מבלי שידע, כמובן, על כל התורה שתיארתי כאן, שפותחה רק אחריו).

בכך באה על פתרונה המלא והיפה בעיית הבניה של מצולעים משוכללים, ולעת עתה גם תם העיסוק שלי בהרחבת שדות. מיותר לציין שבקושי גירדתי את קצה הקרחון והבאתי רק כמה מהיישומים הבסיסיים (אך ה"סקסיים", במובן זה שהם פותרים בעיות עתיקות יומין ומפורסמות) של התורה היפה הזו.

חבורת שורשי היחידה ושדות ציקלוטומיים

בפוסט הקודם עסקתי בשאלה מהם המספרים שכשמעלים אותם בחזקת \(n\), מקבלים 1 – "שורשי היחידה מסדר \(n\)". הגעתי למסקנה שאלו הם כל המספרים המרוכבים מהצורה \(e^{\frac{k\cdot 2i\pi}{n}}\), והסברתי מה המשמעות של חזקה כזו של \(e\) ולמה היא מספר מרוכב. לסיום, הכנסתי לתמונה סימון פשוט יותר:  \(\zeta_n = e^{\frac{2i\pi}{n}}\) (זוהי האות היוונית זטה) ומכאן שכל שורש יחידה מסדר \(n\) ניתן להצגה בתור \(\zeta_n^k\).

כעת אני רוצה לעסוק קצת יותר במבנה של קבוצת כל שורשי היחידה, מבנה שמתבטא בכך שניתן לכפול שני שורשי יחידה אלו באלו, והתוצאה תהיה שורש יחידה שלישי. זאת מכיוון שאם \(\zeta_n^k,\zeta_m^t\) הם שני שורשי יחידה (לא בהכרח מאותו סדר) אז \((\zeta_n^k\cdot\zeta_m^t)^{nm}=(\zeta_n^k)^{nm}\cdot(\zeta_m^t)^{nm}=1\cdot 1=1\), ולכן אפשר "לבנות" שורשי יחידה מתוך שורשי יחידה קיימים, על ידי כפל.

פרט לכך, תכונת הכפל הזו מקיימת שלוש תכונות שודאי מוכרות לכל מי שלומד מתמטיקה (או קורא באדיקות את הפוסטים בבלוג): ראשית, אם \(a,b,c\) הם שורשי יחידה, אז מתקיים \((ab)c=a(bc)\) – חוק הקיבוץ, "אסוציאטיביות" (למי שלא מבין למה זה לא נכון באופן טריוויאלי – שימו לב שפעולת החיסור של מספרים אינה מקיימת את התכונה הזו, כלומר אם\(a,b,c\) הם מספרים שלמים, \((a-b)-c\ne a-(b-c)\) באופן כללי). פרט לכך, המספר 1 (שהוא בוודאי שורש יחידה, מסדר 1 אפילו) הוא "נייטרלי" לכפל – אם כופלים את \(a\) ב-1, מקבלים את \(a\); ולסיום, אם \(\zeta_n^k\) הוא שורש יחידה כלשהו, הרי ש-\(\zeta_n^k\cdot \zeta_n^{n-k}=\zeta_n^n=1\), כלומר – לכל \(a\) קיים \(b\) כך ש-\(ab=1\) – "קיים הופכי לפעולת הכפל".

התכונות שלעיל מראות כי הפעולה של כפל בשורשי היחידה מגדירה חבורה. חדי העין ודאי יודעים לומר שלא הייתי צריך להסתבך כל כך והייתי מסוגל לטעון טענה כדוגמת "המספרים המרוכבים (פרט ל-0) מהווים חבורה כפלית, ומספיק להראות ששורשי היחידה הם תת-חבורה", אך לדעתי עדיף לראות זאת בצורה "ישירה".

שורשי היחידה הם דוגמה מעניינת מאוד לחבורה, בגלל כמה תכונות שהם בבירור מקיימים אבל מי שרק התחיל ללמוד על חבורות אולי טרם הספיק לראות. למשל, כל איבר בחבורה הוא מסדר סופי, למרות שהחבורה היא אינסופית; וכל תת חבורה היא ציקלית למרות שהחבורה כולה אינה ציקלית – תכף אסביר זאת בפירוט.

לפני שאעשה זאת, אני רוצה להציג דרך התבוננות נוספת על החבורה הזו, שאולי תפשט עוד יותר את החיים. נניח שאנו כופלים שני שורשי יחידה מאותו הסדר, \(\zeta_n^k\cdot\zeta_n^t\). מה נקבל? חישוב פשוט מראה שאת \(\zeta_n^{k+t}\). אבל מה קורה אם כופלים שני שורשים שאינם מאותו הסדר? ובכן, למען הסדר הטוב הבה ונעשה זאת על פי ההגדרה, למרות שזה אומר נוסחה ארוכה ומבהילה:

\(e^{\frac{k}{n}\left(2i\pi\right)}\cdot e^{\frac{t}{m}\left(2i\pi\right)}=e^{\left(\frac{k}{n}+\frac{t}{m}\right)\left(2i\pi\right)}=e^{\frac{km+tn}{mn}\left(2i\pi\right)}\)

מה הולך כאן? למעשה, האקשן האמיתי הולך רק במעריך של e, ומה שקורה שם הוא פעולת חיבור, לא כפל – ופעולת חיבור של שני מספרים רציונליים, \(\frac{k}{n}+\frac{t}{m}\). אם כן, אפשר לחשוב על חבורת שורשי היחידה כעל אוסף של מספרים רציונליים, עם פעולת החיבור הרגילה של הרציונליים! אבל ההקבלה נשברת בסיטואציה הבאה, למשל:

\(e^{\frac{1}{2}\left(2i\pi\right)}\cdot e^{\frac{1}{2}\left(2i\pi\right)}=e^{2i\pi}=e^{0}=1\)

מה שקורה כאן הוא שקיבלנו, לכאורה, את המשוואה \(\frac{1}{2}+\frac{1}{2}=0\), שודאי אינה נכונה במספרים הרציונליים. אם כן, אמנם אפשר לחשוב על שורשי היחידה בתור אוסף של מספרים רציונליים עם פעולת חיבור שדומה לזו של מספרים רציונליים רגילים, אבל עם ההבדל החשוב הבא: כל המספרים הרציונליים באוסף הם אי שליליים וקטנים ממש מ-1; ובכל פעם שבה מחברים שני מספרים רציונליים מהקבוצה, "מוחקים" את החלק השלם מהתוצאה ונשארים רק עם השבר (או עם 0, אם החיבור הניב עם מספר שלם). בניסוח קצת יותר מתמטי קוראים לפעולה שכזו "חיבור מודולו 1". בניסוח ממש מתמטי, מה שקורה הוא שחבורת שורשי היחידה איזומורפית לחבורת המנה \(\mathbb{Q}/\mathbb{Z}\) – מי שלא הבין את המשפט האחרון, לא נורא.

מעתה ואילך יהיה יותר פשוט לדבר על שורשי היחידה כעל מספרים רציונליים מהתחום הנ"ל, עם הפעולה הנ"ל. עם זאת, צריך להיות מאוד זהירים ולהבין כל הזמן על מה אנחנו מדברים – אם אני מדבר על שני מספרים רציונליים ועל פעולת החיבור הזו, חשוב להבין שזו בעצם פעולת הכפל של שורשי היחידה, ב"תחפושת". אפשר להגדיר בנוסף לכך גם חיבור על שורשי היחידה, והוא יתנהג באופן שונה לגמרי – לא ניכנס לכך כרגע.

כבר הסכמנו שיש \(n\) שורשי יחידה מסדר \(n\), וכעת קל מאוד לחשוב עליהם – אלו הם המספרים הרציונליים \(\frac{0}{n},\frac{1}{n}, \frac{2}{n},\dots,\frac{n-1}{n} \). מה שכן, רואים מייד שאותו מספר מרוכב ממלא בעצם תפקידים בקבוצות רבות של שורשי יחידה – למשל, \(\frac{1}{2}=\frac{2}{4}=\frac{3}{6}\). כלומר, שורש יחידה מסדר 2 הוא גם שורש יחידה מסדר 4 וגם מסדר 6 וכן הלאה וכן הלאה. ומה עם \(\frac{1}{4}\)? האם גם הוא יכול להיות שורש יחידה מסדר 6? מתברר שלא, כי אין מספר רציונלי \(\frac{a}{6}\) עם \(a\) טבעי (לא שבר) שמקיים \(\frac{a}{6}=\frac{1}{4}\) (בדקו מהו הערך היחיד של \(a\) שמקיים את המשוואה). אם כן, מהם הכללים? איך אפשר לדעת באילו תפקידים משמש כל שורש יחידה?

לשם כך צריך לזכור מושג בסיסי במספרים רציונליים – "שבר מצומצם". מספר רציונלי מוצג כשבר מצומצם \(\frac{a}{b}\) אם ל-a ול-b אין אף מחלק משותף גדול מ-1 (הם "זרים"). כל מספר רציונלי ניתן להציג כשבר מצומצם – אם a,b אינם זרים אלא מתחלקים שניהם באותו מספר גדול מ-1, אפשר לחלק את שניהם במספר הזה ולקבל את אותו מספר רציונלי (כי כשמחלקים מונה ומכנה באותו מספר, ערך השבר כולו אינו משתנה). מכאן שכל שורש יחידה ניתן להביא למצב של שבר מצומצם – ואם בתור שבר מצומצם, המכנה שלו הוא \(n\), אז לא קשה לראות שבכל תיאור אחר שלו, המכנה חייב להיות כפולה של \(n\).

כעת אני רוצה לחזור ל"ציקליות" שהזכרתי קודם. תת-חבורה היא "ציקלית" אם קיים בה איבר אחד כך שכל איבר אחר מתקבל ממנו באמצעות הפעלת פעולת החבורה מספר כלשהו של פעמים. במקרה שלנו הפעולה היא כזכור כפל של מספרים מרוכבים, שניתן לתיאור באמצעות חיבור מודולו 1 של מספרים רציונליים. ברור ששורש היחידה שמיוצג על ידי \(\frac{1}{n}\) מסוגל לייצר כל שורש יחידה אחר מסדר \(n\) – את \(\frac{k}{n}\) אפשר לייצר על ידי חיבור \(\frac{1}{n}\) לעצמו בדיוק \(k\) פעמים (את 0 מקבלים על ידי חיבור \(n\) פעמים). האם \(\frac{1}{n}\) הוא שורש היחידה היחיד מסדר \(n\) שיוצר את שורשי היחידה האחרים? מתברר שלא – לכל \(k\) שזר ל-\(n\), כלומר שאין לשניהם מחלקים משותפים גדולים מ-1, מתקיים ש-\(\frac{k}{n}\) יוצר את כל שורשי היחידה מסדר \(n\). לעומת זאת, כל שורש יחידה אחר מסדר \(n\) איננו יוצר. לדוגמה – \(\frac{1}{4}, \frac{3}{4}\) הם יוצרים של כל שורשי היחידה מסדר 4, אבל שאר שורשי היחידה מסדר 4 אינם (נסו בעצמכם לבצע את החיבור). לשורש יחידה מסדר \(n\) שגם יוצר את היתר קוראים "שורש יחידה פרימיטיבי מסדר \(n\)".

לא אכנס כאן להוכחה הפורמלית של הטענה הזו, אם כי היא אינה מסובכת. היא רק מקרה פרטי של ניתוח כללי יותר שאפשר לבצע על חבורות ציקליות באופן כללי ולא אכנס אליו כאן במלואו (אם כי הוא אינו הרבה יותר מורכב – למעשה, כל חבורה ציקלית סופית ניתן לתאר באמצעות אוסף כל שורשי היחידה מסדר מסויים). השורה התחתונה היא החשובה – יש בדיוק \(\varphi(n)\) שורשי יחידה פרימיטיביים מסדר \(n\), כאשר \(\varphi(n)\) זו פשוט פונקצית אוילר שעליה כבר דיברתי בעבר – הפונקציה שעבור \(n\) מחזירה את כמות המספרים הקטנים ממנו וזרים לו. הפונקציה הזו היא קריטית להמשך הדיון בבניות של מצולעים משוכללים ולכן עירבתי אותה כאן בסיפור.

תובנה מעניינת למדי של הצגת שורשי היחידה כמספרים מרוכבים היא שכל שורש יחידה הוא פרימיטיבי עבור \(n\) כלשהו – המכנה בהצגה המצומצמת שלו. כך למשל \(\frac{2}{4}\) אמנם אינו פרימיטיבי מסדר 4, אך הוא כן פרימיטיבי מסדר 2. נסו להוכיח את הטענה הכללית לעצמכם – ההוכחה טריוויאלית בהינתן מה שכבר דיברנו עליו.

אם כן, זה מסכם פחות או יותר את הדיון במבנה של שורשי היחידה שמוקנה להם על ידי פעולת הכפל. אם מכניסים גם את פעולת החיבור למשחק (שוב, פעולת החיבור הסטנדרטית של מספרים מרוכבים) הסגירות הולכת לעזאזל (סכום של שני שורשי יחידה אינו שורש יחידה) ולכן אין משמעות בדיבור על "חוג שורשי היחידה" (חוג הוא אוסף איברים בעל שתי פעולות, "כפל" ו"חיבור", עם תכונות "נחמדות" שלא אפרט כאן). עם זאת, הכנסת החיבור למשחק מאפשרת לנו לדבר על שדות שמתקבלים על ידי הרחבת הרציונליים באמצעות הוספת שורשי יחידה. לשדות הללו קוראים שדות ציקלוטומיים, ואלו האובייקטים הקריטיים להמשך הדיון שלנו.

ניקח אם כן את המספרים הרציונליים ונוסיף להם שורש יחידה פרימיטיבי מסדר \(n\). קיבלנו את ההרחבה \(\mathbb{Q}(\zeta_n)/\mathbb{Q}\). השאלה החשובה ביותר היא מהו מימד ההרחבה הזו, כפי שהגדרתי מימד של הרחבה כבר בעבר. התשובה המיידית, שנובעת מהתיאוריה הבסיסית של הרחבת שדות, היא שזוהי דרגת הפולינום המינימלי מעל הרציונליים שמאפס את שורש היחידה הזה. לכאורה קל לקפוץ ולהגיד שזהו הפולינום \(x^n-1\) ולכן מימד ההרחבה הוא \(n\), אך זו טעות; הפולינום ההוא פריק ולכן אינו מינימלי. בפרט, פירוק בסיסי שלו הוא \(x^n-1=(x-1)(1+x+x^2+\dots+x^{n-1})\). קל להיווכח בכך – אם נפתח את הסוגריים נקבל סכום שבו כל הזמן מוסיפים ומחסירים את אותו האיבר, פרט לאיבר הראשון (שאינו מחוסר) והאחרון (שאינו מוסף). לטור שכזה קוראים טור טלסקופי. הנוסחה החביבה הזו היא בעצם הבסיס לנוסחת הסכום של טור הנדסי – לדעתי הטור הטלסקופי הוא דרך מצויינת לזכור בה כדי שניתן יהיה לפתח אותה "מהראש" ולא על ידי חיפוש בספרים.

מתברר שלא כל כך קל לכתוב במפורש בעזרת נוסחה את הפולינום המינימלי של שורש היחידה מסדר \(n\). דרך הכתיבה הברורה ביותר שאני מכיר היא זו: \(\prod_{(n,k)=1}(x-\zeta_n^k)\), כאשר הסימון \((n,k)=1\) הוא סימון מקובל ל"המספר \(n\) זר למספר \(k\)" (למעשה, באופן כללי כותבים \((n,k)=d\) כדי לתאר את "המחלק המשותף הגדול ביותר של \(n,k\) הוא \(d\)"). צורת הכתיבה הזו איננה מפורשת, שכן היא אינה אומרת כיצד נראים המקדמים של הפולינום, אלא מציגה אותו כשהוא "מפורק" למכפלת שורשיו. עם זאת, ניתן להוכיח על הפולינום שמקדמיו יהיו מספרים שלמים, ושהוא יהיה אי-פריק. ההוכחות אינן נוראיות אך הן טכניות ודורשת ידע נוסף בתורת החוגים, ולא אכנס אליהן כעת. השורה התחתונה היא החשובה – מכיוון שהפולינום הזה הוא מכפלת שורשי היחידה הפרימיטיביים, דרגתו הוא כמספרם, כלומר \(\varphi(n)\). לכן מימד ההרחבה הציקלוטומית שמתקבלת מהוספת שורש יחידה מסדר \(n\) לרציונליים הוא \(\varphi(n)\). חמושים בידע הזה אנחנו מסוגלים סוף סוף להתמודד עם שאלת המצולע המשוכלל, ולתת תשובה חד משמעית לשאלה מתי אי אפשר לבנות אותו; כדי להגיד מתי אפשר לבנות אותו אצטרך להתבסס על תחום עמוק יותר של הרחבת שדות בשם "תורת גלואה", שראוי לזכות לפוסטים משל עצמו.

שורשנו באחדותנו

בפוסטים האחרונים הראיתי כיצד ניתן להשתמש במושג של הרחבת שדות כדי לחסל שלוש מהבעיות ה"קלאסיות" של בניה בסרגל ומחוגה ולהראות שהן פשוט בלתי אפשריות. נתבקשתי לדבר גם על בעיה רביעית – הבעיה של בניית מצולע משוכלל (מצולע שכל צלעותיו וכל זוויותיו שוות) בסרגל ומחוגה. כאן הסיטואציה מעט שונה – ניתן לבנות חלק מהמצולעים בעזרת סרגל ומחוגה, ומצולעים אחרים לא ניתן. למרבה השמחה, פחות או יותר אותם כלים שבהם השתמשתי עד כה ניתנים לשימוש גם במתן קריטריון פשוט וחד משמעי שמראה מתי ניתן ומתי לא ניתן לבנות את המצולע. הקריטריון מקסים במיוחד משתי סיבות – ראשית, הוא מערב מספרים מעניינים בפני עצמם – מספרי פרמה – שעליהם ארחיב בהמשך; ושנית, הדרך אליו עוברת בנושא שבמבט ראשון נראה בלתי קשור (ובמבט שני, ברור לגמרי שהוא קשור באופן הדוק) – שורשי יחידה מסדר \(n\), שעליהם אדבר בפוסט הזה.

השם "שורש יחידה" נשמע מוזר. ה"יחידה" היא המספר 1, ושורש יחידה מסדר \(n\) הוא פשוט מספר שכאשר מעלים אותו בחזקת \(n\) מקבלים 1. מי אלו יכולים להיות בכלל? על פניו נראה שרק 1 עצמו, ואולי גם מינוס 1 (כי מינוס 1 בריבוע הוא 1, למשל). אז מה הרעיון במושג הזה? לשם כך צריך להכניס לתמונה את המספרים המרוכבים. מי שאינו "חש בנוח" עם המספרים המרוכבים מוזמן לקרוא פוסטים קודמים שלי בנושא – כאן אקבל את קיומם כעובדה מוגמרת, ואתמקד בצורה שבה הכנסתם למשחק רק עוזרת לנו ללמוד דברים חדשים ומעניינים, שבניסוחם המקורי אין זכר למרוכבים (בפרט, בעיית בניית המצולע שהזכרתי).

אפשר לחשוב על שורשי יחידה מסדר \(n\) בתור שורשים של הפולינום \(x^n-1\). האם ניתן למצוא אותם באופן מפורש? ובכן, ברור ש-1 הוא תמיד שורש, אבל חוץ ממנו? כדי להראות כיצד מוצאים אותם, אני רוצה לומר מילה או שתיים על הצורה שבה אנו מתארים מספרים מרוכבים. דרך תיאור אפשרית אחת היא \(a+bi\), שאותה הכל מכירים; אבל הדרך הזו נוחה בעיקר כאשר רוצים לבצע פעולות של חיבור וחיסור, בעוד שאם רוצים לדבר על כפל, חילוק, חזקה או הוצאת שורש (וזה מה שאנחנו רוצים לדבר עליו) יותר נוח להשתמש בדרך הצגה אלטרנטיבית. בתיכון ההצגה היא זו: \(r(\cos(\theta)+i\sin(\theta))\) כאשר \(r\) הוא מספר ממשי חיובי, ו-\(\theta\) היא זווית. בקיצור מסמנים את דרך ההצגה הזו ב-\(r(\mbox{cis}(\theta))\). מה בעצם משמעותה?

אפשר לחשוב על מספרים מרוכבים גם כעל נקודות במישור דו ממדי, שמכונה "המישור המרוכב" אבל למעשה לא שונה מהמישור שעליו מדברים בגאומטריה (ובפרט בגאומטריה אנליטית). המספר \(a+bi\) מיוצג על ידי הנקודה \((a,b)\). זוהי דרך ייצוג אחת לנקודות, אבל יש גם דרך ייצוג אחרת, שלפעמים (למשל, עכשיו) היא נוחה בהרבה – נמתח קו הישר מראשית הצירים אל עבר הנקודה. במה הוא יתאפיין? בשני פרמטרים. ראשית, באורך של הישר (שהוא תמיד מספר ממשי חיובי או אפס), ובזווית של הישר. כשמדברים על זווית צריך לשאול "ביחס למה", ולכן המוסכמה היא להגדיר את הזווית ביחס לכיוון החיובי של ציר ה-x. כלומר, כמה צריך לסובב את הישר עם כיוון השעון כדי שהוא "ינוח" על הצד החיובי של ציר ה-x. כשהנקודה שאותה מנסים לתאר היא 0 אין משמעות לזווית, אבל כל נקודה אחרת מיוצגת באופן חד ערכי על ידי אורך וזווית שהיא בין 0 ו-360 מעלות.

הייצוג באמצעות  \(r(\mbox{cis}(\theta))\) בעצם מקודד את המידע הזה – \(r\) הוא המרחק מהראשית, ואילו \(\theta\) היא הזווית. לא קשה לראות שהייצוג הזה אכן "נכון" אם זוכרים את ההגדרות של סינוס וקוסינוס באמצעות משולשים ישרי זווית – קל לראות ש-\(r\cos\theta\) הוא באמת המיקום על ציר x של הנקודה, וכנ"ל עבור ציר y.

אלא ש-\(\mbox{cis}\) זה לא משהו שרואים בדרך כלל במקום כלשהו שאינו תיכון. למעשה, זוהי דרך כתיבה מסורבלת ומאוד לא מאירת עיניים. דרך הכתיבה ה"נכונה" מתבססת על נוסחה של אוילר, שקושרת בצורה מעניינת ביותר את המספרים המרוכבים עם הקבוע e. הנוסחה היא \(e^{i\theta}=\cos\theta+i\sin\theta\) – כלומר, חלק ה-\(\mbox{cis}\) שהוזכר קודם. כאן (ובכלל, מכאן ואילך) הזווית \(\theta\) תמיד נתונה ברדיאנים; אין ממש משמעות להעלאה בחזקת זווית שאינה רדיאן (כלומר, אינה מספר "טבעי"). ניסיתי בעבר להסביר מדוע רדיאנים הם אכן בחירה "טבעית" שכזו לייצוג של זווית, אבל גם למי שלא משוכנע, די אם אומר שלזווית שאינה מיוצגת ברדיאנים הנוסחה איננה נכונה.

את הצורה שבה אני הגבתי לנוסחה הזו כששמעתי עליה לראשונה מסכם יפה הקומיקס xkcd:

ואכן, יש כאלו שבוחרים להגדיר את e בחזקת מספר מרוכב באמצעות הנוסחה הזו ולהותיר אותה ללא הוכחה כלל. לטעמי הגישה הזו היא "התחמקות", ולמרבה המזל יש לנוסחה הוכחה (שמתבססת, כמובן, על כמה הגדרות אחרות שיש מאחורי הקלעים) שיש בה אפילו משהו אינטואיטיבי – פירוק של טור הטיילור של \(e^x\) לשני טורים, אחד של סינוס והשני של קוסינוס. אני מקווה להרחיב על כך מתישהו. בפרט, אם מציבים בנוסחת אוילר את הזווית פאי, מקבלים (לאחר העברת אגפים) את הזהות \(e^{i\pi}+1=0\), שאהובה מאוד על מתמטיקאים והיא זו שמופיעה כמעט במפורש בקומיקס (וכבר גרמה לי להקים מהומה בעבר בבלוג).

מה יוצא לנו מכל זה? שניתן לכתוב מספר מרוכב "כללי" גם בצורה \(re^{i\theta}\), כלומר בלי הציס המעצבן. פרט לכך שדרך כתיבה זו קומפקטית יותר, אחרי שמוכיחים שכל חוקי החזקות ה"רגילים" תקפים גם לחזקות מרוכבות, היא מאפשרת לבצע בקלות חישובים כמו הוצאת שורש וכדומה, שהיה יותר מסובך לעשות אם היינו עובדים עם ציס (פשוט היינו זוכרים יותר דברים בעל פה). כך למשל אם נעלה את המספר המרוכב \(re^{i\theta}\) בחזקת \(n\), נקבל את \(r^ne^{in\theta}\). אנחנו, לעומת זאת, רוצים דווקא להוציא שורש, ועוד למספר 1. כלומר, אנו רוצים למצוא מספר ממשי \(r\) וזווית \(\theta\) כך שמתקיים \(r^ne^{in\theta}=1\cdot e^{i\cdot 0}\). מכיוון ש-\(r\) ממשי חיובי, קל לראות שהדרך היחידה שבה יתקיים \(r^n=1\) היא שיתקיים \(r=1\). הזווית זה כבר עניין שונה – אנחנו רוצים למצוא כפולה של הזווית ששווה לאפס. איך עושים את זה? איך בכלל כפולה של זווית יכולה להיות שווה לאפס?

התשובה היא שהכפולה של הזווית לא חייבת להיות שווה ממש לאפס; היא יכולה להיות שווה גם לשני פאי, ארבע פאי, וכדומה. כל הזוויות הללו מייצגות סיבוב מלא (360 מעלות), ולכן חוזרות בדיוק לאותה נקודה. בדיחה ידועה (שגם מתרחשת לפעמים בפועל) היא על אנשים שאומרים על עצמם שהם עשו בחייהם "סיבוב של 360 מעלות" (או רס"רים שתובעים זאת מחייליהם). אצלנו זה מתבטא בשאלה הבאה: עבור אילו ערכים של \(n\), נקבל כי \(n\theta=k\cdot 2\pi\) עבור \(k\) טבעי כלשהו?

ובכן, התשובה פשוטה: \(\theta = k\cdot\frac{2\pi}{n}\). כלומר, לכל ערך של \(k\) נקבל ערך מתאים של \(\theta\). האם זה אומר שיש אינסוף פתרונות, כלומר אינסוף שורשי יחידה מסדר \(n\)? התשובה שלילית, כי מתישהו הזוויות שהמשוואה נותנת לנו יתחילו לחזור על עצמן. שוב – הן לא יהיו זהות, כמובן, אך ההפרש ביניהן יהיה של שני פאי, כלומר של 360 מעלות. למעשה, לא קשה לראות שכל פתרון ניתן לייצג עם זווית בין 0 ל-360 מעלות. נסכם, אם כן: כל שורשי היחידה מסדר \(n\) הם המספרים המרוכבים מהצורה \(e^{\frac{k}{n}2\pi i}\) כך ש-\(k=0,1,\dots,n-1\).

נשים לב שהמספרים היחידים שמשתנים בין שורשי יחידה שונים הם \(n\) ו-\(k\). לכן כדי לפשט את הסימון, נהוג לסמן \(\zeta_n=e^{\frac{2\pi i}{n}}\), ואז כל שורש יחידה מסדר \(n\) ניתן לכתיבה בתור \(\zeta_n^k\) (שכן מחוקי החזקות של מספרים מרוכבים נובע מייד ש-\(\zeta_n^k=e^{\frac{k}{n}2\pi i}\)).

נעבור כעת לקצת אינטואיציה גאומטרית. במהלך החישוב, ראינו שלכל שורש יחידה מתקיים \(r=1\), כלומר המרחק של כל שורש יחידה (ולא משנה מאיזה סדר) מראשית הצירים הוא בדיוק 1. במילים אחרות, כל שורש יחידה הוא נקודה על "מעגל היחידה" סביב ראשית הצירים. שנית, הזווית בין כל שני שורשי יחידה סמוכים מאותו הסדר שווה (ל-\(\frac{2\pi}{n}\)) וסכום כל הזוויות הללו הוא בדיוק \(2\pi\), כלומר שורשי היחידה מסדר \(n\) הם נקודות במרווחים שווים על מעגל היחידה סביב הראשית. קצת גאומטריה אוקלידית מובילה למסקנה הבאה – שורשי היחידה מסדר \(n\) הם בדיוק הקודקודים של מצולע משוכלל שמרכזו בראשית הצירים. טראח! פתאום, משום מקום, שני נושאים שנראו בלתי קשורים התחברו זה לזה בקשר הדוק ביותר. התנגשות שכזו היא לב-ליבה של המתמטיקה וככל הנראה הדבר היפה ביותר בה.

עכשיו, משקיבלנו אינטואיציה כלשהי למה בכלל יש טעם לעסוק בשורשי יחידה כשבאים לדבר על מצולעים משוכללים, זה נראה לי זמן טוב לסיים את הפוסט הנוכחי. בפוסט הבא נעסוק הרבה יותר בתכונות של הקבוצה המעניינת של שורשי היחידה – וחשוב לא פחות, בתכונות של הפולינמים שהם שורשיהם, ושחקירה כלשהי שלהם היא שתוביל אותנו לפתרון של בעיית הבניה.