שורשנו באחדותנו

בפוסטים האחרונים הראיתי כיצד ניתן להשתמש במושג של הרחבת שדות כדי לחסל שלוש מהבעיות ה”קלאסיות” של בניה בסרגל ומחוגה ולהראות שהן פשוט בלתי אפשריות. נתבקשתי לדבר גם על בעיה רביעית - הבעיה של בניית מצולע משוכלל (מצולע שכל צלעותיו וכל זוויותיו שוות) בסרגל ומחוגה. כאן הסיטואציה מעט שונה - ניתן לבנות חלק מהמצולעים בעזרת סרגל ומחוגה, ומצולעים אחרים לא ניתן. למרבה השמחה, פחות או יותר אותם כלים שבהם השתמשתי עד כה ניתנים לשימוש גם במתן קריטריון פשוט וחד משמעי שמראה מתי ניתן ומתי לא ניתן לבנות את המצולע. הקריטריון מקסים במיוחד משתי סיבות - ראשית, הוא מערב מספרים מעניינים בפני עצמם - מספרי פרמה - שעליהם ארחיב בהמשך; ושנית, הדרך אליו עוברת בנושא שבמבט ראשון נראה בלתי קשור (ובמבט שני, ברור לגמרי שהוא קשור באופן הדוק) - שורשי יחידה מסדר \( n \), שעליהם אדבר בפוסט הזה.

השם “שורש יחידה” נשמע מוזר. ה”יחידה” היא המספר 1, ושורש יחידה מסדר \( n \) הוא פשוט מספר שכאשר מעלים אותו בחזקת \( n \) מקבלים 1. מי אלו יכולים להיות בכלל? על פניו נראה שרק 1 עצמו, ואולי גם מינוס 1 (כי מינוס 1 בריבוע הוא 1, למשל). אז מה הרעיון במושג הזה? לשם כך צריך להכניס לתמונה את המספרים המרוכבים. מי שאינו “חש בנוח” עם המספרים המרוכבים מוזמן לקרוא פוסטים קודמים שלי בנושא - כאן אקבל את קיומם כעובדה מוגמרת, ואתמקד בצורה שבה הכנסתם למשחק רק עוזרת לנו ללמוד דברים חדשים ומעניינים, שבניסוחם המקורי אין זכר למרוכבים (בפרט, בעיית בניית המצולע שהזכרתי).

אפשר לחשוב על שורשי יחידה מסדר \( n \) בתור שורשים של הפולינום \( x^n-1 \). האם ניתן למצוא אותם באופן מפורש? ובכן, ברור ש-1 הוא תמיד שורש, אבל חוץ ממנו? כדי להראות כיצד מוצאים אותם, אני רוצה לומר מילה או שתיים על הצורה שבה אנו מתארים מספרים מרוכבים. דרך תיאור אפשרית אחת היא \( a+bi \), שאותה הכל מכירים; אבל הדרך הזו נוחה בעיקר כאשר רוצים לבצע פעולות של חיבור וחיסור, בעוד שאם רוצים לדבר על כפל, חילוק, חזקה או הוצאת שורש (וזה מה שאנחנו רוצים לדבר עליו) יותר נוח להשתמש בדרך הצגה אלטרנטיבית. בתיכון ההצגה היא זו: \( r(\cos(\theta)+i\sin(\theta)) \) כאשר \( r \) הוא מספר ממשי חיובי, ו-\( \theta \) היא זווית. בקיצור מסמנים את דרך ההצגה הזו ב-\( r(\mbox{cis}(\theta)) \). מה בעצם משמעותה?

אפשר לחשוב על מספרים מרוכבים גם כעל נקודות במישור דו ממדי, שמכונה “המישור המרוכב” אבל למעשה לא שונה מהמישור שעליו מדברים בגאומטריה (ובפרט בגאומטריה אנליטית). המספר \( a+bi \) מיוצג על ידי הנקודה \( (a,b) \). זוהי דרך ייצוג אחת לנקודות, אבל יש גם דרך ייצוג אחרת, שלפעמים (למשל, עכשיו) היא נוחה בהרבה - נמתח קו הישר מראשית הצירים אל עבר הנקודה. במה הוא יתאפיין? בשני פרמטרים. ראשית, באורך של הישר (שהוא תמיד מספר ממשי חיובי או אפס), ובזווית של הישר. כשמדברים על זווית צריך לשאול “ביחס למה”, ולכן המוסכמה היא להגדיר את הזווית ביחס לכיוון החיובי של ציר ה-x. כלומר, כמה צריך לסובב את הישר עם כיוון השעון כדי שהוא “ינוח” על הצד החיובי של ציר ה-x. כשהנקודה שאותה מנסים לתאר היא 0 אין משמעות לזווית, אבל כל נקודה אחרת מיוצגת באופן חד ערכי על ידי אורך וזווית שהיא בין 0 ו-360 מעלות.

הייצוג באמצעות  \( r(\mbox{cis}(\theta)) \) בעצם מקודד את המידע הזה - \( r \) הוא המרחק מהראשית, ואילו \( \theta \) היא הזווית. לא קשה לראות שהייצוג הזה אכן “נכון” אם זוכרים את ההגדרות של סינוס וקוסינוס באמצעות משולשים ישרי זווית - קל לראות ש-\( r\cos\theta \) הוא באמת המיקום על ציר x של הנקודה, וכנ”ל עבור ציר y.

אלא ש-\( \mbox{cis} \) זה לא משהו שרואים בדרך כלל במקום כלשהו שאינו תיכון. למעשה, זוהי דרך כתיבה מסורבלת ומאוד לא מאירת עיניים. דרך הכתיבה ה”נכונה” מתבססת על נוסחה של אוילר, שקושרת בצורה מעניינת ביותר את המספרים המרוכבים עם הקבוע e. הנוסחה היא \( e^{i\theta}=\cos\theta+i\sin\theta \) - כלומר, חלק ה-\( \mbox{cis} \) שהוזכר קודם. כאן (ובכלל, מכאן ואילך) הזווית \( \theta \) תמיד נתונה ברדיאנים; אין ממש משמעות להעלאה בחזקת זווית שאינה רדיאן (כלומר, אינה מספר “טבעי”). ניסיתי בעבר להסביר מדוע רדיאנים הם אכן בחירה “טבעית” שכזו לייצוג של זווית, אבל גם למי שלא משוכנע, די אם אומר שלזווית שאינה מיוצגת ברדיאנים הנוסחה איננה נכונה.

את הצורה שבה אני הגבתי לנוסחה הזו כששמעתי עליה לראשונה מסכם יפה הקומיקס xkcd:

ואכן, יש כאלו שבוחרים להגדיר את e בחזקת מספר מרוכב באמצעות הנוסחה הזו ולהותיר אותה ללא הוכחה כלל. לטעמי הגישה הזו היא “התחמקות”, ולמרבה המזל יש לנוסחה הוכחה (שמתבססת, כמובן, על כמה הגדרות אחרות שיש מאחורי הקלעים) שיש בה אפילו משהו אינטואיטיבי - פירוק של טור הטיילור של \( e^x \) לשני טורים, אחד של סינוס והשני של קוסינוס. אני מקווה להרחיב על כך מתישהו. בפרט, אם מציבים בנוסחת אוילר את הזווית פאי, מקבלים (לאחר העברת אגפים) את הזהות \( e^{i\pi}+1=0 \), שאהובה מאוד על מתמטיקאים והיא זו שמופיעה כמעט במפורש בקומיקס (וכבר גרמה לי להקים מהומה בעבר בבלוג).

מה יוצא לנו מכל זה? שניתן לכתוב מספר מרוכב “כללי” גם בצורה \( re^{i\theta} \), כלומר בלי הציס המעצבן. פרט לכך שדרך כתיבה זו קומפקטית יותר, אחרי שמוכיחים שכל חוקי החזקות ה”רגילים” תקפים גם לחזקות מרוכבות, היא מאפשרת לבצע בקלות חישובים כמו הוצאת שורש וכדומה, שהיה יותר מסובך לעשות אם היינו עובדים עם ציס (פשוט היינו זוכרים יותר דברים בעל פה). כך למשל אם נעלה את המספר המרוכב \( re^{i\theta} \) בחזקת \( n \), נקבל את \( r^ne^{in\theta} \). אנחנו, לעומת זאת, רוצים דווקא להוציא שורש, ועוד למספר 1. כלומר, אנו רוצים למצוא מספר ממשי \( r \) וזווית \( \theta \) כך שמתקיים \( r^ne^{in\theta}=1\cdot e^{i\cdot 0} \). מכיוון ש-\( r \) ממשי חיובי, קל לראות שהדרך היחידה שבה יתקיים \( r^n=1 \) היא שיתקיים \( r=1 \). הזווית זה כבר עניין שונה - אנחנו רוצים למצוא כפולה של הזווית ששווה לאפס. איך עושים את זה? איך בכלל כפולה של זווית יכולה להיות שווה לאפס?

התשובה היא שהכפולה של הזווית לא חייבת להיות שווה ממש לאפס; היא יכולה להיות שווה גם לשני פאי, ארבע פאי, וכדומה. כל הזוויות הללו מייצגות סיבוב מלא (360 מעלות), ולכן חוזרות בדיוק לאותה נקודה. בדיחה ידועה (שגם מתרחשת לפעמים בפועל) היא על אנשים שאומרים על עצמם שהם עשו בחייהם “סיבוב של 360 מעלות” (או רס”רים שתובעים זאת מחייליהם). אצלנו זה מתבטא בשאלה הבאה: עבור אילו ערכים של \( n \), נקבל כי \( n\theta=k\cdot 2\pi \) עבור \( k \) טבעי כלשהו?

ובכן, התשובה פשוטה: \( \theta = k\cdot\frac{2\pi}{n} \). כלומר, לכל ערך של \( k \) נקבל ערך מתאים של \( \theta \). האם זה אומר שיש אינסוף פתרונות, כלומר אינסוף שורשי יחידה מסדר \( n \)? התשובה שלילית, כי מתישהו הזוויות שהמשוואה נותנת לנו יתחילו לחזור על עצמן. שוב - הן לא יהיו זהות, כמובן, אך ההפרש ביניהן יהיה של שני פאי, כלומר של 360 מעלות. למעשה, לא קשה לראות שכל פתרון ניתן לייצג עם זווית בין 0 ל-360 מעלות. נסכם, אם כן: כל שורשי היחידה מסדר \( n \) הם המספרים המרוכבים מהצורה \( e^{\frac{k}{n}2\pi i} \) כך ש-\( k=0,1,\dots,n-1 \).

נשים לב שהמספרים היחידים שמשתנים בין שורשי יחידה שונים הם \( n \) ו-\( k \). לכן כדי לפשט את הסימון, נהוג לסמן \( \zeta_n=e^{\frac{2\pi i}{n}} \), ואז כל שורש יחידה מסדר \( n \) ניתן לכתיבה בתור \( \zeta_n^k \) (שכן מחוקי החזקות של מספרים מרוכבים נובע מייד ש-\( \zeta_n^k=e^{\frac{k}{n}2\pi i} \)).

נעבור כעת לקצת אינטואיציה גאומטרית. במהלך החישוב, ראינו שלכל שורש יחידה מתקיים \( r=1 \), כלומר המרחק של כל שורש יחידה (ולא משנה מאיזה סדר) מראשית הצירים הוא בדיוק 1. במילים אחרות, כל שורש יחידה הוא נקודה על “מעגל היחידה” סביב ראשית הצירים. שנית, הזווית בין כל שני שורשי יחידה סמוכים מאותו הסדר שווה (ל-\( \frac{2\pi}{n} \)) וסכום כל הזוויות הללו הוא בדיוק \( 2\pi \), כלומר שורשי היחידה מסדר \( n \) הם נקודות במרווחים שווים על מעגל היחידה סביב הראשית. קצת גאומטריה אוקלידית מובילה למסקנה הבאה - שורשי היחידה מסדר \( n \) הם בדיוק הקודקודים של מצולע משוכלל שמרכזו בראשית הצירים. טראח! פתאום, משום מקום, שני נושאים שנראו בלתי קשורים התחברו זה לזה בקשר הדוק ביותר. התנגשות שכזו היא לב-ליבה של המתמטיקה וככל הנראה הדבר היפה ביותר בה.

עכשיו, משקיבלנו אינטואיציה כלשהי למה בכלל יש טעם לעסוק בשורשי יחידה כשבאים לדבר על מצולעים משוכללים, זה נראה לי זמן טוב לסיים את הפוסט הנוכחי. בפוסט הבא נעסוק הרבה יותר בתכונות של הקבוצה המעניינת של שורשי היחידה - וחשוב לא פחות, בתכונות של הפולינמים שהם שורשיהם, ושחקירה כלשהי שלהם היא שתוביל אותנו לפתרון של בעיית הבניה.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com