נגזרת – בשביל מה זה טוב? (בעיות קיצון, חלק א')

כשהייתי קטן תהיתי (יש מישהו שלא תהה על זה?) מה הדרך האופטימלית לזרוק כדור כך שהוא יפול במרחק הגדול ביותר האפשרי ממני. ברור שצריך לזרוק בשיא הכוח שלך, אבל באיזו זווית ביחס לאדמה? אם זורקים יותר מדי לגובה, הכדור אמנם יתעופף לגובה אבל לא יתרחק ממני כמעט; ואם זורקים יותר מדי לאורך הכדור אמנם יבלה את חלק הארי של התנועה שלו בהתרחקות ממני אבל ייפול לאדמה חיש קל. הניחוש היה שהפשרה הטבעית בין קדימה ולמעלה, כלומר זווית של 45 מעלות, היא האופטימלית – אבל איך אפשר להשתכנע בכך שזה נכון? כאן נכנסת המתמטיקה לעזרתנו, ובפרט החשבון הדיפרנציאלי.

השלב הראשון הוא לבנות מודל מתמטי שמתאר את התנועה. כלומר, פונקציה שאומרת לי איפה נמצא הכדור בכל שניה החל מרגע הזריקה. פונקציה כזו תהיה תלויה בפרמטרים: גודל הכוח שהשקעתי בזריקה, והזווית שבה זרקתי. בנוסף לכך, הפונקציה קצת מחוכמת – גם הגובה וגם המרחק של הכדור משתנים בכל עת, כך שבפועל אני צריך שתי פונקציות שונות; ואני צריך "לעצור" את המודל ברגע שבו הפונקציה שמתארת את הגובה מקבלת את הערך 0, ולמדוד כמה מרחק הכדור עבר עד אז. בנייה של מודלים כאלו, לטעמי, היא ממש כיף. אין חוקים – אף אחד לא אומר לך מה לעשות, או באיזה אלגוריתם להשתמש; אתה פשוט מגשש ומנסה להמציא דברים בעצמך כדי לתאר את הסיטואציה באופן הטוב ביותר האפשרי. לכן אני ממליץ לכם לנסות ולפתור את הבעיה בעצמכם ואז לחזור ושנשווה תשובות.

טוב, אז מה אני עושה? ראשית, צריך להבין אילו כוחות משפיעים על הכדור במהלך התנועה שלו. יש את הכוח שלי שבא לידי ביטוי בזריקה עצמה, אבל זה לא כוח שפועל לאורך זמן – בשנייה 0, שבה המודל יתחיל, הזריקה כבר בוצעה ואין צורך להכניס אותה באופן ישיר למודל. היא תיכנס באופן עקיף באמצעות המהירות ההתחלתית של הכדור. הכוח היחיד שפועל על הכדור במהלך התנועה שלו, והוא מה שגורם לו ליפול בסופו של דבר, הוא כוח המשיכה. גם לכוח המשיכה אין צורך להתייחס באופן ישיר במודל – כל שצריך להניח הוא שכוח המשיכה גורם לכדור לתאוצה (שינוי במהירות) קבועה כלפי מטה. פיזיקלית, ההנחה הזו אינה נכונה – ככל שהכדור גבוה יותר, כך תאוצת הכובד שלו קטנה יותר – אבל בפועל היא מתארת את הסיטואציה מספיק טוב לצרכים שלי כי הכדור לא צפוי להגיע לגובה כזה שבו ההבדלים יהיו מורגשים (אבל, ישאלו המתמטיקאים שבחבורה, האין זה אומר ש-45 מעלות הן לא הדבר הנכון בהינתן התכונה הזו של כוח הכובד? ובכן, כן, אתם צודקים, הנה לכם תרגיל בונוס לבית).

הבה ונסמן ב-\(v_{0}\) את המהירות ההתחלתית של הכדור. מכיוון שהכדור נזרק בזווית כלשהי, שנסמן אותה ב-\(\theta\), המהירות הזו מתפרקת לשני רכיבים – אחד בציר \(x\) (אופקי) ואחד בציר \(y\) (אנכי). אופן הפירוק הזה ניתן לתיאור כמשולש ישר זווית שהיתר שלו הוא וקטור המהירות \(v_{0}\), והניצבים הם הרכיבים של \(v_{0}\) בצירי \(x,y\): נסמן אותם \(v_{0}^{x},v_{0}^{y}\) בהתאמה. הגודל שלהם נקבע על פי הגודל של \(v_{0}\) ו-\(\theta\) – זהו אחד מהשימושים הבסיסיים של הפונקציות הטריגונומטריות. מקבלים ש-\(v_{0}^{x}=v_{0}\cos\theta\) ו-\(v_{0}^{y}=v_{0}\sin\theta\).

בציר \(x\) אין תאוצה כלל במשך כל תנועת הכדור, ולכן המהירות של הכדור בציר \(x\) היא פונקציה קבועה שאינה תלויה בזמן \(t\): \(v^{x}\left(t\right)=v_{0}^{x}\). מהפונקציה הזו ניתן לקבל חיש קל את פונקצית המיקום בציר \(x\) ביחס לזמן: אנחנו יודעים שהמהירות היא נגזרת המיקום (זוכרים? מהירות הייתה הדוגמה ה"קלאסית" שלנו לנגזרת), ולכן אם נמצא פונקציה קדומה של \(v^{x}\left(t\right)\), מצאנו את פונקצית המיקום. פונקציה קדומה של קבוע קל למצוא: \(x\left(t\right)=t\cdot v_{0}^{x}\) היא דוגמה לפונקציה שכזו. אל תתנו לסימונים שלי לבלבל אתכם – המשתנה של הפונקציה הוא \(t\), ולפונקציה עצמה קוראים \(x\), כי היא מתארת את המיקום בציר \(x\). אלו סימונים שמאוד מבלבלים למי שרגיל כל היום לגזור פונקציות שנראות כמו \(f\left(x\right)\) אבל בדיוק בגלל זה חשוב לראות דרכי סימון אחרות – כך אפשר לראות שבאמת מבינים מה הולך בתרגיל ואת מה גוזרים ואיך ומה, ולא רק שפועלים אלגוריתמית ובכל פעם שרואים \(x\) איפה שהוא רצים לגזור אותו.

זוכרים שאמרנו שלכל פונקציה יש אינסוף פונקציות קדומות, שנבדלות זו מזו בקבוע? אז איך אנחנו יודעים ש-\(x\left(t\right)\) שהצעתי היא ה"נכונה" למודל שלי? התשובה היא שלא יודעים מייד, אלא צריכים להשתמש בתנאי התחלה. אני יודע שבזמן \(t=0\) אני עומד בראשית הצירים – למה? כי ככה נוח לי לסמן את ראשית הצירים, בתור המקום שבו אני עומד. לכן צריך להתקיים \(x\left(0\right)=0\), וזה אכן מה שקורה עבור הפונקציה שלי (אבל עבור כל פונקציה מהצורה \(t\cdot v_{0}^{x}+C\) עם \(C\ne0\) זה לא היה קורה, ולכן הבחירה ב-\(C=0\) הייתה בחירת הקבוע הנכונה). אם כן, \(x\left(t\right)=t\cdot v_{0}^{x}\) היא פונקציה שמתארת נכונה את מסלול הכדור שלי בציר \(x\) כל עוד הכדור לא פגע באדמה. עכשיו כבר מותר לגלות שמה שעשינו כשחיפשנו את \(x\left(t\right)\) היה לפתור משוואה דיפרנציאלית: הייתה נתונה לנו משוואה שמערבת נגזרת של פונקציה כלשהי, וממנה מצאנו את הפונקציה עצמה. כמובן שהמשוואה שלנו הייתה פשוטה מאוד, אבל זו התחלה.

השלב הבא הוא למצוא את \(y\left(t\right)\) – הפונקציה שמתארת את הגובה כפונקציה של הזמן. כאן הסיטואציה יותר מורכבת בגלל שהמהירות של הכדור משתנה עם הזמן, בגלל שפועל עליה כוח הכובד. גם כאן אנו עומדים לפתור משוואה דיפרנציאלית אבל מעט יותר מסובכת, ובהתאם נציג בצורה קצת יותר מדויקת את מה שאנחנו עושים. מה כבר ידוע לנו על הפונקציה \(y\left(t\right)\)? ידוע לנו תנאי ההתחלה \(y\left(0\right)=0\) (בחרתי לסמן את הגובה שלי בזמן 0 בתור 0; אם אני אשאל את אותה שאלה על זריקת כדור מבניין, למשל, אצטרך לבחור כאן תנאי התחלה שונה שיוביל לפתרון שונה). ידוע לנו גם כי \(y^{\prime}\left(0\right)=v_{0}^{y}\) – המהירות בזמן 0 היא בדיוק זו שנתתי לכדור בעצמי. בנוסף, ידוע לנו ש-\(y^{\prime\prime}\left(t\right)=-g\) כאשר \(g\) הוא קבוע תאוצת הכובד, והוא שלילי בגלל שהתאוצה מגדילה את מהירות הכדור בכיוון השלילי – "למטה". מכל פיסות המידע הללו צריך להרכיב את \(y\left(t\right)\) איכשהו.

השלב הראשון הוא זה: אם \(y^{\prime\prime}\left(t\right)=-g\) אז אחרי אינטגרציה מקבלים ש-\(y^{\prime}\left(t\right)=-gt+C\) עבור \(C\) כלשהו. כדי למצוא את \(C\), יש להשוות לאפס: \(v_{0}^{y}=y^{\prime}\left(0\right)=-g\cdot0+C=C\). כלומר, קיבלנו ש-\(C=v_{0}^{y}\) ולכן \(y^{\prime}\left(t\right)=-gt+v_{0}^{y}\). כעת צריך לבצע עוד אינטגרציה; איך עושים אינטגרציה לפונקציה שאינה קבוע? מכיוון שהפונקציה היא פולינום גם זה לא קשה במיוחד לביצוע ומקבלים \(y\left(t\right)=-g\frac{t^{2}}{2}+v_{0}^{y}t+C\) וכל שנותר הוא למצוא את ה-\(C\). השוואה ל-\(y\left(0\right)=0\) מראה לנו ש-\(C=0\) ולכן \(y\left(t\right)=-\frac{g}{2}t^{2}+v_{0}^{y}t\).

הגורם הריבועי בפונקציה \(y\left(t\right)\) הוא שגורם לכך שאם נצייר את מסלול התנועה של הכדור, הוא לא יהיה קו ישר אלא צורה שנקראת פרבולה. מכיוון שהסימן של המקדם של \(t^{2}\) הוא שלילי, זוהי פרבולה "בוכה", מה שמתאים לאופן האינטואיטיבי שבו אנו חושבים על מסלול תנועתו של כדור שנזרק. אני משער שלרובכם הרעיון הזה כבר טבעי עד שאתם לא שמים אליו לב בכלל, אבל לדעתי זה פשוט נפלא מה שהלך פה – על ידי חישוב מתמטי בלבד, במודל מופשט למדי, קיבלנו תיאור גרפי של האופן שבו הכדור צריך להתעופף. לא לקחנו את צורת התעופפות הכדור כאקסיומה או כגורם הבסיסי במודל; בתור גורמים בסיסיים לקחנו הנחות בסיסיות יותר (המרכזית – פעולת כוח הכובד) ומהן הסקנו את צורתו של מסלול הכדור. הכוח הנבואי הזה שנותנת לנו המתמטיקה הוא לדעתי דבר מרשים ביותר.

טוב, הבה ונמשיך. כעת אנו יודעים בדיוק איך מסלול תנועתו של הכדור נראה, והדבר הבא שאנו רוצים לדעת הוא מתי הכדור יפגע באדמה – עבור איזה \(t\) זה מתקיים. במילים אחרות, לפתור את המשוואה \(-\frac{g}{2}t^{2}+v_{0}^{y}t=0\). פתרון אחד הוא \(t=0\) אבל הוא מנוון ולא מעניין – אנחנו רוצים לדעת מתי הכדור נופל שוב לאדמה, לא מתי הוא היה בהתחלה בגובה אפס. אז אם אנחנו מניחים ש-\(t\ne0\) אפשר לחלק בו, להעביר אגפים ולקבל \(\frac{g}{2}t=v_{0}^{y}\), כלומר \(t=\frac{2v_{0}^{y}}{g}\). באופן לחלוטין בלתי מפתיע אנו רואים שככל שהמהירות ההתחלתית גבוהה יותר, כך הזמן גדול יותר, וככל שתאוצת הכובד גדולה יותר, כך הזמן קטן יותר. זה אולי נראה אידיוטי לציין זאת, אבל בחינה "איכותית" כזו של המשואוות שמקבלים היא דרך טובה לוודא שלא עשינו טעויות חישוב בדרך (כמובן, לפעמים צצות תוצאות מפתיעות ואז אנחנו שוברים את הראש בחיפוש אחר טעות שלא קיימת).

כעת, המרחק שהכדור עבר בציר \(x\) עד פגיעתו באדמה הוא בדיוק \(x\left(\frac{2v_{0}^{y}}{g}\right)=\frac{2v_{0}^{y}v_{0}^{x}}{g}\). משוואה סימטרית ויפה, ועכשיו סיימנו ואפשר… אה, רגע. מה בכלל רצינו לעשות, שוב?

המטרה שלנו, כזכור, הייתה למצוא את \(\theta\) האופטימלי עבור הזריקה, כלומר זה שעבורו המרחק בציר \(x\) שנעבור יהיה הגדול ביותר. עשינו המון חישובים וקיבלנו ביטוי שבו \(\theta\) בכלל לא מופיעה – איך כל זה עזר לנו בכלל?

טוב, אני משקר פה – ברור ש-\(\theta\) מופיע בתוצאה שלנו, פשוט באופן סמוי – הרי \(v_{0}^{y}=v_{0}\sin\theta\) ו-\(v_{0}^{x}=v_{0}\cos\theta\). אם נציב את זה לתוצאה, נקבל \(\frac{2v_{0}^{2}\sin\theta\cos\theta}{g}\). ייתכן שלחלקכם קופצת כרגע לעיניים זהות טריגונומטרית – \(\sin2\theta=2\sin\theta\cos\theta\). זו אחת מהזהויות הללו שכדאי לזכור בעל פה, עד כמה שזה מבאס לגלות שבכלל יש במתמטיקה משהו שצריך לזכור בעל פה (וטענה כמו "זה בדף נוסחאות אז לא צריך" היא קצת בעייתית בהתחשב בכך שצריך לזהות את הדברים הללו כשהם קופצים לנו לעיניים מהדף, ואת זה אפשר לעשות רק אם זוכרים את הנוסחה). אם כן, את מה שקיבלנו אפשר לתאר בתור \(\frac{v_{0}^{2}}{g}\sin2\theta\). וכעת נשאלת השאלה – עבור איזה ערך של \(\theta\) התוצאה שנקבל תהיה מקסימלית?

בואו נתאר עוד בעיה שבה אנחנו מחפשים ערך קיצוני כלשהו, הפעם מינימום – בעיית החתונה. חתונות הן עסק יקר, אך יש כאלו שסבורים שניהול נכון של כמות האורחים יכול לצמצם את הנזקים, עד כדי מאמרים שלמים העוסקים בכך. השורה התחתונה: לכל חתונה יש שורה של הוצאות קבועות שלא תלויות בכלל באורחים (החל בדי-ג'יי ותמיכה כספית ברב, וכלה בדגיגי פיראנה כמו "עיצוב השולחנות" ו"סידורי הפרחים"). בואו נסמן את המחיר הזה ב-\(A\). כמו כן, כל אורח עולה סכום כסף מסויים (מחיר המנה שלו וכדומה) – הבה ונסמן סכום זה ב-\(b\). לסיום, כל אורח גם מביא איתו צ'ק נחמד – הבה ונסמן ב-\(c\) את הסכום הממוצע שכל אורח מביא, וב-\(x\) נסמן את מספר האורחים. אז יש לנו את הנוסחה הבאה שמתארת את מחיר החתונה עבורנו: \(f\left(x\right)=A+\left(b-c\right)x\). אם \(c\) גדול מ-\(b\) (וזו הנחת יסוד של המאמר) אז די בבירור ככל שיהיו יותר אורחים כך הנזק יקטן, ובשלב מסויים ההפסד שלנו יהפוך להיות שלילי – נרוויח! זה יקרה כאשר \(A+\left(b-c\right)x<0\), כלומר כאשר \(x>\frac{A}{c-b}\) – אתם מוזמנים לחשב בעצמכם כמה זה יוצא.

בעולם האמיתי זה לא עובד משתי סיבות. ראשית, יש גבול לכמות האורחים שאולמות מוכנים לסבול, וקרוב לודאי שאולמות גדולים יותר ידרשו יותר כסף. אבל בואו נעזוב את זה ונתמקד במשהו מעניין שנאמר במאמר עצמו – יותר אורחים פירושו הזמנה של אנשים פחות קרובים, ולכן כאלו שמשלמים פחות. כלומר, אפשר לחשוב על \(c\) לא כעל קבוע, אלא כעל משהו שהוא בעצמו פונקציה של \(x\), ופונקציה שיורדת עם הזמן (ה"רווח" הממוצע שלנו מהאורחים יורד ככל שאנו מזמינים אורחים יותר מרוחקים. כלומר, \(f\left(x\right)=A+\left(b-c\left(x\right)\right)x\). מה שאנחנו רוצים לעשות הוא למצוא את \(x\) האופטימלי עבורנו – כזה שמבטיח שההפסד שלנו הוא הקטן ביותר האפשרי (כפי שראינו, לא תמיד קיים כזה – אם \(c\left(x\right)\) קבוע הגדול מ-\(b\) זה לא קורה). איך עושים את זה?

בפוסט הבא נתאר איך מטפלים בשתי הבעיות הללו, ואיך באופן כללי מוצאים נקודות מינימום ומקסימום של פונקציה (ועוד דברים). הפתרון, כמובן, עובר דרך הנגזרת.

נוסחת אוילר, ואיך היא קשורה למתנד הרמוני

הנוסחה \(e^{i\pi}+1=0\) זכתה לפופולריות רבה בתור "הנוסחה היפה ביותר במתמטיקה", ואני נוטה להסכים – יש משהו מאוד אלגנטי ונאה בנוסחה הזו (אמנם, אני חושב שבמתמטיקה מגיעים מתישהו לשלב שבו היופי האמיתי לא נמצא בנוסחאות, אלא ברעיונות מורכבים יותר – וכשמגיעים לשם, נוסחת אוילר מחווירה לעומת חלק מהדברים שאפשר לגלות). מה שמרשים בה הוא האופן שבו היא קושרת את חמשת הקבועים ה"בסיסיים" במתמטיקה – \(0,1,e,\pi,i\). בפוסט הזה אני מקווה להסביר מעט על האופן שבו הנוסחה הזו צצה ומדוע היא אינה עד כדי כך בלתי צפויה – במילים אחרות, מדוע סביר שיהיה קשר בין ערכים אלו דווקא. אני מקווה שאחרי היכרות קצרה עם מאחורי הקלעים של הנוסחה הזו, היא תהיה רק יפה יותר.

נתחיל מתיאור קצר של מרכיבי הנוסחה, שיושפע מהפוסטים שכתבתי לא מזמן על פונקצית האקספוננט ופונקציות הסינוס והקוסינוס. את \(1\) אין צורך להכיר לאף אחד – הוא היה קיים משחר ההיסטוריה, ומהווה את הצעד הראשון בדרך לבניית המספרים הטבעיים. לעומתו, \(0\) היה שנוי במחלוקת אלפי שנים והפך לחלק מהסטנדרט רק בסוף המאה ה-19. שניהם חשובים בהיותם מספרים "נייטרלים" ביחס לאחת מפעולות האריתמטיקה: \(0+x=x\) ו-\(1\cdot x=x\). במבנים אלגבריים שמנסים להכליל את השלמים תמיד יהיה מצוי איבר שמתפקד כ-\(0\) ואיבר שמתפקד כ-\(1\). בפרט, בהגדרה של שדה תמיד נדרש קיומם של \(0,1\) ושיהיו שונים אלו מאלו – לא נדרשים שום איברים אחרים, ובפרט גם הקבוצה \(\left\{ 0,1\right\} \) מהווה בעצמה שדה. מכאן ש-\(0,1\) הם אכן "טבעיים" ולא סתם מספרים שנבחרו שרירותית לנוסחה הזו.

המספר \(e\) הוצג בפוסט שעסק באקספוננט: כזכור, אקספוננט (\(\exp\left(x\right)\)) היא הפונקציה היחידה שנגזרתה שווה לעצמה וערכה ב-\(0\) (אחד מהמספרים ה"טבעיים" שדיברנו עליהם) הוא \(1\) (המספר ה"מעניין" השני). הראיתי בפוסט ההוא שניתן לחשוב על הפונקציה הזו כעל העלאה בחזקה של מספר מסויים: \(e\). כלומר, \(\exp\left(x\right)=e^{x}\) (ולכן \(e=\exp\left(1\right)\)).

המספר \(\pi\) כמעט ולא זקוק להצגה – הוא מוכר ביותר בתור היחס שבין היקף מעגל לקוטרו (בגאומטריה אוקלידית). בפוסטים שבהם הצגתי את הפונקציות הטריגונומטריות – סינוסים וקוסינוסים – הוא צץ באופן חצי-טבעי, תרתי משמע: הראיתי שהפונקציות הללו הן מחזוריות, עם מחזור של \(2\pi\). אם כן, מדוע הסימן המיוחד הוענק דווקא ל-\(\pi\) ולא ל-\(2\pi\) (למשל, היה אפשר לתת סימון מיוחד ליחס בין היקף מעגל לרדיוסו)? נימוק מעניין אחד הוא ששטח עיגול היחידה הוא \(\pi\) (ואכן, לפעמים נהוג להגדיר קבוע זה באמצעות שטח עיגול היחידה). נימוק מטופש אחר – אם נותנים את הסימון ל-\(\pi\), נוסחת אוילר יוצאת יפה יותר.

\(i\) הוא בכלל יצור מוזר בתכלית… אה, רגע, לא. \(i\) הוא מספר מרוכב המקיים \(i^{2}=-1\). כבר עסקתי באופן שבו המרוכבים נבנים באופן "טבעי" מהממשיים, כך שאיני הולך לחזור על הדיון הזה כעת. שאלה קצת יותר מעניינת היא מדוע הנציג ה"טבעי" ביותר של המספרים המרוכבים הוא דווקא שורש \(-1\); למה לא לקחת, למשל, שורש יחידה מסדר 3? יש שני מספרים מרוכבים לא ממשיים שכשמעלים אותם בחזקת 3 מקבלים 1: \(\omega=\frac{-1+\sqrt{-3}}{2}\) ו-\(\omega^{2}=\frac{-1-\sqrt{-3}}{2}\). המספרים הללו מעט יותר מסורבלים מאשר \(i\), שכן העלאה שלהם בריבוע לא נותנת מספר ממשי, ובכלל – הם דורשים הוצאת שורש למספר ממשי שאין לו שורש שלם (\(\sqrt{3}\)) וגועל נפש. לכן ככל הנראה יותר טבעי לבנות את המרוכבים בעזרת \(i\), שהוא שורש יחידה מסדר 4.

אם כן, אלו כל מרכיבי הנוסחה. איך מתרחש הפלא שכולם מתחברים יחד? שורש העניין נעוץ בשאלה מה בכלל המשמעות של העלאת \(e\) בחזקת מספר דמיוני – \(i\) כפול משהו. על העלאה בחזקה ממשית דיברתי די הרבה, אבל איך המרוכבים יכולים בכלל להיכנס לסיפור? זו נשמעת כמו רמאות. אני מכיר רק דרך אחת להסביר את העניין ולכן אשתמש בה, למרות שהיא מעט טכנית ועלולה להבהיל אנשים – הגרסה המלאה של נוסחת אוילר, \(e^{i\theta}=\cos\theta+i\sin\theta\). זו נוסחה שחושפת את הקשר העמוק שבין אקספוננט ובין הפונקציות הטריגונומטריות, וגם תסגור לנו פינה שנותרה פתוחה עד כה: הפתרון הכללי של משוואה דיפרנציאלית מסדר שני במקדמים קבועים (כשאין שורש מרובה – זה מקרה מסובך לכשעצמו שאין טעם לדבר עליו כעת).

נתחיל בהוכחה "יבשה" (שהיא לדעתי יפהפיה) לנוסחה הזו, ואז ננסה לתת אינטואיציה. כזכור, אנחנו עדיין תקועים עמוק בשלב שבו אנו מחפשים הגדרה בעלת משמעות ל-\(e^{i\theta}\). כזכור, ראינו כי ניתן לתאר את \(e^{x}\) באמצעות טור חזקות אינסופי: \(e^{x}=1+x+\frac{x^{2}}{2}+\frac{x^{3}}{3!}+\frac{x^{4}}{4!}+\dots\). מכיוון שקל מאוד לדבר על טורי חזקות גם בהקשר של מספרים מרוכבים, והתיאוריה עובדת גם שם פחות או יותר בשלמותה (למעשה, במובן מסויים התיאוריה יותר שלמה עבור מרוכבים, אך לא אכנס לכך כעת ברצינות – דוגמה היא התכנסות הטור של \(\frac{1}{1+x^{2}}\), שרדיוס התכנסותו הוא 1 אך בלי לדעת על קיומם של מרוכבים לא ברור מדוע), מתבקש להגדיר את \(e^{i\theta}\) גם כן באמצעות טורי חזקות – פשוט נציב \(i\theta\) במקום \(x\) ונראה מה נקבל. התוצאה היא טור שעדיין מתכנס, אבל כעת נראה שונה למדי מהטור ה"רגיל" – פתאום מתחילים לצוץ בו מינוסים, ומופעים של \(i\). אנחנו מקבלים: \(e^{i\theta}=1+i\theta-\frac{\theta^{2}}{2!}-i\frac{\theta^{3}}{3!}+\frac{\theta^{4}}{4!}+\dots\). כעת אפשר לבצע מניפולציות לטור ולפרק אותו לשני טורים. צריך לומר כאן אזהרה כלשהי – לא ניתן לעשות זאת לכל טור מתכנס. משפט מפורסם של רימן מראה שאם יש טור שמתכנס אך אינו מתכנס בהחלט (כלומר, \(\sum a_{n}\) מתכנס אך \(\sum\left|a_{n}\right|\) אינו מתכנס) אז אפשר, על ידי שינוי של סדר הסכימה של הטור, לקבל איזה סכום שרק נרצה, וגם להראות שסכום הטור שואף לאינסוף או "מזפזפ". המשפט המטורלל הזה ראוי לפוסט משל עצמו ואני מקווה לכתוב כזה בקרוב, אך עבור הטור "שלנו" זה לא תקף. וכך נוכל לקבל את הנוסחה הבאה: \(e^{i\theta}=\left(1-\frac{\theta^{2}}{2!}+\frac{\theta^{4}}{4!}-\dots\right)+i\left(\theta-\frac{\theta^{3}}{3!}+\frac{\theta^{5}}{5!}-\dots\right)\). מי שזוכר את הפוסט על הפונקציות הטריגונומטריות ודאי זוכר שהראיתי כי הטור שבסוגריים השמאליים הוא הטור של \(\cos\theta\), והטור בסוגריים הימנים הוא הטור של \(\sin\theta\), וזהו סוף הסיפור.

מכאן שההגדרה ה"טבעית" ל-\(e^{i\theta}\) מניבה את נוסחת אוילר. בנוסחה הזו יש לנו לעת עתה רק שני קבועים "חשובים" – \(e\) ו-\(i\). אם כן, הכל מתחיל מכך שאנו בוחרים להשתמש ב-\(e\) בתור הבסיס שלנו – אפשר היה אמנם לבחור בסיס אחר, אך כבר הסברתי מדוע הגיוני לבחור דווקא ב-\(e\). כעת, אלמלא \(i\) היה השורש של \(-1\), הנוסחה הייתה הולכת לאבדון – הפירוק המקסים של הטור של \(e^{i\theta}\) לשני טורים היה משתבש לגמרי. שימו לב מה היה הכרחי לעשות כדי לקבל מהטור של \(e^{x}\) את הטורים של \(\cos\) ו-\(\sin\): היינו צריכים להשאיר איבר אחד כמות שהוא, את הבא אחריו לכפול במספר מרוכב כלשהו \(z\), את הבא אחריו לכפול ב-\(-1\) אבל לא בשום דבר אחר, ואת הבא אחריו לכפול ב-\(-z\), ואז חוזר חלילה להתחלה. יש רק שני מספרים מרוכבים שמקיימים את התכונה הזו, שבעצם שקולה ל-\(z^{2}=-1\), והם \(i\) ו-\(-i\) (ואכן, אפשר היה באותו אופן להוכיח "נוסחת אוילר" עבור \(-i\); היינו מקבלים \(e^{-i\theta}=\cos\theta-i\sin\theta\), אבל זה לא שונה מהותית מהנוסחה שכבר יש לנו, ומכל אחת ניתן לגזור את השניה).

כעת נעבור לקצת אינטואיציה גאומטרית. על המספרים המרוכבים אפשר לחשוב באופן גאומטרי כמישור – המספר \(a+bi\) מייצג את הנקודה \(\left(a,b\right)\) במישור. המרחק של נקודה מראשית הצירים, אם מודדים מרחק באופן האוקלידי הרגיל, הוא \(\sqrt{a^{2}+b^{2}}\), ועל כן אפשר להגדיר את מעגל היחידה במישור המרוכב בתור כל המספרים \(a+bi\) כך ש-\(a^{2}+b^{2}=1\). כעת, הפלא ופלא: נתבונן במספר המרוכב שמוגדר על ידי \(a=\cos\theta\), \(b=\sin\theta\) עבור \(\theta\) כלשהו – כלומר, על \(e^{i\theta}\). המספר הזה מקיים \(a^{2}+b^{2}=\cos^{2}\theta+\sin^{2}\theta=1\) (זוהי אחת מהנוסחאות הבסיסיות ביותר הנוגעות לסינוס וקוסינוס, והוכחתי אותה באופן לא-גאומטרי "טהור" בפוסט שעסק בהם). מכאן ש-\(e^{i\theta}\) נמצא על מעגל היחידה, לכל \(\theta\). יותר מכך – לא קשה להשתמש ברציפות של \(\sin,\cos\) כדי להראות שכל נקודה על מעגל היחידה ניתנת להצגה בתור \(e^{i\theta}\) שכזה. יותר מכך – אם אנחנו כבר מוכנים לקבל גם את המשמעות ה"גאומטרית" של \(\sin,\cos\), אפשר להראות ש-\(e^{i\theta}\) הוא הנקודה שנמצאת על מעגל היחידה והזווית שיוצרים הישר שמחבר אותה עם הראשית והישר שמהווה ציר \(x\) היא בדיוק \(\theta\) (יש שתי זוויות כאלו, בעצם; אני מדבר על הזווית שמהווה את "כמות הסיבוב" שנדרש כדי להביא את ציר \(x\) לנוח על הקטע שמחבר את הראשית עם \(e^{i\theta}\)).

זה פותח פתח לתיאור של מספר מרוכב באופן כללי באמצעות אקספוננט: המספר \(re^{i\theta}\), כאשר \(r\ge0\) ממשי, מייצג את המספר המרוכב שמרחקו מהראשית הוא \(r\) (דהיינו, \(r=\sqrt{a^{2}+b^{2}}\)) והזווית שלו ביחס לציר \(x\) היא \(\theta\). דרך הצגה זו מכונה "ההצגה הקוטבית" (או ההצגה הטריגונומטרית) של מספרים מרוכבים, ולעתים קרובות היא נוחה יותר מן ההצגה ה"רגילה" של \(a+bi\) (למשל, לצורך העלאה בחזקה). באופן כללי במתמטיקה נוח לעתים לעבור למערכת קוארדינטות קוטבית שכזו, שבה נקודה נמדדת על ידי מרחק מהראשית וזווית ולא על ידי מרחק בשני צירים מאונכים זה לזה, כך שזוהי אינה הצגה בלעדית למספרים מרוכבים. אגב, בבית הספר לעתים קרובות משתמשים בקיצור \(cis\theta\) כדי לתאר את \(\cos\theta+i\sin\theta\) במקום \(e^{i\theta}\); החסרון של דרך הצגה זו היא שבהצגת האקספוננט אפשר להמשיך ולבצע את כל פעולות חשבון החזקות הרגילות; כך למשל \(e^{i\theta}\cdot e^{i\tau}=e^{i\left(\theta+\tau\right)}\) (כמובן, יש להוכיח זאת; אך אם תעיפו מבט בהוכחה לכך שנתתי בפוסט העוסק באקספוננט תראו שהיא עובדת ככתבה וכלשונה גם כאן – ולמעשה, היא יותר כללית אפילו מאשר עבור "רק" מספרים מרוכבים; מה קורה אם ה-\(x\) של האקספוננט הוא מטריצה?).

שימו לב שההגדרה שלי של \(e^{i\theta}\) "עובדת" גם אם אני לא יודע מהם סינוסים וקוסינוסים – נוסחת אוילר היא משפט, ולא סתם הגדרה (אף כי בספרים רבים מעדיפים דווקא כן להגדיר את \(e^{i\theta}\) באמצעות הנוסחה). מכאן עולה דרך נוספת ומעניינת להגדיר את סינוס וקוסינוס: אלו הפונקציות שמתארות את ההיטל של \(e^{i\theta}\) על הציר הממשי והציר המדומה. כלומר, אפשר לחשוב על סינוס וקוסינוס (שהן פונקציות ממשיות) כנובעות לא מגאומטריה ולא ממשוואות דיפרנציאליות, אלא מאנליזה מרוכבת! למעשה, זוהי אפילו הגדרה לא רעה בכלל – בעזרת נוסחת אוילר מיידית מקבלים את טורי הטיילור של סינוס וקוסינוס, ומכאן נוסחאות הגזירה שלהם נובעות מיידית, ומכאן שאר התכונות מתקבלות במהירות. יותר מכך – ניתן להשתמש בתכונות של \(e^{i\theta}\) כדי לגזור תכונות של סינוס וקוסינוס. הנה דרך חדשה להוכיח את נוסחת הסכום: מכיוון ש-\(e^{i\left(\theta+\tau\right)}=e^{i\theta}\cdot e^{i\tau}\), אפשר לכתוב את הנוסחה הזו גם בעזרת סינוסים וקוסינוסים, ומקבלים:

\(\cos\left(\theta+\tau\right)+i\sin\left(\theta+\tau\right)=\left(\cos\theta+i\sin\theta\right)\left(\cos\tau+i\sin\tau\right)=\left(\cos\theta\cos\tau-\sin\theta\sin\tau\right)+i\left(\sin\theta\cos\tau+\cos\theta\sin\tau\right)\)

והשוואת המקדמים הממשי והמדומה של שני האגפים נותנת את נוסחאות הסכום ה"רגילות". זו הוכחה נחמדה למדי כי בה קל מאוד לזכור איך קורה שהסכום עבור קוסינוס מורכב ממכפלות "הומוגניות" ויש בו מינוס, ואילו עבור סינוס הסכום הוא "מעורבב" (כמובן, בתנאי שזוכרים איך מתנהג כפל מרוכבים).

ובכן, נוסחת אוילר הכללית, \(e^{i\theta}=\cos\theta+i\sin\theta\) היא מרתקת ומעניינת ויפה – אעז לומר שאפילו יותר יפה מהנוסחה ה"פרטית" של \(e^{i\pi}+1=0\), בדיוק בגלל שיש יותר דברים מעניינים שמתקשרים אליה, אבל כעת הגיע הזמן לחזור לנוסחה ה"פרטית" ולהבין איך הקבוע שנותר בחוץ עד כה – \(\pi\) – נכנס לעסק.

ובכן, כפי שכבר אמרתי, \(\pi\) קשור בקשר הדוק לסינוס וקוסינוס, שכפי שראינו, צצים באופן טבעי כשעוסקים באקספוננט מרוכב, וכפי שראינו – הם קשורים בקשר עמוק למעגלים, כך שאין פה הפתעה של ממש. \(e^{i\pi}\) היא הנקודה שמתקבלת כשהולכים בדיוק חצי מעגל (כי מחזור שלם של סינוס וקוסינוס, שמציין חזרה לנקודת ההתחלה, הוא \(2\pi\)) ומכיוון שהטיול מתחיל ב-\(\left(1,0\right)\), אחרי הליכה של \(\pi\) "צעדים" נגיע לקצה השני של המעגל, \(\left(-1,0\right)\). על כן \(e^{i\pi}=-1\). לעתים מסתפקים בהצגת הנוסחה הזו בתור "נוסחת אוילר היפה", אבל שיפור קוסמטי מתקבל על ידי חיבור 1 לשני האגפים וקבלת \(e^{i\pi}+1=0\), ובכך השגנו שתי ציפורים במכה אחת – עברנו מ-\(-1\) ה"לא טבעי" ל-\(0,1\) ה"טבעיים"שקשקשתי כל כך הרבה על למה הם טבעיים בתחילת הפוסט. כלומר, יש משהו מלאכותי בהעברת הנוסחה לצורה ה"יפה" שלה. שימו לב ש-\(e^{i2\pi}=1\), כך שאם היינו משתמשים בסימון מיוחד לא עבור \(\pi\) אלא עבור \(2\pi\) היינו מקבלים נוסחה דומה ובמובנים מסויימים יפה יותר, כי אין בה את העברת האגפים ה"מלאכותית".

כעת לסגירת החוב שלי בנוגע למשוואות דיפרנציאליות. כזכור, עסקתי במשוואות מהצורה \(af^{\prime\prime}+bf^{\prime}+f=0\) (כש-\(a,b,c\) מקדמים ממשיים קבועים), וטענתי שהפונקציה \(e^{\lambda x}\) מהווה פתרון למשוואה זו, כאשר \(\lambda\) הוא שורש של המשוואה הריבועית \(ax^{2}+bx+c=0\), וכל עוד יש למשוואה זו שני פתרונות שונים זה מזה, הכל אחלה כי אנחנו מקבלים שני פתרונות שונים מהותית למשוואה הדיפרנציאלית, שבאמצעותם ניתן לבנות כל פתרון אחר. הבעיה צצה כשלמשוואה \(ax^{2}+bx+c=0\) לא היה פתרון ממשי כלל – למשל, המשוואה \(x^{2}+1=0\). במקרה זה, כמו שאמרתי קודם, יהיו למשוואה בהכרח שני פתרונות מרוכבים שונים זה מזה, כך שהאחד הוא הצמוד של השני. כאן "נתקעתי" כי לא היה לי מושג מהו \(e^{\lambda x}\) במקרה זה, ובכל מקרה לא הייתה לי סיבה להניח שהפונקציה הזו עדיין תקיים את המשוואה.

למרבה המזל, עכשיו אנחנו חכמים יותר. חקרנו את המשוואה \(f^{\prime\prime}+f=0\) (שמתאימה ל-\(x^{2}+1=0\)) באופן עצמאי וגילינו באופן זה את קיום הפונקציות \(\cos,\sin\) שפותרות אותה. נוסחת אוילר השלימה את החקירה הזו, כשקשרה את הפונקציות הללו שמצאנו לפונקציית האקספוננט שפתרה לנו את המשוואה במקרה הממשי. לכן משתלם לנו להגדיר את \(e^{\lambda x}\) באמצעות נוסחת אוילר: דהיינו, אם \(\lambda=r+i\theta\), אז \(e^{\lambda x}=e^{rx}\cdot e^{i\theta x}=e^{rx}\left(\cos\theta+i\sin\theta\right)\). אם תנסו לגזור את היצור הזה על פי כללי הגזירה הרגילים של פונקציות ממשיות תגלו כי אכן \(\left(e^{\lambda x}\right)^{\prime}=\lambda e^{\lambda x}\), כפי שאנו מצפים מאקספוננט (קודם כל גזרו את \(e^{ix}\) ותראו שאכן מקבלים \(ie^{ix}\); מכאן זה עניין של חוקי האריתמטיקה הרגילים של נגזרות). לכן כשמציבים את \(e^{\lambda x}\) בנוסחה מקבלים \(\left(a\lambda^{2}+b\lambda+c\right)e^{\lambda x}\) שאכן שווה ל-\(0\), כנדרש.

הבעיה עם \(e^{\lambda x}\) בתור פתרון הוא שאין מדובר על פתרון ממשי – הרי זוהי פונקציה מרוכבת. זה אמנם לגיטימי לכשעצמו ואפילו מעניין – הנה צצים פתרונות מרוכבים במקומות שבהם לא ציפינו להם – אבל אנחנו מעדיפים פתרונות ממשיים. הפאנץ' הוא שאפשר "לשלוף" את סינוס וקוסינוס מתוך הפתרונות \(e^{\lambda x}\) שמצאנו – גם הם מהווים צירוף לינארי כלשהו שלהם (כשמרשים מקדמים מרוכבים). לשם כך, ראשית כל שימו לב לכך ש-\(e^{-i\theta}=\cos\theta-i\sin\theta\) (לא קשה לראות זאת) ועל כן \(e^{i\theta}+e^{-i\theta}=2\cos\theta\), כלומר \(\cos\theta=\frac{e^{i\theta}+e^{-i\theta}}{2}\), ובדומה \(\sin\theta=\frac{e^{i\theta}-e^{-i\theta}}{2i}\). אם תרצו, אלו הנוסחאות ה"הפוכות" לנוסחת אוילר, והן יפות בפני עצמן; כשאני מדבר על הגדרה של סינוס וקוסינוס באמצעות האקספוננט המרוכב, זו השורה התחתונה שאני מדבר עליה – להגדיר את הפונקציות הללו באמצעות המשוואות הללו (וזו אכן דרך נפוצה למדי להגדיר אותן). הנוסחאות כמובן תקפות גם אם נכפול את שני האגפים שלהם במספר ממשי כלשהו, ומכאן נובעת הנוסחה הכללית: אם \(\lambda=r+i\theta\) אז \(e^{rx}\cos\left(\theta x\right)=\frac{e^{\lambda x}+e^{\overline{\lambda}x}}{2}\), ובדומה עבור סינוס, \(e^{rx}\sin\left(\theta x\right)=\frac{e^{\lambda x}-e^{\overline{\lambda}x}}{2}\). מכיוון ששתי הפונקציות הללו התקבלו כצירוף לינארי של שני פתרונות למשוואה הדיפרנציאלית המקורית, גם הם מהווים פתרון – אבל פתרון ממשי, ולא קשה להראות שהם "בלתי תלויים" במובן זה שכל פתרון אחר ניתן לכתיבה באמצעות צירוף לינארי שלהם (כמובן שפתרון מרוכב ידרוש צירוף לינארי עם מקדמים מרוכבים).

כאן הבה וניישם את מה שלמדנו למקרה שהבאתי כמוטיבציה לכל זה – תנועה הרמונית פשוטה.

כזכור, עבור תנועה הרמונית פשוטה הגענו למשוואה \(f^{\prime\prime}=-\frac{k}{m}f\), כאשר \(f\) הייתה פונקציה שמתארת את מיקום האובייקט שנע בתנועה הרמונית פשוטה, \(k\) תיאר את "קבוע הקפיץ" שמושך אותו – ככל שהוא יותר גדול, על הגוף מופעל יותר כוח – ו-\(m\) תיאר את מסת הגוף, כלומר את התנגדותו להאצה, אבל אפשר לחשוב על המערכת גם במובנים יותר מופשטים, לכל \(f\) (לא רק של מרחק) שמקיימת משוואה כזו. לכן נוח לכרוך את \(k,m\) לפרמטר אחד שמאפיין את המערכת, ועם קצת ראיית הנולד הכי טוב להגדיר \(\omega^{2}=\frac{k}{m}\) ולקבל את המשוואה \(f^{\prime\prime}=-\omega^{2}f\). מדוע ריבוע? שכן המשוואה האופיינית שמתקבלת מהמשוואה הדיפרנציאלית הזו היא \(x^{2}=-\omega^{2}\), ופתרונותיה הם \(\lambda=\pm i\omega\), וכך חמקנו מלהכניס שורשים לתמונה. מכיוון שפתרונות המשוואה האופיינית הם מדומים טהורים, אקספוננט ממשי הוא לא חלק מהפתרון; קיבלנו פתרונות פרטיים של \(\cos\left(\omega x\right)\) ו-\(\sin\left(\omega x\right)\). לכן הפתרון הכללי למשוואה הוא \(a\sin\left(\omega x\right)+b\cos\left(\omega x\right)\), וסיימנו.

אלא שעוד לא סיימנו, כי הפתרון הזה לא "יפה" מספיק – הוא סכום של שתי פונקציות, וקשה לנו לצייר את האופן שבו התנועה הזו מתנהגת בראש אם היא שני גלים שנלחמים אחד נגד השני. לכן גם כאן הכי נוח לעבור להצגה קוטבית. חשבו שנייה על הנקודה במישור \(\left(a,b\right)\); אפשר לחשוב עליה כעל נקודה שנמצאת במרחק \(A\) מראשית הצירים ויוצרת זווית \(\phi\)עם ציר \(x\), ממש כמו שהיה עבור מספרים מרוכבים. במקרה זה מתקיים \(a=A\cos\phi\) ו-\(b=A\sin\phi\), ולכן אנחנו מקבלים דרך אחרת לכתוב את הפתרון הכללי למשוואה: \(A\cos\phi\sin\left(\omega x\right)+A\sin\phi\cos\left(\omega x\right)\). זה כבר נראה דומה באופן חשוד לנוסחת הסכום של סינוסים, ואכן – זה שווה ל-\(A\sin\left(\omega x+\phi\right)\), וזהו הפתרון הכללי שבדרך כלל אוהבים לתת. הסכום של סינוס וקוסינוס הפך לגל סינוס בודד, שמתאפיין על ידי שלושה פרמטרים: \(\omega\), שמגדיר את התדירות של התנודה, כלומר כמה מהר היא מתחילה לחזור על עצמה; \(A\), שמגדיר את המשרעת של התנודה, כלומר מה הגדלים המקסימלים שאליהם היא עשויה להגיע (כמה רחוק העצם עשוי להגיע מנקודת שיווי המשקל), ו-\(\phi\) שמתאר את הפאזה של המערכת – מדד כלשהו ל"כמה עמוק בתוך התנודה" המערכת הייתה כשהתחלנו למדוד את הזמן. שימו לב למשהו שעשוי לבלבל כאן – אני משתמש באות \(x\) לסימון המשתנה של הפונקציה, אך חשוב להבין שמשתנה זה מתאר את הזמן – מלכתחילה הפונקציה שרצינו היא פונקציה שמתארת את מיקום האובייקט כתלות בזמן. לכן יותר ברור לכתוב \(A\sin\left(\omega t+\phi\right)\) בתור הפונקציה שלנו.

מה שעשינו עד כה היה לכתוב פתרון כללי למשוואה. כדי למצוא פתרון פרטי צריך למצוא את הפרמטרים \(A,\phi\) שמתאימים למקרה שאנחנו ממדלים; שימו לב ש-\(\omega\) כבר ידוע מראש. לצורך כך אפשר למדוד את מצב המערכת בזמן \(t=0\). כזכור, אנחנו רוצים לדעת הן את ערך הפונקציה עצמה ב-\(t=0\), והן את ערך הנגזרת הראשונה שלה ב-\(t=0\), כלומר מצב המערכת נקבע על ידי מיקום ומהירות האובייקט בזמן \(t=0\). המיקום הוא \(A\sin\left(\phi\right)\), והמהירות היא \(\omega A\cos\left(\phi\right)\). שימו לב למשהו מעניין שנובע מהמשוואות הללו – \(\omega\) אינו תלוי לא במיקום ההתחלתי של המערכת, ולא במהירות ההתחלתית שלה; הוא מושפע רק מקבועים "פנימיים" שלה. זו למשל הסיבה מדוע שעון מטוטלת הוא מדוייק: מטוטלת מתנהגת כמו מתנד הרמוני (לא באופן מושלם כי העולם האמיתי לא מושלם, אבל מספיק טוב – כל עוד אפשר להזניח את החיכוך עם האוויר וכל עוד גודל הזווית שיוצרת המטוטלת קטן דיו), ולכן אין זה משנה כמה נרים אותה לפני שניתן לה להתנדנד, או מה המהירות שבה נדחוף אותה – קצב ההתנדנדות שלה יהיה תלוי רק בקבועים "פנימיים" (במקרה הזה, הוא תלוי באורך החוט של המטוטלת ובכוח המשיכה של כדור הארץ; דבר נאה נוסף שעולה ממשוואות המטוטלת הוא שלמסת המטוטלת אין השפעה על קצב התנודה). מהו קצב התנודה? ובכן, מכיוון שהמחזור של \(\sin\) הוא \(2\pi\), ומכיוון ש-\(t\) מוכפל ב-\(\omega\), הרי שנשלים מחזור בכל פעם שבה \(\omega t\) יהיה כפולה של \(2\pi\), כלומר המחזור הוא \(T=\frac{2\pi}{\omega}\). הנה צץ לו פאי שוב, במערכת שאין לה שום קשר לגאומטריה של המישור (הרי המתנד ההרמוני המקורי שהבאתי כדוגמה – הגוף המחובר לקפיץ – היה חד ממדי).

ובכן, הגענו לסיומה של סאגת פאי-אקספוננט-סינוס-קוסינוס. אני מקווה שהצלחתי לשכנע לפחות חלק מהקוראים שפאי איננו יצור גאומטרי בלבד – וחשוב מכך, שהצלחתי להראות לקוראים שוב עד כמה המתמטיקה עוסקת בקשרים בין דברים שנראים שונים ולא קשורים זה לזה, אך בפועל הקשר ביניהם חזק והדוק מאוד: "האמנות של קריאה באותו שם לדברים שונים, ובשמות שונים לאותו הדבר".

נעים להכיר – סינוס וקוסינוס (גרסת המשוואה הדיפרנציאלית)

שרשרת הפוסטים הקודמים שלי, שהחלה ביום פאי, יועדה למטרה אחת – הגדרה של סינוס וקוסינוס באופן שהוא לחלוטין בלתי קשור לגאומטריה בשום צורה שהיא – ומכאן גם הכנסה של פאי למשחק המתמטי בדרך שהיא לחלוטין בלתי קשורה לגאומטריה בשום צורה שהיא. מנת הפתיחה שלי הייתה הגדרת פונקצית האקספוננט באופן בלתי גאומטרי שכזה, כשהמוטיבציה מגיעה מפתרון משוואות דיפרנציאליות; ובפוסט האחרון הגעתי למשוואה דיפרנציאלית שבה האקספוננט הממשי אינו מסוגל להועיל לנו עוד – המשוואה \(f^{\prime\prime}=-f\). זוהי נקודת המוצא למה שאעשה בפוסט הזה, שיהיה דומה למדי למה שעשיתי בפוסט על האקספוננט – נתחיל מכך שקיימים פתרונות למשוואה הזו, נחקור את תכונותיהם ובסוף נגיע למסקנה שאלו הם הסינוס והקוסינוס המוכרים לנו זה לא מכבר. חשוב להבהיר שמה שנעשה יהיה לצאת להרפתקאה בג'ונגל – זו לא הדרך הקצרה או הפשוטה ביותר, וגם לא רואים בה את הנוף באופן הטוב ביותר, וגם נשרטים כל הזמן מקוצים וענפים וצריך להיזהר מחיות טרף – אבל אני חושב שזו הרפתקאה טובה שכן היא מעניקה לנו נקודת מבט שונה וזרה על הנושא מזו שניתן לראות כאשר פוסעים בשבילים המוכרים.

ובכן, הבה וניגש לעבודה. כפי שאמרתי בפוסט הקודם, למשוואות דיפרנציאליות מסדר שני יש משפט קיום ויחידות שמבטיח למשוואה \(f^{\prime\prime}=-f\) קיים פתרון יחיד אם דורשים גם שני תנאי התחלה מהצורה \(f\left(0\right)=a,f^{\prime}\left(0\right)=b\) עבור \(a,b\) ממשיים כלשהם (תנאי ההתחלה לא חייב להיות באפס, אבל זה יהיה הכי נוח עבורנו). כתמיד, נרצה שתנאי ההתחלה יהיו פשוטים ככל הניתן; תנאי ההתחלה \(f\left(0\right)=f^{\prime}\left(0\right)=0\) מניב בבירור את הפתרון \(f\left(x\right)=0\) שאיננו מעניין, ולכן הנסיון הבא יהיה לקבוע את אחד מתנאי ההתחלה להיות 1. נאמר, \(f\left(0\right)=0,f^{\prime}\left(0\right)=1\). משפט הקיום והיחידות מבטיח שקיימת פונקציה שעונה על תנאים אלו – בואו נסמן אותה בסימון הבלתי צפוי לחלוטין \(f\). ומה יקרה אם נבחר דווקא תנאי התחלה שב-\(0\) נותן לפונקציה 1, ולנגזרתה יתן \(0\)? אין שום בעיה – נסמן פתרון זה ב-\(g\). השלב הראשון בהרפתקאה שלנו יהיה להבין את הקשר שבין \(f\) ו-\(g\).

הבה ונתבונן רגע על הפונקציה \(f^{\prime}\). אמנם, הפונקציה הזו היא בראש ובראשונה הנגזרת של \(f\), אבל יש לה חיים משל עצמה. אם גוזרים אותה מקבלים את \(f^{\prime\prime}\), שכידוע שווה ל-\(-f\); ואם גוזרים אותה שוב, מקבלים את \(-f^{\prime}\). במילים אחרות, גם \(f^{\prime}\) מקיימת את המשוואה הדיפרנציאלית שממנה התחלנו. עם אילו תנאי התחלה היא מקימת אותם? ובכן, \(f^{\prime}\left(0\right)=1\), כי כך קבענו את \(f\) מלכתחילה; ו-\(\left(f^{\prime}\right)^{\prime}\left(0\right)=f^{\prime\prime}\left(0\right)=-f\left(0\right)=0\) – אבל אלו בדיוק תנאי ההתחלה של \(g\)! מכאן ש-\(f^{\prime}=g\). כבר צץ הקשר הראשון בין שני הפתרונות ה"מעניינים" של המשוואה עם תנאי ההתחלה הפשוטים ביותר שהצלחנו למצוא.

הצעד הבא פשוט: \(g^{\prime}=\left(f^{\prime}\right)^{\prime}=f^{\prime\prime}=-f\). כלומר, בעוד ש-\(g\) הייתה הנגזרת של \(f\), הרי ש-\(-f\) הוא הנגזרת של \(g\). שימו לב כמה מעט היינו צריכים להניח בשביל לקבל את "חוק הטבע" הזה ואת הא-סימטריה שטבועה בשתי הפונקציות הללו – האחת מניבה את חברתה, ואילו השניה מניבה את מינוס חברתה. לכן כל אחת מהפונקציות מעניינת בזכות עצמה ויש מקום לדבר על שתיהן בבת אחת.

עכשיו, משיש לנו מידע יותר מלא על מהן כל הנגזרות של \(f\) ו-\(g\), ניתן לבצע את אותו ניתוח שביצענו גם עבור אקספוננט – מציאת טורי הטיילור המתאימים לפונקציות. כזכור, עבור \(f\) טור הטיילור יהיה טור מהצורה \(\sum_{n=0}^{\infty}\frac{f^{\left(n\right)}\left(0\right)}{n!}x^{n}\). החישוב אינו מסובך במיוחד: \(f^{\left(0\right)}\left(0\right)=0\) על פי הגדרה; \(f^{\left(1\right)}\left(0\right)=g\left(0\right)=1\); \(f^{\left(2\right)}\left(0\right)=-f\left(0\right)=0\); \(f^{\left(3\right)}\left(0\right)=-g\left(0\right)=-1\); ואילו \(f^{\left(4\right)}=f\), ולכן הסדרה תתחיל לחזור על עצמה משם ואילך. במילים אחרות, סדרת הערכים שמתקבלת היא \(0,1,0,-1,0,1,0,-1,\dots\) (להבדיל מאקספוננט, שבה היא הייתה פשוט \(1,1,1,\dots\)). לכן הטור יהיה מהצורה \(x-\frac{x^{3}}{3!}+\frac{x^{5}}{5!}-\frac{x^{7}}{7!}+\dots\). ניתוח דומה עבור \(g\) מניב את הסדרה \(1,0,-1,0,1,0,-1,0,\dots\) ולכן את הטור\(1-\frac{x^{2}}{2!}+\frac{x^{4}}{4!}-\frac{x^{6}}{6!}+\dots\). כפי שניתן לראות, שני הטורים "משלימים" זה את זה; בפרט, אם נהפוך את סימני המינוס לפלוס ונחבר את הטורים, נקבל את הטור של \(e^{x}\). תופעה זו היא שמובילה לנוסחת אוילר, \(e^{i\theta}=\cos\theta+i\sin\theta\), אך דיה לצרה בשעתה.

כמובן, זה שכתבנו את טור הטיילור של \(f,g\) עדיין לא אומר שהטור אכן מתכנס אליהן – בשביל זה צריך לדבר על גודל השארית, כמו שעשיתי במקרה של אקספוננט. שם הראיתי שדי להצביע על כך שיש חסם על הערך שכל הנגזרות של \(\exp\)יכולות לקבל בתחום \(\left[0,x_{0}\right]\) כדי להוכיח שהטור מתכנס לפונקציה, וכדי לראות זאת פשוט שמנו לב לכך שגם כאשר גוזרים את \(\exp\) מקבלים אותה עצמה, ולכן חסם על \(\exp\) בתחום הזה (שקיים, כי היא רציפה והתחום סגור) מוביל לחסם על כל הנגזרות. אותו שיקול עובד גם כאן – אמנם, הנגזרת של \(f\) היא \(g\) ושל \(g\) היא \(-f\), אבל ניתן למצוא חסם על \(g,f\) "בו זמנית", ולכן גם על כל נגזרותיהן. מסקנה: שני הטורים שכתבתי לעיל אכן מתארים נכונה את \(f,g\). לאלו מכם שמכירים את הטורים הללו כבר בתור הטורים של \(\sin\) ו-\(\cos\) כבר הגענו לקרקע יציבה כלשהי. עבור היתר מה שחשוב כאן הוא רק שמצאנו ביטוי "קונקרטי" לפונקציות הללו, שגם מאפשר לנו לחשב אותן אם נרצה.

נחזור כעת לציד תכונות מעניינות בג'ונגל, כשהמוטיבציה שלנו מגיעה ממה שאנחנו כבר יודעים על \(\sin\)ו-\(\cos\). הבה ונתבונן בפונקציה שמוגדרת על ידי \(h=f^{2}+g^{2}\). אם נגזור אותה, נקבל את הנגזרת \(h^{\prime}=2ff^{\prime}+2gg^{\prime}=2fg-2gf=0\) – במילים אחרות, \(h\) היא פונקציה שנגזרתה היא זהותית אפס, ולכן היא פונקציה קבועה (זהו אחד מהמשפטים הבסיסיים בחשבון אינפיניטסימלי, וגם משפט ברור אינטואיטיבית – הרי נגזרת היא קצב השינוי של פונקציה, ואם קצב השינוי הזה הוא תמיד אפס, הפונקציה בהכרח קבועה). האם אנחנו יודעים לחשב את הערך הקבוע של \(h\)? ודאי – \(h\left(0\right)=f^{2}\left(0\right)+g^{2}\left(0\right)=0+1=1\). מכאן ש-\(f^{2}\left(x\right)+g^{2}\left(x\right)=1\) לכל \(x\). נראה מוכר? זה גם מניב דרך נוספת לבטא את \(g\) באמצעות \(f\): \(g=\pm\sqrt{1-f^{2}}\). זוהי דרך הצגה "רמאית" במובן מסויים כי איננו יודעים באמת את הערך של \(g\left(x\right)\) בהינתן \(f\left(x\right)\); אנחנו יודעים שהוא \(\pm\sqrt{1-f^{2}\left(x\right)}\) אבל איננו יודעים אם זהו הערך החיובי או השלילי. נצטרך לאמץ דרך שונה לתקוף את השאלה הזו.

שימו לב למה שנובע מהתכונה שכרגע ראינו – מכיוון ש-\(g,f\) הן פונקציות ממשיות ומוגדרות לכל \(x\), נובע מכך בהכרח שהערכים ששתיהן מחזירות מצויים תמיד בתחום \(\left[-1,1\right]\), כי במספרים ממשיים, \(f^{2}\left(x\right)+g^{2}\left(x\right)=1\) מכריח את \(f\left(x\right),g\left(x\right)\) להיות קטנים או שווים ל-1 אחרת אחד מהם יהיה חייב להיות מספר מרוכב. יותר מכך – \(f,g\) רוקדות מעין "ריקוד" יחדיו – כאשר אחת גדולה (בערכה המוחלט), השניה חייבת להיות קטנה. האופן שבו הן משתלבות זו בזו ב"ריקוד" הזה והעובדה שהריקוד הוא מחזורי היא היעד המרכזי שלנו – אבל לצורך כך יש עוד תכונות שעלינו להיווכח בהן.

כל מי שהיה תלמיד תיכון ודאי זוכר את הנוסחאות המפלצתיות עבור \(\sin\left(x+y\right)\) ו-\(\cos\left(x+y\right)\). הבה וננסה לגזור נוסחאות שכאלו עבור \(f,g\) באמצעות הכלים שיש לנו עד כה (דהיינו, בלי שום גאומטריה). לצורך כך הבה וניזכר במשהו מהפוסט הקודם – אמרתי שבהינתן משוואה דיפרנציאלית מסדר שני (בלי מקדם חופשי) ושני פתרונות "בלתי תלויים" עבורה, אפשר לבנות כל פתרון אחר כצירוף לינארי של שני הפתרונות הללו, כשהמקדמים נקבעים על פי תנאי ההתחלה. כפי שניתן לנחש, \(f,g\) הם שני פתרונות "בלתי תלויים" שכאלו, ונראה זאת במפורש. נניח אם כן כי \(h\) היא פונקציה אשר מקיימת \(h^{\prime\prime}=-h\) וכמו כן \(h\left(0\right)=a\) ו-\(h^{\prime}\left(0\right)=b\). כעת נתבונן בפונקציה \(bf+ag\); בבירור אם נציב בה 0 נקבל \(a\) (כי \(f\) יתאפס ואילו \(g\) יהפוך ל-1). אם נגזור אותה, נקבל \(bf^{\prime}+ag^{\prime}=bg-af\), וכשמציבים 0 בנגזרת זו מקבלים בבירור את \(b\). כמו כן ברור כי \(bf+ag\) מקיימת את המשוואה הדיפרנציאלית המקורית שכן היא צירוף לינארי של \(f,g\). מסקנה ממשפט הקיום והיחידות? \(h=bf+ag\).

בואו ניקח כעת \(y\) ממשי כלשהו, ונגדיר פונקציה חדשה: \(h\left(x\right)=f\left(x+y\right)\). מכללי הגזירה הסטנדרטיים עולה ש-\(h^{\prime\prime}\left(x\right)=f^{\prime\prime}\left(x+y\right)=-f\left(x+y\right)=-h\left(x\right)\), כך שאת \(h\) אפשר לייצג כצירוף לינארי של \(f,g\). מהם המקדמים? \(a=h\left(0\right)=f\left(y\right)\), ו-\(b=h^{\prime}\left(0\right)=f^{\prime}\left(y\right)=g\left(y\right)\). מסקנה: \(f\left(x+y\right)=f\left(x\right)g\left(y\right)+g\left(x\right)f\left(y\right)\). נראה מוכר? באופן דומה אפשר להראות כי \(g\left(x+y\right)=g\left(x\right)g\left(y\right)-f\left(x\right)f\left(y\right)\). אני מאוד אוהב את ההוכחה הזו כי היא נותנת תובנה יפה על הנוסחאות הללו – הן לא סתם ערב רב של סינוסים וקוסינוסים שהושלכו באקראי, אלא צירוף לינארי של \(\sin x,\cos x\) כשהמקדמים מבוססים על \(\sin y,\cos y\).

מכאן הדרך להוכחה ש-\(f,g\) מחזוריות קצרה יחסית, אבל עדיין יש צעד מרכזי אחד שטרם ביצענו – עלינו להראות כי \(g\) מתאפסת היכן שהוא. הבה נניח בשלילה כי \(g\left(x\right)>0\) לכל \(x\ge0\) (עבור \(x=0\) אנו יודעים כי זה נכון: \(g\left(0\right)=1\)). מכיוון ש-\(f^{\prime}=g\), נובע מכך ש-\(f\) היא מונוטונית עולה עבור \(x\ge0\), דהיינו \(f\left(x\right)>0\) לכל \(x>0\). כעת, מכיוון ש-\(g^{\prime}=-f\), עולה מכך כי \(g\) היא מונוטונית יורדת לכל \(x>0\). עד כאן, שום דבר מפתיע – זהו בדיוק ה"ריקוד" של \(f,g\) שעליו דיברתי – כשהאחת עולה, השנייה יורדת. האינטואיציה כאן היא שקצב הירידה של \(g\), אם היא אינה מתאפסת אף פעם, חייב להתמתן עוד ועוד עם הזמן. קצב הירידה הזה הוא נגזרתה של \(g\), כלומר \(-f\), ולכן הטענה היא שהערך של \(-f\) חייב לגדול עם הזמן (הוא שלילי כל הזמן, ולכן כשאני אומר שהוא "גדל", הכוונה היא דווקא לכך שערכו המוחלט קטן – בהתחלה הוא \(-1\), אחר כך \(-0.5\) וכן הלאה). אלא שהערך של \(-f\) בתחילת ה"ריקוד" היה 0, ולכן הסיטואציה חייבת להיות כזו: ראשית ערכו של \(-f\) קטן, ואז פתאום המצב "מתהפך" וערכו מתחיל "לגדול". בפרט זה אומר שיש ל-\(-f\)נקודת מינימום בריקוד הזה, אבל משפט בסיסי מחשבון אינפיניטסימלי אומר שבנקודת המינימום הזו הנגזרת של \(-f\) תתאפס – ונגזרת זו היא בדיוק \(-g\)…

למרות שהטיעון הזה נשמע חצי נפנוף-ידיימי, הוא למעשה מאוד קונקרטי ולא נדרשת הרבה עבודה כדי לפרמל אותו לגמרי. השורה התחתונה היא מה שמעניין אותנו – קיימת נקודה \(t>0\) כך ש-\(g\left(t\right)=0\), ו-\(t\) הוא הערך הקטן ביותר שגדול מ-0 שמקיים זאת. מהו ערכה של \(f\) בנקודה זו? ובכן, \(f\left(t\right)=\pm\sqrt{1-g^{2}\left(t\right)}=\pm1\). אלא שלא ייתכן ש-\(f\) שלילי בנקודה זו, כי ב-0 התקיים \(f\left(0\right)=0\) ומאותו רגע והלאה \(g\) – הנגזרת של \(f\) – הייתה חיובית (כי \(t\) הנקודה המינימלית שבה \(g\) מתאפסת), ולכן \(f\) רק עלתה. מכאן ש-\(f\left(t\right)=1\). כעת אפשר להגיע למסקנה מעניינת מאוד: \(f\left(x+t\right)=f\left(x\right)g\left(t\right)+g\left(x\right)f\left(t\right)=g\left(x\right)\). במילים אחרות, \(g\) מתנהגת בדיוק כמו \(f\), פרט לכך שהיא "מקדימה" אותה בדיוק ב-\(t\) "צעדים" (כלומר, אם נזיז את הגרף של \(f\) \(t\) יחידות ימינה, הוא יזדהה עם הגרף של \(g\)).

כעת הניתוח נעשה פשוט בהרבה. מה קורה לפונקציות בקטע \(\left[t,2t\right]\)? בתחילתו, כזכור, \(g\left(t\right)=0\) ואילו \(f\left(t\right)=1\). מכיוון ש-\(f\) מתנהגת בקטע הזה כמו ש-\(g\) התנהגה בקטע \(\left[0,t\right]\) הרי ש-\(f\) פשוט תרד עד ל-\(0\): \(f\left(2t\right)=0\). בזמן הזה \(g\) היא בעלת נגזרת שלילית לכל אורך הדרך (כי הנגזרת שלה היא \(-f\) ו-\(f\) הרי חיובית בקטע זה) ולכן \(g\) תהיה מונוטונית יורדת בכל הקטע. עד להיכן היא תרד? כאן אפשר להשתמש בנוסחת הסכום: \(g\left(2t\right)=g^{2}\left(t\right)-f^{2}\left(t\right)=-1\). אם כן, הריקוד ממשיך – בקטע מ-\(t\) אל \(2t\), שתי הפונקציות יורדות מטה מרחק של יחידה אחת.

ומה קורה ב-\(\left[2t,3t\right]\)? ובכן, \(f\) כרגיל מחקה את \(g\): יורדת עד ל-\(-1\) (\(f\left(3t\right)=-1\)). על כן הנגזרת של \(g\) היא חיובית בכל הקטע ולכן \(g\) עולה בכל הקטע ומגיעה עד ל-0, שהרי \(g\left(3t\right)=g\left(2t\right)g\left(t\right)-f\left(2t\right)f\left(t\right)=0-0=0\).

ולבסוף, בקטע \(\left[3t,4t\right]\) \(f\) ממשיכה לחקות את \(g\) ועולה בעצמה ל-0, ואילו \(g\) ממשיכה לעלות (כי נגזרתה חיובית) ומגיעה עד ל-1: \(g\left(4t\right)=g^{2}\left(2t\right)-f^{2}\left(2t\right)=1\). זה אומר שב-\(4t\) חזרנו להתחלה – שוב \(f\) מאופסת ו-\(g\) מחזירה 1. מזה נובע מיידית ש-\(4t\) הוא מחזור של שתי הפונקציות הללו: \(f\left(x+4t\right)=f\left(x\right)g\left(4t\right)+f\left(4t\right)g\left(x\right)=f\left(x\right)\), ובדומה \(g\left(x+4t\right)=g\left(x\right)g\left(4t\right)-f\left(x\right)f\left(4t\right)=g\left(x\right)\) – וזה נכון לכל \(x\), כולל השליליים. הוכחנו (בלי שום גאומטריה) את המחזוריות של \(f,g\). יותר מכך – המעקב המדוקדק שלנו אחרי ההתנהגות של \(f,g\) מעלה שהסיטואציה הזו (\(f\) מקבלת 0, \(g\) מקבלת 1) התרחשה לראשונה ב-\(4t\) לאחר ההתרחשות שלה ב-0, ומכאן ש-\(4t\) הוא המחזור המינימלי של שתי הפונקציות הללו.

זהו – הוכחנו כרגע את התכונה החשובה ביותר של שתי הפונקציות. שימו לב כמה אנחנו כבר יכולים לומר: למשל, מניתוח ההתנהגות שביצענו ל-\(f\) ברור כי היא מתאפסת רק בערכים מהצורה \(k\cdot2t\) עבור \(k\) שלם; לכן אם נשתמש בהוכחה של אוילר לחישוב \(\sum\frac{1}{n^{2}}\) שהצגתי בעבר, נקבל שהסכום הזה הוא \(\frac{\left(2t\right)^{2}}{6}\). במילים אחרות, הצלחנו לחשב את סכום הטור בלי שום גאומטריה. זו נקודה טובה לעצור ולהודות באמת: \(f\left(x\right)\) הוא פשוט שם מיתמם ל-\(\sin\left(x\right)\), \(g\left(x\right)\) הוא שם מיתמם ל-\(\cos\left(x\right)\), ואילו \(\pi=2t\). אך לא ניתן לעשות זאת "סתם", שהרי \(\sin\left(x\right),\cos\left(x\right),\pi\) כולם יצורים גאומטריים ואי אפשר "להשתלט" עליהם ככה בלי להגיד כלום על גאומטריה. לכן, אם מתעקשים, אפשר להיפגש באמצע – עם קצת אנליזה (והגבול \(\lim_{x\to0}\frac{\sin x}{x}=1\) והוכחתו הגאומטרית הידועה לשמצה) אפשר להראות כי \(\sin^{\prime}\left(x\right)=\cos\left(x\right)\) ו-\(\cos^{\prime}\left(x\right)=-\sin\left(x\right)\) ומכאן חיש קל אפשר להראות ש-\(\sin,\cos\) הם הפתרונות למשוואה הדיפרנציאלית שעליה דיברתי. האם יש דרך אחרת? ובכן, אפשר להגדיר את \(\sin,\cos\) בצורה מעט שונה מהצורות שאנו מכירים – צורה שהיא מעין פשרה בין ההגדרה הגאומטרית ובין ההגדרות האנליטיות, ומשתמשת בפונקציה אנליטית המתארת שטח של עיגול. הניתוח של הפונקציה הזו כולל קצת אינפי "מלוכלך", ואיני רוצה להיכנס אליו כעת; אבל גם בו היעד המרכזי שמגיעים אליו, שהחל ממנו הכל ממשיך כרגיל, הוא נוסחאות הגזירה של סינוס וקוסינוס. דבר זה מראה כי במובן מסויים, הגישה שאני הצגתי היא ה"ישירה" ביותר, שכן ממנה נוסחאות הגזירה נובעות בצורה מיידית לחלוטין.

בפוסט הבא אפרע את החוב מהפוסט הקודם – אראה כיצד נפתרת בעזרת סינוס וקוסינוס המשוואה הדיפרנציאלית הכללית שהצגתי, ואכניס לתמונה סוף סוף את נוסחת אוילר.

הדרך מהאקספוננט לטריגונומטריה רצופה משוואות דיפרנציאליות מסדר שני

בפוסט הקודם עסקתי באופן שבו פונקציית האקספוננט, \(e^{x}\), "צצה באופן טבעי" בתור פתרון המשוואה הדיפרנציאלית \(f^{\prime}=f\) עם תנאי ההתחלה \(f\left(0\right)=1\). כעת אני רוצה להרחיב קצת יותר על פתרון משוואות דיפרנציאליות, כשהיעד הסופי הוא הגעה למשוואות שפתרונן דורש סינוסים וקוסינוסים (כפי שנראה, משוואות כאלו קשורות בקשר הדוק לפונקצית האקספוננט), ובכך לקבל מוטיבציה לא גאומטרית להגדרתן. ראשית אפרע חוב מהפוסט הקודם – אמרתי שפתרון המשוואה \(f^{\prime}=f\) ייתן לנו "קרש קפיצה" לפתרון משוואות אחרות – כעת אוכל להסביר מעט יותר למה התכוונתי.

הבה נסבך מעט את המשוואה הזו – נניח כי כעת היא \(f^{\prime}=a\cdot f\). האם אנו יודעים לפתור אותה? האינטואיציה אומרת לנסות ולהשתמש בפונקציה דומה ל-\(e^{x}\) שאותה מצאנו קודם, ולא צריך לחפש יותר מדי: \(e^{ax}\) היא פונקציה שפותרת את המשוואה הזו, ולכן פתרון כללי למשוואה הזו הוא מהצורה \(\lambda e^{ax}\), כש-\(\lambda\) נקבע על פי תנאי ההתחלה של המשוואה (כזכור, אחרי שקבענו תנאי התחלה למשוואה, דהיינו ערך ש-\(f\) מקבלת בנקודה כלשהי, נובע ש-\(\lambda e^{ax}\) הוא הפתרון היחיד למשוואה).

האקשן האמיתי מתחיל כשמגיעים למשוואות מהצורה \(f^{\prime}=a\left(x\right)f+b\left(x\right)\), כלומר כאלו שבהן המקדם של \(f\) הוא פונקציה שבעצמה תלויה ב-\(x\), ושיש בהן גם מקדם "חופשי" שגם הוא יכול להיות פונקציה כלשהי שתלויה ב-\(x\). כדי להתמודד עם משוואות כאלו כבר צריך לדעת לעשות אינטגרלים ויש מהומות, ולא אכנס לזה כעת (בסופו של דבר, אני לא מנסה כרגע להיות ספר לימוד במשוואות דיפרנציאליות). תחת זאת אעבור למשוואות מסדר שני, ואעשה זאת בעזרת מוטיבציה פיזיקלית שכבר הזכרתי לא מזמן – תנועה הרמונית פשוטה.

קל להבין מהי תנועה הרמונית פשוטה באמצעות דוגמה של גוף שמחובר לקפיץ שבתורו מחובר לקיר. כדי שכוח המשיכה לא יתערב בעניין, נניח שהקפיץ והגוף מונחים על שולחן והקפיץ מתוח באופן אופקי. כעת, כל עוד הקפיץ ב"מנוחה", לא קורה כלום; אבל אם נזיז את הגוף בכיוון המנוגד לקיר, הקפיץ יימתח; וכאשר נעזוב את הגוף, הקפיץ יתחיל למשוך את הגוף, כלומר להפעיל עליו כוח. הכוח הזה מתורגם לתאוצה של הגוף, כלומר לשינוי במהירותו; וזה מתורגם לשינוי במיקום הגוף; וזה מתורגם לשינוי באורך הקפיץ – הקפיץ מתחיל להתקצר, ולכן הכוח שהוא מפעיל על הגוף קטן. מתישהו הקפיץ יגיע לנקודת שיווי המשקל שלו ויפסיק לגמרי להפעיל כוח על הגוף, ולכן הגוף יפסיק להאיץ, אבל בינתיים הגוף כבר צבר מהירות כלשהי, ולכן הוא ימשיך בתנועתו ויתחיל לדחוס את הקפיץ, מה שיגרום לקפיץ להפעיל על הגוף כוח בכיוון המנוגד לכיוון תנועתו הנוכחי של הגוף. בסופו של דבר הגוף ייכנע ויתחיל לזוז לכיוון השני, גורר את הקפיץ איתו; ואז הקפיץ שוב יתארך, ויתחיל "למשוך" את הגוף חזרה לנקודת שיווי המשקל, וכן הלאה וכן הלאה. כל עוד כוחות חיצוניים לא מתערבים במשחק הזה, הוא יימשך בצורה מחזורית עד אין קץ. מחזורית, מה? הנה, כבר בתיאור הפיזיקלי המעורפל, צצים הסינוסים והקוסינוסים – הפונקציות המחזוריות ה"טבעיות" של המתמטיקה.

תיאור גרפי של מסה מחוברת לקפיץ

נעבור לתיאור המתמטי. אנחנו רוצים לתאר את מיקום הגוף כפונקציה של הזמן. בדרך כלל מסמנים את הפונקציה הזו בתור \(x\left(t\right)\) אבל זה כבר מבלבל מדי לטעמי, ולכן אקרא לה \(f\left(t\right)\) (שימו לב שכל התנועה היא חד ממדית, ולכן מספיק מספר בודד כדי לתאר את המיקום). המיקום מן הסתם צריך להימדד ביחס לאיזו ראשית צירים, וטבעי לבחור בנקודה שבה הקפיץ בשיווי משקל (כלומר, לא מפעיל כוח) בתור ראשית הצירים הזו. כעת, מבחינה פיזיקלית הכוח שקפיץ מפעיל על גוף הוא פרופורציוני למידת ההתארכות או הכיווץ של הקפיץ, ואצלנו מידת ההתארכות/כיווץ הזו היא בדיוק מיקום הגוף ביחס לראשית הצירים. דהיינו, הכוח שהקפיץ מפעיל על הגוף בזמן \(t\) הוא \(-k\cdot f\left(t\right)\), כאשר \(f\left(t\right)\) הוא כזכור מיקום הגוף באותו פרק זמן, ו-\(k\) הוא קבוע חיובי כלשהו התלוי רק בקפיץ. המינוס מתאר את העובדה שכאשר הקפיץ מתוח (ואז \(f\left(t\right)>0\)) הקפיץ מושך את הגוף אליו, וכאשר הקפיץ דחוס (\(f\left(t\right)<0\)) הקפיץ דוחה את הגוף ממנו והלאה.

כעת המהומה הדיפרנציאלית של המיקום-תלוי-בקצב-השינוי-של-המיקום-שתלוי-במיקום נכנסת לתמונה. לצורך פשטות המודל אני משתמש בגרסה הבסיסית ביותר של החוק השני של ניוטון: \(F=ma\), דהיינו התאוצה של הגוף היא פרופורציונית לכוח שמופעל עליו, כשקבוע הפרופורציה מכונה "מסה" והוא תמיד חיובי (אפשר לחשוב על המסה \(m\) בתור "כמות ההתנגדות להאצה" של הגוף). אבל מהי ה"תאוצה" הזו? כאמור, היא השינוי במהירות. ומהי המהירות? השינוי במיקום. כלומר, המהירות היא \(f^{\prime}\left(t\right)\) ואילו התאוצה היא \(f^{\prime\prime}\left(t\right)\). מכאן שקיבלנו את המשוואה הבאה: \(f^{\prime\prime}\left(t\right)=-\frac{k}{m}f\left(t\right)\). התקווה שלנו היא כי מהמשוואה הזו ניתן לחלץ את התיאור הסגור של \(f\left(t\right)\).

אם כן, הגענו למשוואה מסדר שני; משוואה שבה מופיעה הנגזרת השנייה של \(f\). עכשיו אפשר לרגע לשכוח מהמוטיבציה (אל חשש – בסוף אפתור גם את המשוואה הספציפית הזו!) ולעבור לדבר על משוואות מסדר שני באופן כללי. כרגיל, נתחיל מהפשוטה ביותר: \(f^{\prime\prime}=f\). כמו בסדר ראשון, \(f\left(x\right)=0\) היא פתרון לא מעניין של המשוואה, ולכן אפשר לקבוע את תנאי ההתחלה הרגיל \(f\left(0\right)=1\). "ניחוש" מוצלח מהיר יראה לנו ש-\(f\left(x\right)=e^{x}\) היא פתרון של המשוואה הזו – ולמה שלא תהיה? אם נגזרתה הראשונה שווה לעצמה, אותו הדבר יקרה גם בנגזת השנייה, ובכל נגזרת אפשרית. אם כן, האם לא קיבלנו שום דבר חדש?

התשובה שלילית. עוד קצת מחשבה יצירתית תראה לנו שיש למשוואה הזו, עם אותו תנאי התחלה, פתרון נוסף: \(e^{-x}\). זאת מכיוון ש-\(\left(e^{-x}\right)^{\prime}=-e^{-x}\), ולכן \(\left(e^{-x}\right)^{\prime\prime}=-\left(-e^{-x}\right)=e^{-x}\). אם כן, משפט הקיום והיחידות ששימש אותו במשוואות מסדר ראשון כבר לא תקף. מה שכן תקפה היא גרסה מתקדמת יותר שלו (וקשה יותר להוכחה) שאומרת שבתנאים כך וכך על המשוואה (שמתקיימים בכל המשוואות שעליהן אדבר), קיים למשוואה פתרון והוא יחיד אם נדרשים שני תנאי התחלה: \(f\left(x_{0}\right)=a_{0}\) ו-\(f^{\prime}\left(x_{0}\right)=b_{0}\), כלומר אנחנו אומרים מה יהיה ערכה של \(f\) ושל נגזרתה הראשונה של \(f\) בנקודה כלשהי. הפתרון \(e^{x}\) של המשוואה שלנו מתאים לתנאי ההתחלה \(f\left(0\right)=f^{\prime}\left(0\right)=1\); והפתרון \(e^{-x}\) מתאים לתנאי ההתחלה \(f\left(0\right)=1,f^{\prime}\left(0\right)=-1\).

שני הפתרונות שכבר מצאנו לא רק מעניינים לכשעצמם – הם גם מאפשרים לנו לפתור את המשוואה לכל זוג תנאי התחלה אחרים. הרעיון הוא פשוט – ראשית נשים לב לכך שאם \(f,g\) הן שני פתרונות של המשוואה (בלי תנאי התחלה), גם \(\alpha f+\beta g\) הוא פתרון, כאשר \(\alpha,\beta\) מספרים ממשיים כלשהם. הסיבה לכך היא שנגזרת היא לינארית, באופן שתואר כבר בפוסט הקודם: \(\left(\alpha f+\beta g\right)^{\prime}=\alpha f^{\prime}+\beta g^{\prime}\), ולא קשה להסיק מתכונה זו את הטענה שלי. מכאן שאם נדרשים מאיתנו שני תנאי התחלה ספציפיים, \(f\left(x_{0}\right)=a_{0}\) ו-\(f^{\prime}\left(x_{0}\right)=b_{0}\), אפשר לכתוב פתרון "כללי" למשוואה מהצורה \(\alpha f+\beta g\), להציב בו את \(x_{0}\) ולהציב ב-\(\alpha f^{\prime}+\beta g^{\prime}\)את \(x_{0}\), ואז לקבל שתי משוואות בשני נעלמים – הנעלמים \(\alpha,\beta\). עם "קצת מזל" יהיה למשוואה זו פתרון. התיאוריה המדוייקת עוסקת מן הסתם בפורמליזציה של ה"קצת מזל" הזה (מילת הקסם "ורונסקיאן" נכנסת לתמונה) אבל כאמור, כרגע איני מנסה לכתוב ספר מד"ר ולא אכנס לכך. במקום זה אסתפק בבדיקת מקרה פרטי אחד או שניים.

בואו נגיד, למשל, שאנחנו רוצים בתור תנאי התחלה למשוואה שיתקיים \(f\left(0\right)=1\) אבל \(f^{\prime}\left(0\right)=0\). האם זה אפשרי בכלל? בואו ננסה: נכתוב "פתרון כללי" \(ae^{x}+be^{-x}\), נציב בו \(0\) ונקבל את המשוואה \(a+b=1\). נגזור את הפתרון הכללי ונקבל \(ae^{x}-be^{-x}\), נציב בזה \(0\) ונקבל את המשוואה \(a-b=0\), שממנה נגזר \(a=b\). נציב זאת במשוואה הראשונה ונקבל \(a=b=\frac{1}{2}\), כלומר הפתרון שרצינו, שמקיים את תנאי ההתחלה שלנו, הוא \(\frac{e^{x}+e^{-x}}{2}\) (בהערת אגב, הפונקציה הזו היא בעלת חשיבות רבה בפני עצמה עד שזכתה לשם "קוסינוס היפרבולי"; ועל כך – בפוסט אחר, ביום מן הימים). בתור תרגיל אפשר לנסות ולעשות את אותו תעלול עבור תנאי ההתחלה \(f\left(0\right)=f^{\prime}\left(0\right)=0\) ולראות שמקבלים את הפתרון \(a=b=0\), כלומר הפונקציה \(f\left(x\right)=0\) צצה מאליה במסגרת הטיפול הכולל במשוואה ולא צריך להתעסק איתה באופן פרטני.

אותה שיטה תקפה באופן כללי למשוואות מסדר שני שבהן אין גורם "חופשי" (שבו לא מופיעה \(f\) או נגזרת שלה) – מוצאים שני פתרונות "בלתי תלויים" ואז כל הפתרונות נתונים כצירוף לינארי של שני הפתרונות שנמצאו. חמושים בידע הזה הבה ונתקוף את המשוואה הכללית ביותר שבה אין גורם חופשי וכל המקדמים הם קבועים – משוואה מהצורה \(af^{\prime\prime}+bf^{\prime}+cf=0\). האינסטינקט הראשון הוא להציב במשוואה הזו שוב וריאציה על \(e^{x}\), שהיה הקלף המנצח שלנו עד כה – הבה ונציב בה את \(e^{\lambda x}\) עבור \(\lambda\) ממשי כלשהו. מכיוון ש-\(\left(e^{\lambda x}\right)^{\prime}=\lambda e^{\lambda x}\), ו-\(\left(e^{\lambda x}\right)^{\prime\prime}=\lambda^{2}e^{\lambda x}\), הרי שאחרי ההצבה נקבל כי \(a\lambda^{2}e^{\lambda x}+b\lambda e^{\lambda x}+ce^{\lambda x}=0\), ואחרי הוצאת גורם משותף, \(\left(a\lambda^{2}+b\lambda+c\right)e^{\lambda x}=0\). כעת ניזכר כי פונקצית האקספוננט אינה מתאפסת בשום נקודה (אחרת הייתה אפס בכל מקום) ולכן אפשר לצמצם בה, ולהיוותר עם \(a\lambda^{2}+b\lambda+c=0\). במילים אחרות, אם \(e^{\lambda x}\) הוא פתרון למשוואה הדיפרנציאלית, אז \(\lambda\) הוא פתרון למשוואה הריבועית \(ax^{2}+bx+c\). שלום כיתה א'.

כזכור מכיתה א' (יותר נכון, מחטיבת הביניים) למשוואה ריבועית יכולים להיות שני פתרונות, פתרון אחד, או "אפס" פתרונות, בהתאם לשאלה האם הפרבולה שמוגדרת באמצעות \(y=ax^{2}+bx+c\) חותכת את ציר ה-\(x\) (2 פתרונות), משיקה לו (פתרון יחיד) או מרחפת מעליו או מתחתיו ("אפס" פתרונות). במקרה שבו ישנם שני פתרונות, \(\lambda_{1},\lambda_{2}\) קיבלנו שני פתרונות למשוואה הדיפרנציאלית: \(e^{\lambda_{1}x},e^{\lambda_{2}x}\). חישוב לא מסובך בעזרת אותו ורונסקיאן פלאי מראה שמכיוון ש-\(\lambda_{1}\ne\lambda_{2}\) הרי ש"יש לנו מזל" ושני הפתרונות הללו פורשים את מרחב הפתרונות כולו, וזה סוף הסיפור. עבור המשוואה \(f^{\prime\prime}=f\) זה עובד יופי: אפשר לכתוב אותה גם כ-\(f^{\prime\prime}-f=0\), כלומר \(a=1,b=0,c=1\) וקיבלנו את המשוואה \(\lambda^{2}-1=0\) שפתרונותיה הם \(\lambda=\pm1\), ואכן הפתרונות הפורשים שמצאנו היו \(e^{x},e^{-x}\).

אם לעומת זאת למשוואה היה פתרון יחיד (למשל, למשוואה \(x^{2}-2x+1=0\) קיים רק הפתרון \(1\), שכן דרך אחרת לכתוב את המשוואה הזו היא בתור \(\left(x-1\right)^{2}=0\)) הרי ש"אכלנו אותה" – כל השיטה המפוארת שלנו ל"ניחוש" פתרון הניבה רק חצי מכמות הפתרונות שצריכים, ואנחנו צריכים למצוא פתרון נוסף, בלתי תלוי בראשון, באמצעות קסמים חדשים. יש קסמים כאלו, אבל כרגיל – אני לא כותב ספר מד"ר ולא אכנס לכך כעת. המקרה שבאמת מעניין אותי בכל הסיפור הזה הוא המקרה השלישי, זה שבו יש "אפס" פתרונות. כמו שאפשר לנחש מהמרכאות שאני כל הזמן כותב, ממש לא נכון לומר (כמו שלמדנו בחטיבת הביניים) שלמשוואה יש אפס פתרונות; כל מה שאפשר לומר הוא שיש לה אפס פתרונות ממשיים, אבל למה להגביל את עצמנו? כאשר מתירים פתרונות מרוכבים (כלומר, כאשר מסתכלים על שדה ההרחבה הטבעי של הממשיים – אנחנו לא מוסיפים כאן פתרונות מלאכותיים) רואים שלמשוואה יש במקרה זה שני פתרונות מרוכבים. מכיוון שהמשוואה היא בעלת מקדמים ממשיים, אז אם \(z\) המרוכב הוא פתרון של המשוואה, כך גם \(\overline{z}\), הצמוד המרוכב שלו (ההוכחה לכך פשוטה: אם \(az^{2}+bz+c=0\), הרי שאחרי ש"נצמיד" את כל המשוואה ונשתמש בכך שצמוד של מספר ממשי הוא אותו מספר עצמו, נקבל \(0=\overline{0}=\overline{az^{2}+bz+c}=\overline{a}\overline{z}^{2}+\overline{b}\overline{z}+\overline{c}=a\overline{z}^{2}+b\overline{z}+c\)), ומכאן שהפתולוגיה של "יש רק פתרון אחד! מה נעשה, מה נעשה" לא מתרחשת במקרה הזה, ושני הפתרונות שקיבלנו הם תמיד בעלי קשר הדוק זה לזה: \(e^{\lambda x}\) ו-\(e^{\overline{\lambda}x}\), ומכאן ש…

רגע, רגע, רגע. לא כל כך מהר. בספרי המד"ר בשלב זה מקדישים דיון קצר לשאלה מהו אקספוננט שמועלה בחזקת מספר מרוכב ומגיעים מיידית לנוסחת אוילר. אלא שנוסחת אוילר מניחה שכבר קיימים סינוסים וקוסינוסים, ואילו המטרה שלי כרגע היא לתת מוטיבציה להגדרת הפונקציות הללו ולדיון עליהן, ולכן אני מגיע כעת לפרשת דרכים: האם אני רוצה לתאר את נוסחת אוילר, שאומרת ש-\(e^{i\theta}=f\left(\theta\right)+ig\left(\theta\right)\) עבור שתי פונקציות ממשיות מאוד מסויימות \(f,g\), ואז לקרוא להן \(\cos\) ו-\(\sin\) בהתאמה? יש הגיון בגישה הזו, שבשורה התחתונה אומרת שקוסינוס וסינוס הן פונקציות ההיטל של פונקצית האקספוננט המרוכב (שהוא בתורו הרחבה טבעית של האקספוננט הממשי, שאותו תיארתי בפוסט הקודם). עם זאת, אני רוצה לאמץ גישה שונה, אולי מעט יותר מוגבלת ברוחב המבט שלה שכן היא לא תתבונן על המרוכבים, אבל יותר דומה באופיה ה"חקרני" לנקודת המבט שאימצתי בפוסט על האקספוננט, ולנסות להמציא את סינוס וקוסינוס בנפרד מהאקספוננט, ורק בסוף לקשור בין כולם.

אם כן, הפוסט הבא יעסוק בחיפוש אחר הפתרונות למשוואה הפשוטה ביותר ש"עושה בעיות" – המשוואה \(f^{\prime\prime}=-f\). יהיה אקשן.

נעים להכיר – אקספוננט

בפוסט הזה אני רוצה לדבר על אחת הפונקציות החשובות והמרכזיות במתמטיקה – פונקצית האקספוננט, או כפי שבדרך כלל מכירים אותה בימינו, \(e^{x}\). בראש ובראשונה זו תהיה גם היכרות עם הקבוע \(e\) שב"בסיס" הפונקציה, וגם הסבר מדוע היא מצורה זו בכלל. כמו שקורה רבות במתמטיקה, הפונקציה צצה בהקשרים רבים ושונים, ובהתאם לכך יש לה הגדרות שקולות רבות ושונות; אני רוצה לדבר על זו שלטעמי היא היפה וה"נקיה" ביותר – ההקשר של משוואות דיפרנציאליות, שכבר הוזכר בפוסט הקודם, וממנה להתפתח הלאה ולראות איך ההגדרות השקולות צצות מאליהן.

במשוואה דיפרנציאלית ה"נעלם" הוא פונקציה \(f\left(x\right)\) כלשהי, והמשוואה מתארת קשר בין \(f\left(x\right)\) ובין הנגזרות שלה. אם יש הרבה נגזרות, או אם נותנים ל-\(x\) להתפרע חופשי במשוואה, מקבלים משהו מורכב למדי – למשל, \(f^{\prime}\left(x\right)=\left(f^{\prime\prime}\left(x\right)\right)^{2}-13x\cdot f\left(x\right)+11x^{2}\) היא משוואה די מסובכת וקשה (או אף בלתי אפשרי?) לתת לה פתרון מפורש. לכן אך טבעי הדבר להתחיל ממשוואות פשוטות ככל הניתן (שעם זאת, עדיין צצות באופן טבעי ומעניין בטבע – את זה הדגים הפוסט הקודם). קשה לי לחשוב על משוואה דיפרנציאלית שמערבת גם את \(f\) וגם את \(f^{\prime}\) והיא פשוטה יותר מאשר \(f=f^{\prime}\); על כן, עיסוק במשוואות דיפרנציאליות צריך להתחיל מגילוי הפתרון של המשוואה הזו; זה נותן לנו קרש קפיצה לפתרון של משוואות נוספות רבות.

השאלה הראשונה שעולה כשמתבוננים במשוואה היא – מי מבטיח לנו שיש פתרון בכלל? ואם יש פתרון, כמה פתרונות יש? כאן נכנס לתמונה משפט תיאורטי מרכזי בענף המשוואות הדיפרנציאליות – משפט הקיום והיחידות. ניסוח מדוייק של המשפט הוא מיותר כאן – הוא דורש מספר לא מבוטל של הנחות ותנאים על המשוואה עצמה, ולכן אגיד רק מה מסקנותיו עבור המשוואה \(f=f^{\prime}\) שלנו: המשפט מבטיח שיש פתרון למשוואה, אך הוא אינו יחיד, וכדי שיהיה יחיד צריך גם לקבוע "תנאי התחלה". למשל, לומר מה יהיה ערכה של \(f\) בנקודה \(x=0\). משנקבע תנאי ההתחלה הזה, קיים למשוואה פתרון יחיד שהוא פונקציה רציפה וגזירה ברציפות (אם המושגים הללו לא אומרים לכם הרבה, לא נורא). זה שקיים פתרון לא אומר לנו עדיין שום דבר על איך הוא נראה; אך זה כן אומר שאפשר מרגע זה ואילך לסמן אותו בסימון כלשהו ולהתחיל לדבר עליו כאילו הוא מציאותי וכל מה שנותר לעשות הוא לחקור את תכונותיו.

ובכן, איזה תנאי התחלה נבחר? התנאי הטבעי ביותר הוא \(f\left(0\right)=0\), אבל אז נקבל פתרון "משעמם" במיוחד: הפונקציה \(f\left(x\right)=0\). קל לראות שנגזרתה שווה לעצמה ושהיא מקיימת את תנאי ההתחלה, אבל זו לא פונקציה שאפשר לעשות איתה משהו מיוחד. תנאי ההתחלה ה"טבעי"הבא הוא \(f\left(0\right)=1\), בזכות המעמד המיוחד שיש לקבוע 1, בהיותו האיבר האדיש לכפל. כאן כבר בבירור לא נקבל את הפונקציה \(f\left(x\right)=0\), כי הפונקציה הזו שווה ל-0 בנקודה 0, לא ל-1. לכן נתכבד ונעניק לפתרון החדש סימון מיוחד: \(\exp\left(x\right)\). כעת נותר לנו להבין איך \(\exp\left(x\right)\) "נראית".

כרגע כל המידע שיש לנו על \(\exp\left(x\right)\) מסתכם בכך ש-\(\left(\exp\left(x\right)\right)^{\prime}=\exp\left(x\right)\) ובכך ש-\(\exp\left(0\right)=1\), אך קל להסיק מזה מידע נוסף: \(\exp^{\left(k\right)}\left(0\right)=1\) לכל \(k\) טבעי, כאשר \(\exp^{\left(k\right)}\) מציין את הנגזרת ה-\(k\)-ית של \(\exp\). הסיבה פשוטה: הנגזרת של \(\exp\) שווה ל-\(\exp\) עצמה, ולכן גם הנגזרת מקבלת את הערך 1 בנקודה 0; ואם גוזרים את הנגזרת, מקבלים שוב את אותו הדבר, וכן הלאה וכן הלאה. אם כן, אנחנו יודעים את הנגזרות של \(\exp\) מכל סדר שהוא בנקודה 0, וזה מזמין שיטת קירוב כללית – פולינומי טיילור.

פולינומים הם פונקציות מהצורה \(p\left(x\right)=a_{0}+a_{1}x+a_{2}x^{2}+\dots+a_{n}x^{n}\), כש-\(x\) הוא המשתנה, \(a_{0},\dots,a_{n}\) הם מספרים ממשיים כלשהם המכונים "מקדמי הפולינום", \(a_{n}\ne0\), ו-\(n\) נקראת דרגת הפולינום. במובן מסויים אלו הן הפונקציות הפשוטות ביותר והקלות ביותר לחישוב, ולכן גם הפונקציות שנהוג להשתמש בהן כדי לקרב פונקציות מורכבות יותר. קל לגזור פולינום: \(\left(x^{n}\right)^{\prime}=nx^{n-1}\), ובאופן כללי לכל פונקציות גזירות \(f,g\) וקבוע ממשי \(c\) מתקיים \(\left(cf\right)^{\prime}=cf^{\prime}\)ו-\(\left(f+g\right)^{\prime}=f^{\prime}+g^{\prime}\) (תכונות אלו מכונות "הלינאריות של הנגזרת"), ומכאן קל להסיק את הנוסחה הכללית לנגזרת של פולינום: \(p'\left(x\right)=a_{1}+2a_{2}x+3a_{3}x^{2}\dots+na_{n}x^{n-1}\) (כלומר, הנגזרת של פולינום היא פולינום אחר, מדרגה קטנה ב-1).

באופן כללי, אם עבור פונקציה \(f\) ידוע לנו הערך של \(f^{\left(k\right)}\left(0\right)\) לכל \(k\), ואנו רוצים להשתמש בידע הזה כדי למצוא לה קירוב באמצעות פולינום; מתבקש להשתמש בפולינום שהערך שלו ושל נגזרותיו בנקודה 0 מתאים לערך של \(f\) ונגזרותיה בנקודה 0 (מאחר וזה המידע שיש לנו על \(f\)). שימו לב כי אם \(p\left(x\right)=a_{0}+a_{1}x+a_{2}x^{2}+\dots+a_{n}x^{n}\) אז \(p\left(0\right)=a_{0}\), כי כל מקדם שעדיין צמוד לחזקה חיובית של \(x\) נעלם. על פי אותו עקרון, \(p^{\prime}\left(0\right)=a_{1}\); ואילו \(p^{\left(2\right)}\left(0\right)=2a_{2}\) (כי אחרי שגזרנו את \(p\) פעם אחת, האיבר \(a_{2}x^{2}\) הפך ל-\(2a_{2}x\); ואחרי גזירה שניה הוא הפך ל-\(2a_{2}\) ואז איפוס \(x\) לא משפיע עליו). ומה יהיה \(p^{\left(k\right)}\left(0\right)\) באופן כללי? אפשר כבר לנחש שזה יהיה \(a_{k}\) כפול קבוע כלשהו – איזה? אחרי שגוזרים את \(p\) פעם אחת, \(a_{k}x^{k}\) הופך ל-\(ka_{k}x^{k-1}\); אחרי גזירה שנייה הוא הופך ל-\(\left(k-1\right)ka_{k}x^{k-2}\); אחרי שלישית, \(\left(k-2\right)\left(k-1\right)ka_{k}x^{k-3}\); ובסופו של דבר כש-\(x\) "ייעלם" ניוותר עם \(1\cdot2\cdot3\cdots k\cdot a_{k}\), כלומר \(k!\cdot a_{k}\).

אם כן, הדרישה שהנגזרות של \(p\) בנקודה 0 יהיו זהות לנגזרות של \(f\) בנקודה 0 מאפשרת לנו למצוא באופן יחיד את מקדמי הפולינום: \(k!a_{k}=f^{\left(k\right)}\left(0\right)\), כלומר \(a_{k}=\frac{f^{\left(k\right)}\left(0\right)}{k!}\), ומכאן ש-\(p_{n}\left(x\right)=f\left(0\right)+f^{\prime}\left(0\right)x+\frac{f^{\left(2\right)}\left(0\right)}{2}x^{2}+\dots+\frac{f^{\left(n\right)}\left(0\right)}{n!}x^{n}\). כדי להפסיק לכתוב נוסחאות ארוכות ומפחידות, אעבור לסימון מקוצר ומפחיד: \(p_{n}\left(x\right)=\sum_{k=0}^{n}\frac{f^{\left(k\right)}\left(0\right)}{k!}x^{k}\). זהו פולינום טיילור מדרגה \(n\) (ולכן הוא מסומן כ-\(p_{n}\) ולא סתם כ-\(p\)) עבור הפונקציה \(f\). השאלה עד כמה זהו קירוב טוב (כלומר, עד כמה הערך של הפולינום בנקודות שאינן 0 קרוב לערך הפונקציה בנקודות אלו) תלויה מאוד בפונקציה, אולם ניתן לקבל הערכה כלשהי לגבי גודל הטעות. ניתן להראות כי לכל \(x\) מתקיים כי \(f\left(x\right)-p_{n}\left(x\right)=\frac{f^{\left(n+1\right)}\left(c\right)}{\left(n+1\right)!}x^{n+1}\), כלומר משהו שנראה כמו המחובר "הבא" בטור הטיילור, אבל כשהנגזרת ה-\(n+1\)-ית לא מוערכת בנקודה 0, אלא בנקודה \(c\) כלשהי. מהי \(c\)? אם היינו יודעים אותה במפורש, היינו יודעים את השארית במפורש; כל מה שאפשר לומר עליה היא שהיא נמצאת אי שם בין 0 ו-\(x\) (ובפרט היא תלויה ב-\(x\) וב-\(n\); עבור \(x\)-ים ו-\(n\)-ים שונים יכולות להיות נקודות ביניים שונות). הנוסחה הזו מאפשרת לנו לחסום את גודל הטעות, אם אנחנו יודעים לחסום את גודל הנגזרת ה-\(n+1\)-ית של \(f\) בקטע שבין 0 ו-\(x\).

נחזור כעת אל פונקציית האקספוננט. אמרנו שהיא מקיימת \(\exp^{\left(k\right)}\left(0\right)=1\) לכל \(k\), כך שהפולינום במקרה זה הוא פשוט במיוחד: \(p_{n}\left(x\right)=\sum_{k=0}^{n}\frac{1}{k!}x^{k}\). אלא שפולינום פשוט זה לא מספיק – צריך גם להראות שהוא קירוב טוב, כלומר צריך לומר משהו על השארית. בואו נקבע לרגע את \(x\), וכדי לסמן שהוא קבוע נסמנו ב-\(x_{0}\); מה שאנחנו באמת רוצים להראות הוא שככל שאנחנו מגדילים את \(n\), ושומרים את \(x_{0}\) קבוע, אנחנו מקטינים את הטעות שלנו ככל שנרצה – כלומר, שהטעות שואפת לאפס כש-\(n\) שואף לאינסוף. בדרך כלל לא פשוט להראות את זה (ולא תמיד זה בכלל נכון), בגלל שההתנהגות של \(f^{\left(n\right)}\) בקטע שלנו עשויה "להתפרע"ככל שנגדיל את \(n\) (חשבו על נהג "משוגע" שכל הזמן נותן גז ובולם בפראות – פונקצית המקום שלו משתנה בצורה יחסית "נחמדה"כי ההתפרעויות מקזזות זו את זו, אבל אם נסתכל על הנגזרת של פונקצית המקום – המהירות – נראה שהיא "משוגעת"). אלא שבמקרה שלנו אין בעיה כי \(f^{\left(n\right)}=f\) לכל \(n\). אנחנו גם יודעים ש-\(f\) במקרה שלנו היא רציפה (זה מובטח ממשפט הקיום והיחידות) ולכן בפרט היא חסומה בקטע \(\left[0,x_{0}\right]\) (אינטואיטיבית תכונה זו ברורה יחסית, אך כמובן שיש להוכיח אותה פורמלית).

אם נסמן ב-\(M\) את החסם על גודל הפונקציה, אז \(\frac{f^{\left(n+1\right)}\left(c\right)}{\left(n+1\right)!}x_{0}^{n+1}\le\frac{x_{0}^{n+1}}{\left(n+1\right)!}\cdot M\). מכיוון שלכל מספר קבוע \(a\) מתקיים כי \(\frac{a^{n}}{n!}\to0\) (האינטואיציה היא שבעוד \(a^{n}\) הוא מכפלה של \(a\) הקבוע בעצמו \(n\) פעמים, בעוד ש-\(n!\) היא מכפלה של מספרים שהולכים וגדלים, והחל משלב מסויים כולם יהיו גדולים מ-\(a\)) נובע שהשגיאה שואפת תמיד לאפס. מסקנה: הפולינומים מהווים קירוב טוב של \(\exp\), במובן זה שלכל \(x_{0}\) מתקיים \(p_{n}\left(x_{0}\right)\to\exp\left(x_{0}\right)\). בשל כך אפשר לשכוח מפולינומים ולעבור לדבר על \(\exp\left(x\right)\) כמיוצגת באמצעות טור חזקות אינסופי: \(\exp\left(x\right)=\sum_{n=0}^{\infty}\frac{x^{n}}{n!}\). בחלק מהמקרים בוחרים להגדיר את פונקצית האקספוננט באמצעות טור חזקות זה (צריך להראות שהוא מתכנס, אך זה פשוט למדי באמצעות תוצאות סטנדרטיות על טורי חזקות).

אם מתחילים עם הגדרה זו קל למדי להראות ש-\(\exp^{\prime}\left(x\right)=\exp\left(x\right)\), שכן התורה של טורי חזקות מצביעה על כך שניתן לגזור את הטור "איבר איבר" כדי לקבל את הטור המתאים לנגזרת – אך לא קשה לראות שאם גוזרים את הטור \(\sum_{n=0}^{\infty}\frac{x^{n}}{n!}\) איבר איבר, מקבלים את אותו הטור בדיוק! שהרי כשגוזרים את \(\frac{x^{n}}{n!}\) מקבלים \(\frac{x^{n-1}}{\left(n-1\right)!}\). אם כן, בגישה זו קל מאוד "לראות בעיניים" מדוע הנגזרת של אקספוננט היא האקספוננט עצמו; ה"חסרון" של שיטה זו היא שיש שרירותיות רבה כלשהי בלהתחיל מההגדרה \(\sum_{n=0}^{\infty}\frac{x^{n}}{n!}\) במקום להגיע אליה כתוצר "טבעי" של איזו שהיא דרישה בסיסית יותר (וזה גם פחות הרפתקני; במקום לטייל בג'ונגל עד שמגיעים לעיר העתיקה שקבורה בו, אנחנו מקבלים הקפצה במסוק).

יפה – אם כן, כעת יש לנו ייצוג מאוד קונקרטי לפונקצית האקספוננט, ואפילו שיטה לחשב אותה נומרית בכל דיוק שנרצה. מה עוד צריך, אם כן? אפיונים נוספים שישפכו עוד אור על הפונקציה הזו. אילו תכונות מעניינות הפונקציה מקיימת? כבר ראינו תכונה מעניינת מאוד: נגזרתה שווה לעצמה. כעת אציג תכונה מעניינת וחשובה לא פחות: \(\exp\left(x\right)\cdot\exp\left(y\right)=\exp\left(x+y\right)\). קל לראות את זה עכשיו, כשיש לנו את הייצוג של \(\exp\) כטור חזקות – אפשר ממש לכפול את שני הטורים. אתם יכולים להאמין לי שזה עובד, אבל גם בחישוב ה"טכני" יש יופי לא קטן וכדאי לדעתי לנסות ולעקוב אחריו. ראשית הבה וננסה להבין מהו \(\exp\left(x\right)\cdot\exp\left(y\right)\). כדי להקל על ההבנה כדאי לכתוב זאת כסכום בלי סיגמות: \(\exp\left(x\right)\cdot\exp\left(y\right)=\left(1+x+\frac{x^{2}}{2}+\dots\right)\left(1+y+\frac{y^{2}}{2}+\dots\right)\). אם נפתח את המכפלה הזו נקבל סכום של איברים שכל אחד מהם התקבל על ידי בחירת איבר אחד מהסכום השמאלי, ואיבר אחד מהסכום הימני, כלומר סכום של איברים מהצורה \(\frac{x^{k}}{k!}\cdot\frac{y^{t}}{t!}\). כרגע זה לא נראה מועיל במיוחד, אז נבצע שינוי משתנים מתוחכם (מי שתוהה איך הגעתי אליו – פשוט פותחים את \(\exp\left(x+y\right)\) ורואים מה היעד שלנו…): את החזקה של \(x\) נמשיך לסמן ב-\(k\), אבל את החזקה של \(y\) נסמן בתור \(n-k\) דווקא (כאשר \(n\) יכול להיות כל מספר טבעי גדול או שווה ל-\(k\); לכל \(n\) כזה, קיים איבר מתאים בסכום שבו \(x\) הוא בחזקת \(k\) ו-\(y\) הוא בחזקת \(n-k\)). עם הסימון הזה, האיבר שלנו הוא \(\frac{x^{k}y^{n-k}}{k!\left(n-k\right)!}\). אולי לחלקכם זה מתחיל להיראות מוכר. נכפול ונחלק ב-\(n!\) ונקבל \(\frac{n!}{k!\left(n-k\right)!}\frac{x^{k}y^{n-k}}{n!}\), כלומר \(\frac{{n \choose k}x^{k}y^{n-1}}{n!}\).

מכאן כבר העניינים מתגלגלים מהר: הסכום שלנו כעת ניתן לתיאור בתור \(\sum_{n=0}^{\infty}\frac{\sum_{k=0}^{n}{n \choose k}x^{k}y^{n-k}}{n!}\), ועל ידי הבינום של ניוטון נקבל כי סכום זה הוא \(\sum_{n=0}^{\infty}\frac{\left(x+y\right)^{n}}{n!}\), כלומר \(\exp\left(x+y\right)\), ובכך מסתיים העניין. גילינו, אם כן, כי \(\exp\) היא פונקציה שמתרגמת פעולת חיבור לפעולת כפל. כל תלמיד תיכון כבר נתקל בתופעה כזו, בחוקי חזקות. הרי \(x^{a}\cdot x^{b}=x^{a+b}\). מכאן צצה אינטואיציה חדשה לגבי מהותה של \(\exp\) – האם ייתכן שהיא פונקציה של העלאה בחזקה? ואם כן, על פי איזה בסיס? הדרך לגלות את הבסיס היא להציב 1 ב-\(\exp\) (כלומר, לקבל את הבסיס בחזקת 1). התוצאה היא המספר \(\exp\left(1\right)=1+1+\frac{1}{2}+\frac{1}{3!}+\frac{1}{4!}+\dots=2.71828\dots\) (שלוש הנקודות מסמלות, כרגיל, שהמספר לא נגמר בספרות אלו אלא ממשיך עד אין קץ). נהוג לסמן את המספר הזה ב-\(e\). לטעמי זהו הקבוע המתמטי המעניין ביותר; מעניין יותר מ-\(\pi\), אחיו המפורסם הרבה יותר. הטור מאפשר חישוב מאוד מהיר ויעיל של \(e\), להבדיל מ-\(\pi\) שחישוב יעיל שלו דורש התחכמויות נוספות. אם כן, המטרה שלנו כעת היא להראות ש-\(\exp\) היא בעצם פונקציה של העלאת \(e\) בחזקה.

כמובן, כדי לדבר על העלאה בחזקה צריך להגדיר במדוייק למה הכוונה. \(a^{2}\) הוא פשוט \(a\cdot a\), ובאותו אופן \(a^{n}\) עבור \(n\) טבעי הוא \(a\cdot a\cdots a\) במשך \(n\) פעמים, אך מהו \(a^{\pi}\)? חייבים לתת משמעות פורמלית לסימון הזה. האופן שבו עושים זאת הוא ראשית כל להגדיר את החזקה לכל מספר שלם, על ידי ההגדרה \(a^{-n}=\left(\frac{1}{a}\right)^{n}\) עבור \(n\) טבעי; ולהרחיב את ההגדרה לרציונליים על ידי כך שמגדירים \(a^{\frac{1}{n}}=\sqrt[n]{a}\) לכל \(n\) טבעי, ועל כן \(a^{\frac{m}{n}}=\sqrt[n]{a^{m}}\). עד כאן – חומר של תיכון. כדי להרחיב את ההגדרה לממשיים כבר צריך להשתמש בחשבון אינפיניטסימלי. באופן כללי בחשבון אינפיניטסימלי, כאשר יש לנו פונקציה \(f\left(x\right)\) שערכיה נקבעו כבר על כל המספרים הרציונליים, נובעת מכך דרך אחת ויחידה להרחיב את הפונקציה לכל הממשיים כך שהפונקציה המתקבלת תהיה רציפה. זוהי הרי מהות הרציפות – שאם יש לנו סדרת נקודות \(x_{n}\) כך ש-\(x_{n}\to a\) עבור \(a\) ממשי כלשהו, אז \(f\left(x_{n}\right)\to f\left(a\right)\). מכיוון שלכל מספר ממשי אפשר לקחת סדרת קירובים רציונליים שכזו, הערך של \(f\) ב-\(a\) מוכתב על ידי הערכים של \(f\) על המספרים הרציונליים.

כעת, אם \(f\) היא פונקציה רציפה שמקיימת את המשוואה \(f\left(x+y\right)=f\left(x\right)\cdot f\left(y\right)\) (משוואה זו מכונה לפעמים "משוואת קושי האקספוננציאלית"), ראשית כל נסמן \(a=f\left(1\right)\), וכעת לכל \(n\) טבעי מתקיים \(f\left(n\right)=f\left(1+\dots+1\right)=f\left(1\right)\cdots f\left(1\right)=a^{n}\), כלומר על הטבעיים \(f\) אכן מתנהגת כמו חזקה. קל לראות ש-\(a\) חייב להיות אי שלילי, שכן \(a=f\left(1\right)=f\left(\frac{1}{2}+\frac{1}{2}\right)=\left[f\left(\frac{1}{2}\right)\right]^{2}\), כלומר \(a\) הוא ריבוע של מספר ממשי כלשהו, ולכן חייב להיות אי שלילי.

השלב הבא הוא 0: מכיוון ש-\(0=0+0\) הרי ש-\(f\left(0\right)=f\left(0+0\right)=f\left(0\right)\cdot f\left(0\right)=\left[f\left(0\right)\right]^{2}\). איזה מספר ממשי שווה לריבוע שלו? רק 0 או 1; אבל אם \(f\left(0\right)=0\) אז גם \(f\left(n\right)=f\left(n+0\right)=f\left(n\right)\cdot f\left(0\right)=0\), וקיבלנו פונקציה לא מעניינת (שאפשר לחשוב עליה בתור \(f\left(x\right)=0^{x}\) – כלומר, אפילו במקרה הזה היא פונקציית העלאה בחזקה, אם מקבלים את הקונבנציה הלא שגרתית \(0^{0}=0\) במקרה זה). לכן \(f\left(0\right)=1\). מכאן מגיעים מיידית להגדרה עבור שליליים: \(1=f\left(0\right)=f\left(n+\left(-n\right)\right)=f\left(n\right)f\left(-n\right)\) ומכאן ש-\(f\left(-n\right)=\frac{1}{a^{n}}=\left(\frac{1}{a}\right)^{n}\), ולכן אפשר לומר ש-\(f\left(-n\right)=a^{-n}\).

השלב הבא הוא הרציונליים: \(a=f\left(1\right)=f\left(\frac{1}{n}+\dots+\frac{1}{n}\right)=\left[f\left(\frac{1}{n}\right)\right]^{n}\), כך ש-\(f\left(\frac{1}{n}\right)=\sqrt[n]{a}\) (עבור מספרים ממשיים אי שליליים תמיד קיים שורש שכזה; הסיבה לכך היא שהפונקציה \(g\left(x\right)=x^{n}-a\) היא רציפה, מקבלת ערך שלילי ב-\(x=0\) אבל ערך אי שלילי ב-\(x=a\) ולכן על פי משפט ערך הביניים היא חייבת להתאפס היכן שהוא). דרישת הרציפות על \(a\) מסיימת כעת את המשחק: \(f\left(x\right)=a^{x}\) לכל \(x\) ממשי – כאשר, כזכור, \(a=f\left(1\right)\). במקרה של \(\exp\), \(\exp\left(1\right)=e\), ולכן \(\exp\left(x\right)=e^{x}\), לכל \(x\) ממשי. סיימנו את המעבר מההגדרה התמימה באמצעות משוואה דיפרנציאלית אל \(e^{x}\) שאנחנו מכירים ואוהבים.

בכל ההרפתקאה הזו נמנעתי במכוון – אפילו בכוח – מלהזכיר את פונקצית הלוגריתם הטבעי. למעשה, ברוב ספרי הלימוד שבהם מגדירים אקספוננט, הדרך לעשות זאת היא ראשית כל על ידי הגדרת הלוגריתם, ואז הגדרת האקספוננט כפונקציה ההופכית שלו, אבל על הלוגריתם הטבעי, המוטיבציה לו והדרך להגדיר אותו כבר אפשר וכדאי לכתוב פוסט נפרד, בעתיד. לעת עתה אני רק רוצה להפנות את תשומת הלב לעובדה אחת שעבורה אני זקוק ללוגריתם הטבעי: בעצם הוכחתי קודם כי כל פונקציה רציפה שמקיימת את משוואת קושי האקספוננציאלית היא מעריכית, כלומר מהצורה \(a^{x}\), אבל למעשה יש דרך אחרת לתאר פונקציה שכזו: מכיוון ש-\(a>0\) הרי ש-\(a=e^{\ln a}\), ולכן את הפונקציה \(a^{x}\) אפשר גם לתאר בתור הפונקציה \(e^{\ln a\cdot x}\). זה גם מראה לנו מיידית מדוע הנגזרת של \(a^{x}\) היא \(a^{x}\cdot\ln a\) (הדבר נובע מכך ש-\(\left(e^{\ln a\cdot x}\right)^{\prime}=\left(\ln a\right)e^{\ln a\cdot x}\)), וגם אומר לנו שאפשר לתת לכל הפונקציות המעריכיות תיאור אחיד על ידי \(e^{kx}\), עבור \(k\) ממשי כלשהו; כך למשל הפתרון של המשוואה הדיפרנציאלית שהצגתי בפוסט הקודם היה פונקציה מעריכית שכזו.

גם עם הקבוע \(e\) לא גמרנו; יש עוד דרכים להגדיר אותו, ובראש ובראשונה בתור הגבול \(\lim_{n\to\infty}\left(1+\frac{1}{n}\right)^{n}\) (למעשה, אפשר גם להגדיר את פונקצית האקספוננט באמצעות וריאציה על גבול זה); וגם על כך אני מקווה לדבר בעתיד.