אינטגרל קווי

בראשית בראו ניוטון ולייבניץ את אינטגרל רימן (רימן בא אחרי ניוטון ולייבניץ, אז מה זה השם הזה? לא נורא, בכל סיפור בריאה טובה צריך סתירות פנימיות). ויהא אינטגרל רימן אינטגרל של פונקציה \( f:\mathbb{R}\to\mathbb{R} \) שמוגדר על קטע \( \left[a,b\right]\subseteq\mathbb{R} \). ויהי ערב ויהי בוקר אינפי 1.

ההתחלה הזו כל כך יפה ונקייה, ומייד אחריה מגיע תוהו ובוהו וחושך על פני תהום. מסתבר שיש אינספור דרכים שונות ומשונות להכליל את האינטגרל הזה. בפוסטים קודמים שלי ראינו דרך אחרת - להכליל אותו לאינטגרל של פונקציות \( f:\mathbb{R}^{n}\to\mathbb{R} \) כאשר האינטגרל נלקח על קבוצה פתוחה \( A\subseteq\mathbb{R}^{n} \). ההגדרה הזו הייתה ישירה למדי - אותם רעיונות של אינטגרל רימן, כשהם מורחבים ל-\( \mathbb{R}^{n} \) בצורה טבעית.

בפוסט הזה אני רוצה לדבר על הכללה קצת שונה, אבל לא מנותקת לגמרי ממה שראינו עד כה - אינטגרל קווי. הייתי יכול, תיאורטית, לוותר על הפוסט הזה לגמרי; המטרה הסופית שלי בסדרת הפוסטים הזו היא להציג את ההכללה המאוד חזקה של כל סוגי האינטגרלים שאציג כאן ומתבססת על קסם שנקרא תבנית דיפרנציאלית. אבל אני רוצה לדבר על אינטגרלים קווים משתי סיבות: ראשית, פרקטית: אלו אינטגרלים שימושיים מאוד שצצים בשלל תחומים והקשרים ואין שום סיבה להציג אותם רק בתור מקרה פרטי של מושג מורכב הרבה יותר שלא כולם יטרחו להכיר; ושנית, מן הסתם יותר קל להבין הכללות (בפרט כאלו, כמו תבניות דיפרנצאליות, שדורשות הרבה הכנה ומושגים מקדימים לפני שאפשר להציג) אם מבינים טוב חלק מהמקרים הפרטיים שאותם מכלילים. אם כן, בפוסט הזה אני הולך לעבוד ברמה מאוד בסיסית של הגדרות, ואני מקווה שהפוסט יהיה נגיש לכל מי שמכיר כבר את אינטגרל רימן ולא הרבה מעבר לכך.

אינטגרל קווי הוא משהו שבין אינטגרל במימד יחיד ובין אינטגרל ב-\( \mathbb{R}^{n} \): הוא מוגדר על פונקציות שתחומן הוא \( \mathbb{R}^{n} \), אבל הקבוצה שמעליה הוא מוגדר היא עקומה - אובייקט ב-\( \mathbb{R}^{n} \) שהוא חד ממדי. תחשבו על מעגל היחידה במישור - אוסף כל הנקודות \( \left(x,y\right) \) כך ש-\( x^{2}+y^{2}=1 \) - זו דוגמה לעקום. הוא נראה כמו קו ישר שלקחנו את הקצוות שלו והדבקנו אותם. זאת להבדיל מעיגול היחידה, שכולל גם את כל ה”בפנים” של המעגל, והוא דוגמא לקבוצה דו ממדית שעליה מבצעים את האינטגרציה המוכללת שכבר ראינו בעבר.

עוד נקודה מהותית היא שישנם שני סוגים של אינטגרלים קוויים, שמתאימים לטווח של הפונקציה שמבצעים עליה אינטגרציה. אם זו פונקציה \( f:\mathbb{R}^{n}\to\mathbb{R} \) אומרים שהפונקציה הזו היא שדה סקלרי והאינטגרל הקווי שלה נקרא “אינטגרל קווי מסוג ראשון” ועד כאן זה הכל נראה מוכר; אבל בניגוד למה שראינו עד כה על אינטגרלים במספר ממדים, אנחנו מאפשרים גם אינטגרציה של פונקציות \( F:\mathbb{R}^{n}\to\mathbb{R}^{n} \), שמחזירות לא ערך סקלרי אלא וקטור ב-\( \mathbb{R}^{n} \); לפונקציה כזו קוראים שדה וקטורי ולאינטגרל הקווי שלה קוראים “אינטגרל קווי מסוג שני”. שני הסוגים כמובן קשורים זה לזה ואדבר פה על שניהם. מבין שניהם, זהו דווקא הסוג השני שנפוץ וחשוב יותר. אני אתן דוגמה זריזה אחת ומרכזית לשימוש בפיזיקה - עבודה: בנפנוף ידיים לא לגמרי מדויק, עבודה של כוח על גוף היא מדד לשינוי באנרגיה הקינטית (האנרגיה של המהירות של הגוף) שכוח מסויים גורם לו. מה שמעניין כאן הוא שתיאור של השינוי הזה לא תלוי בכלל בזמן; מספיק לדעת רק מה המסלול שהגוף נע בו (זו העקומה שלנו) ומה הכוח שפועל עליו בכל נקודה של המסלול (זה השדה הוקטורי שלנו) כדי לדעת את השינוי באנרגיה של הגוף בין שני קצוות המסלול. נתעמק קצת יותר בדוגמה הזו בהמשך, כשיהיו לנו עוד הגדרות.

בפוסט הזה, כאמור, אני רוצה ללכת על הפשוט והבסיסי ביותר, ולכן אדבר על האינטגרלים הללו בדו-מימד - ב-\( \mathbb{R}^{2} \), ואזכיר טיפה מתישהו גם את \( \mathbb{R}^{3} \). ההכללות ל-\( \mathbb{R}^{n} \) הן די מיידיות לרוב הדברים שאתאר פה ואין צורך לדבר מראש בצורה כללית שכזו.

לפני שמתחילים לדבר על אינטגרלים, צריך לדבר על האובייקט שמעליו מתבצעת האינטגרציה - עקומה. עקומה היא מה שקורה כשלוקחים קטע ישר חד ממדי - נאמר \( \left[a,b\right] \), זורקים אותו לתוך המרחב הדו ממדי ומתחילים למשוך ולהזיז חלקים שלו ימינה ושמאלה ולהתפרע איתו - אבל בלי לקרוע. התיאור המוזר שלעיל ניתן לפורמלזיציה באמצעות פונקציות: עקומה היא פשוט פונקציה \( \gamma:\left[a,b\right]\to\mathbb{R}^{2} \) שהיא רציפה (זה הקטע של “בלי לקרוע”) ובשביל השימושים שלנו גם נרצה לדרוש שהיא תהיה גזירה בקטע ושהנגזרת שלה תהיה רציפה ב-\( \left(a,b\right) \)(אפשר להרשות נקודות אי-גזירות מבודדות, אבל גם לזה לא אכנס). על עקומה עם תכונת הגזירות הזו אומרים שהיא חלקה (Smooth). הנה דוגמאות פשוטות לעקומות: \( \gamma_{1}\left(x\right)=\left(x^{2},\sqrt{1-x^{2}}\right) \) היא עקומה שנותנת לנו את מעגל היחידה כשמפעילים אותה על הקטע \( \left[-1,1\right] \). \( \gamma_{2}\left(x\right)=\left(x,x^{2}\right) \) נותנת לנו פרבולה, בעוד ש-\( \gamma_{3}\left(x\right)=\left(x,\frac{1}{x}\right) \) נותנת לנו חלק מהיפרבולה (למשל, על הקטע \( \left[1,2\right] \)). ומה עם \( \gamma_{4}\left(x\right)=\left(-\sqrt{1-x^{2}},x^{2}\right) \)? גם היא נותנת את מעגל היחידה, אבל בצורה שונה מאשר \( \gamma_{1} \). ו-\( \gamma_{5}\left(x\right)=\left(\frac{x}{2},\frac{x^{2}}{4}\right) \) תיתן לנו פרבולה כמו \( \gamma_{2} \), אבל שוב משהו פה מרגיש לנו שונה. אלו נקודות שכדאי להתעכב עליהן.

כשאני מדבר על מעגל היחידה, מה שאני מדבר עליו בתכל’ס הוא קבוצה של נקודות במישור. לרוב אני מתאר אותן בתור “אוסף כל הנקודות שהן פתרון של מערכת משוואות מסויימת”, במקרה שלנו \( x^{2}+y^{2}=1 \). כאן, לעומת זאת, אני מדבר על משהו שונה - אני מדבר על פונקציה, שמעגל היחידה יוצא התמונה שלה על קטע מסויים. ייתכנו פונקציות רבות ושונות שיתנו את אותה התמונה. כדי לפשט את העניינים בואו נדבר על אוסף הנקודות במישור שמקיימות \( x=y \) בין הנקודות \( \left(0,0\right) \) ו-\( \left(1,1\right) \) - זה פשוט קו ישר ב-45 מעלות עם ציר \( x \). הנה ארבע עקומות שונות שהתמונה שלהן יוצאת האוסף הזה:

\( \gamma_{1}\left(x\right)=\left(x,x\right) \) על הקטע \( \left[0,1\right] \)

\( \gamma_{2}\left(x\right)=\left(2x,2x\right) \) על הקטע \( \left[0,\frac{1}{2}\right] \)

\( \gamma_{3}\left(x\right)=\left(1-x,1-x\right) \) על הקטע \( \left[0,1\right] \)

\( \gamma_{4}\left(x\right)=\begin{cases}\left(2x,2x\right) & 0\le x\le\frac{1}{2}\\\left(2\left(1-x\right),2\left(1-x\right)\right) & \frac{1}{2}\le x\le1\end{cases} \)

מה קורה כאן? \( \gamma_{1} \) מתאימה כנראה לאינטואיציה הבסיסית שלנו. לעומת זאת, \( \gamma_{2} \) עושה את הכל “מהר יותר” - אינטואיטיבית, היא מהירה פי 2 יותר מאשר \( \gamma_{1} \). לעומת זאת, \( \gamma_{3} \) נעה “באותה מהירות” כמו \( \gamma_{1} \) אבל לכיוון ההפוך, ו-\( \gamma_{4} \) לוקחת את הטוב שבשני העולמות: אצה רצה לה בכיוון ה”נכון” אל \( \left(1,1\right) \), מגיעה לשם באמצע ה”זמן” שלה, ואז פונה וחוזרת על עקבותיה, תוך שהיא עוברת במקומות שהיא כבר הייתה בהם קודם. לכל ארבע העקומות הללו יש, כאמור, את אותה תמונה, אבל הן מתארות דברים שונים.

לפעמים מנסים להשתמש בטרמינולוגיה כדי להבדיל בין הדברים הללו. אני מכיר את השימוש בעקום בעיקר כדי לתאר את קבוצת הנקודות, בזמן שעקומה מתארת את הפונקציה (ולפעמים אומרים גם “מסלול”, ו”אינטגרל מסלולי”). גם באנגלית נהוג לדבר לפעמים על Curve במשמעות של עקום ועל Path במשמעות של עקומה (אבל זה לא אומר שלא תצליחו למצוא גם Curve במשמעות של עקומה אם תחפשו מספיק - טרמינולוגיה זה לא חוק). אני אשתמש לרוב ב-\( C \) (מלשון curve) כדי לתאר את העקום עצמו, ולזוג של פונקציה \( \gamma \) ותחום שלה \( \left[a,b\right] \) אני אתייחס בתור פרמטריזציה של העקום הזה. נראה בהמשך שכמעט ואין חשיבות לבחירת הפרמטריזציה כשמחשבים את הערך של האינטגרל (מה שמתאים למה שסיפרתי קודם על עבודה, שהיא אינה תלויה בזמן או במהירות של הגוף, אלא רק במסלול שהוא עובר).

בדו-מימד נוח לי לתאר עקומה באופן הבא: \( \gamma\left(t\right)=\left(x\left(t\right),y\left(t\right)\right) \), כלומר העקומה היא זוג של פונקציות \( x\left(t\right),y\left(t\right) \) שהן בעצמן רציפות וגזירות וכל מה שתרצו. הסימון \( t \) לקלט של \( \gamma \) מן הסתם עדיף על \( x \) כי כך אנחנו יכולים להשתמש ב-\( x \) כדי לתאר את קואורדינטת ה-\( x \) במישור של התמונה של העקומה על \( t \). מבחינת אינטואיציה, נוח לחשוב על \( t \) בתור “זמן” ועל \( \gamma \) מעל \( \left[a,b\right] \) כאילו היא מתארת “טיול” במישור שמתחיל ב-\( \gamma\left(a\right) \) בזמן \( a \) ומסתיים ב-\( \gamma\left(b\right) \) בזמן \( b \). אבל “זמן” כאן הוא רק אינטואיציה ותו לא.

כעת, אם \( f\left(x,y\right) \) היא פונקציה ממשית, מה שקראתי לו “שדה סקלרי” קודם, מה סביר להגדיר בתור האינטגרל שלה על העקום \( C \), עם הפרמטריזציה \( \gamma \), שאסמן \( \int_{C}f\left(x,y\right)d\gamma \)? באינטגרל רימן הרגיל, של פונקציה ב-\( \mathbb{R} \) שמוגדרת מעל קטע, גישה אחת (גישת סכומי רימן) היא לפרק את הקטע לקטעים קטנים, לבחור נקודה אקראית בכל תת-קטע שכזה, לחשב את הערך של הפונקציה עליו, לכפול באורך הקטע ולחבר את הכל. אם רואים שככל שהקטעים קטנים יותר, כך הסכום שמקבלים שואף לערך ספציפי (בלי תלות בנקודות האקראיות שבוחרים בתוך תתי-הקטעים, ואופן הפירוק שלנו לתתי-קטעים) אז אומרים שהפונקציה אינטגרבילית והסכום הוא האינטגרל שלה. על פניו, זה גם בדיוק מה שאנחנו יכולים לעשות כאן: נפרק את הקטע \( \left[a,b\right] \) לתת-קטעים קטנים, נבחר נקודה אקראית \( t^{*} \) בכל תת-קטע, נחשב את \( f\left(x\left(t^{*}\right),y\left(t^{*}\right)\right) \), ואז נכפול באורך תת-הקטע… רגע, רגע, רגע. לא להתבלבל. הפונקציה \( f \) שלנו חיה על העקומה. זה אומר שאנחנו רוצים לכפול את הערך שלה לא באורך תת-הקטע, אלא באורך התמונה של תת-הקטע של \( \left[a,b\right] \), דהיינו באורך של תת-העקומה שחיה בין שתי נקודות הקצה של תת-הקטע.

מה שמוביל אותנו לשאלה - איך מחשבים אורך של עקומה? ליתר דיוק, איך בכלל מגדירים אורך של עקומה? ובכן, בואו ניקח דוגמא מאינטגרלים: באינטגרל אנחנו מקרבים שטח באמצעות מלבנים, אז בואו נקרב אורך (האנלוג החד-ממדי של שטח) באמצעות קווים ישרים (האנלוג החד-ממדי של מלבן). פורמלית, אם אנחנו רוצים לחשב את האורך של \( \gamma \) שמוגדרת על הקטע \( \left[a,b\right] \), ניקח חלוקה \( P \) של \( \left[a,b\right] \) (כלומר, אוסף של נקודות \( t_{1},t_{2},\dots,t_{N} \) כך ש-\( a=t_{1}<t_{2}<\dots<t_{n}=b \)), נעביר קטע ישר בין כל שתי נקודות סמוכות ונחבר את סכום כל הקטעים הללו. נקבל:

\( \sum_{i=1}^{N-1}\left|\gamma\left(t_{i+1}\right)-\gamma\left(t_{i}\right)\right| \)

כאשר ערך מוחלט כאן מייצג את הערך המוחלט הרגיל בדו-ממד: \( \left|\left(x,y\right)\right|=\sqrt{x^{2}+y^{2}} \).

האינטואיציה היא שהקו הישר בין שתי נקודות הוא בעל האורך הקטן ביותר מבין כל העקומות שמחברות אותם, ולכן הסכום הזה תמיד קטן מאורך העקומה האמיתי, והוא שואף אליו ככל שהחלוקה קטנה יותר. לכן אפשר לקחת את החסם העליון של כל הסכום מהצורה שלעיל ולהגדיר את אורך העקומה להיות שווה לה.

אצלנו, כזכור, העקומה היא חלקה. זה מאפשר לנו לעשות משהו יותר נחמד. בואו נזכור את משפט הערך הממוצע של לגראנז’: אם \( f \) רציפה על \( \left[a,b\right] \) וגזירה על \( \left(a,b\right) \) אז קיימת \( c\in\left(a,b\right) \) כך ש-\( f\left(b\right)-f\left(a\right)=f^{\prime}\left(c\right)\left(b-a\right) \). אם נפעיל את זה על קירוב העקומה שלנו, נקבל

\( \sum_{i=1}^{N-1}\left|\gamma^{\prime}\left(c_{i}\right)\right|\Delta t_{i} \)

כאשר \( \Delta t_{i}=t_{i+1}-t_{i} \) ו-\( t_{i}<c_{i}<t_{i+1} \).

הדבר הזה הוא סכום רימן של האינטגרל של \( \gamma^{\prime} \) על הקטע \( \left[a,b\right] \), אינטגרל שקיים בזכות ההנחה שלנו ש-\( \gamma^{\prime} \) רציפה (זהו המשפט היסודי של החדו”א). לכן אם משאיפים את גודל החלוקות ל-0, מה שנותן לנו את אורך העקומה, מקבלים גם בדיוק את האינטגרל \( \int_{a}^{b}\left|\gamma^{\prime}\left(t\right)\right|dt \). אם כן, מצאנו דרך נוחה לחשב את האורך של עקומה חלוקה באמצעות אינטגרל רימן רגיל, ואני מקווה שנחה דעתנו שהדרך הזו מסתדרת עם ההגדרה המתבקשת ביותר לאורך של עקומה.

כעת נחזור לאינטגרל קווי. שם הניתוח המדויק מסובך קצת יותר, כי הסכום הטיפוסי שלנו נראה כך:

\( \sum_{i=1}^{N-1}f\left(\gamma\left(c_{i}\right)\right)\left|\gamma\left(t_{i+1}\right)-\gamma\left(t_{i}\right)\right| \)

וזאת אחרי שכבר ביצענו את הפישוט שעכשיו נראה מתבקש - במקום לכפול באורך העקומה בין \( \gamma\left(t_{i}\right) \) ו-\( \gamma\left(t_{i+1}\right) \), אנחנו כופלים באורך הקטע שמחבר את שתי הנקודות הללו. הבעיה היא שאם ננסה להשתמש במשפט ערך הביניים כמו קודם נקבל

\( \sum_{i=1}^{N-1}f\left(\gamma\left(c_{i}\right)\right)\left|\gamma^{\prime}\left(d_{i}\right)\right| \)

כך ש-\( c_{i},d_{i} \) הן נקודות ביניים, אבל לא בהכרח אותן נקודות ביניים. לכן זה לא סכום רימן. זה דורש הערכה קצת יותר זהירה של \( \left|\gamma\left(t_{i+1}\right)-\gamma\left(t_{i}\right)\right| \) שכן תשתמש ב-\( c_{i} \), ולא אכנס לכך כאן. השורה התחתונה היא שזה עובד ומקבלים את האינטגרל המתבקש:

\( \int_{C}fds=\int_{a}^{b}f\left(\gamma\left(t\right)\right)\left|\gamma^{\prime}\left(t\right)\right|dt \)

וברוב הספרים מעדיפים להביא את האינטגרל הזה בתור ההגדרה של אינטגרל קווי מסוג ראשון.

ה-ds שבאינטגרל השמאלי הוא מבחינתנו כרגע סימון בלבד, שנותן אינדיקציה לכך שהאינטגרל הוא אינטגרל קווי, כלומר שהוא מהצורה “ערך הפונקציה כפול יחידת אורך קטנה מאוד על העקומה”.

זה מסיים לעת עתה עם אינטגרל קווי מהסוג הראשון. בואו נעבור אל השני, זה שבו אנחנו מבצעים אינטגרציה על שדה וקטורי שאסמן \( F\left(x,y\right)=\left(P\left(x,y\right),Q\left(x,y\right)\right) \) (כלומר, אני מייצג את \( F \) באמצעות שתי פונקציות סקלריות עם שני משתנים כל אחת, \( P \) ו-\( Q \)). כדי להבין את האינטואיציה שמאחורי אינטגרל קווי מסוג שני כדאי לחזור לדיבורים על עבודה בפיזיקה. בואו נחשוב על שתי סיטואציות: רץ אולימפי שרץ כשהרוח היא עם כיוון הריצה, ורץ עם רוח נגד כיוון הריצה. במקרה הראשון די ברור לנו שהרוח “עוזרת” לרץ ובמקרה השני היא מפריעה לו. במקרה הראשון הרוח מוסיפה לו אנרגייה קינטית ובשני היא גוזלת אותה ממנו. מכאן אנו רואים שהעבודה של כוח תלויה בכיוון שלו.

אבל זה יותר מחוכם ממה שזה נראה במבט ראשון. הנה הדוגמה השלישית: לווין שמקיף את כדור הארץ. בואו נזניח השפעה של כל דבר מלבד כדור הארץ ונניח שהמסלול של הלווין מעגלי לחלוטין - איך הקסם הזה קורה? משהו גורם ללווין להסתובב כל הזמן סביב כדור הארץ בלי להשקיע בו אנרגיה נוספת. המשהו הזה הוא כדור הארץ עצמו; כוח המשיכה של כדור הארץ פועל על הלווין בכל עת בכיוון שהוא מאונך לכיוון התנועה של הלווין. זה גורם לשינוי במסלול של הלווין - במקום שהוא ימשיך בקו ישר, כפי שקורה לגופים בתנועה שלא פועלים עליהם כוחות, המסלול שלו הוא מעגלי. עם זאת, הכוח שכדור הארץ משנה לא מגדיל את גודל המהירות של הלווין, רק את הכיוון שלה; המהירות היא וקטור שמשתנה כל הזמן אבל הערך המוחלט שלו נותר קבוע. אם גודל המהירות לא השתנה, האנרגיה הקינטית של הגוף לא השתנתה. במילים אחרות, כדור הארץ מפעיל כוח שפועל על הלווין ללא הרף וגורם לו להישאר במסלול מעגלי, אבל הוא לא מבצע על הלווין שום עבודה. זה נכון באופן כללי: כוח שפועל על גוף במאונך למסלול תנועתו לא מבצע עליו עבודה.

אם כן, מה שעושים באופן כללי עם כוח שפועל על גוף הוא לפרק את הכוח לשני רכיבים. הרכיב שמאונך למסלול הגוף ולא מבצע שום עבודה ואפשר לכוח ממנו; והרכיב שתואם למסלול הגוף והוא זה שמשתתף בעבודה. בניסוח מתמטי, אנחנו מטילים את הכוח על וקטור הכיוון של מסלול התנועה בכל רגע נתון. הטלה כזו מתבצעת במתמטיקה על ידי מכפלה סקלרית. כזכור, אם \( v_{1}\left(x_{1},y_{1}\right) \) ו-\( v_{2}\left(x_{2},y_{2}\right) \) הם שני וקטורים ב-\( \mathbb{R}^{n} \) אז המכפלה הסקלרית שלהם מוגדרת להיות \( v_{1}\cdot v_{2}=x_{1}x_{2}+y_{1}y_{2} \) - כופלים “רכיב רכיב” ומחברים את כל המכפלות.

כלומר, הפעם אנחנו לא כופלים את ערך הפונקציה באורך הקטע מ-\( \gamma\left(t_{i}\right) \) אל \( \gamma\left(t_{i+1}\right) \); אנחנו כופלים סקלרית את ערך הפונקציה (שהוא, כזכור, וקטור ב-\( \mathbb{R}^{2} \)) בוקטור ההעתק מ-\( \gamma\left(t_{i}\right) \) אל \( \gamma\left(t_{i+1}\right) \). באופן דומה לניתוח של האינטגרל מהסוג הראשון, זה יביא אותנו בסופו של דבר אל הנוסחה:

\( \int_{C}F\cdot d\gamma=\int_{a}^{b}F\left(\gamma\left(t\right)\right)\cdot\gamma^{\prime}\left(t\right)dt \)

ושוב - רוב הספרים מעדיפים להגדיר אינטגרל קווי מסוג שני באמצעות הנוסחה הזו. עוד סימון אפשרי לאינטגרל קווי, שבו לא כותבים את \( F \) אלא את ה-\( P,Q \) שמרכיבות אותו, הוא \( \int_{C}Pdx+Qdy \). זה סימון קצת מבלבל ואני לא אוהב אותו במיוחד, אבל צריך להכיר אותו ולפעמים הוא שימושי מאוד (כשרוצים להציג בו זמנית את \( P,Q \) בצורה נוחה). שימו לב ש-\( \gamma \) נעלמה לחלוטין מהסימון הזה; כשמשתמשים בו מניחים שאפשר להסיק מתוך \( C \) מהי ה-\( \gamma \) הרלוונטית (עוד מעט נראה שיש לנו חופש בחירה די גדול של \( \gamma \) כזו בהינתן \( C \) מבלי שמשמעות האינטגרל תשתנה). עוד סימון שכדאי להכיר הוא \( \oint_{C} \) שמשתמשים בו כדי לתאר אינטגרל קווי כאשר \( C \) הוא עקום סגור, כלומר נקודת הסוף של העקומה שמתארת אותו שווה לנקודת ההתחלה. זה סימון קוסמטי למדי - אפשר היה לוותר על העיגול במרכז ושום דבר לא היה משתנה, אבל אני אוהב להשתמש בו.

בואו נראה איך ההגדרה הזו מסתדרת עם מושג העבודה בפיזיקה. נניח שיש לנו גוף שמבצע תנועה במישור שמתחילה ב-\( t_{1} \) ומסתיימת ב-\( t_{2} \). נתאר את המיקום שלו במישור בזמן \( t \) באמצעות הפונקציה \( r\left(t\right) \), את המהירות שלו עם \( v\left(t\right) \) ואת התאוצה שלו עם \( a\left(t\right) \). הכוח שפועל עליו במהלך התנועה יהיה פונקציה של המיקום שלו במישור, כלומר פונקציה \( F\left(r\left(t\right)\right) \). אנחנו כבר רואים איך זה מתאים יפה למבנה של האינטגרל הקווי שהגדרנו.

עכשיו, בואו ניזכר בכמה דברים מפיזיקה. ראשית, האנרגיה הקינטית של גוף שמהירותו \( v \) ומסתו \( m \) מוגדרת להיות \( \frac{mv^{2}}{2} \). שנית, על פי הגדרתם ממש, \( v\left(t\right)=r^{\prime}\left(t\right) \) ו-\( a\left(t\right)=v^{\prime}\left(t\right)=r^{\prime\prime}\left(t\right) \). לבסוף, החוק השני של ניוטון קובע ש-\( F=ma \) (יש גם ניסוח כללי יותר שלא רלוונטי לנו כאן).

כעת, העבודה שמתבצעת על הגוף על ידי הכוח במהלך תנועתו היא, על פי ההגדרה כאינטגרל קווי מסוג שני:

\( \int_{t_{1}}^{t_{2}}F\left(r\left(t\right)\right)\cdot r^{\prime}\left(t\right)dt=\int_{t_{1}}^{t_{2}}ma\left(t\right)\cdot v\left(t\right)dt=m\int_{t_{1}}^{t_{2}}v\left(t\right)\cdot v^{\prime}\left(t\right)dt \)

עכשיו, איזו פונקציה, כשנגזור אותה, תיתן לנו את הנגזרת \( v\left(t\right)v^{\prime}\left(t\right) \)? המבנה הזה קצת מזכיר את כלל השרשרת, ועם קצת משחק/נסיון באינטגרציה לא קשה לראות ש-\( \left[\frac{1}{2}v^{2}\left(t\right)\right]^{\prime}=v\left(t\right)v^{\prime}\left(t\right) \). מכאן נקבל:

\( m\int_{t_{1}}^{t_{2}}v\left(t\right)\cdot v^{\prime}\left(t\right)dt=\frac{m}{2}\left(v^{2}\left(t_{2}\right)-v^{2}\left(t_{2}\right)\right)=\frac{mv^{2}\left(t_{2}\right)}{2}-\frac{mv^{2}\left(t_{1}\right)}{2} \)

כלומר, קיבלנו שהעבודה אכן שווה לשינוי באנרגיה הקינטית, כפי שקיווינו.

עכשיו בואו נדבר על מה שהציק לנו מתחילת הפוסט: האם האינטגרל שלנו מוגדר היטב על עקום נתון, או שיש כאן תלות בבחירת העקומה שמגדירה את העקום? התשובה המיידית היא שפרט לכמה דברים כמעט מובנים מאליהם, אין חשיבות לבחירת העקומה. מה ברור, לפחות אינטואיטיבית, שכן ישפיע? למשל, שתי עקומות שמגדירות את אותו עקום אבל נעות לכיוונים ההפוכים. בואו ניתן את הניסוחים הפורמליים וההוכחות ואז הכל יהיה ברור יותר.

בואו נתבונן על שני עקומות\( \gamma\left(t\right) \) ו-\( \delta\left(t\right) \). נניח ש-\( \gamma \) מוגדרת על הקטע \( \left[a,b\right] \) ו-\( \delta \) מוגדרת על הקטע \( \left[c,d\right] \). אם \( \delta \) מתארת את אותו דבר כמו \( \gamma \) היינו מצפים שלכל \( t\in\left[c,d\right] \) יהיה איזה \( s_{t}\in\left[a,b\right] \) כך ש-\( \delta\left(t\right)=\gamma\left(s_{t}\right) \). זה מגדיר לנו פונקציה \( u:\left[c,d\right]\to\left[a,b\right] \) שמקיימת \( \delta\left(t\right)=\gamma\left(u\left(t\right)\right) \). בואו נתבונן לצורך הדוגמה בעקומות שהראיתי בתחילת הפוסט:

\( \gamma_{1}\left(x\right)=\left(x,x\right) \) על הקטע \( \left[0,1\right] \)

\( \gamma_{2}\left(x\right)=\left(2x,2x\right) \) על הקטע \( \left[0,\frac{1}{2}\right] \)

\( \gamma_{3}\left(x\right)=\left(1-x,1-x\right) \) על הקטע \( \left[0,1\right] \)

\( \gamma_{4}\left(x\right)=\begin{cases}\left(2x,2x\right) & 0\le x\le\frac{1}{2}\\\left(2\left(1-x\right),2\left(1-x\right)\right) & \frac{1}{2}\le x\le1\end{cases} \)

אז כאן למשל מתקיים \( \gamma_{2}\left(t\right)=\gamma_{1}\left(u\left(t\right)\right) \) כאשר \( u\left(t\right)=2t \). וכמו כן מתקיים \( \gamma_{3}\left(t\right)=\gamma_{1}\left(u\left(t\right)\right) \) כאשר \( u\left(t\right)=1-t \), ו-\( \gamma_{4}\left(t\right)=\gamma_{1}\left(u\left(t\right)\right) \) עם \( u\left(t\right)=\begin{cases}2t & 0\le t\le\frac{1}{2}\\2\left(1-t\right) & \frac{1}{2}\le t\le1\end{cases} \).

עכשיו, אם נחשב את האינטגרל הקווי של השדה הוקטורי \( f\left(x,y\right)=\left(x,y\right) \) עבור ארבעת העקומות הללו, מה נקבל?

במקרה הראשון, \( \int_{0}^{1}\left(t,t\right)\cdot\left(1,1\right)dt=\int_{0}^{1}2t=\left[t^{2}\right]_{0}^{1}=1 \).

במקרה השני, \( \int_{0}^{\frac{1}{2}}\left(2t,2t\right)\cdot\left(2,2\right)dt=\int_{0}^{\frac{1}{2}}8t=\left[4t^{2}\right]_{0}^{\frac{1}{2}}=1 \).

במקרה השלישי, \( \int_{0}^{1}\left(1-t,1-t\right)\cdot\left(-1,-1\right)dt=\int_{0}^{1}\left(2t-2\right)dt=\left[t^{2}-2t\right]_{0}^{1}=-1 \)

במקרה הרביעי, \( \int_{0}^{\frac{1}{2}}\left(2t,2t\right)\cdot\left(2,2\right)dt+\int_{\frac{1}{2}}^{1}\left(2\left(1-t\right),2\left(1-t\right)\right)\cdot\left(-2,-2\right)dt= \)

\( =\int_{0}^{\frac{1}{2}}8tdt+\int_{\frac{1}{2}}^{1}8\left(t-1\right)dt=\left[4t^{2}\right]_{0}^{\frac{1}{2}}+\left[4t^{2}-8t\right]_{\frac{1}{2}}^{1}=1+\left(-4+3\right)=0 \)

די ברור מה “משתבש” במקרים השלישי והרביעי - במקרה השני אנחנו הולכים “בכיוון ההפוך” על העקום, ולכן מקבלים תוצאה הפוכה; ובמקרה הרביעי אנחנו הולכים “לשם ובחזרה” ולכן סוכמים את תוצאות ההליכה בשני הכיוונים ומסיימים עם אפס. כל זה מצביע על כך שאנחנו רוצים לדרוש מ-\( u \) להיות חד-חד-ערכית ולהבדיל בין המקרה שבו היא הולכת בכיוון הנכון לבין זה שבו היא הולכת בכיוון ההפוך. דרך נוחה לעשות זאת היא לדרוש ש-\( u \) תהיה גזירה ושהנגזרת שלה תהיה שונה מ-0 בכל הקטע; זה מבטיח ש-\( u \) היא עולה בכל הקטע, או יורדת בכל הקטע. אם היא עולה (הנגזרת חיובית), הכל בסדר; אם היא יורדת (הנגזרת שלילית) אז נצפה לקבל היפוך של האינטגרל. פורמלית: אם \( \gamma \) ו-\( \delta \) הן עקומות המתאימות לעקום \( C \) כך שקיימת \( u:\left[c,d\right]\to\left[a,b\right] \) רציפה וגזירה עם \( u^{\prime}>0 \) בכל התחום עבורה מתקיים \( \delta\left(t\right)=\gamma\left(u\left(t\right)\right) \), אז \( \int_{C}F\cdot d\gamma=\int_{C}F\cdot d\delta \). אם קיימת \( u \) כזו כך ש-\( u^{\prime}<0 \) בכל התחום אז \( \int_{C}F\cdot d\gamma=-\int_{C}F\cdot d\delta \). זוהי אי התלות בפרמטר שחיפשנו. היא מצביעה על כך שבהינתן \( C \), לא באמת חשוב איך אנחנו בוחרים לבנות את הפרמטריזציה של \( C \), כלומר לא חשוב באיזו \( \gamma \) אנחנו משתמשים, כל עוד אנחנו מקפידים לזכור שהכיוון חשוב ושמספר הפעמים שבהן העקומה שלנו מכסה את \( C \) חשוב. למשל, אם \( C \) הוא מעגל, חשוב לדעת אם הפרמטריזציה שלנו נעה עם כיוון השעון או נגדו, וכמה פעמים היא “משלימה הקפה”.

לסיום, בואו נעבור לדבר על הכללות של המשפט היסודי של החדו"א עבור האינטגרלים שראינו. כאן אנחנו שולחים יד מגששת ונוגעים לראשונה במה שהוא היעד הסופי של סדרת הפוסטים הזו ולטעמי אחת מגולות הכותרת של כל הנושאים הללו - משפט סטוקס. אבל יש עוד זמן עד שאפשר יהיה להבין מה בכלל משפט סטוקס אומר, ולכן מה שנעשה כעת יהיה לדבר על דוגמאות (שכמובן, היו ידועות הרבה לפני משפט סטוקס המדובר).

בשביל להבין מאיפה זה מגיע בכלל, בואו ניזכר איך הולך המשפט היסודי של החדו”א. אם \( f \) רציפה ו-\( F \) היא פונקציה קדומה שלה (דהיינו, \( f=F^{\prime} \)) אז מתקיים \( \int_{a}^{b}f\left(x\right)dx=F\left(b\right)-F\left(a\right) \). המשפט הזה נראה לי כמו קסם - איכשהו אנחנו מצליחים לדעת מה הערך של האינטגרל המסויים על \( f \) בכל הקטע \( \left[a,b\right] \) רק על ידי הסתכלות על מה שקורה בקצוות הקטע. באיזה שהוא אופן קסום, הפונקציה \( F \) מקודדת את המידע על \( f \) בצורה כזו שמספיק לדגום אותה בשתי נקודות הקצה של הקטע כדי לדעת את ערכו של האינטגרל.

ועכשיו בואו נחשוב על אינגטרל כפול, כלומר אינטגרל ב-\( \mathbb{R}^{2} \) שמוגדר בצורה שתיארתי בפוסטים קודמים. כאן האינטגרציה היא לא על קטע אלא על תחום דו-ממדי כלשהו (התחלנו עם מלבן אבל בסופו של דבר הגענו לקבוצה פתוחה כלשהי). בואו נניח שיש לנו פונקציה \( f:\mathbb{R}^{2}\to\mathbb{R} \) שמוגדרת על תחום \( R \) ב-\( \mathbb{R}^{2} \) שהוא נחמד - הוא חסום והשפה שלו \( C \) היא פשוטה יחסית (לא אכנס כרגע להגדרות - אתם מוזמנים בינתיים להניח שהתחום הוא מלבן אם זה עוזר לכם). אין ל-\( R \) “נקודות קצה” כמו במימד אחד, אבל יש לו את השפה שלו; אז האם קיימת פונקציה \( F \) כלשהי כך שאפשר להמיר את האינטגרל הכפול של \( f \) על \( R \) באינטגרל קווי על איזו שהיא פונקציה \( F \)? באופן די נפלא, התשובה היא כן, ולתוצאה הזו קוראים משפט גרין. בואו ננסח אותו באופן מסודר. נתחיל דווקא מהפונקציה ה”קדומה”: ניקח \( F\left(x,y\right)=\left(P\left(x,y\right),Q\left(x,y\right)\right) \) כלשהי ועקומה סגורה \( C \), ויהא \( R \) התחום ש-\( C \) חוסמת, ונניח שהפרמטריזציה של \( C \) היא “נגד כיוון השעון” ועוד כל מני הנחות שבטח פספסתי (אל תשתמשו במשפט הזה בלי לוודא את כל ההנחות שלו!) אז מתקיים הדבר הבא:

\( \iint_{R}\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dxdy=\oint_{C}Pdx+Qdy \)

אם כן, מה שצץ באגף שמאל הוא לא הנגזרת של \( F \) כמו במשפט היסודי של החדו”א, אלא משהו קצת יותר מוזר - פונקציה שמתקבלת מלקיחת הרכיבים של \( F \), גזירה שלהם לפי המשתנה “הלא נכון” לכאורה (כלומר, רכיב ה-\( x \) של \( F \) נגזר לפי \( y \) ולהפך) ועוד יש לנו סכום וסימן מינוס שצצים מאי שם. לא יודע מה איתכם, אבל בי זה מעורר אוטומטית סקרנות להבין מה החוקיות הכללית שיש כאן. אני לא מאמין גדול בלהסתיר דברים, אז הנה החוקיות הכללית, שכרגע כנראה אין לנו דרך להבין: משפט הסטוקס הכללי. הוא אומר שאם \( M \) היא יריעה שמקיימת כך-וכך ו-\( \omega \) היא תבנית דיפרנציאלית שמקיימת כך וכך, אז \( \int_{M}d\omega=\int_{\partial M}\omega \), ובמילים - האינטגרל על \( M \) של הנגזרת החיצונית של התבנית \( \omega \) שווה לאינטגרל של \( \omega \) על השפה של \( M \). יש כאן שלל מושגים שאין לנו הגדרה עבורם כרגע (ובצדק; ההגדרות, שנראה בהמשך, הן לא קלות לעיכול), אבל אפשר להתאים את הנוסחה הכללית למשפט שראינו. ה”יריעה” \( M \) אצלנו היא בסך הכל הקבוצה \( R \) במישור. ה”תבנית הדיפרנציאלית” \( \omega \) היא ה-\( Pdx+Qdy \) הזה (בהמשך ניתן משמעות פורמלית ל-\( dx,dy \) הללו סוף כל סוף!). אני יכול גם לגלות ש-\( Pdx+Qdy \) זה משהו שנקרא 1-תבנית (יש גם 0-תבנית, 2-תבנית וכן הלאה) ושמשפט סטוקס תובע שהמימד של \( M \) יהיה גדול ב-1 מהמספר של התבנית (אצלנו \( M \) היא ממימד 2, כמובן). לבסוף, באיזו שהיא דרך, ה-\( \frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y} \) היא התבנית שמתקבלת בתור נגזרת חיצונית של \( Pdx+Qdy \). אני לא אתעמק במשפט סטוקס יותר מכך כרגע; בהמשך נראה את ההכללה של אינטגרל קווי - אינטגרל משטחי - וזה יאפשר לנו להציג עוד שני משפטים הדומים למשפט גרין - משפט גאוס ומשפט סטוקס הקלאסי, שגם הם מקרים פרטיים של משפט סטוקס, ואז הרעיון הכללי יהיה טיפה יותר ברור (ולכן גם תהיה יותר מוטיבציה להילחם עם ההגדרות של יריעות ושל תבניות דיפרנציאליות).

אז ראינו את משפט גרין שהיה מעין הכללה של המשפט היסודי של החדו”א, אבל עבור אינטגרלים כפולים בכלל; האינטגרל הקווי מילא כאן את התפקיד של “נקודות הקצה” במשפט היסודי הרגיל של החדו”א. השאלה היא אם קיים גם משהו הפוך - משפט יסודי שבו אפשר לצמצם את חישוב האינטגרל הקווי להסתכלות על נקודות הקצה. כלומר, בהינתן עקומה \( \gamma \) על \( \left[a,b\right] \) ושדה וקטורי \( F \), האם קיימת איזו שהיא פונקציה “קדומה” \( \Phi \) כך ש-

\( \int_{a}^{b}F\cdot d\gamma=\Phi\left(b\right)-\Phi\left(a\right) \)?

התשובה היא שזה אפשרי לפעמים. צריך ש-\( F \) יקיים תכונה נחמדה כלשהי; שהוא יהיה שדה משמר. צריך להבין מה זה אומר שהמשוואה לעיל מתקיימת - זה אומר שהאינטגרל הקווי בין הנקודות \( \gamma\left(a\right) \) ו-\( \gamma\left(b\right) \) לא תלוי בעקום אלא רק בנקודות הקצה שלו. שימו לב - זה לא כמו קודם, כאשר לקחנו פרמטריזציות שונות לאותו עקום; כאן אנחנו מדברים על אותן נקודות קצה אבל על עקומים שיכולים להיות שונים לגמרי. אפשר קו ישר בין הנקודות; ואפשר קו מתפתל ומזגזג והולך אחורה וקדימה ושוב אחורה וחותך את עצמו ומשתגע ועושה ספירלות וסלטות באוויר וכל מה שתרצו - ועדיין, צריך לצאת שערך האינגטרל הקווי יהיה זהה כמו במקרה של קו ישר (והנה אפיון אלטרנטיבי: האינטגרל של \( F \) על כל מסלול סגור צריך להיות 0; הסיבה לכך היא שאפשר לבחור שתי נקודות על המסלול הסגור ולפרק אותו לאיחוד של שתי עקומות שהולכות “לשם ובחזרה”). לכן זו שאלה טובה ואפילו מצויינת באילו תנאים על \( F \) הקסם הזה יתרחש. והתשובה היא פשוטה להפתיע: צריך ש-\( F \) יהיה גרדיאנט של שדה סקלרי. כלומר, שתהיה פונקציה סקלרית \( f:\mathbb{R}^{2}\to\mathbb{R} \) כך ש-\( F=\nabla f \), דהיינו ש-\( F=\left(\frac{\partial f}{\partial x},\frac{\partial f}{\partial y}\right) \). עם הסימונים הללו נקבל את הנוסחה

\( \int_{a}^{b}\nabla f\cdot d\gamma=f\left(b\right)-f\left(a\right) \)

והנוסחה הזו ממש אנלוגית למשפט היסודי הרגיל של החדו”א - הרי \( \nabla f \) במקרה החד ממדי זו בדיוק \( f^{\prime} \). היא גם נותנת לנו עוד הצצה אל משפט סטוקס הכללי - כאן \( f \) היא התבנית הדיפרנציאלית ו-\( \nabla f \) היא הנגזרת החיצונית שלה (אז כבר קיבלנו שתי דוגמאות לנגזרות חיצוניות של תבניות דיפרנציאליות, בלי שנדע מה זה בכלל). הטרמינולוגיה שבה משתמשים בהקשר של תבניות היא לומר שתבנית היא מדויקת אם היא הנגזרת החיצונית של תבנית אחרת, ולכן אפשר לנסח את המשפט הקודם בכך שאם השדה הוקטורי הוא תבנית מדויקת, אז הוריאנט של המשפט היסודי מתקיים עבורו.

בכך הגענו לסוף הדיון הנוכחי על אינטגרלים קוויים, אבל כפי שאנחנו כבר רואים - אינטגרלים קווים הם רק ההתחלה; כרטיס הכניסה שלנו לעולם חדש, מופלא, של חדו”א. ויהי ערב ויהיה בוקר וירא אלי קרטן כי טוב ויברא את התבנית הדיפרנציאלית.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com