על יריעות ותבניות (מה משפט סטוקס אומר, בגדול)

מבוא

כל סדרת הפוסטים שלי על אנליזה וקטורית עד כה תיארה פחות או יותר את מה שרואים בקורס הבסיס בנושא (שלרוב זוכה לשמות כמו "חדו"א 2" או "אינפי 3" או "חשבון אינפיניטסימלי במספר משתנים" וכדומה). ה"שיא" של קורסי הבסיס הוא משפטי גאוס וסטוקס. זה נושא יפה, מעניין ובעיקר שימושי ביותר; אבל כשאני סיימתי ללמוד אותו התחושה שלי הייתה של מהומה אחת גדולה. תחושה שיש לנו שלל סוגים שונים ומשונים של אינטגרלים ונגזרות ומשפטים שקשורים אליהם וחסרה הרגשה של "תמונה גדולה".

למרבה המזל, זה מה שאוהבים לעשות במתמטיקה: לראות את התמונה הגדולה. בעזרת הכללות נכונות, אפשר לעשות סדר בכל המהומה הזו, והתוצאות הכלליות הן מרהיבות; לטעמי מדובר על אחד מהדברים היפים ביותר שאני מכיר במתמטיקה. הבעיה היא שבשביל להגיע אל התוצאות הכלליות הללו צריך לא מעט הכנה מוקדמת, וכל עוד עוסקים בהכנה המוקדמת הזו הפרטים עשויים להיראות יבשים ואבסטרקטיים במיוחד ולא ברור מה התמונה הגדולה ולאן זה הולך. אז בפוסט הזה אני אנסה להסביר את התמונה הגדולה ככל שאוכל מבלי להיכנס לעומק הפרטים. המחיר הוא כמובן ויתור כלשהו על היופי (אני חוזר ואומר תמיד שכדי להינות מהאסתטיקה שבמתמטיקה עד הסוף צריך להיכנס גם לפרטים הטכניים) אבל בואו נקווה שלא ויתור גדול מדי.

בואו נתחיל עם תזכורת מהבלאגן שיש לנו. העולם שבו אנחנו חיים הוא \(\mathbb{R}^{n}\), ואנחנו מתעסקים בעיקר עם פונקציות \(F:\mathbb{R}^{n}\to\mathbb{R}^{n}\) (שנקראות אצלנו שדה וקטורי) ופונקציות \(f:\mathbb{R}^{n}\to\mathbb{R}\) (שנקראות שדה סקלרי). הגדרנו אופרטור גזירה \(D\) עבור פונקציות כאלו – אופרטור שמחזיר טרנספורמציה לינארית שמתארת קירוב לינארי של הפונקציה בכל נקודה. אפשר לחשוב על הנגזרת גם בתור מטריצה (מסדר \(n\times n\) במקרה של שדה וקטורי ומסדר \(1\times n\) במקרה של שדה סקלרי – במקרה הזה אנחנו קוראים לה גם גרדיאנט ומתארים אותה כוקטור שמסומן \(\nabla f\)). זה היה נחמד. ואז הגיעו האינטגרלים.

אנחנו הגדרנו אינטגרלים \(n\)-ממדיים בתור הכללה סבירה של אינטגרלים בממד יחיד; באופן כללי אנחנו יודעים להגדיר אותם על קבוצות פתוחות ב-\(\mathbb{R}^{n}\), כאשר הפונקציה הרלוונטית היא שדה סקלרי (על שדה וקטורי לא הגדרנו). ואחר כך הגדרנו אינטגרלים על עקומות ב-\(\mathbb{R}^{n}\) ואז על משטחים במקרה הספציפי של \(\mathbb{R}^{3}\), ובשני המקרים הללו הגדרנו את האינטגרלים גם עבור שדה סקלרי וגם עבור שדה וקטורי. ואז קיבלנו כמה משפטים שמקשרים סוגי אינטגרלים שונים:

  • \(\iint_{D}\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dxdy=\oint_{\partial D}Pdx+Qdy\) (משפט גרין)
  • \(\iiint_{D}\left(\nabla\cdot F\right)dxdydz=\oint_{\partial D}F\cdot ndS\) (משפט גאוס)
  • \(\iint_{S}\left(\nabla\times F\right)dS=\oint_{\partial S}F\cdot d\gamma\) (משפט סטוקס)

אלו משפטים מגניבים והרעיון של כולם זהה באופיו, אבל שימו לב כמה הסימונים שלי שונים ממשפט למשפט, וההרגשה היא של בירחוש כללי. מה המוטיב המאחד כאן?

ובכן, בואו נחשוב רגע על מה זה בכלל אינטגרל. אני חושב על אינטגרל בתור טנגו – בתור ריקוד צמוד וסוער לשני משתתפים, שכל אחד מביא אליו את אופיו המיוחד. המשתתף הראשון הוא המרחב שעליו מתבצעת האינטגרציה, והמשתתף השני הוא הפונקציה שמבצעים לה את האינטגרציה. בתור המשתתף הראשון יש לנו קבוצות פתוחות ב-\(\mathbb{R}^{n}\), ויש לנו עקומות שחיות בתוך \(\mathbb{R}^{n}\) אבל הן "חד ממדיות" במובן מסויים, ויש לנו משטחים שחיים ב-\(\mathbb{R}^{n}\) אבל הם "דו ממדיים" במובן מסויים; בתור המשתתף השני יש לנו שדות סקלריים ושדות וקטוריים, כאשר בחלק מהמקרים שדה סקלרי מתקבל על ידי הפעלת אופרטור על שדה וקטורי (מה שעושה הדיברגנץ \(\nabla\cdot F\)) או שדה וקטורי מתקבל מהפעלת אופרטור על שדה וקטורי (מה שעושה הרוטור \(\nabla\times F\)).

ההכללה שלנו מוצאת את המשותף לכל המשתתפים מהסוג הראשון, ולכל המשתתפים מהסוג השני. בואו נציג את השמות של המשתתפים מבלי להיכנס כרגע להגדרות. כל המשתתפים מהסוג הראשון – קבוצות פתוחות, עקומות, משטחים – הם מקרים פרטיים של יריעות ב-\(\mathbb{R}^{n}\). כל המשתתפים מהסוג השני הם מקרים פרטיים של תבניות דיפרנציאליות מעל \(\mathbb{R}^{n}\). ליריעות יש "דרגה" \(k\) כלשהי ב-\(\mathbb{R}^{n}\) שמייצגת בערך את המימד שלה – לעקומות יש דרגה 1, למשטחים יש דרגה 2 וכן הלאה. גם לתבניות דיפרנציאליות יש דרגה \(k\). אפשר להגדיר אינטגרל באופן כללי, לכל יריעה \(M\) ולכל תבנית דיפרנציאלית \(\omega\), כאשר הדרגה של היריעה זהה לדרגה של התבנית; האינטגרל מסומן \(\int_{M}\omega\). אפשר להגדיר אופרטור \(\partial\) שלוקח יריעה \(M\) מדרגה \(k\) ומחזיר יריעה \(\partial M\) מדרגה \(k-1\) שמהווה את השפה של \(M\); ואפשר להגדיר אופרטור \(d\) שלוקח תבנית דיפרנציאלית \(\omega\) ומחזיר תבנית דיפרנציאלית \(d\omega\) מדרגה \(k+1\) שהיא, במובן מסויים, כל המידע שניתן להפיק מ-\(\omega\) על ידי גזירה שלה. את כל ארבעת הרכיבים הללו – יריעות, שפות של יריעות, תבניות דיפרנציאליות, נגזרות של תבניות דיפרנציאליות – מחברים במה שנקרא משפט סטוקס הכללי:

\(\int_{M}d\omega=\int_{\partial M}\omega\)

אם חושבים על השפה של יריעה בתור "הנגזרת" של היריעה (הסימון \(\partial M\) מרמז לזה), אז משפט סטוקס הוא מאוד אלגנטי בניסוחו: האינטגרל של תבנית על נגזרת של יריעה שווה לאינטגרל של נגזרת התבנית על היריעה. הניסוח הזה מסתיר מאחוריו גישה מופשטת מאוד מעניינת לנושא הזה, שמערבת יצורים שנקראים הומולוגיות וקוהומולוגיות; אני מקווה להציג את זה בעתיד, אך לא כרגע.

אם כן, הגענו די מהר לניסוח של "הגביע הקדוש" שלנו; נשאר רק להבין את חמשת המרכיבים שלו – יריעות, שפות של יריעות, תבניות דיפרנצאליות, נגזרות של תבניות דיפרנציאליות, ואינטגרל של תבנית דיפרנציאלית על יריעה. יש גם דרישות נוספות שלא נכנסתי אליהן כדי שהמשפט יתקיים – הדרישה הקשה ביותר להסביר היא שהיריעה \(M\) צריכה להיות אוריינטבילית; רק ארמוז בפוסט הזה על מה זה אומר בכלל.

יריעות

בואו נתחיל מלהסביר מהן יריעות, כי זה החלק הקל. נפנוף הידיים הסטנדרטי הוא להגיד שיריעה מדרגה \(k\) היא תת-קבוצה של \(\mathbb{R}^{n}\) ש"באופן מקומי" נראית כמו \(\mathbb{R}^{k}\) כלומר, לכל נקודה בה יש סביבה שאיזומורפית ל-\(\mathbb{R}^{k}\). הדוגמה הקלאסית היא כדור הארץ. כדור הארץ הוא, ובכן, כדור (גם זה לא, הוא אליפסואיד; וגם זה לא, הוא גאואיד; מרוצים, נטפקנים?), אבל עבורנו ביומיום הוא נראה שטוח. אנחנו צריכים קצת להתאמץ כדי להיווכח בכך שהוא עקום. אז מבחינה מקומית כדור הארץ נראה לנו כמו \(\mathbb{R}^{2}\), למרות שפני השטח שלו הם ספירה שחיה ב-\(\mathbb{R}^{3}\). ואם תרצו תיאור קצת יותר אלים – אפשר לקחת כל נקודה על פני כדור הארץ, לקרוע אותה יחד עם סביבה שלה מתוך כדור הארץ, לשים על שולחן גדול, לדפוק בפטיש על הסביבה עד שהיא מתיישרת ונראית כמו \(\mathbb{R}^{2}\) נחמד שכזה.

למה לנו לדבר על יריעות? זה כמעט מובן מאליו. מצד אחד, זה מאפשר לנו לדבר על מרחבים מסובכים הרבה יותר מאשר \(\mathbb{R}^{n}\) מבחינת המבנה שלהם. מצד שני, מכיוון שרוב האנליזה שאנחנו מבצעים בכל מקרה מתבצעת בצורה מאוד מקומית (אם נפשפש בהוכחות שנתתי עד כה בפוסטים על הנושא נראה שהקטע של "הנה נקודה והנה סביבה פתוחה שלה ועכשיו בואו נתעסק רק במה שקורה בסביבה הזו" מככב), הרי שאם מקומית המרחב שלנו נראה כמו \(\mathbb{R}^{k}\), נוכל לנתח אותו באמצעות האנליזה של \(\mathbb{R}^{k}\) שאנחנו כבר מכירים, עם מינימום כאב ראש של התאמות נוספות. זו הסיבה שבגללה כל מני ספרי מבוא ל"אנליזה על יריעות" מתחילים עם חדו"א ב-\(\mathbb{R}^{n}\), חורשים את הנושא עוד ועוד, ורק ברגע האחרון מגיעים פתאום ליריעות, במקום להתחיל עם יריעות – כשאנחנו מתחילים עם אנליזה של יריעות, אנחנו מתבססים בצורה חזקה מאוד על האנליזה של \(\mathbb{R}^{n}\) שכבר יש לנו, בדומה לאופן שבו האנליזה של \(\mathbb{R}^{n}\) התבססה חזק על האנליזה של \(\mathbb{R}\).

שימו לב שאני מדבר כאן על יריעה בתור תת-מרחב של \(\mathbb{R}^{n}\). אפשר להשמיט לגמרי את הדרישה הזו ולהגדיר יריעה להיות "מרחב טופולוגי המקיים כך-וכך שנראה מקומית כמו \(\mathbb{R}^{k}\)", אבל אני לא רוצה להיכנס פה לטופולוגיה או ל"כך-וכך" הנדרשים, אז הכי פשוט לדבר רק על תת-מרחבים של \(\mathbb{R}^{n}\) בשלב הזה – זה בכל מקרה המצב אצלנו, עם אינטגרלים מסלוליים ומשטחיים. מסלול הוא בסך הכל יריעה מדרגה 1 ב-\(\mathbb{R}^{n}\) ומשטח הוא יריעה מדרגה 2 (יש משפט, Whitney embedding theorem, שמבטיח שאפשר לשכן כל יריעה מהסוג הרלוונטי לנו בתוך \(\mathbb{R}^{n}\) עבור \(n\) מתאים, כך שזה לא באמת מגביל את הכלליות).

ההגדרות המדויקות עבור יריעות הן לא טריוויאליות לגמרי אז אשמור אותן לפוסט נפרד, אבל הנה הרעיון הכללי: קבוצה \(M\) היא יריעה אם קיים לנו כיסוי של \(M\) על ידי קבוצות פתוחות (פתוחות בתוך \(M\), לאו דווקא בתוך המרחב שמכיל את \(M\)) כך שלכל קבוצה קיימת פונקציה חח"ע ועל מהקבוצה אל תת-קבוצה פתוחה של \(\mathbb{R}^{k}\) שהיא בנוסף לכך גם רציפה וגם ההופכית שלה רציפה – מה שנקרא בטופולוגיה הומיאומורפיזם. לפונקציה כזו קוראים chart (בעברית "מפה", אבל זה פחות מוצלח כי אנחנו משתמשים ב"מפה" גם בשביל map שהוא שם נרדף נפוץ מאוד לפונקציות). האינטואיציה פה היא של כדור הארץ – כל מפה בתוך אטלס היא ייצוג שטוח (מעוות מבחינת הגדלים שהוא מציג, לפעמים) של חלק מכדור הארץ. זה גם נותן מוטיבציה לקרוא בשם אטלס לאוסף של מפות כאלו שביחד מכסות את כל היריעה ו"משחקות יפה ביחד" באיזורים שמשותפים לשתיים או יותר מפות.

הבעיה אצלנו היא שההגדרה הזו – שהיא בדרך כלל מה שמציגים – לא לגמרי תופסת את המרחבים שמעניינים אותנו. כל היריעות שמתוארות בצורה הזו הן ללא שפה, בזמן שבשביל משפט סטוקס אנחנו דווקא צריכים יריעות עם שפה, תחשבו על ההבדל בין כדור הארץ ועולם הדיסק של טרי פראצ'ט – על כדור הארץ אין נקודת קצה שאם עוברים אותה, "יוצאים" מכדור הארץ. כמובן, אם ממריאים למעלה יוצאים מכדור הארץ, אבל זה לא חלק ממה שמתואר על ידי המפות שלנו – במפות שלנו העולם הוא דו-ממדי, אין "למעלה". לא משנה לאיזה כיוון תלכו על גבי המפה, לא תצאו מכדור הארץ. בעולם הדיסק, לעומת זאת, יש לעולם נקודת שפה שכל מי שחורג ממנה נופל מהדיסק. לנקודות שפה כאלו לא תוכל להיות סביבה פתוחה שהומיאומורפית לסביבה פתוחה של \(\mathbb{R}^{k}\). אז קצת מרחיבים את ההגדרה כך שמפה יכולה ללכת גם לסביבות פתוחות של \(\mathbb{H}^{k}\), שהוא חצי המרחב \(\mathbb{R}^{k}\) (תחשבו עליו בתור כל הוקטורים \(v=\left(v_{1},\dots,v_{k}\right)\) כך ש-\(v_{1}\ge0\) ). זה נותן לנו הגדרה של נקודות פנימיות ונקודות שפה על יריעה: נקודה היא פנימית אם קיימת סביבה שלה שהומיאומורפית ל-\(\mathbb{R}^{k}\), ואחרת (אם כל סביבה חייבת להיות הומיאומורפית ל-\(\mathbb{H}^{k}\)) היא נקראת נקודת שפה. את אוסף כל נקודות השפה של \(M\) מסמנים בתור \(\partial M\).

קל להגדיר אינטגרלים של פונקציות סקלריות על יריעה – מרכיבים את הפונקציה על מפה שלוקחת חלק מ-\(\mathbb{R}^{k}\) לתוך היריעה, ועכשיו מחשבים את האינטגרל ב-\(\mathbb{R}^{k}\) של הפונקציה המורכבת הזו. כמובן שיש עוד היבטים טכניים לעניין הזה שלא אכנס אליהם כרגע; מה שחשוב לי להבהיר הוא שההגדרה הרגילה שלנו לאינטגרל עובדת כאן באופן כמעט חלק.

הדבר הרלוונטי הנוסף שאנחנו דורשים מיריעות הוא אוריינטביליות. בנפנוף ידיים, זה אומר שאפשר לקחת את היריעה ולהגדיר לה שני צדדים. הדרך הטובה להבין את זה היא לראות מתי זה לא עובד – עם טבעת מביוס שיש לה רק צד אחד. נניח שאנחנו עומדים היכן שהוא על הטבעת ומתחילים לטייל לאורכה. בסופו של דבר נוכל לחזור לאותה נקודה בדיוק על הטבעת, אבל כשאנחנו הפוכים. קצת יותר פורמלית, אם ניקח ניצב לטבעת ונתחיל להזיז אותו באופן רציף, נחזור בסוף לאותה נקודה ונקבל את הניצב לכיוון ההפוך. כדי להגדיר את זה פורמלית דורשים דרישה מסויימת על מה שקורה באזורי החפיפה במפות של האטלס עבור היריעה – אני לא אכנס לפרטים כרגע.

תבניות דיפרנציאליות

עכשיו אנחנו מגיעים לחלק המאתגר יותר של הפוסט – אולי הדבר הכי מאתגר עבורי בכל סדרת הפוסטים: לנסות להבין מה זו תבנית דיפרנציאלית בלי להיכנס לכל הפרטים הטכניים. כי להגדיר טכנית מה זה, זה די קל: זו פונקציה שלכל נקודה במרחב שלנו מתאימה טנזור מתחלף. אבל מאיפה זה הגיע, מה לעזאזל זה אומר, איך זה משתלב בדברים – זה דורש עבודה, ובפוסט הזה אני עדיין לא מתכנן לבצע את כל העבודה הזו. אני רק רוצה לתת את הרעיון. נתחיל בלקפוץ למים, ואז נעצור לרגע ונראה תמונה גדולה קצת יותר.

הרעיון הבסיסי הוא להתחיל להסתכל על יצורים כמו \(dx\) ו-\(dy\) שעד עכשיו היו על תקן "סימון שמופיע באינטגרלים כשבא לנו והוא חסר כל משמעות בפועל חוץ אולי מלהגיד לנו מה המשתנה שעליו מבצעים אינטגרציה" בתור אובייקטים פורמליים בעלי משמעות מתמטית קונקרטית – בתור יצורים ("טנזורים", אבל השם הזה לא חשוב כרגע) שחיים בתוך מרחב וקטורי שבו אפשר לחבר אותם, לכפול אותם בסקלר, לבצע סוג של פעולת כפל עליהם שמייצרת יצור מסדר גדול יותר, ולבצע עליהם פעולה של גזירה שמכלילה את פעולת הגזירה הרגילה. בלבוש הזה, ביטוי כמו \(\int_{a}^{b}fdx\) כבר לא אומר "אינטגרל על הפונקציה \(f\) על פי המשתנה \(x\)" אלא "אינטגרל על התבנית הדיפרנציאלית \(fdx\) שמורכבת מהיצור \(dx\) ומהמקדם \(f\)", ואילו ביטוי לכאורה שונה, של אינטגרל מסלולי, \(\oint_{\partial D}Pdx+Qdy\), יאמר בעצם את אותו הדבר – אינטגרל על התבנית הדיפרנציאלית \(Pdx+Qdy\) שהיא צירוף לינארי של היצורים \(dx,dx\) עם המקדמים \(P,Q\).

פעולת ה"מכפלה" שמוגדרת על טנזורים כאן נקראת "מכפלת טריז" (תרגום חופשי למדי של wedge product שאין לי דרך טובה יותר לתרגם). והיא מסומנת ב-\(\wedge\): למשל, \(dx\wedge dy\) היא המכפלה של \(dx\) ב-\(dy\). אפילו בלי להיכנס בכלל להגדרה של המכפלה הזו אפשר להבין לא רע איך מקבלים ממנה את המשפטים שלמעלה אם מכירים תכונה אחת שלה – אנטי-קומוטטיביות. כלומר, \(dx\wedge dy=-dy\wedge dx\) וכדומה. מהתכונה הזו נובע מייד ש-\(dx\wedge dx=0\) (כי \(dx\wedge dx=-dx\wedge dx\)).

לסיום, פעולת ה"גזירה" של יצור בסיסי מהצורה \(Pdx_{i_{1}}\wedge dx_{i_{2}}\wedge\dots\wedge dx_{i_{k}}\) נותנת את האיבר \(\sum_{j=1}^{n}\frac{\partial P}{\partial x_{j}}dx_{j}\wedge dx_{i_{1}}\wedge dx_{i_{2}}\wedge\dots\wedge dx_{i_{k}}\) . במילים אחרות – לוקחים את המקדם \(P\). גוזרים אותו לפי המשתנה \(x_{j}\) בגזירה "רגילה". דוחפים את \(dx_{j}\) במקום הראשון של היצור \(dx_{i_{1}}\wedge dx_{i_{2}}\wedge\dots\wedge dx_{i_{k}}\) (וכך מקבלים יצור "גדול יותר"), וסוכמים על כל המשתנים של המרחב. עבור המקרה הפרטי של משפט גרין, שבו מתחילים עם התבנית \(Pdx+Qdy\) ואנחנו חיים בעולם עם שני משתנים, נקבל את הנגזרת \(\left(\frac{\partial P}{\partial x}dx\wedge dx\right)+\left(\frac{\partial P}{\partial y}dy\wedge dx\right)+\left(\frac{\partial Q}{\partial x}dx\wedge dy\right)+\left(\frac{\partial Q}{\partial y}dy\wedge dy\right)\). האיבר הראשון והאחרון שווים לאפס, ובאיבר השני אנחנו מחליפים את \(dy\wedge dx\) ב-\(-dx\wedge dy\), והופס! קיבלנו את הביטוי \(\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dx\wedge dy\) הקסום של משפט גרין שמעולם לא היה ברור (לי) מהיכן הוא בא (שימו לב שאני כותב \(dx\wedge dy\) במקום "סתם" \(dxdy\) כדי לא לבלבל; כשכותבים \(dxdy\) קל מדי לחשוב שאפשר להפוך את הסדר ולקבל \(dydx\) בלי לשלם על זה מחיר). אם נעשה חישוב דומה בתלת מימד עבור \(F_{x}dx+F_{y}dy+F_{z}dz\) נקבל את הרוטור של משפט סטוקס הקלאסי (כאן \(dx\wedge dy\) יתאים, למשל, עבור הרכיב של \(z\) של הרוטור, מסיבות שנבין אם וכאשר ניכנס לפרטים הטכניים). משפט הדיברגנץ טיפה מסובך יותר – עבור השדה הוקטורי \(F=\left(F_{x},F_{y},F_{z}\right)\) אנחנו מתאימים את התבנית \(F_{x}dy\wedge dz-F_{y}dx\wedge dz+F_{z}dx\wedge dy\) ואז קל לראות שהנגזרת תצא \(\frac{\partial F_{x}}{\partial x}+\frac{\partial F_{y}}{\partial y}+\frac{\partial F_{z}}{\partial z}\).

אוקיי, אז יש לנו רעיון כללי מאוד של מה עושים ומה ההיבטים הטכניים שמובילים לנוסחאות של גרין, סטוקס וגאוס; אבל מה לעזאזל התבניות הדיפרנציאליות הללו מייצגות? בואו נתחיל מחדש.

המקום הנכון להתחיל ממנו הוא מהיכן שכל סדרת הפוסטים הזו החלה ממנו: נגזרת רב-ממדית. בואו ניקח פונקציה סקלרית \(f:\mathbb{R}^{n}\to\mathbb{R}\). כזכור, הנגזרת שלה בנקודה \(a\) מסויימת היא מטריצה שסימנתי בתור \(Df\left(a\right)\). המטריצה הזו מקודדת את כל המידע על הנגזרות של \(f\) בנקודה \(a\) במובן הבא: לכל וקטור כיוון \(u\), הנגזרת המכוונת של \(f\) בנקודה \(a\) שווה ל-\(Df\left(a\right)\cdot u\) – כלומר, כפל של המטריצה בוקטור הכיוון. עד עכשיו חשבנו על המטריצה \(Df\left(a\right)\) הזו גם בתור טרנספורמציה לינארית (זו שמוגדרת בדיוק על ידי כפל המטריצה בוקטור הכיוון) שקראתי לה "הדיפרנציאל" של \(f\); אבל דווקא עכשיו ישתלם לנו קצת לשמר את ההפרדה הזו ולהשתמש בסימונים קצת שונים עבור הטרנספורמציה.

בואו נסתכל על המקרה של פונקציה סקלרית, \(f:\mathbb{R}^{n}\to\mathbb{R}\). נסמן את הקלטים שלה ב-\(a=\left(a_{1},\dots,a_{n}\right)\). אז \(Df\left(a\right)=\left(\frac{\partial f}{\partial x_{1}}\left(a\right),\dots,\frac{\partial f}{\partial x_{1}}\left(a\right)\right)\) הוא הוקטור שמתאים לנקודה \(a\). אני יכול קצת לרמות בסימון ופשוט לכתוב \(Df=\left(\frac{\partial f}{\partial x_{1}},\dots,\frac{\partial f}{\partial x_{1}}\right)\) ואז מה שיש לי הוא פונקציה, שאני קורא לה \(Df\), שלכל נקודה \(a\) במרחב מתאימה וקטור. עכשיו בואו נניח שלא הייתי רוצה לעשות את זה, אלא לכתוב פונקציה שלכל נקודה \(a\) במרחב מתאימה את הטרנספורמציה הלינארית המתאימה, בלי השטיק שלי של לזהות וקטורים עם הטרנספורמציות שהם מגדירים. איך אני יכול לעשות את זה?

ובכן, דרך אחת לעשות זאת היא כך: נגדיר פונקציות הטלה \(\pi_{i}:\mathbb{R}^{n}\to\mathbb{R}\) שפועלות על וקטור \(v=\left(v_{1},\dots,v_{n}\right)\) באופן המתבקש: \(\pi_{i}\left(v\right)=v_{i}\). עכשיו, אם יש לי וקטור \(u=\left(u_{1},\dots,u_{n}\right)\) אפשר להגדיר פונקציונל של "מכפלה סקלרית עם \(u\)" על ידי \(\sum u_{i}\pi_{i}\). במקרה שלנו, הוקטור שאיתו כופלים סקלרית הוא \(\left(\frac{\partial f}{\partial x_{1}}\left(a\right),\dots,\frac{\partial f}{\partial x_{1}}\left(a\right)\right)\) כאשר \(a\) היא נקודה כלשהי במרחב. כלומר, אנחנו מתעניינים פה בפונקציה שלכל נקודה \(a\) במרחב מתאימה את האופרטור \(\sum\frac{\partial f}{\partial x_{i}}\left(a\right)\pi_{i}\). לסיום, בואו נסמן ב-\(dx_{i}\) את הפונקציה הקבועה שלכל נקודה במרחב מתאימה את ההטלה \(\pi_{i}\) (זה לא סימון שרירותי; הוא נובע מהגדרת הנגזרת שנתנו קודם, אבל לא אכנס לכך בפוסט הזה). עכשיו אפשר לכתוב את הדבר הבא: \(df=\sum\frac{\partial f}{\partial x_{i}}dx_{i}\). בדו מימד, למשל, זה נכתב בתור \(df=\frac{\partial f}{\partial x}dx+\frac{\partial f}{\partial y}dy\) – וזו עשויה להיות נוסחה שמוכרת לכם. בדרך כלל מציגים אותה פשוט בתור סימון, דרך נוחה לזכור דברים; כאן יש לה משמעות פורמלית לגמרי.

לכל אחד מה-\(dx_{i}\) הללו קוראים 1-תבנית. אינטואיטיבית, \(k\)-תבנית היא פונקציה על \(\mathbb{R}^{n}\) שלכל נקודה \(a\) במרחב מתאימה העתקה לינארית ב-\(k\) משתנים שמוגדרת מעל \(\mathbb{R}^{n}\) (כלומר, מקבלת \(k\) קלטים שכל אחד מהם הוא וקטור ב-\(\mathbb{R}^{n}\)). יש כאן רמת סיבוך נוספת שאני מחביא לבינתיים – ההעתקה שמותאמת לנקודה \(a\) לא פועלת "סתם" על \(\mathbb{R}^{n}\), אלא על המרחב המשיק של הנקודה \(a\), שהוא איזומורפי ל-\(\mathbb{R}^{n}\) בעצמו – אבל אני מחביא את זה בפוסט הזה.

עכשיו, מכיוון שמסורבל לומר כל הזמן "העתקה לינארית ב-\(k\) משתנים שמוגדרת מעל \(\mathbb{R}^{n}\)" אני סתם אגיד "\(k\)-טנזור". אז \(k\)-תבנית היא פונקציה שמתאימה לכל נקודה במרחב \(k\)-טנזור. אבל לא סתם \(k\)-טנזור; יש לנו דרישה אחת נוספת, והיא שהטנזור יהיה מתחלף. פונקציה מולטילינארית ב-\(k\) משתנים \(f\) היא מתחלפת אם החלפה של שני קלטים הופכת את סימן הפונקציה. למשל \(f\left(v,u\right)=-f\left(u,v\right)\). למי שתוהה מאיפה הדרישה הזו הגיעה, נראה לי שהאינטואיציה הטובה ביותר היא האופן שבו באינטגרציה, אם אנחנו הופכים את הסדר של דברים, סימן האינטגרל מתהפך.

לטנזורים מתחלפים יש תכונות נחמדות בפני עצמם, ואפשר להראות שאפשר לכתוב כל \(k\)-טנזור מתחלף בתור צירוף לינארי של איברי בסיס, כשכל איבר בסיס בעצמו מורכב ממכפלת טריז (ה-\(\wedge\) שראינו קודם) של 1-טנזורים מסויימים. אני לא נכנס לפרטים כי בשביל זה יהיו פוסטים ייעודיים (אם יהיו). הפואנטה העיקרית היא שכשיש לנו צירוף לינארי של איברים שהם מכפלות טריז, אפשר להניח שהאיברים במכפלת הטריז כבר ממויינים לפי הסדר שלהם, כי אם לא, אפשר פשוט לשנות סדרים ו"לתקן". למשל, \(dx_{1}\wedge dx_{3}\wedge dx_{2}\) זה בסך הכל \(-dx_{1}\wedge dx_{2}\wedge dx_{3}\), אז הנה, תיקנתי את הסדר כך שיהיה ממויין, ורק שילמתי בהוספת סימן מינוס.

המסקנה המעניינת מכך היא ש-\(k\)-טנזור מתחלף מעל מרחב ממימד \(n\), הוא צירוף לינארי של \({n \choose k}\) איברי בסיס. כלומר, בהתחלה מספר איברי הבסיס האפשריים גדל, ואז פתאום הוא מתחיל לרדת. בפרט, אם \(k=n\) אנחנו מקבלים מרחב ממימד 1 של \(n\)-טנזורים, מה שאומר שכל \(n\)-תבנית דיפרנציאלית מעל מרחב מדרגה \(n\) היא מהצורה \(\omega=fdx_{1}\wedge\dots\wedge dx_{n}\); כאן ה-\(f\) היא פונקציה סקלרית (\(f:\mathbb{R}^{n}\to\mathbb{R}\)) שלכל נקודה במרחב נותנת את המקדם של \(dx_{1}\wedge\dots\wedge dx_{n}\) בטנזור שמותאם לאותה נקודה.

למה זה מעניין? כי זה נותן לנו דרך פשוטה להגדיר אינטגרל של תבנית מעל \(\mathbb{R}_{n}\): \(\int_{\mathbb{R}^{n}}\omega\triangleq\int_{\mathbb{R}^{n}}f\). את ההגדרה הזו אפשר לקחת ולהרחיב לאינטגרל של \(k\)-תבנית מעל יריעה ממימד \(k\). כמובן שלא אעשה זאת כרגע, אבל הרעיון הוא שניתן להשתמש באטלס של היריעה כדי "לתקן" את התבנית ולקבל תבנית לא מעל היריעה (שהיא מרחב שחי ב-\(\mathbb{R}^{n}\)) אלא מעל \(\mathbb{R}^{k}\), ושם אנחנו כבר יודעים איך לחשב את האינטגרל של התבנית.

המרכיב האחרון שחסר לנו בשלב הזה הוא ההגדרה של אופרטור הגזירה של תבניות – תיארתי אותו כבר קודם, אבל אין לי דרך טובה להסביר כאן "למה זה עובד", מלבד זאת שההגדרה נבחרה בקפידה כדי שהמשפט יעבוד. אם מסננים החוצה את כל מה שקשור ליריעות ומוכיחים את משפט סטוקס על קוביות ב-\(\mathbb{R}^{n}\), ההוכחה יוצאת חישוב לא נוראי במיוחד ותו לא; בחישוב הזה אפשר לראות היטב למה הגדרת הנגזרת עובדת.

דברי סיכום ופרידה

כתבתי כאן הרבה מלל שלחלוטין מצדיק את שם הבלוג – זה כתוב מאוד לא מדויק, ונותן לכל היותר את הרעיון הכללי. אבל הרעיון הכללי חשוב כאן. הסיבה לכך היא שהפרטים הטכניים עשויים להיות מאוד יבשים כשלא ברור לאן בדיוק הולכים. ייתכן מאוד שאכתוב כאן פוסטים שמיועדים להסביר בצורה יותר פורמלית מה הולך פה, אבל פוסטים כאלו ייראו באופן בלתי נמנע כמו שנראים ספרי לימוד בנושא: אני אתחיל בלדבר על מה זו מכפלה טנזורית, ומה זו מכפלה מתחלפת, ואיך נראה הבסיס הסטנדרטי שלהן, וכו' וכו' וכו'. וכל הזמן הזה ההמונים צובאים על החומות וצועקים שיתנו להם קצת סטוקס. ובכן, כשיותר ברור לאן בערך הולכים נראה לי שהסבלנות לפרטים הקטנים גדולה יותר.

7 תגובות על הפוסט “על יריעות ותבניות (מה משפט סטוקס אומר, בגדול)

  1. הפוסט מצויין! נקודה אחת שנראה לי שפספסת בה:" נקודה היא פנימית אם קיימת סביבה שלה שהומיאומורפית ל-RkRk, ואחרת (אם כל סביבה חייבת להיות הומיאומורפית ל-HkHk) היא נקראת נקודת שפה"
    הכוונה היא, אני מניח, "… שהומיאומורפית לתת קבוצה של \(\mathbb{R}^k\)" וכנ"ל עם Hk
    יהיה פוסט עם החלק הטכני של מה שאתה עושה פה?

    תודה על הפוסט!

  2. ממש נהדר, תודה על ההשקעה.

    שאלה קטנה, אתה רושם "ההעתקה שמותאמת לנקודה aa לא פועלת "סתם" על RnRn, אלא על המרחב המשיק של הנקודה aa, שהוא איזומורפי ל-RnRn בעצמו – אבל אני מחביא את זה בפוסט הזה.".
    האם זה קשור למה שקוראים בואפטימיזציה "מרחב דואלי"?

  3. סוף סוף הפוסט על יריעות ותבניות! (:
    תיקון קטן: כשכתוב "שהיא צירוף לינארי של היצורים dx,dx " נראה לי שצריך להיות כתוב "dx,dy".

  4. מצאת את דרך המלך לליבו של תלמיד הפיזיקה: התמונה הכוללת ממעוף הציפור. אהבתי את נפנופי הידיים שלך…

    שאלה שמקננת אצלי כבר שנים: האם יש גרסא כלשהי (מוגבלת מנוונת או מעוותת ככל שתהיה) למשפט סטוקס על יריעות לא אוריאנטביליות?

כתיבת תגובה

האימייל לא יוצג באתר.