מידת ז'ורדן ואינטגרלים מוכללים

הפוסט הזה יהיה קצת טכני ובהתחלה קיוויתי להימנע ממנו, אבל זה יכריח אותי לבצע קפיצות מהירות וגדולות מדי בפוסטים בהמשך, ואני חושב שהנושא הנוכחי מספיק מעניין בפני עצמו. מה שאנחנו רוצים לעשות הוא להבין קצת יותר טוב איך נראים אינטגרלים ב-\( \mathbb{R}^{n} \) שמוגדרים לא על קוביות אלא על קבוצות מסובכות יותר - ומתי זה בכלל אפשרי.

ההתחלה היא קבוצות חסומות. אם \( S\subseteq\mathbb{R}^{n} \) היא קבוצה חסומה ויש לנו פונקציה \( f:S\to\mathbb{R} \), אמרנו כבר שאפשר לנסות להגדיר את האינטגרל שלה בצורה כזו: מגדירים פונקציה חדשה, \( f_{S}:\mathbb{R}^{n}\to\mathbb{R} \) על ידי \( f_{S}=f\cdot\chi_{S} \) (או, בניסוח יותר מפורש, \( f_{S}\left(x\right)=\begin{cases}f\left(x\right) & x\in S\\0 & x\notin S\end{cases} \)). כעת אפשר להגדיר את \( \int_{S}f \) בתור \( \int_{Q}f_{S} \) כאשר \( Q \) היא קוביה כלשהי שמכילה את \( S \); נדרשת קצת עבודה כדי להראות שלכל בחירה של \( Q \) כזו שמכילה את \( S \) נקבל את אותו אינטגרל (או שלכל בחירה של \( Q \) כזו האינטגרל לא יהיה קיים בכלל).

עכשיו אפשר להוכיח כל מני תכונות סטנדרטיות שמוכרות למי שזוכר אינטגרלים במימד אחד. למשל ש-\( \int_{S}\left(af+bg\right)=a\int_{S}f+b\int_{S}g \) עבור פונקציות \( f,g \) שאינטגרביליות מעל \( S \) (זה מה שנקרא לינאריות האינטגרל), וש-\( \int_{S_{1}\cup S_{2}}f=\int_{S_{1}}f+\int_{S_{2}}f-\int_{S_{1}\cap S_{2}}f \) וכדומה. גם כאן ההוכחות סטנדרטיות ואפסח עליהן.

קצת יותר מעניין לשאול את עצמנו מה הקריטריון שמבטיח ש-\( f \) אינטגרבילית מעל \( S \). מעל קוביה \( Q \) היה לנו קריטריון יפה: \( f \) אינטגרבילית מעל \( Q \) אם ורק אם קבוצת נקודות אי הרציפות שלה היא ממידה 0. היה אפשר לקוות שזה יהיה נכון גם ל-\( S \) חסומה כלשהי, אלא שזה לא נכון; אפילו אם \( f \) רציפה על \( S \) (וזה יהיה המקרה היחיד שיעניין אותנו מכאן ואילך) זה עדיין לא נכון. בואו ננסה להוכיח את הטענה הלא נכונה “אם \( f \) רציפה על \( S \) אז \( f \) אינטגרבילית על \( S \)” ונראה איפה אנחנו נכשלים ומה צריך לתקן.

אם כן, אנחנו מסתכלים על \( f_{S} \) במקום על \( f \) ושואלים את עצמנו האם \( f_{S} \) אינטגרבילית על קוביה כלשהי \( Q \) שמכילה את \( S \). התשובה היא ש-\( f_{S} \) אינטגרבילית אם ורק אם היא רציפה כמעט בכל מקום. אבל הרי \( f \) רציפה על \( S \); זה לא מבטיח ש-\( f_{S} \) תהיה רציפה? ובכן, לא. \( f_{S} \) היא שילוב של שתי פונקציות שכל אחת מהן בנפרד היא רציפה - \( f \) על \( S \), והפונקציה הקבועה 0 על המשלימה של \( S \). בתוך הקבוצות הללו הפונקציות רציפות. אם יש בעיה, היא נוצרת על השפה של \( S \), מה שמסומן \( \mbox{Bd}S \) - באוסף כל הנקודות שבכל סביבה שלהן יש נקודה מתוך \( S \) ונקודה מחוץ ל-\( S \).

מה זה בעצם אומר ש-\( f_{S} \) רציפה בנקודה \( x\in\mbox{Bd}S \)? שכל סדרה \( x_{n} \) של נקודות ששואפת ל-\( x \) מקיימת \( \lim_{n\to\infty}f_{S}\left(x_{n}\right)=f_{S}\left(x\right) \). קל לראות שהגבול הזה חייב להיות 0 תמיד: אם \( x\notin S \) אז \( f_{S}\left(x\right)=0 \); מצד שני, אם \( x\in S \) אז אפשר לקחת בתור הסדרה \( x_{n} \) סדרה של נקודות שכולן מחוץ ל-\( S \) (בגלל ש-\( x\in\mbox{Bd}S \); אם \( x \) הייתה נקודה פנימית של \( S \) זה לא היה עובד) ולכן הגבול השמאלי יוצא 0. אם כן, יש סכנה שתהיה לנו אי רציפות אם יקרה אחד משניים: או ש-\( f_{S}\left(x\right)\ne0 \), או שקיימת סדרת נקודות \( x_{n} \) שמתכנסת אל \( x \) ועם זאת \( \lim_{n\to\infty}f_{S}\left(x_{n}\right)\ne0 \). רגע של מחשבה מראה שהתנאי הראשון נבלע בתוך השני; אם \( x\notin S \) אז בכלל בלתי אפשרי ש-\( f_{S}\left(x\right)\ne0 \), ואילו אם \( x\in S \) אז הרציפות של \( f \) גוררת ש-\( f_{S}\left(x\right)\ne0 \) אם ורק אם \( \lim_{n\to\infty}f_{S}\left(x_{n}\right)\ne0 \) עבור סדרת \( x_{n} \)-ים כלשהי (כלשהי, לאו דווקא של נקודות שכולן ב-\( S \), פשוט כי נקודות מחוץ ל-\( S \) חייבות להפסיק להופיע בסדרה מתישהו אחרת הגבול לא יוכל להיות שונה מאפס).

אז הנה ניסוח קומפקטי של המשפט: בהינתן \( f \) נתבונן על קבוצת כל הנקודות \( x\in\mbox{Bd}\left(S\right) \) שעבורן \( \lim_{n\to\infty}f_{S}\left(x_{n}\right)\ne0 \) עבור סדרה \( x_{n}\to x \) כלשהי. \( f \) אינטגרבילית מעל \( S \) אם ורק אם קבוצת הנקודות הזו היא ממידה אפס. מכיוון שעבור רוב הקבוצות החסומות ה”אינטואיטיביות” לנו, השפה שלהן היא ממידה 0, דוגמאות נגדיות ייראו פתולוגיות משהו. אבל ככה זה חדו”א.

אפשר לתת עוד נקודת מבט על קבוצות כאלות שהן חסומות והשפה שלהן ממידה אפס. אם ניקח אינטגרל של הפונקציה הקבועה \( f\left(x\right)=1 \) על קוביה כלשהי, מה שנקבל הוא את הנפח של הקוביה (כלומר, המכפלה של אורכי המקצועות שלה). זה מתקבל ישירות מהגדרת האינטגרל, שבה כבר משתמשים בהגדרה הזו של נפח. זה כמובן מזמין מדידת נפחים של קבוצות כלליות יותר על ידי חישוב האינטגרל של \( f\left(x\right)=1 \) עליהן. מכיוון שהפונקציה הזו רציפה, לקבוצה חסומה יש נפח על פי ההגדרה הזו אם ורק אם מתקיים עבורה התנאי שהשפה שלה היא ממידה 0. מבחינה היסטורית הדרך הזו למדוד נפח של קבוצות כלליות הומצאה על ידי קמיל ז’ורדן, ולכן ה”נפח” הזה נקרא מידת ז'ורדן וקבוצה חסומה עם שפה ממידה אפס נקראת מדידה ז'ורדן. הניסוח המקורי אצל ז’ורדן הוא קצת שונה (הוא מקרב מבחוץ ומבפנים את הקבוצה על ידי ריבועים ובודק האם שני הקירובים “מתחברים”, בדומה לאופן שבו מוגדרים אינטגרלים עם סכומי דארבו) אבל מה שהצגנו כאן הוא שקול ויותר נוח לנו. ייתכן שקצת הציק לכם שאני מגדיר את מידת ז’ורדן על ידי שימוש בביטוי “מידה אפס”. אבל זכרו ש”מידה אפס” הוא משהו שקל להגדיר בלי הגדרה כללית של מידה (כל מה שנדרש הוא להראות שאפשר לכסות את הקבוצה על ידי קוביות שסכום נפחיהן קטן כרצוננו).

יש למידת ז’ורדן הכללה חזקה ויפה מאוד - מידת לבג - אבל אנחנו לא הולכים לדבר עליה כאן. לצרכים שלנו מידת ז’ורדן תספיק.

ומה הם הצרכים הללו? ובכן, אני רוצה לדבר עכשיו על אינטגרלים מוכללים. אלו אינטגרלים ששוברים את דרישת ה”חסום” שאפיינה אינטגרלים עד כה - אצלנו הפונקציה שמבצעים לה אינטגרציה הייתה חסומה, והתחום שעליו מבצעים את האינטגרציה היה חסום. אינטגרל מוכלל משמיט את אחת מהדרישות הללו ורואה אם אנחנו עדיין יכולים להסתדר איכשהו. שם נפוץ לאינטגרלים כאלו הוא “אינטגרלים לא אמיתיים” (improper integrals) אבל אני לא אוהב את השם הזה בגלל שהוא יוצר אשליה כאילו יש בעיה כלשהי עם האינטגרלים הללו (זה ה”מספרים דמיוניים” החדש). מכיוון שהקשר הדיון שלנו הוא אנליזה וקטורית, אני אסתפק במקרה פרטי שהוא כל מה שאצטרך בשביל אנליזה וקטורית - אינטגרלים של פונקציות רציפות על קבוצה לאו דווקא חסומה.

הכי טוב להתחיל עם דוגמה חד ממדית. בואו ניקח את הפונקציה \( f\left(x\right)=\frac{1}{x^{2}} \). את האינטגרל הלא מסויים שלה קל למצוא - הוא \( F\left(x\right)=-\frac{1}{x} \). מכיוון ש-\( f \) “מתפוצצת” ב-0 בואו נחשב את האינטגרל שלה החל מ-1 ועד לאיזו נקודה שרירותית \( t>1 \): \( \int_{1}^{t}f\left(x\right)dx=F\left(t\right)-F\left(1\right)=1-\frac{1}{a} \). קיבלנו תוצאה שאפשר לחשוב עליה בתור פונקציה של \( a \): \( G\left(t\right)=1-\frac{1}{t} \). עכשיו, ככל ש-\( t \) גדול יותר כך \( G\left(t\right) \) גדולה יותר, וזה לא מפתיע כי \( f\left(x\right) \) המקורית הייתה פונקציה חיובית; אבל מה שמעניין הוא ש-\( G \) היא חסומה - כלומר, לא משנה כמה אנחנו מגדילים את התחום שעליו מבצעים אינטגרציה ל-\( f \), אנחנו לא עוברים את החסם של 1. מצד שני, אנחנו מתקרבים אליו כרצוננו, כלומר \( \lim_{t\to\infty}G\left(t\right)=1 \), וזה מוביל אותנו לסמן את התופעה הזו בתור \( \int_{1}^{\infty}f\left(x\right)dx=1 \).

זה הכל; זה מה שעושים בכל פעם: \( \int_{a}^{\infty}f\left(x\right)dx\triangleq\lim_{t\to\infty}\int_{a}^{\infty}f\left(x\right)dx \) וזאת עבור נקודה \( a \) שרירותית ופונקציה \( f \) שרירותית, תחת המגבלה ש-\( f \) אינטגרבילית לכל קטע \( \left[a,t\right] \) עבור \( t>a \). באופן דומה אפשר להגדיר גם אינטגרל מוכלל שבו דווקא הגבול התחתון הוא מינוס אינסוף: \( \int_{-\infty}^{a}f\left(x\right)dx\triangleq\lim_{t\to\infty}\int_{-t}^{a}f\left(x\right)dx \) אבל מה קורה כששני הגבולות הם אינסופיים?

אינטואיציה אחת היא להגדיר \( \int_{-\infty}^{\infty}f\left(x\right)dx=\lim_{t\to\infty}\int_{-t}^{t}f\left(x\right)dx \). אלא שזו טעות שככל הנראה כל אחד מכם שכבר למד חדו”א מכיר: כשיש לנו שני גבולות, לשאוף לשניהם “באותו הקצב” יכול ליצור אשליות אופטיות. קחו למשל את הפונקציה \( f\left(x\right)=x \). זו פונקציה אי זוגית, כלומר \( f\left(-x\right)=-f\left(x\right) \). ככזו, האינטגרל שלה על כל קטע סימטרי סביב 0 הוא 0, כלומר \( \int_{-t}^{t}xdx=0 \) לכל \( t \). לכן אם ננקוט בהגדרה שהצעתי, נקבל ש-\( \int_{-\infty}^{\infty}xdx=0 \). מצד שני, אם נבחר בתור נקודת האמצע שלנו לא את \( x=0 \) אלא את \( x=1 \), מה נקבל? \( \int_{-\infty}^{\infty}xdx=\lim_{t\to\infty}\int_{1-t}^{1+t}xdx=\frac{\left(1+t\right)^{2}-\left(1-t\right)^{2}}{2}=2t \), וזה בבירור לא מתכנס. אנחנו מן הסתם לא רוצים הגדרה שבה התוצאה כל כך רגישה לשינוי בבחירה שרירותית לגמרי של “נקודת האמצע”. לכן ההגדרה הנפוצה יותר היא באמצעות גבול כפול או פירוק לשני אינטגרלים מוכללים נפרדים (במקרה של \( f\left(x\right)=x \) היינו מקבלים אינטגרלים שסכום אחד מהם הוא \( \infty \) וסכום השני \( -\infty \) ולכן ה”סכום” של שניהם הוא הביטוי חסר המשמעות \( \infty-\infty \)). הגישות הללו עובדות טוב במימד יחיד אבל בהכללה למספר ממדים, כשיש קבוצות בעלות מבנה מסובך יותר והרבה כיוונים לברוח אליהם, חבל בכלל להיכנס להגדרות הללו.

הנה גישה אחרת לטיפול בבעיה הזו: הסתבכנו מלכתחילה רק בגלל שניסינו לבצע אינטגרל מוכלל על פונקציה שבה הערכים החיוביים והשליליים הצליחו לבטל זה את זה (כשהסתכלו עליהם מזווית מסויימת ביום מסויים כשהשמש מטילה כך וכך צל). אפשר פשוט לפרק את הפונקציה \( f \) לשתי פונקציות, אחת עבור הערכים החיוביים ואחת עבור הערכים השליליים. פורמלית, להגדיר \( f_{+}\left(x\right)=\mbox{max}\left\{ f\left(x\right),0\right\} \) ו-\( f_{-}\left(x\right)=\max\left\{ -f\left(x\right),0\right\} \), ועכשיו מתקיים \( f\left(x\right)=f_{+}\left(x\right)-f_{-}\left(x\right) \), ולכן טבעי יהיה להגדיר \( \int_{A}f\left(x\right)=\int_{A}f_{+}\left(x\right)-\int_{A}f_{-}\left(x\right) \) עבור קבוצה פתוחה \( A \) כלשהי. במילים אחרות, ביצענו כאן רדוקציה מהגדרת אינטגרל מוכלל עבור \( f \) רציפה כללית אל הגדרת אינטגרל מוכלל עבור \( f \) רציפה אי שלילית. מי שמכיר חדו”א יודע שאנחנו אוהבים טורים אי שליליים כי אנומליות מעצבנות של ביטולים הדדיים לא יכולות להתקיים בהם (למשל, כשלומדים על טורים, נהוג להתחיל מטורים אי שליליים ורק אחר כך להרחיב את התורה לטיפול בטורים כלליים).

מה שנחמד, למשל, בפונקציות אי שליליות הוא שהערך של האינטגרל על קבוצה קטנה יותר הוא תמיד קטן או שווה לערך של האינטגרל על קבוצה גדולה יותר שמכילה אותה. זה אומר שאפשר להפסיק לדבר על גבולות ולעבור לדבר על סופרמום - אפשר יהיה להגדיר את \( \int_{A}f\left(x\right) \) בתור הסופרמום של קבוצת האינטגרלים הרגילים מהצורה \( \int_{S}f\left(x\right) \) כאשר \( S \) רץ על… על מה נריץ את \( S \) באמת?

האינטואיציה הראשונית שלי היא לקחת קוביות הולכות וגדלות סביב הראשית ולחשב את האינטגרל הרגיל של \( f \) על החיתוך שלהן עם \( A \). כלומר, להגדיר את \( f \) להיות אפס מחוץ לחיתוך הזה ולקחת אינטגרל על כל \( Q \), כפי שתיארתי בתחילת הפוסט. לרוע המזל, כבר ראינו שבכלל לא מובטח שנקבל כך פונקציה אינטגרבילית. כי צריך שהשפה של החיתוך תהיה ממידה אפס. אז בואו נדרוש את זה במפורש: נריץ את \( S \) על כל תת-הקבוצות של \( A \) שהן חסומות ובעלות שפה ממידה אפס, כלומר כל תת-הקבוצות של \( A \) שהן מדידות ז’ורדן. מכיוון שהשפה זניחה, אפשר לפשט את ההגדרה עוד קצת, להוסיף את השפה לכל קבוצה כזו ולקבל קבוצה סגורה וחסומה שהיא מדידה ז’ורדן. לקבוצה סגורה וחסומה ב-\( \mathbb{R}^{n} \) קוראים קומפקטית (במרחבים מטריים כלליים יותר קומפקטיות היא תכונה שונה מסתם סגירות וחסימות אבל זה לא רלוונטי כאן), כך שהנה הגדרה: \( \int_{A}f\left(x\right) \) עבור \( A \) פתוחה ו-\( f \) אי שלילית הוא הסופרמום של \( \int_{D}f \) על כל הקבוצות \( D\subseteq A \) שהן קומפקטיות ומדידות ז’ורדן. בהנחה שהסופרמום הזה קיים.

עכשיו אני מקווה שנוכל סוף סוף להגיע אל היעד שלנו מזה זמן רב - משפט החלפת המשתנים עבור \( \mathbb{R}^{n} \).


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com