משפט הפירוק הציקלי

חלק ראשון, שבו הרבה הגדרות והסערה היא רק הבטחה באופק

בפוסט הקודם הצגתי את התכל'ס של צורת ז'ורדן, והבטחתי שאראה בהמשך גם את התיאוריה שמאחוריה. בפרט, למרות שהראיתי את השיטה למציאת צורת ז'ורדן, לא באמת הוכחתי שהיא קיימת או יחידה. בפוסט הזה נלך צעד אחד אחורה ונוכיח משפט שממנו אפשר לקבל יחסית בקלות הן את צורת ז'ורדן והן עוד צורה קנונית – הצורה הרציונלית שטרם הזכרתי. המשפט הזה נקרא משפט הפירוק הציקלי והוא החלק ה"עמוק" פה – איפה שמצויה העבודה האמיתית (ותהיה כאן לא מעט עבודה – זה הולך להיות פוסט טכני למדי). רק אעיר שההקשר של הדיון שלנו כרגע הוא מרחבים וקטוריים; יש למשפט הזה הכללה עבור מודולים, שהם בעצמם הכללה של מרחבים וקטוריים; אבל אני לא רוצה לדבר כרגע על מודולים ולכן נישאר "על הקרקע" ובעתיד אולי נחזור אל ההכללה הזו.

אפשר להגיד כמעט מייד מה המשפט אומר, אבל לשם כך אנחנו זקוקים להגדרה אחת בכל זאת – של וקטור ציקלי. העולם שלנו יהיה, כרגיל, מרחב וקטורי $latex V$, ותמיד יש ברקע טרנספורמציה לינארית $latex T:V\to V$, והמטרה שלנו בחיים היא למצוא פירוק של $latex V$ לתת-מרחבים שהם "יפים" ביחס ל-$latex T$ במובנים מסויימים.

אם כן, מהו וקטור ציקלי? קרוב לודאי ששמעתם את השם הזה בתורת החבורות, שם חבורה ציקלית היא חבורה שנוצרת על ידי איבר בודד. אבל מה המשמעות של "יוצרת" בהקשר שלנו? יש לנו כבר מושג של $latex \mbox{span}$ של תת-מרחב על ידי וקטורים ולא על זה אנחנו מדברים פה, אלא על משהו כללי יותר: בהינתן וקטור $latex v$ והטרנספורמציה $latex T$, קחו את כל הוקטורים $latex v,T\left(v\right),T^{2}\left(v\right),\dots$ ותסתכלו על תת-המרחב הוקטורי שנוצר על ידי כולם. לזה נקרא תת-המרחב הציקלי שנוצר על ידי $latex v$, ונסמן $latex Z\left(v;T\right)\triangleq\mbox{span}\left\{ T^{n}\left(v\right)\ |\ n\in\mathbb{N}\right\} $. כעת, מה שמשפט הפירוק הציקלי אומר הוא שאפשר לכתוב את $latex V$ בתור סכום ישר של תת-מרחבים ציקליים, כלומר שקיימים $latex v_{1},\dots,v_{k}$ כך ש-$latex V=Z\left(v_{1};T\right)\oplus\dots\oplus Z\left(v_{k};T\right)$. אבל אפשר לעשות יותר מכך; אפשר יהיה להוכיח שהפירוק הזה לתת-מרחבים ציקליים, הוא גם יחיד לכל $latex T$, בהינתן תנאים מסויימים שנדרוש בהמשך במפורש. צורת ז'ורדן הולכת להתקבל משילוב של המשפט הזה עם משפט הפירוק הפרימרי שראינו בעבר.

בואו נתחיל מלהבין קצת יותר טוב מה זה ה-$latex Z\left(v;T\right)$ המוזר הזה. בואו ניקח איבר כלשהו, $latex u\in Z\left(v;T\right)$. מכיוון שהוא צירוף לינארי של חזקות של $latex T\left(v\right)$ אז הוא מהצורה $latex u=\sum_{k=0}^{n}a_{k}T^{k}\left(v\right)$ עבור מקדמים $latex a_{0},\dots,a_{n}$ כלשהם מהשדה $latex \mathbb{F}$ שמעליו אנחנו עובדים. אפשר לכתוב את זה טיפה שונה: $latex u=\left(\sum_{k=0}^{n}a_{k}T^{k}\right)v$. המשמעות היא שאנחנו לוקחים את הפולינום $latex f\left(x\right)=\sum_{k=0}^{n}a_{k}x^{k}$, מציבים בו את $latex T$ ומקבלים טרנספורמציה לינארית שאותה אנחנו מפעילים על $latex v$. זה מאפשר לנו לתת תיאור שונה של $latex Z\left(v;T\right)$:

$latex Z\left(v;T\right)=\left\{ f\left(T\right)v\ |\ f\left(x\right)\in\mathbb{F}\left[x\right]\right\} $

במובן מסויים אפשר לחשוב על כך כאילו הרחבנו את פעולת ה"כפל בסקלר" של המרחב הוקטורי מכפל באיבר של $latex \mathbb{F}$ לכפל באיבר של $latex \mathbb{F}\left[x\right]$: התכונות הבסיסיות כמו $latex \left(f+g\right)v=fv+gv$ וכדומה בבירור נשמרות. פעולת הכפל המורחבת הזו הופכת את $latex V$ למה שנקרא $latex \mathbb{F}\left[x\right]$-מודול, אבל אמרתי שלא אכנס למודולים בפוסט הזה אז לא אגיד יותר על נקודת המבט הזו (למרות שהיא מפשטת לא מעט מהתיאור של מה שיקרה בהמשך, אבל המחיר הוא שכבר צריך להכיר מודולים). מה שכן, אני אאמץ את הסימון. במקום לכתוב $latex f\left(T\right)v$ אני פשוט אכתוב $latex fv$. זה ישתלם לנו בהמשך.

מכיוון שכל מה שאנחנו עושים הוא מעל מרחב סוף-ממדי, אפשר מן הסתם לתאר את $latex Z\left(v;T\right)$ באמצעות קבוצה פורשת סופית. ל-$latex T$ הרי יש פולינום מינימלי, $latex m_{T}\left(x\right)=x^{n}+a_{n-1}x^{n-1}+\dots+a_{1}x+a_{0}$. אם נציב את $latex T$ בפולינום ונעביר אגף, נקבל

$latex T^{n}=-a_{n-1}T^{n-1}-\dots-a_{1}T-a_{0}$

כלומר, אפשר לכתוב את $latex T^{n}$ בתור צירוף לינארי של $latex T^{0},T^{1},\dots,T^{n-1}$, ולכן גם את החזקות הגבוהות יותר של $latex T$. מכאן ש-$latex Z\left(v;T\right)=\mbox{span}\left\{ T^{0}\left(v\right),\dots,T^{n-1}\left(v\right)\right\} =\left\{ fv\ |\ f\left(x\right)\in\mathbb{F}_{n}\left[x\right]\right\} $ כאשר $latex \mathbb{F}_{n}\left[x\right]$ הוא אוסף הפולינומים ממעלה קטנה מ-$latex n$ (אפשר ויותר נכון להשתמש פה בחוג מנה אבל נעזוב את זה).

אבל למה לעצור פה? המרחב $latex Z\left(v;T\right)$ נקבע על פי הפעולה של $latex T$ על וקטור בודד, $latex v$. ייתכן שיש פולינום ב-$latex T$ שמאפס את $latex v$ והוא קטן יותר מהפולינום המינימלי (כי הפולינום המינימלי צריך לאפס את כל המרחב ולא רק וקטור בודד). כמו שקורה עם הפולינום המינימלי של $latex T$, אפשר להוכיח שיש פולינום מתוקן יחיד ממעלה קטנה ביותר כך שכשמציבים בו את $latex T$, מקבלים טרנספורמציה שמאפסת את $latex v$, והפולינום הזה מחלק כל פולינום אחר שכשמציבים בו את $latex T$ זה מאפס את $latex v$. הפולינום הזה נקרא ה-$latex T$-מאפס של $latex v$, ונסמן אותו $latex p_{v}\left(x\right)$. מן הסתם הוא מחלק את הפולינום המינימלי של $latex T$. נסמן את הדרגה שלו ב-$latex d$.

כעת אפשר להגיד על $latex Z\left(v;T\right)$ יותר מאשר אמרנו קודם. קודם רק אמרנו שהמרחב הזה נפרש על ידי קבוצה של איברים מהצורה $latex T^{k}\left(v\right)$. עכשיו אנחנו יכולים להגיד שהקבוצה $latex \left\{ T^{0}\left(v\right),T^{1}\left(v\right),\dots,T^{d-1}\left(v\right)\right\} $ היא בסיס ל-$latex Z\left(v;T\right)$, כלומר ש-$latex d$ הוא המימד של המרחב הזה. האינטואיציה פשוטה: אם זו קבוצה תלויה לינארית אנחנו מקבלים $latex \sum a_{i}T^{i}\left(v\right)=0$, כלומר פולינום שמאפס את $latex v$ והוא ממעלה נמוכה מ-$latex p_{v}\left(x\right)$, וזה כמובן בלתי אפשרי (זה מסביר למה זו קבוצה בלתי תלויה; זה שהיא פורשת נובע, כמו קודם, מכך שכל חזקה של $latex T$. שהיא לפחות $latex d$ ומופעלת על $latex v$ ניתנת לכתיבה כצירוף לינארי של חזקות קטנות יותר שמופעלות על $latex v$).

כעת, המרחב $latex Z\left(v;T\right)$ הוא מן הסתם $latex T$-אינוריאנטי. מה נקבל את נצמצם את $latex T$ אליו? נקרא לטרנספורמציה הזו $latex U$. מה אפשר לומר עליה? ראשית, המאפס $latex p_{v}\left(x\right)$ של $latex v$ הוא מן הסתם הפולינום המינימלי שלה. שנית, מכיוון שהדרגה של $latex p_{v}\left(x\right)$ היא המימד של $latex Z\left(v;T\right)$, אז זה גם הפולינום האופייני של $latex U$ (כי המינימלי מחלק את האופייני – זה קיילי המילטון – והאופייני הוא פולינום מתוקן ממעלה ששווה למימד המרחב). זו תוצאה שמדגדג לחשוב עליה בתור "אם ורק אם" – דהיינו, אם בהינתן טרנספורמציה $latex T$ ומרחב $latex V$ הפולינום האופייני של $latex T$ שווה לפולינום המינימלי שלה, אז $latex V$ הוא מרחב $latex T$-ציקלי. אבל בואו נחכה עם זה להמשך.

שאלה אחרת היא מה המטריצה המייצגת של $latex U$ בבסיס של המרחב. לצורך כך בואו ניזכר בסימונים שלנו: אני אסמן $latex p_{v}\left(x\right)=x^{d}+a_{d-1}x^{d-1}+\dots+a_{1}x+a_{0}$, ואני אסדר את הבסיס שלנו "מהסוף להתחלה", כלומר $latex \left(T^{d-1}\left(v\right),T^{d-2}\left(v\right),\dots,T\left(v\right),v\right)$. בצורה הזו, כשמפעילים את $latex U$ על כל איבר בסיס למעט הראשון מקבלים את איבר הבסיס שלפניו. וכשמפעילים על הראשון? מקבלים את $latex -a_{0}T^{0}\left(v\right)-a_{1}T\left(v\right)-\dots-a_{d-1}T^{d-1}\left(v\right)$. המטריצה המייצגת של $latex U$ היא וקטורי הקואורדינטות של הפעלות שכאלו, ולכן היא תהיה מהצורה

$latex \left(\begin{array}{ccccc}-a_{0} & 1 & 0 & \cdots & 0\\-a_{1} & 0 & 1 & \cdots & 0\\\vdots & \vdots & \vdots & \ddots & \vdots\\-a_{d-2} & 0 & 0 & \cdots & 1\\-a_{d-1} & 0 & 0 & \cdots & 0\end{array}\right)$

אני כותב את המטריצה הזו בצורה קצת לא סטנדרטית. באופן סטנדרטי, בהינתן פולינום מתוקן $latex x^{d}+a_{d-1}x^{d-1}+\dots+a_{1}x+a_{0}$ נהוג להגדיר את המטריצה המלווה של הפולינום להיות המטריצה המאוד דומה הבאה:

$latex \left(\begin{array}{ccccc}0 & 0 & 0 & \cdots & -a_{0}\\1 & 0 & 0 & \cdots\\0 & 1 & 0 & \cdots & -a_{1}\\\vdots & \vdots & \vdots & \ddots & \vdots\\0 & 0 & 0 & \cdots & -a_{d-1}\end{array}\right)$

שהיא מה שמקבלים כשהבסיס הסדור שלי מסודר בסדר הפוך. הסיבה שבחרתי בכל זאת להציג את המטריצה ה"הפוכה" היא שמהמטריצה ההפוכה הזו מתקבלת צורת ז'ורדן: הרעיון הכללי הוא שלכל בלוק ז'ורדן אפשר לפרק את הטרנספורמציה שמחפשים את צורת ז'ורדן שלה לסכום של טרנספורמציה סקלרית וטרנספורמציה נילפוטנטית, כלומר כזו שמקיימת $latex T^{k}=0$ עבור $latex k$ מסויים; למטריצה כזו, כל המקדמים $latex a_{0},\dots,a_{k-1}$ יהיו 0, ולכן נקבל מטריצה של 1-ים שאם נחבר לה את המטריצה האלכסונית של הטרנספורמציה הסקלרית נותנת לנו בדיוק בלוק ז'ורדן.

חלק שני, שבו אנחנו מבינים את הרעיון הכללי והסערה מתקרבת

אני מקווה שעכשיו הקשר בין מה שאנחנו עושים ובין היעד של צורת ז'ורדן ברור, ואפשר לגשת לעבודה המרכזית שלנו – משפט הפירוק הציקלי. המטרה הכללית שלנו ברורה: למצוא פירוק $latex V=Z\left(v_{1};T\right)\oplus\dots\oplus Z\left(v_{k};T\right)$. אפשר להתחיל בצורה הכי נאיבית שאפשר: לקחת וקטור $latex v_{1}$ שונה מאפס כלשהו ולהסתכל על $latex Z\left(v_{1};T\right)$. אם $latex V=Z\left(v_{1};T\right)$, סיימנו; אחרת, יש $latex v_{2}\notin Z\left(v_{1};T\right)$ ואז נבנה את $latex Z\left(v_{2};T\right)$ וכן הלאה. באופן כללי, נגדיר $latex W_{0}=\left\{ 0\right\} $ ובשלב ה-$latex i$-י נמצא וקטור $latex v_{i}\notin W_{i-1}$ ונגדיר $latex W_{i}=W_{i-1}+Z\left(v_{i};T\right)$. בצורה הזו אנחנו מקבלים סדרה עולה של מרחבים, $latex W_{0}\subset W_{1}\subset\dots$ ומכיוון שבכל שלב המימד של המרחב שלנו עולה לפחות ב-1, בסופו של דבר נגיע אל $latex V$. כלומר, נקבל $latex V=W_{k}=Z\left(v_{1};T\right)+\dots+Z\left(v_{k};T\right)$. זו התחלה טובה, אבל יש בה שתי בעיות מהותיות. ראשית, זה איננו סכום ישר. זה אומר שהמרחבים $latex Z\left(v_{i};T\right)$ הללו נחתכים בצורה לא טריוויאלית ויש ביניהם קשרים, וזה לא טוב; בשביל משהו כמו צורך ז'ורדן צריך להשיג הפרדה למרחבים זרים, אחרת לא ניתן לצמצם את $latex T$ לכל אחד מתתי-המרחבים בנפרד ולטפל בהם בנפרד.

הבעיה השניה היא שהפירוק הזה אינו יחיד. יש הרבה דרכים שונות לקבל פירוק לסכום כזה של מרחבים שונים. היינו רוצים למצוא תנאי כלשהו שמבטיח שהמרחבים שמופיעים בפירוק נקבעים באופן יחיד. אחרת, לא תהיה לנו צורה קנונית; ל-$latex T$ יהיו המון פירוקים שונים ומשונים אפשריים.

משפט הפירוק הציקלי בא לטפל בשתי הבעיות הללו, ועושה את זה בצורה לא פשוטה במיוחד אבל גם לא ממש נוראית. הרעיון הוא אכן לבנות את ה-$latex W_{i}$-ים כפי שתיארתי, אבל עם בחירה "חכמה" של היוצרים ולא סתם לקחת וקטורים באופן אקראי; ואחר כך לבצע "תיקון" חכם של היוצרים הללו כדי לקבל מרחבים זרים. בואו נתחיל עם שלב הבחירה. מכיוון ש-$latex v_{i}$ הוא הסימון שאני מייעד ליוצרים ה"נכונים" שאמצא בסופו של דבר, אני אשתמש בסימון $latex w_{i}$ כדי לתאר את הוקטורים שאני בוחר בשלב הזה.

הרעיון הוא לבחור את ה-$latex w_{i}$ באופן שממקסם את הביס שאנחנו נותנים בחלק של $latex V$ שעדיין לא תפסנו. כלומר, אם כרגע בנינו כבר את $latex W_{i-1}$ ואנחנו מחפשים $latex w_{i}$ כדי לבנות את $latex W_{i}=W_{i-1}+Z\left(w_{i};T\right)$, בואו ניקח $latex w_{i}$ שממקסם את $latex \dim W_{i}$. עכשיו, כל מי שיש לו טיפת נסיון במתמטיקה יודע שהתגובה הראשונה לאמירה כמו "ניקח מישהו שממקסם" צריכה להיות "רגע, רגע, רגע, למה בכלל יש מישהו כזה?" אבל אנחנו באלגברה לינארית סוף-ממדית פה והכל נחמד. מכיוון ש-$latex \dim W_{i}$ חסום על ידי $latex \dim V$ ומימד הוא מספר טבעי, קבוצת כל הממדים האפשריים של $latex W_{i}$ היא קבוצה סופית של טבעיים ולכן ברור שיש לה איבר מקסימלי.

תכונת המקסימליות הזו תבטיח בהמשך את יחידות הפירוק שאנחנו מוצאים. אבל איך הופכים את הסכום $latex V=Z\left(w_{1};T\right)+\dots+Z\left(w_{k};T\right)$ לסכום ישר? בשביל זה נצטרך "לתקן" את ה-$latex w_{i}$-ים – להעיף מהם את החלקים ה"מתנגשים". זה דומה מאוד באופי שלו לאלגוריתם גרם-שמידט: שם אנחנו מתחילים מבסיס "רגיל" $latex \left\{ w_{1},\dots,w_{n}\right\} $, להבדיל מבסיס אורתונורמלי, ובכל שלב אם כבר בנינו את $latex v_{1},\dots,v_{k}$ שהם אברי הבסיס האורתונורמלי שנגיע אליו בסופו של דבר, אנחנו מחשבים את $latex w_{k+1}-\sum_{i=1}^{k}\left\langle w_{k+1},v_{i}\right\rangle v_{i}$ ומנרמלים את הוקטור הזה כדי לקבל את ה-$latex v_{k+1}$ הבא בתור. כלומר, חיסרנו מ-$latex w_{k+1}$ את כל האיברים הקודמים, כשהם מוכפלים במקדם "תיקון" מתאים. אצלנו הסיטואציה תהיה מאוד דומה: נגדיר $latex v_{k+1}=w_{k+1}-\sum_{i=1}^{k}f_{i}w_{i}$ כאשר ה-$latex f_{i}$-ים הם פולינומים שייבחרו בצורה חכמה כלשהי (שימו לב שבסכום באגף ימין יש לנו את ה-$latex w_{i}$-ים ה"ישנים" ולא את ה-$latex v_{i}$-ים ה"חדשים"; כדי לשמור על התאמה מושלמת לגרם-שמידט הייתי יכול לעשות את זה גם עם ה-$latex v_{i}$-ים אבל הכתיבה והנימוקים היו יוצאים לי טיפה יותר מסורבלים אז ויתרתי).

בשביל שנבין איך מוצאים את הפולינומים הללו אנחנו צריכים להכניס לתמונה מושג חדש, שהוא סוג של הכללה של המאפס שראינו קודם. בואו ניזכר: המאפס של $latex v$ (ביחס ל-$latex T$) היה הפולינום המתוקן $latex p$ מהמעלה המינימלית האפשרית כך ש-$latex p\left(T\right)v=0$ (לדוברים אלגברית שוטפת: הוא היה יוצר של אידאל הפולינומים שמאפסים את $latex v$ בחוג $latex \mathbb{F}\left[x\right]$ שהוא חוג פולינומים מעל שדה ולכן תחום ראשי). מה שאני רוצה להגדיר עכשיו נקרא באנגלית conductor ובעברית אין לי מושג איך לקרוא לו – קצת מתחשק לי לקרוא לו "המבאס", כי עבורנו הוא מודד עד כמה $latex w_{i}$ "מתנגש" עם קודמיו. כזכור, אנחנו מגדירים $latex W_{i}=W_{i-1}+Z\left(w_{i};T\right)$ ואנחנו יודעים ש-$latex w_{i}\notin W_{i-1}$. זה אומר שיש פולינום מדרגה גדולה מ-1 שאסמן $latex s\left(w_{i};W_{i-1}\right)$ כך שמתקיים $latex sw_{i}\in W_{i-1}$. למה תמיד קיים $latex s$ כזה? כי המאפס של $latex w_{i}$ הוא בפרט בעל התכונה הזו (שהרי $latex 0\in W_{i-1}$), אבל אולי יש פולינום קטן יותר מהמאפס שכבר הוא מכניס אותנו לתוך $latex W_{i-1}$. אז אנחנו לוקחים את הפולינום המתוקן הקטן ביותר שמקיים זאת – זה ה-conductor המדובר. למי שדוברים אלגברית שוטפת, ה-conductor $latex s\left(v,W\right)$ של $latex v$ לתוך מרחב $latex T$ אינוריאנטי $latex W$ הוא הפולינום המוני היחיד אשר יוצר את האידאל $latex \left\{ f\in\mathbb{F}\left[x\right]\ |\ f\left(T\right)v\in W\right\} $ (זה אידאל בגלל ש-$latex W$ הוא $latex T$-אינוריאנטי).

קודם אמרתי שאם יש לנו את $latex W_{i-1}$ אז אנחנו בוחרים את $latex w_{i}$ כך ש-$latex \dim W_{i}$ ממוקסם על ידו. עכשיו יש דרך קצת יותר קונקרטית לומר את זה: לא קשה לראות שככל שהדרגה של $latex s\left(w_{i},W_{i-1}\right)$ גדולה יותר, כך גם $latex \dim W_{i}$ יהיה גדול יותר (כי, אינטואיטיבית, $latex w_{i}$ יכול לייצר יותר איברים חדשים לפני שהחזקות שלו "נזרקות" לתוך $latex W_{i-1}$). לכן הבחירה של $latex w_{i-1}$ היא כזו שממקסמת את הדרגה של $latex s\left(w_{i},W_{i-1}\right)$; נשתמש בזה עוד מעט.

יש עוד טענה אחת שנזדקק לה בהמשך וכדאי לציין כבר עכשיו: נניח ש-$latex v,u$ הם שני וקטורים שהם "שקולים מודולו $latex W$", כלומר $latex v-u\in W$. ינבע מכך ש-$latex s\left(v,W\right)=s\left(u,W\right)$. למה? ובכן, נסמן $latex p=s\left(v,W\right)$ ו-$latex q=s\left(u,W\right)$. כמו כן נסמן $latex w=v-u$; כאמור, $latex w\in W$. כעת, $latex pv\in W$, ומצד שני $latex pv=p\left(w+u\right)=pw+pu$ (זה נובע מכך שה"כפל" ב-$latex p$ הוא בעצם הפעלה של טרנספורמציה לינארית שמתקבלת בעזרת $latex p$ על הוקטור $latex w+u$, וכאן אנחנו משתמשים בתכונת הלינאריות של הטרנספורמציה הזו). מכיוון ש-$latex W$ הוא $latex T$-אינוריאנטי הרי ש-$latex pw\in W$ (מדגדג לי לכתוב כאן "$latex W$ הוא תת-מודול" אבל הבטחתי לא להשתמש בטרמינולוגיה הזו) ולכן $latex pu=pv-pw\in W$. נובע מכך ש-$latex q$ מחלק את $latex p$, ובדיוק באותו האופן $latex p$ מחלק את $latex q$ ולכן הם שווים.

חלק שלישי, שבו הסערה פורצת

כעת, זכרו ש-$latex W_{i-1}=Z\left(w_{1};T\right)+\dots+Z\left(w_{i-1};T\right)$. על כן, אם $latex sw_{i}\in W_{i-1}$ זה אומר שאפשר לכתוב אותו כסכום של אברי ה-$latex Z$-ים שמרכיבים את $latex W_{i-1}$. כל איבר כזה הוא כפל בפולינום של היוצר המתאים. כלומר, קיימים פולינומים $latex g_{1},\dots,g_{i-1}$ כך ש-$latex sw_{i}=\sum_{t=1}^{i-1}g_{t}w_{t}$. עכשיו, אם אני רק אדע ש-$latex s$ מחלק את כל ה-$latex g_{t}$-ים הללו אני אהיה מאוד שמח: עולה מכך שה-$latex f_{t}$-ים ש"נבחרו בצורה חכמה כלשהי" צריכים להיבחר כך: $latex f_{t}=\frac{g_{t}}{s}$.

להראות את תכונת החלוקה הזו, זה החלק הקשה ביותר בהוכחה כולה. מה שאעשה יהיה לחלק עם שארית את כל ה-$latex g_{t}$-ים ב-$latex s$. זה אומר שאני אקבל משוואות מהצורה $latex g_{t}=q_{t}s+r_{t}$ כאשר על $latex r_{t}$ – ה"שארית" – אני יודע שהיא פולינום ממעלה קטנה משל $latex s$. המטרה שלי היא להראות שה-$latex r_{t}$ הזה הוא פולינום האפס, לכל $latex t$.

על פי האינטואיציה שנתתי קודם, אנחנו הולכים להגדיר וקטור $latex v_{i}=w_{i}-\sum_{t=1}^{i-1}\frac{g_{t}}{s}w_{t}$. אם באמת אצליח להוכיח שכל השאריות הן 0, אז ההגדרה הזו תהיה זהה להגדרה הבאה: $latex v_{i}=w_{i}-\sum_{t=1}^{i-1}q_{t}w_{t}$. בואו ניקח את ה-$latex v_{i}$ הזה ונעבוד איתו. אנחנו רואים ש-$latex v_{i}-w_{i}\in W_{i-1}$ ולכן מהטענה שהזכרתי קודם, לשניהם יש את אותו conductor לתוך $latex W_{i-1}$, דהיינו $latex s\left(v_{i},W_{i-1}\right)=s\left(w_{i},W_{i-1}\right)=s$. כעת, מה מקבלים כאשר לוקחים את ה-$latex s$ הזה ומפעילים אותו על $latex v_{i}$? חישוב זריז יראה לנו ש-

$latex sv_{i}=sw_{i}-\sum_{t=1}^{i-1}sq_{t}w_{t}=\sum_{t=1}^{i-1}r_{t}w_{t}$

כלומר, $latex sv_{i}$ מורכב מסכום של ה"שאריות", ואם נצליח להוכיח שכל השאריות הן 0, בפרט ינבע מכך ש-$latex sv_{i}$ הוא 0 ולכן $latex s$ הוא לא סתם ה-conductor של $latex v_{i}$ לתוך $latex W_{i-1}$ אלא הוא ממש המאפס שלו; זו הסיבה שבגללה $latex v_{i}$ הוא מיוחד כל כך: הרי ה-conductor של וקטור יכול להשתנות כתלות במרחב שאליו נכנסים, אבל המאפס שלו הוא יחיד. אז כאן $latex v_{i}$ מיוחד מבחינת $latex W_{i}$ במובן זה שהמאפס שלו – הפולינום שמותאם לו "אבסולוטית", גם זהה לפולינום ה"ספציפי" שהמרחב $latex W_{i}$ מתאים ל-$latex v_{i}$.

עכשיו צריך לעבוד קצת בזהירות כדי לקבל את הסתירה. חשבתי להראות קודם מקרה פרטי וכאלו, אבל זה לא באמת מפשט את העניינים אז בואו פשוט נצלול פנימה. אמרנו ש-$latex sv_{i}=\sum_{t=1}^{i-1}r_{t}w_{t}$. חלק מהפולינומים $latex r_{t}$ הללו עשויים להיות 0. אם כולם 0, סיימנו. אחרת, בואו נסמן ב-$latex j$ את האינדקס הגדול ביותר של פולינום ששונה מאפס. כלומר, $latex sv_{i}=\sum_{t=1}^{j}r_{t}w_{t}$ ואנחנו יודעים שהמחובר האחרון שונה מאפס. מה שיביא לנו את הסתירה יהיה לבחון את ה-conductor של $latex v_{i}$ לתוך $latex W_{j-1}$ ולהשוות אותו אל $latex s$, שהוא כזכור ה-conductor לתוך $latex W_{i-1}$ (שימו לב לכך ש-$latex j\le i-1$ ולכן $latex j-1<i-1$ – אלו מרחבים שונים). נסמן אם כן $latex p=s\left(v_{i},W_{j-1}\right)$. כעת, מכיוון ש-$latex W_{j-1}\subset W_{i-1}$, מי שמכניס את $latex v_{i}$ לתוך $latex W_{j-1}$ בוודאי מכניס אותו גם לתוך $latex W_{i-1}$. ה-conductor, כזכור, מחלק כל פולינום אחר שמכניס לתוך המרחב. לכן $latex s$ מחלק את $latex p$. נסמן את זה $latex p=s\cdot g$.

עכשיו בואו נביט שוב במשוואה $latex sv_{i}=\sum_{t=1}^{j}r_{t}w_{t}$. נכפול את שני האגפים שלה ב-$latex g$ (פורמלית אנחנו עושים פעולה יותר מסובכת מאשר כפל – הרבה של טרנספורמציות לינאריות – אבל בפועל זה יוצא אותו דבר) ונקבל:

$latex \left(sg\right)v_{i}=\sum_{t=1}^{j}gr_{t}w_{t}$

אגף שמאל שווה ל-$latex pv_{i}$. מאגף ימין אפשר לנתק את המחובר האחרון, להעביר את יתר הסכום אגף, ולקבל:

$latex pv_{i}-\sum_{t=1}^{j-1}gr_{t}w_{t}=gr_{j}w_{j}$

זה מעניין מכיוון ש-$latex pv_{i}\in W_{j-1}$ (כי $latex p$ הוא ה-conductor של $latex v_{i}$ לתוך $latex W_{j-1}$) וכמובן ש-$latex \sum_{t=1}^{j-1}r_{t}w_{t}\in W_{j-1}$ (צירוף לינארי של איברים שכולם שייכים ל-$latex W_{j-1}$). לכן $latex gr_{j}w_{j}\in W_{j-1}$, כלומר $latex gr_{j}$ מעביר את $latex w_{j}$ לתוך $latex W_{j-1}$. עכשיו ברור למה התעקשתי ש-$latex r_{j}\ne0$, כי אם הוא אפס זה לא מעניין – ברור שזה קורה.

איפה הסתירה פה?

בשביל זה צריך לחזור אחורה, לשלב שבו בחרנו את $latex w_{j}$. בחרנו אותו כדי שימקסם את הדרגה של $latex s\left(w_{j},W_{j-1}\right)$. אני אשתמש בזה כדי להוכיח ש-$latex \deg r_{j}\ge\deg s$, מה שהוא בלתי אפשרי כי $latex r_{j}$ היא השארית של חלוקה של משהו ב-$latex s$. לצורך כך, מספיק לי להראות ש-$latex \deg gr_{j}\ge\deg sr_{j}=\deg p$, אבל זה ברור: $latex p$ מכניס את $latex v_{i}$ לתוך $latex W_{j-1}$, ולכן המעלה שלו קטנה או שווה למעלה של הפולינום מהמעלה המינימלית שמכניס את $latex w_{j}$ לתוך $latex W_{j-1}$ (אם זה לא היה כך, היינו בוחרים את $latex v_{i}$ במקום את $latex w_{i}$ בשלב שבו בחרנו איבר שממקסם את ה-conductor לתוך $latex W_{j-1}$). כעת, מכיוון ש-$latex r_{j}s$ הוא פולינום כלשהו שמכניס את $latex w_{j}$ לתוך $latex W_{j-1}$, המעלה שלו יכולה להיות רק גדולה יותר. פורמלית, למי שזה עוזר לו:

$latex \deg gr_{j}\ge\deg s\left(w_{j},W_{j-1}\right)\ge\deg s\left(v_{i},W_{j-1}\right)=\deg p=\deg sr_{j}$

חלק רביעי, שבו כבר מתחילים לראות את אור היום

זהו, זה היה החלק המסובך ביותר בהוכחה. עכשיו אפשר ללכת צעד אחד אחורה ולראות מה בעצם הוכחנו: הוכחנו ש-$latex sw_{i}=\sum_{t=1}^{i-1}g_{t}w_{t}$ כאשר כל ה-$latex g_{t}$-ים מתחלקים ב-$latex s$ ולכן אפשר להגדיר $latex v_{i}=w_{i}-\sum_{t=1}^{i-1}\frac{g_{t}}{s}w_{t}$. כבר ראינו ש-$latex s\left(v_{i},W_{i-1}\right)=s\left(w_{i},W_{i-1}\right)$, וראינו יותר מכך: ש-$latex s\left(v_{i},W_{i-1}\right)$ הוא המאפס של $latex v_{i}$, כלומר $latex sv_{i}=0$.

כעת אני רוצה להוכיח באינדוקציה שני דברים:

  1. $latex W_{i}=Z\left(v_{1};T\right)+\dots+Z\left(v_{i};T\right)$. כלומר, זה שהחלפנו את ה-$latex w_{t}$-ים המקוריים שלנו ב-$latex v_{t}$-ים החדשים, ה"מתוקנים", לא שינה את סדרת המרחבים ההולכת ועולה שאנחנו מקבלים.
  2. לכל זוג $latex v_{i},v_{j}$ מתקיים $latex Z\left(v_{i};T\right)\cap Z\left(v_{j};T\right)=\left\{ 0\right\} $. במילים אחרות, $latex W_{i}$ הוא כעת סכום ישר.

בסיס האינדוקציה טריוויאלי כשיש לנו רק מרחב אחד. לכן אפשר להניח שכבר בנינו את $latex W_{i-1}$ ולראות מה קורה כשמכניסים לתמונה את $latex v_{i}$. אם כן, אנו מניחים ש-$latex W_{i-1}=Z\left(v_{1};T\right)+\dots+Z\left(v_{i-1};T\right)$. כעת, נזכור שהגדרנו $latex W_{i}\triangleq W_{i-1}+Z\left(w_{i};T\right)$, ואני רוצה להוכיח ש-$latex W_{i}=W_{i-1}+Z\left(v_{i};T\right)$. מן הסתם זה לא נכון ש-$latex Z\left(w_{i};T\right)=Z\left(v_{i};T\right)$, אבל כל מה שאני צריך לעשות הוא להוכיח הכלה, ובשביל זה מספיק שאראה $latex w_{i}\in W_{i-1}+Z\left(v_{i};T\right)$, וזה כמובן נכון כי $latex w_{i}=v_{i}+\sum_{t=1}^{i-1}\frac{g_{t}}{s}w_{t}$.

נשאר להראות ש-$latex Z\left(v_{i};T\right)\cap Z\left(v_{j};T\right)=\left\{ 0\right\} $ – זו הרי הייתה המטרה של כל המהומה הזו. כאן נכנס לתמונה עניין ה"ה-conductor הוא גם המאפס". נניח ש-$latex i<j$ ובואו נסתכל על איבר ב-$latex Z\left(v_{i};T\right)\cap Z\left(v_{j};T\right)$. האיבר הזה הוא איבר של $latex Z\left(v_{j};T\right)$, כלומר מהצורה $latex pv_{j}$. מכיוון ש-$latex pv_{j}\in Z\left(v_{i};T\right)$, נובע מכך ש-$latex p$ מתחלק על ידי ה-conductor של $latex v_{j}$, כלומר הוא כפולה של פולינום ה-0, כלומר הוא בעצמו 0, וסיימנו. בהתחשב בזוועה הטכנית שעברנו קודם, החלק הזה היה פשוט מאוד.

נסכם: ראינו ש-$latex V=Z\left(v_{1};T\right)\oplus\dots\oplus Z\left(v_{k};T\right)$. עכשיו אנחנו רוצים לדבר קצת על תכונת ה"יחידות" של הפירוק. מה הכוונה שלי ב"יחידות"? האם לא ייתכן שיהיו וקטורים ציקליים מלבד $latex v_{1},\dots,v_{k}$? ייתכן שיהיו. אבל אם אדרוש עוד תנאי מסויים, אני יכול להבטיח ששני דברים יישאר קבועים בכל פירוק ציקלי של $latex V$: ראשית, שמספר תת-המרחבים הציקליים יהיה זהה; ושנית, שהמאפסים של הוקטורים הציקליים יהיו זהים. התנאי הנוסף הזה הוא: אם $latex V=Z\left(v_{1};T\right)\oplus\dots\oplus Z\left(v_{k};T\right)$ ואם נסמן את המאפסים של $latex v_{1},\dots,v_{k}$ ב-$latex p_{1},\dots,p_{k}$ בהתאמה, אז $latex p_{i}|p_{i-1}$ לכל $latex 1<i\le k$. אני רוצה לטעון שבפירוק שמצאתי בהוכחה לעיל התכונה הזו אכן מתקיימת, ושאם היא מתקיימת זה מבטיח את היחידות של סדרת המאפסים.

חלק חמישי, שבו יש לנו הוכחת קיום ויחידות לכך שיהיה טוב מתישהו

נתחיל עם ההוכחה שהתכונה הזו אכן מתקיימת עבור ה-$latex v_{i}$-ים שלנו. הטיעון הוא פשוט מכיוון שהוא מסתמך בצורה מחוכמת על מה שכבר ראינו: כזכור, קודם, עם ה-$latex w_{i}$-ים, ראינו שאם $latex sw_{i}=\sum_{t=1}^{i-1}g_{t}w_{t}$ אז $latex s$ מחלק את כל ה-$latex g_{t}$-ים. כעת אנחנו יכולים לחזור על ההוכחה עם ה-$latex v_{i}$-ים; זה עובד מכיוון שה-conductor-ים של $latex w_{i}$ ושל $latex v_{i}$ זהים. במקרה של ה-$latex v_{i}$-ים הסכום פשוט במיוחד: $latex p_{t}v_{t}=0$ לכל $latex 1\le t\le i$ ולכן אפשר לכתוב $latex p_{i}v_{i}=\sum_{t=1}^{i-t}p_{t}v_{t}$, ונקבל ש-$latex p_{i}$ מחלק את $latex p_{i-1}$ כפי שרצינו.

נשארנו עם החלק של הוכחת היחידות. שגם הוא יהיה קשה, אבל אל דאגה, נחפף בו. כאמור, ראינו שמתקיים

$latex V=Z\left(v_{1};T\right)\oplus\dots\oplus Z\left(v_{k};T\right)$

עם מאפסים $latex p_{1},\dots,p_{k}$ שכל אחד מהם מחלק את קודמו.

בואו נניח שבנוסף לכך מתקיים גם

$latex V=Z\left(u_{1};T\right)\oplus\dots\oplus Z\left(u_{s};T\right)$

עם מאפסים $latex q_{1},\dots,q_{s}$ שכל אחד מהם מחלק את קודמו.

אנחנו רוצים להוכיח ש-$latex k=s$ וש-$latex p_{i}=q_{i}$ לכל $latex 1\le i\le k$. איך נעשה את זה? נוכיח ש-$latex p_{1}=q_{1}$, ואז נוכיח ש-$latex p_{2}=q_{2}$ ומשם נמשיך באינדוקציה. לא, אני רציני, זה מה שנעשה.

הסיבה ש-$latex p_{1},q_{1}$ הם קלים יחסית היא שהם לא סתם מאפסים את $latex v_{1},u_{1}$ אלא הם מאפסים את כל המרחב, בגלל תכונת החלוקה. הנה הטיעון המלא: כל איבר ב-$latex V$ הוא מהצורה $latex v=\sum_{i=1}^{k}f_{i}v_{i}$. כעת, $latex p_{1}$ מתחלק על ידי כל אחד מהפולינומים $latex p_{1},\dots,p_{k}$ כך שאפשר לכתוב $latex p_{1}=g_{i}p_{i}$. מסקנה: $latex p_{1}v=\sum_{i=1}^{k}g_{i}p_{i}f_{i}v_{i}=\sum_{i=1}^{k}\left(g_{i}f_{i}\right)p_{i}v_{i}=0$. מכאן שבפרט, $latex p_{1}$ מאפס את $latex u_{1}$ ולכן מתחלק על ידי המאפס שלו, $latex q_{1}$. באותו האופן גם $latex q_{1}$ מתחלק על ידי $latex p_{1}$. מכיוון שמאפס הוא פולינום מתוקן נובע מכך ש-$latex p_{1}=q_{1}$.

אוקיי, זה היה קל. להוכיח ש-$latex p_{2}=q_{2}$ יהיה יותר טריקי.

ראשית, בכלל לא בטוח שיש $latex p_{2}$. הרי ייתכן ש-$latex k=1$. אבל אפשר בלי הגבלת הכלליות להניח מראש ש-$latex s\le k$ כלומר, נניח מראש ש-$latex p_{2}$ קיים ונראה שבמקרה הזה, גם $latex q_{2}$ קיים. הטיעון פה הוא שיקול מימד פשוט: המימד של $latex Z\left(v_{1};T\right)$ שווה למעלה של $latex p_{1}$, ולכן אם $latex p_{1}=q_{1}$ גם $latex \dim Z\left(v_{1};T\right)=\dim Z\left(u_{1};T\right)$ ולכן אם $latex \dim Z\left(v_{1};T\right)<\dim V$ כך גם עבור $latex u_{1}$. מן הסתם אפשר להמשיך באינדוקציה עם הטיעון הזה אחרי שמוכיחים ש-$latex p_{2}=q_{2}$ וכן הלאה, כך שכבר ברור לנו איך מוכיחים ש-$latex k=s$.

נשאר רק להבין איך מוכיחים ש-$latex p_{2}=q_{2}$, ואז אפשר לומר שממשיכים באינדוקציה באופן דומה.

מה שעשינו קודם היה לקחת את $latex p_{1}$ ולהפעיל אותו על כל המרחב. אפשר לסמן את זה כך: $latex p_{1}V=\left\{ p_{1}v\ |\ v\in V\right\} $. הקבוצה שקיבלנו הייתה פשוט $latex \left\{ 0\right\} $ ומכאן הכל היה קל. אבל מה אם נעשה את זה עבור $latex p_{2}$? מכיוון ש-$latex p_{2}$ מתחלק בכל הבאים אחריו נחסל את כל המרחב, אבל לא את החלק של $latex Z\left(v_{1};T\right)$. מה שכן, קל להראות ש-$latex p_{2}Z\left(v_{1};T\right)=Z\left(p_{2}v_{1};T\right)$. כלומר, נקבל:

$latex p_{2}V=Z\left(p_{2}v_{1};T\right)$

עכשיו נפעיל את $latex p_{2}$ גם על הפירוק השני של המרחב, הפעם בלי שנוכל לחסל שום תת-מרחב כי אנחנו עוד לא יודעים איך $latex p_{2}$ מתנהג עם תתי-המרחבים הללו:

$latex p_{2}V=Z\left(p_{2}u_{1};T\right)\oplus\dots\oplus Z\left(p_{2}u_{s};T\right)$

(גם פה יש משהו להוכיח – שאנחנו עדיין מקבלים סכום ישר – אבל אני מחפף).

מה שאני רוצה לטעון עכשיו הוא ש-$latex \dim Z\left(p_{2}v_{1};T\right)=\dim Z\left(p_{2}u_{1};T\right)$. גם זו טענה ישירה יחסית שלא אטרח להוכיח – הרעיון הוא שאם המאפס של $latex v_{1}$ שווה למאפס של $latex u_{1}$, כך גם המאפסים של $latex pv_{1},pu_{1}$ יהיו שווים לכל פולינום $latex p$. כעת, שוויון המימדים הזה גורר שבהכרח המימד של $latex Z\left(p_{2}u_{2};T\right)\oplus\dots\oplus Z\left(p_{2}u_{s};T\right)$ הוא אפס, ולכן $latex Z\left(p_{2}u_{i};T\right)=\left\{ 0\right\} $ לכל $latex 2\le i\le s$. מסקנה: $latex p_{2}$ מאפס את $latex u_{2}$ ולכן מתחלק על ידי $latex q_{2}$, ובאופן דומה $latex q_{2}$ מאפס את $latex p_{2}$ ולכן הם שווים. זה טיעון דומה לזה שבו השתמשנו עבור $latex p_{1}=q_{1}$ אבל כללי קצת יותר (כי היה צריך "לקלף" את המרחב הראשון), ומכאן אני חושב שההמשך באינדוקציה ברור.

אם כן, זה סוף ההוכחה. זו לא הוכחה קשה במיוחד – הרעיונות שלה הם כולם בסיסיים ומופיעים בעוד כל מני מקומות באלגברה לינארית; אבל היא הייתה ארוכה ומלאת אינדקסים הרבה יותר מאשר רוב ההוכחות שאני מכיר באלגברה לינארית בסיסית. מכיוון שאפשר לקבל ממנה שלל דברים יפים, זה גם לא עד כדי כך מפתיע.

2 תגובות על הפוסט “משפט הפירוק הציקלי

  1. הצעה: Conductor יכול להיקרא מוליך, כמו במעגלים חשמליים, ובהקשר כאן, שהוא "מוליך" את w_i אל המרחב W_(i-1) בדרך הקצרה ביותר מבחינה פולינומאלית ב- T.
    לא?

  2. פינגבאק: צורת ז'ורדן והצורה הרציונלית – התיאוריה | לא מדויק

כתיבת תגובה

האימייל לא יוצג באתר.