לוגיקה מסדר ראשון

אם נרצה לייחס את המצאת הלוגיקה המתמטית המודרנית לאדם יחיד, זה בוודאי יהיה המתמטיקאי הגרמני גוטלוב פרגה, ובפרט לספרו מ-1879, "Begriffsschrift" (אפילו לא אנסה להעמיד פנים שאני יכול לתרגם). בספר הזה פרגה המציא את מה שבימינו הוא הלחם והחמאה של הלוגיקה – סימונים פורמליים למושגים כמו "וגם", "לכל", "שקול" וכדומה, והסקת מסקנות על ידי מניפולציות סימבוליות של אותם סימונים פורמליים. ההשפעה של הספר על המשך התפתחותה של הלוגיקה המתמטית אינה מוטלת בספק. עם זאת, אני ממש לא הולך להציג שום דבר מתוך הספר כאן.

זו הבעיה באופן כללי במתמטיקה: אנחנו בדרך כלל רואים רק את התוצר הסופי. אם ננסה להבין את כל שלבי הביניים זה ידרוש מאיתנו מאמץ גדול פי כמה וכמה, ולעתים קרובות נצטרך להסתגל לטרמינולוגיות שונות מהותית מאלו שהתרגלו אליהן (אפילו הפוכות!) ולרעיונות פילוסופיים מנחים שבימינו עשויים להיראות מוזרים. זה הופך את ההיסטוריה של המתמטיקה לתחום מאתגר מאין כמותו, שאני לרוב נמנע ממנו. כך גם עם פרגה – שיטות הסימון שלו היו שונות משלנו כיום, והיו עוד כמה הבדלים רעיוניים בין מה שהוא עשה ומה שאני הולך להציג כרגע. חשבו על מה שאני מציג בתור זיקוק הרעיונות של פרגה ומתמטיקאים רבים אחרים; וזכרו שזו בפירוש לא הדרך היחידה לבנות לוגיקה פורמלית אלא פשוט זו שהשתרשה בסופו של דבר במרבית ספרי הלימוד ובעיסוק המתמטי הכללי, בגלל שהיא הייתה הנוחה ביותר. למה שאני אציג קוראים "לוגיקה מסדר ראשון" (First Order Logic).

לוגיקה מסדר ראשון מנסה לתאר את רוב המתמטיקה. כדי להסביר מה בכלל המשמעות של "תיאור" שכזה ולמה לא את כל המתמטיקה אני חושב שכדאי קודם כל להכיר את הפרטים הקטנים של מה זה בכלל אומר, לוגיקה מסדר ראשון. גם פשר השם ("סדר ראשון"? מה זו "לוגיקה מסדר שני", אם כן?) תלוי בפרטים. לכן הפוסט הזה הולך להיות טכני והגדרתי יחסית. זה לא יהיה נעים לקוראים שמקווים למבוא מלטף, אבל אומר לכם בכנות – בכל הנוגע ללוגיקה, אני לא חושב שיש כזה, או אפילו שנכון לעשות את זה. לוגיקה היא האמנות של תיאור פורמלי ומדויק של דברים שאחרת הם בגדר נפנופי ידיים; לב-לבו של העניין הוא בכך שהבנה של הפורמליזם הזה מאפשרת לנו להבין את נפנופי הידיים ברמה גבוהה יותר מאשר היינו מבינים אותם אם היינו נשארים ברמת נפנופי הידיים. אם לסטות לאנגלית לרגע, Details Matter. אני לא חושב שזה מקרה שספר המדע הפופולרי היחיד שקראתי ולדעתי עושה צדק ללוגיקה – "גדל, אשר, באך" – מלכלך את הידיים שלו בפרטים טכניים כבר מההתחלה.

רק למען הסר ספק, לנפשות התועות שנקלעו לפה בטעות – לוגיקה מתמטית אינה התחום שעוסק ב"איך לחשוב נכון" או "איך לבנות טענות בויכוח בצורה נכונה כך שלא ניתן יהיה לסתור אותן" או משהו דומה. בשביל זה צריך Common Sense (מה הקטע עם האנגלית היום?) שאותו צריך באופן כללי בתחומים רבים בחיים (ובפרט, במתמטיקה באופן כללי). לוגיקה מתמטית מתעסקת באיך לפרמל את מה שהמתמטיקאים עושים. כבר הסברתי זאת בפוסט קודם שהיה מבוא כללי ללוגיקה מתמטית.

אם כן, בואו ונעבור לפרטים. מי מכם שקרא את הפוסטים על תחשיב הפסוקים כבר יודע למה בערך צריך לצפות – תיאור של לוגיקה מסויימת מורכב מתיאור של תחביר – האופן שבו בונים פסוקים שמטרתם "לתאר משהו", וסמנטיקה, האופן שבו נותנים משמעות לרכיבים של הפסוקים, ובמקרה שלנו – המשמעות הזו נותנת בסופו של דבר לפסוקים ערכי אמת – "אמת/שקר", או $latex \mbox{T,F}$.

בתחשיב הפסוקים בנינו את הפסוקים מתוך "אטומים" שהיו משתנים שיכלו לקבל ערכי $latex \mbox{T,F}$ בלבד, וחיברנו אותם זה לזה עם "וגם/או/לא/גורר", וזהו זה. כוח ההבעה שלנו היה מוגבל למדי. הבה ונמחיש זאת עם שתי דוגמאות. הראשונה היא קלאסית, ונוגעת לשרשרת המשפטים הבאה שמשוייכת לאריסטו:

  1. כל בני האדם הם בני תמותה.
  2. סוקרטס הוא בן אדם.
  3. מכאן שסוקרטס הוא בן תמותה.

אינטואיטיבית ברור לנו שההיסק פה "נכון". איך מפרמלים אותו בתחשיב הפסוקים? הרי בתחשיב הפסוקים אין לנו דרך לדבר על "כל" ועל תכונות כמו "מישהו הוא בן אדם/בן תמותה". אפשר היה אולי לחשוב שטענה 1 היא מהצורה $latex A\to B$ כאשר $latex A$ הוא "בן אדם" ו-$latex B$ הוא "בן תמותה", אבל איך זה מתחבר אל סוקרטס? האם טענה 2 היא $latex A$? לא, שהרי $latex A$ היא הטענה "בן אדם". היא לא הטענה "סוקרטס הוא בן אדם". אולי צריך להוסיף עוד משתנה עבור "סוקרטס"? ואז טענה 2 היא $latex C\to A$? ואז נסיק איכשהו מצמד הפסוקים $latex A\to B$ ו-$latex C\to A$ ש-$latex C\to B$. זה נשמע לא רע במיוחד, אבל זה אומר שצריך להתאים משתנה מיוחד לכל בן אדם אפשרי. ומה עם זאפוד ביבלברוקס? הוא לא בן אדם. בואו נתאים לו משתנה $latex Z$. האם אנחנו צריכים פסוק $latex \neg\left(Z\to A\right)$ עבור זאפוד? ומה יקרה אם זאפוד וסוקרטס יופיעו באותו משפט? מה המשמעות של $latex \left(C\to A\right)\wedge\neg\left(Z\to A\right)$? היינו רוצים לומר שהמשפט הזה אומר "סוקרטס הוא בן אדם וזאפוד לא" אבל לשם כך המשתנה $latex A$ צריך לקבל גם $latex \mbox{T}$ וגם $latex \mbox{F}$ בו זמנית ($latex \mbox{T}$ לחלק השמאלי של המשפט ו-$latex \mbox{F}$ לימני). או לחילופין, צריך יהיה להציב $latex \mbox{F}$ או בסוקרטס או בזאפוד, אבל…

טוב, זה די מיש-מש. למרות שאולי אפשר לחלץ מזה משהו, זה כאב ראש לחשוב איך לנסח אפילו משפטים פשוטים בצורה הזו. בואו נעבור עכשיו למשפט קצת יותר מורכב – הגדרת הגבול בחדו"א. אומרים ש-$latex \lim_{x\to x_{0}}f\left(x\right)=L$ אם לכל $latex \varepsilon>0$ קיים $latex \delta>0$ כך שלכל $latex x$, אם $latex \left|x-x_{0}\right|<\delta$ אז $latex \left|f\left(x\right)-L\right|<\varepsilon$. איך אפשר לנסח את שרשרת ה"לכל-קיים-לכל" בעזרת תחשיב הפסוקים? אין לי מושג. ואיך אפשר לנסח את ההפעלה של ערך מוחלט בתוך ההגדרה? לא יודע. ואיך אפשר לנסח את "קטן מ-"? האם צריך שני משתנים שונים, אחד עבור $latex \left|x-x_{0}\right|<\delta$ ואחד עבור $latex \left|f\left(x\right)-L\right|<\varepsilon$? הרי התחושה שלנו היא שהמופע של הערך המוחלט, והמופע של ה-$latex <$ בשני המקרים הוא מופע של אותו דבר. אנחנו רוצים לחלץ את הרכיבים הדומים, לא להסתיר אותם מאחורי משתנים שונים.

בקיצור, אנחנו עוברים לדבר על לוגיקה מסדר ראשון כדי לשפר את יכולת ההבעה שלנו. לצורך כך אנחנו מרחיבים את התחביר באופן משמעותי. יש לנו, כמקודם, משתנים: $latex x_{1},x_{2},x_{3},\dots$. יש לנו את הסימנים הלוגיים של תחשיב הפסוקים, כלומר $latex \to,\neg,\wedge,\vee$, ואפשר גם להוסיף $latex \leftrightarrow$ כדי לשפר את הקריאות. צריך גם סוגריים ופסיק, כלומר הסימנים $latex )$ ו-$latex ($ ו-$latex ,$ (למה פסיק? עוד מעט נגיע לזה). אבל שני השחקנים החדשים שמקבלים מקום של כבוד הם הסימנים עבור "לכל" ו"קיים": $latex \forall$ ו-$latex \exists$, שהם מעין A הפוכה (עבור All, "לכל") ו-E הפוכה (עבור Exists, "קיים").

אילו עוד דברים אנחנו צריכים? ובכן, אם ננסה לדבר על תורת הקבוצות נצטרך כנראה סימן עבור יחס השייכות $latex \in$ ועבור הקבוצה הריקה $latex \emptyset$; אם נדבר על תורת החבורות נצטרך סימן עבור הפעולה הבינארית של החבורה $latex \cdot$ ועבור האיבר האדיש לכפל $latex e$. אם נדבר על המספרים הטבעיים נצטרך סימן ל-$latex 0$ וסימן ל"עוקב של מספר", נאמר $latex S$ (כך ש-$latex S\left(0\right)$ הוא בעצם 1 וכדומה), וכמובן שאת יחס הסדר $latex <$ ואת פעולות החיבור $latex +$ והכפל $latex \times$. ואם נרצה לדבר על גרפים נצטרך עוד סימן יחס שמתאר שיש קשת בין שני צמתים – למשל, $latex E\left(v,u\right)$ מתאר זאת. וכו' וכו' וכו'. אנחנו רואים שאנחנו צריכים המון סימנים, אבל שהסימנים הללו הם תלויי שימוש; אנחנו לא חייבים את $latex \in$ תמיד אלא רק כשאנחנו רוצים לתאר קבוצות; ואין צורך בסימן $latex +$ בתורת החבורות, וכו' וכו'. לכן מטעמי חסכנות אנחנו מרשים להשתמש רק בתת-קבוצה של הסימנים האפשריים. פורמלית, אנחנו מגדירים מילון שהוא אוסף של סימנים שבאים לתאר קבועים, יחסים ופונקציות, כך שכל מילון מגדיר שפה אחרת מסדר ראשון. יש את השפה של תורת החבורות, שהמילון שלה הוא $latex \left\langle e,\cdot\right\rangle $; השפה של המספרים הטבעיים עם המילון $latex \left\langle 0,S,+,\times\right\rangle $; השפה של תורת הקבוצות עם $latex \left\langle \emptyset,\in\right\rangle $ וכן הלאה. כאן $latex 0,\emptyset$ הם דוגמאות לקבועים, בעוד ש-$latex \in$ הוא דוגמא ליחס ו-$latex S,+,\times$ הם דוגמאות לפונקציות.

רק כדי לוודא שהנקודה הזו ברורה: איברי המילון אינם קבועים, יחסים או פונקציות; הם סימני קבועים, סימני יחסים וסימני פונקציות. כלומר, הם סימבולים מסויימים שהמשמעות שעוד מעט נתאים להם תהיה של קבועים, יחסים ופונקציות, אבל הם אינם כאלו בעצמם. מבלבל? כן! זה ההבדל שבין התחביר ובין הסמנטיקה שכבר הזכרתי.

יש סימן יחס מיוחד שטרם דיברתי עליו – שוויון, $latex =$. יש ספרים שלא מכניסים אותו אוטומטית לשפות, ויש ספרים שכן. אני מעדיף את הגישה שמכניסה אותו אוטומטית למרות שהיא טיפה מגבילה אותנו. אם כן, $latex =$ יהיה שייך לקבוצת הסימנים שתמיד יכולים לשמש כחלק מהרכבת פסוקים בשפה – הקבוצה $latex \left\{ \to,\neg,\wedge,\vee,\leftrightarrow,),(,,,\exists,\forall,=\right\} $. לסימנים הללו קוראים סימנים לוגיים.

באופן כללי מסמנים פונקציות כמשהו כזה: $latex f\left(x_{1},x_{2}\right)$ הוא דוגמה לסימן פונקציה ש"מופעלת" על שני משתנים, $latex x_{1},x_{2}$. גם יחסים מתוארים כך -$latex R\left(x_{1},x_{2}\right)$ הוא דוגמה. שימו לב מה יש לנו כאן: קודם כל את סימן הפונקציה/יחס; אחר כך סוגר שמאלי (הסוגר הזה הוא חלק מהסימנים הלוגיים!), אחר כך שם של משתנה, אחר כך הסימן "פסיק", אז עוד משתנה, ואז סוגר ימני.

כשבונים פסוקים בתחשיב הפסוקים, יש שני סוגים של "אבני בניין" שעובדים איתם. ראשית, יש ביטויים שהמשמעות שנייחס להם – אחרי שנתחיל לייחס משמעות לדברים – היא של איברים מה"עולם" (מה זה? בהמשך). שנית, יש ביטויים שהמשמעות שנייחס להם היא משמעות לוגית – $latex \mbox{T}$ או $latex \mbox{F}$. לביטויים מהסוג הראשון נקרא שמות עצם, ולביטויים מהסוג השני – נוסחאות. שימו לב ששם עצם לבדו הוא לא נוסחה חוקית!

שם עצם מוגדר בתור סימן של משתנה (למשל, $latex x$) או סימן של קבוע (למשל, $latex c$) או "הפעלה" של סימן פונקציה על שמות עצם, למשל $latex f\left(x,c\right)$ או $latex g\left(f\left(x,x,x\right),g\left(c_{1},c_{2}\right)\right)$.

נוסחאות מוגדרות בצורה טיפה יותר מורכבת – ראשית יש נוסחאות אטומיות, שהן תמיד "הפעלה" של סימן יחס כלשהו על שמות עצם כלשהם, למשל $latex R\left(f\left(x_{1},x_{2}\right),c\right)$ או $latex x_{1}=g\left(x_{2}\right)$ וכדומה. שנית, אם $latex \varphi,\psi$ הן נוסחאות, כך גם $latex \neg\varphi$ ו-$latex \left(\varphi\to\psi\right)$ ו-$latex \left(\varphi\leftrightarrow\psi\right)$ ו-$latex \left(\varphi\wedge\psi\right)$ ו-$latex \left(\varphi\vee\psi\right)$ (זה דומה לתחשיב הפסוקים, עם נוסחאות אטומיות במקום משתנים). לבסוף, לכל משתנה $latex x$ ונוסחה $latex \varphi$, גם $latex \forall x\left(\varphi\right)$ ו-$latex \exists v\left(\varphi\right)$ היא נוסחה. זה משלים את הגדרת התחביר (אבל ברצינות, אם אתם רוצים ללמוד את העניין עד הסוף, תצטרכו ספר אמיתי בשביל זה).

אני חושב שעכשיו זה זמן טוב לעצור ולתת דוגמה לאיך פסוקים נראים בפועל. אשתמש בתורת החבורות, פשוט כי היא דוגמה כל כך טובה: השפה תורת החבורות כוללת, כאמור, את סימן הקבוע $latex e$ ואת סימן הפונקציה $latex \cdot$. מה שנקרא "תורת החבורות" עצמה כולל את שלושת הפסוקים הבאים:

  1. $latex \forall x\forall y\forall z\left(\left(x\cdot y\right)\cdot z=x\cdot\left(y\cdot z\right)\right)$ ("אסוציאטיביות").
  2. $latex \forall x\left(x\cdot e=e\cdot x=x\right)$ ("אדיש כפלי").
  3. $latex \forall x\exists y\left(x\cdot y=y\cdot x=e\right)$ ("הופכי כפלי").

הפסוקים הללו מוצגים בצורה רשלנית משהו שעמוסה בקיצורי דרך; הם לא תקינים מבחינה תחבירית, אבל די ברור (לדעתי) איך אפשר להמיר אותם לפסוקים שיהיו תקינים תחבירית ויגידו אותו דבר, אבל לא ממש יהיו קריאים, אז אני מוותר על התענוג. העיקר כאן הוא לראות את רכיבי המשפט – סימני היחס, הפונקציה, הקבועים, הכמתים – ואת ההגיון שאפשר להביע באמצעותם.

עכשיו בואו נעבור לסמנטיקה.

הסמנטיקה של תחשיב הפסוקים היא פשוטה ביותר – יש משתנים, בכל אחד מציבים $latex \mbox{T}$ או $latex \mbox{F}$, "מחשבים" את הערך של פסוק שנובע מתוך ההצבה הזו, וסיימנו. בתחשיב היחסים הסיפור מסובך באופן משמעותי. אנחנו מתחילים משפה מסדר ראשון נתונה, עם איזה שהוא מילון נתון (מילון, כזכור, הוא אוסף סימני הקבועים, היחסים והפונקציות שיכולים להופיע בנוסחאות השפה). הדבר הראשון שעושים, עוד לפני שמתחילים עם השמות של ערכים למשתנים, הוא לקבוע את "זירת המשחק" שלנו, שכוללת את העולם שממנו ילקחו הערכים שמשתנים יכולים לקבל, ואת הפרשנות שניתנת בעולם הזה לסימני הקבועים, היחסים והפונקציות. המפלצת שכוללת את כל המידע הזה בתוכה נקראת מבנה ומסומנת אצלי ב-$latex \mathcal{M}$.

מבנה $latex \mathcal{M}$, אם כן, כולל:

  1. קבוצה לא ריקה $latex D^{\mathcal{M}}$ – זה "העולם" שממנו ילקחו הערכים שהמשתנים יכולים לקבל.
  2. לכל סימן קבוע $latex c$ במילון, איבר $latex c^{\mathcal{M}}\in D^{\mathcal{M}}$ – הפרשנות ש-$latex c$ מקבל במודל $latex \mathcal{M}$.
  3. לכל סימן יחס $latex R$ במילון על $latex n$ מקומות, יחס $latex R^{\mathcal{M}}\subseteq\left(D^{\mathcal{M}}\right)^{n}$.
  4. לכל סימן פונקציה $latex f$ במילון על $latex n$ מקומות, פונקציה $latex f^{\mathcal{M}}:\left(D^{\mathcal{M}}\right)^{n}\to D^{\mathcal{M}}$.

ושוב, אדגיש את ההבדל שיש פה בין הסמנטיקה והתחביר. $latex c,R,f$ הם סימנים – אותיות ותו לא, חסרי פשר לכשעצמם ונתונים לפרשנויות רבות; לעומת זאת, $latex c^{\mathcal{M}}$ הוא איבר של קבוצה, ו-$latex R^{\mathcal{M}}$ הוא יחס על קבוצה ו-$latex f^{\mathcal{M}}$ היא פונקציה על קבוצה. יש להם משמעות עמוקה יותר מאשר אוסף פיקסלים.

בואו נחזור אל תורת החבורות שלנו וניתן דוגמאות לשני מבנים אפשריים עבורה. מבנה אחד הוא זה: $latex \mathcal{M}=\left(\mathbb{Z},0,+\right)$. כלומר, $latex D^{\mathcal{M}}=\mathbb{Z}$ – המספרים השלמים; $latex e^{\mathcal{M}}=0$ – כלומר, הפרשנות שלנו לסימן הקבוע $latex e$ הוא המספר $latex 0\in\mathbb{Z}$, ו-$latex \cdot^{\mathcal{M}}=+$, כלומר הפרשנות שלנו לסימן הפונקציה $latex \cdot$ הוא פעולת החיבור.

מבנה אחר לגמרי הוא זה שבו $latex D^{\mathcal{M}}=\mbox{GL}_{n}\left(\mathbb{C}\right)$ – אוסף המטריצות מסדר $latex n\times n$ מעל המרוכבים שהדטרמיננטה שלהן שונה מאפס. במבנה הזה $latex \cdot$ הוא הפעולה של כפל מטריצות, ו-$latex e$ היא מטריצת היחידה (המטריצה שכולה אפסים פרט לאלכסון הראשי שכולו 1). אם אתם לא מכירים את הדוגמה הזו, לא נורא; זה לא קריטי להמשך.

עכשיו, אחרי שהגדרנו מבנה, אפשר להגדיר גם השמה – זו פשוט פונקציה $latex s:\left\{ x_{1},x_{2},x_{3},\dots\right\} \to D^{\mathcal{M}}$ שמתאימה לכל משתנה $latex x$ איבר כלשהו מתוך $latex D^{\mathcal{M}}$. ברגע שבו הגדרנו השמה $latex s$, ערך האמת של כל נוסחה נקבע, באופן הבא:

  1. ראשית, אפשר לחשב לכל שם עצם את האיבר שהוא מתאים לו.
  2. שנית, לכל נוסחה אטומית אפשר לחשב אם ערכה הוא $latex \mbox{T}$ או $latex \mbox{F}$.
  3. כעת קל לחשב מתוך ערכי ה-$latex \mbox{T}$ וה-$latex \mbox{F}$ הללו ערך אמת לכל הנוסחה כמו בתחשיב הפסוקים.
  4. …למעט במקרה שבו יש לנו כמתים, ואז יש לנו רמה נוספת של סיבוך.

בואו נעבור על זה שלב שלב. ראשית, מרגע שהגדרנו את $latex s$ על המשתנים, אפשר להגדיר פונקציה $latex \overline{s}$ שהיא הרחבה של $latex s$ על כל שמות העצם, באופן הבא: $latex \overline{s}\left(x\right)=s\left(x\right)$ לכל משתנה; $latex \overline{s}\left(c\right)=c^{\mathcal{M}}$ לכל סימן קבוע $latex c$; ו-$latex \overline{s}\left(f\left(t_{1},\dots,t_{n}\right)\right)=f^{\mathcal{M}}\left(\overline{s}\left(t_{1}\right),\dots,\overline{s}\left(t_{n}\right)\right)$ לכל סימן פונקציה $latex f$.

כאן כדאי לעצור ולוודא שמבינים את הגדרה למעלה. למשל, באגף שמאל של השוויון האחרון יש לנו את הפונקציה $latex \overline{s}$ שמופעלת על שם עצם יחיד – $latex f\left(t_{1},\dots,t_{n}\right)$. האופן שבו היא פועלת הוא קודם כל לחשב, באופן רקורסיבי, מה ההשמה המורחבת נותנת לכל אחד משמות העצם $latex t_{1},\dots,t_{n}$ שהם הרכיבים של שם העצם הזה; לאחר מכן היא לוקחת את הפונקציה $latex f^{\mathcal{M}}$ – הפרשנות של סימן הפונקציה $latex f$ במבנה $latex \mathcal{M}$ – ומפעילה אותה על הערכים שהיא כבר חישבה. התוצאה היא איבר ב-$latex D^{\mathcal{M}}$, וזה הערך ש-$latex \overline{s}$ נותנת לשם העצם.

למשל, נתבונן בשם העצם $latex \left(x\cdot y\right)\cdot e$ שמנוסחת בשפה של תורת החבורות. נניח שהמודל שלנו הוא $latex \mathcal{M}=\left(\mathbb{Z},0,+\right)$ שכבר הזכרתי; מה יהיה $latex \overline{s}\left(\left(x\cdot y\right)\cdot e\right)$? מההגדרה שלי ניתן לראות שהוא יהיה $latex s\left(x\right)+s\left(y\right)+0$, ולכן אם למשל $latex s\left(x\right)=2$ ו-$latex s\left(y\right)=3$ נקבל $latex \overline{s}\left(\left(x\cdot y\right)\cdot e\right)=5$.

השלב הבא הוא לטפל בנוסחאות האטומיות. נוסחה אטומית כללית נראית כך: $latex R\left(t_{1},\dots,t_{n}\right)$ כאשר $latex R$ הוא סימן יחס כלשהו. לנוסחה הזו ניתן ערך $latex \mbox{T}$ אם מתקיים $latex R^{\mathcal{M}}\left(\overline{s}\left(t_{1}\right),\dots,\overline{s}\left(t_{n}\right)\right)$, כלומר אם ביחס $latex R^{\mathcal{M}}$, שהוא הפרשנות של סימן היחס $latex R$ במבנה $latex \mathcal{M}$, האיברים $latex \overline{s}\left(t_{1}\right),\dots,\overline{s}\left(t_{n}\right)$ של $latex D^{\mathcal{M}}$ אכן נמצאים זה עם זה. שימו לב שזה תלוי הן בערך ש-$latex \overline{s}$ מעניקה לשמות העצם, והן בפרשנות של $latex R$ ב-$latex \mathcal{M}$. היוצא מן הכלל היחיד הוא יחס השוויון, שבו אין "פרשנות" – הוא תמיד מייצג שוויון, כלומר $latex t_{1}=t_{2}$ מקבל ערך $latex \mbox{T}$ אם ורק אם $latex \overline{s}\left(t_{1}\right)=\overline{s}\left(t_{2}\right)$. כאמור, הדרישה הזו מגבילה אותנו במובן מסויים אבל זה לא קריטי כרגע.

כיצד מחשבים ערך אמת כעת עבור פסוקים שבנוים מקשרים אני מקווה שאתם כבר יודעים. למשל, $latex \varphi\wedge\psi$ מקבל $latex \mbox{T}$ רק אם שני רכיביו קיבלו $latex \mbox{T}$ וכדומה.

הסימון הפורמלי לכל זה הוא הסימון הבא: $latex \mathcal{M}\models_{s}\varphi$ פירושו "בפרשנות של השפה שנותן המבנה $latex \mathcal{M}$, ובהשמה $latex s$, הפסוק $latex \varphi$ מקבל ערך $latex \mbox{T}$". הסימון הזה הכרחי כדי שיהיה נוח להסביר איך נותנים ערכי אמת עבור פסוקים שמכילים כמתים; לפני כן אצטרך להציג עוד סימון. נניח ש-$latex x$ הוא משתנה כלשהו ו-$latex a\in D^{\mathcal{M}}$ איבר כלשהו במבנה, וש-$latex s$ היא השמה למשתנים. אז אפשר להגדיר השמה אחרת, שאסמן $latex s\left[x\leftarrow a\right]$, שהיא זהה ל-$latex s$ על כל משתנה אפשרי פרט ל-$latex x$, ועל המשתנה הזה היא מחזירה $latex a$.

כעת: $latex \mathcal{M}\models_{s}\forall x\left(\varphi\right)$ אם לכל $latex a\in D^{\mathcal{M}}$ מתקיים $latex \mathcal{M}\models_{s\left[x\leftarrow a\right]}\varphi$; ו-$latex \mathcal{M}\models_{s}\exists x\left(\varphi\right)$ אם קיים $latex a\in D^{\mathcal{M}}$ כך ש-$latex \mathcal{M}\models_{s\left[x\leftarrow a\right]}\varphi$. זו ההגדרה הכי קשה כאן; עצרו ונסו לוודא שאתם מבינים מה הולך פה. שימו לב לכך שחישוב ערך האמת של $latex \forall x\left(\varphi\right)$ ו-$latex \exists x\left(\varphi\right)$ תחת ההשמה $latex s$ בעצם מתעלם מהערך ש-$latex s$ נותנת ל-$latex x$; תחת זאת הוא משחק עם כל ערך אפשרי ורואה מה קורה. זה לא אומר ש-$latex s$ לא חשובה; רק שהערך הספציפי שהיא נותנת ל-$latex x$ לא רלוונטי.

עם ההגדרה הזו, סיימנו; אנחנו מבינים איך בהינתן מודל והשמה נותנים ערך אמת לכל הנוסחאות. עם זאת, לרוב הנוסחאות שיעניינו אותנו הן נוסחאות שאפשר לדעת מה יהיה ערך האמת שלהן ישר מתוך $latex \mathcal{M}$, בלי שהוא יהיה תלוי בהשמה זו או אחרת. לצורך כך אני נזקק להגדרה אחת אחרונה: משתנה בנוסחה כלשהי הוא קשור אם הוא מופיע בטווח של כמת שמתאים לו. למשל, $latex \forall x\left(x=y\right)$ היא דוגמה לנוסחה שבה המשתנה $latex x$ הוא קשור (כי הוא נופל בתוך הטווח של הכמת $latex \forall x$ – בתוך הסוגריים שמייד אחריו). לעומת זאת $latex y$ אינו קשור; למשתנה שכזה קוראים חופשי.

נוסחה שאין בה משתנים חופשיים בכלל נקראת פסוק. אם אין משתנים חופשיים בכלל, זה אומר שכל משתנה נמצא תמיד בטווח של כמת כלשהו, ולכן, אם תחשבו על זה רגע, ערך האמת של הפסוק לא יכול להיות תלוי באף השמה ספציפית כלשהי! זה בגלל שחישוב ערך האמת של הפסוק מתוך השמה תמיד יכלול את השלב שבו "זורקים לפח" את הערך שההשמה נתנה למשתנה, ובמקום זה מנסים את כל הערכים האפשריים. כן, זה מבלבל למדי; כשמוכיחים את זה פורמלית הראש כואב טיפה פחות.

זה מוביל אותנו להגדרה המרכזית בכל העניין הזה: אם $latex \varphi$ הוא פסוק ו-$latex \mathcal{M}$ הוא מבנה שמתאים לשפה, אז מסמנים $latex \mathcal{M}\models\varphi$ אם $latex \mathcal{M}\models_{s}\varphi$ עבור השמה $latex s$ כלשהי (אם זה קורה להשמה כלשהי, זה קורה לכל ההשמות). במקרה הזה אומרים ש-$latex \mathcal{M}$ היא מודל של $latex \varphi$. מכאן קצרה הדרך לאוסף של נוסחאות: $latex \mathcal{M}\models\Phi$ אם היא מודל של כל נוסחה ב-$latex \Phi$. זה גם בדיוק מה שהלך בתחשיב הפסוקים, רק ששם "מודל" היה פשוט השמה, וכאן מודל הוא עולם ומלואו, תרתי משמע.

כעת, שימו לב לכך שהמבנה $latex \mathcal{M}=\left(\mathbb{Z},0,+\right)$ הוא מודל של תורת החבורות, כלומר של קבוצת שלושת הפסוקים שקראתי לה "תורת החבורות". לעומת זאת, $latex \mathcal{M}=\left(\mathbb{Z},1,+\right)$ הוא אמנם מבנה חוקי למהדרין, אבל הוא איננו מודל של תורת החבורות שכן הוא לא מספק את הפסוק $latex \forall x\left(x\cdot e=e\cdot x=x\right)$ (בדקו זאת!). זה מתאים לידע שלנו, לפיו $latex \left(\mathbb{Z},1,+\right)$ אינה חבורה. למעשה, די ברור שהמודלים של "תורת החבורות" שלנו הם בדיוק המבנים שאנחנו קוראים להם "חבורות"!

הפורמליזציה הושלמה, סוף כל סוף. כעת יש לנו נתיב ישיר בין סדרות של סימבולים ובין חלקים נכבדים ביותר של המתמטיקה. בפוסטים הבאים על לוגיקה נוכל להראות את הדברים הכיפיים הבסיסיים שנובעים מכך.

15 תגובות על הפוסט “לוגיקה מסדר ראשון

  1. Begriffsschrift זה כתב מושגים. הספר תורגם לעברית על ידי גלעד ברעלי ויצא לאור בהוצאת שלם ב-2008. התרומה שלו ליסודות הלוגיקה היא מכרעת.

  2. רק דבר קטן – בסוף הפסקה השלישית, רשמת "אני לא חושב שזה לא מקרה ש…|

  3. שלום גדי,
    אני מסיים שנה א מתמטיקה עכשיו ואני מעוניין להרחיב קצת בלוגיקה מעבר לשיעור וחצי בתורת הקבוצות.
    יש לך ספר לימוד שאתה ממליץ עליו?

    דרך אגב, בלוג מצויין!

  4. יש הרבה ספרים, ולצערי אף אחד מאלו שאני מכיר לא ממש מומלץ כי לכל אחד החולשות שלו, ובכל זאת הנה שלושה:

    http://www.amazon.com/Introduction-Mathematical-Logic-Fourth-Edition/dp/0412808307
    http://www.amazon.com/Mathematical-Introduction-Logic-Second-Edition/dp/0122384520
    http://www.amazon.com/Mathematical-Logic-Undergraduate-Texts-Mathematics/dp/0387942580

    כולם מכסים את החומר הבסיסי, כל אחד בסגנון שלו. מנדלסון הוא כנראה יבש מדי עבור רוב הקוראים, ואני אישית מחבב הרבה יותר את שני האחרים, אבל זה נחשב לספר "קלאסי". מבין שני האחרים ייתכן שהספר השני (עם הסמיילי) קצת יותר מתאים לקורא עם נסיון, אבל ייתכן שזו אשליה אופטית שלי.

    יש עוד הרבה ספרים. אם אתה מנסה את אלו ולא סובל אף אחד מהם, אל תתייאש.

  5. מדוע התייחסת לאקסיומות של תורת החבורות בצורה שהצגת אותן כ " לא תקינים מבחינה תחבירית" ? איפה הפגם ? בתור בוגר מתמטיקה לא מצאתי שום פגם , חוץ מסימן ה"וגם" באסיומות 2 ו 3 ואולי גם מהסימון של סימני הפונקציות שהוא לא prenex. אנא החכם אותי.

  6. למשל, לכתוב a=b=c לא תקין תחבירית; צריך לכתוב a=b "וגם" a=c. אבל אלו זוטות. אפשר להמיר את הפסוק הזה בקלות בפסוק שכן תקין תחבירית ובעל אותה המשמעות.

  7. למה הכוונה לכל סימן יחס במילון על n מקומות? האם n זה מספר הפעמים שמופיע סימן היחס? בסעיף 3 בהגדרת המבנה

  8. סליחה על התשובה המאוחרת. "סימן יחס על n מקומות", על קבוצה A, פירושו תת-קבוצה של המכפלה הקרטזית של A עם עצמה n פעמים. כלומר, זה גודל ה-n-יות ששייכות ליחס.

    למשל, שוויון הוא יחס דו-מקומי, כי שוויון הוא בין שני איברים (תמיד אומרים a=b). דוגמה ליחס תלת מקומי: הנקודות במישור a,b,c נמצאות ביחס אם ורק אם שלושתן נמצאות על ישר אחד (זה מעניין רק עבור שלשות של נקודות, כי כל זוג של נקודות נמצא תמיד על ישר כלשהו).

  9. פינגבאק: הבעיה העשירית של הילברט – פונקציות דיופנטיות וחיות אחרות (רקורסי

  10. פינגבאק: מערכת הוכחה ללוגיקה מסדר ראשון | לא מדויק

  11. פינגבאק: מכסחי הכמתים | לא מדויק

  12. פינגבאק: על על-מסננים ועל-מכפלות | לא מדויק

  13. "אני לא חושב שזה לא מקרה שספר המדע הפופולרי היחיד שקראתי ולדעתי עושה צדק ללוגיקה – "גדל, אשר, באך" – מלכלך את הידיים שלו בפרטים טכניים כבר מההתחלה."

    נדמה לי שלא התכוונת לשלילה כפולה

  14. היי גדי, שאלה קטנה:
    כשאתה כותב, בדוגמא של תורת החבורות, ((x⋅y)⋅z=x⋅(y⋅z)), למה בעצם המשפט הזה הוא בכלל משפט תקין? הכוונה שלי היא שדברים כמו הפונקציה ⋅ והיחס = הם דברים שנכון לכתוב אותם בין קבועים/ משתנים כמו x,y,z, אבל אני לא מבין למה נכון לכתוב (x⋅(y⋅z, למשל. הכוונה היא למה בכלל זה נכון תחבירית לכתוב את הסימן ⋅ אחרי (y⋅z), שאיננו קבוע/ משתנה אלא פונקציה שמופעלת על 2 משתנים. אם נקח דוגמא אחרת – זה לא בעל משמעות לכתוב x∈(y∈z) zzzz, נכון? אשמח להבהרת הנקודה הזו.

כתיבת תגובה

האימייל לא יוצג באתר.