Skip to main content
Mathematics LibreTexts

Hebrew Math

  • Page ID
    141568
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    הקדמה

    בפרק הזה נלמד לחפש נקודות מינימום/מקסימום של פונקציה סקלרית שמוגדרת בתחום מסוים. נפריד בין נקודות מינימום/מקסימום מקומי כלומר ערך שפונקציה מקבלת בהן הגדול הקטן או הגדול ביותר בסביבה מסוימת שלהן, לבין נקודות מינימום/מקסימום מוחלט, כלומר נקודות בהן ערך הפונקציה הקטן ביותר או הגדול ביותר בתחום כולו. נזכר איך מחפשים מינימום/מקסימום מקומי ומוחלט של פונקציה סקלרית במשתנה אחד \(y=f(x),x\in[a,b]\). ע"י פתרון המשוואה \(f'(x)=0,x\in[a,b]\) מוצאים נקודות "חשודות" בקיצון (נקודות מינימום/מקסימום מקומי) ומוצאים גם נקודות בקטע \([a,b]\) שבהן הנגזרת \(f'(x)\) לא קיימת. מתקבלת רשימת נקודות \(\left\{{x_1,x_2,\ldots,x_k}\right\}\). הבדיקה האם כל נקודה \(x_i\) מתוך רשימה הנ"ל אכן נקודת קיצון נעשית ע"י סימן של הנגזרת \(f'(x)\) מצד שמאלי וימיני של נקודה \(x_i\) במידה וקיימת נגזרת בסביבה מסוימת של הנקודה הזאת. דרך אחרת לבצע את הבדיקה היא לראות סימן של נגזרת שניה בנקודה הנבדקת. אם נגזרת ראשונה לא קיימת בנקודה הנבדקת אז בדיקה האם היא אכן נקודת קיצון נעשית לפי הגדרה עצמה של מינימום/מקסימום.
    כאשר מחפשים מינימום/מקסימום מוחלט של \(f(x)\) בקטע \([a,b]\) לא מתעסקים בחישובים עם נגזרות אחרי שנקודות חשודות בקיצון נמצאו אלא מחשבים ערכים של הפונקציה בכל הנקודות \(x_1,x_2,\ldots,x_k\) וגם ערכים של הפונקציה בקצוות \(f(a),f(b)\). מתוך הערכים האלה בוחרים ערך הקטן ביותר והוא מינימום מוחלט וערך הגדול ביותר והוא מקסימום מוחלט.

    דיון בנקודות מינימום/מקסימום מקומי ומוחלט של פונקציה סקלרית במספר משתנים נעשה לפי אותה תבנית. ההגדרות עצמן של נקודות מינימום/מקסימום אינן משתנות. הבדיקות נעשות מסובכות יותר אבל לפי אותו היגיון.

    מינימום/מקסימום מקומי

    הגדרה

    תהי \(f(x,y,\ldots)\) פונקציה סקלרית במספר משתנים. נקודה \(P\left({x_0,y_0,\ldots}\right)\) נקראת

    1. נקודת מינימום מקומי של הפונקציה הנתונה אם לכל \((x,y,\ldots)\neq P\) בסביבה מסוימת של נקודה \(P\) מתקיים אי-שוויון \(f(P)<f(x,y,\ldots)\).

    2. נקודת מקסימום מקומי של הפונקציה הנתונה אם לכל \((x,y,\ldots)\neq P\) בסביבה מסוימת של נקודה \(P\) מתקיים אי-שוויון \(f(P)>f(x,y,\ldots)\).

    בתור סביבה של נקודה \(P\) אני מתכוון כדור פתוח \(\left({x-x_0}\right)^2+\left({y-y_0}\right)^2+\ldots <\varepsilon^2\).
    כתבתי הגדרה שנקראת הגדרה חריפה של מינימום/מקסימום מקומי. משתמשים גם בגרסה לא חריפה כאשר כותבים אי-שוויון \(f(P)\leq f(x,y,\ldots)\). אז לא דורשים ש- \((x,y,\ldots)\neq P\).

    נמשיך לקרוא את נקודות מינימום/מקסימום מקומי בשם נקודות קיצון. נהוג גם שם אחר והוא נקודות אקסטרמום. אני לא אשתמש בו.

    דוגמאות

    1. נתונה הפונקציה \(f(x,y)=1-x^2-y^2\). הנקודה \(P(0,0)\) היא נקודת מקסימום מקומי של הפונקציה הנתונה כי לכל \((x,y)\neq P\) מתקיים אי-שוויון \(f(P)=1>f(x,y)=1-x^2-y^2\) ובפרט בכל סביבה של נקודה \(P\). דרך אגב, נקודה \(P\) היא גם נקודת מקסימום מוחלט של הפונקציה הנתונה במישור כולו כי \(f(P)>f(x,y)\) לכל \((x,y)\neq P\).

    תנאי הכרחי של נקודות קיצון

    נניח שנקודה \(P\left({x_0,y_0,\ldots}\right)\) היא נקודת קיצון של פונקציה סקלרית \(f(x,y,\ldots)\) ונניח שקיימות הנגזרות החלקיות \(f_x(P),f_y(P),\ldots\). נרכיב פונקציה סקלרית \(g(x)\) במשתנה אחד והוא \(x\) כך \[g(x)=f\left({x,y_0,z_0,\ldots}\right)\] משום ש- \(P\) נקודת קיצון של הפונקציה \(f(x,y,\ldots)\) הנקודה \(x=x_0\) היא נקודת קיצון של הפונקציה \(g(x)\). לכן, אם קיימת נגזרת \(g'\left({x_0}\right)\) אז היא שווה אפס. אבל הנגזרת הזאת שווה לנגזרת \(f_x(P)\) והיא כן קיימת לפי הנחה שלנו. אז מתקבלת מסקנה ש- \(f_x(P)=0\). באופן דומה מגיעים למסקנה שגם \(f_y(P)=0,f_z(P)=0,\ldots\). נרכיב מנגזרות האלה גרדיאנט \(\vec\nabla f(P)\). אז ניתן לנסח טענה שנקראת תנאי הכרחי של נקודות קיצון.

    אם \(P\) נקודת קיצון של הפונקציה \(f(x,y,\ldots)\) וקיים הגרדיאנט \(\vec\nabla f(P)\) אז \(\vec\nabla f(P)=\vec 0\).

    ממשפט הזה נובע שאם קיים הגרדיאנט \(\vec\nabla f(P)\) והוא שונה מווקטור אפס אז נקודה \(P\) היא לא נקודת קיצון של הפונקציה \(f\).

    דוגמאות

    1. נתונה הפונקציה \(f(x,y)=x^2-2x+y^2\). נחשב נגזרות חלקיות שלה \(f_x=2x-2,f_y=2y\). הן קיימות לכל \((x,y)\). נמצא נקודות בהן \(\vec\nabla f=\vec 0\). \[\begin{cases} 2x-2=0\\ 2y=0 \end{cases}\implies x=1,y=0\] מסקנה היא שאם לפונקציה הנתונה יש נקודת קיצון אז היא חייבת להיות בנקודה \((1,0)\) בלבד. כרגע אין לנו שום דרך לבדוק האם הנקודה הזאת אכן היא נקודת קיצון פרט להגדרה. אז נשתמש בהגדרה. לשם כך נכתוב נוסחה של הפונקציה הנתונה כך. \[f(x,y)=x^2-2x+y^2=(x-1)^2+y^2-1\] נחשב \(f(1,0)=-1\) ונשים לב שלכל \((x,y)\neq (1,0)\) מתקיים \[f(1,0)=-1<f(x,y)=(x-1)^2+y^2-1\] לכן הנקודה \((1,0)\) אכן נקודת מינימום מקומי של הפונקציה הנתונה (היא גם נקודת מינימום מוחלט).

    2. נתונה הפונקציה \(f(x,y)=\sqrt{x^2+y^2}\). נחשב נגזרות חלקיות \[f_x=\frac{x}{\sqrt{x^2+y^2}}\,,\;f_y=\frac{y}{\sqrt{x^2+y^2}}\] הו קיימות לכל \((x,y)\neq(0,0)\). נחפש נקודות בהן \(\vec\nabla f=\vec 0\). \[\begin{cases} \frac{x}{\sqrt{x^2+y^2}}=0\\ \frac{y}{\sqrt{x^2+y^2}}=0 \end{cases}\] למערכת הזאת אין פתרון. אז מסקנה היא שאם לפונקציה הנתונה יש נקודת קיצון היא חייבת להיות בנקודה \((0,0)\) בלבד. נפנה להגדרה על מנת לבדוק האם הנקודה הזאת היא נקודת קיצון. \[f(0,0)=0<f(x,y)=\sqrt{x^2+y^2}\] לכל \((x,y)\neq(0,0)\). לכן הנקודה \((0,0)\) כן נקודת מינימום מקומי (וגם מוחלט) של הפונקציה הנתונה.

    3. \(f(x,y)=x^2-y^2\). נחשב נגזרות חלקיות \(f_x=2x,f_y=-2y\). הן קיימות לכל \((x,y)\). נחפש נקודות בהן \(\vec\nabla f=\vec 0\). \[\begin{cases} 2x=0\\ -2y=0 \end{cases}\implies x=0,y=0\] המסקנה היא שאם לפונקציה הנתונה יש נקודת קיצון היא חייבת להיות בנקודה \((0,0)\). נפנה להגדרה לשם בדיקה. בכל סביבה של נקודה הזאת מתקיים \[f(x,0)=x^2>0,\; f(0,y)=-y^2<0\] לכל \(x\neq 0,y\neq 0\). כמו כן, \(f(0,0)=0\). לכן, לפי הגדרה של נקודות קיצון הנקודה \((0,0)\) לא נקודת קיצון. בקישור הזה ניתן לראות שרטוט של גרף הפונקציה הנתונה. הוא דומה לעוקף. לכן הנקודה \(P\) בה \(\vec\nabla f(P)=\vec 0\) אבל נקודה עצמה היא לא נקודת קיצון נקראת נקודת עוקף של הפונקציה \(f\).

    תנאי מספיק של נקודות קיצון

    נדון רק בפונקציה סקלרית בשני משתנים \(z=f(x,y)\). בהינתן נקודה \(P\left({x_0,y_0}\right)\) בה מתקיים \(\vec\nabla f(P)=\vec 0\) נלמד איך לבדוק ללא שימוש בהגדרה האם הנקודה הזאת אכן נקודת קיצון של הפונקציה הנתונה וגם איך לקבוע האם בנקודה הזאת הפונקציה מקבלת ערך מינימלי או ערך מקסימלי מקומי. הנקודה בה מתקיים השוויון \(\vec\nabla F(P)=\vec 0\) נקראת נקודה קריטית של פונקציה \(f\). בחדו"א 1 קראנו אותה בשם "נקודה חשודה". אין שום בעיה גם בחדו"א 2 להשתמש בשם הזה. נכתוב נוסחת טיילור עבור הפונקציה הנתונה בנקודה \(P\). \[\begin{gathered} f(x,y)-f(P)=f_x(P)\Delta x+f_y(P)\Delta y + \frac{1}{2!}\left({f_{xx}(Q)(\Delta x)^2+ 2f_{xy}(Q)\Delta x\Delta y+f_{yy}(Q)(\Delta y)^2}\right)\\ \Delta x=x-x_0,\; \Delta y=y-y_0\end{gathered}\] כאשר \(Q\) נקודה בסביבה מסוימת של נקודה \(P\). אנחנו מניחים פה שנגזרות חלקיות מסדר שני של הפונקציה הנתונה רציפות בנקודה \(P\). משום ש- \(\vec\nabla f(P)=\vec 0\) החלק הלינארי בנוסחת טיילור מתאפס. לכן מקבלים ש- \[f(x,y)-f(P)=\frac{1}{2!}\left({f_{xx}(Q)(\Delta x)^2+ 2f_{xy}(Q)\Delta x\Delta y+f_{yy}(Q)(\Delta y)^2}\right)\] אמרנו שנגזרות חלקיות מסדר שני הן פונקציות רציפות בנקודה \(P\). לכן \[\begin{gathered} f_{xx}(Q)=f_{xx}(P)+\alpha,\; f_{xy}(Q)=f_{xy}(P)+\beta,\; f_{yy}(Q)=f_{yy}(P)+\gamma\\ \lim_{\Delta x,\Delta y \to 0}\alpha,\beta,\gamma =0\end{gathered}\] לכן \[\begin{gathered} f(x,y)-f(P)=\frac{1}{2!}\left({f_{xx}(P)(\Delta x)^2+ 2f_{xy}(P)\Delta x\Delta y+f_{yy}(P)(\Delta y)^2}\right)+\\ \frac{1}{2!}\left({\alpha(\Delta x)^2+2\beta\Delta x\Delta y+\gamma(\Delta y)^2}\right) \end{gathered}\] נסמן \[A=f_{xx}(P),\;B=f_{xy}(P),\;C=f_{yy}(P)\] אז \[f(x,y)-f(P)=\frac{1}{2!}\underbrace{\left({A(\Delta x)^2+2B\Delta x\Delta y+C(\Delta y)^2}\right)}_{M}+ \frac{1}{2!}\underbrace{\left({\alpha(\Delta x)^2+2\beta\Delta x\Delta y+\gamma(\Delta y)^2}\right)}_{N}\] יש הבדל מהותי בין החלק בנוסחה הנ"ל שסימנתי ב- \(M\) לבין חלק שסימנתי ב- \(N\). המקדמים \(A,B,C\) בחלק \(M\) הם מספרים קבועים. לעומת זאת, המקדמים \(\alpha,\beta,\gamma\) בחלק \(N\) שואפים לאפס כאשר \(\Delta x,\Delta y\) שואפים לאפס. לכן קיימים \(\Delta x,\Delta y\) מספיק קטנים כך שסימן ההפרש \(f(x,y)-f(P)\) נקבע לפי סימן של חלק \(M\). זאת נקודה עדינה שדורשת הסבר פורמלי מדויק והוא כתוב בנספח א’ לפרק הזה. פה אנחנו נמשיך לעקוב אחרי הרעיון והוא שקיום \(\Delta x,\Delta y\) מספיק קטנים בו סימן ההפרש \(f(x,y)-f(P)\) חופף לסימן של תבנית \(M\). לכן, אם סימן של תבנית \(M\) חיובי אז הנקודה \(P\) היא נקודת מינימום מקומי ואם הסימן הנ"ל שלילי אז הנקודה \(P\) היא נקודת מקסימום מקומי. כמו כן, אם עבור \(\Delta x.\Delta y\) מסוימים סימן של תבנית \(M\) חיובי ועבור \(\Delta x.\Delta y\) אחרים סימן של תבנית \(M\) שלילית אז הנקודה \(P\) לא נקודת קיצון. הגיע זמן לראות דוגמה.

    דוגמה

    נתונה הפונקציה \(f(x,y)=-x^4+2x^2-y^2\). נחשב נגזרות חלקיות \(f_x=-4x^3+4x,f_y=-2y\). הן קיימות לכל \((x,y)\). לפי תנאי הכרחי של נקודות קיצון \[\begin{gathered} \vec\nabla f=\vec 0 \implies \begin{cases} -4x^3+4x=0\\ -2y=0 \end{cases}\implies \begin{cases} x=0,-1,1\\ y=0 \end{cases}\end{gathered}\] קיבלנו שלוש נקודות קריטיות \((0,0),(1,0),(-1,0)\). נעבור לבדיקה האם כל אחת מנקודות האלה אכן נקודת קיצון לפי תנאי מספיק. לשם כך נחשב נגזרות חלקיות מסדר שני \[f_{xx}=-12x^2+4,\; f_{xy}=0,\; f_{yy}=-2\] עבור נקודה \((0,0)\) מקבלים \[A=f_{xx}(0,0)=4,\;B=f_{xy}(0,0)=0,\;C=f_{yy}(0,0)=-2\] אז מתקבלת תבנית \[M=4(\Delta x)^2-2(\Delta y)^2\] אם \(\Delta x\neq 0,\Delta y=0\) אז \(M>0\) ואם \(\Delta x=0,\Delta y\neq 0\) אז \(M<0\). זה אומר שבכל סביבה של נקודה \((0,0)\) יש נקודות \((x,y)\) בהן ההפרש \(f(x,y)-f(0,0)>0\) ויש נקודות בהן \(f(x,y)-f(0,0)<0\). לכן הנקודה \((0,0)\) אינה נקודת קיצון.

    עבור נקודה \((1,0)\) מקבלים \[A=f_{xx}(1,0)=-8,\;B=f_{xy}(1,0)=0,\;C=f_{yy}(1,0)=-2\] אז תבנית \(M=-8(\Delta x^2)-2(\Delta y)^2\) והיא שלילית לכל \(\Delta x,\Delta y\neq 0\). לכן ההפרש \(f(x,y)-f(0,0)<0\) לכל \((x,y)\) וזה אומר שהנקודה \((1,0)\) היא נקודת מקסימום מקומי (גם מוחלט) של הפונקציה הנתונה.

    עבור נקודה \((-1,0)\) מקבלים \[A=f_{xx}(-1,0)=-8,\;B=f_{xy}(-1,0)=0,\;C=f_{yy}(-1,0)=-2\] אז תבנית \(M=-8(\Delta x^2)-2(\Delta y)^2\) והיא שלילית לכל \(\Delta x,\Delta y\neq 0\). לכן ההפרש \(f(x,y)-f(0,0)<0\) לכל \((x,y)\) וזה אומר שהנקודה \((1,0)\) היא נקודת מקסימום מקומי (גם מוחלט) של הפונקציה הנתונה. אז לפונקציה הנתונה יש שתי נקודות מקסימום מקומי ואין שום נקודת מינימום מקומי. בקישור הזה ניתן לראות שרטוט הגרף. מעניין לציין שעבור פונקציה סקלרית במשתנה אחד המצב בו לפונקציה רציפה יש שתי נקודות מקסימום מקומי ואין אף נקודה של מינימום מקומי לא יתכן.


    אנחנו רואים שלב השיטה הוא לקבוע סימן של תבנית \[M=A(\Delta x)^2+2B\Delta x\Delta y+C(\Delta y)^2\] היא נקראת תבנית ריבועית לפי משתנים \(\Delta x,\Delta y\). שמות המשתנים לא חשובים ולכן, על מנת לקצר בכתיבה נסמן \(s=\Delta x,t=\Delta y\) ונדבר עת תבנית ריבועית \(M=As^2+2Bst+Ct^2\). קל לקבוע סימן שלה לפי השלמה שלה לסכום/הפרש של ריבועים. נראה איך זה עובד בדוגמה.

    דוגמה

    1. \[\begin{gathered} M=s^2+3st+t^2=(s+1.5t)^2-2.25t^2+t^2=(s+1.5t)^2-1.25t^2 \end{gathered}\] אם \(t=0,s+1.5t\neq 0\) מתקבל ש- \(M>0\) ואם \(s+1.5t=0,t\neq 0\) אז \(M<0\). לכן לתבנית הזאת אין סימן קבוע. היא נקראת תבנית ריבועית מעורבת.

    2. \[M=s^2+st+t^2=(s+0.5t)^2-0.25t^2+t^2=(s+0.5t)^2+0.75t^2\] לכל \((s,t)\neq(0,0)\) מתקבל ש- \(M\leq 0\). אם \(M=0\) אז \[\begin{cases} s+0.5t=0\\ t=0 \end{cases}\implies s=0,t=0\] לכן \(M>0\) לכל \((s,t)\neq (0,0)\). התבנית \(M\) הזאת נקראת חיובית.


    אז כל תבנית ריבועית ע"י השלמת לסכום/הפרש של שני ריבועים ניתן להביא למצב בו קל לקבוע האם היא חיובית, שלילית או מעורבת. אפשר גם לעשות את התהליך הזה באופן כללי, לרשום מסקנות ולהשתמש בן. זה מה שנעשה עכשיו. \[\begin{gathered} M=As^2+2Bst+Ct^2=A\cdot\left({s^2+2\frac{B}{A}st+\frac{C}{A}t^2}\right)=A\cdot\left({\left({s+\frac{B}{A}t}\right)^2-\frac{B^2}{A^2}t^2+\frac{C}{A}t^2}\right)=\\ A\cdot\left({\left({s+\frac{B}{A}t}\right)^2+\frac{AC-B^2}{A^2}t^2}\right)\end{gathered}\] הנחנו ש- \(A\neq 0\). בהמשך נתייחס למקרה \(A=0\). אם \(AC-B^2>0\) ו- \(A>0\) אז \(M\geq 0\). אם \(AC-B^2>0\) ו- \(A<0\) אז \(M\leq 0\).

    אם \(M=0,AC-B^2>0\) אז מתקבל ש- \[\begin{cases} s+\frac{B}{A}t=0\\ t=0 \end{cases}\implies s=0,t=0\] מתוך כל זה מתקבלת מסקנה הבאה.

    אם \(AC-B^2>0\) התבנית \(As^2+2Bst+Ct^2\) חיובית כאשר \(A>0\) ושלילית כאשר \(A<0\).

    אם \(AC-B^2<0\) אז עבור זוג \((s,t)\) שמקיים \(s+\frac{B}{A}t\neq 0,t=0\) מתקבל \(M>0\) ועבור זוג \((s,t)\) שמקיים \(s+\frac{B}{A}t=0,t\neq 0\) מתקבל \(M<0\) כאשר \(A>0\) וכאשר \(A<0\) סימנים של \(M\) יתהפכו. לכן מתקבלת מסקנה הבאה.

    אם \(AC-B^2<0\) התבנית \(As^2+2Bst+Ct^2\) מעורבת.

    נתייחס למקרה \(A=0\). אז מדובר על התבנית \(M=2Bst+Ct^2\) גם פה נעשה השלמה להפרש ריבועים \[\begin{gathered} Ct^2+2Bts=C\cdot\left({t^2+2\frac{B}{C}ts}\right)=C\cdot\left({\left({t+\frac{B}{C}s}\right)^2-\frac{B^2}{C^2}s^2}\right)\end{gathered}\] הנחנו פה ש- \(C\neq 0\). למקרה \(C=0\) נתייחס בהמשך. קיבלנו הפרש ריבועים לפי הסבר שכבר כתבנו קודם התבנית הזאת מעורבת.
    אם \(C=0\) אז מדובר על התבנית \(M=2Bst\) והיא מעורבת כי עבור \(s,t\) בעלי אותו סימן הסימן של \(M\) חופף לסימן של \(B\) ועבור \(s,t\) בעלי סימנים שונים הסימן של \(M\) נגדי לסימן של \(B\).

    נותר להתייחס למקרה \(AC-B^2=0\). אז מדובר על התבנית \(M=A\cdot\left({s+\frac{B}{A}t}\right)^2\). אם \(s+\frac{B}{A}t=0\) כאשר \((s,t)\neq(0,0)\) אז \(M=0\) ולכן במקרה הזה לא ניתן להסיק מסקנות לגבי הנקודה הנבדקת. בדוגמה הבאה נראה מה באמת יכול לקרות.

    דוגמה

    1. \(f(x,y)=x^4+y^4\). נחשב \[\begin{gathered} f_x=4x^3,\;f_y=4y^3,\;f_{xx}=12x^2,\;f_{xy}=0,\;f_{yy}=12y^2 \end{gathered}\] הנקודה \(P(0,0)\) היו נקודה קריטית כי \(\vec\nabla f(P)=\vec 0\). \[\begin{gathered} A=f_{xx}(P)=0,\; f_{xy}(P)=0,\;f_{yy}(P)=0\implies AC-B^2=0 \end{gathered}\] אז מה שנותר זה לבדוק האם נקודה \(P\) היא נקודת קיצון לפי הגדרה של נקודות קיצון. הבדיקה פשוטה והיא \[f(P)=0<f(x,y)=x^4+y^4\] לכל \((x,y)\neq 0,0\) ולכן נקודה \(P\) נקודת מינימום מקומי (גם מוחלט).

    2. \(f(fx,y)=x^4-y^4\).

      \[\begin{gathered} f_x=4x^3,\;f_y=-4y^3,\;f_{xx}=12x^2,\;f_{xy}=0,\;f_{yy}=-12y^2\end{gathered}\] הנקודה \(P(0,0)\) היו נקודה קריטית כי \(\vec\nabla f(P)=\vec 0\). \[\begin{gathered} A=f_{xx}(P)=0,\; f_{xy}(P)=0,\;f_{yy}(P)=0\implies AC-B^2=0\end{gathered}\] אז מה שנותר זה לבדוק האם נקודה \(P\) היא נקודת קיצון לפי הגדרה של נקודות קיצון. \[f(P)=0,\;f(x,0)=x^4>0,\;f(0,y)=-y^4<0\] עבור \((x,y)\neq (0,0)\). לכן \(P\) אינה נקודת קיצון.

    הערות אישיות

    לי נראה יותר נחמד לעשות בדיקה האם נקודה קריטית היא אכן נקודת קיצון ע"י השלמה של תבנית ריבועית לסכום/הפרש ריבועים מאשר להשתמש בקריטריון שמבוסס על סימן של \(AC-B^2\). המצב דומה לשיטת פתרון של משוואה ריבועית. אפשר לפתור אותה ע"י נוסחת השורשים ואפשר לפתור אותה ע"י השלמה לסכום/הפרש של ריבועים. לכל אחד טעם משלו :).

    מינימום/מקסימום מקומי תחת אילוץ

    הקדמה

    נדון בבעיה גאומטרית הבאה. עקום \(T\) מוגדר כאיחוד של שני מעגלים \[(x-2)^2+y^2=1,\; x^2+(y-3)^2=1\] באופו אלגברי ניתן לבטא את האיחוד הזה כקבוצת פתרונות של המשוואה \[\left({(x-2)^2+y^2-1}\right)\cdot\left({x^2+(y-3)^2-1}\right)=0\] לכל נקודה \((x,y)\) על העקום הזה יש מרחק מראשית הצירים והוא פונקציה \[f(x,y)=\sqrt{x^2+y^2}\] נחפש נקודות על העקום הנתון הקרובות ביותר והרחוקות ביותר לראשית הצירים. זה אומר שאנחנו רוצים למצוא נקודות מינימום/מקסימום מוחלט של \(f(x,y)\) שנמצאות על העקום הנתון. זה סוג חדש של בעיות מינימום/מקסימום. לא מדובר מינימום/מקסימום של \(f(x,y)\) לבד אלא בנקודות מינימום/מקסימום שלה שמקיימות את משוואת עקום \(C\). קל לפתור את הבעיה הזאת באופן גאומטרי. מספיק לצייר את המעגלים הנתונים. בקישור הזה ניתן לראות את השרטוט. מובן שנקודה \(A(1,0)\) קרובה ביותר לראשית הצירים ונקודה \(D(0,4)\) רחוקה ביותר מראשית הצירים. הנקודות האלה נקראות נקודות מינימום ומקסימום מוחלט של הפונקציה \(f(x,y)\) תחת אילוץ (או בתנאי) שמוגדר ע"י המשוואה \[\left({(x-2)^2+y^2-1}\right)\cdot\left({x^2+(y-3)^2-1}\right)=0\] נשים לב לשתי נקודות נוספות בשרטוט הנ"ל, נקודות \(B,C\). נקודה \(B\) לא הרחוקה ביותר מראשית הצירים על העקום הנתון אבל היא כן הרחוקה ביותר משאר הנקודות על העקום הנתון מראשית הצירים בסביבה מסוימת שלה. לכן היא נקראת נקודת מקסימום מקומי של הפונקציה \(f(x,y)\) תחת אילוץ הנתון. הנקודה \(C\) לא הקרובה ביותר לראשית הצירים על העקום הנתון אבל היא כן הקרובה ביותר משאר הנקודות על העקום הנתון מראשית הצירים בסביבה מסוימת שלה. לכן היא נקראת נקודת מינימום מקומי של הפונקציה \(f(x,y)\) תחת אילוץ הנתון. בשרטוט הזה ניתן לראות את הסביבות האלה וע"י לחצנים \(r_1,r_2\) לשנות את גודלן.

    ניתן גם לראות פרשנות גאומטרית של המושגים החדשים, נקודות מינימום/מקסימום מקומי ומוחלט בתלת ממד, כאשר משרטטים גרף הפונקציה \(f(x,y)\). השרטוט נמצא בקישור הזה. לפי פרשנות הזאת עקום \(T\) הוא אוסף נקודות במישור \(xy\). האוסף הזה מגדיר בהתאמה אוסף נקודות על גרף הפונקציה \(f(x,y)\) שמוגדר כך \[\left\{{(x,y,z):(x,y)\in T,z=f(x,y)}\right\}\] נקרא לאוסף הזה בשם \(H\). אז באוסף \(H\) אנחנו מחפשים נקודות עם ערך של קואורדינטה \(z\) הקטן ביותר כאשר מדובר על נקודת מינימום מוחלט תחת אילוץ ונקודות עם ערל של קואורדינטה \(z\) הגדול ביותר כאשר מדובר על נקודות מקסימום מוחלט תחת אילוץ. כאשר מדובר על נקודות מינימום/מקסימום מקומי תחת אילוץ אנחנו מחפשים נקודה הנמוכה/הגבוהה ביותר באוסף \(H\) בסביבה מסוימת.

    תנאי הכרחי לנקודות קיצון תחת אילוץ

    לנקודות מינימום/מקסימום מקומי תחת אילוץ (בתנאי) נקרא נקודות קיצון תחת אילוץ. נלמד איך לאתר אותן בעזרת נגזרות חלקיות. הדיון ננהל עבור פונקציה סקלרית בשני משתנים \(f(x,y)\) ואילוץ אחד שמוגדר ע"י המשוואה \(g(x,y)=0\). לפונקציה \(f\) נקרא גם פונקציית המטרה. נניח שהנקודה \(P\left({x_0,y_0}\right)\) היא נקודת קיצון של הפונקציה \(f\) תחת אילוץ הנתון. נחפש מה משתמע מפה. נקודה \(P\) מקיימת את משוואת האילוץ. נניח שבסיבה מסוימת של נקודה \(P\) משוואת האילוץ מגדירה משתנה \(y\) כפונקציה גזירה של משתנה \(x\), כלומר פונקציה סתומה \(y=y(x)\). נזכור שלשם כך יש לדרוש ש- \(g_y(P)\neq 0\). נרכיב פונקציה חדשה \[h(x)=f(x,y(x))\] הנקודה \(x=x_0\) היא נקודת קיצון שלה ולכן \(h'\left({x_0}\right)=0\). מצד שני, לפי כלל השרשרת הנגזרת הזאת שווה \[h'\left({x_0}\right)=f_x(P)\cdot x'\left({x_0}\right)+f_y(P)\cdot y'\left({x_0}\right)=f_x(P)+f_y(P)\cdot y'\left({x_0}\right)\] לפי כלל גזירה של פונקציה סתומה \[y'\left({x_0}\right)=-\frac{g_x(P)}{g_y(P)}\] מפה מתקבל שוויון הבא. \[f_x(P)-\frac{g_x(P)}{g_y(P)}\cdot f_y(P)=0\] נסמן \(\lambda=\frac{g_x(P)}{g_y(P)}\). אז \(f_x(P)=\lambda g_x(P)\). מפה מתקבל תנאי הכרחי של נקודות קיצון תחת אילוץ והוא

    אם \(P\) נקודת קיצון של הפונקציה \(f(x,y)\) תחת אילוץ \(g(x,y)=0\) וקיימים הווקטורים \(\vec\nabla f(P),\vec\nabla g(P)\) ו- \(\vec\nabla g(P)\neq \vec 0\) אז מתקיים השוויון \[\vec\nabla f(P)=\lambda\vec\nabla g(P)\]

    במילים,בנקודת קיצון תחת אילוץ גרדיאנט של פונקציית מטרה פרופורציונלי (מקביל בשפה גאומטרית) לגרדיאנט של פונקציית האילוץ.

    יש להדגיש שבניסוח של התנאי ההכרחי הנ"ל כתבתי ש- \(\vec\nabla g(P)\neq \vec 0\). הסיבה היא שהתנאי הזה מתקבל בהנחה ש- \(g_y(P)\neq 0\). כמובן שהיה אפשר לדרוש ש- \(g_x(P)\neq 0\) ואז לדבר על \(x\) כעל פונקציה של \(y\). אבל גם זה אומר שגרדיאנט של פונקציית אילוץ שונה מווקטור אפס בנקודת קיצון תחת אילו. זה אומר שכאשר מאתרים נקודות "חשודות" בקיצון תחת אילוץ יש לקחת בחשבון גם את הנקודות בהן \(\vec\nabla g=\vec 0\).

    שווה מאוד לראות איך מתקבלת מסקנה הזאת באופן גאומטרי, אמנם לא פורמלי. נדמיין קווי רמה של פונקציית המטרה \(f(x,y)\). במעבר מקוו אחד לקוו אחר ערך פונקציית המטרה הולך ומשתנה. למשל, עבור פונקציית המטרה \(f(x,y)=\sqrt{x^2+y^2}\) מדובר על אוסף מעגלים. כל מעגל מייצג ערך מסוים של \(f(x,y)\). אם רדיוס המעגל גדול יותר אז ערך פונקציית שמיוצג ע"י המעגל הזה גדול יותר. נוסיף לציור שאנחנו מדמיינים גם עקום שמוגדר ע"י משוואת האילוץ \(g(x,y)=0\). ניקח למשל דוגמה מהקדמה והיא \[\left({(x-2)^2+y^2-1}\right)\cdot\left({x^2+(y-3)^2-1}\right)=0\] באנימציה הזאת ניתן לשנות רדיוס המעגל שמייצג קווי רמה של \(f(x,y)\). כאשר הרדיוס הזה לא מספיק גדול קוו רמה (בצבע אדום) אינו חותך את עקום האילוץ (שני מעגלים בצבע כחול). אז במצב הזה אנחנו לא מקיימים את משוואת האילוץ. בנקודה \(A\) קוו רמה נוגע בעקום האילוץ וכאשר ממשיכים להגדיל טיפה את הרדיוס ממשיך לחתוך את עקום האילוץ. לכן נקודה \(A\) היא נקודת מינימום מקומי (גם מוחלט) של פונקציית המטרה תחת אילוץ הנתון. נמשיך להגדיל את הרדיוס עד שקוו רמה יינגע במעגל השני בנקודה \(C\). זה אומר שנקודה \(C\) נקודת מינימום מקומי של פונקציית המטרה אבל לא מוחלט כי יש קווי רמה שמייצגים ערך פונקציית המטרה קטן יותר והן נקודות מפגש של קווי רמה עם מעגל שמרכזו על ציר \(x\). באופן דומה ניתן להסביר מדוע נקודה \(B\) היא נקודת מקסימום מקומי אבל לא מוחלט ונקודה \(D\) היא נקודת מקסימום מקומי וגם מוחלט. חשוב להבין שבנקודות \(A,B,C,D\) לקוו רמה של פונקציית המטרה ולעקום האילוץ יש משיק משותף ולהיזכר שגרדיאנט מאונך לישר משיק. מפה מתקבלת מסקנה שבנקודות קיצון תחת אילוץ ווקטור גרדיאנט של פונקציית המטרה מקביל לגרדיאנט של פונקציית האילוץ.

    נעשה עוד דוגמאות לאיתור של נקודות חשודות בקיצון תחת אילוץ.

    דוגמאות

    1. נחפש נקודות קיצון של הפונקציה \(f(x,y)=x^2+y^2\) תחת האילוץ \(xy-1=0\).

      וקטור \(\vec\nabla f=(2x.2y)\) קיים לכל \((x,y)\) כמו הווקטור \(\vec\nabla g=(y,x)\) כאשר \(g(x,y)=xy-1\). לכן, נקודות קיצון תחת אילוץ הן רק נקודות שמקיימות את השוויון \(\vec\nabla f=\lambda\vec\nabla g\). השוויון הזה יחד עם משוואת האילוץ מרכיב מערכת \[\begin{cases} 2x=\lambda\cdot y\\ 2y=\lambda\cdot x\\ xy=1 \end{cases}\] ממשוואת אילוץ נובע ש- \(x,y\neq 0\). לכן ניתן לחלק משוואה ראשונה במשוואה שניה של המערכת הנ"ל ולקבל משוואה ללא \(\lambda\) והיא \[\frac{x}{y}=\frac{y}{x}\] בסופו של חשבון, \(\lambda\) הוא רק משתנה עזר שלא נצטרך לדעת אותו. ממשוואה הנ"ל נובע ש- \(x=\pm y\). נציב \(x=y\) במשוואת אילוץ ונקבל \(y^2=1\) ומפה \(y=\pm 1\). אז קיבלנו שתי נקודות חשודות בקיצון תחת אילוץ \((1,1),(-1,-1)\).

      אם \(x=-y\) אז \(-y^2=1\) ולמשוואה הזאת אין פתרון ממשי.

      נותר לבדוק האם נקודות שקיבלנו אכן נקודות קיצון. נדון קצת בתאוריה על מנת להבין איך לעשות את זה. אם \(P\left({x_0,y_0}\right)\) נקודת קיצון של פונקציית המטרה \(f(x,y)\) תחת אילוץ \(g(x,y)=0\) אז עבור הפונקציה \(h(x)=f(x.y(x))\) כאשר \(y(x)\) היא פונקציה סתומה שמוגדרת ע"י משוואת אילוץ הנקודה \(x=x_0\) היא נקודת קיצון שלה. לכן על מנת לבדוק שנקודה \(P\) שמקיימת תנאי הכרחי
      \(\vec\nabla f(P)=\lambda\vec\nabla g(P)\) היא אכן נקודת קיצון אפשר לבדוק האם הנקודה \(x=x_0\) שמקיימת את התנאי ההכרחי \(h'\left({x_0}\right)=0\) היא אכן נקודת קיצון. ניתן לעשות את זה ע"י חישוב סימן של נגזרת שנייה \(h''\left({x_0}\right)\). נזכר שכאשר \(h''\left({x_0}\right)>0\) אז \(x=x_0\) נקודת מינימום מקומי וכאשר \(h''\left({x_0}\right)<0\) הנקודה \(x=x_0\) נקודת מקסימום מקומי. נעבור לחישובים. חשוב לזכור ש- \(y=y(x)\). \[\begin{gathered} h(x)=f(x,y(x)),\; h'(x)=f_x+f_y\cdot y'(x)=f_x-f_y\cdot\frac{g_x}{g_y}=2x-2y\cdot\frac{y}{x} =2\left({x-\frac{y^2}{x}}\right)\\ h''(x)=2\cdot\left({1-\frac{2y\cdot y'(x)\cdot x-y^2\cdot 1}{x^2}}\right)= 2\cdot\left({1-\frac{2xy\cdot\left({-\frac{y}{x}}\right)-y^2}{x^2}}\right)= 2\cdot\left({1+\frac{3y^2}{x^2}}\right)\end{gathered}\] נבדוק עכשיו את הנקודה \((1,1)\). לשם כך נחשב \[h''(1)=2\cdot\left({1+\frac{3\cdot 1^2}{1^2}}\right)>0\] לכן \(x=1\) נקודת מינימום מקומי של הפונקציה \(h(x)\) ומפה נובע שהנקודה \((1,1)\) נקודת מינימום של הפונקציה \(f(x,y)\) תחת אילוץ הנתון.

      נבדוק נקודה \((-1,-1)\). נחשב \[h''(-1)=2\cdot\left({1+\frac{3\cdot (-1)^2}{(-1)^2}}\right)>0\] לכן גם הנקודה \((-1,-1)\) נקודת מינימום מקומי של הפונקציה \(f(x,y)\) תחת אילוץ הנתון.

      אם \(\vec\nabla g=(y,x)=\vec 0\) אז \(x=0,y=0\) אבל הנקודה הזאת לא מקיימת את משוואת האילוץ, כלומר על ההיפרבולה \(xy=1\) אין נקודות בהן \(\vec\nabla g=\vec 0\).

    2. נתונה הפונקציה \[f(x,y)=x^2+(y+1)^2\] ונתונה משוואת האילוץ \[x^2-y^3=0\] פה הפונקציה שמייצגת את האילוץ היא \(g(x,y)=x^2-y^3\). נחשב את הגרדיאנטים \[\vec\nabla f=(2x,2y+1),\quad \vec{\nabla} g=(2x,-3y^2)\] נרכיב את המערכת \[\begin{cases} \vec\nabla f=\lambda\vec{\nabla}g\\ x^2-y^3=0 \end{cases}\] מקבלים \[\begin{cases} 2x=\lambda\cdot 2x\\ 2y+1=\lambda\cdot(-3y^2)\\ x^2-y^3=0 \end{cases}\] ממשוואה ראשונה נובע שאו \(x=0\) או \(\lambda=1\). אם \(x=0\) אז ממשוואה שלישית נובע ש- \(y=0\) אבל הערך הזה לא מקיים משוואה שניה. אם \(\lambda=1\) אז משוואה שניה הופכת להיות משוואה ריבועית \(3y^2+2y+1=0\) שאין לה אף פתרון ממשי. לכן התנאי \(\vec\nabla f=\lambda\vec{\nabla} g\) לבד לא מביא שום נקודה "חשודה" בקיצון תחת אילוץ הנתון. נותר לאתר נקודות בהן \(\vec\nabla g=\left({2x,-3y^3}\right)=\vec 0\). מתקבלת נקודה יחידה והיא \((0,0)\). נבדוק האם היא אכן נקודת קיצון תחת אילוץ בדרך גאומטרית. פונקציית המטרה \(f(x,y)=x^2+(y+1)^2\) מייצגת מרחק בריבוע של נקודה \((x,y)\) מנקודה \((0,-1)\), כלומר, קווי רמה של פונקציית המטרה הם מעגלים שמרכזם בנקודה \((0,-1)\). גם גרף של עקום אילוץ \(y^3=x^2\) לא קשה לצייר. צורתו דומה לצורת אות V עקומה עם קדקוד בראשית הצירים. בקישור הזה ניתן לראות אנימציה של קווי רמה יחד עם עקום אילוץ. ע"י לחצן \(r\) ניתן לשלוט ברדיוס המעגלים. אז רואים שהנקודה \((0,0)\) היא נקודת קיצון מינימום של הפונקציה הנתונה תחת אילוץ הנתון (היא גם נקודת מינימום מוחלט תחת אילוץ הנתון).

    נספח א

    נוכיח שבנוסחה \[f(x,y)-f(P)=\frac{1}{2!}\underbrace{\left({A(\Delta x)^2+2B\Delta x\Delta y+C(\Delta y)^2}\right)}_{M}+ \frac{1}{2!}\underbrace{\left({\alpha(\Delta x)^2+2\beta\Delta x\Delta y+\gamma(\Delta y)^2}\right)}_{N}\] כאשר \[A=f_{xx}(P),\;B=f_{xy}(P),\; C=f_{yy}(P),\;\lim_{\Delta x,\Delta y \to 0}\alpha,\beta,\gamma=0\] קיימת סביבה של נקודה \(P\) בה סימן ההפרש \(f(x,y)-f(P)\) חופף לסימן של ביטוי \(M\). נסמן ב- \(r\) אורך הקטע שמחבר הנקודות \(P,(x,y)\), כלומר \(r=\sqrt{(\Delta x)^2+(\Delta y)^2}\) וב- \(\phi\) גודל הזווית בין הקטע הזה לבין קטע אופקי שמחבר את הנקודות \(P,\left({x,y_0}\right)\). אז \[\Delta x= r\cos\phi,\;\Delta y=r\sin\phi\] אז ניתן לכתוב את \(M,N\) כך. \[M=r^2\left({A\cos^2\phi+2B\cos\phi\sin\phi+C\sin^2\phi}\right)\] \[N=r^2\left({\alpha\cos^2\phi+2\beta\cos\phi\sin\phi+\gamma\sin^2\phi}\right)\] ע"י השלמה לסכום/הפרש ריבועים נכתוב ביטוי עבור \(M\) כך. \[M=\frac{r^2}{A}\left({(A\cos\phi+B\sin\phi)^2+(AC-B^2)\sin^2\phi}\right)\] הנחנו פה ש- \(A\neq 0\) וכאשר \(AC-B^2>0\) ההנחה הזאת אכן מתקיימת. הביטוי \[(A\cos\phi+B\sin\phi)^2+(AC-B^2)\sin^2\phi\] לא שלילי לכל ערך \(\phi\in[0,2\pi]\) אם הוא היה שווה אפס אז הייתה מתקיימת מערכת \[\begin{cases} A\cos\phi+B\sin\phi=0\\ \sin\phi=0 \end{cases}\implies \begin{cases} \cos\phi=0\\ \sin\phi=0 \end{cases}\] וזה לא יתכן. לכן \(M>0\) לכל ערך \(\phi\in[0,2\pi]\). ניתן לומר ש- \(M\) הוא פונקציה רציפה של משתנה \(\phi\in[0,2\pi]\). לכן, לפי משפט ווירשטראש הפונקציה הזאת מקבלת ערך מינימלי שלה והוא חייב להיות חיובי. נסמן את הערך הזה ב- \(m\). אז מתקיים אי-שוויון \(M\geq m>0\).

    עבור ביטוי \(N\) ניתן לעשות הערכה הבאה. \[|N|\leq r^2\left({|\alpha|+2|\beta|+|\gamma|}\right)\] משום ש- \[\lim_{\Delta x,\Delta y \to 0}\alpha,\beta,\gamma=0\] ניתן למצוא סביבה של נקודה \(P\) בה מתקיים אי-שוויון \(|N|<m\). לכן בסיבה הזאת סימן ההפרש \(f(x,y)-f(P)\) חופף לסימן של \(M\) שנקבע לפי סימן של \(A\). זה אומר שכאשר \(AC-B^2>0\) הנקודה \(P\) אכן נקודת קיצון.


    Hebrew Math is shared under a not declared license and was authored, remixed, and/or curated by LibreTexts.

    • Was this article helpful?