If you're seeing this message, it means we're having trouble loading external resources on our website.

Jeżeli jesteś za filtrem sieci web, prosimy, upewnij się, że domeny *.kastatic.org i *.kasandbox.org są odblokowane.

Główna zawartość

Gradient

Gradient zawiera informacje o wszystkich pochodnych cząstkowych skalarnej funkcji wielu zmiennych.  Oprócz tego's ma interesującą interpretację i różne zastosowania.

Co powinieneś wiedzieć przed przystąpieniem do tej lekcji

Do czego zmierzamy

  • Gradient funkcji rzeczywistej zależnej od wielu zmiennych f(x,y,), oznaczamy przez f, to wektor, który zawiera wszystkie informacje o pochodnych cząstkowych tej funkcji:
    f=[fxfy]
Ta definicja oznacza, że f jest funkcją o wartościach wektorowych.
  • Wyobraź sobie, że znajdujesz się w przestrzeni, na jakiej określona jest funkcja f, w punkcie o współrzędnych (x0,y0,). Wektor f(x0,y0,) wskazuje Ci kierunek, w którym funkcja f rośnie najszybciej.
  • Gradient—f(x0,y0,)—jest także prostopadły do konturu stałej wartości funkcji f.

Definicja

Wiesz już, co to są pochodne cząstkowe w przypadku funkcji wielu zmiennych. Pewnie zastanawia Cię czy można zdefiniować coś, co odpowiada w tym przypadku pochodnej funkcji jednej zmiennej. W przypadku funkcji skalarnej, zależnej od wielu zmiennych, w pewnym sensie gradient jest takim odpowiednikiem.
Gradient funkcji skalarnej f, który najczęściej oznaczamy jako f, składa się z pierwszych pochodnych cząstkowych względem wszystkich zmiennych. Gradient wygodnie zapisać jako "wektor" utworzony z tych pochodnych.
Pora na prosty przykład.

Przykład 1: Dwa wymiary

Niech f(x,y)=x2xy. Które z poniższych wyrażeń równa się f?
Wybierz 1 odpowiedź:

Zauważ, że ta notacja sugeruje, nieprzypadkowo, że f jest funkcją o wartościach wektorowych. W rozważanym przypadku, gdy f jest funkcją skalarną określoną na R2, gradient jest dwuwymiarowym polem wektorowym, żyjącym także w przestrzeni R2. Matematycy nazywają przestrzeń, "przestrzeń styczna"więcej o polach wektorowych.
To pole wektorowe nazywamy czasem polem gradientu f.
Pytanie do zastanowienia: dlaczego wektory, ilustrujące to pole wektorowe, mają małą długość w pasie idącym od dołu do góry w środku płaszczyzny XY?

Przykład 2: gradient funkcji zależnej od trzech współrzędnych

Ile wynosi gradient f(x,y,z)=xxy+z2?
Wybierz 1 odpowiedź:

W tym przypadku, f jest funkcją określoną na R3 o wartościach w R3. A zatem, wygodnie jest przedstawić ją jako pole wektorowe w R3.
Filmy wideo na Khan Academy

Interpretacja gradientu

We wszystkich dotychczasowych przykładach gradient f był pewnym polem wektorowym, ale jaką interpretację mają pola wektorowe gradientów?
Dla ustalenia uwagi, rozważmy sytuację w której f jest funkcją skalarną określoną na dwuwymiarowej przestrzeni R2. Gradient przyporządkowuje każdemu punktowi (x0,y0) tej przestrzeni pewien wektor.
f(x0,y0)=[fx(x0,y0)fy(x0,y0)].
Jaką informację o zachowaniu się funkcji f w otoczeniu punktu (x0,y0) niesie ze sobą gradient tej funkcji?
Wyobraź sobie, że znajdujesz się na powierzchni, będącej wykresem funkcji f(x,y). Wokół siebie widzisz mniej lub bardziej pofałdowany krajobraz. Jeśli znajdujesz się w punkcie leżącym bezpośrednio nad—lub pod—punktem o współrzędnych (x0,y0), nachylenie wzgórza zależeć będzie od kierunku, w którym chcesz się udać. Na przykład, jeśli chcesz zrobić krok w kierunku wskazywanym przez dodatni kierunek osi X, nachylenie wynosi fx; jeśli chcesz pójść w kierunku wskazywanym przez dodatni kierunek osi Y, nachylenie wyniesie fy. Możesz też pójść w dowolnym innym kierunku, w tym przypadku nachylenie będzie kombinacją nachylenia w kierunku osi X i nachylenia w kierunku osi Y.
Najważniejsza własność gradientu, którą musisz zapamiętać, jest taka: gradient funkcji f w punkcie (x0,y0) wskazuje kierunek, w którym funkcja f rośnie najszybciej.
To znaczy, że jeśli wyruszysz w kierunku wskazywanym przez gradient, pójdziesz dokładnie pod górę. Co więcej, długość wektora f(x0,y0) powie Ci ile wynosi nachylenie stoku w tym kierunku.
Dziwisz się, dlaczego gradient wskazuje kierunek najszybszego wzrostu funkcji? Wyjaśnimy to dokładnie w rozdziale o pochodnych kierunkowych.
Jeśli funkcja f określona jest na przestrzeni o więcej niż dwóch wymiarach, nie możemy przedstawić powierzchni, będącej jej wykresem, przez analogię do pagórkowatego krajobrazu . Tym niemniej, interpretacja gradientu pozostaje prawdziwa. Dla funkcji skalarnej f określonej na przestrzeni o dowolnej liczbie wymiarów gradient f zawsze wskazuje kierunek, w którym f rośnie najszybciej.

Przykład 3: maksima lokalne

Rozważmy funkcję f(x,y)=x4+4(x2y2)3. Jak wygląda gradient f?
Wybierz 1 odpowiedź:

A tak wygląda dwuwymiarowa powierzchnia, będąca wykresem funkcji f:
Widzisz dwa maksima, dwa wyraźnie widoczne szczyty? A tak wygląda pole wektorowe f —aby móc przedstawić je na rysunku, skróciliśmy wektory zaznaczone na czerwono o wydłużyliśmy te, zaznaczone na niebiesko:
Dwa punkty, w których wykres f ma maksima, otaczają strzałki skierowane w ich kierunku. Dlaczego?
W otoczeniu szczytu wzgórza, kierunek "w górę" zawsze wskazuje na sam szczyt.
Pytanie do zastanowienia: jak wygląda pole gradientu w otoczeniu lokalnego minimum funkcji?

Gradient jest prostopadły do konturu stałej wartości funkcji

Rozważmy funkcję skalarną, określoną na R2. Zastanówmy się, jak wyglądają linie stałej wartości funkcji f w relacji do pola wektorowego zadanego przez gradient tej funkcji f.
Rozważmy, dla przykładu, funkcje f(x,y)=xy:
Przyjrzyj się temu wykresowi. Widzisz coś niezwykłego? O tak! Wygląda na to, że każdy wektor jest prostopadły do konturu, z którego bierze początek.
Zastanówmy się, dlaczego tak jest. Wyobraźmy sobie jeden z konturów stałej wartości funkcji f, na przykład ten, który odpowiada wartości f(x,y)=2 i przyjrzyjmy się jednemu z punktów należących do tego konturu. Jak już wiemy, wektor f wskazuje kierunek, w którym f rośnie najszybciej. Ale co to dokładnie znaczy, "kierunek, w którym f rośnie najszybciej"? Można o tym myśleć na dwa sposoby:
  1. Zadajemy długość kroku i szukamy kierunku, w którym krok ten przyniesie największy przyrost funkcji f.
    Rysunek 1
  2. Zadajemy przyrost funkcji f i szukamy kierunku, w którym przyrost funkcji o zadaną wartość wymaga wykonania najkrótszego kroku.
    Rysunek 2
W obu wypadkach, staramy się zmaksymalizować stosunek przyrostu funkcji do przyrostu argumentu, maksymalizując przyrost funkcji lub minimalizując przyrost argumentu.
Analiza konturów stałej wartości funkcji dobrze ilustruje to drugie podejście. Powyżej, na rysunku 2, zaznaczono drugą linię, odpowiadającą wartości f(x,y)=2,1, czyli odrobinę więcej niż w przypadku f(x,y)=2, której odpowiada pierwszy kontur. Gradient funkcji f wskazuje kierunek, który należy wybrać, aby wychodząc z punktu należącego do konturu f(x,y)=2 dojść do konturu odpowiadającego nieco większej wartości f po jak najkrótszej drodze.
Im bardziej powiększymy ten obrazek, zmniejszając przyrost wartości funkcji f pomiędzy konturami, tym bardziej sąsiednie kontury będą lokalnie wyglądać jak dwie proste równoległe. Najkrótszy odcinek łączący dwie proste równoległe jest prostopadły do obu tych prostych, a więc gradient będzie wskazywał kierunek prostopadły do konturu stałej wartości wartości f.

Operator nabla

W analizie funkcji zależnych od wielu zmiennych—a także dalej—często pojawia się określenie operator. Najprostsza, intuicyjna definicja operatora mogłaby (serio) wyglądać tak: "czarna skrzynka, która łyka funkcję i wypluwa inną funkcję".
Zwykła pochodna jest przykładem takiego operatora, ponieważ przekształca funkcję f w inną funkcję, f. Operatory różniczkowe to ogólna nazwa wszystkich takich przekształceń, które rozszerzają definicję pochodnej.
Przykład operatorów różniczkowych
NazwaSymbolPrzykład działania
Pochodnaddxddx(x2)=2x
Pochodna cząstkowaxx(x2xy)=2xy
Gradient(x2xy)=[2xyx]
Symbol nazywany jest najczęściej po prostu nabla, albo "d czegoś (funkcji) po d czymś (argumencie)". Na ogół nabla odnosi się do symbolu operatora, natomiast "d c (funkcji) po d (argumencie)" oznacza jego działanie, podobnie jak symbol , a różnicę pomiędzy nimi można wywnioskować z kontekstu.
Operator możemy intuicyjnie traktować jako wektor złożony z pochodnych cząstkowych:
=[xy]
Nie jest to ścisła definicja. Z jednej strony, wymiar wektora nie jest określony dopóki nie umówimy się, od ilu zmiennych zależą funkcje, na które będzie działał. W każdym wypadku, interpretowanie pochodnych cząstkowych jako składowych wektora wymaga ostrożności i namysłiu. Ponieważ jednak w praktyce nie prowadzi to do nieporozumienia, rzadko się nad tym zastanawiamy.
Można sobie wyobrażać, że "mnożymy" utworzony z pochodnych cząstkowych wektor gradientu przez funkcję skalarną:
f=[xy]f=[fxfy]
Oczywiście to jest czysto mnemotechniczna operacja, w rzeczywistości obliczamy pochodne cząstkowe i danej funkcji i tworzymy z nich wektor. Tym niemniej, taki sposób myślenia o operatorze rzeczywiście dość przydatny z myślą o zastosowaniach, które poznamy w przyszłości: dywergencji, rotacji, oraz operatora Laplace'a.

Podsumowanie

  • Gradient funkcji rzeczywistej zależnej od wielu zmiennych f(x,y,), oznaczamy przez f, to wektor, który zawiera wszystkie informacje o pochodnych cząstkowych tej funkcji:
    f=[fxfy]
Ta definicja oznacza, że f jest funkcją o wartościach wektorowych.
  • Jeśli znajdujesz się w przestrzeni, na jakiej określona jest funkcja f, w punkcie o współrzędnych (x0,y0,). Wektor f(x0,y0,) wskazuje Ci kierunek, w którym funkcja f rośnie najszybciej.
  • Wektor gradientu f(x0,y0,) jest także prostopadły do konturu stałej wartości funkcji f, który przechodzi przez punkt (x0,y0,).

Chcesz dołączyć do dyskusji?

Na razie brak głosów w dyskusji
Rozumiesz angielski? Kliknij tutaj, aby zobaczyć więcej dyskusji na angielskiej wersji strony Khan Academy.