Główna zawartość
Kurs: Analiza matematyczna funkcji wielu zmiennych > Rozdział 2
Lekcja 3: Pochodna cząstkowa i gradient (artykuły)Gradient
Gradient zawiera informacje o wszystkich pochodnych cząstkowych skalarnej funkcji wielu zmiennych. Oprócz tego's ma interesującą interpretację i różne zastosowania.
Co powinieneś wiedzieć przed przystąpieniem do tej lekcji
- Pochodne cząstkowe
- Pola wektorowe
- Mapy konturowe—niezbędne tylko w jednym paragrafie tego rozdziału.
Do czego zmierzamy
- Gradient funkcji rzeczywistej zależnej od wielu zmiennych
, oznaczamy przez , to wektor, który zawiera wszystkie informacje o pochodnych cząstkowych tej funkcji:
Ta definicja oznacza, że jest funkcją o wartościach wektorowych.
- Wyobraź sobie, że znajdujesz się w przestrzeni, na jakiej określona jest funkcja
, w punkcie o współrzędnych ( ). Wektor wskazuje Ci kierunek, w którym funkcja rośnie najszybciej. - Gradient—
—jest także prostopadły do konturu stałej wartości funkcji .
Definicja
Wiesz już, co to są pochodne cząstkowe w przypadku funkcji wielu zmiennych. Pewnie zastanawia Cię czy można zdefiniować coś, co odpowiada w tym przypadku pochodnej funkcji jednej zmiennej. W przypadku funkcji skalarnej, zależnej od wielu zmiennych, w pewnym sensie gradient jest takim odpowiednikiem.
Gradient funkcji skalarnej , który najczęściej oznaczamy jako , składa się z pierwszych pochodnych cząstkowych względem wszystkich zmiennych. Gradient wygodnie zapisać jako "wektor" utworzony z tych pochodnych.
Pora na prosty przykład.
Przykład 1: Dwa wymiary
Niech . Które z poniższych wyrażeń równa się ?
Zauważ, że ta notacja sugeruje, nieprzypadkowo, że jest funkcją o wartościach wektorowych. W rozważanym przypadku, gdy jest funkcją skalarną określoną na , gradient jest dwuwymiarowym polem wektorowym, żyjącym także w przestrzeni . Matematycy nazywają przestrzeń, "przestrzeń styczna"więcej o polach wektorowych.
To pole wektorowe nazywamy czasem polem gradientu .
Pytanie do zastanowienia: dlaczego wektory, ilustrujące to pole wektorowe, mają małą długość w pasie idącym od dołu do góry w środku płaszczyzny ?
Przykład 2: gradient funkcji zależnej od trzech współrzędnych
Ile wynosi gradient ?
W tym przypadku, jest funkcją określoną na o wartościach w . A zatem, wygodnie jest przedstawić ją jako pole wektorowe w .
Interpretacja gradientu
We wszystkich dotychczasowych przykładach gradient był pewnym polem wektorowym, ale jaką interpretację mają pola wektorowe gradientów?
Dla ustalenia uwagi, rozważmy sytuację w której jest funkcją skalarną określoną na dwuwymiarowej przestrzeni . Gradient przyporządkowuje każdemu punktowi tej przestrzeni pewien wektor.
Jaką informację o zachowaniu się funkcji w otoczeniu punktu niesie ze sobą gradient tej funkcji?
Wyobraź sobie, że znajdujesz się na powierzchni, będącej wykresem funkcji . Wokół siebie widzisz mniej lub bardziej pofałdowany krajobraz. Jeśli znajdujesz się w punkcie leżącym bezpośrednio nad—lub pod—punktem o współrzędnych , nachylenie wzgórza zależeć będzie od kierunku, w którym chcesz się udać. Na przykład, jeśli chcesz zrobić krok w kierunku wskazywanym przez dodatni kierunek osi , nachylenie wynosi ; jeśli chcesz pójść w kierunku wskazywanym przez dodatni kierunek osi , nachylenie wyniesie . Możesz też pójść w dowolnym innym kierunku, w tym przypadku nachylenie będzie kombinacją nachylenia w kierunku osi i nachylenia w kierunku osi .
Najważniejsza własność gradientu, którą musisz zapamiętać, jest taka: gradient funkcjiw punkcie wskazuje kierunek, w którym funkcja rośnie najszybciej.
To znaczy, że jeśli wyruszysz w kierunku wskazywanym przez gradient, pójdziesz dokładnie pod górę. Co więcej, długość wektora powie Ci ile wynosi nachylenie stoku w tym kierunku.
Dziwisz się, dlaczego gradient wskazuje kierunek najszybszego wzrostu funkcji? Wyjaśnimy to dokładnie w rozdziale o pochodnych kierunkowych.
Jeśli funkcja określona jest na przestrzeni o więcej niż dwóch wymiarach, nie możemy przedstawić powierzchni, będącej jej wykresem, przez analogię do pagórkowatego krajobrazu . Tym niemniej, interpretacja gradientu pozostaje prawdziwa. Dla funkcji skalarnej określonej na przestrzeni o dowolnej liczbie wymiarów gradient zawsze wskazuje kierunek, w którym rośnie najszybciej.
Przykład 3: maksima lokalne
Rozważmy funkcję . Jak wygląda gradient ?
A tak wygląda dwuwymiarowa powierzchnia, będąca wykresem funkcji :
Widzisz dwa maksima, dwa wyraźnie widoczne szczyty? A tak wygląda pole wektorowe —aby móc przedstawić je na rysunku, skróciliśmy wektory zaznaczone na czerwono o wydłużyliśmy te, zaznaczone na niebiesko:
Dwa punkty, w których wykres ma maksima, otaczają strzałki skierowane w ich kierunku. Dlaczego?
W otoczeniu szczytu wzgórza, kierunek "w górę" zawsze wskazuje na sam szczyt.
Pytanie do zastanowienia: jak wygląda pole gradientu w otoczeniu lokalnego minimum funkcji?
Gradient jest prostopadły do konturu stałej wartości funkcji
Rozważmy funkcję skalarną, określoną na . Zastanówmy się, jak wyglądają linie stałej wartości funkcji w relacji do pola wektorowego zadanego przez gradient tej funkcji .
Rozważmy, dla przykładu, funkcje
:
Przyjrzyj się temu wykresowi. Widzisz coś niezwykłego? O tak! Wygląda na to, że każdy wektor jest prostopadły do konturu, z którego bierze początek.
Zastanówmy się, dlaczego tak jest. Wyobraźmy sobie jeden z konturów stałej wartości funkcji , na przykład ten, który odpowiada wartości i przyjrzyjmy się jednemu z punktów należących do tego konturu. Jak już wiemy, wektor wskazuje kierunek, w którym rośnie najszybciej. Ale co to dokładnie znaczy, "kierunek, w którym rośnie najszybciej"? Można o tym myśleć na dwa sposoby:
- Zadajemy długość kroku i szukamy kierunku, w którym krok ten przyniesie największy przyrost funkcji
. - Zadajemy przyrost funkcji
i szukamy kierunku, w którym przyrost funkcji o zadaną wartość wymaga wykonania najkrótszego kroku.
W obu wypadkach, staramy się zmaksymalizować stosunek przyrostu funkcji do przyrostu argumentu, maksymalizując przyrost funkcji lub minimalizując przyrost argumentu.
Analiza konturów stałej wartości funkcji dobrze ilustruje to drugie podejście. Powyżej, na rysunku 2, zaznaczono drugą linię, odpowiadającą wartości , czyli odrobinę więcej niż w przypadku , której odpowiada pierwszy kontur. Gradient funkcji wskazuje kierunek, który należy wybrać, aby wychodząc z punktu należącego do konturu dojść do konturu odpowiadającego nieco większej wartości po jak najkrótszej drodze.
Im bardziej powiększymy ten obrazek, zmniejszając przyrost wartości funkcji pomiędzy konturami, tym bardziej sąsiednie kontury będą lokalnie wyglądać jak dwie proste równoległe. Najkrótszy odcinek łączący dwie proste równoległe jest prostopadły do obu tych prostych, a więc gradient będzie wskazywał kierunek prostopadły do konturu stałej wartości wartości .
Operator nabla
W analizie funkcji zależnych od wielu zmiennych—a także dalej—często pojawia się określenie operator. Najprostsza, intuicyjna definicja operatora mogłaby (serio) wyglądać tak: "czarna skrzynka, która łyka funkcję i wypluwa inną funkcję".
Zwykła pochodna jest przykładem takiego operatora, ponieważ przekształca funkcję w inną funkcję, . Operatory różniczkowe to ogólna nazwa wszystkich takich przekształceń, które rozszerzają definicję pochodnej.
Przykład operatorów różniczkowych
Nazwa | Symbol | Przykład działania | ||||
Pochodna | ||||||
Pochodna cząstkowa | ||||||
Gradient |
Symbol nazywany jest najczęściej po prostu nabla, albo "d czegoś (funkcji) po d czymś (argumencie)". Na ogół nabla odnosi się do symbolu operatora, natomiast "d c (funkcji) po d (argumencie)" oznacza jego działanie, podobnie jak symbol , a różnicę pomiędzy nimi można wywnioskować z kontekstu.
Operator możemy intuicyjnie traktować jako wektor złożony z pochodnych cząstkowych:
Nie jest to ścisła definicja. Z jednej strony, wymiar wektora nie jest określony dopóki nie umówimy się, od ilu zmiennych zależą funkcje, na które będzie działał. W każdym wypadku, interpretowanie pochodnych cząstkowych jako składowych wektora wymaga ostrożności i namysłiu. Ponieważ jednak w praktyce nie prowadzi to do nieporozumienia, rzadko się nad tym zastanawiamy.
Można sobie wyobrażać, że "mnożymy" utworzony z pochodnych cząstkowych wektor gradientu przez funkcję skalarną:
Oczywiście to jest czysto mnemotechniczna operacja, w rzeczywistości obliczamy pochodne cząstkowe i danej funkcji i tworzymy z nich wektor. Tym niemniej, taki sposób myślenia o operatorze rzeczywiście dość przydatny z myślą o zastosowaniach, które poznamy w przyszłości: dywergencji, rotacji, oraz operatora Laplace'a.
Podsumowanie
- Gradient funkcji rzeczywistej zależnej od wielu zmiennych
, oznaczamy przez , to wektor, który zawiera wszystkie informacje o pochodnych cząstkowych tej funkcji:
Ta definicja oznacza, że jest funkcją o wartościach wektorowych.
- Jeśli znajdujesz się w przestrzeni, na jakiej określona jest funkcja
, w punkcie o współrzędnych ( ). Wektor wskazuje Ci kierunek, w którym funkcja rośnie najszybciej. - Wektor gradientu
jest także prostopadły do konturu stałej wartości funkcji , który przechodzi przez punkt .
Chcesz dołączyć do dyskusji?
Na razie brak głosów w dyskusji