Genialny wzór Taylora - czyli o informacji zakodowanej w pochodnych

"Co to jest różniczka? - zapytano  matematyka.
Różniczka to wyniczek odejmowanka - odpowiedział"
🙂

Wzór Taylora to jeden z elementów, które stanowią esencję rachunku różniczkowego i całkowego. Oto, w magiczny sposób, na bazie sekwencji informacji o funkcji, dotyczących tylko jednego jej wybranego punktu, możliwe jest bardzo precyzyjne odtworzenie zmienności funkcji w pobliżu ustalonego punktu. Wzór Taylora, nazywamy często rozwinięciem Taylora funkcji f(x) w otoczeniu punktu x_0, faktycznie "rozwija" funkcję do postaci sumy funkcji elementarnych a_n(x-x_0)^n, stanowiących atomy wielomianów. W efekcie otrzymujemy nie tylko efektywną aproksymację wartości funkcji, ale również nową "łatwiejszą" jej formę.

Wielomian Taylora

Twierdzenie Taylora: Dla funkcji f:\mathbb{R}\to\mathbb{R} n-razy różniczkowalnej (n\geq 1) w punkcie x_0\in\mathbb{R}, istnieje funkcja h_n:\mathbb{R}\to\mathbb{R}, że

f(x)=\underbrace{\displaystyle\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}(x-x_0)^k}_{wielomian-aproksymacja~f(x)}+\underbrace{h_n(x)(x-x_0)^n}_{reszta}

f(x)=f(x_0)+\frac{f^{(1)}(x_0)}{1!}(x-x_0)^1+\frac{f^{(2)}(x_0)}{2!}(x-x_0)^2+\ldots

\ldots+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+h_n(x)(x-x_0)^n

oraz

\displaystyle\lim_{x\to x_0}h_n(x)=0

Przez f^{(k)}(x) oznaczamy pochodną rzędu k funkcji f(x).

Twierdzenie Taylora nosi nazwę od angielskiego matematyka Brooka Taylora, który opracował je w 1712 roku. Samą własność wcześniej odkrył James Gregory - dokonał tego w 1671 roku.

Wzór, choć początkowo wygląda na dosyć skomplikowany, po bliższej analizie ujawnia niezwykłe piękno. Kolejne pochodne danej funkcji, wyznaczone w tym samym punkcie, kodują coraz "większą" i bardziej dokładną informację o kształcie funkcji w "szerszym" przedziale. Często sekwencja kilku / kilkunastu liczb wystarcza do osiągnięcia świetnej jakości aproksymacji. Jest to więc coś w rodzaju standaryzacji zapisu funkcji i algorytmu ich kompresji w jednym. Ten fenomen to główny przekaz artykułu - fenomen, który zostanie wyjaśniony w dalszej części tekstu.

Na bazie wzoru Taylora wprowadza się wielomian Taylora rzędu n funkcji f.

T_n(x)=\displaystyle\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}(x-x_0)^k

Zalety wzoru Taylora - wybrane

  • Wzór Taylora definiuje wielomian Taylora, który tym lepiej (zwykle) aproksymuje funkcję im wyższy jest jego stopień.
  • Twierdzenie Taylora (w wersji powyższej z resztą w postaci Peano), daje informację o błędzie aproksymacji (notacja "o-małe" w zagadnieniach asymptotycznego tempa wzrostu). Istnieją inne dodatkowe nierówności pozwalające szacować resztę - po szczegóły kliknij tutaj.
  • Wielomiany to funkcje elementarne, które bardzo łatwo wyznaczać numerycznie - z tego względu szereg kalkulatorów (czy programów / języków programowania) implementuje funkcje takie jak \sin x, \cos x, e^x, \ldots poprzez odpowiednie wielomiany Taylora.
  • Wielomiany z łatwością poddają się różniczkowaniu i całkowaniu.
  • Wielomiany można zapisać w postaci iloczynowej, ułatwiając rozwiązywanie szeregu równań i nierówności.
  • Wielomiany są określone na całej prostej rzeczywistej (lub płaszczyźnie zespolonej), co umożliwia analityczne "przedłużanie" wartości funkcji na dziedzinę, w której wyjściowa funkcja jest nieokreślona.

Przykład aproksymacji e^x wielomianem Taylora - animacja

Animacja prezentuje rozwinięcie Taylora funkcji e^x w otoczeniu punktu x = 0.

Rozwinięcie funkcji e^x w szereg Taylora / Maclaurina

Dlaczego to działa?

Różniczka vs pochodna

Dział matematyki, badający własności funkcji na bazie pochodnych i całek, nazywamy rachunkiem różniczkowym i całkowym. Równania opisujące zależność pomiędzy funkcjami a ich pochodnymi nazywamy równaniami różniczkowymi. O funkcji, dla której możemy wyznaczyć pochodną, mówimy, że jest różniczkowalna. Nawet sam proces wyznaczania pochodnej nazywamy różniczkowaniem. Tymczasem różniczka ma w matematyce konkretne własne znaczenie.

Różniczka funkcji powstaje z jej pochodnej. Różniczka to funkcja dwóch niezależnych zmiennych. Można powiedzieć, że różniczka funkcji „to predykcja” przyrostu wartości funkcji (w zależności od przyrostu argumentu) na bazie informacji o pochodnej funkcji w danym punkcie.

Różniczka (definicja): jeśli funkcja f:\mathbb{R}\to\mathbb{R} jest różniczkowalna w punkcie x\in\mathbb{R}, to jej różniczką nazywamy funkcję df:\mathbb{R}\times\mathbb{R}\to\mathbb{R} określoną wzorem

df(x,\Delta x)=f^\prime(x)\cdot\Delta x

gdzie x,\Delta x\in\mathbb{R}

Różniczka funkcji

Ustalając pewien punkt x_0\in\mathbb{R} możemy zapisać, że \Delta x = x-x_0, wtedy

df(x_0,\Delta x=x-x_0)=f^\prime(x_0)(x-x_0)

Łatwo zauważyć, że dodając do różniczki df(x_0,\Delta x=x-x_0) wartość funkcji f(x_0) otrzymujemy liniową aproksymację funkcji f w pewnym otoczeniu punktu x_0

p(x)=f(x_0)+df(x_0,\Delta x=x-x_0)

p(x)=f(x_0)+f^\prime(x_0)(x-x_0)

gdzie

p(x_0)=f(x_0)

oraz

p^\prime(x_0)=f^\prime(x_0)

W pewnym sensie już widać, że we wzorze Taylora występują różniczki, wykorzystywane jako predykcje wzrostu wartości funkcji, wzrostu wartości pierwszej pochodnej, wzrostu wartości drugiej pochodnej, i tak dalej...

Kolejne pochodne kodują coraz więcej informacji o funkcji wyjściowej

Z definicji pochodna f^\prime(x_0) mówi jak zmienia się funkcja f(x) w otoczeniu x_0 (np. aproksymacja na bazie różniczki). Druga pochodna f^{\prime\prime}(x_0) w punkcie x_0 wskazuje zmianę pierwszej pochodnej f^\prime(x_0) w otoczeniu x_0. Do tej pory znaliśmy jedynie pierwszą pochodną w jednym punkcie, a na bazie informacji o drugiej pochodnej poszerzamy wiedzę o zachowaniu pierwszej pochodnej do pewnego przedział. Tym samym rozszerza się przedział dobrej informacji na temat wyjściowej funkcji f(x).

Znając f(x_0) oraz wartości "punktowe" w x_0 kolejnych pochodnych f^{(1)}(x_0), f^{(2)}(x_0), \ldots, f^{(n)}(x_0) wiedzę o zachowaniu funkcji f(x) do coraz szerszych otoczeń punktu x_0 powiększamy stosując logikę:

  • pochodna f^{(n)}(x_0) rzędu n w punkcie x_0 poszerza wiedzę o pochodnej f^{(n-1)}(x) rzędu n-1 do otoczenia punktu x_0;
  • tym samym wiedzę o f^{(n-2)}(x) poszerzamy do jeszcze większego otoczenia x_0;
  • i tak dalej, aż do pierwszej pochodnej, kończąc na zakodowanej informacji o funkcji wyjściowej.

Wielomian Taylora aproksymuje wartość funkcji poprzez aproksymowanie wartości jej kolejnych pochodnych.

Wspomniałem o tym już wcześniej, że gołym okiem we wzorze Taylora widać różniczki. Wszystko staje się znacznie jaśniejsze po wyznaczeniu kolejnych pochodnych wielomianu. Analizując poniższy schemat zwróć szczególną uwagę "jak wzór zwija się w lewo".

Pochodne wielomianu Taylora

Podstawiając x_0 do wzorów na pochodne wielomianu Taylora otrzymujemy oczywisty wniosek, że szacowane pochodne w punkcie x_0 będą zgodne z wyjściowymi wartościami pochodnych w punkcie x_0, co zapisujemy

T_n^{(k)}(x_0)=f^{(k)}(x_0)

k=0,1,\ldots,n

Wielomian Maclaurina

Wzór Maclaurina to szczególny przypadek wielomianu Taylora dla x_0=0 - reprezentuje więc rozwinięcie funkcji w otoczeniu punktu x_0=0.

T_n(x)=\displaystyle\sum_{k=0}^n\frac{f^{(k)}(0)}{k!}x^k

Rozwinięcie e^x w wielomian Maclaurina

f(x)=e^x, \quad f^{(k)}(x)=e^x

x_0=0, \quad f^{(k)}(0)=e^0=1

T_n(x)=\displaystyle\sum_{k=0}^n\frac{x^k}{k!}=1+x+\frac{x^2}{2!}+\ldots+\frac{x^n}{n!}

Reprezentacja e^x: 1, 1, 1, 1, 1, 1, 1, 1, ...

Rozwinięcie funkcji e^x w szereg Taylora / Maclaurina

Rozwinięcie \cos x w wielomian Maclaurina

f(x)=\cos x, \quad f(0)=1

f^\prime(x)=-\sin x\quad f^\prime(0)=0

f^{\prime\prime}(x)=-\cos x\quad f^{\prime\prime}(0)=-1

f^{(3)}(x)=\sin x\quad f^{(3)}(0)=0

f^{(4)}(x)=\cos x\quad f^{(4)}(0)=1

\cdots

Reprezentacja \cos x: 1, 0, -1, 0, 1, 0, -1, 0, ...

Rozwinięcie funkcji cosinus w szereg Taylora / Maclaurina

Szereg Taylora i Szereg Maclaurina

Dla funkcji nieskończenie wiele razy różniczkowalnych uzasadnione jest rozważanie nieskończonych wielomianów Taylora. Nieskończone sumy nazywamy szeregami, stąd

\displaystyle\sum_{n=0}^\infty\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n

nazywamy szeregiem Taylora, a

\displaystyle\sum_{n=0}^\infty\frac{f^{(n)}(0)}{n!}x^n

nazywamy szeregiem Maclaurina.

Tu w sposób naturalny pojawia się pytanie czy "nieskończony" wielomian Taylora jest zbieżny? Szereg Taylora jest szeregiem potęgowym, w związku z tym możliwe są trzy przypadki:

  • szereg jest zbieżny dla wszystkich x\in\mathbb{R};
  • szereg jest zbieżny na pewnym odcinku (x_0-r,x_0+r), poza tym odcinkiem szereg jest rozbieżny;
  • szereg jest zbieżny tylko w jednym punkcie x=x_0.

Do badania zbieżności wykorzystuje się kryteria zbieżności dla szeregów potęgowych  -po szczegóły kliknij tutaj.

Funkcja analityczna

Jeśli szereg Taylora (w otoczeniu dowolnego x_0\in A) funkcji f:A\subseteq\mathbb{R}\to\mathbb{R} jest zbieżny i jego granicą jest właśnie funkcja f, to o f mówimy, że jest analityczna na zbiorze A. Zachodzi wtedy zależność

f(x)=\displaystyle\sum_{n=0}^\infty\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n

Przykłady funkcji analitycznych w \mathbb{R}:

  • \sin x
  • \cos x
  • e^x

Przykład funkcji, której szereg Taylora jest zbieżny, ale jego granica jest różna od wyjściowej funkcji

Twierdzenie: Funkcja f:\mathbb{R}\to\mathbb{R} 

f(x)=\begin{cases}e^{-\frac{1}{x^2}}&\text{dla}\quad x\neq0\\0&\text{dla}\quad x=0\end{cases}

posiada rozwinięcie Taylora w otoczeniu x_0=0, które jest różne od f(x) dla każdego x\neq0.

Funkcja nieanalityczna

Funkcja f jest nieskończenie wiele razy różniczkowalna w punkcie x=0, gdzie f^{(n)}(0)=0, więc jej szereg Taylora będzie funkcją stałą o wartości 0, ale funkcja f(x)\neq0 dla x\neq0. Szczegóły znajdziesz w artykule "A Function which Does Not Equal its Taylor Series".

Przedłużenie analityczne funkcji

Rozważmy funkcję f:A\subset\mathbb{R}\to\mathbb{R} nieskończenie wiele razy różniczkowalną w punkcie x_0. Szereg Taylora funkcji f jest przedłużeniem analitycznym funkcji f na zbiór B\supset A jeśli

  • \displaystyle\sum_{n=0}^\infty\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n=f(x) dla każdego x\in A - tzn. szereg jest zbieżny do f w jej dziedzinie;
  • \displaystyle\sum_{n=0}^\infty\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n=g(x) dla każdego x\in B - tzn. szereg jest zbieżny do pewnej funkcji g:B\subset\mathbb{R}\to\mathbb{R} na zbiorze B, którego podzbiorem jest A;
  • f(x)=g(x) dla każdego x\in A - tzn. funkcje f i g są identyczne na dziedzinie funkcji f.

Przedłużenie funkcji

 

Analityczne przedłużanie funkcji stoi u podstaw analizy zespolonej, niesamowicie bogatej gałęzi matematyki.

Pozdrowienia,

Mariusz Gromada

Matematyka w obrazkach #19 - Oko Mandelbrota

W cyklu "Matematyka w obrazkach" - nowe logo MathSpace.pl

Motywacja

Motywując postać nowego logo przytoczę cytaty, którymi posłużyłem się otwierając serię o "Geometrii fraktalnej" - wpis "Fraktalne oblicze natury".

"Geometria fraktalna sprawi, że inaczej spojrzysz na świat. Ostrzegam - zgłębianie tej wiedzy wiąże się z niebezpieczeństwem. Ryzykujesz utratę części wyobrażeń z dzieciństwa - szczególnie tych dotyczących chmur, lasów, kwiatów, galaktyk, liści, piór, skał, gór, potoków, i wielu innych. Twoja interpretacja przyrody zmieni się całkowicie i na zawsze."

Michael F. Barnsley

 

"W kwestii fraktali zobaczyć znaczy uwierzyć"

Benoit Mandelbrot

 

Pozdrowienia,

Mariusz Gromada

Egzotyczna hiperkula - czyli o pomiarach w przestrzeni wielowymiarowej

"Jak oczami wyobraźni zobaczyć 4 wymiary? - zapytano matematyka.
To proste - odpowiedział - wystarczy wyobrazić sobie n-wymiarów i podstawić n=4"
🙂

Hipersześcian i Hiperkula - rzut

Dzisiejszy wpis poświęcę pomiarom odległości, powierzchni i pojemności w przestrzeniach wielowymiarowych. N-wymiarowa przestrzeń euklidesowa dostarcza dosyć oczywistą metrykę - a przez to wydawałoby się - bardzo intuicyjną. To wrażanie jest jednak mylne, co łatwo pokazać analizując wpływ zwiększania liczby wymiarów na dokonywane pomiary. Jak w zależności od liczby wymiarów zmienia się powierzchnia i objętość kuli? Analogicznie - jak zmienia się maksymalna odległość pomiędzy wierzchołkami kostki? Obiecuję - odpowiedzi będą zaskakujące 🙂

Możesz mieć wrażenie, że to wyłącznie abstrakcyjne rozważania. Czy na pewno? Ja w zasadzie na co dzień analizuję Klientów opisanych szeregiem miar. Poszukiwanie podobieństw, skupień, segmentów czy "najbliższych sąsiadów" niemal w całości opiera się na wielowymiarowej metryce euklidesowej. Zapraszam do pogłębienia wiedzy w tym obszarze:-) Zapewniam - warto!

Przestrzeń kartezjańska \mathbb{R}^n

Przestrzeń euklidesowa R^n

Przestrzeń kartezjańska \mathbb{R}^n to przestrzeń współrzędnych rzeczywistych

(x_1, x_2, \ldots, x_n)\in\mathbb{R}^n

z określoną metryką

d(\mathbb{x},\mathbb{y})=\sqrt{\sum_{i=1}^n(x_i-y_i)^2}

gdzie

\mathbb{x}=(x_1, x_2, \ldots, x_n)\in\mathbb{R}^n

\mathbb{y}=(y_1, y_2, \ldots, y_n)\in\mathbb{R}^n

Można powiedzieć, że metryka euklidesowa to pewna forma twierdzenia Pitagorasa.

Hipersześcian

Dla uproszczenia zdefiniujemy hipersześcian o długości boku a, którego jeden z wierzchołków to punkt 0, a inne wierzchołki składają się ze współrzędnych nieujemnych.

Hipersześcian o boku długości a to zbiór punktów

\mathbb{x}=(x_1, x_2, \ldots, x_n)\in\mathbb{R}^n

Spełniających zależność

\begin{cases}0\leq x_1\leq a\\0\leq x_2\leq a\\ \cdots\\0\leq x_n\leq a\end{cases}

Hipersześcian - wymiar od 1 do 4

Odcinek powstaje z "przesunięcia" punktu w dodatkowym nowym wymiarze. Kwadrat powstaje z odcinka poprzez "przesunięcie" odcinka w dodatkowym nowym wymiarze. Kostka powstaje z kwadratu poprzez przesunięcie kwadratu w dodatkowym nowym wymiarze. W tym postępowaniu uwidacznia się zależność rekurencyjna.

Hiperkula

Hiperkula to uogólnienie pojęcia kuli na n-wymiarów przy rozważaniu punktów w przestrzeni euklidesowej \mathbb{R}^n. Ponownie, dla uproszczenia, założymy, że środkiem kuli jest punkt 0.

Hiperkula o promieniu r to zbiór punktów

\mathbb{x}=(x_1, x_2, \ldots, x_n)\in\mathbb{R}^n

Spełniających zależność

d(0,\mathbb{x})=\sqrt{\sum_{i=1}^n x_i^2}\leq r

Hiperkula - wymiar od 1 do 4

Odcinek powstaje z "przesunięcia" punktu w dodatkowym nowym wymiarze. Koło powstaje z odcinka poprzez "przesunięcie" odcinka (jednocześnie odcinek zmienia długość) w dodatkowym nowym wymiarze. Kula powstaje z koła poprzez przesunięcie koła (jednocześnie koło zmienia promień) w dodatkowym nowym wymiarze. Ponownie w tym postępowaniu uwidacznia się zależność rekurencyjna, którą niebawem wykorzystamy.

Przydatna całka \displaystyle\int_{-r}^r\Big(r^2-x^2\Big)^y dx

Wszelkie niezbędne wzory będę wyznaczał korzystając z elementarnych całek. W okręgach, kołach, kulach często pojawiają się równania postaci (r^2-x^2)^y. Poniżej wyznaczę ogólny i pomocny wzór na całkę oznaczoną:

\displaystyle\int_{-r}^r\Big(r^2-x^2\Big)^y dx=\displaystyle\int_{-r}^r\Bigg[r^2\bigg(1-\Big(\frac{x}{r}\Big)^2\bigg)\Bigg]^y dx=

=r^{2y}\displaystyle\int_{-r}^r\bigg[1-\Big(\frac{x}{r}\Big)^2\bigg]^y dx=

={\scriptsize\begin{bmatrix}\frac{x}{r}=\sin t && t = \arcsin\frac{x}{r}\\x=r\sin t && t_{-r}=\arcsin\frac{-r}{r}=\arcsin(-1)=-\frac{\pi}{2}\\dx=r\cos t dt && t_r=\arcsin\frac{r}{r}=\arcsin(1)=\frac{\pi}{2}\end{bmatrix}}=

=r^{2y}\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\Big(1-\sin^2t\Big)^y r\cos t dt=

=r^{2y+1}\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2y}t\cos t dt=

=r^{2y+1}\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2y+1}t dt

Teraz skorzystamy z poniższej formuły redukcyjnej

\displaystyle\int\cos^nxdx=\frac{1}{n}\cos^{n-1}x\sin x+\frac{n-1}{n}\displaystyle\int\cos^{n-2}xdx

Z wyprowadzeniem powyższego wzoru można zapoznać się np. w filmie "Calculus - Reduction Formula for Powers of Cosine".

Podstawiając otrzymujemy

\displaystyle\int_{-r}^r\Big(r^2-x^2\Big)^y dx=

=\frac{r^{2y+1}}{2y+1}\Bigg(\Big[\cos^{2y}t\sin t\Big]_{-\frac{\pi}{2}}^\frac{\pi}{2}+2y\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2y-1}t dt\Bigg)=

={\scriptsize\frac{r^{2y+1}}{2y+1}\Bigg(\cos^{2y}\frac{\pi}{2}\sin\frac{\pi}{2}-\cos^{2y}\big(-\frac{\pi}{2}\big)\sin\big(-\frac{\pi}{2}\big)+2y\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2y-1}t dt\Bigg)}=

=\frac{r^{2y+1}}{2y+1}\Bigg(0\cdot 1-0\cdot\big(-1\big)+2y\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2y-1}t dt\Bigg)=

=\frac{2y}{2y+1}r^{2y+1}\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2y-1}t dt

Ostatecznie

{\small\displaystyle\int_{-r}^r\Big(r^2-x^2\Big)^y dx=\frac{2y}{2y+1}r^{2y+1}\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2y-1}t dt}

Jest to wzór warty zapamiętania 🙂

Uogólnienie wzoru na objętość kuli

W uogólnieniu wzoru na objętość kuli n-wymiarowej pomaga zrozumienie zależności rekurencyjnej (pisałem o tym definiując hipersześcian i hiperkulę), dosyć oczywistej gdy się rozważa postać i objętość kuli krok po kroku, tzn. zaczynając od wymiaru 1, przechodząc przez wymiary 2 i 3.

Objętość kuli o wymiarze n = 1

Można powiedzieć, że kula o wymiarze 1 (czyli odcinek) powstaje z przesunięcia punktu (który ma wymiar 0), wzdłuż nowego wymiaru X w zakresie x\in[-R,R]

Kula - wymiar 1

{\Large V_R^{\dim 1}=2R}

Objętość kuli o wymiarze n = 2

Mając odcinek (kulę o wymiarze 1), przesuwając go wzdłuż nowego wymiaru X w zakresie x\in[-R,R], dostosowując jednocześnie jego długość (czyli promień kuli o wymiarze 1), otrzymujemy koło - tzn. kulę o wymiarze 2.

Kula - wymiar 2

V_R^{\dim 2}=\displaystyle\int_{-R}^R V_{r(x)}^{\dim 1}dx=

=\displaystyle\int_{-R}^R 2r(x)dx=2\displaystyle\int_{-R}^R \Big(R^2-x^2\Big)^\frac{1}{2}dx=...

Stosujemy wcześniej wyprowadzony wzór dla y=\frac{1}{2}

...=2\frac{2\cdot\frac{1}{2}}{2\cdot\frac{1}{2}+1}R^{2\cdot\frac{1}{2}+1}\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2\cdot\frac{1}{2}-1}t dt=

=2\frac{1}{2}R^2\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^0t dt=

=R^2\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}dt=R^2\Big[t\Big]_{-\frac{\pi}{2}}^\frac{\pi}{2}=

=R^2\Big(\frac{\pi}{2}+\frac{\pi}{2}\Big)=\pi R^2

{\Large V_R^{\dim 2}=\pi R^2}

Objętość kuli o wymiarze n = 3

Procedura jest analogiczna. Przesuwając koło (czyli kulę o wymiarze 2) wzdłuż nowego wymiaru X w zakresie x\in[-R,R], jednocześnie zmieniając odpowiednio promień koła, otrzymujemy kulę o wymiarze 3.

Kula - wymiar 3

V_R^{\dim 3}=\displaystyle\int_{-R}^R V_{r(x)}^{\dim 2}dx=

=\displaystyle\int_{-R}^R \pi r^2(x)dx=\pi\displaystyle\int_{-R}^R \Big(\sqrt{R^2-x^2}\Big)^2dx=

=\pi\displaystyle\int_{-R}^R \big(R^2-x^2\big)dx=...

Jak widać jest to całka zupełnie elementarna, nie ma konieczności stosowania wcześniej wyprowadzonego wzoru. Ja to jednak uczynię aby potwierdzić, że poprzednio otrzymana formuła jest prawdziwa w każdym przypadku 🙂

Stosując elementarną całkę

...=\pi\Bigg(\Big[R^2x\Big]_{-R}^R-\Big[\frac{x^3}{3}\Big]_{-R}^R\Bigg)

=\pi\Bigg(\Big[R^2R-R^2(-R)\Big]-\frac{R^3-(-R^3)}{3}\Bigg)=

\pi\bigg(2R^3-\frac{2R^3}{3}\bigg)=\pi\bigg(\frac{6R^3}{3}-\frac{2R^3}{3}\bigg)=\pi\frac{4R^3}{3}

{\Large V_R^{\dim 3}=\frac{4}{3}\pi R^3}

Stosując wcześniej wyprowadzony wzór dla y=1

...=\pi\displaystyle\int_{-R}^R \big(R^2-x^2\big)^1dx=

=\pi \frac{2\cdot 1}{2\cdot 1+1}R^{2\cdot 1+1}\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2\cdot 1-1}t dt=

=\pi \frac{2}{3}R^3\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos t dt=\pi \frac{2}{3}R^3\Big[\sin t\Big]_{-\frac{\pi}{2}}^\frac{\pi}{2}=

=\pi \frac{2}{3}R^3\Big(\sin\frac{\pi}{2}-\sin(-\frac{\pi}{2})\Big)=\pi \frac{2}{3}R^3\Big(1-(-1)\Big)=

=\pi \frac{2}{3}R^3\big(2\big)=\frac{4}{3}\pi R^3

{\Large V_R^{\dim 3}=\frac{4}{3}\pi R^3}

Objętość kuli o wymiarze n - uogólnienie

Na bazie przypadków 1, 2, 3 wymiarowych ujawniła się procedura rekurencyjna pozwalająca tworzyć hiperkulę wymiaru n z hiperkuli wymiary n-1. Zwyczajnie "przesuwamy" hiperkulę wymiaru n-1 w nowym wymiarze X w zakresie x\in[-R,R], dostosowując jej promień r(x)=\sqrt{R^2-x^2}, gdzie R jest niezmiennym promieniem hiperkuli.

{\small V_R^{\dim n}=\begin{cases}2R&\text{dla}\quad n=1\\ \displaystyle\int_{-R}^R V_{r(x)=\sqrt{R^2-x^2}}^{\dim n-1}dx&\text{dla}\quad n>1\end{cases}}

Objętość kuli o wymiarze n = 4

V_R^{\dim 4}=\displaystyle\int_{-R}^R V_{r(x)}^{\dim 3}dx=

=\displaystyle\int_{-R}^R\frac{4}{3}\pi r^3(x)dx=\frac{4}{3}\pi\displaystyle\int_{-R}^R \Big(R^2-x^2\Big)^\frac{3}{2}dx=...

Stosujemy wzór dla y=\frac{3}{2}

...=\frac{4}{3}\pi\frac{2\cdot\frac{3}{2}}{2\cdot\frac{3}{2}+1}R^{2\cdot\frac{3}{2}+1}\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^{2\cdot\frac{3}{2}-1}t dt=

=\frac{4}{3}\pi\frac{3}{4}R^4\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^2t dt=

=\pi R^4\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^2t dt=...

Całkę \displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^2t dt możemy oczywiście liczyć, ale łatwiej i szybciej zauważyć, że

\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^2t+\sin^2tdt=\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}dt=\pi

i że połowa tego "prostokąta" przypada dla \displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^2t dt, zatem

\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^2t dt=\frac{\pi}{2}

Podstawiając do

...=\pi R^4\displaystyle\int_{-\frac{\pi}{2}}^\frac{\pi}{2}\cos^2t dt=\pi R^4\frac{\pi}{2}=\frac{\pi^2}{2}R^4

{\Large V_R^{\dim 4}=\frac{\pi^2}{2}R^4}

Hiperkula wpisana w hipersześcian

Wyznaczyliśmy, że:

  • dla 1 wymiaru V_R^{\dim 1}=2R
  • dla 2 wymiarów V_R^{\dim 2}=\pi R^2
  • dla 3 wymiarów V_R^{\dim 3}=\frac{4}{3}\pi R^3
  • dla 4 wymiarów V_R^{\dim 4}=\frac{\pi^2}{2}R^4

5-ty i większy wymiar można wyznaczyć analogicznie, poniżej podam gotowe wzory opublikowane na Wikipedii.

  • dla 5 wymiarów V_R^{\dim 5}=\frac{8}{15}\pi^2R^5
  • dla 6 wymiarów V_R^{\dim 6}=\frac{\pi^3}{6}R^6
  • dla 7 wymiarów V_R^{\dim 7}=\frac{16}{105}\pi^3R^7
  • dla 8 wymiarów V_R^{\dim 8}=\frac{\pi^4}{24}\pi^8R^5
  • dla 9 wymiarów V_R^{\dim 9}=\frac{32}{945}\pi^4R^9
  • dla 10 wymiarów V_R^{\dim 10}=\frac{\pi^5}{120}\pi^2R^{10}
  • ...
  • dla n wymiarów V_R^{\dim n}=\frac{\pi^\frac{n}{2}}{\Gamma(\frac{n}{2}+1)}R^n

Jeśli krawędź n-wymiarowego hipersześcianu ma długość a, to jego objętość wynosi a^n. Promień hiperkuli wpisanej w hipersześcian będzie stanowił połowę długości krawędzi hipersześcianu, tzn. R=\frac{a}{2}.

Zadziwiające, objętość kuli wpisanej w hipersześcian "znika" wraz ze wzrostem liczby wymiarów, i ten zanik postępuje na prawdę szybko!!

Aby wyjaśnić ten fenomen należy zauważyć, że wraz ze wzrostem liczby wymiarów rośnie odległość "po przekątnej" do wymiarów, przy jednoczesnym zachowaniu odległości wzdłuż wymiarów. Maksymalna długość "przekątnej" w hipersześcianie jednostkowym (o krawędzi długości 1) będzie równa \sqrt{n}, gdzie n oznacza liczbę wymiarów. Wynika to bezpośrednio z zaaplikowania metryki do wierzchołków \mathbb{0}=(0,0,\ldots,0) i \mathbb{1}=(1,1,\ldots,1).

W konsekwencji objętość hipersześcianu kumuluje się w okolicach jego wierzchołków, zaś kula wpisana leży w jego środku stykając się ze wszystkimi jego ścianami.

Objętość hiperkuli jednostkowej

Kolejna ciekawostka kryje się w objętości hiperkuli jednostkowej (o promieniu 1). Okazuje się, że ta objętość jest najwyższa dla 5 wymiarowej przestrzeni.

Objętość hiperkuli jednostkowej - zależność od liczby wymiarów

Do liczby wymiarów n=5 objętość hiperkuli jednostkowej rośnie, w 5-tym wymiarze osiąga maksimum, powyżej 5-tego wymiaru objętość systematycznie spada, w granicy osiągając wartość 0.

Ciekawostka: jeśli rozważyć powierzchnię hiperkuli n-wymiarowej (czyli hipersfery n-1 wymiarowej) to powierzchnia będzie najwyższa dla hipersfery 6-wymiarowej, czyli hiperkuli 7-wymiarowej. Powyżej 7 wymiaru powierzchnia zaczyna spadać z granicą w nieskończoności równą 0.  Powierzchnię hiperkuli można wyznaczyć poprzez pochodną objętości względem promienia.

Na koniec

Przestrzenie wielowymiarowe, nawet te z bardzo intuicyjną metryką, skrywają wiele tajemnic. Dziś odkryliśmy tylko kilka 🙂 Mam nadzieję, że Wam się podobało!

Pozdrowienia,

Mariusz Gromada