AstronomieAntwoorden
Vergelijking van Kepler


[AA] [Woordenboek] [Antwoordenboek] [UniversumFamilieBoom] [Wetenschap] [Sterrenhemel] [Planeetstanden] [Reken] [Colofon]

1. De Vergelijking van Kepler ... 1.1. Ellipsbanen ... 1.2. Paraboolbanen ... 1.3. Hyperboolbanen ... 2. Hulpgrootheden ... 3. Afstand en coördinaten ... 4. Samenvatting ... 5. Grafieken van anomalieën ... 6. Enige Specifieke Oplossingen ... 7. Vind een oplossing ... 7.1. Verbeter de schatting ... 7.1.1. Eerste-ordemethode ... 7.1.2. Tweede-ordemethode ... 7.2. Hoeveel herhalingen hebben we nodig? ... 7.3. Stopcriterium ... 7.4. Beginschatting ... 7.4.1. Kleine excentrische anomalie ... 7.4.2. Grote excentrische anomalie ... 7.4.3. Gecombineerd ... 7.5. Hoe kies je de juiste beginschatting?

\( \DeclareMathOperator{\sgn}{sgn} \DeclareMathOperator{\d}{d} \DeclareMathOperator{\artanh}{artanh} \DeclareMathOperator{\arsinh}{arsinh} \DeclareMathOperator{\arcosh}{arcosh} \DeclareMathOperator{\del}{∆\!} \newcommand{\pdd}[2]{\frac{\partial #1}{\partial #2}} \)

1. De Vergelijking van Kepler

De vergelijking van Kepler is een vergelijking die voor hemellichamen in een ellipsbaan onder de invloed van zwaartekracht het verband tussen de tijd en de plaats aangeeft. Er zijn soortgelijke vergelijkingen voor paraboolbanen en voor hyperboolbanen, die we hier voor het gemak ook vergelijkingen van Kepler noemen.

Met de vergelijking van Kepler kun je de tijd uitrekenen waarop een bepaalde plaats bereikt wordt. Als je de andere kant op wil (dus uitrekenen waar het voorwerp is op een bepaalde tijd), dan gaat dat voor ellipsbanen en hyperboolbanen helaas niet als een berekening met een klein aantal waarden van bekende functies, maar alleen door eerst een oplossing te gokken en dan de echte oplossing steeds dichter te benaderen tot hij niet meer beter kan.

Met behulp van de methoden die hieronder beschreven zijn kun je de ware anomalie \( ν \) uitrekenen, die de positie van de planeet (of ander hemellichaam) in zijn baan rond de Zon (of ander hemellichaam) aangeeft. De ware anomalie is de hoek tussen de richting van het perifocus en de richting van de planeet, gezien vanuit het brandpunt van de baan. De beschreven methode heeft (voor dubbeleprecisie-zwevendekommagetallen, tot een relatieve nauwkeurigheid van ongeveer 2 × 10−16) hooguit 6 iteraties nodig.

1.1. Ellipsbanen

Voor een ellipsbaan is de excentriciteit \( e \) groter of gelijk aan 0 en kleiner dan 1. De middelbare anomalie \( M \), excentrische anomalie \( E \) en ware anomalie \( ν \) (griekse letter 'nu') van een voorwerp in een ellipsbaan worden bepaald door

\begin{align} M & = t\sqrt{\frac{Γ}{a^3}} \\ M & = E − e \sin(E) \label{eq:ekepler} \\ τ & ≡ \tan\left( \frac{1}{2}ν \right) = \sqrt{\frac{1 + e}{1 − e}} \tan\left( \frac{1}{2}E \right) \label{eq:eEtoν} \end{align}

waar \( a \) de afmeting van de halve lange as van de baan is, \( Γ \) (griekse hoofdletter 'gamma') de zwaartekrachtparameter van het systeem, \( t \) de tijd sinds de (laatste) perifocusdoorgang, \( e \) de excentriciteit van de baan, en alle hoeken in radialen gemeten zijn (2π radialen zijn gelijk aan 360 graden). \( M \) neemt toe met een constante snelheid (met 2π radialen per baanperiode) en is dus een maat voor de tijd. \( ν \) is de hoekafstand van het voorwerp tot zijn perfocus (gezien vanuit het brandpunt).

Vergelijking \eqref{eq:ekepler} is de vergelijking van Kepler (voor ellipsbanen). Het probleem is dat we \( E \) willen weten als we \( M \) en \( e \) kennen, en die vergelijking is niet om te schrijven naar een vorm \( E = … \) waarin de rechterkant een eindige verzameling van termen bevat waar \( E \) zelf niet in voorkomt.

1.2. Paraboolbanen

Voor een paraboolbaan is de excentriciteit \( e \) precies gelijk aan 1. Voor zo'n baan is wel een methode om direct de positie op een bepaald moment te vinden, zonder benaderingen. Dat is de methode van Barker:

\begin{align} W & = t\sqrt{\frac{9Γ}{8q^3}} = \frac{3}{2\sqrt{2}} t\sqrt{\frac{Γ}{q^3}} = \frac{3}{2\sqrt{2}} M_q \label{eq:pkepler} \\ u & = \sqrt[3]{W + \sqrt{W^2 + 1}} \\ τ & ≡ \tan\left( \frac{1}{2}ν \right) = u − \frac{1}{u} \end{align}

Voor \( M_q \) zie vergelijking \eqref{eq:M_q}.

1.3. Hyperboolbanen

Voor een hyperboolbaan is de excentriciteit \( e \) groter dan 1.

\begin{align} M & = t\sqrt{\frac{Γ}{|a|^3}} \\ M & = e \sinh E − E \label{eq:hkepler} \\ τ & ≡ \tan\left( \frac{1}{2}ν \right) = \sqrt{\frac{e + 1}{e − 1}} \tanh\left( \frac{1}{2}E \right) \label{eq:hEtoν} \end{align}

Vergelijking \eqref{eq:hkepler} heeft hetzelfde probleem als vergelijking \eqref{eq:ekepler}.

2. Hulpgrootheden

We definiëren een paar grootheden die handig zijn voor later gebruik. Ten eerste het parabolisch overschot, de hoeveelheid waarmee de excentriciteit groter is dan die van een paraboolbaan:

\begin{equation} δ ≡ e − 1 \label{eq:δ} \end{equation}

Daarna de perifocale afstand \( q \), de afstand tussen het brandpunt en het perifocus van de baan. Het brandpunt van de baan is het punt waaromheen het hemellichaam beweegt. Het perifocus is het punt in de baan dat het dichtste bij het brandpunt is.

\begin{equation} q ≡ |a| |1 − e| = |a| |δ| \end{equation}

Dan de perifocale anomalie \( M_q \), die vergelijkbaar is met de middelbare anomalie maar gebaseerd op de perifocale afstand \( q \) in plaats van op de lengte \( a \) van de halve lange as:

\begin{equation} M_q ≡ t \sqrt{\frac{Γ}{q^3}} = \frac{M}{\sqrt{|δ|^3}} \label{eq:M_q} \end{equation}

en als laatste de perifocale excentrische anomalie \( E_q \), gedefinieerd als

\begin{equation} E_q ≡ \frac{E}{\sqrt{|δ|}} \label{eq:E_q} \end{equation}

3. Afstand en coördinaten

Het is niet altijd nodig om de ware anomalie \( ν \) uit te rekenen. Als je eigenlijk alleen de afstand en/of rechthoekige coördinaten wilt uitrekenen dan kan dat via \( τ \) zonder \( ν \) ― en dat scheelt weer een paar trigonometrische functieaanroepen.

Gegeven \( τ = \tan\left( \frac{1}{2}ν \right) \), de excentriciteit \( e \), en de perifocusafstand \( q = a |1 − e| \) tussen brandpunt en perifocus is de afstand \( r \) tussen brandpunt en hemellichaam voor alle cirkel-, ellips-, parabool- en hyperboolbanen:

\begin{align} ρ & = \frac{1 + e}{1 + e + (1 − e)τ^2} \\ r & = qρ (1 + τ^2) \notag \\ & = q \frac{(1 + e) (1 + τ^2)}{1 + e + (1 − e) τ^2} \\ & = q \frac{1 + e}{1 + e \cos ν} \end{align}

Voor ellipsbanen:

\begin{eqnarray} r & = & q \frac{1 − e \cos E}{1 − e} \\ x & = & q \frac{\cos(E) − e}{|e − 1|} \\ y & = & q \sqrt{\frac{1 + e}{1 − e}} \sin(E) \end{eqnarray}

Voor paraboolbanen:

\begin{align} r & = q \frac{2}{1 + \cos ν} \notag \\ & = q (1 + τ^2) \end{align}

Voor hyperboolbanen:

\begin{eqnarray} r & = & q\frac{e \cosh(E) − 1}{e − 1} \\ x & = & q \frac{e − \cosh(E)}{e − 1} \\ y & = & q \sqrt{\frac{e + 1}{e − 1}} \sinh(E) \end{eqnarray}

Als je \( τ = \tan\left( \frac{1}{2}ν \right) \) kent, dan kun je daaruit \( \sin(ν) \) en \( \cos(ν) \) uitrekenen:

\begin{align} \sin(ν) & = \frac{2τ}{1 + τ^2} \\ \cos(ν) & = \frac{1 − τ^2}{1 + τ^2} \end{align}

en daarmee de coördinaten van het hemellichaam (in het baanvlak):

\begin{align} x & = r \cos(ν) = qρ (1 − τ^2) = q \frac{(1 + e) (1 − τ^2)}{1 + e + (1 − e) τ^2} \label{eq:coords} \\ y & = r \sin(ν) = 2qρτ = q \frac{2 (1 + e) τ}{1 + e + (1 − e) τ^2} \end{align}

4. Samenvatting

Hier is de samenvatting van de methode die verderop in detail uitgelegd wordt. De opdracht is om de ware anomalie \( ν \) en \( τ ≡ \tan(ν/2) \) uit te rekenen voor tijdstip \( t \) (sinds perifocusdoorgang) voor een hemellichaam in een baan met halve lange as \( a \) of perifocale afstand \( q \) en excentriciteit \( e \) en zwaartekrachtparameter \( Γ \).

  1. Als \( e = 0 \) (voor een cirkelbaan), dan is

    \begin{eqnarray} ν & = & E = M = M_q \\ τ & = & \tan\left( \frac{ν}{2} \right) \end{eqnarray}

  2. Bereken het parabolische overschot \( δ \) en de perifocale afstand \( q \) (als die niet al gegeven is):

    \begin{eqnarray} δ & = & e − 1 \\ q & = & \left|\frac{a}{δ}\right| \end{eqnarray}

  3. Als \( e ≠ 1 \) (voor een niet-paraboolbaan), bereken dan de lengte \( a \) van de halve lange as (als die niet al gegeven is):

    \begin{equation} a = \frac{q}{|δ|} \end{equation}

    Bereken dan de middelbare anomalie \( M \):

    \begin{equation} M = t\sqrt{\frac{Γ}{a^3}} \end{equation}

    Als \( e \lt 1 \) (voor een ellipsbaan) reduceer dan \( M \) tot het interval van −π tot +π:

    \begin{equation} M ← M − 2π\left[ \frac{M}{2π} \right] \end{equation}

    waarin \( [ … ] \) staat voor "rond af naar het dichtstbijzijnde hele getal".

  4. Bereken de perifocale anomalie \( M_q \):

    \begin{eqnarray} M_q & = & \frac{M}{\sqrt{|δ|^3}} & \qquad (e ≠ 1) \\ M_q & = & t\sqrt{\frac{Γ}{q^3}} \end{eqnarray}

  5. Als \( e = 1 \) (voor een paraboolbaan) bereken dan \( τ \) en de ware anomalie \( ν \):

    \begin{eqnarray} W & = & \sqrt{\frac{9}{8}} M_q \\ u & = & \sqrt[3]{W + \sqrt{W^2 + 1}} \\ τ & = & u − \frac{1}{u} \\ ν & = & 2\arctan(τ) \end{eqnarray}

    Nu ben je klaar.

  6. Bereken anders (als \( e ≠ 1 \)) de beginschatting voor kleine anomalie:

    \begin{eqnarray} P & = & \frac{2}{e} \\ Q & = & \frac{3M_q}{e} \\ u & = & \sqrt[3]{Q + \sqrt{Q^2 + P^3}} \\ E_q & = & u − \frac{P}{u} \\ E_s & = & E_q\sqrt{|δ|} \end{eqnarray}

    Als \( e \lt 1 \) (voor ellipsbanen) dan gebruiken we deze beginschatting en we noemen die \( E_0 \).

  7. Als \( e \gt 1 \) (voor hyperboolbanen), bereken dan ook de beginschatting voor grote anomalie:

    \begin{equation} E_h = \arsinh\left( \frac{M}{e} \right) \end{equation}

    Als

    \[ |E_h| \lt 0.53 |e \sinh(E_s) − E_s − M| \]

    dan gebruiken we verder de beginschatting \( E_h \), en anders de beginschatting \( E_s \). We noemen de gekozen beginschatting \( E_0 \).

  8. Zet \( i = 0 \).
  9. Als \( e \lt 1 \) (voor ellipsbanen), bereken dan

    \begin{eqnarray} s_i & = & e \sin(E_i) \\ c_i & = & 1 − e \cos(E_i) \\ d_i & = & E_i − s_i − M \end{eqnarray}

    Als \( e \gt 1 \) (voor hyperboolbanen), bereken dan

    \begin{eqnarray} s_i & = & e \sinh(E_i) \\ c_i & = & e \cosh(E_i) − 1 \\ d_i & = & s_i − E_i − M \end{eqnarray}

    Bereken dan voor \( e ≠ 1 \)

    \begin{eqnarray} \del E_i & = & \frac{d_i}{c_i} \\ B_i & = & \left| \frac{2εE_ic_i}{s_i} \right| \\ E_{i+1} & = & E_i − \del E_i \end{eqnarray}

    Als \( \del E_i^2 \lt B_i \), stop dan. Zet anders \( i ← i + 1 \) en herhaal deze stap.

  10. De laatst gevonden \( E_i \) is de \( E \) die we zoeken.

    Als \( e \lt 1 \) (voor ellipsbanen), bereken dan

    \begin{equation} τ = \sqrt{\frac{e + 1}{|δ|}} \tan\left( \frac{1}{2}E \right) \end{equation}

    en als \( e \gt 1 \) (voor hyperboolbanen), bereken dan

    \begin{equation} τ = \sqrt{\frac{e + 1}{|δ|}} \tanh\left( \frac{1}{2}E \right) \end{equation}

    Bereken daarna

    \begin{equation} ν = 2 \arctan(τ) \end{equation}

    Nu ben je klaar.

  11. De waarden van \( B_i \) zijn in de praktijk voor alle \( i \) ongeveer hetzelfde, en de precieze waarde is niet verschrikkelijk belangrijk, dus als rekensnelheid heel belangrijk is dan zou je kunnen overwegen om alleen \( B_0 \) uit te rekenen en die te gebruiken in plaats van \( B_i \).

Hier zijn wat voorbeelden. We rekenen met \( t = 1 \), \( Γ = 1 \), \( q = 1 \) en \( ε = 2.2×10^{−16} \), behalve waar wat anders genoemd wordt. In onderstaande formules schrijf ik de getallen met tot 5 significante cijfers, maar in de berekeningen neem ik alle significante cijfers mee.

Met \( e = 1 \) vinden we

\begin{eqnarray*} M_q & = & 1 × \sqrt{\frac{1}{1^3}} & = 1 \\ W & = & \sqrt{\frac{9}{8}} × 1 & = 1.0607 \\ u & = & \sqrt[3]{1.0607 + \sqrt{1.0607^2 + 1}} & = 1.3605 \\ τ & = & 1.3605 − \frac{1}{1.3605} & = 0.62552 \\ ν & = & 2\arctan(0.6255) & = 1.1179 \end{eqnarray*}

Met \( e = 0.99 \) vinden we

\begin{eqnarray*} δ & = & 0.99 − 1 & = −0.01 \\ a & = & \frac{1}{0.01} & = 100 \\ M & = & 1 × \sqrt{\frac{1}{100^3}} & = 0.001 \\ M & ← & 0.001 − 2π\left[ \frac{0.001}{2π} \right] & = 0.001 \\ M_q & = & 1 × \sqrt{\frac{1}{1^3}} & = 1 \\ P & = & \frac{2}{0.99} & = 2.0202 \\ Q & = & \frac{3×1}{0.99} & = 3.0303 \\ u & = & \sqrt[3]{3.0303 + \sqrt{3.0303^2 + 2.0202^3}} & = 1.9314 \\ E_q & = & 1.9314 − \frac{2.0202}{1.9314} & = 0.88545 \\ E_s & = & 0.88545 \sqrt{0.01} & = 0.088545 \\ E_0 & & & = 0.088545 \\ s_0 & = & 0.99\sin(0.088545) & = 0.087545 \\ c_0 & = & 1 − 0.99 \cos(0.088545) & = 0.013878 \\ d_0 & = & 0.088545 − 0.087545 − 0.001 & = −4.4895 × 10^{−8} \\ \del E_0 & = & \frac{−4.4895 × 10^{−8}}{0.013878} & = −3.2349 × 10^{−6} \\ B_0 & = & \left| \frac{2 × 2.2 × 10^{−16} × 0.088545 × 0.013878}{0.087545} \right| & = 7.0401 × 10^{−17} \\ E_1 & = & 0.088545 − (−3.32349 × 10^{−6}) & = 0.088549 \end{eqnarray*}

We vinden \( \del E_0^2 \gt |B_0| \) dus we hebben \( E \) nog niet gevonden. Dan

\begin{eqnarray*} s_1 & = & 0.99\sin(0.088549) & = 0.087549 \\ c_1 & = & 1 − 0.99 \cos(0.088549) & = 0.013879 \\ d_1 & = & 0.088549 − 0.087549 − 0.001 & = 4.5806 × 10^{−13} \\ \del E_1 & = & \frac{4.5806 × 10^{−13}}{0.013879} & = 3.3005 × 10^{−11} \\ B_1 & = & \left| \frac{2 × 2.2 × 10^{−16} × 0.088542 × 0.013879}{0.087549} \right| & = 7.0399 × 10^{−17} \\ E_2 & = & 0.088549 − 3.3005 × 10^{−11} & = 0.088549 \end{eqnarray*}

Nu is \( \del E_1^2 \lt |B_1| \) dus we hebben \( E \) gevonden. Even controleren:

\[ E − e \sin(E) = 0.088549 − 0.99 \sin(0.088549) = 0.0010000 = M \]

Dan

\begin{eqnarray*} E & & & = 0.088549 \\ τ & = & \sqrt{\frac{1.99}{0.01}} \tan\left( \frac{0.088549}{2} \right) & = 0.62497 \\ ν & = & 2\arctan(0.62497) & = 1.1172 \end{eqnarray*}

Nu bekijken we \( e = 2 \) en \( t = 100 \). Dan

\begin{eqnarray*} δ & = & 2 − 1 & = 1 \\ a & = & \frac{1}{1} & = 1 \\ M & = & 100 × \sqrt{\frac{1}{1^3}} & = 100 \\ M & ← & 100 − 2π\left[ \frac{100}{2π} \right] & = 100 \\ M_q & = & 100 × \sqrt{\frac{1}{1^3}} & = 100 \\ P & = & \frac{2}{2} & = 2 \\ Q & = & \frac{3×100}{2} & = 150 \\ u & = & \sqrt[3]{150 + \sqrt{150^2 + 2^3}} & = 6.6944 \\ E_q & = & 6.6944 − \frac{2}{6.6944} & = 6.5450 \\ E_s & = & 6.5450 \sqrt{1} & = 6.5450 \\ E_h & = & \arsinh\left( \frac{100}{2} \right) & = 4.6053 \end{eqnarray*}

Nu is \( |E_h| \lt 0.53 |e\sinh(E_s) − E_s − M| \) dus \( E_0 = E_h \).

\begin{eqnarray*} E_0 & & & = 4.6053 \\ s_0 & = & 2\sinh(4.6053) & = 100 \\ c_0 & = & 2 \cosh(4.6053) − 1 & = 99.020 \\ d_0 & = & 100 − 4.6053 − 100 & = −4.6053 \\ \del E_0 & = & \frac{−4.6053}{99.020} & = −0.046508 \\ B_0 & = & \left| \frac{2 × 2.2 × 10^{−16} × 4.6053 × 99.010}{100} \right| & = 4.3974 × 10^{−16} \\ E_1 & = & 4.6053 − (−0.046508) & = 4.6518 \\ s_1 & = & 2\sinh(4.6518) & = 104.76 \\ c_1 & = & 2 \cosh(4.6518) − 1 & = 103.78 \\ d_1 & = & 104.76 − 4.6518 − 100 & = 0.10985 \\ \del E_1 & = & \frac{0.10985}{103.78} & = 0.0010585 \\ B_1 & = & \left| \frac{2 × 2.2 × 10^{−16} × 4.6518 × 103.78}{104.76} \right| & = 4.3993 × 10^{−16} \\ E_2 & = & 4.6518 − 0.0010585 & = 4.6507 \\ s_2 & = & 2\sinh(4.6507) & = 104.65 \\ c_2 & = & 2 \cosh(4.6507) − 1 & = 103.67 \\ d_2 & = & 104.65 − 4.6507 − 100 & = 5.8664 × 10^{−5} \\ \del E_2 & = & \frac{5.8664 × 10^{−5}}{103.67} & = 5.6588 × 10^{−7} \\ B_2 & = & \left| \frac{2 × 2.2 × 10^{−16} × 4.6507 × 103.67}{104.65} \right| & = 4.3993 × 10^{−16} \\ E_3 & = & 4.6507 − 5.6588 × 10^{−7} & = 4.6507 \\ s_3 & = & 2\sinh(4.6507) & = 104.65 \\ c_3 & = & 2 \cosh(4.6507) − 1 & = 103.67 \\ d_3 & = & 104.65 − 4.6507 − 100 & = 1.6712 × 10^{−11} \\ \del E_3 & = & \frac{1.6712 × 10^{−11}}{103.67} & = 1.6120 × 10^{−13} \\ B_3 & = & \left| \frac{2 × 2.2 × 10^{−16} × 4.6507 × 103.67}{104.65} \right| & = 4.3993 × 10^{−16} \\ E_4 & = & 4.6507 − 1.6120 × 10^{−13} & = 4.6507 \end{eqnarray*}

Nu is \( \del E_3^2 \lt |B_3| \) dus we hebben \( E \) gevonden. Even controleren:

\[ e \sinh(E) − E = 2 \sinh(4.6507) − 4.6507 = 100.00 = M \]

Dan

\begin{eqnarray*} E & & & = 4.6507 \\ τ & = & \sqrt{\frac{3}{1}} \tan\left( \frac{4.6507}{2} \right) & = 1.6993 \\ ν & = & 2\arctan(1.6993) & = 2.0778 \end{eqnarray*}

5. Grafieken van anomalieën

Fig. 1: Vergelijking van Kepler: ν voor M en e
Fig. 1: Vergelijking van Kepler: ν voor M en e

Figuur 1 toont de ware anomalie \( ν \) (met kleurcodering) als functie van de middelbare anomalie \( M \) op de verticale as en excentriciteit \( e \) op de horizontale as. De ware anomalie is wat we zoeken. Het oplossen van de vergelijking van Kepler is een stap op weg daar naartoe.

Het witte gebied links bovenin komt overeen met \( M \gt π \) voor ellipsbanen (\( e \lt 1 \)), waarvoor geen oplossing nodig is omdat voor ellipsbanen \( M \) altijd kan worden teruggebracht tot het interval van −π tot +π om dezelfde oplossing te geven. Voor hyperboolbanen (\( e \gt 1 \)) kan de middelbare anomalie willekeurig groot worden. De ware anomalie wordt niet groter dan π ≈ 3.14.

De witte verticale lijn op \( e = 1 \) is voor paraboolbanen. Voor een paraboolbaan is geen middelbare anomalie gedefinieerd.

Het is duidelijk dat voor bijna-paraboolbanen (\( e ≈ 1 \)) de ware anomalie voor een bepaalde middelbare anomalie heel sterk afhangt van de excentriciteit.


Fig. 2: Vergelijking van Kepler: E voor M en e
Fig. 2: Vergelijking van Kepler: E voor M en e

Figuur 2 is als de vorige grafiek maar toont excentrische anomalie \( E \) in plaats van ware anomalie \( ν \). Voor ellipsbanen (\( e \lt 1 \)) wordt de excentrische anomalie niet groter dan π, net als voor \( ν \). Voor hyperboolbanen (\( e \gt 1 \)) kan de excentrische anomalie willekeurig groot worden.

Net als in de vorige grafiek is de verticale witte lijn op \( e = 1 \) voor een paraboolbaan. Voor een paraboolbaan is geen middelbare anomalie gedefinieerd.

Voor een bijna-paraboolbaan hangt de excentrische anomalie voor een bepaalde middelbare anomalie ook heel sterk af van de excentriciteit.


Fig. 3: Vergelijking van Kepler: ν voor M_q en e
Fig. 3: Vergelijking van Kepler: ν voor M_q en e

Figuur 3 is als Figuur 1 maar heeft de perifocale anomalie \( M_q \) in plaats van de middelbare anomalie \( M \) langs de verticale as.

Voor bijna-paraboolbanen hangt de ware anomalie voor een vaste perifocale anomalie niet sterk af van de excentriciteit, wat betekent dat de perifocale anomalie ook voor bijna-paraboolbanen een geschikte maat is voor de tijd.


Fig. 4: Vergelijking van Kepler: E voor M_q en e
Fig. 4: Vergelijking van Kepler: E voor M_q en e

Figuur 4 is als Figuur 2 maar heeft de perifocale anomalie \( M_q \) in plaats van de middelbare anomalie \( M \) langs de verticale as.

De witte verticale lijn op \( e = 1 \) is voor een paraboolbaan. Voor een paraboolbaan is de excentrische anomalie niet gedefinieerd.

Voor een bijna-paraboolbaan hangt de excentrische anomalie voor een vaste perifocale anomalie sterk af van de excentriciteit.


Fig. 5: Vergelijking van Kepler: E_q voor M_q en e
Fig. 5: Vergelijking van Kepler: E_q voor M_q en e

Figuur 5 is als Figuur 4 maar toont perifocale excentrische anomalie \( E_q \) in plaats van (gewone) excentrische anomalie \( E \).

Voor bijna-paraboolbanen hangt de perifocale excentrische anomalie voor een vaste perifocale anomalie niet sterk af van de excentriciteit, wat betekent dat de perifocale excentrische anomalie een geschikte maat is voor de plaats in een bijna-paraboolbaan.

6. Enige Specifieke Oplossingen

De volgende tabellen tonen een aantal oplossingen van de vergelijking van Kepler. Alle hoeken zijn gegeven in radialen. Een radiaal is 180/π ≈ 57,2957795131 graden.

Tabel 1 is voor een anomalie van 0,0001 radialen.

Tabel 1: Vergelijking van Kepler: oplossingen voor 0,0001 radiaal

\({M}\)\({M_q}\)\({e}\)\({E}\)\({E_q}\)\({τ}\)\({ν}\)
0.000100000000 0.000100000000 0.00000000 0.000100000000 0.000100000000 5.00000000 × 10−05 0.000100000000
0.000100000000 0.000101518971 0.0100000000 0.000101010101 0.000101518971 5.10126517 × 10−05 0.000102025303
0.000100000000 0.00316227766 0.900000000 0.000999998500 0.00316227292 0.00217944638 0.00435888587
0.000100000000 0.100000000 0.990000000 0.00998358122 0.0998358122 0.0704184571 0.140604812
0.000100000000 3.16227766 0.999000000 0.0614230944 1.94236879 1.37355061 1.88299657
0.000100000000 100.000000 0.999900000 0.0819842185 8.19842185 5.80026395 2.80013747
0.000100000000 100.000000 1.00010000 0.0819610818 8.19610818 5.79242631 2.79968440
0.000100000000 3.16227766 1.00100000 0.0613913007 1.94136339 1.37266327 1.88238152
0.000100000000 0.100000000 1.01000000 0.00998325102 0.0998325102 0.0707679178 0.141300268
0.000100000000 0.00316227766 1.10000000 0.000999998167 0.00316227186 0.00229128346 0.00458255889
0.000100000000 1.01518971 × 10−07 100.000000 1.01010101 × 10−06 1.01518971 × 10−07 5.10126517 × 10−07 1.02025303 × 10−06
0.000100000000 1.00000150 × 10−13 1000000.00 1.00000100 × 10−10 1.00000150 × 10−13 5.00001000 × 10−11 1.00000200 × 10−10
9.85037563 × 10−05 0.000100000000 0.0100000000 9.94987437 × 10−05 0.000100000000 5.02493781 × 10−05 0.000100498756
3.16227766 × 10−06 0.000100000000 0.900000000 3.16227766 × 10−05 9.99999999 × 10−05 6.89202437 × 10−05 0.000137840487
1.00000000 × 10−07 0.000100000000 0.990000000 9.99999998 × 10−06 9.99999998 × 10−05 7.05336798 × 10−05 0.000141067359
3.16227766 × 10−09 0.000100000000 0.999000000 3.16227765 × 10−06 9.99999998 × 10−05 7.06929981 × 10−05 0.000141385996
1.00000000 × 10−10 0.000100000000 0.999900000 9.99999998 × 10−07 9.99999998 × 10−05 7.07089102 × 10−05 0.000141417820
0.000100000000 1.00000000 7.07106780 × 10−05 0.000141421356
1.00000000 × 10−10 0.000100000000 1.00010000 9.99999998 × 10−07 9.99999998 × 10−05 7.07124457 × 10−05 0.000141424891
3.16227766 × 10−09 0.000100000000 1.00100000 3.16227765 × 10−06 9.99999998 × 10−05 7.07283535 × 10−05 0.000141456707
1.00000000 × 10−07 0.000100000000 1.01000000 9.99999998 × 10−06 9.99999998 × 10−05 7.08872343 × 10−05 0.000141774468
3.16227766 × 10−06 0.000100000000 1.10000000 3.16227765 × 10−05 9.99999998 × 10−05 7.24568836 × 10−05 0.000144913767
0.0985037563 0.000100000000 100.000000 0.000994987271 9.99999833 × 10−05 0.000502493656 0.00100498723
99999.8500 0.000100000000 1000000.00 0.0998340290 9.98340789 × 10−05 0.0498756461 0.0996687023

Regel 4 van tabel 1 zegt dat voor \( M = 0.0001 \) radialen en \( e = 0.99 \), de excentrieke anomalie gelijk is aan \( E = 0.00998358122 \) radialen, en de ware anomalie aan \( ν = 0.140602484 \) radialen = 8.05592894°. Klopt dat?

Volgens vergelijking \eqref{eq:ekepler} moet dan gelden dat

\[ M = E − e \sin(E) \]

Met deze waarden van \( E \) en \( e \) vinden we

\[ E − e \sin(E) = 0.00998358122 − 0.99 × \sin(0.00998358122) = 0.000100000000 \]

en dat is precies \( M \). Met vergelijking \eqref{eq:eEtoν} vinden we dan

\begin{align*} \tan\left( \frac{1}{2}ν \right) & = \sqrt{\frac{1 + e}{1 − e}} \tan\left( \frac{1}{2}E \right) \\ & = \sqrt{\frac{1.99}{0.01}} × \tan(0.5×0.0998358122) \\ & = 14.106736 × \tan(0.00499179061) \\ & = 14.106736 × 0.00499183207 \\ & = 0.0704184571 \end{align*}

en dat klopt met wat er staat in de τ-kolom.

Dan is

\[ ν = 2\arctan(0.0704184571) = 0.140604812 \]

en ook dat klopt met wat er in de tabel staat.

Tabel 2 is voor een anomalie van 1 radiaal.

Tabel 2: Vergelijking van Kepler: oplossingen voor 1 radiaal

\({M}\)\({M_q}\)\({e}\)\({E}\)\({E_q}\)\({τ}\)\({ν}\)
1.00000000 1.00000000 0.00000000 1.00000000 1.00000000 0.546302490 1.00000000
1.00000000 1.01518971 0.0100000000 1.00846012 1.01354055 0.557353696 1.01694301
1.00000000 31.6227766 0.900000000 1.86208669 5.88843513 5.85747591 2.80340907
1.00000000 1000.00000 0.990000000 1.92763555 19.2763555 20.3140949 3.04321826
1.00000000 31622.7766 0.999000000 1.93387356 61.1544515 64.8144720 3.11073780
1.00000000 1000000.00 0.999900000 1.93449428 193.449428 205.143679 3.13184347
1.00000000 1000000.00 1.00010000 1.72897376 172.897376 98.7940852 3.12134922
1.00000000 31622.7766 1.00100000 1.72768618 54.6342340 31.2337093 3.07758114
1.00000000 1000.00000 1.01000000 1.71487376 17.1487376 9.85240023 2.93928924
1.00000000 31.6227766 1.10000000 1.59281168 5.03691279 3.03376885 2.50477756
1.00000000 0.00101518971 100.000000 0.0101008366 0.00101517228 0.00510113418 0.0102021799
1.00000000 1.00000150 × 10−09 1000000.00 1.00000100 × 10−06 1.00000150 × 10−09 5.00001000 × 10−07 1.00000200 × 10−06
0.985037563 1.00000000 0.0100000000 0.993416520 0.998421169 0.547483734 1.00181857
0.0316227766 1.00000000 0.900000000 0.282532839 0.893447285 0.619895127 1.10983994
0.00100000000 1.00000000 0.990000000 0.0885485963 0.885485963 0.624974249 1.11716160
3.16227766 × 10−05 1.00000000 0.999000000 0.0279769359 0.884708395 0.625467687 1.11787112
1.00000000 × 10−06 1.00000000 0.999900000 0.00884630818 0.884630818 0.625516891 1.11794185
1.00000000 1.00000000 0.625522357 1.11794971
1.00000000 × 10−06 1.00000000 1.00010000 0.00884613583 0.884613583 0.625527822 1.11795757
3.16227766 × 10−05 1.00000000 1.00100000 0.0279714858 0.884536046 0.625576995 1.11802825
0.00100000000 1.00000000 1.01000000 0.0883762467 0.883762467 0.626067340 1.11873295
0.0316227766 1.00000000 1.10000000 0.277078928 0.876200504 0.630836813 1.12557114
985.037563 1.00000000 100.000000 2.98623497 0.300127907 0.912981379 1.47988203
999998500. 1.00000000 1000000.00 7.60090122 0.00760090502 0.999001498 1.56979733

Regel 18 uit tabel 2 zegt dat voor \( M_q = 1 \) en \( e = 1 \) (dus voor een paraboolbaan) geldt dat \( \tan\left( \frac{1}{2}ν \right) = 0.625522357 \). Klopt dat?

Volgens vergelijking \eqref{eq:pkepler}ff en \eqref{eq:M_q} geldt

\[ W = \sqrt{\frac98}M_q = 1.06066017×1 = 1.06066017 \]

en dan

\begin{align*} u & = \left( W + \sqrt{W^2 + 1} \right)^{1/3} \\ & = \left( 1.06066017 + \sqrt{1.06066017^2 + 1} \right)^{1/3} \\ & = (1.06066017 + 1.45773797)^{1/3} \\ & = 2.51839815^{1/3} \\ & = 1.36053002 \end{align*}

en dan

\begin{align*} τ = \tan\left( \frac{1}{2}ν \right) & = u − \frac{1}{u} \\ & = 1.36053002 − \frac{1}{1.36053002} \\ & = 0.625522357 \end{align*}

en dat klopt met wat er staat in de τ-kolom.

Tabel 3 is voor een anomalie van 10000 radialen. Dat is alleen relevant voor parabolische en hyperbolische banen.

Tabel 3: Vergelijking van Kepler: oplossingen voor 10000 radialen

\({M}\)\({M_q}\)\({e}\)\({E}\)\({E_q}\)\({τ}\)\({ν}\)
10000.0000 1.00000000 × 10+10 1.00010000 9.90437751 990.437751 141.410763 3.12744969
10000.0000 316227766. 1.00100000 9.90347791 313.175470 44.7280654 3.09688545
10000.0000 10000000.0 1.01000000 9.89452619 98.9452619 14.1760164 3.00074262
10000.0000 316227.766 1.10000000 9.80915781 31.0192806 4.58207213 2.71184720
10000.0000 10.1518971 100.000000 5.29887209 0.532556682 1.00000580 1.57080212
10000.0000 1.00000150 × 10−05 1000000.00 0.00999984334 9.99984834 × 10−06 0.00499988501 0.00999968669
10000.0000 1.00000000 27.6461704 3.06928143
0.0100000000 10000.0000 1.00010000 0.389974639 38.9974639 27.2318138 3.06818213
0.316227766 10000.0000 1.00100000 1.20643179 38.1507231 24.1257778 3.05874120
10.0000000 10000.0000 1.01000000 3.27015981 32.7015981 13.1393971 2.98967154
316.227766 10000.0000 1.10000000 6.37425935 20.1571779 4.56697679 2.71047028
9850375.63 10000.0000 100.000000 12.1909984 1.22524144 1.01004025 1.58078634
9.99998500 × 10+12 10000.0000 1000000.00 16.8112413 0.0168112497 1.00000090 1.57079723

Regel 3 van tabel 3 zegt dat voor \( M = 10000 \) radialen en \( e = 1.01 \) de excentrieke anomalie gelijk is aan 9.89452619, en de ware anomalie is \( ν = 2×\arctan(14.1760164) = 3.00074262 \) radialen = 171.929887°. Klopt dat?

Volgens vergelijking \eqref{eq:hkepler} moet dan gelden dat

\[ M = e \sinh(E) − E \]

Met deze waarden van \( E \) en \( e \) vinden we

\[ e \sinh(E) − E = 1.01 × \sinh(9.89452619) − 9.89452619 = 10000 \]

en dat is precies \( M \). Met vergelijking \eqref{eq:hEtoν} vinden we dan

\begin{align*} τ = \tan\left( \frac{1}{2}ν \right) & = \sqrt{\frac{e + 1}{e − 1}} \tanh\left( \frac{1}{2}E \right) \\ & = \sqrt{\frac{2.01}{0.01}} × \tanh(0.5 × 9.89452619) \\ & = 14.1774469 × \tanh(4.9472631) \\ & = 14.1774469 × 0.999899105 \\ & = 14.1760164 \end{align*}

en dat klopt met wat er staat in de τ-kolom.

In bovenstaande tabellen is te zien dat in de buurt van \( e = 1 \) de waarden van \( E \) en \( τ \) veel sterker variëren met \( e \) voor vaste \( M \) dan voor vaste \( M_q \). Een paraboolbaan (met \( e = 1 \)) is zelfs helemaal niet te beschrijven met \( M \) of \( E \) (want die zijn dan precies gelijk aan 0), maar wel met \( M_q \).

7. Vind een oplossing

Men kan uit de vergelijking van Kepler niet direct de excentrische anomalie \( E \) vinden gegeven een bepaalde tijd \( t \). Het beste wat we kunnen doen is om een hopelijk goede beginschatting voor \( E \) te berekenen, dan te kijken hoe goed die schatting is, daarmee een betere schatting te vinden, en dat te herhalen tot de schatting goed genoeg is en we hem niet meer kunnen verbeteren.

We hebben een goede beginschatting nodig voor elke \( M \) en \( e \), een goede manier om de schatting te verbeteren, en een goede manier om te beslissen of we de schatting niet meer kunnen verbeteren.

7.1. Verbeter de schatting

Stel dat we een schatting \( E_n \) hebben voor de excentrische anomalie \( E \). Hoe kunnen we die en de vergelijking van Kepler gebruiken om een betere schatting \( E_{n+1} \) te vinden?

7.1.1. Eerste-ordemethode

De vergelijking van Kepler voor ellipsbanen en hyperboolbanen kunnen worden herschreven in de vorm

\begin{equation} E = g(E) \end{equation}

voor een toepasselijke functie \( g \):

\begin{eqnarray} g(E) & = & M + e \sin(E) & \qquad (e \lt 1) \\ g(E) & = & \arsinh\left( \frac{M + E}{e} \right) & \qquad (e \gt 1) \end{eqnarray}

Dit wijst op een benaderingsmethode

\begin{equation} E_{n+1} = g(E_n) \end{equation}

Hoeveel beter is \( E_{n+1} \) dan \( E_n \)?

\begin{equation} E + \del E_{n+1} = E_{n+1} = g(E_n) = g(E + \del E_n) ≈ g(E) + g'(E)\del E_n = E + g'(E)\del E_n \end{equation}

waar \( g'(E) \) de afgeleide van \( g \) naar \( E \) is. Dus

\begin{equation} \del E_{n+1} ≈ g'(E)\del E_n \label{eq:improve1} \end{equation}

dus \( E_{n+1} \) is alleen beter dan \( E_n \) als \( |g'(E)| \lt 1 \), en het verschil met de echte oplossing \( E \) wordt voor elke herhalen met ongeveer dezelfde factor \( g'(E) \) vermenigvuldigd, dus het aantal goede cijfers achter de komma neemt tijdens elke herhaling met dezelfde hoeveelheid toe. Maar dat kan nog veel beter.

7.1.2. Tweede-ordemethode

De vergelijking van Kepler voor ellipsbanen en hyperboolbanen hebben de vorm

\begin{equation} M = f(E) \label{eq:f} \end{equation}

voor een toepasselijke functie \( f \), dus als we een kleine verandering \( \del E \) aanbrengen in \( E \) dan is de overeenkomstige verandering \( \del M \) in \( M \) ongeveer

\begin{equation} \del M ≈ f'(E) \del E \label{eq:∆M} \end{equation}

waar \( f'(E) \) de afgeleide van \( f \) naar \( E \) is. We zoeken de waarde van \( E \) waarvoor \( M = f(E) \), maar onze huidige schatting \( E_n \) geeft in plaats daarvan

\begin{equation} f(E_n) = M + \del M_n \end{equation}

Hieruit kunnen we schatten hoe ver \( E_n \) is van \( E \). Het geschatte verschil is

\begin{equation} \del E_n ≈ \frac{\del M_n}{f'(E_n)} ≈ \frac{f(E_n) − M}{f'(E_n)} \label{eq:∆E} \end{equation}

dus de volgende schatting is

\begin{equation} E_{n+1} = E_n − \del E_n = E_n + \frac{M − f(E_n)}{f'(E_n)} \end{equation}

Deze methode faalt als \( f'(E_n) = 0 \), maar voor de vergelijking van Kepler kan dat niet gebeuren, zoals we later zullen zien.

Hoeveel beter is \( E_{n+1} \) dan \( E_n \)? We definiëren

\begin{equation} β(E) ≡ \frac{f''(E)}{2f'(E)} \end{equation}

We hebben

\begin{eqnarray} f(E_n) & = & f(E + \del E_n) ≈ f(E) + \del E_n f'(E) + \frac{1}{2} \del E_n^2 f''(E) \notag \\ & = & M + \del E_n f'(E) (1 + \del E_n β(E)) \\ f'(E_n) & = & f'(E + \del E_n) ≈ f'(E) + \del E_n f''(E) \notag \\ & = & f'(E) (1 + 2 \del E_n β(E)) \end{eqnarray}

dus

\begin{eqnarray} E + \del E_{n+1} = E_{n+1} & = & E_n + \frac{M − f(E + \del E_n)}{f'(E + \del E_n)} \notag \\ & ≈ & E_n + \frac{−\del E_n f'(E) (1 + \del E_n β(E))}{f'(E) (1 + 2 \del E_n β(E))} & (|\del E_nβ(E)| \ll 1 ∧ |\del E_nf'''(E)| \ll |f''(E)|) \notag \\ & = & E_n − \del E_n \frac{1 + \del E_n β(E)}{1 + 2 \del E_n β(E)} \notag \\ & ≈ & E_n − \del E_n (1 + \del E_n β(E))(1 − 2 \del E_n β(E)) & (|\del E_nβ(E)| \ll 1) \notag \\ & ≈ & E_n − \del E_n (1 + \del E_n β(E) − 2 \del E_n β(E)) & (|\del E_nβ(E)| \ll 1) \notag \\ & = & E_n − \del E_n (1 − \del E_n β(E)) \notag \\ & = & E_n − \del E_n + \del E_n^2 β(E) \notag \\ & = & E + \del E_n^2 β(E) \end{eqnarray}

waar we vergelijking \eqref{eq:f} hebben gebruikt. Dus we vinden

\begin{eqnarray} \del E_{n+1} & ≈ & \del E_n^2 β(E) \\ \del E_{n+1} β(E) & ≈ & (\del E_n β(E))^2 \label{eq:improve} \end{eqnarray}

De volgende schatting \( E_{n+1} \) is beter dan de vorige \( E_n \) als \( |\del E_{n+1}| \lt |\del E_n| \), wat overeenkomt met

\begin{equation} |\del E_nβ(E)| \lt 1 \end{equation}

De grens aangegeven door \( β(E) \) is vaag, want afgeleidt door verwaarlozing van sommige termen, en in het begin weten we de ware waarde van \( E \) nog niet en moeten we \( β(E) \) schatting gebaseerd op de schatting \( E_n \), wat ook niet nauwkeurig is. Dus als \( |\del E_n| \) niet comfortabel minder is dan \( 1/|β(E)| \) dan is dat misschien nog steeds niet klein genoeg om de oplossing snel te kunnen vinden. Maar als \( |\del E_n| \ll 1/|β(E)| \) dan zal het aantal goede cijfers achter de komma tijdens elke herhaling ongeveer verdubbelen. Deze verbetering is veel sneller dan voor de eerste-ordemethode die we hierboven bespraken. Van nu af aan zullen we alleen de tweede-ordemethode gebruiken.

Voor ellipsbanen geldt

\begin{eqnarray} f(E) & = & E − e \sin(E) \\ f'(E) & = & 1 − e \cos(E) \\ f''(E) & = & e \sin(E) = E − f(E) \\ \del E_n & = & \frac{f(E_n) − M}{f'(E_n)} = \frac{E_n − e \sin(E_n) − M}{1 − e \cos(E_n)} \\ E_{n+1} & = & E_n − \del E_n = E_n + \frac{M − E_n + e \sin(E_n)}{1 − e \cos(E_n)} \\ β(E_n) & = & \frac{f''(E)}{2f'(E)} = \frac{e \sin(E_n)}{2(1 − e\cos(E_n))} \end{eqnarray}

De berekening van \( \del E_n \) en \( β(E_n) \) zou fout gaan als \( 1 − e \cos(E_n) = 0 \), want dan zou je delen door 0, maar die gelijkheid komt overeen met \( \cos(E_n) = 1/e \gt 1 \) en dat heeft geen oplossing omdat \( |\cos(E_n)| \le 1 \).

Voor vaste \( e \) wordt de grootste waarde van \( |β(E)| \) bereikt wanneer \( \cos(E) = e \); Die grootste waarde is \( β_\text{max} = e/(2\sqrt{1 − e^2}) \). Voor bijna-paraboolbanen is \( β_\text{max} ≈ 1/\sqrt{8|δ|} \).

Voor hyperboolbanen geldt

\begin{eqnarray} f(E) & = & e \sinh(E) − E \\ f'(E) & = & e \cosh(E) − 1 \\ f''(E) & = & e \sinh(E) = E + f(E) \\ \del E_n & = & \frac{f(E_n) − M}{f'(E_n)} = \frac{e \sinh(E_n) − E_n − M}{e \cosh(E_n) − 1} \\ E_{n+1} & = & E_n − \del E_n = E_n + \frac{M + E_n − e \sinh(E_n)}{e \cosh(E_n) − 1} \\ β(E_n) & = & \frac{f''(E_n)}{2f'(E_n)} = \frac{e \sinh(E_n)}{2(e\cosh(E_n) − 1)} \end{eqnarray}

De berekening van \( \del E_n \) en \( β(E_n) \) zou fout gaan als \( e \cosh(E_n) − 1 = 0 \) want dan zou je delen door 0, maar die gelijkheid komt overeen met \( \cosh(E_n) = 1/e \lt 1 \) en dat heeft geen oplossing omdat \( |\cosh(E_n)| \gt 1 \).

Voor vaste \( e \) wordt de grootste waarde van \( |β(E)| \) bereikt als \( \cosh(E) = e \); Die grootste waarde is \( β_\text{max} = e/(2\sqrt{e^2 − 1}) \). Voor bijna-paraboolbanen is \( β_\text{max} ≈ 1/\sqrt{8|δ|} \).

Dus, voor ellipsbanen en hyperboolbanen

\begin{equation} β_\text{max} = \frac{e}{2\sqrt{|e^2 − 1|}} \end{equation}

en voor bijna-paraboolbanen

\begin{equation} β_\text{max} ≈ \frac{1}{\sqrt{8|δ|}} \end{equation}

Als \( |\del E_nβ(E_n)| \lt 1 \) dan is de volgende schatting beter dan de vorige.

\begin{equation} |\del E_nβ(E_n)| ≤ |\del E_nβ_\text{max}| = |\del E_n| \frac{e}{2\sqrt{|e^2 − 1|}} \end{equation}

dus als \( |\del E_n| \lt 2\sqrt{|e^2 − 1|}/e \) dan is de volgende schatting beter dan de vorige. Voor bijna-paraboolbanen komt dit overeen met \( |\del E_n| \lt \sqrt{8|δ|} \), dus voor bijna-paraboolbanen moet de beginschatting voor \( E \) al aardig goed zijn om de oplossing te kunnen vinden.

Voor \( e = 0.02 \) en \( E_0 = M = 1 \), en met gebruik van "dubbeleprecisie-zwevendekommagetallen" vinden we

eerste orde tweede orde
\({n}\)\({E_n}\)\({\del E_n}\)\({E_n}\)\({\del E_n}\)
0 1.0000 −0.017 1.0000 −0.017013
1 1.0168 −0.00018 1.0170 +2.4704 × 10−6
2 1.0170 −1.9 × 10−6 1.0170 +5.2511 × 10−14
3 1.0170 −2.0 × 10−8 1.0170 0
4 1.0170 −2.1 × 10−10
5 1.0170 −2.2 × 10−12
6 1.0170 −2.3 × 10−14
7 1.0170 −2.2 × 10−16
8 1.0170 0

waar ik \( E_n \) met een paar cijfers achter de komma laat zien, maar heb gerekend met alle beschikbare cijfers achter de komma.

We zien dat de eerste-ordemethode 8 herhalingen nodig heeft om de grootst mogelijke nauwkeurigheid te krijgen, maar de tweede-ordemethode heeft maar 3 herhalingen nodig. En dit is een relatief simpel geval.

Neem nu aan dat \( e = 0.99 \) and \( E_0 = M = 1 \). Dan

eerste orde tweede orde
\({n}\)\({E_n}\)\({\del E_n}\)\({E_n}\)\({\del E_n}\)
0 1.0000 −0.91 1.0000 −1.7911
1 1.8331 −0.095 2.7911 +0.75200
2 1.9561 +0.029 2.0391 +0.10763
3 1.9174 −0.010 1.9315 +0.0038570
4 1.9311 +0.0035 1.9276 +5.1219 × 10−6
5 1.9264 −0.0012 1.9276 +9.0412 × 10−12
6 1.9281 +0.00042 1.9276 0
7 1.9275 −0.00014
8 1.9278 +5.0 × 10−5
9 1.9276 −1.7 × 10−5
  ... 
...
33 1.9276 −2.2 × 10−16
34 1.9276 0

Nu heeft de eerste-ordemethode 34 herhalingen nodig waar de tweede-ordemethode slechts 6 herhalingen nodig heeft, hoewel de eerste-ordemethode in het begin dichter bij de juiste oplossing was dan de tweede-ordemethode.

Nu nemen we aan dat \( e = 1.01 \) and \( E_0 = M = 1 \). Dan

eerste orde tweede orde
\({n}\)\({E_n}\)\({\del E_n}\)\({E_n}\)\({\del E_n}\)
0 1.0000 +0.4347 1.0000 −1.4557
1 1.4347 +0.1788 2.4557 +0.48421
2 1.6135 +0.0658 1.9715 +0.21686
3 1.6793 +0.0232 1.7547 +0.038692
4 1.7025 +0.0081 1.7160 +0.0011009
5 1.7106 +0.0028 1.7149 +8.6813 × 10−7
6 1.7134 +0.0010 1.7149 +5.3924 × 10−13
7 1.7144 +3.3 × 10−4 1.7149 0
8 1.7147 +1.2 × 10−4
9 1.7148 +4.0 × 10−5
  ... 
...
33 1.7149 +2.2 × 10−16
34 1.7149 0

Nu heeft de eerste-ordemethode 34 herhalingen nodig en de tweede-ordemethode 7.

7.2. Hoeveel herhalingen hebben we nodig?

Hoeveel herhalingen hebben we nodig om zo dicht mogelijk bij de waarde van \( E \) te komen?

Om inzicht te krijgen in het antwoord op die vraag nemen we aan dat vergelijking \eqref{eq:improve} exact is en niet slechts een benadering, met een vaste waarde voor \( β(E) \). Onze beginschatting had afwijking \( \del E_0 \). Dan

\begin{eqnarray} |\del E_1 β(E)| & = & |\del E_0 β(E)|^2 \\ |\del E_2 β(E)| & = & |\del E_1 β(E)|^2 = |\del E_0 β(E)|^4 = |\del E_0β(E)|^{\left( 2^2 \right)} \\ |\del E_n β(E)| & = & |\del E_0 β(E)|^{\left( 2^n \right)} \\ |\del E_n| & = & \frac{|\del E_0 β(E)|^{\left( 2^n \right)}}{|β(E)|} \end{eqnarray}

Hoe dichtbij kunnen we komen?

Een typisch computerprogramma is beperkt in zijn relatieve nauwkeurigheid: Het kan geen onderscheid maken tussen het getal 1 en nabijgelegen getallen als het verschil tussen die getallen en 1 niet tenminste \( ε \) is, waarin \( ε \) de relatieve-nauwkeurigheidlimiet is. Voor een willekeurig getal \( x ≠ 0 \) ziet het programma geen verschil tussen \( x \) en een ander getal \( y \) behalve als \( |y − x| \gt ε|x| \). Voor een programma dat "enkeleprecisie-zwevendekommagetallen" gebruikt is \( ε \) meestal rond \( 10^{−7} \). Voor een programma dat "dubbeleprecisie-zwevendekommagetallen" gebruikt is \( ε \) ongeveer \( 10^{−16} \).

Dus als de volgende herhaling een relatieve verbetering kleiner dan \( ε \) zou opleveren dan kan het programma die verbetering niet meer uitdrukken en is de huidige schatting zo nauwkeurig als het programma dat kan maken. Dan hebben we de oplossing gevonden, tot op relatieve nauwkeurigheid \( ε \).

Dus heeft het geen zin om door te gaan als \( |\del E| ≤ ε|E| \). Stel dat we uitkomen bij precies \( |\del E_n| = ε|E| \). Wat is dan \( n \)? Dan

\begin{eqnarray} |εβ(E)E| & = & |\del E_n β(E)| = |\del E_0 β(E)|^{\left( 2^n \right)} \\ \log(|εβ(E)E|) & = & 2^n \log(|\del E_0β(E)|) \\ 2^n & = & \frac{\log(|\del E_0β(E)|)}{\log(|εβ(E)E|)} \\ n & = & \log_2\left( \frac{\log(|\del E_0β(E)|)}{\log(|εβ(E)E|)} \right) \label{eq:n} \end{eqnarray}

Deze berekening van \( n \) is alleen mogelijk als \( |\del E_0β(E)| \lt 1 \) en \( |εβ(E)E| \lt 1 \). Als aan de eerste eis niet wordt voldaan dan zal de volgende schatting slechter zijn dan de huidige, en dan is de afleiding van vergelijking \eqref{eq:n} ook niet geldig. Voor ellipsbanen is \( |β(E)E| \lt 1 \) dus aan deze eis wordt altijd voldaan (omdat \( ε \ll 1 \)). Voor hyperboolbanen is \( |β(E)E| \gt 10 \) alleen als de afstand \( r \gt 10^8 q \), wat zo ver is van het brandpunt dat de baan daar bijna niet te onderscheiden is van een rechte lijn die met vaste snelheid doorlopen wordt.

7.3. Stopcriterium

Hoe kunnen we zien dat we de waarde van \( E \) niet meer kunnen verbeteren? De eenvoudigste manieren hebben in de praktijk nadelen.

  1. Stop als \( \del E_n = 0 \). Dit is geen goed criterium, want \( \del E_n \) zou ongelijk aan nul kunnen zijn maar toch zo klein vergeleken met \( E_n \) dat de waarde van \( E_n \) niet verandert als er \( \del E_n \) bij opgeteld wordt, en dan zitten we in een oneindige lus. Of de herhaling kan in een oneindige lus komen met twee of meer bijna-identieke waarden van \( E \) met een relatief verschil in de buurt van \( ε \).
  2. Stop als \( |\del E_n| \) toeneemt. Dit criterium is lastig tijdens de eerste paar herhalingen, want als de eerste schatting niet dicht genoeg bij de juiste oplossing is dan kan de schatting eerst slechter worden voordat hij beter wordt, en dan zouden we te vroeg stoppen als de schatting nog ver van de oplossing is.

Laten we een betere manier vinden. Als \( |\del E_n| ≤ |εE_n| \) dan kunnen we de schatting zeker niet meer beter maken. Wat kunnen we dan zeggen over de vorige verbetering \( \del E_{n−1} \)?

\begin{equation} \begin{split} |\del E_n| & ≤ & |εE| \\ |\del E_nβ(E)| & ≤ & |εEβ(E)| \\ |\del E_{n−1}β(E)|^2 & ≤ & |εEβ(E)| \\ |\del E_{n−1}β(E)| & ≤ & \sqrt{|εEβ(E)|} \\ |\del E_{n−1}| & ≤ & \sqrt{\left| \frac{εE}{β(E)} \right|} \end{split} \end{equation}

Dus we moeten zoeken naar \( |\del E_n| ≤ \sqrt{|εE/β(E)|} ≈ \sqrt{|εE_n/β(E_n)|} \). Als we aan die eis voldoen, dan moeten we nog één herhaling doen, en daarna stoppen. Deze limiet op \( \del E_n \) is flink groter dan \( |εE_n| \), waarmee we het oneindige-lusprobleem ontlopen, en is klein genoeg dat aan deze eis nog niet is voldaan als de schatting no zo ver van de oplossing is dat hij nog tijdelijk slechter kan worden voordat hij naar de juiste oplossing gaat.

Voor ellipsbanen is het criterium

\begin{align} |\del E_n| & ≤ & \sqrt{\left| \frac{εE_n}{β(E_n)} \right|} \\ & = & \sqrt{\left| \frac{2εE_n(1 − e\cos(E_n))}{e\sin(E_n)} \right|} \end{align}

en voor hyperboolbanen

\begin{align} |\del E_n| & ≤ & \sqrt{\left| \frac{εE_n}{β(E_n)} \right|} \\ & = & \sqrt{\left| \frac{2εE_n(e\cosh(E_n) − 1)}{e\sinh(E_n)} \right|} \end{align}

7.4. Beginschatting

Nu hebben we nog een beginschatting nodig voor \( E \). We vinden zo'n schatting door de vergelijking van Kepler te vervangen door een simpelere die we wel direct kunnen oplossen. Hoe dichter de simpelere vergelijking bij de echte vergelijking blijft, hoe groter het deel van alle combinaties van \( M \) en \( e \) is waarvoor die versimpelde vergelijking een goede schatting voor de echte oplossing geeft.

We beoordelen de kwaliteit van een beginschatting door uit te zoeken hoeveel herhalingen er nodig zijn om de oplossing te vinden (voor een bepaalde relatieve nauwkeurigheid \( ε \)) voor een groot interval van \( M \) en \( e \). Degene die minder herhalingen nodig heeft vinden we beter dan degene die meer herhalingen nodig heeft.

Er is geen beginschatting die voor alle \( M \) en \( e \) het beste (of zelfs alleen maar goed) is. Alle beginschattingen die ik heb bekeken die goed zijn voor tenminste een paar \( M \) en \( e \) hebben voor andere \( M \) en \( e \) heel veel herhalingen nodig. Hieronder beschrijf ik twee beginschattingen die elk goed zijn voor een groot gebied van \( M \) en \( e \), en die in combinatie tenminste redelijk zijn voor alle \( M \) en \( e \).

Het is mogelijk om andere beginschattingen te vinden die nog beter zijn voor sommige \( M \) en \( e \), maar al zulke andere beginschattingen die ik bekeken heb zijn beter in alleen een smal gebied van \( M \) en \( e \), en verlagen het aantal herhalingen met hooguit een paar, zodat het niet de moeite waard lijkt om ze in de methode op te nemen.

7.4.1. Kleine excentrische anomalie

De vergelijking van Kepler voor ellipsbanen is

\begin{eqnarray} M & = & E − e \sin(E) & \qquad (e \lt 1) \label{eq:ekepler2} \\ M & = & e \sinh(E) − E & \qquad (e \gt 1) \end{eqnarray}

We vervangen de \( \sin \)- en \( \sinh \)-aanroepen door hun derde-orde-taylorbenadering rond nul:

\begin{eqnarray} M & ≈ & E − e \left( E − \frac{1}{6}E^3 \right) = \frac{1}{6}eE^3 − δE & \qquad (e \lt 1) \\ M & ≈ & e \left( E + \frac{1}{6}E^3 \right) − E = \frac{1}{6}eE^3 + δE & \qquad (e \gt 1) \end{eqnarray}

De twee vergelijkingen voor \( M \) kunnen worden samengevoegd tot

\begin{equation} M ≈ \frac{1}{6}eE^3 + |δ| E \label{eq:M3} \end{equation}

Echter, voor bijna-paraboolbanen zijn \( M \) en \( E \) niet erg handig om mee te werken, omdat ze voor vaste \( t \) en \( q \) sterk afhangen van \( e \). Met vergelijkingen \eqref{eq:M_q} en \eqref{eq:E_q} kunnen we vergelijking \eqref{eq:M3} omschrijven tot

\begin{equation} M_q ≈ E_q + \frac{1}{6}eE_q^3 \end{equation}

We vervangen \( E_q \) door \( E_q' \) en \( ≈ \) door \( = \). Dan is \( E_q' \) een benadering voor \( E_q \) en krijgen we een derdegraadsvergelijking in \( E_q' \) die we kunnen oplossen.

\begin{equation} M_q = E_q'+ \frac{1}{6}eE_q'^3 \label{eq:Mq3} \end{equation}

We lossen deze vergelijking op voor \( E_q' \):

\begin{eqnarray} P & = & \frac{2}{e} \\ Q & = & \frac{3M_q}{e} \\ u & = & \sqrt[3]{Q + \sqrt{Q^2 + P^3}} \\ E_q' & = & u − \frac{P}{u} \label{eq:E_q3} \\ E & ≈ & E_q'\sqrt{|δ|} \label{eq:est_ep} \end{eqnarray}

Deze methode om een beginschatting voor \( E \) te vinden lijkt wel wat op vergelijkingen \eqref{eq:pkepler}ff voor paraboolbanen. Als je \( ν \) uit \( E \) berekent en dan \( e \) naar 1 laat gaan (wat overeenkomt met \( δ \) naar 0 laten gaan) dan krijg je een methode die gelijkwaardig is aan die van Barker. Dit suggereert dat bovenstaande schatting voor \( E \) voor bijna-paraboolbanen vrij goed moet zijn.

Fig. 6: Vergelijking van Kepler: Aantal herhalingen voor de beginschatting voor kleine anomalie
Fig. 6: Vergelijking van Kepler: Aantal herhalingen voor de beginschatting voor kleine anomalie

Figuur 6 toont het aantal herhalingen voor deze beginschatting, als functie van de excentriciteit \( e \) en perifocale anomalie \( M_q \), beiden tussen 0,01 en 1000.

Het witte gebied linksboven komt overeen met \( M \gt π \) voor ellipsbanen, waarvoor we geen aparte beginschatting nodig hebben omdat we \( M \) altijd kunnen terugbrengen tot het interval van −π tot +π.

De donkere verticale lijn op \( e = 1 \) komt overeen met een paraboolbaan, waarvoor geen herhaling nodig is.

Het gele gebied rechtsboven geeft aan dat het aantal herhalingen daar groter is dan in alle niet-gele gebieden (en groter dan 38).

Het aantal herhalingen is redelijk klein, behalve voor hyperboolbanen (\( e \gt 1 \)) als de anomalie groot wordt.

Het is niet eenvoudig om aan de voorgaande vergelijkingen af te lezen hoe hun resultaten zich gedragen. De rechterkant van vergelijking \eqref{eq:Mq3} heeft twee termen. De eerste overheerst als \( |E_q'| \gg e|E_q|^3/6 \), ofwel \( |E_q'| \ll \sqrt{6/e} \), waaruit volgt \( |M_q| \ll \sqrt{6/e} \) ofwel \( |M| \ll \sqrt{6|δ|^3/e} \). We noemen dit deel van de parameterruimte gebied Ⅰ. Voor ellipsbanen valt de hele baan in gebied Ⅰ als \( e \ll 0.11 \). In gebied Ⅰ

\begin{eqnarray} E_q & ≈ & M_q & = & \frac{M}{|δ|^{3/2}} \\ E & ≈ & M_q \sqrt{|δ|} & = & \frac{M}{|δ|} \\ τ & ≈ & \frac{1}{2} \sqrt{1+e} M_q & = & \frac{1}{2} \sqrt{1+e} \frac{M_q}{|δ|^{3/2}} \\ ν & ≈ & \sqrt{1+e} M_q & = & \sqrt{1+e} \frac{M_q}{|δ|^{3/2}} \end{eqnarray}

Als de tweede term in vergelijking \eqref{eq:Mq3} overheerst (wanneer \( \sqrt{6/e} \ll |E_q| \ll \sqrt{20/|δ|} \)), dan zijn we in gebied Ⅱ. Daar is

\begin{eqnarray} E_q & ≈ & \left( \frac{6M_q}{e} \right)^{1/3} & = & \frac{ \left( \frac{6M}{e} \right)^{1/3} }{\sqrt{|δ|}} \\ E & ≈ & \left( \frac{6M_q|δ|^{3/2}}{e} \right)^{1/3} & = & \left( \frac{6M}{e} \right)^{1/3} \\ τ & ≈ & \frac{1}{2}\sqrt{1 + e} \left( \frac{6M_q}{e} \right)^{1/3} & = & \frac{1}{2}\sqrt{\frac{1 + e}{|δ|}} \left( \frac{6M}{e} \right)^{1/3} \\ ν & ≈ & \left( \frac{6M_q|δ|^{3/2}}{e} \right)^{1/3} & = & \left( \frac{6M}{e} \right)^{1/3} \end{eqnarray}

Met deze beginschatting is \( |\del E_0 β(E_0)| ≤ 0.5 \) voor alle \( M \) en \( e \), wat kleiner is dan 1, dus de beginschatting is goed genoeg om de gewenste \( E \) te kunnen vinden met behulp van de tweede-ordemethode.

7.4.2. Grote excentrische anomalie

Voor ellipsbanen is het geval \( |E| \gg 1 \) niet van belang, omdat voor een ellipsbaan alle posities zich steeds weer herhalen, en je weer dezelfde positie vindt als je bij \( E \) een willekeurig veelvoud van 2π radialen optelt. Voor hyperboolbanen is het geval \( |E| \gg 1 \) wel van belang, omdat voor een hyperboolbaan de posities zich niet herhalen. We kijken hier alleen naar hyperboolbanen (met \( e \gt 1 \)).

Voor een hyperboolbaan geldt

\begin{equation} M = e \sinh(E) − E \end{equation}

We kunnen dit omschrijven tot

\begin{equation} E = \arsinh\left( \frac{M + E}{e} \right) \end{equation}

Dit geeft de benaderingsmethode

\begin{equation} E_{n+1} = \arsinh\left( \frac{M + E_n}{e} \right) \end{equation}

maar dat is een benaderingsmethode van de eerste orde, dus veel minder geschikt dan de benaderingsmethode van de tweede orde om de uiteindelijke oplossing te vinden. Deze methode is echter prima om een goede beginschatting te vinden.

Als \( |E| \gg 1 \) dan \( |\sinh(E)| \gg |E| \) dus \( |M| \gg |E| \), dus is \( E_0 = 0 \) een goede beginwaarde (voor \( n = 0 \)). Dan

\begin{equation} E ≈ \arsinh\left( \frac{M}{e} \right) \label{eq:est_h} \end{equation}

Fig. 7: Vergelijking van Kepler: Aantal herhalingen voor de beginschatting voor grote anomalie
Fig. 7: Vergelijking van Kepler: Aantal herhalingen voor de beginschatting voor grote anomalie

Figuur 7 toont het aantal herhalingen voor deze beginschatting, vergelijkbaar met Figuur 6. Het aantal herhalingen is klein voor grote \( e \) en grote \( M_q \), en wordt groot voor bijna-paraboolbanen (\( e ≈ 1 \)) voor grote \( M_q \).

Voor grote middelbare anomalie \( M \) is het gedrag ongeveer als volgt:

\begin{eqnarray} E & ≈ & \log\left( \frac{2M}{e} \right) \\ τ & ≈ & \sqrt{\frac{e+1}{e−1}} \left( 1 − \frac{e}{M} \right) \\ ν & ≈ & 2 \arctan\left( \sqrt{\frac{e+1}{e−1}} \right) − \frac{\sqrt{e^2 − 1}}{M} = \arccos\left( −\frac{1}{e} \right) − \frac{\sqrt{e^2 − 1}}{M} \end{eqnarray}

De asymptoot van de hyperbool is op \( ν = \arccos(−1/e) \).

Met deze beginschatting is \( |\del E_0 β(E_0)| \) ten hoogste 10.8, wat groter is dan 1, dus deze beginschatting is niet voor alle \( M \) en \( e \) goed genoeg om de gewenste \( E \) te kunnen vinden met behulp van de tweede-ordemethode. De te grote waarden kunnen alleen optreden als \( e \) is tussen 0.83 en 1.26 en als bovendien \( M \) is tussen 0.0033 en 1.91. Voor de combinaties van \( M \) en \( e \) waarvoor de waarde te groot is moeten we deze beginschatting niet gebruiken. Hieronder zal blijken dat dat geen probleem is.

7.4.3. Gecombineerd

Fig. 8: Vergelijking van Kepler: Gecombineerde aantal herhalingen
Fig. 8: Vergelijking van Kepler: Gecombineerde aantal herhalingen

Figuur 8 toont het kleinste aantal herhalingen over beide beginschattingen. Het aantal herhalingen is klein voor kleine \( e \) en \( M_q \), en voor grote \( e \) en \( M_q \), en is hooguit ongeveer 5.5.

7.5. Hoe kies je de juiste beginschatting?

Fig. 9: Vergelijking van Kepler: Beste beginschatting
Fig. 9: Vergelijking van Kepler: Beste beginschatting

Figuur 9 toont welke van de twee beginschattingen de beste is: De beginschatting gebaseerd op kleine excentrische anomalie is de beste voor kleine \( M_q \) en \( e \) en voor de meeste elliptische banen, en de beginschatting gebaseerd op grote excentrische anomalie is de beste voor grote \( M_q \) en \( e \), maar ook voor een smal gebied van \( M_q \) en \( e \) voor ellipsbanen.

Hoe kiezen we de beste beginschatting voor een bepaalde \( M \) en \( e \)? Het is redelijk om de \( \del M \) uit vergelijking \eqref{eq:∆M} voor de twee beginschattingen met elkaar te vergelijken. De beginschatting die de kleinste \( \del M \) geeft is waarschijnlijk de beste keuze. Voor de twee beschreven beginschattingen geeft dit een hoogste herhalingsaantal van 5,88, vergeleken met 5,52 voor de ideale combinatie van de beginschattingen.

We kunnen de plaats van de grens iets verschuiven door meer gewicht te geven aan de ene of de andere beginschatting in de vergelijking. Enig proberen levert het volgende criterium:

Gebruik de beginschatting gebaseerd op grote anomalie als

\[ e \gt 1 ∧ |e \sinh(E_h) − E_h − M| \lt 0.53 |e \sinh(E_s) − E_s − M| \]

en gebruik anders de beginschatting voor kleine anomalie. Hier is \( E_h \) de beginschatting voor grote anomalie (van vergelijking \eqref{eq:est_h}) en is \( E_s \) de beginschatting voor kleine anomalie (volgens vergelijking \eqref{eq:est_ep}), en betekent \( ∧ \) "en".

Omdat \( E_h = \arsinh(M/e) \) kan het criterium worden versimpeld tot

\[ e \gt 1 ∧ |E_h| \lt 0.53 |e \sinh(E_s) − E_s − M| \]

Met dit criterium is het kleinste herhalingsaantal gelijk aan 5,52, wat niet te onderscheiden is van het aantal voor de ideale combinatie. En de grootste waarde van \( |\del E_0β(E_0)| \) is 0.27, wat ruim kleiner is dan 1, dus met dit criterium is de beginschatting voor alle \( M \) en \( e \) goed genoeg om \( E \) te vinden.


Fig. 10: Vergelijking van Kepler: Aantal herhalingen
Fig. 10: Vergelijking van Kepler: Aantal herhalingen

Figuur 10 toont het aantal herhalingen dat nodig is als de hiervoor beschreven procedure wordt gebruikt. Er is niet veel verschil met Figuur 8.


Fig. 11: Vergelijking van Kepler: Gebruikte beginschatting
Fig. 11: Vergelijking van Kepler: Gebruikte beginschatting

Figuur 11 toont welke beginschatting wordt gebruikt in de hiervoor beschreven procedure, vergelijkbaar met Figuur 9. Het meest opvallende verschil ten opzichte van die figuur is de afwezigheid van het kleine gele gebied voor \( e \lt 1 \) en \( M_q ≈ 3 \), maar de grens tussen de grote rode en gele gebieden is ook ietsje verschoven.



[AA]

talen: [en] [nl]

//aa.quae.nl/nl/reken/kepler.html;
Laatst vernieuwd: 2017-04-17