Discussion:
Wariancja i wartość oczekiwana zmiennej losowej, czy dobrze wyznaczyłem?
(Wiadomość utworzona zbyt dawno temu. Odpowiedź niemożliwa.)
S.Sienkowski
2009-03-29 16:46:27 UTC
Permalink
Witam Kolegów

Proszę o sprawdzenie poprawności wyprowadzeń.

Dana jest n-wymiarowa zmienna losowa X=(X1, X2, ..., Xn) oraz utworzona
na jej postawie statystyka Y=sqrt( (X1^2+X2^2+...+Xn^2)/n), gdzie X1,
X2, ...., Xn to zmienne losowe. Należy wyznaczyć wartość oczekiwaną (a)
i wariancję (b) zmiennej losowej Y.

(a) E[Y]=sqrt((1/n)*(E[X1^2]+E[X2^2]+...+E[Xn^2]))=sqrt(E[X^2]);

(b) Var[Y]=E[Y^2]-E[Y]^2 = sqrt( (1/n^2)*(n*E[X^4]+n(n-1)*E[X^2]^2) )
-E[X^2] = sqrt( (1/n)*(E[X^4]-E[X^2]^2) + E[X^2]^2 ) - E[X^2];

Gdyby nie było tego pierwiastka, który mnie niepokoi to wynik byłby
oczywisty, a tak nie wiem czy pierwiastek ma wpływ na obliczanie
wartości oczekiwanej. Może są jakieś konsekwencje "wchodzenia" z
operatorem wartości oczekiwanej pod pierwiastek? Może istnieje jakiś
przykład na obliczanie wartości oczekiwanej zmiennej losowej zapisanej
wyrażeniem z pierwiastkiem?

Dziękuję i pozdrawiam.
Mateusz Lacki
2009-03-29 20:06:57 UTC
Permalink
Wartość oczekiwania pierwiastka to nie jest pierwiastek wartości
oczekiwanej, np:

P(X=1)=0.5
P(X=0)=0.5
E[\sqrt{X}]=E[X]=E[X^2]=0.5
\sqrt{E[X]}=\sqrt{0.5}
\sqrt{E[X^2]}=\sqrt{0.5}
E[\sqrt{X^2}]=E[|X|]=E[X]=0.5

i się nie zgadza. Ten myk ze składaniem z jakąś funkcją działa tylko dla
funkcji afinicznych.

Pozdrawiam,
Mateusz Łącki
S.Sienkowski
2009-03-29 20:39:51 UTC
Permalink
Witam

Dziękuję za kontrprzykład. No właśnie, tego się obawiałem. ;)

Ciekaw jestem zatem ile wynosi
E[Y]=sqrt((1/n)*(E[X1^2]+E[X2^2]+...+E[Xn^2]))=?

Czy mógłby Pan podać choćby wskazówkę do rozwiązania tego problemu? Czy
można znaleźć jakiś przykład w literaturze. Przyznam, że przerzuciłem
kilka książek ze statystyki i nie znalazłem jasnej dla mnie odpowiedzi,
jak postępować gdy pojawia się w wyrażeniu ze zmienną losową pierwiastek.

Pozdrawiam serdecznie
Post by Mateusz Lacki
Wartość oczekiwania pierwiastka to nie jest pierwiastek wartości
P(X=1)=0.5
P(X=0)=0.5
E[\sqrt{X}]=E[X]=E[X^2]=0.5
\sqrt{E[X]}=\sqrt{0.5}
\sqrt{E[X^2]}=\sqrt{0.5}
E[\sqrt{X^2}]=E[|X|]=E[X]=0.5
i się nie zgadza. Ten myk ze składaniem z jakąś funkcją działa tylko dla
funkcji afinicznych.
Pozdrawiam,
Mateusz Łącki
WuKa
2009-03-29 20:45:07 UTC
Permalink
Post by S.Sienkowski
Gdyby nie było tego pierwiastka, który mnie niepokoi to wynik byłby
oczywisty, a tak nie wiem czy pierwiastek ma wpływ na obliczanie wartości
oczekiwanej. Może są jakieś konsekwencje "wchodzenia" z operatorem
wartości oczekiwanej pod pierwiastek? Może istnieje jakiś przykład na
obliczanie wartości oczekiwanej zmiennej losowej zapisanej wyrażeniem z
pierwiastkiem?
Dziękuję i pozdrawiam.
Ponieważ pytanie wróciło po jakimś czasie, rozumiem, że jest dla Kolegi
ważne, więc podzielę się pewnymi uwagami. Pierwiastek jest istotną
przeszkodą i w sposób oczywisty "psuje" addytywność i jednorodność wzorów,
czyli "wchodzenie" z operatorami do wnętrza.
Mam obawy, że nie uda się wyprowadzić wzorów dla dowolnego typu rozkładów
zmiennej X, (czytaj: jej elementów Xi), natomiast niezmiernie ważnym
ułatwieniem byłoby założenie ich rozkładu N(0,1).
Wtedy zaczynamy mówić o znanych rozkładach spotykanych w statystyce, jak
chi-kwadrat, który przecież jest rozkładem sumy kwadratów Xi. Wszystko
sprowadza się do sięgnięcia po rozkład Gamma, do twierdzeń o sumowaniu
zmiennych o rozkładzie Gamma. Możliwe jest wówczas wyznaczenie E i Var w
funkcji liczby składników n.
Polecam książkę A. i E. Plucińscy "Rachunek pp, Statystyka Matematyczna,
Procesy Stochastyczne" z serii Probabilistyka, wydawnictwa WNT, rok 2000.
Tam niemal dotyka się tego problemu, który teraz wymaga kartki papieru i
chwili czasu do samodzielnych obliczeń. Zwarte tam przykłady krok po kroku
pokazują, jak wylicza się E i Var dla chi-kwadrat czy t-Studenta. Ten
ostatni przecież jest ilorazem zmiennej o rozkładzie N przez chi-kwadrat.
Przypomnę, że zmienna Y=sqrt(2chi-kwadrat)-sqrt(2n-1) ma rozkład N(0,1) i
dlatego teraz intuicyjnie wyczuwam, że również N będzie rozkładem końcowym,
jeśli Xi podlegałyby normalnemu (dla prostoty - unormowanemu). Przy n->oo
zdecydowanie "wygra" rozkład normalny.
Z ciekawości - spróbuję to policzyć, gdy czas na to pozwoli.
W przypadku dowolnych typów rozkładów, pozostaje chyba tylko eksperyment
losowy. Generowanie zmiennych, sumowanie ich kwadratów, tworzenie
histogramów, stawianie hipotez, weryfikacja a na końcu - wyznaczenie ich
parametrów z "odgadniętej" postaci analitycznej.

WuKa
S.Sienkowski
2009-03-29 22:25:43 UTC
Permalink
Witam serdecznie

Byłbym wielce zobowiązany za pomoc w rozwiązaniu problemu.

Mogę dodać, co może być interesujące, że generatorami liczb
pseudolosowych o rozkładzie gaussowskim, a następnie równomiernym
wyznaczałem K=1 000 000 prób zawierających po n=1 000 próbek. Następnie
szacowałem wariancję ze wzoru:

Var=(1/(K-1))*( (y(1)-y_sr)^2 + (y(2)-y_sr)^2 +...+ (y(K)-y_sr)^2 ),

gdzie: y(1), y(2),..., y(K) to wartości skuteczne obliczone dla każdej
próby, y_sr to średnia ze wszystkich wartości skutecznych.

Co ciekawe otrzymywałem zawsze dla obu rozkładów, że Var przyjmowała
wartości bliskie 0.5*Var[Y].

Następnie intuicyjnie bardzo nieznacznie zmodyfikowałem wzór na Var[Y]
podany w pierwszym poście i przyjąłem, że:

Var[Y]= sqrt( (1/(2*n))*(E[X^4]-E[X^2]2) + E[X^2]^2 ) - E[X^2].

Otrzymywałem wówczas, że niemal Var=Var[Y]. Niedowierzając, powtarzałem
eksperyment generując nawet miliard prób, przyjmując różne wartości
odchyleń standardowych i amplitud badanych rozkładów i zawsze
otrzymywałem zgodność Var i Var[Y] nawet do kilku cyfr znaczących.

Oczywiście muszę dodać, że składniki wariancji Var[Y] to momenty zwykłe
zmiennej losowej, łatwo je obliczyłem, ponieważ podane są w literaturze
dla wszystkich popularnych rozkładów.

Niestety to wszystko bez analitycznych wyprowadzeń i formalnego dowodu,
ot zgadywanka na podstawie wyników eksperymentu.


Pozdrawiam serdecznie
Post by WuKa
Post by S.Sienkowski
Gdyby nie było tego pierwiastka, który mnie niepokoi to wynik byłby
oczywisty, a tak nie wiem czy pierwiastek ma wpływ na obliczanie wartości
oczekiwanej. Może są jakieś konsekwencje "wchodzenia" z operatorem
wartości oczekiwanej pod pierwiastek? Może istnieje jakiś przykład na
obliczanie wartości oczekiwanej zmiennej losowej zapisanej wyrażeniem z
pierwiastkiem?
Dziękuję i pozdrawiam.
Ponieważ pytanie wróciło po jakimś czasie, rozumiem, że jest dla Kolegi
ważne, więc podzielę się pewnymi uwagami. Pierwiastek jest istotną
przeszkodą i w sposób oczywisty "psuje" addytywność i jednorodność
wzorów, czyli "wchodzenie" z operatorami do wnętrza.
Mam obawy, że nie uda się wyprowadzić wzorów dla dowolnego typu
rozkładów zmiennej X, (czytaj: jej elementów Xi), natomiast niezmiernie
ważnym ułatwieniem byłoby założenie ich rozkładu N(0,1).
Wtedy zaczynamy mówić o znanych rozkładach spotykanych w statystyce, jak
chi-kwadrat, który przecież jest rozkładem sumy kwadratów Xi. Wszystko
sprowadza się do sięgnięcia po rozkład Gamma, do twierdzeń o sumowaniu
zmiennych o rozkładzie Gamma. Możliwe jest wówczas wyznaczenie E i Var w
funkcji liczby składników n.
Polecam książkę A. i E. Plucińscy "Rachunek pp, Statystyka Matematyczna,
Procesy Stochastyczne" z serii Probabilistyka, wydawnictwa WNT, rok
2000. Tam niemal dotyka się tego problemu, który teraz wymaga kartki
papieru i chwili czasu do samodzielnych obliczeń. Zwarte tam przykłady
krok po kroku pokazują, jak wylicza się E i Var dla chi-kwadrat czy
t-Studenta. Ten ostatni przecież jest ilorazem zmiennej o rozkładzie N
przez chi-kwadrat.
Przypomnę, że zmienna Y=sqrt(2chi-kwadrat)-sqrt(2n-1) ma rozkład N(0,1)
i dlatego teraz intuicyjnie wyczuwam, że również N będzie rozkładem
końcowym, jeśli Xi podlegałyby normalnemu (dla prostoty - unormowanemu).
Przy n->oo zdecydowanie "wygra" rozkład normalny.
Z ciekawości - spróbuję to policzyć, gdy czas na to pozwoli.
W przypadku dowolnych typów rozkładów, pozostaje chyba tylko eksperyment
losowy. Generowanie zmiennych, sumowanie ich kwadratów, tworzenie
histogramów, stawianie hipotez, weryfikacja a na końcu - wyznaczenie ich
parametrów z "odgadniętej" postaci analitycznej.
WuKa
Boguś
2009-03-30 16:50:34 UTC
Permalink
Post by S.Sienkowski
Mogę dodać, co może być interesujące, że generatorami liczb
pseudolosowych o rozkładzie gaussowskim, a następnie równomiernym
wyznaczałem K=1 000 000 prób zawierających po n=1 000 próbek. Następnie
Var=(1/(K-1))*( (y(1)-y_sr)^2 + (y(2)-y_sr)^2 +...+ (y(K)-y_sr)^2 ),
gdzie: y(1), y(2),..., y(K) to wartości skuteczne obliczone dla każdej
próby, y_sr to średnia ze wszystkich wartości skutecznych.
hm, wartość skuteczna to dobre w elektrotechnice, w matematyce to lepiej
jednak używać średnia kwadratowa.
Odnotujmy również: że średnia kwadratowa > średniej zwykłej,
że średnia kwadratowa z ujemnych wartości zmiennej losowej jest dodatnia.
Post by S.Sienkowski
Co ciekawe otrzymywałem zawsze dla obu rozkładów, że Var przyjmowała
wartości bliskie 0.5*Var[Y].
Co to jest Y :
1) zbiór wszystkich elementów y ( liczba elementów n*K)
2) zgodnie z definicją z 1 postu zdefiniowaną jako
Y=sqrt( (X1^2+X2^2+...+Xn^2)/n)
(liczba elementów K)

ad1) Var ~= Var(Y) jest prawdziwe tylko gdy y_sr jest zdefiniowane jako
średnia ze wszystkich wyników i jest równe ZERO.
<dygresja> oznaczenie Var i Var(y) jest fatalne </dygresja>
Gdy tak jak u ciebie y_sr zdefiniowane jest jako średnia ze średnich
kwadratowych to Var jest zawsze < Var(Y) i może być znacznie mniejsze
czyli Var<< Var{Y}

ad2) Var = Var(Y) ZAWSZE, niezależnie od rozkładu, bo zdefiniowałeś Var
tak samo jak Var(Y)
To 0.5 to jakieś nieporozumienie numeryczne.
--
Boguś

PS. Tnij niepotrzebne cytaty
WuKa
2009-03-30 19:19:31 UTC
Permalink
Post by S.Sienkowski
Witam serdecznie
Byłbym wielce zobowiązany za pomoc w rozwiązaniu problemu.
Wziąłem się za trudniejszy przypadek, gdy składowe Xi mają rozkład N(0,1),
jeśli nie, to unormowanie sprawę załatwi jednym dodatkowym krokiem.
1. Skorzystałem z definicji funkcji G Gamma-Eulera i jej własności:
G(p)=(p-1)G(p-1)
2. Stworzyłem zmienną Yn=sqrt(suma(Xi^2)/n)
3. Zbudowałem jej gęstość, jest to postać sprowadzalna do funkcji G
4. Skoro mam gęstość, to z definicji liczę EYn jako całkę wiadomo z czego.
Wnętrze całki znów sprowadza się do odmiany funkcji G i całkuje się w sposób
ogólny, na symbolach.
5. Dostałem EYn= sqrt(2/n)*G(0.5(n-1))/G(n/2)
6. Liczenie VarYn jest już proste, korzystam ze wzoru VarYn =
E(Yn^2)-(EYn)^2, w którym to drugi składnik daje kwadrat liczby z pkt. 5 a
pierwszy uwalnia pierwiastek i pozwala wejść z E do wnętrza. Składnik ten
daje E(Yn^2)=E(suma(Xi^2)/n)=(1/n)*suma(E(Xi^2)). Korzystam z faktu, że Xi
mają rozkład N(0,1), a zatem można na boku pokazać, że E(Xi^2)=1, czyli
ostatecznie: VarYn=(1/n)*n*1- kwadrat wzoru z pkt. 5 = 1-kwadrat wzoru z
pkt. 5.

We wspomnianej wczoraj literaturze była wzmianka, że w innej pozycji
literatury: H. Cramer Metody matematyczne w statystyce, PWN, 1958 można
znaleźć dowód pewnej własności granicznej: lim (n->oo) EYn = 1.
Wniosek: Dla n=inf mamy prawo oczekiwać (ozn. Yinf=Y), że EY=1 i VarY=0,
czyli dąźymy do
rozkładu dyskretnego, jednopunktowego!!! P(Y=1)=1, P(Y!=1)=0. Prosta grafika
matlabowa rzeczywiście to pokazuje w sposób nie budzący wątpliwości.

Przypadek Xi z rozkładem równomiernym, pozornie prostszy, wydaje się mieć
pewną trudność. Nie jest określony typ rozkładu sumy n składników w
kwadratach. Nie mamy tu bowiem rozkładu chi-kwadrat, który zakładał ich
rozkład normalny. Być może dopiero tw. graniczne pozwolą coś tu zauważyć?

WuKa
WuKa
2009-03-30 20:34:06 UTC
Permalink
Post by WuKa
5. Dostałem EYn= sqrt(2/n)*G(0.5(n-1))/G(n/2)
Korekta, źle napisałem znak w liczniku:
Dostałem EYn= sqrt(2/n)*G(0.5(n+1))/G(n/2)

WuKa
Boguś
2009-03-31 07:04:48 UTC
Permalink
Post by WuKa
Post by S.Sienkowski
Byłbym wielce zobowiązany za pomoc w rozwiązaniu problemu.
Wziąłem się za trudniejszy przypadek, gdy składowe Xi mają rozkład N(0,1),
Ambitny plan odpowiedzi na pierwotne pytanie autora wątku
Post by WuKa
G(p)=(p-1)G(p-1)
2. Stworzyłem zmienną Yn=sqrt(suma(Xi^2)/n)
3. Zbudowałem jej gęstość, jest to postać sprowadzalna do funkcji G
Nie tak szybko. Funkcja Gamma (G) to uogólnienie silni na liczby
rzeczywiste a rozkład Gamma to zupełnie co innego. Podaj swoją funkcję
gęstości, która ma wynikać z pkt 2, albo i nie , bo musiałabym ją w pkt
4 całkować ;)
Post by WuKa
4. Skoro mam gęstość, to z definicji liczę EYn jako całkę wiadomo z czego.
Wnętrze całki znów sprowadza się do odmiany funkcji G i całkuje się w
sposób ogólny, na symbolach.
5. Dostałem EYn= sqrt(2/n)*G(0.5(n-1))/G(n/2)
Dostałem EYn= sqrt(2/n)*G(0.5(n+1))/G(n/2)
Ten plus niby niewiele robi kolosalną różnicę
dla n=100 wg 1 wzoru EYn=0.020 w /g 2 wzoru EYn= 0.9975 i to jest
prawidłowa odpowiedź.
Dla dużych n są problemy z obliczeniem G np dla n=100 G(100/2) = 2
10^31, a co z n=1000?. Strach pomyśleć ( 5 10^565 nie zmieści się w
komputerze ;) )
Dla n >= 10 można obliczyć w/ wzoru EYn = 1-1/(4n)+1/{32n)
Dla n >= 10 z dobrą dokładnością można opisać ten rozkład przy pomocy
rozkładu normalnego

Dla ogólnego rozkładu normalnego N(sr,s) nie można przeprowadzić
normalizację bo Xi^2 to jednak nie Xi
W tym przypadku
EYn ~= sqrt(2/n)*G(0.5(n+1))/G(n/2)*sqrt(sr^2+s^2)
--
Boguś
WuKa
2009-03-31 08:01:12 UTC
Permalink
U?ytkownik "Bogu?" <***@wp.pl> napisa? w wiadomo?ci news:gqsfrl$ejs$***@nemesis.news.neostrada.pl...

1. Zasadą grupy jest wskazywanie pewnych kierunków, pomysłów a nie
rozwiązywanie od A do Z. Jeśli wziąłem pod uwagę rozkład N(0,1), to dlatego,
że chciałem SOBIE rzecz uprościć, bo przecież czas jaki poświęcam zadaniu
jest inspirowany ciekawością a limitowany rosądkiem.
Ponieważ autor postu pisze o prądach i ich pomiarach, uznałem, że rozkład
N(mi, sigma) będzie jak najbardziej właściwy, stąd skupienie akurat na nim
uwagi.
2. Nie mówiłem o rozkładzie Gamma, ale o funkcji Gamma. G(p)=int(0,inf)
x^(p-1)*exp(-x)dx
3. Funkcja Z=sqrt(W) ma gęstość g(w)=2w*f(w^2) dla y>0 na mocy twierdzenia o
funkcjach zmiennych losowych, które określa nową gęstość na podstawie
wyjściowej f(w) dla W
4. Funkcja gęstości g(Yn) = sqrt(suma(Xi^2)) ma więc postać, w której rolę W
pełni suma(Xi^2) czyli chi-kwadrat. Jej gęstość (nazwijmy g(y))jest
kłopotliwa do zapisania tekstowo, ale można ją znaleźć tu i ówdzie. Pod
całką zawiera m. innymi y^(n-1) oraz exponent z wyrażeniem -(ny^2)/2
5. Licząc wartość oczekiwaną, mnożę wnętrze przez y, co pozostawi tylko y^n
i dalej ten sam eksponent. Doskonuję zamiany zmiennych (ny^2)/2=s a w
konsekwencji dostaję całkę z wnętrzem odpowiadającym wartości funkcji
Gamma(o.5(n+1)) z jakimiś wyrażeniami usuwającymi wszystko to, co wniosła
(jako stałe) funkcja gęstości rozkładu chi-kwadrat. Po znacznej redukcji
zostaje tylko sqrt(2/n) w mianowniku.
6. "Ambitniejsze" zadanie okazało się analiycznie prostsze od ogólnego, z
dowolnym typem rozkładu, gdyż zostanie utracona zdolność skorzystania z
postaci rozkładu ch-kwadrat, wnoszącego szereg istotnych udogodnień i
odwołań do znanych symbolicznych całek.
7. Chętnie wyślę pdf z pełnym wyprowadzeniem.
WuKa


na zmiennych
Oczywwiście, że podam, ale
Post by Boguś
Post by WuKa
4. Skoro mam gęstość, to z definicji liczę EYn jako całkę wiadomo z czego.
Wnętrze całki znów sprowadza się do odmiany funkcji G i całkuje się w
sposób ogólny, na symbolach.
5. Dostałem EYn= sqrt(2/n)*G(0.5(n-1))/G(n/2)
Dostałem EYn= sqrt(2/n)*G(0.5(n+1))/G(n/2)
Ten plus niby niewiele robi kolosalną różnicę
dla n=100 wg 1 wzoru EYn=0.020 w /g 2 wzoru EYn= 0.9975 i to jest
prawidłowa odpowiedź.
Dla dużych n są problemy z obliczeniem G np dla n=100 G(100/2) = 2
10^31, a co z n=1000?. Strach pomyśleć ( 5 10^565 nie zmieści się w
komputerze ;) )
Dla n >= 10 można obliczyć w/ wzoru EYn = 1-1/(4n)+1/{32n)
Dla n >= 10 z dobrą dokładnością można opisać ten rozkład przy pomocy
rozkładu normalnego
Dla ogólnego rozkładu normalnego N(sr,s) nie można przeprowadzić
normalizację bo Xi^2 to jednak nie Xi
W tym przypadku
EYn ~= sqrt(2/n)*G(0.5(n+1))/G(n/2)*sqrt(sr^2+s^2)
--
Boguś
S.Sienkowski
2009-04-01 15:05:56 UTC
Permalink
Witam Kolegów

Dziękuję za wszystkie odpowiedzi i podpowiedzi. Temat jest rzeczywiscie
ciekawy a przykłady raczej rzadko podawane w literaturze.

Przedwczoraj odgrzebałem pewien przykład obliczania wartości oczekiwanej
zmiennej losowej pod pierwiastkiem w książce Profesora Krzyśki
"Statystyka matematyczna", str. 74, p.2.5, gdyby ktoś był
zainteresowany. Krzyśko zakłada rozkład normalny z próby.

Niestety teraz mam urwanie głowy, jestem w rozjazdach, jak tylko znajdę
chwilę postaram się przeanalizować na pewno wartościowe dla mnie
odpowiedzi i wskazówki.

Pozdrawiam serdecznie
Post by WuKa
1. Zasadą grupy jest wskazywanie pewnych kierunków, pomysłów a nie
rozwiązywanie od A do Z. Jeśli wziąłem pod uwagę rozkład N(0,1), to dlatego,
że chciałem SOBIE rzecz uprościć, bo przecież czas jaki poświęcam zadaniu
jest inspirowany ciekawością a limitowany rosądkiem.
Ponieważ autor postu pisze o prądach i ich pomiarach, uznałem, że rozkład
N(mi, sigma) będzie jak najbardziej właściwy, stąd skupienie akurat na nim
uwagi.
2. Nie mówiłem o rozkładzie Gamma, ale o funkcji Gamma. G(p)=int(0,inf)
x^(p-1)*exp(-x)dx
3. Funkcja Z=sqrt(W) ma gęstość g(w)=2w*f(w^2) dla y>0 na mocy twierdzenia o
funkcjach zmiennych losowych, które określa nową gęstość na podstawie
wyjściowej f(w) dla W
4. Funkcja gęstości g(Yn) = sqrt(suma(Xi^2)) ma więc postać, w której rolę W
pełni suma(Xi^2) czyli chi-kwadrat. Jej gęstość (nazwijmy g(y))jest
kłopotliwa do zapisania tekstowo, ale można ją znaleźć tu i ówdzie. Pod
całką zawiera m. innymi y^(n-1) oraz exponent z wyrażeniem -(ny^2)/2
5. Licząc wartość oczekiwaną, mnożę wnętrze przez y, co pozostawi tylko y^n
i dalej ten sam eksponent. Doskonuję zamiany zmiennych (ny^2)/2=s a w
konsekwencji dostaję całkę z wnętrzem odpowiadającym wartości funkcji
Gamma(o.5(n+1)) z jakimiś wyrażeniami usuwającymi wszystko to, co wniosła
(jako stałe) funkcja gęstości rozkładu chi-kwadrat. Po znacznej redukcji
zostaje tylko sqrt(2/n) w mianowniku.
6. "Ambitniejsze" zadanie okazało się analiycznie prostsze od ogólnego, z
dowolnym typem rozkładu, gdyż zostanie utracona zdolność skorzystania z
postaci rozkładu ch-kwadrat, wnoszącego szereg istotnych udogodnień i
odwołań do znanych symbolicznych całek.
7. Chętnie wyślę pdf z pełnym wyprowadzeniem.
WuKa
na zmiennych
Oczywwiście, że podam, ale
Post by Boguś
Post by WuKa
4. Skoro mam gęstość, to z definicji liczę EYn jako całkę wiadomo z
czego.
Post by Boguś
Post by WuKa
Wnętrze całki znów sprowadza się do odmiany funkcji G i całkuje się w
sposób ogólny, na symbolach.
5. Dostałem EYn= sqrt(2/n)*G(0.5(n-1))/G(n/2)
Dostałem EYn= sqrt(2/n)*G(0.5(n+1))/G(n/2)
Ten plus niby niewiele robi kolosalną różnicę
dla n=100 wg 1 wzoru EYn=0.020 w /g 2 wzoru EYn= 0.9975 i to jest
prawidłowa odpowiedź.
Dla dużych n są problemy z obliczeniem G np dla n=100 G(100/2) = 2
10^31, a co z n=1000?. Strach pomyśleć ( 5 10^565 nie zmieści się w
komputerze ;) )
Dla n >= 10 można obliczyć w/ wzoru EYn = 1-1/(4n)+1/{32n)
Dla n >= 10 z dobrą dokładnością można opisać ten rozkład przy pomocy
rozkładu normalnego
Dla ogólnego rozkładu normalnego N(sr,s) nie można przeprowadzić
normalizację bo Xi^2 to jednak nie Xi
W tym przypadku
EYn ~= sqrt(2/n)*G(0.5(n+1))/G(n/2)*sqrt(sr^2+s^2)
--
Boguś
Loading...