Title: Seminarium magisterskie
1Seminarium magisterskie
- Zajecia szóste sprawdzamy jak to jest z
przezywaniem...
2Na czym polega tajemnica przezycia?
- Poczatki wszystkiego w medycynie i biologii
- Pytanie kluczowe czy mozemy mówic o
determinantach przezycia od t1 do t2, wiedzac, ze
czesc pacjentów przezyla od t0 do t1? - Nie ma czarodziejskich rózdzek przyszlosci sie
nie zgadnie, ale - Prawdopodobienstwo przezycia do chwili T, ozn.
S(T) P(YgtT) - Estymujemy P(YgtT) na podstawie próby (losowosc?)
- Czas w odcinkach (az zostaje jedna obserwacja)
- P(przezycia do czasu T) S(T) P(YgtT) p(t1)
p(t2) ... p(tN)
3Techniczne tlo
- W kazdym okresie mozna wyestymowac probit/logit
- P(zyje w t przezylam do t-1)
- De facto, ciag estymacji
- p(live_tlive_t-1), p(live_t1live_t),
p(live_t2live_t1), itp. - Dla kazdego ti wyznaczamy
- ni-1 - liczbe osób w grupie ryzyka w czasie ti-1,
czyli chwile wczesniej - di - liczbe jednostek, które zaginely pomiedzy
ti-1 a ti - ni ni-1 di, n0N
- Prawdopodobienstwo przezycia odcinka pomiedzy
ti-1 a ti - p(ti) P(tiYgtti-1) (ni-1 di)/ni-1 1
di/ni-1
4Przyklad
- Dane kliniczne
- 20 obserwacji, 10 zgonów, 10 obserwacji
cenzurowanych osoby zyjace w dniu zakonczenia
obserwacji - Czas obserwacji (FU) liczony w miesiacach od daty
zakonczenia leczenia
5Estymator Kaplana Meiera
i 1 2 3 4 5 6 7 8 9 10
t 2,37 2,40 2,79 3,19 3,91 6,64 7,10 8,02 8,05 8,21
d 1 1 0 1 1 0 1 0 1 0
c 0 0 1 0 0 1 0 1 0 1
t00
t12.3655
n020
d11, c10
n1 20 1 19
S(t1) P(Ygtt1) P(t1Ygtt0)P(Ygtt0) (1-
1/20)10.95
6Estymator Kaplana Meiera
i 14 15 16 17 18 19 20
t 11,47 11,79 15,64 15,70 19,70 21,94 24,30
d 1 0 0 1 0 1 0
c 0 1 1 0 1 0 1
S(t19)P(Ygtt19) P(t19Ygtt18)P(Ygtt18) (1-
1/2)0.3863 0.50.390.19
7Estymator Kaplana Meiera
8Dodatkowe utrudnienia funkcje
- Gdy zalozyc, ze przezycie jest jakas funkcja (a
nie tylko obrazkiem danych) - Konieczne zalozenie o rozkladzie
prawdopodobienstwa przezycia - Wykladnicze ?(t) ? /stale wraz z próba?/
- Weibull ?(t) ?pptp-1 /zmienne, ale jak?/
- Gompertz-Makeham ?(t) eaßt /tez zmienne? /
- Gamma S(t) 1 - Ik(? t) /tez zmienne? /
- Wiele róznych.
9Zalety i wady estymatora KM
- Zalety
- Intuicyjny
- Nie potrzebuje wielu obserwacji
- Wyliczany z danych (zawsze wyjdzie)
- Wady
- Nie mozliwosci warunkowania cechami
- Nieciaglosci (jaki sens, gdy N duze)
- Nie ma testów statystycznych, hipotez, itp.
- Slowem narzedzie wizualizacji danych
- Potrzeba podejscia funkcyjnego, z mozliwoscia
testowania hipotez
10Inne podobne estymatory
- Estymator Nelsona-Aalena
- Ideowo nie wnosi wiele
- Podobnie jak KM szacowany z danych i tylko je
odzwierciedla - Róznica NA startuje z tzw. funkcji ryzyka, a KM
bezposrednio z funkcji przezycia - Proste modele porównujace dwie/kilka grup
- Mantel-Haenszel
- Cox
- Rózne inne kombinacje nieczesto spotykane
(czasem potrzebne)
11Model Mantel-Haenszel
12Funkcja ryzyka model Coxa
- Mozna zdefiniowac
- h(t) - funkcja ryzyka ? chwilowe
prawdopodobienstwo zgonu w czasie t pod warunkiem
przezycia do chwili t - x1, x2, ..., xk testowany zbiór czynników
ryzyka - h0(t) bazowa funkcja ryzyka w grupie, t czas
obserwacji - ß1, ß 2, ..., ß k wspólczynniki modelu
porównywane grupy
13Wady i zalety modely Coxa
- Wady
- iloraz funkcji ryzyka STALY W CZASIE!
- brak informacji (bezposredniej) dotyczacej h0(t)
- Tylko bardzo proste hipotezy (czy grupy sie
róznia) - Zalety
- Graficzny test krzywe ln(-ln(S(t)) dla
porównywanych grup - Model Coxa moze byc warunkowany dodatkowymi
zmiennymi
14Jak to zrobic w STATA? Bez survival?
- Funkcje przezycia
- twoway line S age
- Funkcje ryzyka
- gen H - log(S)
- gen h H_n - H_n-1
- gen logh log(h) gen agem age - 0.5 if h lt.
- twoway line logh agem, xtitle("age")
15Jak to dziala w STATA?
- Generalnie dwa podejscia
- Z danych (tzw. nieparametryczne)
- stscox, stsgraph
- Z zalozeniem o rozkladzie prawdopodobienstwa
(tzw. parametryczne) - stsreg, stscurve
- Najpierw trzeba zadeklarowac dane w formacie
survival - Zmienna okreslajaca smierc zmienna okreslajaca
czas - stset czas, failure(smierc)
16Jak to zrobic w STATA
- W wersji parametrycznej
- stset czas, fail(smierc)
- streg wszystkie_zmienne_determinujace,
distribution(rozklad) - W wersji nieparametrycznej
- sts graph /Kaplan Meier/
- sts graph, by(group) /Kaplan Meier/
- sts test group /Mantel-Haenszel/
- stcox group /Cox/
- stphtest, plot(group) /test potwierdzajacy, czy
Cox dobry/ - stphplot, by(treated) /graficzne potwierdzenie
testu PH/ - I to mniej wiecej wszystko
17Przykladowa estymacja streg
18Przykladowy wynik stcox
19Przykladowy test na proporcjonalnosc
20Podsumowanie
- Nie jest to narzedzie specjalnie wyrafinowane
- Na jak skomplikowane pytania odpowiemy zalezy
od nas i specyfikacji modelu - Przy duzych zbiorach metody nieparametryczne
maja swoje zalety - Przy niewielkich zbiorach metody parametryczne
moga dawac slabe rezultaty - Nie jest to metoda z zalozenia
przyczynowo-skutkowa