Vypsáno: | 2009–2010 | ||
Zadáno: | 6.10.2009 | ||
Obhájeno: | 14.5.2012 |
Práce se bude zabývat statistickými metodami pro řešení například následujícího problému. Máme skupinu subjektů (pacienti, ...) a u nich opakovaně (v čase) měříme nějaký ukazatel (krevní tlak, ...). Pro jeden subjekt máme tedy k dispozici opakovaná měření téhož, přičemž na jednotlivá měření lze též pohlížet jako na funkci času. Odsud termín funkcionální data, kdy jedno pozorování = funkce (času) udávající hodnotu ukazatele (krevního tlaku) pro jeden subjekt (pacienta). Cílem je rozdělit jednotlivé subjekty do skupin (shluků) tak, aby v rámci jednoho shluku byly ty subjekty, pro něž si jsou funkcionální pozorování v jistém smyslu podobná. V případě pacientů a v situaci, kdy má měřený ukazatel nějakou souvislost s danou chorobou, mohou poté shluky reprezentovat různé stupně závažnosti choroby. Na rozdíl od klasické shlukové analýzy, kdy se k tvorbě shluků použije pouze jedno (např. poslední) měření ukazatele pro každý subjekt, se bude DP práce zabývat přístupy, kdy je k vytvoření shluků použito celé historie, tj. všech pozorování daného ukazatele každého subjektu.
V posledních cca 15 letech bylo v literatuře publikováno mnoho přístupů ke shlukování na základě funkcionálních či longitudinálních dat. Posluchač aktivně vyhledá relevantní literaturu, kriticky posoudí publikované přístupy a vše při jednotném značení shrne ve své diplomové práci. V případě zájmu je možné některý z dříve publikovaných přístupů zobecnit či jinak vylepšit. Pro mnohé publikované přístupy neexistuje snadno aplikovatelný software. Nedílnou součástí diplomové práce bude proto implementace jednotlivých přístupů v R a aplikace na reálná data. Odborná literatura bude vesměs v angličtině, diplomová práce bude psána česky nebo slovensky.