(NMST 551) Statistický projektový seminář
Rozvrh:
Po: 15:40 - 17:10 | @K4
(Michal Kulich & Matúš Maciak)
Sylabus/Úlohy
Cielom projektového semináru NMST551 je štatistické spracovanie dátového súboru a príprava odborného textu s s výsledkami analýzy - vypracovanie vedeckého článku. V priebehu semestra budeme postupne analyzovať jeden konkrétny dátový súbor: budeme diskutovať nad rôznymi metódami štatistikého spracovania a postupne zopovedať otázky a riešiť problémy, ktoré v súvislosti so spracovaním dátového súboru nastanú.
Okrem samotnej analýzy budeme diskutovať aj spôsob tvorby výzkumnej správy, formulácie odborného textu a prezentácie štatistických výsledkov. Na tejto stránke bude postupne zverejňovaný a priebežne aktualizovaný zoznam úloh, ktoré je nutné v danom týždni vypracovať.
- Úkol č.1 | Due to 9/10/17
Oboznámiť sa s dátovými súbormi, porozumieť im a pochopiť ich štruktúru. Načítať dátové súbory v programe R a premyslieť možné spôsoby ich spracovania za účelom zodpovedania položených vedeckých hypotéz
(viď PDF súbor so zadaním). - Úkol č.2 | Due to 16/10/17
Načítať dátove súbory v R, opraviť ich pomocou kontrolých súborov a vypracovať postup (R skript) na prípravu dát k štatistickej analýze (prvotný cieľ je získať z dát informáciu o vzájomných vzdialenostiach jedincov v danom prostredí). Aktualizované kontrolné súbory (check files) s odstránenou zaokrúhlovacou chybou su k dispozícii tu: ZIP súbor | TAR.GZ súbor - Úkol č.3 | Due to 23/10/17
Spracovať data v programe R tak, aby obsahovali informáciu o polohe jedincov v prostredí (buď pomocou definície jednotlivých sektorov/segmentov, alebo priamo pomocou záznamov z jednotlivých antén). Premyslieť si a nadefinovať (niekoľko rôznych) vzialenosti a pomocou informácie o polohe sumcov tieto vzdialenosti spočítať. Aktuálný postup práce zdokumentovať (stručne ale konkrétne) a emailom (PDF alebo aspoň TXT súbor) poslať obom vyučujúcim (najneskôr v pondelok dopoludnia). - Úkol č.4 | Due to 30/10/17
Pripraviť štrukturovanú výzkumnú správu (PDF report) a podrobne vypracovať niektoré jej časti: Úvod, Metódy (konkrétne popis experimentu a príprava dátového súboru) a Výsledky (konkrétne popisné charakteristiky, uviesť tabuľky a názorné obrázky/grafy). Dopracovať výpočet vzdialenosti a premyslieť možné postupy pre štatisticku analýzu. Ako pomoc pri písaní úvodu može poslúziť fantázia, wikipédia, prípadne iné odborné články, napr. o tom ako fungujú sumci v skupinách, alebo ako sú schopné robiť kolektívne rozhodnutia. - Úkol č.5 | Due to 6/11/17
Dopracovať Úvod, Metódy (konkrétne popis experimentu a príprava dátového súboru) a Výsledky (konkrétne popisné charakteristiky). Časť Výsledky má obsahovať slovný popis základných (podstatných a dôležitých) informácii z tabuliek (ktoré tvoria v určitom zmysle kompexný prehľad o datach) a obrázkov (s priamym odkazovaním na tabulky a obrázky). Pre umožnenie českej diakritike v popise obrázkov by mal fungovať nasledujúci príkaz:
Sys.setlocale(category="LC_CTYPE", locale="cs_CZ.UTF-8")
Analogický postup funguje pre voľbu slovenskej diakritiky:
Sys.setlocale(category="LC_CTYPE", locale="sk_SK.UTF-8")
- Úkol č.6 | Due to 13/11/17
Dopracovať report v rozsahu všeobecne aj špecificky mienených pripomienok a návrhov a premyslieť možnosti štatistickej analýzy dát. - Úkol č.7 | Due to 20/11/17
Štatistická analýza dát: navrhnuť a odhadnúť konkrétne štatistické modely pre modelovanie vzdialenosti, súdržnosti a izolovanosti pridaného jedinca vzhľadom pôvodnej skupine sumcov. Použité modely popísať a získané výsledky sa pokúsiť interpretovať. - Úkol č.8 | Due to 27/11/17
Štatistická analýza dát: dopracovať štatisticku analýzu dat. V prípade použitia modelov s nahodnými efektami premysliet a namodelovat variančnú a kovariančnú štruktúru v datach. V prípade charakterizácie experimentov pomocou jedneho čísla rozhodnuť akým číslom konkrétne a navrhnúť vhodný štatistický model, ktorý pomože odpovedať hypotézy položené v úvode. - Úkol č.9 | Due to 04/12/17
Finálne dopracovať štatistickú analýzu a zladiť výsledky z popisnej štatistiky s výsledkami zo štatistickej analýzy. Viacmenej finálne dopracovať report: úvod, metódy, výsledky, diskusiu a záver.
Zadanie projektu pre ZS2017/2018
K dispozícii sú dátové súbory z experimentu, ktorý bol v závere roka 2010 uskutočnený vo Výzkumnom ústave vodohospodářskom, T.G. Masaryka, v Prahe. Experiment mal za úlohu vyšetriť chovanie skupiny sumcov, v prípade, že že sa dostanú do kontaktu s neznámym jedincom. Tento neznámy jedinec bol síce opäť sumec, avšak v niektorých prípadoch sa jednalo o sumca skupine podobného a iných prípadoch o jedinca na pohľad rozdielného - tzv. albína.
Odborné vedecké hypotézy kladené v súvislosti s týmto experimentom, môžu byť formulované nasledujúco:
- Skupina sumcov bude ochotnejšie akceptovať jedinca im podobného,
než jedinca na pohľad výrazne odlišného - albína. - Skupina sumcov bude súdržnejšia v prípade, že ma do činenia s neznámym jedincom, ktorý je albín.
- Dodatočný jedinec bude viacej izolovaný skupinou sumcov v prípade,
že sa jedná o jedinca albína.
Podrobnejší popis celého experimentu, technické detaily jeho priebehu, popis dátových súborov a tiež samotné dátové súbory sú k dispozícii k stiahnutiu tu:
- Popis experimetu a dátových súborov: PDF súbor
- Jednotlivé dátové súbory: ZIP súbor || tar.gz súbor
- Opravené kontrolné súbory: ZIP súbor || tar.gz súbor (Updated 09/10/17)
Odporúčaná literatúra
Niekoľko názorných príkladov odborných vedeckých článkov, rôzne doporučenia ako odborné články písať a formulovať text a ako prezentovať štatistické výsledky, spolu s užitočnými návodmi pre prácu s LaTeX-om:
Požiadavky k zápočtu
Každý študent odovzdá na konci semestru vlastnú prácu - vedecký odborný článok (resp. výskumnú správu), vypracovanú podľa jednotlivých úloh, zadávaných v priebehu semetra.