Statistisches Praktikum im SS 2019

Prof. Dr. Gaby Schneider
unter Mitarbeit von Solveig Plomer und Insea Schlattmeier

Seminar im SS 2019. Do. 12:15 Uhr, 711 (klein), RM 10

Vorbesprechung: Mi, 6. Februar, 13:30 Uhr, Raum 711 (groß).
Die Teilnahme an der Vorbesprechung ist Voraussetzung für die Teilnahme am Statistischen Praktikum.

Abschlusspräsentation: Donnerstag, 11. Juli 2019, 12-14 Uhr
, 711 (groß), RM 10

Thema 1: Stochastische Modellierung und statistische Analyse der Bewegung von Zellorganellen

In Kooperation mit Prof. Dr. Enrico Schleiff, Institut für molekulare Zellbiologie der Pflanzen, Goethe-Universität Frankfurt

1. Marina Sturm und Alexander Wiegel - Datenlage und Hypothesenentwicklung

Wir untersuchen einen Datensatz von Bewegungsmustern bestimmter Zellorganellen mit dem Ziel, diese zu klassifizieren und zu beschreiben. Die Bewegungsmuster zeigen eine hohe Variabilität von sehr kleinen, fast punktförmigen, bis hin zu schnellen, sprunghaften Bewegungen. Speziell zu den sprunghaften Bewegungen diskutieren wir potentielle Probleme bei der Datenerhebung sowie experimentelle und analytische Lösungsansätze. So sinkt etwa die Beobachtungsdauer mit steigender Geschwindigkeit der Organelle, und große Sprünge treten gehäuft an den Rändern des beobachteten Zeitfensters auf.

2. Sonja Drescher und Adrian Schmidt - Hauptkomponentennalyse

Wir untersuchen, wie gut die Bewegungen der Organellen in weniger als drei Dimensionen dargestellt werden können. Hierfür nutzen wir die Hauptkomponentenanalyse, welche sukzessive die zueinander orthogonalen Richtungen maximaler Varianz findet. Anhand dieser Richtungen können die Bewegungen in neuen Koordinatensystemen dargestellt werden. Besteht in einer der neuen Richtungen nur wenig Variabilität, so wird durch Weglassen dieser Richtung eine Darstellung in nur ein oder zwei Dimensionen möglich, die dennoch einen Großteil der Varianz abbildet. Bei einer Reduktion auf nur eine Dimension etwa bewegt sich die Organelle annähernd entlang einer Geraden. Wir untersuchen Unterschiede in der Reduzierbarkeit der Organellbewegungen zwischen verschiedenen Mutanten und Aufnahmeframes.

3. Maurice Georgi - Detektion von Richtungsänderungen und Stochastische Modellierung

In den auf zwei Dimensionen projizierten Bewegungsdaten der Organellen lassen sich Bewegungen finden, die sich anscheinend entlang von Geraden bewegen und plötzlich ihre Richtung ändern. Wir wollen mithilfe einer zeitaufgelösten Hauptkomponentenanalyse den Zeitpunkt dieser Richtungswechsel detektieren. Diese schätzt die Bewegungsrichtung in zwei Fenstern der Größe h vor bzw. nach jedem Zeitpunkt und betrachtet den Prozess der Winkel zwischen diesen Richtungen. Der maximale Winkel dient als Teststatistik des Tests der Nullhypothese der Abwesenheit von Richtungswechseln. Seine Verteilung unter der Nullhypothese wird durch Simulation gewonnen. Dazu entwickeln wir stochastische Modelle, die die mit Messfehlern behaftete stückweise lineare Bewegung beschreiben.

4. Denis Spiegel - Detektion gradueller Änderungen

Wir untersuchen ein Verfahren zur Detektion von Changepoints, an denen sich der Erwartungswert einer Zeitreihe ändert [1]. Dabei wird ein Maß für die Schwankung des Erwartungswertes entwickelt und geschätzt durch die reskalierte Differenz der Mittelwerte. Einen Schätzer für einen Changepoint liefert der Zeitpunkt, an dem diese Differenz D eine vorher festgelegte Schwelle S überschreitet. Wir erläutern Eigenschaften des Verfahrens anhand von Simulationen und diskutieren seine Anwendbarkeit auf die empirischen Daten der Organellbewegungen.

[1] M. Vogt, H. Dette (2015) Detecting gradual changes in locally stationary processes. The Annals of Statistics 43(2): 713-40.

Thema 2: Statistische Analyse neuronaler Aktivität in Mikronetzwerken

In Kooperation mit Prof. Dr. Albrecht Stroh, Institut für mikroskopische Anatomie und Neurobiologie, Universitätsmedizin Mainz

5. Fabian Roth - Peak detection in time series

Ein Verfahren zur Detektion von Gipfeln in Zeitreihen wird vorgestellt [2]. Für jeden Zeitpunkt t schätzen wir mithilfe des normalen linearen Modells die Steigung in einem Ausschnitt vor und nach t und berechnen deren reskalierte Differenz. Peaks sollen durch ihre charakteristische Zu- und Abnahme der Steigung zu großen Differenzen führen und so detektiert werden. Zum Test der Nullhypothese der Abwesenheit von Peaks wird als Teststatistik das Maximum dieser Differenzen betrachtet. Unter der Modellannahme unabhängig identisch verteilter Messfehler kann durch Permutation ein Schwellenwert zur Ablehnung der Nullhypothese gewonnen werden. Auch die Kombination verschiedener Ausschnittsgrößen ist möglich, um verschieden große Gipfel besser detektieren zu können. Wir stellen Theorie und Verfahren vor, diskutieren Eigenschaften, Vor- und Nachteile und demonstrieren diese sowohl an idealisierten, simulierten Daten, als auch an echten Messwerten von Neuronenaktivitäten von Mäusen in unterschiedlichen Sedierungszuständen.

[2] M. Messer, H. Backhaus, T. Fu, A. Stroh, G. Schneider (eingereicht) A multi scale approach for testing and detecting peaks in time series

6. Lukas Deppe und Torsten Walther - Segmented linear Regression

Existieren in einer Zeitreihe Phasen konstant niedriger neuronaler Aktivität, und unterscheidet sich ihre Länge zwischen verschiedenen experimentellen Bedingungen? Zur Beantwortung dieser Fragen unterteilen wir die Zeitreihe zunächst in sinnvolle Abschnitte und wenden dann auf diese Abschnitte eine stückweise lineare Regression an. Mit ihrer Hilfe lassen sich stückweise lineare Trends identifizieren und beschreiben. Die Zeitpunkte einer Änderung des Trends werden aus dem Modell mit den kleinsten Residuenquadraten geschätzt. Zum Vergleich verschiedener Modelle diskutieren wir varianzanalytische Verfahren und Likelihood-Quotienten-Tests [3,4]. Die Längen der Phasen konstant niedriger Aktivität verschiedener experimenteller Bedingungen werden mit einem Wilcoxon-Rangsummen-Test verglichen.

[3] P. I. Feder (1975) The Log Likelihood Ratio in Segmented Regression. The Annals of Statistics 3(1): 84-97.
[4] S. S. Wilks (1938) The Large-Sample Distribution of the Likelihood Ratio for Testing Composite Hypotheses. The Annals of Mathematical Statistics 9(1): 60-62.

Semesterprogramm

Ca. 60-minütige Vorträge mit Diskussion

1. Datenlage und Hypothesenentwicklung

18. April Marina Sturm, Alexander Wiegel

2. Hauptkomponentenanalyse und niederdimensionale Projektion

25. April Sonja Drescher, Adrian Schmidt

3. Detektion von Richtungsänderungen und Stochastische Modellierung

2. Mai Maurice Georgi

4. Detektion gradueller Änderungen

9. Mai Denis Spiegel

5. Peak detection

16. Mai Ngoc-Anh Dao, Fabian Roth

6. Segmented regression

23. Mai Lukas Deppe, Torsten Walther

Weitere Analysen und Zusammenfassung der Hauptergebnisse

6.-27. Juni Kurzpräsentationen 20-30 Min

Abschlusspräsentation

11. Juli verpflichtend bei Anfertigung einer Bachelor- / Masterarbeit in Statistik

Allgemeine Informationen

Das Statistische Praktikum richtet sich an Studierende der Mathematik mit Statistikkenntnissen (Voraussetzung: bestandene Klausur Statistik 1). In enger Kooperation mit Anwendern werden statistische Denkweisen und Methoden anhand von Daten und Fragestellungen erprobt, die aus der Praxis kommen. Das Statistische Praktikum ist ähnlich konzipiert wie ein Seminar. Themenvergabe erfolgt nach bestandener Klausur, die Bearbeitung der Themen umfasst

- die theoretische Auseinandersetzung mit einem statistischen Verfahren,
- die Anwendung des Verfahrens auf einen Datensatz,
- die intensive Auseinandersetzung mit einem komplexen Datensatz (hoher Programmieraufwand, R)
- die Präsentation von statistischer Methode und Analyseergebnissen (Folien),
- die aktive Mitarbeit im Seminar sowie ggf. Neuanalyse von Datensätzen nach Diskussion im Seminar,
- die Zusammenfassung der eigenen Hauptergebnisse in einem Kurztext (2-3 Sätze) und einer Figur.

Zum Abschluss werden die Ergebnisse in einer Abschlusspräsentation vorgestellt (10 Minuten pro Thema, Methoden und Hauptergebnisse laienverständlich zusammengefasst). Diese Abschlusspräsentation zum Statistischen Praktikum kann als separate Veranstaltung mit 2 CPs z.B. in die Module BaM-SK oder MaM-PR-2 eingebracht werden.

Hauptseite Statistisches Praktikum