Statistisches Praktikum im SS 2020

Statistische Analyse der Fütteraktivität von Bienen

Prof. Dr. Gaby Schneider, unter Mitarbeit von Solveig Plomer und Marina Sturm

In Kooperation mit Dr. Paul Siefert und Prof. Dr. Bernd Grünewald, Institut für Bienenkunde, Goethe-Universität Frankfurt

    

Seminar im SS 2020. Do. 8:30 Uhr, SR 903, RM 10

Vorbesprechung: Mi, 5. Februar 2020, 13:30 Uhr, Raum 711 (groß).
Die Teilnahme an der Vorbesprechung ist Voraussetzung für die Teilnahme am Statistischen Praktikum!
Abschlusspräsentation: 9. Juli 2020     

1. Nikolai Krimphove und Luis Malter - Datenüberblick und Analyse von Gesamtstatistiken

Bienen zählen zu den wichtigsten Bestäubern und sind daher von hoher ökologischer Bedeutung. In diesem Vortrag wird ein Datensatz einer aktuellen Studie von Paul Siefert und Kollegen [1] analysiert, in der der Einfluss von Neonikotinoiden auf das Brutpflegeverhalten und die Entwicklung von Bienen untersucht wurde.
    Dazu betrachten wir im ersten Vortrag die drei Variablen Entwicklungsdauer, Fütterdauer und Anzahl der Fütterbesuche, die für jede beobachtete Zelle individuell gewonnen wurden. Diese wurden in ein- und mehrfaktoriellen Varianzanalysen und einer Kovarianzanalyse [2] zwischen verschiedenen Neonikotinoiden und ihren Konzentrationen sowie Replikationen des Versuchs verglichen. Hierbei zeigten sich unter anderem signifikante Änderungen der Entwicklungsdauer der Larven (siehe Figur).
[1] Siefert, P., Hota, R., Ramesh, V., Grünewald, B. (2020) Chronic within-hive video recordings detect altered nursing behaviour and retarded larval development of neonicotinoid treated honey bees. Sci. Rep. 10, 8727
[2] Pruscha, H. (1996) Angewandte Methoden der Mathematischen Statistik, B.G. Teubner, Stuttgart

2. Marius Beer - Strukturbrüche in der Fütterdauer: Segmentierte Regression

Beim Heranwachsen von Bienenlarven beobachten wir eine etwa segmentierte lineare Beziehung, in der die Dauer einzelner Fütterereignisse in Abhängigkeit vom Zeitpunkt der Fütterung zunächst zu- und dann wieder abnimmt. In diesem Vortrag wird untersucht, wie sich dieser Verlauf unter Einfluss von Neonikotinoiden verschiedener Konzentration verändert, insbesondere in Hinblick auf den Zeitpunkt des Knotenpunktes, d.h. den Zeitpunkt der maximalen mittleren Fütterdauer.

  Zur Schätzung dieses Knotenpunktes verwenden wir einerseits einen simplen Ansatz der Minimierung der Residuenquadratsumme (RQS) und untersuchen andererseits das speziell dafür entwickelte R-package segmented. Schließlich wurden die Parameterschätzer in den verschiedenen experimentellen Gruppen mittels Varianzanalyse verglichen. Hierbei zeigten sich Unterschiede im geschätzten Zeitpunkt des Knotenpunktes insbesondere zwischen verschiedenen Versuchsreplikationen.
[3] V. Muggeo (2003) Estimating regression models with unknown break-points. Statist. Med. 22:3055-3071
[4] V. Muggeo (2008) Segmented: An R Package to Fit Regression Models With Broken-Line Relationships. R News. 8. 20-25.

3. Anne Kaiser und Anna-Lena Weinel - Modellierung der Fütterzeiten mit inhomogenen Erneuerungsprozessen

Lassen sich die Fütterzeitpunkte von Bienenlarven durch zeitinhomogene Erneuerungsprozesse beschreiben? Wir untersuchen und bewerten dazu zunächst den Poisson- und Gammaprozess mit homogener zeitunabhängiger Rate. Mittels Intensity Rescaling leiten wir daraus besser zu den Daten passende Modelle mit inhomogener Rate her. Die inhomogene exponentielle Rate, bei der die Anzahl an Fütterungen von der Zeit abhängt, wird dabei aus den Daten geschätzt.

     Mit fortschreitender Larvenentwicklung wird zunehmend häufiger gefüttert, und entsprechend steigt die Intensität mit der Zeit immer stärker an. Dabei steigt die Fütterrate der Gruppe mit hoher Schadstoffkonzentration zu Beginn langsamer und zum Ende hin stärker an als in der Kontrollgruppe. Zur Modellbewertung ziehen wir Simulationen und das Time Rescaling Theorem heran.

[5]: R. Barbieri, M. C. Quirk, L. M. Frank, M. A. Wilson, E. N. Brown (2001) Construction and analysis of non-Poisson stimulus-response models of neural spiking activity. Journal of Neuroscience Methods 105, 25-37
[6]: E.N. Brown, R. Barbieri, V. Ventura, R.E. Kass, L.M. Frank (2001) The Time-Rescaling Theorem and Its Application to Neural Spike Train Data Analysis. Neural Computation 14, 325-346

4. Marie Kuhn - Fütterexplosion? Modellierung der Fütterzeiten mit Hawkes Prozessen

Hawkes Prozesse (HP, [7]) sind selbsterregende Punktprozesse, bei denen jeder Event die Wahrscheinlichkeit eines weiteren Events (Intensität des Prozesses) für eine bestimmte Zeit erhöht. Der Prozess ist dabei über seine Conditional Intensity Function definiert [8]. Im betrachteten Spezialfall steigt die Intensität mit jedem Event sprunghaft an und fällt danach exponentiell ab.

    Der Prozess der Fütterzeitpunkte der Bienen ähnelt explodierenden HPs, bei denen die Intensität durch neue Events tendenziell schneller steigt als sie wieder abfällt. Durch Simulationsstudien wurde die Güte der Maximum-Likelihood-Schätzung für HPs dieser Art untersucht. Ein spezielles Problem dabei ist die hohe Variabilität der Hawkes Prozesse, insbesondere der Zeitpunkte der Explosion. Dagegen weisen die beobachteten Fütterprozesse nur geringe Variabilität auf. Wir verzichten hier auf statistische Interpretationen der Parameterschätzer und ihrer Gruppenunterschiede.

  
[7] Laub, Taimre, Pollett (2015) Hawkes Processes, arXiv:1507.02822
[8] Rasmussen (2018) Lecture Notes: Temporal Point Processes and the Conditional Intensity Function, arXiv:1806.00221

5. An Hoang und Fabian Schneider - Welche Variablen trennen die Gruppen am besten? Diskriminanzanalyse und MANOVA

Ändert sich das Fütterverhalten von Bienen, wenn sie mit unterschiedlichen Konzentrationen von Pestiziden in Kontakt kommen? Um dies zu untersuchen, möchten wir hier simultan multiple abhängige Variablen betrachten, etwa die Anzahl der Fütterbesuche pro Zelle, die Fütterdauer oder die Entwicklungsdauer einer Larve.
       Zur Untersuchung dieser Frage verwenden wir eine multivariate Varianzanalyse (MANOVA, [9]). Falls Unterschiede auftreten, möchten wir identifizieren, welche Komponenten des korrelierten Variablensatzes am meisten zur Gruppentrennung beitragen. Zu diesem Zweck verwenden wir eine Diskriminanzanalyse [10]. Auf Grundlage dieser lassen sich die einzelnen Komponenten des Variablensatzes auf ihre Trennkraft hin beurteilen, und man erhält diejenigen Variablen mit dem größten Anteil an der Gruppentrennung. Im vorliegenden Datensatz waren dies vor allem Variablen, die mit der Anzahl und Verteilung der Besuche einer Larvenzelle zusammenhingen, wie etwa die relative Zeit bis 75% Prozent der Besuche stattgefunden hatten.   
[9] K.V. Mardia, J.T. Kent and J.M. Bibby (1979) Multivariate Analysis. New York: Academic Press. [10] K. Backhaus, B. Erichson, W. Plinke, C. Schuchard-Ficher and R. Weiber (1993) Multivariate Analysemethoden. Springer

6. Edgar Schmidt und Jeremias van der Wardt - Modellierung von Wachstumskurven

In Kooperation mit Christoph Schür und Prof. Dr. Jörg Oehlmann, Institut für aquatische Ökotoxikologie, Goethe-Universität Frankfurt

Wir modellieren Wachstumsdaten von Wasserflöhen (Daphnia magna), welche mit verschiedenen Konzentrationen an Mikroplastik behandelt wurden [11]. Dazu vergleichen wir zunächst verschiedene Modelle für Wachstumskurven, wie etwa die logistische, die Gompertz oder die von Bertalanffy Kurve [12].

         Diese enthalten Parameter für die Geschwindigkeit des Wachstums, das asymptotische Wachstumsverhalten und eine horizontale Verschiebung der Kurve. Unterschiede zwischen den Modellen sind gering, daher verwenden wir hier die Gompertzkurve als Standardmodell. Die Wachstumskurven werden mittels Non-Linear least squares angepasst. Durch Bootstrapping haben wir Konfidenzintervalle generiert, um so die Parameter zwischen den Gruppen zu vergleichen. Unterschiede zeigten sich bei der Asymptote der Kurve sowie in einem Parameter, der die Kurve horizontal verschiebt. In beiden war mit steigender Mikroplastikkonzentration ein Abwärtstrend zu beobachten.

 
[11] Christoph Schür, Sebastian Zipp, Tobias Thalau, Martin Wagner (2020): Microplastics but not natural particles induce multigenerational effects in Daphnia magna, Environmental Pollution, Volume 260, 113904
[12] Kathleen M.C. Tjorve, Even Tjorve (2017): The use of Gompertz models in growth analyses, and new Gompertz-model approach: An addition to the Unified-Richards family, PLoS ONE 12(6): e0178691


Semesterprogramm

Ca. 60-minütige Vorträge mit Diskussion

1. Datenlage, zweifaktorielle ANOVA und ANCOVA

23. April      Nikolai Krimphove und Luis Malter

2. Segmentierte Regression

30. April      Marius Beer

3. Inhomogene Erneuerungsprozesse und Time Rescaling

7. Mai      Anne Kaiser und Anna-Lena Weinel

4. Hawkes Prozesse

14. Mai      Marie Kuhn

5. Modellierung von Wachstumskurven

28. Mai      Edgar Schmidt und Jeremias van der Wardt

6. Diskriminanzanalyse und MANOVA

4. Juni      An Hoang und Fabian Schneider

Weitere Analysen und Zusammenfassung der Hauptergebnisse

18.6.-2.7.      Kurzpräsentationen 20-30 Min

Abschlusspräsentation

9. Juli 2020

Allgemeine Informationen

Das Statistische Praktikum richtet sich an Studierende der Mathematik mit Statistikkenntnissen (Voraussetzung: bestandene Klausur Statistik 1). In enger Kooperation mit Anwendern werden statistische Denkweisen und Methoden anhand von Daten und Fragestellungen erprobt, die aus der Praxis kommen. Das Statistische Praktikum ist ähnlich konzipiert wie ein Seminar. Themenvergabe erfolgt nach bestandener Klausur, die Bearbeitung der Themen umfasst

- die theoretische Auseinandersetzung mit einem statistischen Verfahren,
- die Anwendung des Verfahrens auf einen Datensatz,
- die intensive Auseinandersetzung mit einem komplexen Datensatz (hoher Programmieraufwand, R)
- die Präsentation von statistischer Methode und Analyseergebnissen (Folien),
- die aktive Mitarbeit im Seminar sowie ggf. Neuanalyse von Datensätzen nach Diskussion im Seminar,
- die Zusammenfassung der eigenen Hauptergebnisse in einem Kurztext (2-3 Sätze) und einer Figur.

Zum Abschluss werden die Ergebnisse in einer Abschlusspräsentation vorgestellt (10 Minuten pro Thema, Methoden und Hauptergebnisse laienverständlich zusammengefasst). Diese Abschlusspräsentation zum Statistischen Praktikum kann als separate Veranstaltung mit 2 CPs z.B. in die Module BaM-SK oder MaM-PR-2 eingebracht werden.




Hauptseite Statistisches Praktikum




Impressum      Datenschutzerklärung