1  Organisation

Letzte Änderung am 26. March 2024 um 08:52:50

“Denn sie wissen nicht, was sie getan haben werden!” — Futurama, Staffel 6, Folge 17

Den Teil kannst du hier überspringen, wenn es dich nicht so richtig interessiert, was ich alles an Vorlesungen an der Hochschule Osnabrück anbiete. Wenn es dir um statistische Inhalte geht, dann gehe einfach weiter in die nächsten Kapitel. In diesem Kapitel geht es nochmal Orientierung über meine Vorlesungen und Module zu geben. Alle meine Module sind für jeden offen, wenn du willst kannst du jedes Modul besuchen. Bitte informiere dich in deinem Studierendensekretariat über die Modalitäten zur Prüfungsteilnahme.

1.1 Statistische Beratung

Abbildung 1.1— “Dad, is this completely safe?” “Research in 500 theme parks in 2010 showed that 1 in 10’000 of carriages were found to be malfunctioning, which can lead to 1 out 50’000 kids falling out… So your chances are okay, but there’s always a risk, honey…” Quelle: wumo.com

Neben der klassischen Vorlesung biete ich auch Termine für die statistische Beratung von Abschlussarbeiten sowie Projekten an. Dieses Angebot gibt es für alle Mitglieder der Hochschule Osnabrück und teilweise für die Universität Osnabrück. Ich berate dabei primär für Fakultät Agrarwissenschaften und Landschaftsarchitektur (AuL), aber natürlich auch für alle anderen Fakultäten. Dafür musst du mir einfach eine E-Mail schreiben und dann schicke ich dir Terminvorschläge für ein Online-Meeting innerhalb der nächsten zwei Wochen.

Die Beratung ist grundsätzlich anonym und vertraulich. Wenn du willst kannst du gerne noch dein:e Betreuer:in mitbringen. Das ist aber keine Voraussetzung oder Notwendigkeit. Meistens finden mehrere Besprechungen statt, wir versuchen aber natürlich zusammen zügig dein Problem zu lösen. Ziel ist der Beratung ist es dich in die Lage zu versetzen selbstständig deine Analyse zu rechnen.

1.2 Bachelorarbeit in der Bio Data Science?

Hier findest du keine Themen. Dafür musst du mich bitte ansprechen oder eine E-Mail schreiben. Die Themen finden sich dann etwa mit Kooperationspartern oder aber eher methodisch ohne echte Daten. Das müssen wir dann aber Absprechen. Bitte bachte dann dafür die Informationen in dem Kapitel zu der Abschlussarbeit.

1.3 Master in der Bio Data Science?

Disclaimer: Ich bin nicht in dem M.Sc. Studiengang “Umwelt- und Systemwissenschaften” an der Universität Osnabrück involviert.

Gibt es eigentlich einen Master in der Bio Data Science in Osnabrück? Nein. Aber es gibt die Möglichkeit einen ähnlichen Master mit Schwerpunkten in der Bio Data Science, zum Beispiel das Modellieren von Daten, zu studieren. Das wäre dann der Master Umwelt- und Systemwissenschaften der Uni Osnabrück. Bitte beachte in diesem Zusammenhang die aktuellen Informationen für Studierende der Systemwissenschaften. Der Master befasst sich mit der Modellierung von Ökosystemen/Ressourcen und nimmt auch nach jetzigem Stand (SoSe 2023) unkompliziert Studierende mit Abschluss aus dem Bachelorstudiengang Pflanzenbiologie mit der Vertiefung Pflanzentechnologie auf. Das ist eventuell jetzt deine Lösung für Osnabrück! Wenn du woanders hin willst, dann gibt es zig Studiengänge. Da musst du dann aber selber googlen was dich interessiert.

1.4 Vorlesungen an der Hochschule Osnabrück

Von mir angebotene Vorlesungen werden an der Hochschule Osnabrück an der Fakultät Agrarwissenschaften und Landschaftsarchitektur (AuL) in ILIAS verwaltet. Alle notwendigen Informationen und Materialien sind auf ILIAS unter https://lms.hs-osnabrueck.de/ zu finden. Wenn du in einem Modul nicht angemeldet bist, dann kontaktiere bitte das Studierendensekretariat. Auch die Kommunikation über Inhalte und Termine sowie Terminausfälle erfolgt von meiner Seite aus über ILIAS.

Auf ILIAS findest du alle aktuellen Kursinformationen und erhälst auch die Mails, wenn Änderungen im Kursablauf stattfinden.

Wenn du nicht in der Fakultät Agrarwissenschaften und Landschaftsarchitektur (AuL) studierst oder aber in einem Studiengang, der meine Module nicht anbietet, steht es dir natürlich frei, sich in meine Vorlesungen zu setzten. Du findest im Folgenden eine Übersicht der angebotenen Module und auch die inhaltliche Ordnung nach Lernstufe. Bitte informiere dich in deinem Studierendensekretariat über die Modalitäten zur Prüfungsteilnahme.

1.5 Modulbeschreibung meiner Vorlesungen

In der folgenden Tabelle findest du eine Übersicht der aktuell von mir angebotenen Module nach Semester sortiert. Bitte beachte, dass du nicht einfach ein Modul belegen kannst. Von meiner Seite ist es eher weniger das Problem, aber es muss ja auch in deinen Studiengang passen und anerkannt werden. Andersherum kannst du gerne auch meine Veranstaltungen aus anderen Studiengängen besuchen. Frag mich einfach, dann finden wir eine Lösung.

Tabelle 1.1— Angebotene Module der Bio Data Science an der Fakultät Agrarwissenschaften und Landschaftsarchitektur (AuL). Teilweise werden gleiche Module in verschiedenen Studiengängen unterrichtet. Die Semesterlage entspricht der Lage des Pflichtmoduls. Wahlpflichtmodule liegen in dem ersten möglichen Semester der Belegung. Abweichungen sind wie immer individuell möglich.
Semester Angewandte Pflanzenbiologie – Gartenbau, Pflanzentechnologie Landwirtschaft Wirtschafts- ingenieurwesen Agrar / Lebensmittel Bioverfahrenstechnik in Agrar- und Lebensmittelwirtschaft Angewandte Nutztier- und Pflanzenwissenschaften
1. Mathematik und Statistik Mathematik und Statistik Statistik
2. Angewandte Statistik und Versuchswesen Angewandte Statistik für Bioverfahrenstechnik (läuft aus) Biostatistik
3.
4. Modellierung landwirtschaftlicher Daten Statistische Bioinformatik
5. Spezielle Statistik und Versuchswesen

Im Folgenden finden sich hier die work in progress Modulbeschreibungen. Diese werden teilweise von den offiziellen Modulbeschreibungen abweichen. Es handelt sich hierbei um Entwürfe von Modulbeschreibungen deren langfristiges Ziel es ist in den offiziellen Modulbeschreibungen aufzugehen. Dabei werden sicherlich nicht alle Inhalte hier übernommen. Besonders die Prüfungsformen sind Änderungen unterworfen.

Modellierung landwirtschaftlicher Daten

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

Die Modellierung von komplexen Daten spielt eine zentrale Rolle in verschiedenen wissenschaftlichen Disziplinen der Agrarwissenschaften. Dabei ermöglicht die Modellierung nicht nur den Gewinn von neuen Erkenntnissen über biologische Prozesse, sondern auch die Vorhersage zukünftiger Ereignisse weit über die gängigen Gruppenvergleiche aus Feldexperimenten hinaus. Oftmals sind biologische Abhängigkeiten nicht linear, sondern folgen nicht-linearen Trends. Die Modellierung solcher nicht-linearen Abhängigkeiten erfordert spezielle Kompetenzen in der statistischen Analyse, insbesondere von Zeitreihen (eng. “time series”), räumlichen Daten (eng. “spatial data”) oder genetischen Daten und Sequenzen. In dem Modul “Modellierung landwirtschaftlicher Daten” werden die gängigen statistische Verfahren zur Auswertung dieser und weiterer Datenquellen vorgestellt und diskutiert. Im Weiteren spielt die Vorhersage von Ereignissen eine entscheidende Rolle in den Agrarwissenschaften, sei es für die Früherkennung von Risiken oder die Steuerung landwirtschaftlicher Prozesse. Im Modul werden die Grundlagen des maschinellen Lernens präsentiert und anhand von Fallbeispielen erläutert. Das Modul “Modellierung landwirtschaftlicher Daten” vermittelt den Studierenden fortgeschrittene Kenntnisse und Fähigkeiten im Bereich der Datenmodellierung und -analyse im Kontext der landwirtschaftlichen Anwendung. Der Fokus liegt in dem Modul auf der Darstellung, Verarbeitung und statistischer Modellierung komplexer landwirtschaftlicher Daten. Fallstudien aus verschiedenen Bereichen der Agrarwissenschaften werden verwendet, um die erworbenen theoretischen Kenntnisse in die Praxis umzusetzen. In der Anwendung wird R/Bioconductor für die Datenanalyse genutzt. Das Modul “Modellierung landwirtschaftlicher Daten” erweitert die bisherigen Kenntnisse der Studierenden in der Auswertung agrarwissenschaftlicher Daten und bereitet auf anspruchsvolle Aufgaben in diesem Bereich vor.

Lehr-Lerninhalte

  • Einführung in die statistische Modellierung sowie deren Interpretation am Beispiel der multiplen linearen Regression.
  • Besonderheiten der statistischen Modellierung von Zeitreihen und räumlichen Daten.
  • Die explorative Datenanalyse und deren statistischen Maßzahlen sowie die Visualisierung von räumlichen und zeitlichen Daten.
  • Multivariate statistische Analysen zur Erkennung von Gruppenzugehörigkeiten anhand von Clusteranalysen.
  • Einführung in die klassischen experimentellen Designs in den Agrarwissenschaften.
  • Grundlagen der Analyse von genetischen Daten anhand ausgewählter, beispielhafter Omics-Ebenen.
  • Genetische Distanzen und polygenetische Bäume zur Darstellung evolutionärer Beziehungen.
  • Grundlagen des maschinellen Lernens und der Klassifikation von Ereignissen sowie Maßzahlen der Bewertung eines maschinellen Lernalgorithmus.
  • Anwendung der grundlegenden maschinellen Lernverfahren beispielhaft durch k-NN, Random Forest und Neuronale Netze.
  • Modellierungen an aktuellen Fallbeispielen aus der Anwendung.
  • Automatisierte Erstellung von Berichten in R Quatro.
  • Einführung in die Erstellung von interaktiven R Shiny Apps.

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung
  • Die Studierenden kennen die gängigen experimentellen Designs in den Agrarwissenschaften.
  • Die Studierenden kennen die entsprechenden Repräsentationen der experimentellen Designs als Datensatz.
  • Die Studierenden kennen die gängigen Datenformate für räumliche und zeitliche Daten.
  • Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen in der Genetik zu erkennen und zu benennen.
  • Die Studierenden können die gängigen, vorgestellten statistischen Modellierungen benennen und unterscheiden.
  • Die Studierenden kennen die gängigen Funktionen für die Modellierungen und Datenaufbereitung in R.
Wissensvertiefung
  • Die Studierenden können explorative Abbildungen erstellen und interpretieren.
  • Die Studierenden können räumliche und zeitliche Daten visualisieren und interpretieren.
  • Die Studierenden können das Ergebnis eines statistischen Modells im Kontext einer wissenschaftlichen Fragestellung interpretieren.
  • Die Studierenden sind in der Lage anhand eines statistischen Modells eine Entscheidung zu treffen.
  • Die Studierenden sind in der Lage Modellierungen mit den notwendigen Funktionen und Paketen in R durchzuführen.
  • Die Studierenden können einen automatischen Bericht in R Quatro erstellen.
Wissensverständnis
  • Die Studierenden können ein statistisches Modell mit einer explorativen Datenanalyse oder Visualisierung in einen Kontext bringen.
  • Die Studierenden können verschiedene statistisches Modelle anhand verschiedener Maßzahlen miteinander vergleichen und eine informierte Modellauswahl treffen.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden sind in der Lage einfache Kosten- und Nutzenabschätzungen anhand von statistischen Modellen durchzuführen. Diese einfachen Abschätzungen umfassen die Planung von technischen und biologischen Prozessen in der Landwirtschaft. Sie können Modelle für landwirtschaftliche Prozesse unter Verwendung von räumlichen Daten entwickeln und validieren. Die Studierenden können dabei externe Literaturquellen und deren statistischen Maßzahlen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen treffen.

Wissenschaftliche Innovation

Die Studierende können statistische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen. Die Studierenden können explorative Abbildungen aus Veröffentlichungen verstehen und erste informierte Forschungsideen entwickeln.

Kommunikation und Kooperation

Die Studierenden sind in der Lage die Ergebnisse der Datenanalyse klar und verständlich zu kommunizieren, sowohl schriftlich als auch mündlich. Ebenfalls sind die Studierenden in der Lage gängige statistische Maßzahlen zu erkennen und zu berichten. Die Studierenden können R Code lesen, erstellen und demonstrieren. Die Studierenden sind in der Lage mit einer automatisierten Berichterstattung in R Quatro oder R Shiny eine Datenanalyse zu kommunizieren.

Wissenschaftliches Selbstverständnis / Professionalität

Die Studierenden können wissenschaftliche Publikationen und deren Modellierungen räumlicher und zeitlicher Fragestellungen in den Kontext des eigenen Berufsfeldes setzen. Unter der Hilfe der Modellierung sind die Studierenden in der Lage informierte Entscheidungen treffen. Die Studierende sind sich der inhärenten Unsicherheit statistischer Modellierungen bewusst und können die eigenen Forschungsergebnisse kritisch hinterfragen. Den Studierenden sind die algorithmischen Grenzen von Modellen bewusst.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Das Skript zur Genetik und Bioinformatik unter https://jkruppa.github.io/bioinformatic/

Voraussetzungen für die Teilnahme

Keine.

Empfohlene Vorkenntnisse

Für dieses Modul sind Kenntnisse der deskriptiven Statistik sowie Grundkenntnisse der Statistik hilfreich, aber nicht notwendig, wie sie unter anderem in den Modulen “Mathematik und Statistik (44B0266)” oder “Angewandte Statistik und Versuchswesen (44B0400)” vermittelt werden.

Studierenden, die ihre Kenntnisse und Fertigkeiten vor Beginn des Moduls auffrischen oder erweitern möchten, wird folgende Grundlagenliteratur mit dem “Skript Bio Data Science” unter https://jkruppa.github.io/ empfohlen.

In dem Modul wird mit der Software R gearbeitet. Um sich im Vorfeld mit den Basisfunktionen vertraut zu machen, eignen sich beispielsweise die folgenden Video-Tutorials unter https://www.youtube.com/c/JochenKruppa.

Zusammenhang mit anderen Modulen

Das Modul “Modellierung landwirtschaftlicher Daten” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Hausarbeit und Präsentation

Statistische Bioinformatik

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

Die statistische Bioinformatik spielt eine bedeutende Rolle in verschiedenen wissenschaftlichen Bereichen der Omics-Forschung. Sie wird nicht nur klassisch genutzt, um genetische Marker für Krankheiten oder genetische Veranlagungen in der Humangenetik zu identifizieren, sondern auch zur Entschlüsselung der genetischen Vererbung bei der Züchtung von Tieren und Pflanzen. Die algorithmische Auswertung von genetischen Daten ist sowohl biologisch umfassend als auch methodisch anspruchsvoll. Das Modul “Statistische Bioinformatik” folgt dem zentralen Dogma der Molekularbiologie, das besagt, dass Informationen von Genen zu Proteinen übertragen werden. Es beinhaltet die statistische Analyse von genetischen Markern auf DNA-Ebene sowie die Untersuchung der Genexpression über mRNA und die daraus resultierende Proteinexpression bis hin zur Phänomik. Auch regulatorische Elemente der DNA-Expression, wie die Methylierung, werden im Modul berücksichtigt. Das Modul “Statistische Bioinformatik” bietet zuerst eine Einführung in die klassische mendelsche Genetik sowie Grundlagen in der quantitativen Genetik. Den Großteil den Inhalts machen aktuelle algorithmische Verfahren zu Assoziationsstudien und Sequenzanalysen aus. Studierende erlernen somit die grundlegenden Fähigkeiten für zukünftige wissenschaftliche und angewandte Arbeiten im Bereich der Omics-Forschung. Der Schwerpunkt des Moduls liegt auf der Darstellung, Verarbeitung und statistischen Auswertung von hochdimensionalen genetischen Daten. Fallstudien aus den Bereichen der Agrarwissenschaften und Humanbiologie dienen als praktische Anwendungen. Gleichzeitig werden die erworbenen theoretischen Kenntnisse durch die Auswertung von Daten in R/Bioconductor in die Praxis umgesetzt. Das Modul “Statistische Bioinformatik” legt somit den Grundstein für die methodische Auswertung von Omics-Daten.

Lehr-Lerninhalte

  • Grundlagen der klassischen, mendelschen Vererbung beinhaltend das Hardy-Weinberg-Gleichgewicht
  • Grundlagen der Quantitativen Genetik mit Kopplungskarten und Linkage disequilibrium
  • Genetische Distanz und polygenetische Bäume zur Darstellung evolutionärer Beziehungen
  • Markergestützte Selektion und indirekte Selektion
  • Statistische Herausforderungen von hochdimensionalen Daten
  • Data Preprocessing und Qualitätskontrolle auf der Ebene der Marker und Individuen
  • Gängige Assoziationstests unter anderem Chi-Quadrat-Test und logistische Regression
  • Auswertung von Genomeweite Assoziationsstudien, Microarraydaten, High throughput genotyping, Next generation sequencing, Whole genome sequencing und RNA-seq an Fallbeispielen
  • Visualisierungen der Ergebnisse durch Manhattanplot, Vucanoplot und Regional Association Plot und weiteren.
  • Grundlagen Multiomics und Pathway Analysen sowie deren Datenbanken
  • Grundlegende Methoden zum Sequenzaligment
  • Anwendung der Algorithmen an ausgewählten Fallbeispielen in R/Bioconductor

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung
  • Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen zu den jeweiligen Omics-Verfahren zu erkennen und zu benennen.
  • Die Studierenden können das zentrale Dogma der Molekularbiologie erklären und visualisieren.
  • Die Studierenden sind in der Lage den Unterschied zwischen der quantitativen und qualitativen Genetik zu erklären.
  • Die Studierenden können Omics-Abbildungen erkennen und benennen.
  • Die Studierenden können externe Programme aus R heraus starten und Ergebnisse einlesen.
Wissensvertiefung
  • Die Studierenden können explorative Abbildungen in ausgewählten Omics-Analysen erstellen und interpretieren.
  • Die Studierenden sind in der Lage anhand einer Omics-Analyse eine Entscheidung zu treffen.
  • Die Studierenden können das Ergebnis einer Omics-Analyse im Kontext der wissenschaftlichen Fragestellung interpretieren.
  • Die Studierenden sind in der Lage aus englischen Tutorien eine Lösung für ein Omics-Verfahren einzugrenzen.
  • Die Studierenden können einfache Auswahl- und Filterregeln auf Datensätze in R anwenden.
  • Die Studierenden können erste einfache R Code Blöcke miteinander in einen Kontext setzen.
Wissensverständnis
  • Die Studierenden können verschiedene Ebenen der Omics-Analysen in einen wissenschaftlichen Kontext bringen und miteinander vergleichen.
  • Die Studierenden sind in der Lage eine genetische Auswertung mit den notwendigen Funktionen und Paketen in R zu skizzieren und zu erklären.
  • Die Studierenden können die einzelnen Schritte einer genetischen Analyse benennen und bei der Planung eines eigenen Experiments berücksichtigen. Sie identifizieren dabei die Probleme der jeweiligen biologischen Proben.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden sind in der Lage einfache Kosten- und Nutzenabschätzungen anhand von genetischen Analysen durchzuführen. Diese einfachen Abschätzungen umfassen die Planung von marktwirtschaftlichen, technischen und biologischen Prozesses in der Agrarwirtschaft und den Lebenswissenschaften. Sie können dabei die verschiedenen Ebenen der Omics-Foschung in den Kontext der Anwendung und der Phänomik setzen. Die Studierenden können dabei externe Literaturquellen und deren genetischen Analysen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen für die eigenen Analysen treffen.

Wissenschaftliche Innovation

Die Studierende können genetische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen in der Genetik. Die Studierenden können genetische Visualisierungen aus Veröffentlichungen verstehen und erste informierte Forschungsideen entwickeln. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen.

Kommunikation und Kooperation

Die Studierenden sind in der Lage genetische Daten und Analysen mit anderen Forschenden zu teilen. Sie können die einzelnen Schritte der Analyse erklären und die Ergebnisse allgemein verständlich erklären. Ebenfalls sind die Studierenden in der Lage gängige genetische Maßzahlen zu erkennen und zu berichten. Die Studierenden können R Code lesen, erstellen und demonstrieren.

Wissenschaftliches Selbstverständnis / Professionalität

Die Studierenden können wissenschaftliche Publikationen und deren genetischen Maßzahlen sowie Ergebnisse in den Kontext des eigenen Berufsfeldes setzen und somit informierte Entscheidungen treffen. Diese informierten Entscheiden betreffen sowohl die praktische Anwendung wie auch die Bewertung von Forschungsideen in der wissenschaftlichen Grundlagenforschung. Die Studierende sind sich der inhärenten Unsicherheit der wissenschaftlichen, genetischen Forschung bewusst und können die eigenen Forschungsergebnisse diesbezüglich kritisch hinterfragen.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Das Skript zum Bioinformatikteil unter https://jkruppa.github.io/bioinformatic/
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc., 2016. https://r4ds.had.co.nz

Voraussetzungen für die Teilnahme

Keine.

Empfohlene Vorkenntnisse

Für dieses Modul sind Kenntnisse der deskriptiven Statistik sowie Grundkenntnisse der Statistik hilfreich aber nicht notwendig, wie sie unter anderem in den Modulen “Mathematik und Statistik (44B0266)” oder “Angewandte Statistik und Versuchswesen (44B0400)” vermittelt werden.

Studierenden, die ihre Kenntnisse und Fertigkeiten vor Beginn des Moduls auffrischen oder erweitern möchten, wird folgende Grundlagenliteratur mit dem “Skript Bio Data Science” unter https://jkruppa.github.io/ empfohlen.

In dem Modul wird mit der Software R gearbeitet. Um sich im Vorfeld mit den Basisfunktionen vertraut zu machen, eignen sich beispielsweise die folgenden Video-Tutorials unter https://www.youtube.com/c/JochenKruppa.

Zusammenhang mit anderen Modulen

Das Modul “Statistische Bioinformatik” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Hausarbeit und Präsentation

Mathematik und Statistik

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

In den Pflanzenwissenschaften sowie in der Landwirtschaft werden vielen Prozesse und Phänomene durch mathematische und statistische Modelle beschrieben. In dem Modul “Mathematik und Statistik” lernen Studierende drei Schwerpunkte für das spätere wissenschaftliche und angewandte Arbeiten. Im ersten Teil des Moduls werden mathematische Grundkenntnisse wiederholt und im Verlauf des Moduls vertieft. Die mathematischen Formeln werden aus ihrer theoretischen, formalistischen Anwendung herausgelöst und in praktische Herausforderungen übertragen. Dabei werden Bereiche der Physik, Chemie sowie Biologie in den Kontext der Mathematik gesetzt. Im zweiten Teil des Moduls werden statistische Grundkenntnisse vermitteln. Der Fokus liegt hier auf der Darstellung, Erfahrung und ersten statistischen Auswertungen von Daten. Wissenschaftliche Forschung und Erkenntnisgewinn wird hierbei in den Kontext der Erhebung von Daten gesetzt. Die für Landwirtschaft und Gartenbau relevanten mathematischen und statistischen Verfahren werden dargestellt und diskutiert. Im dritten Teil des Moduls werden die erworbenen theoretischen, mathematischen und statistischen Kenntnisse durch die Einführung in die Programmierung in R für die Studierenden umsetzbar und erfahrbar gemacht. In dem Modul “Mathematik und Statistik” werden somit die ersten Grundkenntnisse für die praktische Anwendung der Bio Data Science erworben.

Lehr-Lerninhalte

Mathematischer Anteil

  • Maßzahlen, Flächen und Volumen beinhaltend Berechnungen mit Maßeinheiten von sehr kleinen sowie sehr großen Zahlen. Berechnungen mit Flächen- sowie Volumenmaßen einschließlich Winkel- und Streckenbestimmung.
  • Berechnungen mit Vektoren und Matrizen.
  • Mathematische Funktionen und Anwendung der Differential- und Integralrechnung einschließlich logarithmischer sowie exponentieller Funktionen. Lösung von quadratischer Gleichungen sowie Extremwertproblemen.
  • Wahrscheinlichkeiten mit Baumdiagramm und Pfadregeln sowie stochastische Prozesse. Wahrscheinlichkeitsverteilungen am Beispiel der Normalverteilung.
  • Logische Operatoren sowie Mengenlehre.

Statistischer Anteil

  • Einführung in die explorative Datenanalyse mit Fokus auf dem Boxplot und dem Barplot und deren statistischen Maßzahlen.
  • Einführung in das statistische Testen sowie der Testtheorie mit dem Prüfen von statistischen Hypothesen beinhaltend p-Wert und die 95% Konfidenzintervalle.
  • Berechnung des Student-, Welch- und gepaarten t-Test. Einführung in die Varianzanalyse.
  • Einführung in das multiple Testen von mehreren Mittelwerten und die Darstellung im compact letter display.

Informatorischer Anteil

  • Einführung in die Programmierung in R anhand von Skalenarten sowie der Darstellung von Daten in R.
  • Konzept von Objekten, Funktionen sowie Pipen und der Vorstellung des tidyverse in R.
  • Einlesen von Daten und deren Bearbeitung sowie Visualisierung in R

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung

Mathematischer Anteil

  • Die Studierenden sind in der Lage mathematische Formeln in der Literatur zu finden.
  • Die Studierenden können ein Baumdiagramm für die Berechnung von Wahrscheinlichkeiten erstellen.

Statistischer Anteil

  • Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen zu erkennen.
  • Die Studierenden können einfache explorative Abbildungen erstellen und interpretieren.
  • Die Studierenden können verschiedene statistische Tests händisch durchführen.

Informatorischer Anteil

  • Die Studierenden können die Anforderungen an einen Datensatz zur Verwendung in R benennen.
  • Die Studierenden können in R Objekte, Funktionen und Zahlenvektoren unterscheiden und kennen die gängigen Operatoren in R.
  • Die Studierenden können den Ablauf für die Erstellung einer explorativen Datenanalyse in R beschreiben.
Wissensvertiefung

Mathematischer Anteil

  • Die Studierenden sind in der Lage mathematische Formeln in einem anwendungsorientierten Kontext anzuwenden.
  • Die Studierenden können sinnvolle Abschätzungen von linearen und exponentiellen Wachstum vornehmen.

Statistischer Anteil

  • Die Studierenden können das Ergebnis eines statistischen Test im Kontext der wissenschaftlichen Fragestellung interpretieren.
  • Die Studierenden sind in der Lage anhand eines statistisches Tests eine Entscheidung zu treffen.

Informatorischer Anteil

  • Die Studierenden sind in der Lage die Ausgabe eines statistischen Test in R zu interpretieren.
Wissensverständnis

Mathematischer Anteil

  • Die Studierenden können praktische Fragestellungen in einen formalisierten, mathematischen Kontext übersetzen.
  • Die Studierenden sind in der Lage die Wahrscheinlichkeit für das Eintreten eines Ereignisses abzuschätzen.

Statistischer Anteil

  • Die Studierenden können einen einfachen statistischen Test mit einer explorativen Datenanalyse in einen Kontext setzen.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden sind in der Lage einfache lineare und exponentielle Kosten- und Nutzenabschätzungen anhand von mathematischen Modellen durchzuführen. Diese einfachen Abschätzungen umfassen die Planung von technischen und biologischen Prozesses in den Pflanzenwissenschaften sowie in der Landwirtschaft. Die Studierenden können dabei externe Literaturquellen und deren statistischen Maßzahlen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen treffen.

Wissenschaftliche Innovation

Die Studierende können statistische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen. Die Studierenden können eine Reihe von explorativen Abbildungen aus Veröffentlichungen verstehen und erste informierte Forschungsideen entwickeln. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen.

Kommunikation und Kooperation

Die Studierenden sind in der Lage durch das Konzept von “tidy data” erhobene Daten mit anderen Forschenden zu teilen. Ebenfalls sind die Studierenden in der Lage gängige statistische Maßzahlen zu erkennen und zu berichten. Die Studierenden können einfachen R Code lesen und demonstrieren.

Wissenschaftliches Selbstverständnis / Professionalität

Keine. Es handelt sich um ein Grundlagenmodul.

Literatur

  • Das Skript des Mathematikteils des Moduls unter https://jkruppa.github.io/math/
  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Teile des Skripts als Video unter https://www.youtube.com/c/JochenKruppa
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc., 2016. [https://r4ds.had.co.nz/]

Voraussetzungen für die Teilnahme

Keine. Es handelt sich um ein Grundlagenmodul.

Empfohlene Vorkenntnisse

Keine. Es handelt sich um ein Grundlagenmodul.

Zusammenhang mit anderen Modulen

Das Modul “Mathematik und Statistik” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Klausur

Angewandte Statistik und Versuchswesen

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

Der wissenschaftliche Fortschritt in den Agrarwissenschaften ist wesentlich getragen durch eine intensive experimentelle Versuchstätigkeit. Um erfolgreich in diesem Bereich tätig zu sein sind neben statistischen Kenntnissen auch solche über die Techniken zur Versuchsdurchführung erforderlich. Für die Versuchsdurchführung müssen Messdaten und Beobachtungen aus Erhebungen sowie aus experimentellen Versuchen in einem Datensatz aufgearbeitet werden. In dem Modul “Angewandte Statistik und Versuchswesen” lernen Studierende die grundlegenden Algorithmen der Statistik für das spätere wissenschaftliche und angewandte Arbeiten kennen. Das Modul vermittelt die dafür notwendigen statistischen und algorithmischen praktischen Kenntnisse. Verschiedene statistische Verfahren zur Auswertung von experimentellen Daten werden vorgestellt und die statistischen Maßzahlen für das lineare Modellieren eingeübt. Einfache experimentelle Designs werden vorgestellt und Anwendungsmöglichkeiten diskutiert. Die vorhandenen Programmierkenntnisse in R werden weiter vertieft. Verschiedene einfache Fallbeispiele dienen als Einstieg für die Diskussion und der Reflexion der eigenen Versuchstätigkeit. Das Modul “Angewandte Statistik und Versuchswesen” schließt den Erwerb der Grundlagen in der Bio Data Science ab und ermöglicht den Studierenden somit einfache Experimente in den Agrarwissenschaften selbstständig zu planen und auszuwerten.

Lehr-Lerninhalte

Statistischer Anteil

  • Die explorative Datenanalyse und deren statistischen Maßzahlen.
  • Einführung in statistische Verteilungen anhand der Poisson- und Normalverteilung.
  • Die Varianzanalyse beinhaltend die einfaktorielle sowie zweifaktorielle ANOVA.
  • Grundlagen des nicht-parametrischen Tests beinhaltend Wilcoxon-Mann-Whitney-Test sowie Kruskal-Wallis-Test.
  • Grundlagen der simplen linearen Regression und der multiplen linearen Regression sowie deren statistischen Maßzahlen der Modellgüte am Beispiel eines normalverteilten Endpunkts.
  • Diagnostischen Testen und deren statistischen Maßzahlen.
  • Chi-Quadrat-Test für eine Vierfeldertafel.
  • Das multiple Testen von mehreren Mittelwerten und deren Visualisierungen.
  • Einführung in die klassischen experimentellen Designs in den Agrarwissenschaften sowie die einfache Versuchsplanung.

Informatorischer Anteil

  • Durchführung aller theoretisch erarbeiteten Inhalte in R.
  • Interpretation und Bewertung von einfachen statistischen Modellierungen in R.
  • Einfache Transformationen von Daten für die explorative Datenanalyse.
  • Demonstration der automatisierten Erstellung von Berichten in Rmarkdown sowie in R Quatro.

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung

Statistischer Anteil

  • Die Studierenden kennen einfache experimentelle Designs in den Agrarwissenschaften.
  • Die Studierenden kennen einfache Repräsentationen der experimentellen Designs als Datensatz.
  • Die Studierenden können verschiedene statistische Tests händisch durchführen.
  • Die Studierenden sind in der Lage zwischen einen parametrischen und einem nicht-parametrischen Test zu unterscheiden.

Informatorischer Anteil

  • Die Studierenden kennen die gängigen Funktionen für die Datenaufbereitung in R.
  • Die Studierenden können den Ablauf für die Erstellung einer einfachen Datenanalyse in R beschreiben.
  • Die Studierenden sind in der Lage aus englischen Internetquellen eine Lösung für ein R Problem einzugrenzen.
Wissensvertiefung

Statistischer Anteil

  • Die Studierenden können eine simple lineare Regression für eine Normalverteilung modellieren.
  • Die Studierenden können eine Aussage über die Güte eines simplen linearen Modells abgeben.
  • Die Studierenden können eine Korrelation berechnen und interpretieren.
  • Die Studierenden können einen multiplen Gruppenvergleich für einen normalverteilten Endpunkt rechnen und die p-Werte entsprechend adjustieren.
  • Die Studierenden sind in der Lage eine einfache explorative Datenanalyse mit einem multiplen Gruppenvergleich zu verbinden.

Informatorischer Anteil

  • Die Studierenden können Datensätze in R bearbeiten.
  • Die Studierenden können einfache experimentelle Designs in R visualisieren.
  • Die Studierenden können verschiedene Ausgaben von statistischen Tests in R visualisieren.
Wissensverständnis

Statistischer Anteil

  • Die Studierenden sind die der Lage eine wissenschaftliche Fragestellung mit einem einfachen experimentellen Design zu verbinden.
  • Die Studierenden können einfache linearen Modellierungen bewerten und interpretieren.

Informatorischer Anteil

  • Die Studierenden können verschiedene statistische Tests und eine lineare Modellierung mit einer explorativen Datenanalye in einen Kontext setzen.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden sind in der Lage einfache Kosten- und Nutzenabschätzungen anhand von statistischen linearen Modellen durchzuführen. Diese Abschätzungen umfassen im Besonderen die Planung von einfachen experimentellen Designs in den Agrarwissenschaften. Die Studierenden können statistische Unterschiede aus multiplen Gruppenvergleichen berechnen und eine Risikoabschätzung treffen. Die Studierenden sind in der Lage selbständig einfache statistische Analysen auf Datensätzen in R durchzuführen. Die Studierenden können einfache experimentelle Designs für verschiedene Berufsfelder und Anwendungen abwägen und diskutieren.

Wissenschaftliche Innovation

Die Studierende können statistische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden können selbständig eigene wissenschaftliche Fragestellungen mit Fallbeispielen abgleichen und entsprechend der eigenen Anforderungen modifizieren. Die Studierenden können explorative Abbildungen aus Veröffentlichungen verstehen und erste informierte Forschungsideen entwickeln. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die wissenschaftliche Verwertbarkeit in R zu gewährleisten. Die Studierenden kennen die Möglichkeit über automatisierte Berichte die Reproduzierbarkeit der eigenen Forschungsergebnisse zu gewährleisten.

Kommunikation und Kooperation

Die Studierenden sind in der Lage die Daten der durchgeführten Experimente und entsprechende R Skripte der statistische Auswertungen mit anderen Forschenden zu teilen. Die Studierenden können die statistischen Analyseergebnisse vorstellen und Änderungswünsche entsprechend durchführen.

Wissenschaftliches Selbstverständnis / Professionalität

Keine. Es handelt sich um ein Grundlagenmodul.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Teile des Skripts als Video unter https://www.youtube.com/c/JochenKruppa
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc., 2016. [https://r4ds.had.co.nz/]
  • Data Science for Agriculture in R unter https://schmidtpaul.github.io/DSFAIR/

Voraussetzungen für die Teilnahme

Keine.

Empfohlene Vorkenntnisse

Für dieses Modul werden Kenntnisse der deskriptiven Statistik sowie Grundkenntnisse der Statistik vorausgesetzt, wie sie in dem Modul “Mathematik und Statistik (44B0266)” vermittelt werden.

Studierenden, die ihre Kenntnisse und Fertigkeiten vor Beginn des Moduls auffrischen möchten, wird folgende Grundlagenliteratur mit dem “Skript Bio Data Science” unter https://jkruppa.github.io/ empfohlen.

In dem Modul wird mit der Software R gearbeitet. Um sich im Vorfeld mit den Basisfunktionen vertraut zu machen, eignen sich beispielsweise die folgenden Video-Tutorials unter https://www.youtube.com/c/JochenKruppa.

Zusammenhang mit anderen Modulen

Das Modul “Angewandte Statistik und Versuchswesen” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Klausur

Spezielle Statistik und Versuchswesen

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

Mit dem Fortschreiten der Digitalisierung können in den Pflanzenwissenschaften und der Landwirtschaft komplexere Experimente durchgeführt werden. Die Digitalisierung erlaubt die automatisierte Erfassung und Speicherung großer Datenmengen, die über entsprechende statistische Algorithmen aggregiert und ausgewertet werden müssen. Diese Daten können zur Steuerung der Produktion oder zur Erkennung von unerwünschten Ereignissen genutzt werden. Dadurch kann eine bessere Qualitätssicherung und Entwicklung gewährleistet werden. In dem Modul “Spezielle Statistik und Versuchswesen” lernen Studierende die fortgeschrittenen Algorithmen für das spätere wissenschaftliche und angewandte Arbeiten mit großen Datenmengen. Das Modul vermittelt die dafür notwendigen statistischen und algorithmischen praktischen Kenntnisse. Verschiedene statistische Verfahren werden vorgestellt und die statistischen Maßzahlen für die Modellselektion eingeübt. Im Weiteren werden maschinelle Lernverfahren präsentiert und auf Fallbeispiele angewendet. Der Fokus des Moduls liegt auf der praktischen Anwendung und Diskussion der Ergebnisse der statistischen Modellierungen. Die vorhandenen Programmierkenntnisse in R werden weiter vertieft und automatisierte Berichtserstellung mit Quarto und RMarkdown eingeübt. Das Arbeiten mit großen Datenmengen wird so für die Studierenden umsetzbar und erfahrbar gemacht. Das Modul “Spezielle Statistik und Versuchswesen” befähigt Studierende in dem Bereich der Bio Data Science in verschiedenen Anwendungsfeldern praktisch tätig zu sein.

Lehr-Lerninhalte

Statistischer Anteil

  • Einführung in die gängigen multiplen linearen Regressionen und deren Verteilungsfamilien beinhaltend die Gaussian, Poisson, Multinominal/Ordinal und Binomial.
  • Grundlagen der statistischen Maßzahlen der Modellgüte einer multiplen linearen Regression sowie deren Effektschätzer.
  • Grundlagen der Variablenselektion und Imputation von fehlenden Werten sowie Ausreißerdetektion.
  • Einführung in die linearen gemischten Modelle und die Berücksichtigung von Messwiederholungen.
  • Einführung in die nicht lineare Regression.
  • Vertiefte Auseinandersetzung mit multiplen Gruppenvergleichen und deren Möglichkeiten der Visualisierung von Gruppenunterschieden.
  • Einführung in die Äquivalenz oder Nichtunterlegenheit in der praktischen Anwendung.
  • Einführung in die klassischen experimentellen Designs in den Agrarwissenschaften.
  • Grundlagen des maschinellen Lernens und der Klassifikation von Ereignissen sowie Maßzahlen der Bewertung eines maschinellen Lernalgorithmus.
  • Anwendung der grundlegenden maschinellen Lernverfahren wie k-NN, Random Forest, Support Vector Machine und Neuronale Netze.

Informatorischer Anteil

  • Durchführung aller theoretisch erarbeiteten Inhalte in R.
  • Interpretation und Bewertung von statistischen Modellierungen in R.
  • Fortgeschrittene Programmierung in R unter der Verwendung von regulären Ausdrücken.
  • Automatisierte Erstellung von Berichten in Rmarkdown sowie in R Quatro.
  • Einführung in die Erstellung von interaktiven R Shiny Apps.

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung

Statistischer Anteil

  • Die Studierenden kennen die gängigen experimentellen Designs in den Agrarwissenschaften.
  • Die Studierenden kennen die entsprechenden Repräsentationen der experimentellen Designs als Datensatz.
  • Die Studierenden können die gängigen statistischen Modellierungen benennen und unterscheiden.
  • Die Studierenden sind in der Lage zwischen einem kausalen und einem prädiktiven Modell zu unterscheiden.

Informatorischer Anteil

  • Die Studierenden kennen die gängigen Funktionen für die Datenaufbereitung in R.
  • Die Studierenden sind in der Lage aus englischsprachigen Tutorien die statistische Analyseschritte für die eigenen Daten zu transferieren.
Wissensvertiefung

Statistischer Anteil

  • Die Studierenden sind in der Lage anhand einer wissenschaftlichen Fragestellung eine statistische Auswertung zu gliedern und zu planen.
  • Die Studierenden können wissenschaftliche Veröffentlichungen lesen und in den statistischen Kontext richtig einordnen.
  • Die Studierenden können eine multiple lineare Regression oder einen maschinellen Lernalgorithmus entsprechend des Endpunktes modellieren und interpretieren.
  • Die Studierenden können einen multiplen Gruppenvergleich für verschiedene Endpunkte rechnen und die p-Werte entsprechend adjustieren.
  • Die Studierenden können verschiedene technische Messparameter miteinander vergleichen und eine Aussage über die Nichtunterlegenheit treffen.

Informatorischer Anteil

  • Die Studierenden können mit regulären Ausdrücken Datensätze bearbeiten.
  • Die Studierenden sind in der Lage durch eine eine parallele Programmierung eine serielle Programmierungen zu optimieren.
  • Die Studierenden sind in der Lage einen automatisierten Bericht in Rmarkdown oder R Quarto zu erstellen
Wissensverständnis

Statistischer Anteil

  • Die Studierenden sind die der Lage eine wissenschaftliche Fragestellung mit einem experimentellen Design und einer statistischen Modellierung zu verbinden.
  • Die Studierenden können eine statistische Modellierung in einer Präsentation darstellen und vorstellen.
  • Die Studierenden können eine wissenschaftliche Veröffentlichung anhand der verwendeten Statistik bewerten.

Informatorischer Anteil

  • Die Studierenden sind in der Lage in R eine statistische Modellierung zu planen und den entsprechenden R Code zu erstellen.
  • Die Studierenden können R Code Chunks miteinander sinnvoll für die eigene Anwendung kombinieren und optimieren.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden sind in der Lage Kosten- und Nutzenabschätzungen anhand von statistischen Modellen und deren Effektschätzern durchzuführen. Diese Abschätzungen umfassen im Besonderen die Planung von technischen und biologischen Prozesses in den Agrarwissenschaften. Die Studierenden können verschiedene technische Prozesse miteinander vergleichen und eine Aussage über die Nichtunterlegenheit oder den statistischen Unterschied treffen. Die beiden gegensätzlichen Konzepte von einem geplanten Experiment und einer technischen Nichtunterlegenheit können von den Studierenden unterschieden werden. Die Studierenden sind in der Lage selbständig Datenanalysen auf großen Datensätzen in R durchzuführen. Die Studierenden können die gängigen experimentellen Designs für verschiedene Berufsfelder und Anwendungen anpassen und durchführen.

Wissenschaftliche Innovation

Die Studierende können statistische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden sind in der Lage wissenschaftlich zu Arbeiten und eine praktische Fragestellung in einen wissenschaftlichen Erkenntnisprozess zu übersetzen. Die Studierenden können statistische Auswertungen aus wissenschaftlichen Publikationen verstehen und informierte Forschungsideen entwickeln. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die wissenschaftliche Verwertbarkeit in R zu berücksichtigen. Die Studierenden können über die Erstellung von automatisierten Berichten die Reproduzierbarkeit der eigenen Forschungsergebnisse gewährleisten.

Kommunikation und Kooperation

Die Studierenden sind in der Lage durch das Konzept der automatisierten Berichtserstattung durchgeführte Experimente und statistische Auswertungen mit anderen Forschenden zu teilen. Die Studierenden sind dadurch in der Lage in multidiziplinären, wissenschaftlichen Teams mitzuwirken. Die Studierenden können eine gemeinsam geplante Forschungsskizze in R umsetzen. Die Studierenden sind in der Lage die Ergebnisse einer statistischen Analyse auch Fachfremden zu erläutern.

Wissenschaftliches Selbstverständnis / Professionalität

Die Studierenden können wissenschaftliche Publikationen und deren statistischen Maßzahlen in den Kontext des eigenen Berufsfeldes setzen und somit informierte Entscheidungen treffen. Die Studierende sind sich der inhärenten Unsicherheit der wissenschaftlichen Forschung bewusst und können die eigenen Forschungsergebnisse kritisch hinterfragen.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Teile des Skripts als Video unter https://www.youtube.com/c/JochenKruppa
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc., 2016. [https://r4ds.had.co.nz/]
  • Data Science for Agriculture in R unter https://schmidtpaul.github.io/DSFAIR/
  • Bruce, Peter, Andrew Bruce, und Peter Gedeck. 2020. Practical statistics for data scientists: 50+ essential concepts using R and Python. O’Reilly Media.

Voraussetzungen für die Teilnahme

Keine. Bitte aber die empfohlenen Vorkenntnisse beachten.

Empfohlene Vorkenntnisse

Für dieses Modul werden vertiefte Kenntnisse der deskriptiven Statistik sowie Grundkenntnisse der Statistik vorausgesetzt, wie sie in den Modulen “Mathematik und Statistik (44B0266)” und “Angewandte Statistik und Versuchswesen (44B0400)” vermittelt werden.

Studierenden, die ihre Kenntnisse und Fertigkeiten vor Beginn des Moduls auffrischen möchten, wird folgende Grundlagenliteratur mit dem “Skript Bio Data Science” unter https://jkruppa.github.io/ empfohlen.

In dem Modul wird mit der Software R gearbeitet. Um sich im Vorfeld mit den Basisfunktionen vertraut zu machen, eignen sich beispielsweise die folgenden Video-Tutorials unter https://www.youtube.com/c/JochenKruppa.

Zusammenhang mit anderen Modulen

Das Modul “Spezielle Statistik und Versuchswesen” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Hausarbeit

Statistik

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

In der Agrarwirtschaft, Lebensmittelwissenschaft und Gartenbau werden vielen Prozesse und Phänomene durch mathematische und statistische Modelle beschrieben. Entwicklung, Qualitätssicherung und Marketing sind wesentlich getragen durch eine statistische Analyse von Daten. In dem Modul “Statistik” lernen Studierende die Grundlagen für das spätere wissenschaftliche und angewandte Arbeiten. Das Modul vermittelt die dafür notwendigen statistischen Grundkenntnisse. Der Fokus liegt hier auf der Darstellung, Erfahrung und ersten statistischen Auswertungen von Daten. Wissenschaftliche Forschung und Erkenntnisgewinn wird hierbei in den Kontext der Erhebung von Daten gesetzt. Die für die Agrarwirtschaft, Lebensmittelwissenschaft und Gartenbau relevanten statistischen Verfahren und Modellierungen werden dargestellt und diskutiert. Eine auf Daten gestützte Risikoabschätzung von Entscheidungen wird eingeübt. Parallel dazu werden in dem Modul die erworbenen theoretischen, statistischen Kenntnisse durch die Einführung in die Programmierung in R für die Studierenden umsetzbar und erfahrbar gemacht. In dem Modul “Statistik” werden somit die ersten Grundkenntnisse für die praktische Anwendung der Bio Data Science erworben.

Lehr-Lerninhalte

Statistischer Anteil

  • Einführung in die explorative Datenanalyse und deren statistischen Maßzahlen.
  • Einführung in statistische Verteilungen anhand der Poisson- und Normalverteilung.
  • Einführung in das statistische Testen sowie der Testtheorie mit dem Prüfen von statistischen Hypothesen beinhaltend p-Wert und die 95% Konfidenzintervalle.
  • Berechnung des Student-, Welch- und gepaarten t-Test.
  • Einführung in die Varianzanalyse beinhaltend die einfaktorielle sowie zweifaktorielle ANOVA.
  • Grundlagen des nicht-parametrischen Tests beinhaltend Wilcoxon-Mann-Whitney-Test sowie Kruskal-Wallis-Test.
  • Grundlagen der simplen linearen Regression und der multiplen linearen Regression sowie deren statistischen Maßzahlen der Modellgüte am Beispiel eines normalverteilten Endpunkts.
  • Diagnostischen Testen und deren statistischen Maßzahlen.
  • Chi-Quadrat-Test für eine Vierfeldertafel.
  • Einführung in das multiple Testen von mehreren Mittelwerten und die Darstellung im compact letter display.

Informatorischer Anteil

  • Einführung in die Grundlagen der Programmierung in R anhand von Skalenarten.
  • Einführung in die Darstellung von Daten in R und die Vorstellung des Konzepts der “tidy data”.
  • Konzept von Objekten, Funktionen sowie Pipen und der Vorstellung des tidyverse in R.
  • Einlesen von Daten und deren Bearbeitung sowie Visualisierung in R.
  • Durchführung der gängigen statistischen Tests und die Interpretierung der jeweiligen R Ausgaben.

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung

Statistischer Anteil

  • Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen zu erkennen und zu benennen.
  • Die Studierenden können explorative Abbildungen erkennen und benennen.
  • Die Studierenden können verschiedene statistische Tests händisch durchführen.

Informatorischer Anteil

  • Die Studierenden können die Anforderungen an einen Datensatz zur Verwendung in R benennen.
  • Die Studierenden können in R Objekte, Funktionen und Zahlenvektoren unterscheiden und kennen die gängigen Operatoren in R.
  • Die Studierenden können den Ablauf für die Erstellung einer explorativen Datenanalyse in R beschreiben.
  • Die Studierenden sind in der Lage aus englischen Internetquellen eine Lösung für ein R Problem einzugrenzen.
Wissensvertiefung

Statistischer Anteil

  • Die Studierenden können explorative Abbildungen erstellen und interpretieren.
  • Die Studierenden können aus explorative Abbildungen die entsprechende Datenstruktur zur Erstellung der Abbildungen wiedergeben.
  • Die Studierenden sind in der Lage anhand eines statistisches Tests eine Entscheidung zu treffen.
  • Die Studierenden können das Ergebnis eines statistischen Test im Kontext der wissenschaftlichen Fragestellung interpretieren.

Informatorischer Anteil

  • Die Studierenden sind in der Lage experimentelle Daten nach dem Konzept der der “tidy data” zu erheben.
  • Die Studierenden sind in der Lage die Ausgabe eines statistischen Test in R zu interpretieren.
  • Die Studierenden können einfache Auswahl- und Filterregeln auf Datensätze in R anwenden.
  • Die Studierenden können erste einfache R Code Blöcke miteinander in einen Kontext setzen.
Wissensverständnis

Statistischer Anteil

  • Die Studierenden können einen statistischen Test mit einer explorativen Datenanalyse in einen Kontext bringen.

Informatorischer Anteil

  • Die Studierenden sind in der Lage eine einfache statistische Auswertung mit den notwendigen Funktionen und Paketen in R zu skizzieren.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden sind in der Lage einfache lineare Kosten- und Nutzenabschätzungen anhand von statistischen Modellen durchzuführen. Diese einfachen Abschätzungen umfassen die Planung von marktwirtschaftlichen, technischen und biologischen Prozesses in den Agrarwirtschaften, Lebensmittelwissenschaften und Gartenbau. Die Studierenden können dabei externe Literaturquellen und deren statistischen Maßzahlen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen treffen. Die Studierenden sind in der Lage die grundlegenden Konzepte der Programmierung in R in anderen Programmiersprachen zuerkennen.

Wissenschaftliche Innovation

Die Studierende können statistische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen. Die Studierenden können explorative Abbildungen aus Veröffentlichungen verstehen und erste informierte Forschungsideen entwickeln. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen.

Kommunikation und Kooperation

Die Studierenden sind in der Lage durch das Konzept von “tidy data” erhobene Daten mit anderen Forschenden zu teilen. Ebenfalls sind die Studierenden in der Lage gängige statistische Maßzahlen zu erkennen und zu berichten. Die Studierenden können R Code lesen, erstellen und demonstrieren.

Wissenschaftliches Selbstverständnis / Professionalität

Keine. Es handelt sich um ein Grundlagenmodul.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Teile des Skripts als Video unter https://www.youtube.com/c/JochenKruppa
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc., 2016. [https://r4ds.had.co.nz/]

Voraussetzungen für die Teilnahme

Keine. Es handelt sich um ein Grundlagenmodul.

Empfohlene Vorkenntnisse

Keine. Es handelt sich um ein Grundlagenmodul.

Zusammenhang mit anderen Modulen

Das Modul “Statistik” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Klausur

Angewandte Statistik für Bioverfahrenstechnik

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

In der Agrarwirtschaft und Ingenieurwissenschaften werden vielen Prozesse und Phänomene durch statistische Modelle beschrieben. Verfahrenstechnik, Qualitätssicherung und Marketing sind wesentlich getragen durch eine statistische Analyse von Daten. In dem Modul “Angewandte Statistik für Bioverfahrenstechnik” lernen Studierende die Grundlagen für das spätere wissenschaftliche und angewandte Arbeiten. Das Modul vermittelt die dafür notwendigen statistischen Grundkenntnisse. Der Fokus liegt hier auf der Darstellung, Erfahrung und ersten statistischen Auswertungen von Daten. Wissenschaftliche Forschung und Erkenntnisgewinn wird hierbei in den Kontext der Erhebung von Daten gesetzt. Die für die Agrarwirtschaft und Ingenieurwissenschaften relevanten statistischen Verfahren und Modellierungen werden dargestellt und diskutiert. Eine auf Daten gestützte Risikoabschätzung von Entscheidungen wird eingeübt. Parallel dazu werden in dem Modul die erworbenen theoretischen, statistischen Kenntnisse durch die Einführung in die Programmierung in R für die Studierenden umsetzbar und erfahrbar gemacht. In dem Modul “Angewandte Statistik für Bioverfahrenstechnik” werden somit die ersten Grundkenntnisse für die praktische Anwendung der Bio Data Science erworben.

Lehr-Lerninhalte

Statistischer Anteil

  • Einführung in die explorative Datenanalyse und deren statistischen Maßzahlen.
  • Einführung in statistische Verteilungen anhand der Poisson- und Normalverteilung.
  • Einführung in das statistische Testen sowie der Testtheorie mit dem Prüfen von statistischen Hypothesen beinhaltend p-Wert und die 95% Konfidenzintervalle.
  • Berechnung des Student-, Welch- und gepaarten t-Test.
  • Einführung in die Varianzanalyse beinhaltend die einfaktorielle sowie zweifaktorielle ANOVA.
  • Grundlagen des nicht-parametrischen Tests beinhaltend Wilcoxon-Mann-Whitney-Test sowie Kruskal-Wallis-Test.
  • Grundlagen der simplen linearen Regression und der multiplen linearen Regression sowie deren statistischen Maßzahlen der Modellgüte am Beispiel eines normalverteilten Endpunkts.
  • Diagnostischen Testen und deren statistischen Maßzahlen.
  • Chi-Quadrat-Test für eine Vierfeldertafel.
  • Einführung in das multiple Testen von mehreren Mittelwerten und die Darstellung im compact letter display.

Informatorischer Anteil

  • Einführung in die Grundlagen der Programmierung in R anhand von Skalenarten.
  • Einführung in die Darstellung von Daten in R und die Vorstellung des Konzepts der “tidy data”.
  • Konzept von Objekten, Funktionen sowie Pipen und der Vorstellung des tidyverse in R.
  • Einlesen von Daten und deren Bearbeitung sowie Visualisierung in R.
  • Durchführung der gängigen statistischen Tests und die Interpretierung der jeweiligen R Ausgaben.

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung

Statistischer Anteil

  • Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen zu erkennen und zu benennen.
  • Die Studierenden können explorative Abbildungen erkennen und benennen.
  • Die Studierenden können verschiedene statistische Tests händisch durchführen.

Informatorischer Anteil

  • Die Studierenden können die Anforderungen an einen Datensatz zur Verwendung in R benennen.
  • Die Studierenden können in R Objekte, Funktionen und Zahlenvektoren unterscheiden und kennen die gängigen Operatoren in R.
  • Die Studierenden können den Ablauf für die Erstellung einer explorativen Datenanalyse in R beschreiben.
  • Die Studierenden sind in der Lage aus englischen Internetquellen eine Lösung für ein R Problem einzugrenzen.
Wissensvertiefung

Statistischer Anteil

  • Die Studierenden können explorative Abbildungen erstellen und interpretieren.
  • Die Studierenden können aus explorative Abbildungen die entsprechende Datenstruktur zur Erstellung der Abbildungen wiedergeben.
  • Die Studierenden sind in der Lage anhand eines statistisches Tests eine Entscheidung zu treffen.
  • Die Studierenden können das Ergebnis eines statistischen Test im Kontext der wissenschaftlichen Fragestellung interpretieren.

Informatorischer Anteil

  • Die Studierenden sind in der Lage experimentelle Daten nach dem Konzept der der “tidy data” zu erheben.
  • Die Studierenden sind in der Lage die Ausgabe eines statistischen Test in R zu interpretieren.
  • Die Studierenden können einfache Auswahl- und Filterregeln auf Datensätze in R anwenden.
  • Die Studierenden können erste einfache R Code Blöcke miteinander in einen Kontext setzen.
Wissensverständnis

Statistischer Anteil

  • Die Studierenden können einen statistischen Test mit einer explorativen Datenanalyse in einen Kontext bringen.

Informatorischer Anteil

  • Die Studierenden sind in der Lage eine einfache statistische Auswertung mit den notwendigen Funktionen und Paketen in R zu skizzieren.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden sind in der Lage einfache lineare Kosten- und Nutzenabschätzungen anhand von statistischen Modellen durchzuführen. Diese einfachen Abschätzungen umfassen die Planung von marktwirtschaftlichen, technischen und biologischen Prozesses in der Agrarwirtschaft und Ingenieurwissenschaften. Die Studierenden können dabei externe Literaturquellen und deren statistischen Maßzahlen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen treffen. Die Studierenden sind in der Lage die grundlegenden Konzepte der Programmierung in R in anderen Programmiersprachen zuerkennen.

Wissenschaftliche Innovation

Die Studierende können statistische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen. Die Studierenden können explorative Abbildungen aus Veröffentlichungen verstehen und erste informierte Forschungsideen entwickeln. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen.

Kommunikation und Kooperation

Die Studierenden sind in der Lage durch das Konzept von “tidy data” erhobene Daten mit anderen Forschenden zu teilen. Ebenfalls sind die Studierenden in der Lage gängige statistische Maßzahlen zu erkennen und zu berichten. Die Studierenden können R Code lesen, erstellen und demonstrieren.

Wissenschaftliches Selbstverständnis / Professionalität

Keine. Es handelt sich um ein Grundlagenmodul.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Teile des Skripts als Video unter https://www.youtube.com/c/JochenKruppa
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc., 2016. https://r4ds.had.co.nz

Voraussetzungen für die Teilnahme

Inhalte des Moduls Mathematik für Bioverfahrenstechnik (44B0609)

Empfohlene Vorkenntnisse

Keine. Es handelt sich um ein Grundlagenmodul.

Zusammenhang mit anderen Modulen

Das Modul “Angewandte Statistik für Bioverfahrenstechnik” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Klausur

Angewandte Mathematik und Statistik für Bioverfahrenstechnik

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

In der Agrarwirtschaft und Ingenieurwissenschaften werden vielen Prozesse und Phänomene durch statistische Modelle beschrieben. Verfahrenstechnik, Qualitätssicherung und Marketing sind wesentlich getragen durch eine statistische Analyse von Daten. In dem Teil des Moduls “Angewandte Statistik für Bioverfahrenstechnik” lernen Studierende die Grundlagen für das spätere wissenschaftliche und angewandte Arbeiten. Das Modul vermittelt die dafür notwendigen statistischen Grundkenntnisse. Der Fokus liegt hier auf der Darstellung, Erfahrung und ersten statistischen Auswertungen von Daten. Wissenschaftliche Forschung und Erkenntnisgewinn wird hierbei in den Kontext der Erhebung von Daten gesetzt. Eine auf Daten gestützte Risikoabschätzung von Entscheidungen wird eingeübt. In dem Modul “Angewandte Statistik für Bioverfahrenstechnik” werden somit die ersten Grundkenntnisse für die praktische Anwendung der Bio Data Science erworben. Der Teil “Angewandte Mathematik für Bioverfahrenstechnik” des Moduls ist die Vertiefung und Erweiterung des Moduls “Mathematik für Bioverfahrenstechnik”. Schwerpunkt soll auf der Auswahl und Anwendung wichtiger mathematischer Werkzeuge liegen. Während im Modul “Mathematik für Bioverfahrenstechnik” Wert auf grundlegende Rechentechniken gelegt wird, ist in diesem Modul die Unterstützung durch die Software MATLAB zentrales Merkmal. Die grundlegende Funktionsweise der Software soll in diesem Rahmen vermittelt werden. Mittels der integrierten Funktionen der Software sollen die Studierenden lernen mathematische Berechnungen und numerische Analysen durchzuführen und zu visualisieren.

Lehr-Lerninhalte

Statistischer Anteil

  • Einführung in die explorative Datenanalyse und deren statistischen Maßzahlen.
  • Einführung in das statistische Testen sowie der Testtheorie mit dem Prüfen von statistischen Hypothesen beinhaltend p-Wert und die 95% Konfidenzintervalle.
  • Berechnung des Student-, Welch- und gepaarten t-Test.
  • Einführung in die Varianzanalyse beinhaltend die einfaktorielle ANOVA.
  • Grundlagen der simplen linearen Regression und deren statistischen Maßzahlen der Modellgüte am Beispiel eines normalverteilten Endpunkts.
  • Einführung in das multiple Testen von mehreren Mittelwerten und die Darstellung im compact letter display.

Mathematischer Anteil

  • Vertiefung der Anwendung mathematischer Lösungsansätze und Methoden
  • Grundlegende Einführung in die Software MATLAB
  • Anwendung der Software MATLAB
  • Näherungen und Näherungsmethoden
  • Systeme von Differentialgleichungen
  • Visualisierung von Daten

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung

Statistischer Anteil

  • Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen zu erkennen und zu benennen.
  • Die Studierenden können explorative Abbildungen erkennen und benennen.
  • Die Studierenden können verschiedene statistische Tests händisch durchführen.

Mathematischer Anteil

  • Die Studierenden sind in der Lage Lösungsverfahren auszuwählen, anzuwenden um Problemlösungen korrekt zu erarbeiten.
  • Die Studierenden können Näherungsmethoden auswählen und anwenden.
  • Die Studierenden sind in der Lage Daten zu visualisieren.
Wissensvertiefung

Statistischer Anteil

  • Die Studierenden können explorative Abbildungen erstellen und interpretieren.
  • Die Studierenden können aus explorative Abbildungen die entsprechende Datenstruktur zur Erstellung der Abbildungen wiedergeben.
  • Die Studierenden sind in der Lage anhand eines statistisches Tests eine Entscheidung zu treffen.
  • Die Studierenden können das Ergebnis eines statistischen Test im Kontext der wissenschaftlichen Fragestellung interpretieren.

Mathematischer Anteil

  • Die Studierenden können mathematische Problemstellungen unter Zuhilfenahme der Software MATLAB lösen.
  • Die Studierenden sind in der Lage Näherungen mittels geeigneter Näherungsmethoden sinnvoll durchzuführen.
  • Die Studierenden können Systeme von linearen Differentialgleichungen lösen.
  • Die Studierenden können Ergebnisse zwei- und dreidimensional graphisch darstellen.
Wissensverständnis

Statistischer Anteil

  • Die Studierenden können einen statistischen Test mit einer explorativen Datenanalyse in einen Kontext bringen.

Mathematischer Anteil

  • Die Studierenden können Aufgabenstellungen interpretieren, Lösungsverfahren zuordnen und unter Zuhilfenahme von Software korrekt anwenden.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden sind in der Lage einfache lineare Kosten- und Nutzenabschätzungen anhand von statistischen Modellen durchzuführen. Diese einfachen Abschätzungen umfassen die Planung von marktwirtschaftlichen, technischen und biologischen Prozesses in der Agrarwirtschaft und Ingenieurwissenschaften. Die Studierenden können dabei externe Literaturquellen und deren statistischen Maßzahlen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen treffen. Die Studierenden sind in der Lage die grundlegenden Konzepte der Programmierung in R in anderen Programmiersprachen zuerkennen.

Wissenschaftliche Innovation

Die Studierende können statistische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen. Die Studierenden können explorative Abbildungen aus Veröffentlichungen verstehen und erste informierte Forschungsideen entwickeln. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen.

Kommunikation und Kooperation

Die Studierenden sind in der Lage durch das Konzept von “tidy data” erhobene Daten mit anderen Forschenden zu teilen. Ebenfalls sind die Studierenden in der Lage gängige statistische Maßzahlen zu erkennen und zu berichten.

Wissenschaftliches Selbstverständnis / Professionalität

Keine. Es handelt sich um ein Grundlagenmodul.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Teile des Skripts als Video unter https://www.youtube.com/c/JochenKruppa
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc., 2016. https://r4ds.had.co.nz

Voraussetzungen für die Teilnahme

Inhalte des Moduls Mathematik für Bioverfahrenstechnik (44B0609)

Empfohlene Vorkenntnisse

Keine. Es handelt sich um ein Grundlagenmodul.

Zusammenhang mit anderen Modulen

Das Modul “Angewandte Statistik für Bioverfahrenstechnik” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Klausur

Biostatistik

Inhalte und Qualifikationsziele des Moduls

Kurzbeschreibung

Im Masterstudiengang Nutztier- und Pflanzenwissenschaften wird angewandte Forschungs- und Entwicklungskompetenz in den Forschungsfeldern der Agrarwissenschaften vermittelt. Studierende lernen, wie sie aus Daten, die sich aus technischen Prozessen und wissenschaftlichen Experimenten ergeben, zuverlässige und objektive Entscheidungen treffen können. Dazu benötigen die Studierenden vertiefte und umfangreiche Kenntnisse über angewandte statistische Methoden. Das Modul “Biostatistik” vermittelt die notwendigen wissenschaftlichen und angewandten statistischen Modelle, um später wissenschaftlich und angewandt arbeiten zu können. Das wissenschaftliche Arbeiten, Strategien in der Forschung und ihre Beziehungen zu statistischen Methoden werden an Fallbeispielen eingeübt. Dabei werden verschiedene statistische Verfahren vorgestellt und die statistischen Maßzahlen für die Modellselektion diskutiert. Der Schwerpunkt des Moduls liegt auf dem forschenden Arbeiten und der wissenschaftlichen Diskussion der Ergebnisse der statistischen Modellierungen. Studierende werden außerdem dazu angeleitet, bereits vorhandene Programmierkenntnisse in R weiter zu vertiefen und somit das Arbeiten mit Daten umsetzbar und erfahrbar zu machen. Das Modul “Biostatistik” befähigt Studierende dazu, in verschiedenen Anwendungsfeldern der agrarwissenschaftlichen Forschung und Praxis forschend tätig zu sein und Daten auszuwerten.

Lehr-Lerninhalte

Allgemeine Statistik

  • Vertiefung der gängigen multiplen linearen Regressionen und deren Verteilungsfamilien beinhaltend die Gaussian, Poisson, Multinominal/Ordinal und Binomial.
  • Vertiefung der statistischen Maßzahlen der Modellgüte einer multiplen linearen Regression sowie deren Effektschätzer.
  • Methoden der Variablenselektion und Imputation von fehlenden Werten sowie Ausreißerdetektion.
  • Lineare gemischte Modelle und die Berücksichtigung von Messwiederholungen in der praktischen Anwendung.
  • Vertiefte Auseinandersetzung mit multiplen Gruppenvergleichen und deren Möglichkeiten der Visualisierung von Gruppenunterschieden.
  • Einführung in die Äquivalenz oder Nichtunterlegenheit in der praktischen Anwendung.
  • Die klassischen experimentellen Designs in den Agrarwissenschaften und deren Auswertung an Fallbeispielen.
  • Grundlagen des maschinellen Lernens und der Klassifikation von Ereignissen sowie Maßzahlen der Bewertung eines maschinellen Lernalgorithmus.
  • Durchführung aller theoretisch erarbeiteten Inhalte in R.
  • Interpretation und Bewertung von statistischen Modellierungen in R.

Nutztierwissenschaften und Pflanzenwissenschaften

  • Spezifische Strategien und statistische Methoden in der Forschung und ihre Beziehungen zu angewandten statistischen Methoden in der jeweiligen Fachrichtung.

Kompetenzorientierte Lernergebnisse

Wissen und Verstehen

Wissensverbreiterung
  • Die Studierenden kennen die gängigen experimentellen Designs in den Agrarwissenschaften.
  • Die Studierenden kennen die entsprechenden Repräsentationen der experimentellen Designs als Datensatz.
  • Die Studierenden können die gängigen statistischen Modellierungen benennen und unterscheiden.
  • Die Studierenden können das Ergebnis eines statistischen Modells im Kontext der wissenschaftlichen Fragestellung interpretieren.
  • Die Studierenden sind in der Lage zwischen einem kausalen und einem prädiktiven Modell zu unterscheiden.
Wissensvertiefung
  • Die Studierenden sind in der Lage anhand einer wissenschaftlichen Fragestellung eine statistische Auswertung zu gliedern und zu planen.
  • Die Studierenden können wissenschaftliche Veröffentlichungen lesen und in den statistischen Kontext richtig einordnen.
  • Die Studierenden können eine multiple lineare Regression entsprechend des Endpunktes modellieren und interpretieren.
  • Die Studierenden können einen multiplen Gruppenvergleich für verschiedene Endpunkte rechnen und die p-Werte entsprechend adjustieren.
  • Die Studierenden können verschiedene technische Messparameter miteinander vergleichen und eine Aussage über die Nichtunterlegenheit treffen.
Wissensverständnis
  • Die Studierenden sind die der Lage eine wissenschaftliche Fragestellung mit einem experimentellen Design und einer statistischen Modellierung zu verbinden.
  • Die Studierenden können eine statistische Modellierung in einer Präsentation darstellen und vorstellen.
  • Die Studierenden können eine wissenschaftliche Veröffentlichung anhand der verwendeten Statistik bewerten.

Einsatz, Anwendung und Erzeugung von Wissen

Nutzung und Transfer

Die Studierenden können durch statistische Modelle Kosten- und Nutzenabschätzungen durchführen, um marktwirtschaftliche, technische und biologische Prozesse in den Forschungsfeldern der Agrarwissenschaften zu planen. Sie sind in der Lage, externe Literaturquellen zu nutzen und statistische Maßzahlen in den Kontext ihres Berufsfeldes zu setzen, um fundierte Entscheidungen zu treffen. Außerdem können die Studierenden grundlegende Konzepte der Programmierung in R erkennen und eine Datenauswertung durchführen.

Wissenschaftliche Innovation

Die Studierenden verfügen über die Fähigkeit, statistische Maßzahlen aus wissenschaftlichen Publikationen in verschiedenen wissenschaftlichen Kontexten zu interpretieren und anzuwenden. Sie besitzen grundlegende Fähigkeiten des wissenschaftlichen Arbeitens, die es ihnen ermöglichen, praktische Fragestellungen in wissenschaftliche Erkenntnisprozesse zu übersetzen. Darüber hinaus können sie statistische Auswertungen aus wissenschaftlichen Publikationen verstehen und aufbauend darauf informierte Forschungsideen entwickeln.

Kommunikation und Kooperation

Die oben genannten Fähigkeiten der Studierenden ermöglichen es ihnen, in multidisziplinären wissenschaftlichen Teams mitzuwirken. Sie können eine gemeinsam geplante Forschungsskizze von Drittmittelprojekten oder in Kooperation mit Wirtschaftspartnern und Forschungsanstalten umsetzen. Darüber hinaus sind die Studierenden in der Lage, die Ergebnisse einer statistischen Analyse auch Fachfremden verständlich zu erläutern.

Wissenschaftliches Selbstverständnis / Professionalität

Die Studierenden haben ein umfangreiches Verständnis für wissenschaftliche Publikationen und statistische Maßzahlen und können dieses Wissen auf ihr Berufsfeld anwenden. Dadurch sind sie in der Lage, komplexe naturwissenschaftliche und technische Fragestellungen aus den Forschungsfeldern der Agrarwissenschaften eigenständig und fundiert mit statistischen Methoden zu bearbeiten, was sie für anspruchsvolle Aufgaben in der agrarwissenschaftlichen Forschung und Praxis qualifiziert.

Literatur

  • Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
  • Teile des Skripts als Video unter https://www.youtube.com/c/JochenKruppa
  • Dormann, Carsten F. Parametrische Statistik. Springer Berlin Heidelberg, 2013.
  • Wickham, Hadley, and Garrett Grolemund. R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc., 2016. [https://r4ds.had.co.nz/]
  • Data Science for Agriculture in R unter https://schmidtpaul.github.io/DSFAIR/
  • Bruce, Peter, Andrew Bruce, und Peter Gedeck. 2020. Practical statistics for data scientists: 50+ essential concepts using R and Python. O’Reilly Media.

Empfohlene Vorkenntnisse

Für dieses Modul werden vertiefte Kenntnisse der deskriptiven Statistik sowie Grundkenntnisse der Statistik vorausgesetzt, wie sie in den Modulen “Mathematik und Statistik (44B0266)” und “Angewandte Statistik und Versuchswesen (44B0400)” vermittelt werden. Zudem werden Grundregeln und -methoden des wissenschaftlichen Arbeitens aus dem Modul “Wissenschaftliches Arbeiten (44M0159)” als bekannt vorausgesetzt.

Studierenden, die ihre Kenntnisse und Fertigkeiten vor Beginn des Moduls auffrischen möchten, wird folgende Grundlagenliteratur mit dem “Skript Bio Data Science” unter https://jkruppa.github.io/ empfohlen.

In dem Modul wird mit der Software R gearbeitet. Um sich im Vorfeld mit den Basisfunktionen vertraut zu machen, eignen sich beispielsweise die folgenden Video-Tutorials unter https://www.youtube.com/c/JochenKruppa.

Zusammenhang mit anderen Modulen

Das Modul “Biostatistik” bereitet zudem auf weiterführende Module aus verschiedenen Themenbereichen vor. Zu diesen Themenbereichen gehören insbesondere

Welche nachfolgenden Module konkret in Frage kommen, hängt von den einzelnen Studiengängen ab. Nähere Informationen hierzu bietet der Studienverlaufsplan in der jeweils gültigen Studienordnung.

Voraussetzungen für die Vergabe von ECTS-Leistungspunkten

Benotete Prüfungsleistung

Klausur