5  Von Flöhen auf Tieren

Letzte Änderung am 02. April 2024 um 09:52:43

“I am fond of pigs. Dogs look up to us. Cats look down on us. Pigs treat us as equals.” — Winston S. Churchill

Die ursprüngliche Idee zu den Sprungweiten der Hunde- und Katzenflöhe stammt von Cadiergues u. a. (2000) aus der entsprechenden Veröffentlichung A comparison of jump performances of the dog flea, Ctenocephalides canis (Curtis, 1826) and the cat flea, Ctenocephalides felis felis (Bouché, 1835). Wir bauen uns hier kleinere Datensätze mit einer ähnlichen Fragestellung nach, die wir dann in den folgenden Kapiteln immer wieder nutzen. Dabei begleiten uns die Hunde- und Katzenflöhe eher in den Einführungskapiteln. Später schauen wir uns dann noch komplexere Datensätze mit einem klaren Anwendungsbezug an.

5.1 Von Flöhen und Hunden

In unserem ersten Beispiel wollen wir uns verschiedene Daten von Hunden und Hundeflöhen anschauen. Unter anderem sind dies die Sprungweite, die Anzahl an Flöhen, die Boniturnoten auf einer Hundemesse sowie der Infektionsstatus. Hier nochmal detailliert, was wir uns im Folgenden immer wieder anschauen wollen. Ich habe dann zu der mathematischen Schreibweise noch die Schreibweise in R mit einem Objekt ergänzt.

Sprungweite in [cm] von verschiedenen Flöhen:

\[ Y_{jump} = \{5.7, 8.9, 11.8, 5.6, 9.1, 8.2, 7.6\}. \]

y_jump_dog <- c(5.7, 8.9, 11.8, 5.6, 9.1, 8.2, 7.6)
y_jump_dog
[1]  5.7  8.9 11.8  5.6  9.1  8.2  7.6

Anzahl an Flöhen auf verschiedenen Hunden:

\[ Y_{count} = \{18, 22, 17, 12, 23, 18, 21\}. \]

y_count_dog <- c(18, 22, 17, 12, 23, 18, 21)
y_count_dog
[1] 18 22 17 12 23 18 21

Gewicht des gesprungenen Flohes in [mg] auf verschiedenen Hunden:

\[ Y_{weight} = \{2.1, 2.3, 2.8, 2.4, 1.2, 4.1, 3.2\}. \]

y_weight_dog <- c(2.1, 2.3, 2.8, 2.4, 1.2, 4.1, 3.2)
y_weight_dog
[1] 2.1 2.3 2.8 2.4 1.2 4.1 3.2

Boniturnoten [1 = schwächste bis 9 = stärkste Ausprägung] von verschiedenen Hunden:

\[ Y_{grade} = \{8, 8, 6, 8, 7, 7, 9\}. \]

y_grade_dog <- c(8, 8, 6, 8, 7, 7, 9)
y_grade_dog
[1] 8 8 6 8 7 7 9

Infektionstatus [0 = gesund, 1 = infiziert] mit Flöhen von verschiedenen Hunden:

\[ Y_{infected} = \{0, 1, 1, 0, 1, 0, 0\}. \]

y_infected_dog <- c(0, 1, 1, 0, 1, 0, 0)
y_infected_dog
[1] 0 1 1 0 1 0 0

Je nachdem was wir messen, nimmt \(Y\) andere Zahlenräume an. Wir sagen, \(Y\) folgt einer Verteilung. Die Sprungweite ist normalverteilt, die Anzahl an Flöhen folgt einer Poisson Verteilung, die Boniturnoten sind multinominal/ordinal bzw. kategoriell verteilt. Der Infektionsstatus ist binomial verteilt. Wir werden uns später die Verteilungen anschauen und visualisieren. Das können wir hier aber noch nicht. Wichtig ist, dass du schon mal gehört hast, dass \(Y\) unterschiedlich verteilt ist, je nachdem welche Dinge wir messen. Die Tabelle 5.1 zeigt dir die Darstellung der Daten von oben in einer einzigen Tabelle. Bitte beachte, dass genau eine Zeile für eine Beobachtung, in diesem Fall einem Hund, vorgesehen ist.

Tabelle 5.1— Tabelle der Sprunglängen [cm], Anzahl an Flöhen, Gewicht der Flöhe, Boniturnote sowie der Infektionsstatus für Hundeflöhe. Die Tabelle ist im Long-Format dargestellt.
animal jump_length flea_count weight grade infected
dog 5.7 18 2.1 8 0
dog 8.9 22 2.3 8 1
dog 11.8 17 2.8 6 1
dog 5.6 12 2.4 8 0
dog 9.1 23 1.2 7 1
dog 8.2 18 4.1 7 0
dog 7.6 21 3.2 9 0
Datei für von Flöhen und Hunden

Du findest die Datei flea_dog.xlsx auf GitHub jkruppa.github.io/data/ als Excel oder auch als CSV.

5.2 Von Flöhen, Hunden und Katzen

Wir wollen jetzt das Beispiel von den Hunden und Flöhen um eine Spezies erweitern. Wir nehmen noch die Katzen mit dazu und fragen uns, wie sieht es mit der Sprungfähigkeit von Katzen und Hundeflöhen aus? Konzentrieren wir uns hier einmal auf die Sprungweite. Wir können wie in dem vorherigen Beispiel mit den Hundeflöhen die Sprungweiten [cm] der Katzenflöhe wieder in der gleichen Weise aufschreiben:

\[ Y_{jump} = \{3.2, 2.2, 5.4, 4.1, 4.3, 7.9, 6.1\}. \]

Wenn wir jetzt die Sprungweiten der Hundeflöhe mit den Katzenflöhen vergleichen wollen haben wir ein Problem. Beide Zahlenvektoren heißen gleich, nämlich \(Y_{jump}\). Wir könnten jeweils in die Indizes noch \(dog\) und \(cat\) schreiben als \(Y_{jump,\, dog}\) und \(Y_{jump,\, cat}\) und erhalten folgende Vektoren.

\[ \begin{align} Y_{jump,\, dog} &= \{5.7, 8.9, 11.8, 5.6, 9.1, 8.2, 7.6\}\\ Y_{jump,\, cat} &= \{3.2, 2.2, 5.4, 4.1, 4.3, 7.9, 6.1\} \end{align} \]

Dadurch werden die Indizes immer länger und unübersichtlicher. Auch das \(Y\) einfach \(Y_{dog}\) oder \(Y_{cat}\) zu nennen ist keine Lösung - wir wollen uns vielleicht später nicht nur die Sprungweite vergleichen, sondern vielleicht auch die Anzahl an Flöhen oder den Infektionsstatus. Dann stünden wir wieder vor dem Problem die \(Y\) für die verschiedenen Outcomes zu unterscheiden. Daher erstellen wir uns die Tabelle 5.2. Wir haben jetzt eine Datentabelle.

Tabelle 5.2— Sprunglängen [cm] für Hunde- und Katzenflöhe. Die Tabelle ist im Wide-Format dargestellt.
dog cat
5.7 3.2
8.9 2.2
11.8 5.4
5.6 4.1
9.1 4.3
8.2 7.9
7.6 6.1

Intuitiv ist die obige Tabelle 5.2 übersichtlich und beinhaltet die Informationen die wir wollten. Dennoch haben wir das Problem, das wir in dieser Tabelle 5.2 nicht noch weitere Outcomes angeben können. Wir könnten die Anzahl an Flöhen auf den Hunde und Katzen nicht einfach so in dieser Form darstellen. Als Lösung ändern wir die Tabelle 5.2 in das Long-Format und erhalten die folgende Tabelle 5.3. Jede Beobachtung belegt nun eine Zeile. Dies ist sehr wichtig im Kopf zu behalten, wenn du eigene Daten in z.B. Excel erstellt.

Tabelle 5.3— Tabelle der Sprunglängen [cm], Anzahl an Flöhen, Gewicht der Flöhe, Boniturnote sowie der Infektionsstatus von Hunde- und Katzenflöhe. Die Tabelle ist im Long-Format dargestellt.
animal jump_length flea_count weight grade infected
dog 5.7 18 2.1 8 0
dog 8.9 22 2.3 8 1
dog 11.8 17 2.8 6 1
dog 5.6 12 2.4 8 0
dog 9.1 23 1.2 7 1
dog 8.2 18 4.1 7 0
dog 7.6 21 3.2 9 0
cat 3.2 12 1.1 7 1
cat 2.2 13 2.1 5 0
cat 5.4 11 2.4 7 0
cat 4.1 12 2.1 6 0
cat 4.3 16 1.5 6 1
cat 7.9 9 3.7 6 0
cat 6.1 7 2.9 5 0
Datei für von Flöhen, Hunden und Katzen

Du findest die Datei flea_dog_cat.xlsx auf GitHub jkruppa.github.io/data/ als Excel oder auch als CSV.

5.3 Von Flöhen auf Hunde, Katzen und Füchsen

Wir wollen jetzt das Beispiel von den Hunde- und Katzenflöhen um eine weitere Spezies erweitern. Warum machen wir das? Später wollen wir uns anschauen, wie sich verschiedene Gruppen oder Behandlungen voneinander unterscheiden. Wir brauchen also mehr Spezies. Wir nehmen noch die Füchse mit dazu und fragen uns, wie sieht es mit der Sprungfähigkeit von Hunde-, Katzen- und Fuchsflöhen aus?

Tabelle 5.4— Tabelle der Sprunglängen [cm], Anzahl an Flöhen, Gewicht der Flöhe, Boniturnote sowie der Infektionsstatus von Hunde-, Katzen- und Fuchsflöhe.
animal jump_length flea_count weight grade infected
dog 5.7 18 2.1 8 0
dog 8.9 22 2.3 8 1
dog 11.8 17 2.8 6 1
dog 5.6 12 2.4 8 0
dog 9.1 23 1.2 7 1
dog 8.2 18 4.1 7 0
dog 7.6 21 3.2 9 0
cat 3.2 12 1.1 7 1
cat 2.2 13 2.1 5 0
cat 5.4 11 2.4 7 0
cat 4.1 12 2.1 6 0
cat 4.3 16 1.5 6 1
cat 7.9 9 3.7 6 0
cat 6.1 7 2.9 5 0
fox 7.7 21 3.1 5 1
fox 8.1 25 4.2 4 1
fox 9.1 31 5.1 4 1
fox 9.7 12 3.5 5 1
fox 10.6 28 3.2 4 0
fox 8.6 18 4.6 4 1
fox 10.3 19 3.7 3 0

Der Datensatz in Tabelle 5.4 beginnt schon recht groß zu werden. Deshalb brauchen wir auch die Statistiksoftware R als Werkzeug um große Datensätze auswerten zu können.

Datei für von Flöhen auf Tieren

Du findest die Datei flea_dog_cat_fox.xlsx auf GitHub jkruppa.github.io/data/ als Excel oder auch als CSV.

5.4 Von Flöhen auf Tieren in Habitaten

Wir schauen uns in diesem Beispiel wiederum drei Tierarten an: Hunde, Katzen und Füchse. Auf diesen Tierarten messen wir die Sprunglänge von jeweils zehn Tieren. Im Vergleich zu dem vorherigen Beispiel erweitern wir die Daten um eine Spalte site in der wir vier verschiedene Messorte protokollieren. Es ergibt sich folgende Tabelle 5.5 und die dazugehörige Abbildung 5.1.

Tabelle 5.5— Sprunglängen [cm] für Hunde-, Katzen- und Fuchsflöhe in verschiedenen Habitaten.
animal site rep jump_length
cat city 1 12.04
cat city 2 11.98
cat city 3 16.1
cat city 4 13.42
cat city 5 12.37
cat city 6 16.36
fox field 5 16.38
fox field 6 14.59
fox field 7 14.03
fox field 8 13.63
fox field 9 14.09
fox field 10 15.52

Die Datentabelle ist in dieser Form schon fast nicht mehr überschaubar. Daher hilft hier die explorative Datenanalyse weiter. Wir schauen uns daher die Daten einmal als einen Boxplot in Abbildung 5.1 an. Wir sehen hier, dass wir drei Tierarten an vier Orten die Sprungweite in [cm] gemessen haben.

Abbildung 5.1— Boxplot der Sprungweiten [cm] für Hunde-, Katzen- und Fuchsflöhe in verschiedenen Habitaten.
Datei für von Flöhen auf Tieren in Habitaten

Du findest die Datei flea_dog_cat_fox_site.xlsx auf GitHub jkruppa.github.io/data/ als Excel oder auch als CSV.

5.5 Von vielen Flöhen auf Hunden und Katzen

Wir schauen uns in diesem Beispiel wiederum nur zwei Tierarten an: Hunde und Katzen. Auf diesen Tierarten messen wir wieder die Sprunglänge in [cm] von jeweils 400 Tieren. Im Vergleich zu dem vorherigen Beispiel erweitern wir die Daten um eine Spalte jump_weight in [mg] sowie sex [male, female]. Bei Versuch wurde noch in der Variable hatch_time gemessen, wie lange die Flöhe in Stunden zum Schlümpfen brauchen. Es ergibt sich folgende Tabelle 5.6 mit den ersten zehn Beobachtungen und die dazugehörige Abbildung 5.2.

Tabelle 5.6— Sprunglängen [cm], Gewichte [mg], Geschecht [sex] und Schlüpfzeit [h] für Hunde- und Katzenflöhe.
animal sex weight jump_length flea_count hatch_time
cat male 6.02 15.79 5 483.60
cat male 5.99 18.33 1 82.56
cat male 8.05 17.58 1 296.73
cat male 6.71 14.09 3 140.90
cat male 6.19 18.22 1 162.20
cat male 8.18 13.49 1 167.47
cat male 7.46 16.28 1 291.20
cat male 5.58 14.54 0 112.58
cat male 6.19 16.36 1 143.97
cat male 7.53 15.08 1 766.31

Die Datentabelle ist in dieser Form schon fast nicht mehr überschaubar. Daher hilft hier die explorative Datenanalyse weiter. Wir schauen uns daher die Daten einmal als einen Scatterplot in Abbildung 5.2 an. Wir sehen hier, dass wir das mit dem Gewicht [mg] der Flöhe auch die Sprungweite in [cm] steigt.

Abbildung 5.2— Scatterplot der Sprunglängen [cm] und Gewichte [mg] für Hunde- und Katzenflöhe.
Datei für von vielen Flöhen auf Hunden und Katzen

Du findest die Datei flea_dog_cat_length_weight.xlsx auf GitHub jkruppa.github.io/data/ als Excel oder auch als CSV.

Referenzen

Cadiergues M-C, Joubert C, Franc M. 2000. A comparison of jump performances of the dog flea, Ctenocephalides canis (Curtis, 1826) and the cat flea, Ctenocephalides felis felis (Bouché, 1835). Veterinary parasitology 92: 239–241.