Wide-Format und Lang-Format



Das Wide-Format und das Lang Format (manchmal Auch ungestapelt und gestapelt genannt) Sind Begriffe, sterben used Werden, um Zwei verschiedene Darstellung von Tabelle Daten zu beschreiben.

Die bekannteste Darstellungsmethode von beiden ist das Wide Format in derselben Spalte wie der Variable Representative. Messwiederholungen ermöglichen pro Zeitpunkt eine eigene Spalte. Diese intuitive Darstellungsweise ermöglicht eine übersichtliche Darstellung, wird jedoch nie von allen statistischen Verfahren unterstützt.

Im Long-Format sind die gemeinsamen Werte der messwiederholten Variablen in einer bestimmten Spalte dargestellt. Daher wurden Daten im Long-Format auch als „stacked“ bezeichnet. Diejenigen der Messwerten Hearing Zeitpunkte wurden in Separate Separation Spalt vermerkt. Im Fall einer nicht messwiederholten Variable enthält der Spalt den Stand des Kontextes der Werte.

Im Allgemeinen gibt es ein Breitbildformat sowie Das Lang-Format, das mehr ist als Segeln. Ein Beispiel für die Transformation des Wide-Format im Lang-Format wird im folgenden Abschnitt ausgeführt.

Beispiel

Ein Ernährungswissenschaftler prüft eine neue Diätmethode. Hierfur 10 übergewichtige Personen, 5 Frauen und 5 Männer, eine Studie teil. Die Probandinnen Werden unmittelbar vor Beginn (Gewicht.1) und nach Ende (Gewicht.2), wo Diät Gewogs von Bhutan, um Eine Gewichtsreduktion Durch Die Diät feststellen zu can. Das ist ein Problem, bei dem das Gewicht zunimmt, um den langfristigen Erfolg der Diät zu überprüfen. Das Gewicht Erscheint als messwiederholte Variable in mehreren Schlitze im Gegensatz zum Geschlecht, Welches bei Jedem Probanden nur einmal gemessen Wird.

# R-Programm-Kodex zur Erstellung Dezember Datensatz im Wide-Format und Export zu Latex:
Bibliothek ( XTABLE )
set.seed ( 42 )
datensatz.wide = data.frame ( Probandennummer = 1 : 10 , Geschlecht = c ( rep ( " w " 5 ), Seil ( " m " , 5 )) ,
Gewicht.1 = rnorm ( 10 , 150 , 10 ) , Gewicht.2 = rnorm ( 10 , 140 , 10 ) , Gewicht.3 = rnorm ( 10 , 135 , 10 ))
anzeigen ( datensatz.wide )
XTABLE ( datensatz.wide , caption = "Wide Format" , Ziffern = 1 , align = c ( "c |" , "c" , "c" , "c" , "c" , "c"))
Wide-Format
Probandennummer Geschlecht Gewicht.1 Gewicht.2 Gewicht.3
1 1 w 163,7 153,0 131,9
2 2 w 144,4 162,9 117,2
3 3 w 153,6 126,1 133,3
4 4 w 156,3 137,2 147,1
5 5 w 154,0 138,7 154,0
6 6 m 148,9 146,4 130,7
7 7 m 165,1 137,2 132,4
8 8 m 149,1 113,4 117,4
9 9 m 170,2 115,6 139,6
10 10 m 149,4 153,2 128,6

So anschaulich das Wide-Format Auch ist, MANCHE Statistischen Elle Verfahren Wie zB sterben Varianzanalyse mit Messwiederholung Profilierung mittels der Funktion ezANOVAaus dem R-Paket ez [1] Benot Eine Darstellung im Langformat. Im Wide-Format Wird für jeden zeitpunkt, zu ihnen das Gewicht der Familie gemessen Wird, Eine eigene Lücke im Datensatz angelegt. Dagegen Wird im Langformat Sämtlichen Messwerte Dezember Gewicht für Die drei Zeitpunkt in Einem Einzigen Lücke untergebracht. Die Information über den Zeitpunkt nicht zu verlieren wird, wird einer neuen Variable entsprechen.

Lang Format
Probandennummer Geschlecht zeitpunkt gewicht
1.1 1 w 1 163,7
2.1 2 w 1 144,4
3.1 3 w 1 153,6
4.1 4 w 1 156,3
5.1 5 w 1 154,0
6.1 6 m 1 148,9
7.1 7 m 1 165,1
8.1 8 m 1 149,1
9.1 9 m 1 170,2
10.1 10 m 1 149,4
1.2 1 w 2 153,0
2.2 2 w 2 162,9
3.2 3 w 2 126,1
4.2 4 w 2 137,2
5.2 5 w 2 138,7
6.2 6 m 2 146,4
7.2 7 m 2 137,2
8.2 8 m 2 113,4
9.2 9 m 2 115,6
10.2 10 m 2 153,2
1.3 1 w 3 131,9
2.3 2 w 3 117,2
3.3 3 w 3 133,3
4.3 4 w 3 147,1
5.3 5 w 3 154,0
6.3 6 m 3 130,7
7.3 7 m 3 132,4
8.3 8 m 3 117,4
9.3 9 m 3 139,6
10.3 10 m 3 128,6
# R Programm Code Transformation vom Weiten -ins Long-Format und Export nach Latex:
datensatz.long = umformen ( datensatz.wide , idvar = " Seriennummer " , variierend = c ( "Weight.1" , "Weight.2 " , " Weight.3 " ) ,
timevar = " Zeitpunkt " , v.names = " Gewicht " , sep = ". " , Direction = " long " )
View ( datasatz.lang )
xtable( datensatz.long , caption = "Lang-Format" , Ziffern = 1 , align = c ( "c |" , "c" , "c" , "c" , "c" ))

Die Transformation vom Weit-in Langformat – Scanner in R unter Anderem with the umformt-befehl bewerkstelligt Werden. Ihr Worst Argument of Function ist der Umstrukturierungs-Datensatz, in diesem Fall datensatz.wideidvarist die Variable, die am Ende die Probanden beweist, in diesem Fall mit der Nummer 1a 10. varyingGib die messwandlerhole Variable Gewichtinklusive der Bezeichnung für den Zeitpunkt an. Es gibt einen Punkt, an dem die Variablen sichtbar sind und der Punkt gezeichnet wird, so dass es nur Variablen im Wide Format als Vektor gibt c("Gewicht.1","Gewicht.2","Gewicht.3"). Weil in diesem Fall ein Punkt zur Trennung verwickelt wurde, wird das im Argument sep = "."notiert. Wer sich Gewicht1 entscheidet, Zeichen für die Trennung zu verwenden, wird sich für einen Mann entscheidensep = ""schreiben. Die messwiederholte Variablenbezeichnung ohne Messzeitpunkt wird v.namesbeigefügt. Im Long-Format wird eine Variable erstellt, was endzeitlich ist, zu welchem ​​Zeitpunkt die messwiederholte Variablen geändert wurde. Eine Variablenbezeichnung hierfür können untergeben werden timevar. Closed wird mit directionder Transformation in einem Long-Format.

Einzelstunden

  1. Hochspringen↑ Michael A. Lawrence: ez: Einfache Analyse und Visualisierung von faktoriellen Experimenten. 2. November 2016; Abgerufen am 16. Dezember 2016 .