Histogramm in R erstellen und formatieren - Björn Walther (2024)

Histogramm in R erstellen und formatieren - Björn Walther (1)

Mit einem Histogramm werden die Häufigkeiten eines Merkmals in einer Grafik, genauer gesagt Säulen abgetragen. Je höher die Säulen, desto mehr Häufigkeiten wurden für die Ausprägung gezählt.
Histogramm in R erstellen und formatieren - Björn Walther (2)

Inhaltsverzeichnis

Vorbemerkungen

Zunächst müsst ihr eure Daten in R einlesen. Wahlweise löst ihr sie mit dem attach()-Befehl aus dem Data Frame heraus. In diesem Artikel zeige ich die Variante mit Zugriff auf den Data Frame. Aufgrund dessen steht vor den jeweiligen Variablen stets mein Data Frame, der “df” heißt, sowie das Dollarzeichen ($) zur Verknüpfung.

Zum Installieren von R bzw. RStudio empfehle ich diesen Artikel. Für augenfreundliches Arbeiten empfehle ich euch diesen Artikel sehr.

1 Histogramm in R mit hist()

1.1 Säulen einfügen

Der hist()-Befehl ist der Ausgangspunkt der Grafikerstellung. Die abzutragende Variable ist direkt einzugeben. In meinem Fall die Variable Gewicht aus dem Data Frame “df”.

hist(df$Gewicht)

Histogramm in R erstellen und formatieren - Björn Walther (3)

R entscheidet auf Basis der Verteilung, wo auf der x-Achse Anfang und Ende gesetzt werden. Gleichzeitig werden die Abstände von R automatisch gesetzt. Die Abstände meinen die Säulenbreiten, also in welchem Bereich die Häufigkeiten gezählt werden.

1.2 Achsen beschriften und Titel vergeben

Da die Beschriftungen an den Achsen noch unangepasst sind, ist hier Abhilfe nötig. Dazu dienen die Befehle “xlab=” und “ylab=“. In Anführungszeichen können beliebige Wörter eingegeben werden. Sinnvollerweise kommt an die y-Achse die Beschriftung “Häufigkeit” und an die x-Achse der Variablenname “Gewicht”.

Zusätzlich kann ich mit “main=” noch einen Titel vergeben. Allerdings ist das nicht zwingend notwendig, da in Texten meist mit Abbildungsbeschriftungen unter- oder oberhalb der Abbildung gearbeitet wird.

hist(df$Gewicht, xlab="Gewicht", ylab="Häufigkeit" main="TITEL")

Histogramm in R erstellen und formatieren - Björn Walther (4)

1.3 Säulen einfärben

Um die Säulen vom Standardgrau zu befreien und eine andere Farbe festzulegen, kann das Argument “col=” verwendet werden. Zu den zur Verfügung stehenden Farben in R gibt es hier noch mal einen ausführlichen Artikel: Farben in R, der „col“-Befehl.

hist(df$Gewicht, xlab="Gewicht", ylab="Häufigkeit", main="TITEL", col="steelblue")

Histogramm in R erstellen und formatieren - Björn Walther (5)

1.4 Häufigkeiten als Beschriftung einfügen

Um auf einen Blick ablesen zu können, welches Merkmal wie häufig vorkommt, können Häufigkeiten eingefügt werden. Die Häufigkeiten einzufügen hört sich trivialer an, als es das zunächst ist.
Als Erstes muss hierzu das Diagramm in einen Vektor (hier “h”) abgelegt werden, weil darin die Informationen für die Beschriftungsposition sowie die Häufigkeiten hinterlegt werden.

h <- hist(df$Gewicht, xlab="Gewicht", ylab="Häufigkeit", main="TITEL", col="steelblue")

Als Zweites werden mit dem text()-Befehl die Häufigkeiten an entsprechende Positionen gesetzt. Dabei wird Bezug auf den Vektor h und dessen Inhalt genommen.

  • h$mids ist die Mitte der jeweiligen Säule
  • h$counts sind die Häufigkeiten der jeweiligen Säule
  • labels = h$counts beschriftet die Säulen mit den jeweiligen Häufigkeiten
  • adj=c() verrückt die Beschriftung etwas. Die erste Ziffer setzt die Beschriftung mittig in x-Richtung, die zweite Ziffer setzt die Beschriftung in y-Richtung leicht nach oben ab.
text(h$mids, h$counts, labels = h$counts, adj=c(0.5, -0.5))

Die beiden Befehle werden nacheinander ausgeführt. text() plottet die Häufigkeiten über das Histogramm. Sollten Änderungen in text() vorgenommen werden, ist das Histogramm vorher erneut zu plotten.
Histogramm in R erstellen und formatieren - Björn Walther (6)

Sollten die Häufigkeiten nach oben abgeschnitten sein, hilft es die Höhe der y-Achse mit dem Befehl ylim zu erhöhen, z.B. wird mit folgendem Befehl die y-Achse bis auf 25 erweitert:hist(df$Gewicht, ylim=c(0,25))


2 Achsen, Achsenbeschriftung und Titel formatieren

  • Die Größe der Achsenbeschriftung kann ebenfalls angepasst werden. Es kann durchaus sinnvoll sein, die Achsen bzw. deren Beschriftung etwas zu vergrößern oder zu verkleinern. Mit dem Argument cex.axis werden die Achsenwerte in ihrer Größe verändert.
  • Das Argument cex.lab sorgt für eine andere Größe der Merkmalsbeschriftung, also der y-Achse,
  • cex.main für den Titel. In meinem Falle vergrößere ich die Achsenwerte und die Achsenbeschriftung des Streudiagramms etwas mit jeweils 1.5. Der Standardwert ist 1. Ihr könnt auch mit 0.5 eine Verkleinerung erzielen.
  • Das Argument “las” ermöglicht euch das Drehen der Werte auf den Achsen. 0 ist hier der Standard, 1 zeigt beide Beschriftungen parallel zur x-Achse. Mit “las=2” drehe ich nur die Beschriftung der x-Achse um 90° nach links und mit “las=3” drehe ich beide Beschriftungen um 90° nach links.

Der Code sieht wie folgt aus.

h <- hist(df$Gewicht, xlab="Gewicht", ylab="Häufigkeit", main="TITEL", col="steelblue", ylim=c(0,25), cex.axis=1.5, cex.lab=1.5, cex.main=1.5, las=2)

Histogramm in R erstellen und formatieren - Björn Walther (7)

3 Anzahl Säulen anpassen

Es kann wünschenswert sein, nicht R die Kontrolle zu überlassen, wenn es um die Festlegung der Anzahl der Säulen bzw. der Säulenbreiten geht. Hierzu dient das breaks-Argument. Mit der Anzahl der Breaks werden die Anzahl der Säulen+1 festgelegt. Bei breaks = 3 werden demnach 4 Säulen erstellt.

h <- hist(df$Gewicht, xlab="Gewicht", ylab="Häufigkeit", main="TITEL", col="steelblue", ylim=c(0,25), breaks=3)

Histogramm in R erstellen und formatieren - Björn Walther (8)

Alternativ kann man mit breaks=c(50, 70, 90, 110) auch definieren, wo die jeweiligen Säulen beginnen und enden sollen.

h <- hist(df$Gewicht, xlab="Gewicht", ylab="Häufigkeit", main="TITEL", col="steelblue", ylim=c(0,25), breaks=c(50, 70, 90, 110))

Histogramm in R erstellen und formatieren - Björn Walther (9)

4 Zusatz: Farbe der Achsen und Achsenbeschriftungen ändern

Mit dem Argument “col” könnt ihr euren Säulen zusätzlich einen farbigen Anstrich geben. col.axis ist für die Achsen, col.lab für die Achsenbeschriftung und col.main für den Titel des Streudiagramms. Mit Farbe würde ich allerdings sparsam umgehen. Schwarze oder in Graustufen gehaltene Diagramme sind am unverfänglichsten. Dennoch, gibt es die Möglichkeit Diagrammbestandteile neben den Säulen einzufärbenZu den Farben in R gibt es hier noch mal einen ausführlichen Artikel: Farben in R, der „col“-Befehl.
col.axis färbt die Werte auf den Achsen ein, col.main färbt den Titel ein sowie col.lab die Achsenbeschriftungen.

h <- hist(df$Gewicht, xlab="Gewicht", ylab="Häufigkeit", main="TITEL", col="steelblue", ylim=c(0,25), cex.axis=1.5, cex.lab=1.5, cex.main=1.5, las=2, col.axis="darkblue", col.main="darkblue", col.lab="darkred")

Histogramm in R erstellen und formatieren - Björn Walther (10)

5 Videotutorial zum Erstellen eines einfachen Histogramms in R


Histogramm in R erstellen und formatieren - Björn Walther (2024)
Top Articles
Bernie Taupin Recalls the Start of His Partnership with Elton John: 'We Were All Each Other Had'
'Rocketman' Only Tells the Beginning of Bernie Taupin's Massive Contributions to Music
monroe, LA housing - craigslist
Non-Identity Functions
Start EN - Casimir Pulaski Foundation
Who is on the FBI Most Wanted list cryptocurrency?
Black Adam Movies123
Leon Vs Chisec Figs
Dd Codeshare
For My Derelict Favorite Novel Online
AT&T Mission | Cell Phones, Wireless Plans & Accessories | 2409 E Interstate Highway 2, Mission, TX | AT&T Store
Job Skills That Start With Y
Does Publix Pharmacy Accept Sunshine Health
Sauce 423405
Teenbeautyfitness
Employment Vacancies - Find Jobs with our recruitment team
Rub Rating Louisville
ACCESS Arts Live --- Online Performing Arts for All on LinkedIn: Leeds International Piano Competition 2024 | Second Round | 12 September…
Nissan Rogue Tire Size
Aluminum Model Toys
The Blind Showtimes Near Showcase Cinemas Springdale
SEBO (UK) Ltd on LinkedIn: #sebouk #commercialcleaning #cleaning #floorcleaning #carpetcleaning
6 Fun Things to Do in Bodega Bay - Sonoma County Tourism
Zen Leaf New Kensington Menu
Morgan Plus Four 2024 review
Perry County Mugshots Busted
Greet In Cheshire Crossword Clue
Aunt Nettes Menu
Dom's Westgate Pizza Photos
Wmu Academic Calendar 2022
9132976760
Ufc 281 Tapology
Killing Self Gif
No hard feelings: cómo decir "no" en inglés educadamente y sin herir sensibilidades
Should Jenn Tran Join 'Bachelor in Paradise'? Alum Mari Pepin Weighs In
Road Conditions Riverton Wy
Walmart Car Service Near Me
Computer Repair Tryon North Carolina
Rimworld Prison Break
Craigslist Hart Mi
Brian Lizer Life Below Zero Next Generation
Rise Meadville Reviews
Closest Dollar Tree Store To My Location
Pressconnects Obituaries Recent
Dicks: The Musical Showtimes Near Regal Galleria Mall
Cvs Pharmacy Tb Test
Wiki Jfk Film
Broadcastify Thurston County
Apartments for rent in Rotterdam
Do Diversity Visa Lottery Winners Need Affidavit Of Support With Green Card Application Is Affidavit
Senna Build Guides :: League of Legends Strategy Builds, Runes, Items, and Abilities :: Patch 14.18
Transportationco.logisticare
Latest Posts
Article information

Author: Greg Kuvalis

Last Updated:

Views: 5719

Rating: 4.4 / 5 (55 voted)

Reviews: 86% of readers found this page helpful

Author information

Name: Greg Kuvalis

Birthday: 1996-12-20

Address: 53157 Trantow Inlet, Townemouth, FL 92564-0267

Phone: +68218650356656

Job: IT Representative

Hobby: Knitting, Amateur radio, Skiing, Running, Mountain biking, Slacklining, Electronics

Introduction: My name is Greg Kuvalis, I am a witty, spotless, beautiful, charming, delightful, thankful, beautiful person who loves writing and wants to share my knowledge and understanding with you.