Prime funzioni per la statistica con R

Esistono molte funzioni e molti pacchetti specifici per la statistica con R. Vediamo un elenco delle funzioni di base per affrontare la statistica con R.

Comando Spiegazione
+ – / * operazioni standard
mean() media
median() mediana
quantile() quantili
sqrt() radice quadrata
pi() pi greco
x^y elevazione a potenza
log(x, base = n) logaritmi
sin() seno
cos() coseno
tan() tangente
min() valore minimo
max() valore massimo
median() mediana
cor() correlazione tra due vettori
cumsum() somma cumulata
cumprod() prodotto cumulato
colMeans() media di colonna
rowMeans() media di riga
colSums() somma dei dati di una colonna
rowSums() somma dei dati di una riga

Abbiamo già visto molte di queste funzioni quando abbiamo parlato dell’analisi esplorativa di base con R. Come abbiamo già visto, queste funzioni si aggiungono a quelle più generiche per scoprire le prime informazioni sulla struttura e le dimensioni del nostro dataset, come dim(), str() e summary(). Tra le funzioni di base per la statistica con R sono molto importanti anche quelle per la creazione di grafici semplici, che sono:

  • plot()
  • hist()
  • barplot()

Vediamo un esempio sul dataset trees, che è incluso in R e che contiene dei dati relativi a un gruppo di alberi, divise su tre variabili. Come sempre, per selezionare una sola variabile di un dataset, utilizziamo la struttura:

nome_dataset$nome_variabile


plot(trees$Girth)

 

 

 

 

 

 

Per creare un istogramma usiamo la funzione hist():


hist(trees$Volume)

 

 

 

 

 

 

Mentre infine per creare un barplot utilizziamo la funzione barplot():


barplot(trees$Volume)

 

 

 

 

 

 

 

Infine, la funzione table() può esserci utile per sintetizzare una variabile, visualizzando la frequenza degli elementi che la compongono. Creiamo ad esempio un oggetto:

 


frutta <- c("mele", "pere", "avocado", "kiwi", "banane", "fragole", "nespole", "mele", "mele", "mele", "pere", "pere", "pere", "pere", "kiwi",  "mele", "fragole", "banane", "banane" )



# creiamo adesso una tabella con la funzione table()

table(frutta)

frutta

avocado  banane fragole    kiwi    mele nespole    pere

1       3       2       2       5       1       5



 

In questo post abbiamo imparato alcune delle funzioni di base per la statistica in R. Puoi proseguire con una lezione sull’analisi esplorativa, oppure imparare a costruire una funzione , oppure imparare come importare dei dati su R. Se questi post non ti bastano e cerchi qualcosa di più approfondito, puoi dare un’occhiata anche al corso base di R.

 

By | 2017-03-27T14:02:35+00:00 febbraio 22nd, 2017|Data Science, R|0 Comments

Leave A Comment