In questo corso di base per R, trattiamo le basi di questo linguaggio di programmazione, uno dei più conosciuti e utilizzati nel campo dell’analisi dati e data science. Questo non significa che una volta finito questo corso sarai in grado di analizzare grossi dataset. Se hai già delle basi di R, o sei ad un livello più avanzato, questo corso non ti serve, ti consiglio quindi di andare a vedere i miei corsi più avanzati, ad esempio su machine learning e text mining.
Questo corso R ti spiega per prima cosa come creare degli oggetti: R si basa su alcune strutture che è necessario conoscere, come vettori, matrici, liste e dataframe: in questo corso R imparerai a crearle e manipolarle.
Una volta create queste strutture dati, imparerai a manipolarle, salvarle sul computer ed estrarne degli elementi. In questo corso R ti insegnerò anche le basi di creazione di una funzione.
Nella sezione successiva del corso R imparerai una serie argomenti utili: come impostare una cartella di lavoro, come installare e richiamare un pacchetto, come ottenere delle informazioni sui dati, dove trovare dei dataset per i test, come rimuovere degli elementi duplicati, come iterare un’azione e come gestire le date.
Quando si analizzano dei dati ci si imbatte prima o poi nei dataframe cosiddetti casi x variabili. In questo corso R imparerai come si importa un dataframe dal computer, o da internet, su R. Esistono molte funzioni adatte allo scopo e molti pacchetti che ci sono utili per importare dei dati che sono in alcuni formati particolari, come ad esempio i formati per Excel oppure quelli per altri software di analisi, come SPSS.
Un altro argomento importante cha affrontiamo in questo corso R è come gestire i dati, come manipolarli, modificarli, aggregarli, ordinarli in maniera orizzontale e longitudinale. Per fare questo utilizzeremo alcuni pacchetti e funzioni specifiche, come dplyr o reshape2.
R è un linguaggio molto importante anche nell’ambito della statistica. Impareremo quindi alcune delle funzioni di base, come calcolo delle medie per riga o per colonna, e le funzioni statistiche più comuni.
Quando si parla di analisi dati, ci troveremo spesso a creare dei grafici per spiegare i nostri dati e le nostre analisi. Per questo motivo dedichiamo una sezione del corso R a vedere come creare dei grafici sia con le funzioni della libreria di base, sia con il pacchetto ggplot2.
Nelle ultime sezioni del corso R vediamo come creare e esportare dei report e delle slide, riepiloghiamo gli argomenti visti e le funzioni utilizzate, e vediamo del materiale di supporto.