Opleiding: 5 daagse cursus R: Statistical Programming with R
De cursus programmeren in R vormt een eerste inleiding in de zeer populaire statistische software pakketten R en RStudio. Na deze cursus kan de cursist zelfstandig een aantal statistische analyses uitvoeren, resultaten beoordelen en visualiseren, en rapporteren met R en RStudio. R is op dit moment één van de meest geavanceerde en flexibele statistische programma’s en is bovendien open source (gratis).
Inhoud
Tridata hecht er aan om cursisten tijdens de cursussen hands-on ervaring op te laten doen. Dus op basis van gedegen theorie meteen toepassen in de praktijk. Elke dag bestaat daarom voor ongeveer de helft uit oefeningen onder begeleiding van onze ervaren docenten. De cursist heeft de mogelijkheid om slechts 3 dagen te volgen.
### Inhoud van de cursus
De focus ligt op de Tidyverse packages voor een moderne workflow.
## Module 1: De Basis (Dag 1 t/m 3)
Dag 1: Introductie & Data Transformaties
Basis R & RStudio: objecten, vectoren en kolomtypen.
Bewerkingen op tabellen: filteren, selecteren, aggregeren en 'piping' (ketenen van opdrachten).
Inleiding in `ggplot2` voor datavisualisatie.
Dag 2: Datamanagement
Werken met complexe data: datums, categoriale variabelen (factors) en tekst.
Basis Regular Expressions (Regex).
Data-import/-export en het koppelen (joining) van tabellen.
Dag 3: Datapresentaties & Datavisualisaties
Geavanceerde exploratieve data-analyse.
Visualisaties verfijnen: facetwraps, grids, kleuren en labels.
## Module 2: Modellen, analyses en rapportage
Dag 4: Modellen & Functies
Modelleren in R: Lineaire modellen en residuen – beschrijving, toepassingen en selectie van variabelen.
Logistische modellen: Schatten van kansen en binaire uitkomsten.
Dag 5: Statistiek & Geavanceerde Analyses
Statistiek in R: Kruistabellen en statistische toetsen (t-toets, chi-kwadraattoets).
Interactieve rapportages met R Markdown / Quarto: Het dynamisch genereren van rapporten in PDF, HTML of Word.
Praktische Informatie
Doelgroep
Heb je al wat ervaring met basale statistiek of programma’s zoals Excel of SPSS, maar wil je de overstap maken naar het krachtige (en gratis!) R? Dan is dit de perfecte stap voor jou!
Vereiste voorkennis
Je hoeft geen programmeur te zijn om deze cursus te volgen. Je bent in je werk al regelmatig met data bezig en hebt een basisbegrip van statistiek. Daarmee heb je precies de juiste basis om met R aan de slag te gaan.
Studiebelasting
De R cursus duurt 5 dagen (één dag per week). Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.
Lestijden
De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.
Waarom de cursus volgen bij Tridata?
- Tridata is het enige instituut wat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
- De R cursus van Tridata is een multidisciplinaire cursus die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, Tekstmining, datavisualisatie en datamanagement.
- Tridata heeft samen met de faculteit economie/econometrie van de Erasmus Universiteit, R geïntroduceerd in Nederland.
De Docenten
Dr. Mark van der Loo studeerde cum laude af in de informatische chemie aan de Katholieke Universiteit Nijmegen (een combinatie van scheikunde, wiskunde, en informatica). Na zijn promotie op een onderwerp uit de quantumfysica is hij werkzaam als statistisch onderzoeker bij het CBS met als specialiteit statistical computing and modeling, data cleaning en text processing. Over deze onderwerpen publiceert hij op conferenties en in peer reviewed journals. Mark is expert op het gebied van R, python, en (multicore) C programming en heeft verschillende R-packages op CRAN gepubliceerd. Een van die packages wordt onder andere door Wikimedia Foundation gebruikt voor tekstanalyse van Wikipedia paginas. Mark werkt sinds 2012 als consultant en docent voor Tridata.
Drs. Edwin de Jonge Studeerde af in de theoretische natuurkunde aan de Katholieke Universiteit Nijmegen. Na zich enkele jaren the hebben gespecialiseerd in softwareontwikkeling is hij als onderzoeker gaan werken bij het CBS met als specialiteit statistical computing and modeling, data management en data visualisatie. Over dit laatste onderwerp publiceerde Edwin onder andere een paper voor de prestigieuze IEEE VisWeek conferentie. Edwin is expert op het gebied van verschillende programmeertalen waaronder C++, javascript, python en R. In die laatste taal ontwikkelde hij een package wat inmiddels meer dan 120.000 maal per maand wordt gedownload van de CRAN servers. Edwin werkt sinds 2012 als consultant en docent voor Tridata.
Edwin en Mark zijn auteur van het boek 'Learning R Statistical Computing with Rstudio' (Packt publishing, 2012) en werken momenteel, aan een boek over 'Statistical Data Cleaning with Applications in R' (te verschijnen bij Wiley). In 2013 gaven zij een tutorial op de grootste R conferentie ter wereld (useR!2013) getiteld “an introduction to data cleaning with R”.