Opleiding: Python en Datascience
Tijdens de cursus Python en Datascience leert u werken met de diverse packages ( NumPy, SciPy, Pandas) die voor datascience toepassingen erg nuttig zijn.
Het belang van data-analyse en data-science is enorm toegenomen en de programmeertaal Python is hierbij een van de belangrijkste hulpmiddelen geworden. Met behulp van een aantal gespecialiseerde bibliotheken, zoals NumPy, Pandas en Matplotlib, is Python uitgegroeid tot misschien wel het belangrijkste hulpmiddel voor het analyseren en visualiseren van allerlei data.
Dag 1: Dag 1 Als eerste worden de Python syntax-aspecten behandeld. Deze zijn belangrijk bij Data Science-projecten. Variabelen, datatypes, functies, flow-control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda. Dag 2: Dag 2 Vervolgens komt het NumPy package aan de orde, waarmee grote data sets zeer efficiënt verwerkt kunnen worden. Hierbij wordt NumPy's ndarray object en zijn methodes besproken. Aandacht wordt besteed aan de verschillende array-manipulatietechnieken en speciale routines voor het ordenen, zoeken en vergelijken van data in matrices. Hierbij wordt ook de MatPlotlib library besproken. Deze is nauw geïntegreerd met NumPy en een zeer krachtig instrument vormt voor het creëren en plotten van complexe datarelaties. Dag 3: Dag 3 Daarna is het de beurt aan het gebruik van Pandas voor data-analyse. De Pandas library introduceert twee nieuwe datastructures in Python, die gebruik maken van Numpy en daarom zeer snel zijn. De datastructures zijn DataFrame en Series en er wordt uitgebreid ingegaan op hoe u deze kunt gebruiken voor data-analyses bij het inspecteren, selecteren, filteren, combineren en groeperen van data. Dag 4: Dag 4 Ten slotte wordt aandacht besteed aan de essentials van de SciPy library. De cursus maakt gebruik van vele voorbeelden uit de praktijk en laat zien hoe een-, twee- en driedimensionale datasets kunnen worden gevisualiseerd. De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo's verduidelijken de concepten verder. De theorie wordt afgewisseld met oefeningen. Als ontwikkelomgeving wordt de Anaconda distributie met Jupyter notebooks gebruikt.
De cursist kant verschillende datascience bibliotheken gebruiken om complexe analyses uit te voeren De cursist kan zelfstandig verschillende analyses uitvoeren in Python