Data science in Python

Waarom dit thema?

Een data scientist is eigenlijk gewoon iemand die ‘handig is met data’. En deze skill kan tegenwoordig bij bijna elke bedrijf waarde toevoegen. Vrijwel elk bedrijf verzamelt data, maar er zijn weinig mensen die waarde uit die data kunnen halen. Speciaal daarvoor is deze training ontwikkeld

Waarom deze opleiding?

Het leren van Python is een absolute aanrader. Python is op dit moment de meest populaire programmeertaal en niet voor niets het is namelijk relatief eenvoudig om te leren. Daarnaast zijn veel online tutorials op het gebied van Data Science en Machine Learning geschreven in Python. Je kunt dus binnen de datawereld niet meer om Python heen. 

Na dag 2 beschik jij over de Python basiskennis. Alles binnen Python borduurt hierop voort.

Dag 3 gaat specifiek over werken met data in Python. We merken dat veel mensen zich afvragen waar ze moeten beginnen als ze met data aan de slag willen.

Wij krijgen vaak vragen zoals:

  • Moet ik Numpy of Pandas gebruiken?
  • Waarom is Matplotlib zo .. lastig?
  • Welke library moet ik gebruiken om te plotten?
  • Wat is (ana)conda?
  • Moet ik Jupyter Notebooks gebruiken?
  • Etcetera

Na deze training weet je welke tools er zijn en wanneer je welke tool (Numpy, Pandas, Scikit-Learn, Matplotlib) moet gebruiken.Verder leer je hoe Pandas werkt en hoe je het kan gebruiken voor bijv. data inlezen, aggregeren en plotten.Als je deze skills beheerst dan kun je het grootste deel van de dagelijkse werkzaamheden van een data scientist uitvoeren.

Tijdens de laatste dag leer je patronen herkennen in data door middel van Machine Learning. Je leert wat Machine Learning is (theorie) en hoe je het kan toepassen (praktijk). Na deze training ben je in staat om machine learning binnen jouw organisatie toe te passen. Hierdoor kun je waarschijnlijk veel processen verbeteren en zorgen voor extra inzicht of waarde

Inhoud

Dag 1-2: Introductie Data Science (thoerie) & Python (theorie & hands-on)

Dag 3: Werken met data in Python: Pandas & Jupyter Notebooks (hands-on)

Dag 4: Machine learning in Python: SciKit-Learn (theorie & hands-on)

Waar & wanneer

Deze opleiding staat even niet ingepland of is volzet. Laat jouw e-mailadres na en we houden je op de hoogte van nieuwe data.

Hou mij op de hoogte van nieuwe data

Voor wie

Deze training is speciaal ontwikkeld voor mensen die:

  • Hoogopgeleid zijn
  • Enige ervaring hebben met het werken met data
  • Enige ervaring hebben met programmeren (het maakt niet uit in welke taal/tool)
  • Affiniteit hebben met analyse / modellen / wiskunde /statistiek / o.i.d
Data science in Python

Prijs

€ 1610 excl. BTW

Ledenprijs

Lid van Amelior: € 1460 excl. BTW
Non-profit Amelior lid: € 1370 excl. BTW

Nog geen lid? Lid worden kan al vanaf € 205 per jaar

Deze opleiding goedkoper volgen?

  • Bekijk op welke subsidies (o.a. KMO-portefeuille, Alimento-korting, ...) je recht hebt
  • Korting mogelijk bij meerdere deelnemers van hetzelfde bedrijf
  • Bij een groter aantal deelnemers is het voordeliger om deze opleiding in-company te volgen
Categorie KMO-portefeuille
bedrijfsstrategie

Na de opleiding

Je zal volgende geleerd hebben:

Python

  • Wat is Python?
  • Wat is een Python programma en hoe run je het?
  • Wat is een module?
  • Python vs. andere programmeertalen
  • Jupyter notebooks
  • Built-in objects: lists, dictionaries, tuples, etc.
  • Control flow: if/else, for- en while-loops
  • Functies

Data analyse

Na deze training weet je welke tools er zijn en wanneer je welke tool (Numpy, Pandas, Scikit-Learn, Matplotlib) moet gebruiken.Verder leer je hoe Pandas werkt en hoe je het kan gebruiken voor bijv. data inlezen, aggregeren en plotten.Als je deze skills beheerst dan kun je het grootste deel van de dagelijkse werkzaamheden van een data scientist uitvoeren.

Machine Learning

  • Machine learning theorie. Je leert wat de begrippen supervised/ unsupervised learning inhouden. En wat de verschillen zijn tussen classificatie, regressie en clusteren.
  • Verschillende machine learning modellen zoals decision tree, naive Bayes, random forest, K-nearest neighbours en K-means
  • Hoe je een dataset prepareert
  • Hoe je een model toepast d.m.v. scikit-learn
  • Hoe je een model valideert: split-/cross-validatie
  • Interpreteren en visualiseren van resultaten

Docenten

frederik tijhuis
Frederik Tijhuis
  • ruime ervaring met data science en machine learning, vooral in Python/Pandas
  • trainer rond verschillende topics voor verschillende doelgroepen 

Op maat

Liever een oplossing op maat?

  • Win het advies in van een ervaren vakspecialist, en doe beroep op een consultant.
  • Meerdere collega's die deze opleiding willen volgen? Al vanaf 4 deelnemers is in-company voordeliger.
  • Aangepast op basis van de noden van jouw organisatie.