Data Science
Big data is geen hype meer, maar een dagelijkse realiteit. Elke minuut genereert een persoon nu meer data dan in heel 2008 werd opgeslagen. Big data is geen hype maar een dagelijks fenomeen. Per persoon produceren we vandaag meer data per minuut dan er totaal in 2008 werd opgeslagen. Via allerlei sensors in de openbare ruimte, in onze apparatuur en door het gebruik van smart mobile devices zenden we continu informatie naar geïnteresseerde bedrijven en partijen. Voorbeelden van gebruik van deze data zijn het onderhoud van treinen, elektriciteit sturing door slimme meters of aanbevelingen op websites voor producten die je echt moet hebben. Data science is de discipline die betekenisvolle inzichten uit enorme hoeveelheden data haalt met behulp van algoritmes. Via allerlei sensors in de openbare ruimte, in onze apparaten en door het gebruik van smart mobile devices stuur je continu informatie naar geïnteresseerde bedrijven en partijen. Deze data wordt bijvoorbeeld gebruikt voor het onderhoud van treinen, het beheer van elektriciteit via slimme meters en aanbevelingen op websites voor producten die je echt moet hebben. Data science helpt om uit deze overvloed aan gegevens waardevolle inzichten te halen met behulp van algoritmes.
In de wereld van big data verwijst data science naar het proces van het omzetten van enorme hoeveelheden gegevens in bruikbare kennis. Dit is een moeilijk proces, omdat de enorme hoeveelheid gegevens moeten worden opgeslagen en omgezet in bruikbare informatie. Het doel van deze minor is studenten op te leiden tot junior data scientists die in staat zijn zelf een project aan te pakken voor een opdrachtgever. We gaan met échte opdrachtgevers en échte datavraagstukken aan de slag. Binnen de minor kennen we een aantal specialisatie tracks:
- Connectivity & Mobility (met een focus op Aviation)
- Designing Future Cities
- Energy Transition
- Smart Industry
- Technology for Life (met een focus op Smart Health)
Je kiest in het tweede blok van de minor voor een van de hierboven genoemde tracks. Tijdens de minor leer je programmeren in Python, data analyse technieken (machine learning), en visualisatie technieken. Daarnaast hebben we een impact programma met onder andere een hackathon.
Let op!
- Voorafgaand aan de minor hebben we een introductiedag waar je verwacht wordt.
Video: Data Science
Leerdoelen
- Data en (exploratieve) inzichten interpreteren, uitleggen en bediscussiëren;
- Aanbevelingen doen voor data-gedreven beslissingen binnen een technische context, rekening houdend met de betrouwbaarheid van de resultaten;
- Met een onderzoekende houding een technisch vraagstuk oplossen;
- Bedrijfsproblemen vertalen naar data science vraagstukken, met onderscheid tussen hoofd- en deelvragen;
- De waarde van betrouwbare en transparante data-analyse realiseren en bewust zijn van de risico’s van biases;
- Functies gebruiken voor het importeren, bewerken, visualiseren en modelleren van data;
- Code opleveren die overdraagbaar is.
Ingangseisen
Toelatingseisen conform OER eigen opleiding.
Gewenst:
- enige ervaring met het bewerken van data (bijvoorbeeld Excel/Access);
- bekend zijn met een aantal basistechnieken uit de statistiek: gemiddelde, standaardafwijking, variantie, histogrammen maken. Indien dit ontbreekt raden we je aan voorafgaand aan de minor een statistiek cursus te volgen op DataCamp.;
- affiniteit met het werken met getallen, met databestanden en het interpreteren van data.
Literatuur
We hebben geen verplicht studiemateriaal. We maken veel gebruik van de online leeromgeving Datacamp. Als je voor de minor kiest ontvang je van ons een licentie. Mocht je het fijn vinden om uit een boek te leren, dan raden we het onderstaande (digitale) boek aan:
- Van der Plas, J. Python Data Science Handbook
- Digitaal verkrijgbaar via github.com of Oreilly
Daarnaast wordt gebruikt gemaakt van wetenschappelijke papers over big data en key performance indicators. Voor de Tracks wordt nog literatuur bekend gemaakt.
Verder adviseren we je middels zelfstudie te bekwamen in het data werkveld, bijvoorbeeld door het luisteren van podcasts zoals De dataloog.
Rooster
Het onderwijs concept van de minor is dat je aan het begin van iedere twee weken een challenge krijgt die je op de vrijdag moet presenteren. Op de maandag krijg je de basisstof voor de challenge gedoceerd, echter de challenge gaat veel verder dan de basisstof. Zodoende wordt je steeds uitgedaagd het beste uit jezelf te halen. Het stramien van de minor is in de twee blokken doorgaans als volgt:
maandag: college; theorie uitleg en challenge voor komende twee weken
dinsdag: blok 1: zelfstudie (onder begeleiding)
blok 2: bij het bedrijf aan de slag met de bedrijfscase
woensdag: werkcollege
donderdag: blok 1: zelfstudie (onder begeleiding)
blok 2: bij het bedrijf aan de slag met de bedrijfscase
vrijdag: blok 1: een tweewekelijkse presentatie van de challenge
blok 2: een wekelijkse presentatie van de voortgang van de bedrijfscase
Het eerste blok wordt door studenten als pittig ervaren maar tegelijkertijd wel ervaren dat er veel geleerd wordt in slechts enkele weken. Juist daardoor is het mogelijk om in het tweede blok het geleerde in de praktijk te brengen. Naast de standaard colleges hebben we in de minor een viertal presentatie/workshop avonden waarin we de trends, hacks of maatschappelijke impact verder uitdiepen.
Contacttijd:
Studiedeel / Hoorcollege / Werkcollege / Overig
Introduction to Data Science / 7 x 100 min. / 7 x 100 min. / 7 x 8u
Datacamp / 7 x 8u consult
Visual Analytics / 7 x 100 min. / 7 x 100 min.
Data Mining / 7 x 100 min. / 7 x 100 min.
Track / 7 x 100 min. / 7 x 100 min. / 5 x 3u presentaties, 50 min. eindpresentatie
Hackaton / / / 4 dagen fulltime
ML workshop / / / 4 dagdelen
Data ethics / 2 x 50 min. opzet / / 4 thema avonden van ca 4u, 8u excursies, oa Big Data Expo
Let op:
- Voorafgaand aan de minor hebben we een introductiedag waar je verwacht wordt.
- De minor wordt door studenten als tijdsintensief ervaren. Als je kiest voor data science (big data), kies je voor het leren van een nieuwe taal de taal van data. Soms betekent dit meer uren te besteden dan je voorafgaand had gehoopt, dat moet je willen accepteren. Het docententeam van de minor is gecommitteerd om het beste uit jou te halen, we zullen er alles aan doen om je tijdens de minor échte ervaringen op te laten doen in bijvoorbeeld excursies. We vragen dus ook commitment van jou.
Toetsing
30 ECTS.
Studiedeel / EC / Blok / Toetsing
Introduction to Data Science / 9 / 1 / Tentamen
Visual Analytics / 5 / 1 / Opdrachten
Data Mining / 4 / 2 / Opdrachten
Hackaton / - / 1, waarschijnlijk in week 7 / Deelname
Track / 10 / 2 / Eindpresentatie
Data Ethics / 2 / 1 en 2 / Reflectie deelname
De vakken Introduction to Data Science en Visual Analytics kunnen in blok 1 en blok 3 worden herkanst.
Het vak Data Mining en de Track kunnen in blok 2 en blok 4 worden herkanst.
Voor het vak Data Ethics geldt een herkansing op maat afhankelijk van welk onderdeel je moet herkansen.
In geval van herkansen vragen we je om van tevoren contact met ons op te nemen.
Wordt een minor niet meer aangeboden of is de inhoud van de minor herzien? Dan biedt de opleiding in het daarop volgende studiejaar nog tweemaal de gelegenheid tot het afronden van de minor.
Aanvullende informatie
Meer informatie:
Kosten:
De thema en hack avonden van het vak Data Ethics zijn nog niet gepland. Maar het kan zijn dat er voor een van de avonden kosten gemaakt worden. Denk hierbij aan de aanschaf van een Raspberri Pi of sensor boards.
Tot slot, zorg voor een redelijke laptop. We kunnen support bieden aan Macbooks, Windows en Linux/Unix, maar Chromebook kunnen we niet ondersteunen.
Vragen over de minor?
Contact: Charaf Batou, c.batou@hva.nl
Vragen over de Kies op Maat-procedure?
Contact: Monique Ax-Bervoets, Christian van Dokkum minoren-techniek@hva.nl
Er zijn 30 plaatsen voor KOM-studenten. De aanmeldperiode voor HvA-studenten is voorafgaand aan de aanmeldperiode voor niet HvA-studenten.
Aanmeldingen worden op volgorde van binnenkomst ondertekende leerovereenkomsten in behandeling genomen.