Schulungsübersicht
Woche 1 Big Data Konzepte
- VVVV (Geschwindigkeit, Volumen, Vielfalt, Wahrhaftigkeit) Definition
- Grenzen der traditionellen Datenverarbeitungskapazität
- Verteilte Verarbeitung
- Statistische Analyse
- Machine Learning Analysearten
- Data Visualization
- Verteilte Verarbeitung (z.B. map-reduce)
- Einführung in die verwendeten Sprachen
- R Sprache Crash-Kurs
- Python Crash-Kurs
Wochen 2&3 Durchführen Data Analysis
- Statistische Analyse
- Deskriptiv Statistics in Big Data Mengen (z.B. Mittelwertberechnung)
- Inferentiell Statistics (Schätzung)
- Forecasting mit Korrelations- und Regressionsmodellen
- Zeitreihenanalyse
- Grundlagen von Machine Learning
- Überwachtes vs. unüberwachtes Lernen
- Klassifizierung und Clustering
- Abschätzung der Kosten spezifischer Methoden
- Filter
Woche 4 Verarbeitung natürlicher Sprache
- Verarbeitung von Text
- Verstehen der Bedeutung des Textes
- Automatische Texterzeugung
- Analyse von Sätzen/Themen
- Computer Sehen
Woche 5&6 Tooling-Konzept
- Datenspeicherlösung (SQL, NoSQL, hierarchisch, objektorientiert, dokumentenorientiert)
- MySQL, Cassandra, MongoDB, Elasticsearch, HDFS, etc...)
- Auswahl der richtigen Lösung für das Problem
- Verteilte Verarbeitung
- Spark
- Machine Learning mit Spark (MLLib)
- Spark SQL
- Scalability
- Öffentliche Cloud (AWS, Google, etc...)
- Private Cloud (OpenStack, Cloud Foundry)
- Autoskalierbarkeit
Woche 7 Soft Skills
- Beratung & Leadership Fertigkeiten
- Wirkung erzielen: datengestütztes Storytelling
- Verstehen Sie Ihr Publikum
- Effektive Datenpräsentation - wie Sie Ihre Botschaft vermitteln
- Effektive Beeinflussung und Führung im Wandel
- Umgang mit schwierigen Situationen
Prüfung
- Abschlussprüfung am Ende des Programms
Voraussetzungen
Die Teilnehmer müssen über gute Mathematikkenntnisse verfügen, mindestens auf Gymnasialniveau.
Programmierkenntnisse sind zwar nicht erforderlich, aber dennoch nützlich.
Die Teilnehmer werden vor der Teilnahme an diesem Schulungsprogramm beurteilt und befragt.
Erfahrungsberichte (4)
Understanding big data beter
Shaune Dennis - Vodacom
Kurs - Big Data Business Intelligence for Telecom and Communication Service Providers
Subject presentation knowledge timing
Aly Saleh - FAB banak Egypt
Kurs - Introduction to Data Science and AI (using Python)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Kurs - Jupyter for Data Science Teams
The example and training material were sufficient and made it easy to understand what you are doing.