Data Analyse met Python
Lesgeld
Python Overview
De cursus Data Analyse met Python start met een behandeling in vogelvlucht van de Python syntax aspecten die belangrijk zijn bij Data Analyse projecten. Variabelen, data types, functies, flow control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda.
Numpy
Vervolgens komt het NumPy package in de cursus Data Analy
Python Overview
De cursus Data Analyse met Python start met een behandeling in vogelvlucht van de Python syntax aspecten die belangrijk zijn bij Data Analyse projecten. Variabelen, data types, functies, flow control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda.
Numpy
Vervolgens komt het NumPy package in de cursus Data Analyse met Python aan de orde, waarmee grote datasets zeer efficiënt verwerkt kunnen worden. Hierbij wordt NumPy’s ndarray object en zijn methodes besproken. Aandacht wordt besteed aan de verschillende array manipulatie technieken met broadcasting en vectorized operations.
Pandas
Vervolgens staat het gebruik van Panda's op het programma van de cursus Data Analyse met Python. De pandas library introduceert twee nieuwe data structures in Python die gebruik maken van Numpy en daarom snel zijn. De data structures zijn DataFrame en Series en er wordt uitgebreid ingegaan hoe deze te gebruiken voor data analysis bij het inspecteren, selecteren, filteren, combineren en groeperen van data.
MatPlotLib
Ook wordt in de cursus Data Analyse met Python de MatPlotlib library besproken die nauw is geïntegreerd met NumPy en een zeer krachtig instrument vormt voor het creëren en plotten van complexe data relaties.
Scikit-Learn
En tenslotte wordt aandacht besteed aan de essentials van de ScikitLearn library voor modellering. De cursus Data Analyse met Python maakt gebruik van vele voorbeelden uit de praktijk en laat zien hoe één- en twee- en drie dimensionale data sets kunnen worden gevisualiseerd.
Doelgroep Cursus Data Analyse met Python
De cursus Data Analyse met Python is bedoeld voor data analisten die Python en de Python libraries willen gebruiken in Data Analyse projecten.
Voorkennis training Data Analyse met Python
Om aan deze cursus te kunnen deelnemen is kennis van en ervaring met een willekeurige programmeertaal of pakket zoals SPSS, Matlab of VBA wenselijk. De cursus start met de behandeling van de beginselen van de programmeertaal Python.
Uitvoering cursus Data Analyse met Python
De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo's verduidelijken de concepten. De theorie wordt afgewisseld met oefeningen. Als ontwikkelomgeving wordt de Anaconda distributie met Jupyter notebooks gebruikt. De cursustijden zijn van 9.30 tot 16.30.
Officieel Certificaat Data Analyse met Python
De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Data Analyse met Python.
Modules
Module 1 : Python Language Syntax
- Python Features
- Running Python
- Anaconda Distribution
- IPython Shell
- Interactive and Script Mode
- Python Data Types
- Numbers and Strings
- Sequences and Lists
- Sets and Dictionaries
- Python Flow Control
- Exception Handling
Module 2 : Functions and Modules
- Pass by Value and Reference
- Scope of Variables
- EFAP principle
- What are comprehensions?
- Lambda Operator
- Filter, Reduce and Map
- List comprehensions
- Set and Dictionary comprehensions
- Creating and Using Modules
- import Statement
- from…import Statement
Module 3 : Classes and Objects
- Creating Classes
- Creating and Using Objects
- Accessing Attributes
- Property Syntax
- Constructors and Destructors
- Encapsulation
- Inheritance
- super Keyword
- Checking Relationships
- issubclass and isinstance
- Overriding Methods
Module 4 : Numpy
- NumPy Numerical Types
- Data Type objects
- dtype attributes
- Slicing and Indexing
- Array comparisons
- Manipulating array shapes
- Stacking and Splitting arrays
- any(),all(), slicing, reshape()
- Manipulating array shapes
- Methods of ndarray
- Views versus copies
- ravel(),flatten(),transpose()
Module 5 : Pandas
- Pandas DataFrame
- Import Data
- Inspect Data
- Data Visualization
- DataFrame Data Types
- Indexing and selection
- Data operations in pandas
- Missing Data
- Hierarchical Indexing
- Plotting with Pandas
- Combining Datasets
- Exploratory Data Analysis
Module 6 : Data Manipulation
- Indexing Data Frames
- .loc and .iloc Accessor
- Slicing and Indexing a Series
- Filtering with Boolean Series
- Zeros and NaNs
- all and any Nonzeros
- Using map Function
- Hierarchical Indexing
- Rearranging Data
- Reshaping by Pivoting
- Transformation and Aggregation
- Grouping Data
Module 7 : MatplotLib
- Simple Plots
- Plot format String
- Subplots
- Histograms
- Logarithmic Plots
- Scatter plots
- Fill between
- Legend and Annotations
- Three Dimensional Plots
- Contour Plots
- Transformations
- Projections
Module 8 : Time Series
- Indexing Pandas Time Series
- Reading and Slicing Times
- Using a DatetimeIndex
- Reindexing the Index
- Separating and Resampling
- Rolling mean and Frequency
- Resample and Roll with it
- Manipulating Time Series
- Method chaining and Filtering
- Missing values and Interpolation
- Time Zones and Conversion
- Plotting Time Series
Module 9 : SciKitLearn Essentials
- SkiKit Learn library
- Machine learning essentials
- Supervised and Unsupervised
- Feature matrix
- Target array
- Estimator API
- Hyperparameters
- Fit method
- Predict method
- Model Selection
- Linear Regression
- Logistic Regression