Ontdek wat deze opleiding jou kan bieden!

 


 

Home Alle Opleidingen
Hadoop voor Big Data
terug naar zoekresultaten

Hadoop voor Big Data

Deelnemerskosten
€ 2.418,79 incl. BTW

Lesgeld

€ 1.999,00
Totaal excl. BTW
€ 1.999,00
BTW
€ 419,79
Totaal incl. BTW
€ 2.418,79
Startdata in een groep op locatie en online
Locatie: Houten
Start: 19-01-2026
Toon rooster
Aanmelden
Locatie: Amsterdam
Start: 19-01-2026
Toon rooster
Aanmelden
Locatie: Rotterdam
Start: 19-01-2026
Toon rooster
Aanmelden
Locatie: Eindhoven
Start: 19-01-2026
Toon rooster
Aanmelden
In de cursus Hadoop voor Big Data leren de deelnemers Apache Hadoop te gebruiken voor de opslag en verwerking van grote hoeveelheden data.
Image
Image

Hadoop Architectuur

In de cursus Hadoop voor Big Data Hadoop komt de architectuur van Hadoop uitgebreid aan de orde. Hadoop gebruikt een eenvoudig programmeer model in een gedistribueerde omgeving over een cluster van computers.

HDFS

Binnen een Hadoop cluster wordt het Hadoop Distributed File System (HDFS) gebruikt als bestandssysteem. In de cursus Hadoop voor Big Data Hadoop wordt HDFS uitgebreid besproken. HDFS is een horizontaal schaalbaar bestandssysteem dat opge

...

Hadoop Architectuur

In de cursus Hadoop voor Big Data Hadoop komt de architectuur van Hadoop uitgebreid aan de orde. Hadoop gebruikt een eenvoudig programmeer model in een gedistribueerde omgeving over een cluster van computers.

HDFS

Binnen een Hadoop cluster wordt het Hadoop Distributed File System (HDFS) gebruikt als bestandssysteem. In de cursus Hadoop voor Big Data Hadoop wordt HDFS uitgebreid besproken. HDFS is een horizontaal schaalbaar bestandssysteem dat opgeslagen staat op een cluster van servers. De data wordt gedistribueerd opgeslagen, en het bestandssysteem zorgt automatisch voor replicatie van data over het cluster.

MapReduce

Een belangrijk algoritme voor het verwerken van Data is het MapReduce algorithm en hier wordt uitgebreid aandacht aan besteed.

Utilities

Tenslotte is er in de cursus Hadoop voor Big Data Hadoop aandacht voor tools en utilities die vaak in combinatie met Hadoop worden gebruikt zoals Zookeeper, Scoop, Ozie en Pig.

Doelgroep Cursus Hadoop voor Big Data

De cursus Hadoop voor Big Data is bedoeld voor developers, data analisten en anderen die willen leren met hoe je data kunt verwerken met Hadoop.

Voorkennis training Hadoop voor Big Data

Om aan deze cursus deel te nemen is kennis van programmeren in Java en databases bevorderlijk voor de begripsvorming. Voorafgaande kennis van Java of Hadoop is niet nodig.

Uitvoering cursus Hadoop voor Big Data

De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo’s worden gebruikt om de behandelde concepten te verduidelijken. Er is voldoende gelegenheid om te oefenen en afwisseling van theorie en praktijk. De cursustijden zijn van 9.30 tot 16.30.

Certificering cursus Hadoop voor Big Data

De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Hadoop voor Big Data.

Modules

Module 1 : Hadoop Intro

  • Big Data Handling
  • No SQL
  • Comparison to Relational DB
  • Hadoop Eco-System
  • Hadoop Distributions
  • Pseudo-Distributed Installation
  • Namenode Safemode
  • Namenode High Availability
  • Secondary Namenode
  • Hadoop Filesystem Shell

Module 2 : Java API

  • Create via Put method
  • Read via Get method
  • Update via Put method
  • Delete via Delete method
  • Create Table
  • Drop Table
  • Scan API
  • Scan Caching
  • Scan Batching
  • Filters

Module 3 : HDFS

  • Hadoop Environment
  • Hadoop Stack
  • Hadoop Yarn
  • Distributed File System
  • HDFS Architecture
  • Parallel Operations
  • Working with Partitions
  • RDD Partitions
  • HDFS Data Locality
  • DAG (Direct Acyclic Graph)

Module 4 : Hbase Key Design

  • Storage Model
  • Querying Granularity
  • Table Design
  • Tall-Narrow Tables
  • Flat-Wide Tables
  • Column Family
  • Column Qualifier
  • Storage Unit
  • Querying Data by Timestamp
  • Querying Data by Row-ID
  • Types of Keys and Values
  • SQL Access

Module 5 : MapReduce

  • MapReduce Model
  • MapReduce Theory
  • YARN and MapReduce 2.0 Daemons
  • MapReduce on YARN single node
  • MapReduce framework
  • Tool and ToolRunner
  • GenericOptionsParser
  • Running MapReduce Locally
  • Running MapReduce on Cluster
  • Packaging MapReduce Jobs
  • MapReduce CLASSPATH
  • Decomposing into MapReduce

Module 6 : Submitting Jobs

  • MapReduce Job
  • Using JobControl class
  • Joining data-sets
  • User Defined Functions
  • Logs and Web UI
  • Input and Output Formats
  • Anatomy of Mappers
  • Reducers and Combiners
  • Partitioners and Counters
  • Speculative Execution
  • Distributed Cache
  • YARN Components

Module 7 : Hadoop Streaming

  • Implement a Streaming Job
  • Contrast with Java Code
  • Create counts in Streaming App
  • Text Processing Use Case
  • Key Value Pairs
  • $yarn command
  • Using Pipes

Module 8 : Utilities

  • ZooKeeper
  • Scoop
  • Introduce Oozie
  • Deploy and Run Oozie Workflow
  • Pig Overview
  • Execution Modes
  • Developing Pig Script

Module 9 : Hive

  • Hive Concepts
  • Hive Clients
  • Table Creation and Deletion
  • Loading Data into Hive
  • Partitioning
  • Bucketing
  • Joins

 

Lees meer
Opleidingsinformatie
Opleidingssoort
Training
Opleidingsmethode
In een groep op locatie en online
Type certificaat/diploma
Certificaat
Opleidingsduur
3 dagen
Max. deelnemers
12
Studiebelastingsuren
18 per opleiding
Tijdstip
Overdag
Taal in opleiding
Nederlands
Aanbieder
SpiralTrain is een opleidingsinstituut dat zich bij uitstek richt op trainingen voor software developers en zaken die raken aan software development.
SpiralTrain BV
SpiralTrain BV
NRTO