Opleiding: Training Apache Hive
Apache Hive is een methode om Hadoop omgevingen gericht te bevragen door middel van queries (HiveQL). Tijdens de Training Apache Hive worden de functionaliteit en het gebruik uitgebreid behandeld.
Algemene omschrijving
Moderne webportalen en applicaties hebben te maken met grote hoeveelheden data in verschillende vormen. Om deze informatie op een gerichte en gestroomlijnde manier te kunnen ontsluiten kan er gebruik worden gemaakt van Apache Hive. Het biedt de mogelijkheid grote datasets gericht te bevragen of te analyseren en is compatible met andere populaire methoden zoals MapReduce.
Apache Hive is een framework bovenop het bekende Apache Hadoop om de onderliggende data te kunnen benaderen. Met de query taal HiveQL is het mogelijk om gerichte zoekopdrachten te geven en analyses en aggregaties uit te voeren.
Tijdens de Training Apache Hive
Tijdens de Training Apache Hive word je wegwijs gemaakt in het framework, het schrijven van HiveQL queries en de interactie met Apache Hadoop. Er is ruime aandacht voor analyse en aggregatie en de mogelijkheid deze opdrachten te exporteren naar andere omgevingen. Ook gaan we in op indexering en andere manieren om de performance te verhogen.
Resultaat van de Training Apache Hive
Na het volgen van de training ben je in staat om Apache Hive aan een Hadoop omgeving te koppelen en relevante informatie te halen uit grote datasets. Je kunt data manipuleren en exporteren en krijgt inzicht in de samenhang van de verschillende onderdelen.
Programma
Tijdens de Training Apache Hive behandelen we de volgende modulen:
- Basics
-
- Introductie Big Daga
- Waarom Hive?
- Hadoop
- HDFS
- Setup
-
- Installatie
- Configuratie
- Koppeling met Hadoop
- Aanmaken van tabellen
- Datatypen
- Schemas
- Gegevens importeren
- Verschillende opslagmethoden
- HiveQL
-
- Introductie
- Opvragen van informatie
- Manipuleren van data
- Functions
- Joins
- Views
- Analytics
-
- Analyse van Data
- Aggregatie
- Data partitionering en bucketing
- Indexering en performance
- Aanvullend
-
- Koppelingen met andere systemen
- Introductie Apache Pig