Opleiding: Large Language Models Bouwen

De cursus Large Language Models Bouwen van SpiralTrain leert je hoe je met PyTorch en modern tooling transformer-based LLMs ontwerpt, traint, fine-tuned en deployed.

Intro LLM

De cursus Large Language Models bouwen start met wat LLM’s zijn, waar ze worden ingezet en gaat in op de lifecycle van bouwen versus gebruiken. De Transformer/GPT-architectuur wordt geintroduceerd evenals hoe modellen leren van grote datasets en wanneer je klassieke QA gebruikt versus RAG.

Werken met Tekstdata

Je leert ruwe tekst om te zetten naar modelklare tensors dor middel van tokenization token→ID mapping, speciale/contexttokens en sliding-window sampling. Embeddings en positional encodings worden behandeld en hoe om te gaan om met onbekende woorden.

Attention-mechanisme

Deze module demystificeert self-attention voor long-sequence modeling: queries, keys, values en causal masking om toekomstige tokens te verbergen. Positional encoding en multi-head attention worden toegvoegd toe om afhankelijkheden in input op te vangen.

PyTorch Deep Learning

Deze module behandelt PyTorch-basics—tensors en training loops evenals tooling om model kwaliteit te meten. Ingegaan wordt op feature scaling/normalization, activatie- en loss-functies en backpropagation.

Neurale Netwerken

Vervolgens bouw je MLP’s en CNN’s in PyTorch, kies je passende activaties en losses en implementeer je backpropagation. Ook NLP-specifieke preprocessing wordt behandeld evenals end-to-end binaire en multiclass-classificatie.

GPT van scratch

Daarna implementeer je een minimale GPT met layer normalization, residual connections en attention + feed-forward (GELU).

Pretraining

Je pretraint de LLM op ongelabelde tekst met next-token prediction en volgt training- versus validation-losses. Je verkent decoding strategies (bijv. temperature, top-k), beheerst randomness voor reproduceerbaarheid en slaat PyTorch-weights op/laadt ze in.

Tuning voor Classificatie

We bereiden datasets en dataloaders voor, initialiseren vanuit pretrained weights en voegen een classification head met softmax toe. Je traint en evalueert met loss/accuracy, met als voorbeeld een LLM-based spam-classification.

Fine-tuning

Tot slot oefen je supervised instruction tuning: datasets formatteren, efficiënt batchen en een pretrained LLM fine-tunen. Je evalueert outputs, exporteert responses/checkpoints en past parameter-efficiënte methoden zoals LoRA toe.

Doelgroep Cursus Large Language Models Bouwen

De cursus Large Language Models Bouwen is bedoeld voor engineers die transformer-based LLM’s willen ontwerpen.

Voorkennis Cursus Large Language Models Bouwen

Deelnemers dienen vertrouwd te zijn met Python. Ervaring met PyTorch of een vergelijkbaar Deep Learning-framework is een plus.

Uitvoering Training Large Language Models Bouwen

De training combineert bondige theorie met begeleide, hands-on labs. Via code-alongs bouw je een mini-GPT, bereid je datasets voor, voer je pretraining en fine-tuning uit en deploy je modellen.

Certificaat Large Language Models Bouwen

Na afloop ontvangen deelnemers een certificaat van deelname aan de cursus Large Language Models Bouwen.

Modules

Module 1 : LLM Intro

What is an LLM?
Applications of LLMs
Stages of Building LLMs
Stages of Using LLMs
Transformer Architecture
Utilizing Large Datasets
GPT Architecture Internals
Learn Language Patterns
Retrieval Augmented Generation
Question and Answer Systems
QA versus RAG
Building an LLM

Module 2 : Working with Text Data

Word Embeddings
Decoders and Encoders
Decoder Only Transformer
Tokenizing text
Convert Tokens into IDs
Special Context Tokens
Understand Sentence Structure
Byte Pair Encoding
Unknown Words
Sampling with Sliding Window
Creating Token Embeddings
Encoding Word Positions

Module 3 : Attentions Mechanism

Modeling Long Sequences
Capturing Data Dependencies
Attention Mechanisms
Attending Different Input Parts
Using Self-Attention
Trainable Weights
Hiding Future Words
Positional Encoding
Causal Attention
Masking Weights with Dropout
Multihead Attention
Stacking Attentions Layers

Module 4 : Pytorch Deep Learning

Deep Learning Intro
Overview of PyTorch
PyTorch Tensors
Tensor Operations
Model Evaluation Metrics
Feature Scaling
Feature Normalization
Categorical Features
Activation Functions
Loss Functions
Backpropagation

Module 5 : Neural Networks

Neural Networks Intro
Building NN with PyTorch
Multiple Layers of Arrays
Convolutional Neural Networks
Activation Functions
Loss Functions
Backpropagation
Natural Language Processing
Stopword Removal
Binary Classification
Multi-class Classification

Module 6 : GPT from scratch

Coding an LLM Architecture
Layer Normalization
Normalizing Activations
Feed Forward Network
GELU Activations
Adding Shortcut Connections
Connecting Attention
Weight Tying
Linear Layers in Transformer Block
Coding the GPT Model
Generating Text

Module 7 : Pretraining

Pretraining on Unlabeled Data
Calculating Text Generation Loss
Training Losses
Validation Set Losses
Training an LLM
Decoding Strategies
Control Randomness
Temperature Scaling
Saving Model Weights in PyTorch
Loading Pretrained Weights

Module 8 : Tuning for Classification

Categories of Fine-Tuning
Preparing the Dataset
Creating Data Loaders
Top-k Sampling
Soft-Max Function
Initializing with Pretrained Weights
Adding Classification Head
Classification Loss and Accuracy
Fine-tuning on Supervised Data
Using LLM as Spam Classifier

Module 9 : Fine-Tuning

Instruction Fine-tuning
Supervised Instruction
Preparing a Dataset
Organizing Training Batches
Creating Data Loaders
Loading a pretrained LLM
Fine-tuning the LLM
Extracting and Saving Responses
Evaluating Fine-tuned LLM
Fine Tuning with LoRA

Meer...

Nu inschrijven

Informatie aanvragen

€3.200

ex. BTW

Aangeboden door

SpiralTrain

Onderwerp

Niveau

Duur

4 dagen

Looptijd

24 dagen

Taal

Type product

cursus

Lesvorm

Klassikaal

Aantal deelnemers

Max: 12

Tijdstip

Overdag

Tijden en locaties

Amsterdam

ma 9 feb. 2026

Eindhoven

ma 9 feb. 2026

Houten

ma 9 feb. 2026

Online

ma 9 feb. 2026

Rotterdam

ma 9 feb. 2026

Zwolle

ma 9 feb. 2026

Amsterdam

ma 13 apr. 2026

Eindhoven

ma 13 apr. 2026

Houten

ma 13 apr. 2026

Online

ma 13 apr. 2026

Rotterdam

ma 13 apr. 2026

Zwolle

ma 13 apr. 2026

Amsterdam

ma 8 jun. 2026

Eindhoven

ma 8 jun. 2026

Houten

ma 8 jun. 2026

Online

ma 8 jun. 2026

Rotterdam

ma 8 jun. 2026

Zwolle

ma 8 jun. 2026

Amsterdam

ma 10 aug. 2026

Eindhoven

ma 10 aug. 2026

Houten

ma 10 aug. 2026

Online

ma 10 aug. 2026

Rotterdam

ma 10 aug. 2026

Zwolle

ma 10 aug. 2026

Amsterdam

ma 12 okt. 2026

Eindhoven

ma 12 okt. 2026

Houten

ma 12 okt. 2026

Online

ma 12 okt. 2026

Rotterdam

ma 12 okt. 2026

Zwolle

ma 12 okt. 2026

Amsterdam

ma 14 dec. 2026

Eindhoven

ma 14 dec. 2026

Houten

ma 14 dec. 2026

Online

ma 14 dec. 2026

Rotterdam

ma 14 dec. 2026

Zwolle

ma 14 dec. 2026

Amsterdam

ma 8 feb. 2027

Eindhoven

ma 8 feb. 2027

Houten

ma 8 feb. 2027

Online

ma 8 feb. 2027

Rotterdam

ma 8 feb. 2027

Zwolle

ma 8 feb. 2027

Amsterdam

ma 12 apr. 2027

Eindhoven

ma 12 apr. 2027

Houten

ma 12 apr. 2027

Online

ma 12 apr. 2027

Rotterdam

ma 12 apr. 2027

Zwolle

ma 12 apr. 2027

Amsterdam

ma 14 jun. 2027

Eindhoven

ma 14 jun. 2027

Houten

ma 14 jun. 2027

Online

ma 14 jun. 2027

Rotterdam

ma 14 jun. 2027

Zwolle

ma 14 jun. 2027

Amsterdam

ma 9 aug. 2027

Eindhoven

ma 9 aug. 2027

Houten

ma 9 aug. 2027

Online

ma 9 aug. 2027

Rotterdam

ma 9 aug. 2027

Zwolle

ma 9 aug. 2027

Amsterdam

ma 11 okt. 2027

Eindhoven

ma 11 okt. 2027

Houten

ma 11 okt. 2027

Online

ma 11 okt. 2027

Rotterdam

ma 11 okt. 2027

Zwolle

ma 11 okt. 2027

Amsterdam

ma 13 dec. 2027

Eindhoven

ma 13 dec. 2027

Houten

ma 13 dec. 2027

Online

ma 13 dec. 2027

Rotterdam

ma 13 dec. 2027

Zwolle

ma 13 dec. 2027

Amsterdam

ma 14 feb. 2028

Eindhoven

ma 14 feb. 2028

Houten

ma 14 feb. 2028

Online

ma 14 feb. 2028

Rotterdam

ma 14 feb. 2028

Zwolle

ma 14 feb. 2028

Amsterdam

ma 10 apr. 2028

Eindhoven

ma 10 apr. 2028

Houten

ma 10 apr. 2028

Online

ma 10 apr. 2028

Rotterdam

ma 10 apr. 2028

Zwolle

ma 10 apr. 2028

Amsterdam

ma 12 jun. 2028

Eindhoven

ma 12 jun. 2028

Houten

ma 12 jun. 2028

Online

ma 12 jun. 2028

Rotterdam

ma 12 jun. 2028

Zwolle

ma 12 jun. 2028

Amsterdam

ma 14 aug. 2028

Eindhoven

ma 14 aug. 2028

Houten

ma 14 aug. 2028

Online

ma 14 aug. 2028

Rotterdam

ma 14 aug. 2028

Zwolle

ma 14 aug. 2028

Amsterdam

ma 9 okt. 2028

Eindhoven

ma 9 okt. 2028

Houten

ma 9 okt. 2028

Online

ma 9 okt. 2028

Rotterdam

ma 9 okt. 2028

Zwolle

ma 9 okt. 2028

Keurmerken aanbieder

NRTO

UWV scholingsvoucher