Opleiding: Large Language Models Bouwen

De cursus Large Language Models Bouwen van SpiralTrain leert je hoe je met PyTorch en modern tooling transformer-based LLMs ontwerpt, traint, fine-tuned en deployed.

Intro LLM

De cursus Large Language Models bouwen start met wat LLM’s zijn, waar ze worden ingezet en gaat in op de lifecycle van bouwen versus gebruiken. De Transformer/GPT-architectuur wordt geintroduceerd evenals hoe modellen leren van grote datasets en wanneer je klassieke QA gebruikt versus RAG.

Werken met Tekstdata

Je leert ruwe tekst om te zetten naar modelklare tensors dor middel van tokenization token→ID mapping, speciale/contexttokens en sliding-window sampling. Embeddings en positional encodings worden behandeld en hoe om te gaan om met onbekende woorden.

Attention-mechanisme

Deze module demystificeert self-attention voor long-sequence modeling: queries, keys, values en causal masking om toekomstige tokens te verbergen. Positional encoding en multi-head attention worden toegvoegd toe om afhankelijkheden in input op te vangen.

PyTorch Deep Learning

Deze module behandelt PyTorch-basics—tensors en training loops evenals tooling om model kwaliteit te meten. Ingegaan wordt op feature scaling/normalization, activatie- en loss-functies en backpropagation.

Neurale Netwerken

Vervolgens bouw je MLP’s en CNN’s in PyTorch, kies je passende activaties en losses en implementeer je backpropagation. Ook NLP-specifieke preprocessing wordt behandeld evenals end-to-end binaire en multiclass-classificatie.

GPT van scratch

Daarna implementeer je een minimale GPT met layer normalization, residual connections en attention + feed-forward (GELU).

Pretraining

Je pretraint de LLM op ongelabelde tekst met next-token prediction en volgt training- versus validation-losses. Je verkent decoding strategies (bijv. temperature, top-k), beheerst randomness voor reproduceerbaarheid en slaat PyTorch-weights op/laadt ze in.

Tuning voor Classificatie

We bereiden datasets en dataloaders voor, initialiseren vanuit pretrained weights en voegen een classification head met softmax toe. Je traint en evalueert met loss/accuracy, met als voorbeeld een LLM-based spam-classification.

Fine-tuning

Tot slot oefen je supervised instruction tuning: datasets formatteren, efficiënt batchen en een pretrained LLM fine-tunen. Je evalueert outputs, exporteert responses/checkpoints en past parameter-efficiënte methoden zoals LoRA toe.

Doelgroep Cursus Large Language Models Bouwen

De cursus Large Language Models Bouwen is bedoeld voor engineers die transformer-based LLM’s willen ontwerpen.

Voorkennis Cursus Large Language Models Bouwen

Deelnemers dienen vertrouwd te zijn met Python. Ervaring met PyTorch of een vergelijkbaar Deep Learning-framework is een plus.

Uitvoering Training Large Language Models Bouwen

De training combineert bondige theorie met begeleide, hands-on labs. Via code-alongs bouw je een mini-GPT, bereid je datasets voor, voer je pretraining en fine-tuning uit en deploy je modellen.

Certificaat Large Language Models Bouwen

Na afloop ontvangen deelnemers een certificaat van deelname aan de cursus Large Language Models Bouwen.

Modules

Module 1 : LLM Intro

  • What is an LLM?
  • Applications of LLMs
  • Stages of Building LLMs
  • Stages of Using LLMs
  • Transformer Architecture
  • Utilizing Large Datasets
  • GPT Architecture Internals
  • Learn Language Patterns
  • Retrieval Augmented Generation
  • Question and Answer Systems
  • QA versus RAG
  • Building an LLM

Module 2 : Working with Text Data

  • Word Embeddings
  • Decoders and Encoders
  • Decoder Only Transformer
  • Tokenizing text
  • Convert Tokens into IDs
  • Special Context Tokens
  • Understand Sentence Structure
  • Byte Pair Encoding
  • Unknown Words
  • Sampling with Sliding Window
  • Creating Token Embeddings
  • Encoding Word Positions

Module 3 : Attentions Mechanism

  • Modeling Long Sequences
  • Capturing Data Dependencies
  • Attention Mechanisms
  • Attending Different Input Parts
  • Using Self-Attention
  • Trainable Weights
  • Hiding Future Words
  • Positional Encoding
  • Causal Attention
  • Masking Weights with Dropout
  • Multihead Attention
  • Stacking Attentions Layers

Module 4 : Pytorch Deep Learning

  • Deep Learning Intro
  • Overview of PyTorch
  • PyTorch Tensors
  • Tensor Operations
  • Model Evaluation Metrics
  • Feature Scaling
  • Feature Normalization
  • Categorical Features
  • Activation Functions
  • Loss Functions
  • Backpropagation

Module 5 : Neural Networks

  • Neural Networks Intro
  • Building NN with PyTorch
  • Multiple Layers of Arrays
  • Convolutional Neural Networks
  • Activation Functions
  • Loss Functions
  • Backpropagation
  • Natural Language Processing
  • Stopword Removal
  • Binary Classification
  • Multi-class Classification

Module 6 : GPT from scratch

  • Coding an LLM Architecture
  • Layer Normalization
  • Normalizing Activations
  • Feed Forward Network
  • GELU Activations
  • Adding Shortcut Connections
  • Connecting Attention
  • Weight Tying
  • Linear Layers in Transformer Block
  • Coding the GPT Model
  • Generating Text

Module 7 : Pretraining

  • Pretraining on Unlabeled Data
  • Calculating Text Generation Loss
  • Training Losses
  • Validation Set Losses
  • Training an LLM
  • Decoding Strategies
  • Control Randomness
  • Temperature Scaling
  • Saving Model Weights in PyTorch
  • Loading Pretrained Weights

Module 8 : Tuning for Classification

  • Categories of Fine-Tuning
  • Preparing the Dataset
  • Creating Data Loaders
  • Top-k Sampling
  • Soft-Max Function
  • Initializing with Pretrained Weights
  • Adding Classification Head
  • Classification Loss and Accuracy
  • Fine-tuning on Supervised Data
  • Using LLM as Spam Classifier

Module 9 : Fine-Tuning

  • Instruction Fine-tuning
  • Supervised Instruction
  • Preparing a Dataset
  • Organizing Training Batches
  • Creating Data Loaders
  • Loading a pretrained LLM
  • Fine-tuning the LLM
  • Extracting and Saving Responses
  • Evaluating Fine-tuned LLM
  • Fine Tuning with LoRA
Meer...
€3.200
ex. BTW
Aangeboden door
SpiralTrain
Onderwerp
Niveau
Duur
4 dagen
Looptijd
24 dagen
Taal
nl
Type product
cursus
Lesvorm
Klassikaal
Aantal deelnemers
Max: 12
Tijdstip
Overdag
Tijden en locaties
Amsterdam
ma 8 dec. 2025
Eindhoven
ma 8 dec. 2025
Houten
ma 8 dec. 2025
Online
ma 8 dec. 2025
Rotterdam
ma 8 dec. 2025
Zwolle
ma 8 dec. 2025
Amsterdam
ma 9 feb. 2026
Eindhoven
ma 9 feb. 2026
Houten
ma 9 feb. 2026
Online
ma 9 feb. 2026
Rotterdam
ma 9 feb. 2026
Zwolle
ma 9 feb. 2026
Amsterdam
ma 13 apr. 2026
Eindhoven
ma 13 apr. 2026
Houten
ma 13 apr. 2026
Online
ma 13 apr. 2026
Rotterdam
ma 13 apr. 2026
Zwolle
ma 13 apr. 2026
Amsterdam
ma 8 jun. 2026
Eindhoven
ma 8 jun. 2026
Houten
ma 8 jun. 2026
Online
ma 8 jun. 2026
Rotterdam
ma 8 jun. 2026
Zwolle
ma 8 jun. 2026
Amsterdam
ma 10 aug. 2026
Eindhoven
ma 10 aug. 2026
Houten
ma 10 aug. 2026
Online
ma 10 aug. 2026
Rotterdam
ma 10 aug. 2026
Zwolle
ma 10 aug. 2026
Amsterdam
ma 12 okt. 2026
Eindhoven
ma 12 okt. 2026
Houten
ma 12 okt. 2026
Online
ma 12 okt. 2026
Rotterdam
ma 12 okt. 2026
Zwolle
ma 12 okt. 2026
Amsterdam
ma 14 dec. 2026
Eindhoven
ma 14 dec. 2026
Houten
ma 14 dec. 2026
Online
ma 14 dec. 2026
Rotterdam
ma 14 dec. 2026
Zwolle
ma 14 dec. 2026
Amsterdam
ma 8 feb. 2027
Eindhoven
ma 8 feb. 2027
Houten
ma 8 feb. 2027
Online
ma 8 feb. 2027
Rotterdam
ma 8 feb. 2027
Zwolle
ma 8 feb. 2027
Amsterdam
ma 12 apr. 2027
Eindhoven
ma 12 apr. 2027
Houten
ma 12 apr. 2027
Online
ma 12 apr. 2027
Rotterdam
ma 12 apr. 2027
Zwolle
ma 12 apr. 2027
Amsterdam
ma 14 jun. 2027
Eindhoven
ma 14 jun. 2027
Houten
ma 14 jun. 2027
Online
ma 14 jun. 2027
Rotterdam
ma 14 jun. 2027
Zwolle
ma 14 jun. 2027
Amsterdam
ma 9 aug. 2027
Eindhoven
ma 9 aug. 2027
Houten
ma 9 aug. 2027
Online
ma 9 aug. 2027
Rotterdam
ma 9 aug. 2027
Zwolle
ma 9 aug. 2027
Amsterdam
ma 11 okt. 2027
Eindhoven
ma 11 okt. 2027
Houten
ma 11 okt. 2027
Online
ma 11 okt. 2027
Rotterdam
ma 11 okt. 2027
Zwolle
ma 11 okt. 2027
Amsterdam
ma 13 dec. 2027
Eindhoven
ma 13 dec. 2027
Houten
ma 13 dec. 2027
Online
ma 13 dec. 2027
Rotterdam
ma 13 dec. 2027
Zwolle
ma 13 dec. 2027
Amsterdam
ma 14 feb. 2028
Eindhoven
ma 14 feb. 2028
Houten
ma 14 feb. 2028
Online
ma 14 feb. 2028
Rotterdam
ma 14 feb. 2028
Zwolle
ma 14 feb. 2028
Amsterdam
ma 10 apr. 2028
Eindhoven
ma 10 apr. 2028
Houten
ma 10 apr. 2028
Online
ma 10 apr. 2028
Rotterdam
ma 10 apr. 2028
Zwolle
ma 10 apr. 2028
Amsterdam
ma 12 jun. 2028
Eindhoven
ma 12 jun. 2028
Houten
ma 12 jun. 2028
Online
ma 12 jun. 2028
Rotterdam
ma 12 jun. 2028
Zwolle
ma 12 jun. 2028
Amsterdam
ma 14 aug. 2028
Eindhoven
ma 14 aug. 2028
Houten
ma 14 aug. 2028
Online
ma 14 aug. 2028
Rotterdam
ma 14 aug. 2028
Zwolle
ma 14 aug. 2028
Amsterdam
ma 9 okt. 2028
Eindhoven
ma 9 okt. 2028
Houten
ma 9 okt. 2028
Online
ma 9 okt. 2028
Rotterdam
ma 9 okt. 2028
Zwolle
ma 9 okt. 2028
Keurmerken aanbieder
NRTO
UWV scholingsvoucher