Productie-AI
in de praktijk.

on-prem · ai agents · lokale ai modellen

Hoi, ik ben Django de Vreng, mede-oprichter van Kamoo. Ik bouw agents, MCP-servers en on-prem deployments op de DGX Spark, en deel wat ik onderweg allemaal leer.

Open de Arena Lees recent werk

Django de Vreng geeft AI-training aan een groep

Posts gepubliceerd: 8
Modellen in de arena: 19
GPU-uren on-prem: 1.4k
DGX Spark in lab: 128GB

02 Over · Django de Vreng

Ik ben Django.

Ik bouw aan de laag tussen taalmodellen en echt werk: agents, MCP-servers, lokale modellen en on-prem AI. Niet als losse demo, maar als software die context ophaalt, tools gebruikt, keuzes voorbereidt en netjes faalt als het moet.

Op deze blog deel ik de technische tussenstand: benchmarks op de DGX Spark, build-logs uit agent-projecten, en field notes over wat in productie overeind blijft. Het meeste komt uit werk bij Kamoo, maar de blog blijft persoonlijk.

Lees mijn hele verhaal →

03 Featured benchmark Volledige arena →

NVFP4 vs BF16 · Gemma-4-26B-A4B-it

NVFP4 wint met 91% throughput-winst, onder druk.

Negen identieke benchmarks, twee precisies. NVFP4 is 22 tot 92 procent sneller per token, en de capaciteit groeit 69 procent op piekuren op de Spark.

NVFP4 128 tok/s · 24 GB

BF16 67 tok/s · 52 GB

Lees de hele post

Decode +91%

Prefill +64%

Concurrency 2.1×

VRAM −54%

HumanEval −1.2pt

04 Recent · build-logs, field notes, on-prem Alle posts →

Iets bouwen?
Of doorpraten
over on-prem.

Mail hello@djangodevreng.nl Werk kamoo.ai LinkedIn @djangodevreng GitHub @djangodevreng RSS /rss.xml

Productie-AI
in de praktijk.

Ik ben Django.

NVFP4 wint met 91% throughput-winst, onder druk.

Gemma-4 v23 op de DGX Spark

De drie getallen achter een snelle DGX Spark

Waarom deze blog en arena bestaan

Gemma-4 op de DGX Spark: NVFP4 vs BF16

Nemotron-3 op de DGX Spark: BF16 vs FP8 vs NVFP4

Iets bouwen?
Of doorpraten
over on-prem.

Productie-AIin de praktijk.

Ik ben Django.

NVFP4 wint met 91% throughput-winst, onder druk.

Gemma-4 v23 op de DGX Spark

De drie getallen achter een snelle DGX Spark

Waarom deze blog en arena bestaan

Gemma-4 op de DGX Spark: NVFP4 vs BF16

Nemotron-3 op de DGX Spark: BF16 vs FP8 vs NVFP4

Iets bouwen?Of doorpratenover on-prem.

Productie-AI
in de praktijk.

Iets bouwen?
Of doorpraten
over on-prem.