Ingénieur systèmes & IA, du cycle CPU au produit

Consultant en architectures haute performance

France - Bretagne - Vannes

Je construis herbert-rs, un moteur d'inférence LLM local en Rust et assembleur, optimisé au niveau instruction. Plus rapide que llama.cpp en decode CPU.

→ Articles techniques
→ Parcours
→ Réserver une consultation