Ingénieur systèmes & IA, du cycle CPU au produit
Consultant en architectures haute performance
France - Bretagne - Vannes
Je construis herbert-rs, un moteur d'inférence LLM local en Rust et assembleur, optimisé au niveau instruction. Plus rapide que llama.cpp en decode CPU.
→ Articles techniques
→ Parcours
→ Réserver une consultation