Observabilité à grande échelle
Grafana, Loki, Thanos, Vector, Elasticsearch. Audits de stack, tuning d'ingestion, migrations Fluentd vers Vector, recording rules, performance des requêtes et dashboards SLO.
- Grafana
- Loki
- Thanos
- Vector
RetakeData / infrastructure practice
RetakeData aide les équipes infrastructure à reprendre le contrôle de systèmes sensibles — observabilité, automatisation, virtualisation, private cloud et IA locale. Conçu et opéré par un SRE senior avec 10+ ans sur des plateformes à enjeux.
Hardware to software · Full-stack infrastructure · Bare metal to private AI
Engineering d'infrastructure on-prem, private-cloud et hybride. Observabilité, automatisation, virtualisation et IA privée — pour les équipes qui doivent garder les workloads sensibles sous leur propre contrôle.
Grafana, Loki, Thanos, Vector, Elasticsearch. Audits de stack, tuning d'ingestion, migrations Fluentd vers Vector, recording rules, performance des requêtes et dashboards SLO.
Modules Terraform multi-provider, Ansible, pipelines GitOps, inventaire Consul et NetBox. L'automatisation qui permet aux petites équipes d'opérer à l'échelle d'une flotte.
100+ noeuds Proxmox déployés avec automatisation PXE. Backends de stockage dont ZFS, NFS, SAN, NVMe-oF et Ceph. Migrations depuis vSphere, conception de clusters HA.
Certaines données opérationnelles ne doivent pas quitter votre réseau : incidents, logs, runbooks, docs internes et procédures. RetakeData construit des systèmes d'IA locaux pour ces environnements : serving de modèles vLLM, pipelines RAG privés, assistants avec RBAC, et intégrations avec votre stack Proxmox, observabilité et documentation existante. Aucune dépendance API externe pour les workflows sensibles, coûts prévisibles, contrôle total des données.
Quelques preuves sur 10 ans d'infrastructure qui ne peut pas tomber en silence.
Exploitation d'une observabilité multi-cluster à 11 TB/jour répartis sur Loki, Elasticsearch et Thanos. Tuning d'ingestion, migration Fluentd vers Vector, recording rules convertissant des TB/jour de logs de load-balancers en métriques. Dans un métier où quelques minutes d'indisponibilité ont un impact à sept chiffres.
Construction d'un pipeline autonome de livraison de VMs en 6 phases : Git PR, Terraform sur vSphere/Proxmox/OpenStack, auto-enregistrement Consul et NetBox, configuration Ansible, inscription backend HAProxy, monitoring Centreon. Sans Kubernetes.
Déploiement de serveurs équipés GPU en datacenter faisant tourner vLLM avec un pipeline RAG privé sur 1000+ documents. Création de Graphia, un agent SRE avec RBAC qui abstrait la complexité de Grafana pour les équipes engineering.
Des outils conçus autour de vrais problèmes opérationnels, pratiques, ouverts et utiles au-delà de notre environnement.

Multiplexeur SSH moderne avec inventaire multi-sources et backends tmux ou iTerm2.
GitHub →
Interface terminal d'audit pour sessions OpenClaw avec événements en direct et streaming temps réel.
GitHub →
Provider Terraform pour l'API Centreon V2, configuration de supervision gérée comme infrastructure as code.
GitHub →Si votre équipe construit de l'infrastructure on-prem, private-cloud ou hybride pour des workloads sensibles, contactez-moi.
Nous contacter