Construí una plataforma agentic en mi homelab (part-01)
Serie Homelab Agentic · Parte 0/13 — Del bare metal al agente conversacional. Ver todos los posts
TL;DR
¿Y si en lugar de abrir cuatro tabs para saber si tu infra está sana, simplemente le preguntaras? Eso es lo que construí: un cluster Proxmox convertido en una plataforma con tres agentes IA, 9 MCP servers y 120+ herramientas. 13 posts. Cero suavizado de los fracasos.
El momento en que todo cambió
Era tarde. Yo estaba en la pantalla revisando métricas en Grafana, como lo había hecho cien veces antes. Abrí una terminal. Hice un SSH al nodo. Corrí un comando. Volví a Grafana. Abrí otro tab. Revisé los logs en Loki.
Y en algún momento de ese loop absurdo me pregunté: ¿por qué tengo que ir yo a buscar la información si los datos ya están todos ahí?
No debería tener que recordar qué IP tiene el nodo secundario, ni abrir cuatro tabs para entender si el cluster está sano. Eso es exactamente el tipo de trabajo que debería hacer una máquina. No yo.
Esa noche no dormí bien, pero no por los servidores. Dormí mal porque empecé a imaginar cómo sería tener una plataforma que razona sobre su propia infra. Que puedas preguntarle “¿hay algún nodo con presión de memoria?” y que te responda con contexto real, no con una pantalla llena de números que vos tenés que interpretar.
Eso es lo que construí. Esta serie cuenta cómo.
¿Qué es exactamente un “homelab agentic”?
Buena pregunta. Y no es una pregunta obvia.
Un homelab clásico es un conjunto de servidores en tu casa (o en un rack, si sos de los serios) donde experimentás con tecnología. Proxmox, Docker, Kubernetes, lo que sea. Es tu sandbox. Es donde aprendés sin miedo a romper producción de tu empresa.
Un homelab agentic es eso, más una capa de inteligencia encima.
La diferencia no es cosmética. No es “le puse un chatbot al panel de administración”. Es que los agentes tienen acceso directo a las herramientas de la infra: pueden consultar Prometheus, reiniciar contenedores Docker, listar VMs en Proxmox, revisar logs en Loki, y hacer todo eso de manera autónoma en respuesta a una pregunta o a un trigger de tiempo.
La analogía que más me gusta: antes tenía un tablero de control lleno de indicadores. Ahora tengo un co-piloto que lee esos indicadores y me habla.
El problema que resuelve
Hay un patrón que reconocerás si tenés infra propia, ya sea en cloud o en hierro propio.
Cuando algo falla o cuando querés entender el estado de tu sistema, tenés que hacer un recorrido mental. ¿Dónde están los logs? ¿Cuál es la IP de ese nodo? ¿El servicio corre en Docker o en systemd? ¿Dónde está el dashboard de esa cosa?
Eso se llama context switching cognitivo, y es agotador. Multiplicate ese agotamiento por meses de operar infra y entendés por qué los SREs a veces parecen zombies.
Lo que construí invierte el modelo: ya no voy yo a buscar la información. La información viene a mí, filtrada, contextualizada, y presentada en lenguaje natural.
El Agent-01 puede responderme “¿cuánta memoria libre tiene el cluster Proxmox ahora mismo?” en tiempo real, consultando Prometheus directamente.
El Agent-02 revisa los logs cada mañana a las 8am y me manda un resumen por WhatsApp antes de que yo abra la computadora. Antes de que yo abra la computadora. Eso es operación proactiva.
El Agent-03 investiga noticias de DevOps/IA, las analiza, y escribe un draft de newsletter. Básicamente un equipo de research automatizado.
El stack que construí
Para que tengas el mapa completo antes de entrar en detalles:
Infraestructura base:
- Cluster Proxmox de dos nodos físicos
- Un tercer nodo con TrueNAS y storage ZFS Mirror 2×2TB
- VPS como punto de entrada con WireGuard VPN
- Red LAN 192.168.100.0/24, dominio interno
- AdGuard DNS: propio primario y secundario
Stack de observabilidad (la base sin la cual nada funciona):
- OpenTelemetry / Alloy como collector
- Prometheus para métricas
- Loki para logs
- Grafana para visualización
- Langfuse self-hosted para tracing específico de LLMs
- Ntfy para alertas push
Los agentes :
- Agent-01: Infra Query — patrón ReAct, GPT-4o-mini, consultas conversacionales sobre el cluster
- Agent-02: Log Analyzer — pipeline secuencial, cron, análisis diario de logs con delivery por WhatsApp y ntfy
- Agent-03: News Investigator — arquitectura multi-agente, search + analysis + writing
El protocolo que une todo:
- Model Context Protocol (MCP) — el estándar que le da herramientas reales a los LLMs
- 9 servidores MCP corriendo: Proxmox, Grafana, Docker, WordPress, y más
- 120+ herramientas expuestas al LLM
Cada uno de esos componentes tiene su post. Y cada post tiene la historia de cómo funcionó, cómo no funcionó al principio, y qué aprendí.
Por qué 13 posts y no uno
La respuesta corta: porque intenté escribirlo en uno y quedó horrible.
La respuesta larga: porque cada capa de esta arquitectura tiene su propia complejidad, sus propias decisiones de diseño, y sus propias historias de “esto no funcionó como esperaba”. Comprimir eso en un solo post es hacer un flyer cuando lo que necesitás es una guía.
Además, y esto es importante, la serie está diseñada para que cada post funcione de manera independiente. Si ya tenés observabilidad y solo querés saber cómo configurar MCP, podés ir directo al Post 03. Si ya entendés MCP y querés ver cómo se implementa un agente ReAct, Post 05 te espera.
No tenés que leer todo en orden. Pero si lo hacés en orden, la historia tiene sentido de principio a fin.
Para quién es esto
Seamos honestos sobre la audiencia, porque esto no es para principiantes absolutos.
Si estás empezando en DevOps y nunca configuraste un servidor, hay mejores lugares para comenzar. Esta serie asume que sabés lo que es Docker, que no te da miedo una terminal, y que entendés básicamente qué es una VM.
Dicho eso, tampoco tenés que ser un SRE de 10 años con cicatrices de batallar con Kubernetes en producción. Si sos un desarrollador con curiosidad por la infra, un QA que quiere entender cómo funciona el backend del sistema que testea, o un DevOps que está mirando los agentes de IA con interés (y con escepticismo sano, que también está bien), esta serie es para vos.
El objetivo no es que copies mi homelab exacto. Es que entiendas las decisiones, los patrones, y las ideas, y que puedas aplicarlas a tu propio contexto. Sea en cloud, sea en hierro, sea en una VM que corrés en tu laptop.
Índice completo de la serie
Acá está el mapa completo. Marcá los que te interesen:
Post Qué vas a encontrar
| ### | Post | Qué vas a encontrar |
| 00 | Estás aquí — Intro de la serie | El manifiesto, el mapa, el por qué |
| 01 | Por qué monté un homelab en 2026 | Hardware, costos, decisiones, honestidad sobre lo que salió mal |
| 02 | Stack de observabilidad: Grafana + OTEL + Prometheus | La base de datos sin la cual los agentes son inútiles |
| 03 | Model Context Protocol: cómo la IA habla con tu infra | El protocolo que lo hace posible, explicado sin buzzwords |
| 04 | 8 servidores MCP corriendo en paralelo | La arquitectura de herramientas: Proxmox, Grafana, Docker y más |
| 05 | Agente ReAct para consultas de infra | El primer agente real: razona, consulta, responde |
| 06 | El agente que avisa solo | Log Analyzer: cron + análisis + WhatsApp antes de que despiertes |
| 07 | Sistema multi-agente para newsletter | Search, análisis y escritura distribuidos entre agentes |
| 08 | El bug de asyncio/anyio que me costó dos días | El bug más tonto que tuve con consecuencias reales |
| 09 | Por qué hash() en Python me rompió el caché | El bug más tonto que tuve con consecuencias reales |
| 10 | Langfuse: tracing para LLMs en producción | Cómo observar lo que hacen tus agentes por dentro |
| 11 | Dashboard React para el stack agentic | La UI que le puse encima a todo esto |
| 12 | Claude Code + MCPs: el meta-nivel | Usar el mismo stack para desarrollar el stack |
Cómo empezar
Si llegaste acá sin contexto previo y querés empezar desde cero, el orden natural es este:
- Post 01 — Entiende por qué el homelab y cuál es el hardware base
- Post 02 — Monta la observabilidad (sin esto, nada de lo demás tiene sentido)
- Post 03 — Entendé MCP antes de tocar código de agentes
- A partir de ahí, podés elegir tu propia aventura
Si ya tenés infra y solo te interesa la parte de agentes, entrá directo por el Post 03.
Si lo que te trajo acá fue un bug específico o una tecnología específica, Langfuse (Post 10) o el bug de asyncio (Post 08) son self-contained.
El homelab no es un hobby. Es un laboratorio. Y este laboratorio ahora tiene cerebro propio.
Bienvenido a la serie.
Lo que sigue
Siguiente → Por qué monté un homelab en 2026 (y cuánto me costó la cordura)
También en esta serie:
- Model Context Protocol: cómo la IA habla con tu infra
- Agente ReAct para consultas de infra
- Langfuse: tracing para LLMs en producción
¿Te fue útil? Dejá un comentario o compartilo. Y si tenés dudas, encontrá el resto de la historia en la serie completa.