Construí una plataforma agentic en mi homelab (part-01)

21 June, 2026 | homelab

Serie Homelab Agentic · Parte 0/13 — Del bare metal al agente conversacional. Ver todos los posts

TL;DR

¿Y si en lugar de abrir cuatro tabs para saber si tu infra está sana, simplemente le preguntaras? Eso es lo que construí: un cluster Proxmox convertido en una plataforma con tres agentes IA, 9 MCP servers y 120+ herramientas. 13 posts. Cero suavizado de los fracasos.

El momento en que todo cambió

Era tarde. Yo estaba en la pantalla revisando métricas en Grafana, como lo había hecho cien veces antes. Abrí una terminal. Hice un SSH al nodo. Corrí un comando. Volví a Grafana. Abrí otro tab. Revisé los logs en Loki.

Y en algún momento de ese loop absurdo me pregunté: ¿por qué tengo que ir yo a buscar la información si los datos ya están todos ahí?

No debería tener que recordar qué IP tiene el nodo secundario, ni abrir cuatro tabs para entender si el cluster está sano. Eso es exactamente el tipo de trabajo que debería hacer una máquina. No yo.

Esa noche no dormí bien, pero no por los servidores. Dormí mal porque empecé a imaginar cómo sería tener una plataforma que razona sobre su propia infra. Que puedas preguntarle “¿hay algún nodo con presión de memoria?” y que te responda con contexto real, no con una pantalla llena de números que vos tenés que interpretar.

Eso es lo que construí. Esta serie cuenta cómo.

¿Qué es exactamente un “homelab agentic”?

Buena pregunta. Y no es una pregunta obvia.

Un homelab clásico es un conjunto de servidores en tu casa (o en un rack, si sos de los serios) donde experimentás con tecnología. Proxmox, Docker, Kubernetes, lo que sea. Es tu sandbox. Es donde aprendés sin miedo a romper producción de tu empresa.

Un homelab agentic es eso, más una capa de inteligencia encima.

La diferencia no es cosmética. No es “le puse un chatbot al panel de administración”. Es que los agentes tienen acceso directo a las herramientas de la infra: pueden consultar Prometheus, reiniciar contenedores Docker, listar VMs en Proxmox, revisar logs en Loki, y hacer todo eso de manera autónoma en respuesta a una pregunta o a un trigger de tiempo.

La analogía que más me gusta: antes tenía un tablero de control lleno de indicadores. Ahora tengo un co-piloto que lee esos indicadores y me habla.

El problema que resuelve

Hay un patrón que reconocerás si tenés infra propia, ya sea en cloud o en hierro propio.

Cuando algo falla o cuando querés entender el estado de tu sistema, tenés que hacer un recorrido mental. ¿Dónde están los logs? ¿Cuál es la IP de ese nodo? ¿El servicio corre en Docker o en systemd? ¿Dónde está el dashboard de esa cosa?

Eso se llama context switching cognitivo, y es agotador. Multiplicate ese agotamiento por meses de operar infra y entendés por qué los SREs a veces parecen zombies.

Lo que construí invierte el modelo: ya no voy yo a buscar la información. La información viene a mí, filtrada, contextualizada, y presentada en lenguaje natural.

El Agent-01 puede responderme “¿cuánta memoria libre tiene el cluster Proxmox ahora mismo?” en tiempo real, consultando Prometheus directamente.

El Agent-02 revisa los logs cada mañana a las 8am y me manda un resumen por WhatsApp antes de que yo abra la computadora. Antes de que yo abra la computadora. Eso es operación proactiva.

El Agent-03 investiga noticias de DevOps/IA, las analiza, y escribe un draft de newsletter. Básicamente un equipo de research automatizado.

El stack que construí

Para que tengas el mapa completo antes de entrar en detalles:

Infraestructura base:

Cluster Proxmox de dos nodos físicos
Un tercer nodo con TrueNAS y storage ZFS Mirror 2×2TB
VPS como punto de entrada con WireGuard VPN
Red LAN 192.168.100.0/24, dominio interno
AdGuard DNS: propio primario y secundario

Stack de observabilidad (la base sin la cual nada funciona):

OpenTelemetry / Alloy como collector
Prometheus para métricas
Loki para logs
Grafana para visualización
Langfuse self-hosted para tracing específico de LLMs
Ntfy para alertas push

Los agentes :

Agent-01: Infra Query — patrón ReAct, GPT-4o-mini, consultas conversacionales sobre el cluster
Agent-02: Log Analyzer — pipeline secuencial, cron, análisis diario de logs con delivery por WhatsApp y ntfy
Agent-03: News Investigator — arquitectura multi-agente, search + analysis + writing

El protocolo que une todo:

Model Context Protocol (MCP) — el estándar que le da herramientas reales a los LLMs
9 servidores MCP corriendo: Proxmox, Grafana, Docker, WordPress, y más
120+ herramientas expuestas al LLM

Cada uno de esos componentes tiene su post. Y cada post tiene la historia de cómo funcionó, cómo no funcionó al principio, y qué aprendí.

Por qué 13 posts y no uno

La respuesta corta: porque intenté escribirlo en uno y quedó horrible.

La respuesta larga: porque cada capa de esta arquitectura tiene su propia complejidad, sus propias decisiones de diseño, y sus propias historias de “esto no funcionó como esperaba”. Comprimir eso en un solo post es hacer un flyer cuando lo que necesitás es una guía.

Además, y esto es importante, la serie está diseñada para que cada post funcione de manera independiente. Si ya tenés observabilidad y solo querés saber cómo configurar MCP, podés ir directo al Post 03. Si ya entendés MCP y querés ver cómo se implementa un agente ReAct, Post 05 te espera.

No tenés que leer todo en orden. Pero si lo hacés en orden, la historia tiene sentido de principio a fin.

Para quién es esto

Seamos honestos sobre la audiencia, porque esto no es para principiantes absolutos.

Si estás empezando en DevOps y nunca configuraste un servidor, hay mejores lugares para comenzar. Esta serie asume que sabés lo que es Docker, que no te da miedo una terminal, y que entendés básicamente qué es una VM.

Dicho eso, tampoco tenés que ser un SRE de 10 años con cicatrices de batallar con Kubernetes en producción. Si sos un desarrollador con curiosidad por la infra, un QA que quiere entender cómo funciona el backend del sistema que testea, o un DevOps que está mirando los agentes de IA con interés (y con escepticismo sano, que también está bien), esta serie es para vos.

El objetivo no es que copies mi homelab exacto. Es que entiendas las decisiones, los patrones, y las ideas, y que puedas aplicarlas a tu propio contexto. Sea en cloud, sea en hierro, sea en una VM que corrés en tu laptop.

Índice completo de la serie

Acá está el mapa completo. Marcá los que te interesen:

Post Qué vas a encontrar

###	Post	Qué vas a encontrar
00	Estás aquí — Intro de la serie	El manifiesto, el mapa, el por qué
01	Por qué monté un homelab en 2026	Hardware, costos, decisiones, honestidad sobre lo que salió mal
02	Stack de observabilidad: Grafana + OTEL + Prometheus	La base de datos sin la cual los agentes son inútiles
03	Model Context Protocol: cómo la IA habla con tu infra	El protocolo que lo hace posible, explicado sin buzzwords
04	8 servidores MCP corriendo en paralelo	La arquitectura de herramientas: Proxmox, Grafana, Docker y más
05	Agente ReAct para consultas de infra	El primer agente real: razona, consulta, responde
06	El agente que avisa solo	Log Analyzer: cron + análisis + WhatsApp antes de que despiertes
07	Sistema multi-agente para newsletter	Search, análisis y escritura distribuidos entre agentes
08	El bug de asyncio/anyio que me costó dos días	El bug más tonto que tuve con consecuencias reales
09	Por qué hash() en Python me rompió el caché	El bug más tonto que tuve con consecuencias reales
10	Langfuse: tracing para LLMs en producción	Cómo observar lo que hacen tus agentes por dentro
11	Dashboard React para el stack agentic	La UI que le puse encima a todo esto
12	Claude Code + MCPs: el meta-nivel	Usar el mismo stack para desarrollar el stack

Cómo empezar

Si llegaste acá sin contexto previo y querés empezar desde cero, el orden natural es este:

Post 01 — Entiende por qué el homelab y cuál es el hardware base
Post 02 — Monta la observabilidad (sin esto, nada de lo demás tiene sentido)
Post 03 — Entendé MCP antes de tocar código de agentes
A partir de ahí, podés elegir tu propia aventura

Si ya tenés infra y solo te interesa la parte de agentes, entrá directo por el Post 03.

Si lo que te trajo acá fue un bug específico o una tecnología específica, Langfuse (Post 10) o el bug de asyncio (Post 08) son self-contained.

El homelab no es un hobby. Es un laboratorio. Y este laboratorio ahora tiene cerebro propio.

Bienvenido a la serie.

Lo que sigue

Siguiente → Por qué monté un homelab en 2026 (y cuánto me costó la cordura)
También en esta serie:

Model Context Protocol: cómo la IA habla con tu infra
Agente ReAct para consultas de infra
Langfuse: tracing para LLMs en producción

¿Te fue útil? Dejá un comentario o compartilo. Y si tenés dudas, encontrá el resto de la historia en la serie completa.