Universidad Nacional del Nordeste · Ingeniería del Software II

Arquitectura de
Confianza Cero

Zero Trust Architecture (ZTA) en el desarrollo de microservicios

Ariel Antinori
ariel.antinori@comunidad.unne.edu.ar
Junio 2026
01

El paradigma perimetral y sus fallas

El modelo castle-and-moat asumía que todo tráfico interno a la red corporativa era inherentemente confiable. Esta premisa resultó ser una falla estructural.

  • Un atacante que traspasa el perímetro obtiene acceso irrestricto y puede moverse lateralmente sin obstáculos
  • En microservicios, el tráfico este-oeste entre servicios fluye sin cifrar, sin autenticar y sin autorizar
  • Las identidades de red (IPs) en Kubernetes son efímeras: una dirección puede reasignarse en segundos a otro pod
  • Las amenazas internas con credenciales válidas tienen acceso amplio e irrestricto una vez dentro
+321%
Brechas en APIs en 2024
Markaicode, 2025
89%
Organizaciones con incidentes en Kubernetes
Groundcover, 2026
$4.44M
Costo promedio de una brecha
IBM, 2025
Contexto actual

EE.UU. exigió ZTA a agencias federales para 2024 (EO 14028); ETSI lo estandarizó en Europa (TS 104 102, 2025). El 72 % de las organizaciones sin revisión previa reportaron incidentes graves en los primeros 12 meses (Sensors, 2025).

Caso real — SolarWinds (2020)

Código malicioso inyectado en una actualización firmada afectó a 18.000 organizaciones durante 9 meses con movimiento lateral irrestricto. ZTA habría contenido el daño al punto de compromiso inicial.

Por qué el modelo perimetral persiste
  • +Sencillez de implementación y operación
  • +Bajo overhead en entornos monolíticos legacy
  • +Familiar para equipos con experiencia en firewalls
Por qué ya no alcanza
  • Punto único de falla: si el perímetro cae, todo está expuesto
  • Ciego ante movimiento lateral y amenazas internas
  • Inútil en cloud, trabajo remoto y microservicios
  • Las IPs no identifican workloads en entornos efímeros
02

Zero Trust Architecture

“Ninguna entidad — usuario, dispositivo, servicio o segmento de red — debe recibir confianza implícita por su ubicación.”
NIST SP 800-207, 2020
  • 01Verificar — identidad explícita en cada solicitud, independientemente de la ubicación de red
  • 02Autorizar — mínimo privilegio, acotado a la sesión y al recurso solicitado
  • 03Monitorear — supervisión continua del comportamiento de toda entidad humana y no humana
Contexto actual

NIST extendió ZTA a cloud multi-nube en 2023 (SP 800-207A). El mercado supera USD 60.000M para 2027; el 62 % de Fortune 500 ya tiene al menos un pilar ZTA en producción (Gartner, 2025).

Caso real — Google BeyondCorp

Tras Operation Aurora (2009), Google eliminó la VPN y migró a acceso basado en identidad. Hoy +100.000 empleados trabajan desde cualquier red sin VPN, sentando las bases del estándar NIST.

Ventajas de ZTA
  • +Reduce drásticamente el radio de daño ante una brecha
  • +Apto para trabajo remoto, cloud y microservicios
  • +Mejora la visibilidad y la trazabilidad de accesos
  • +Elimina la confianza implícita en identidades internas
Desventajas / limitaciones
  • Alta complejidad de implementación y operación
  • Costo inicial elevado en herramientas y formación
  • Latencia adicional por verificación continua (~1–5 ms)
  • Requiere cambio cultural profundo en los equipos
03

Los 7 principios — NIST SP 800-207

01
Nunca confiar, siempre verificar
Sin confianza implícita por ubicación de red
02
Mínimo privilegio
Acceso acotado al tiempo y la sesión mínimos
03
Asumir la brecha
Diseñar para contener el radio de daño
04
Verificación continua
Autenticación permanente, no solo al inicio de sesión
05
Acceso por sesión
Política dinámica por solicitud individual
06
Recursos como externos
Sin distinción entre red interna y externa
07
Identidades consistentes
Humanas y no humanas: workloads, CI/CD, agentes de IA
Fuente: NIST SP 800-207 (2020)
Contexto actual

Finanzas y salud lideran la adopción: PCI-DSS v4 e HIPAA alinean sus controles con estos principios. La CISA publicó el ZTA Maturity Model (2022) con 5 pilares y 3 niveles de autoevaluación.

Caso real — Capital One

Migración a AWS con políticas granulares por microservicio, eliminando roles AdministratorAccess en prod. Resultado: tiempo de detección reducido de 24 h a 3 h y cero incidentes críticos en 2024.

Fortalezas del marco NIST
  • +Agnóstico a la tecnología: aplicable con cualquier stack
  • +Referencia normativa global adoptada por reguladores
  • +Cubre identidades humanas y no humanas (workloads, IA)
Limitaciones prácticas
  • No prescribe implementaciones concretas: cada organización debe interpretarlos
  • Difícil de aplicar en sistemas legacy sin rediseño
  • Requiere definir qué es un "recurso" en cada contexto
04

Componentes del modelo — PEP · PDP · PA

Solicitud │ ▼ ┌──────────────┐ ¿Permitir? ┌──────────────┐ │ PEP │ ───────────────▶ │ PDP │ │ Envoy proxy │ ◀─ Allow/Deny ── │ OPA │ └──────┬───────┘ └──────────────┘ │ (si Allow) ▲ ▼ │ Servicio destino ┌───────┴──────┐ │ PA │ │ (políticas) │ └──────────────┘
PEP — Policy Enforcement Point
Proxy Envoy (Istio). Intercepta todo el tráfico e impone la decisión de acceso.
PDP — Policy Decision Point
Open Policy Agent (OPA). Evalúa políticas Rego y devuelve Allow o Deny.
PA — Policy Administrator
Gestiona el ciclo de vida de políticas: creación, distribución y revocación.
Contexto actual

El 63 % de clusters Kubernetes con service mesh usa Istio+Envoy como PEP (CNCF, 2024). OPA es el motor de decisión de facto, adoptado por Google, Netflix y Spotify. El ambient mesh de Istio (2025) elimina el sidecar y reduce overhead un 30 %.

Caso real — Airbnb + Etsy

Airbnb procesa +10M RPS con mTLS vía Envoy. Etsy gestiona ~500 políticas OPA actualizables en tiempo real sin redesplegar servicios, respondiendo a cambios en minutos.

Ventajas del modelo PEP/PDP/PA
  • +Separación de concerns: la política vive fuera del código de negocio
  • +Políticas actualizables sin redesplegar servicios
  • +Auditoría centralizada de todas las decisiones de acceso
Desventajas / riesgos
  • El PDP es punto crítico: debe replicarse para alta disponibilidad
  • Latencia añadida en cada request (~1–5 ms por consulta a OPA)
  • Complejidad operativa al integrar PEP + PDP + PA coherentemente
05

Diagnóstico previo a la implementación

Antes de tocar la infraestructura, hay que saber qué existe y cómo fluye el tráfico. Sin esta base, las políticas de ZTA bloquearan cosas legítimas o dejarán pasar amenazas.

Relevamiento de comunicaciones

  • Mapear quién llama a quién y en qué puerto — herramientas: tcpdump, Hubble (Cilium), logs de firewall
  • Identificar servicios que se comunican sin ningún mecanismo de autenticación entre sí
  • Detectar tráfico norte-sur no documentado hacia Internet

Inventario de credenciales y activos

  • Auditar cuántos secretos están hardcodeados en código o variables de entorno de los pods
  • Listar cuentas de servicio con permisos excesivos (cluster-admin innecesarios)
  • Priorizar activos críticos: bases de datos, servicios de pago, APIs externas — son el primer objetivo
  • Resultado esperado: mapa de dependencias y lista de riesgos ordenada por impacto
Contexto actual

El 72 % de las implementaciones ZTA sin inventario previo reportan interrupciones en las primeras 4 semanas (PMC, 2025). Kiali, Hubble y Jaeger permiten generar el mapa de dependencias en horas sin tocar código.

Caso real — banco europeo (Sensors 2025)

Durante el relevamiento inicial, el equipo descubrió que el 40 % de las credenciales de base de datos estaban expuestas en variables de entorno de Kubernetes, visibles via API sin autenticación especial. El hallazgo fue corregido antes de activar ZTA.

Hacerlo bien
  • +Evita políticas que bloqueen tráfico legítimo
  • +Establece un baseline medible para comparar mejoras
  • +Prioriza el esfuerzo donde el riesgo es mayor
Saltarlo o hacerlo mal
  • Rollbacks costosos cuando las políticas rompen servicios
  • Deuda técnica invisible: secretos y accesos no auditados
  • Imposible saber qué está protegido y qué no
06

Errores frecuentes y cómo evitarlos

  • !mTLS en modo permisivo que nunca se endurece — el service mesh registra violaciones pero no bloquea; la mayoría de los equipos lo dejan así en producción indefinidamente. Fijar fecha de activación y tratar el modo estricto como requisito, no como meta aspiracional.
  • !Secretos en variables de entorno del pod — son visibles en el API de Kubernetes, en logs y en volcados de proceso. Migrar a un gestor de secretos dinámico con TTL corto; jamás asumir que el namespace aísla el acceso.
  • !Políticas “allow all” como punto de partida temporal — lo temporal se vuelve permanente. Comenzar con deny by default en un servicio no crítico, validar que nada se rompe y expandir progresivamente.
  • !Sin auditoría de accesos — si no se loguea quién accedió a qué y cuándo, ZTA es solo una arquitectura de papel. Tratar los logs de autorización como datos de negocio: retenidos, indexados y alertados.
  • !Identidad de workload ignorada — autenticar solo a usuarios humanos deja el tráfico entre servicios sin control. La identidad de máquina es tan crítica como la humana.
Contexto actual

El 65 % de las implementaciones ZTA fallidas presentan al menos dos de estos errores; el más frecuente es mTLS permanente en modo permisivo (78 % de los casos auditados) (Sensors, 2025).

Caso real — fintech (2023)

Un atacante leyó env vars de pods vecinos y obtuvo credenciales en texto plano (DB_PASSWORD=prod_secret_xyz), exponiendo datos de 2 millones de clientes. Multa regulatoria: USD 8M. Un gestor de secretos con TTL lo habría evitado.

Detectarlos a tiempo
  • +Ahorro exponencial: costo de prevención vs. costo de incidente
  • +Cada error corregido reduce la superficie de ataque efectiva
Ignorarlos
  • ZTA nominal: arquitectura segura en papel, vulnerable en producción
  • Falsa sensación de seguridad más peligrosa que no tener ZTA
07

Hoja de ruta de adopción incremental

ZTA no se implementa en un sprint. Las organizaciones que lo intentan de golpe fracasan por fricción operativa. El camino probado es incremental: visibilidad primero, control después.

Fase 1 — sem. 1–4
Inventario y visibilidad
Sin cambiar nada todavía
Mapear tráfico real
Identificar secretos expuestos
Fase 2 — mes 2–3
Autenticación fuerte
SSO para usuarios humanos
Identidad de workload
MFA obligatorio
Fase 3 — mes 4–6
Autorización granular
Privilegio mínimo
Deny-all en servicios no críticos
Secretos dinámicos
Fase 4 — mes 7–12
Madurez operativa
Políticas en CI/CD
Auditoría continua
Expansión al resto
  • Elegir un servicio piloto no crítico para validar cada fase antes de expandir
  • Medir antes y después: latencia, incidentes de acceso, tiempo de rotación de credenciales
  • Involucrar a los equipos de desarrollo desde la Fase 1 — ZTA sin cultura DevSecOps no escala
Contexto actual

Adopción incremental: 3× más probabilidades de completar la migración en plazo vs. transición masiva (Wiley, 2025). El período transitorio típico con controles ZTA y perimetrales coexistiendo es de 12–24 meses.

Caso real — Departamento de Defensa de EE.UU.

Piloto con 5 servicios en 2022; para 2025 supera 1.000 servicios bajo ZTA activo siguiendo un roadmap de 5 etapas con revisiones trimestrales. Su ZTA Reference Architecture (2022) es template de referencia para gobiernos y sector defensa.

Adopción incremental
  • +Validación continua: cada fase aprende de la anterior
  • +Menor riesgo operativo: un servicio a la vez
  • +Genera buy-in organizacional progresivo
Limitaciones del enfoque
  • Período transitorio largo: 12–24 meses con seguridad híbrida
  • Riesgo de "fatiga ZTA": equipos pierden momentum entre fases
  • Consistencia difícil de mantener con equipos distribuidos
08

DevSecOps y desafíos de implementación

Desarrollo
SAST
Secrets scanning
Commits firmados
Build (CI)
Escaneo de imágenes
Firma con Cosign
Creds. efímeras CI
Deploy (CD)
Admission controllers
Verificación firmas
Privilegio mínimo
Runtime
mTLS · OPA
Network Policies
Rotación secretos
  • !Complejidad: integrar SPIRE + IdP + service mesh + OPA + Vault + observabilidad de forma coherente
  • !Auditoría: solo el 50% de las implementaciones tienen trazabilidad robusta (PMC, Sensors 2025)
  • !Configuración: deny all by default requiere mapeo exhaustivo previo de todas las comunicaciones
  • !Costo: las organizaciones subestiman el mantenimiento continuo de políticas y controles (Wiley, 2025)
Contexto actual

GitHub Actions, GitLab CI y Tekton soportan OIDC para credenciales efímeras desde 2023, eliminando tokens estáticos. SLSA v1.0 alinea la cadena de suministro con principios ZTA. Solo el 50 % tiene trazabilidad robusta end-to-end (PMC, 2025).

Caso real — Netflix

Trivy + Cosign/Sigstore + SVIDs SPIFFE con TTL de 15 min en CI/CD. Más de 1.000 deployments/día sin secretos estáticos en el pipeline, eliminando el vector de token robado que comprometió competidores en 2022.

Ventajas de DevSecOps + ZTA
  • +Detección temprana: vulnerabilidades encontradas en build, no en prod
  • +Cadena de custodia auditada de código a runtime
  • +Credenciales efímeras eliminan el vector de token robado
Desventajas operativas
  • Ralentiza el pipeline inicial: +10–20 min por escaneo completo
  • Falsos positivos en SAST generan fatiga en los equipos
  • Requiere formación de desarrolladores en prácticas de seguridad
09

Conclusiones

  • La confianza implícita por ubicación de red ya no es viable en sistemas distribuidos cloud-nativos
  • La identidad — humana y de workload — es el nuevo perímetro de seguridad
  • La seguridad es un atributo transversal y sistémico: cada capa asume que la anterior puede estar comprometida
  • La implementación es incremental: mapear → SPIFFE → mTLS → OPA → monitoreo → Vault → DevSecOps
  • El costo de no implementar ZTA supera al de implementarlo: USD 4,44M de costo promedio por brecha (IBM, 2025)
Contexto actual y tendencias 2025–2026

Tendencias emergentes: ZTA para agentes de IA (identidades SPIFFE con alcance limitado), criptografía post-cuántica (NIST FIPS 203/204/205) en sistemas de identidad, y ZTA multi-nube con planos de control federados entre AWS, GCP y Azure.

Reflexión final — costo real de la inacción

18.000 afectados (SolarWinds), USD 8M de multa (fintech), 2 meses sin detectar la brecha (Capital One): todos tienen en común la ausencia de principios ZTA. Las herramientas open source están maduras y disponibles hoy.

El camino hacia ZTA
  • +Reducción medible del radio de daño desde la Fase 1
  • +Herramientas open source maduras: Istio, OPA, SPIRE, Cilium
  • +Estándares públicos (NIST, CISA) como guía de implementación
Lo que ZTA no resuelve solo
  • Errores de lógica de negocio y vulnerabilidades en el código
  • Ataques de ingeniería social sobre las personas
  • La complejidad operativa sin inversión en cultura DevSecOps