TRILHA 6

📈 Escalando e Evoluindo

De 100 usuarios para 100 milhoes — escalando sistemas, otimizando performance e construindo produtos que evoluem

5
Módulos
35
Tópicos
~3h
de conteúdo
Avançado
Nível

Navegação Rápida

6.1

📊 Estrategias de Escala

De 100 usuarios para 100 milhoes — sem reescrever

6.2

⚡ Performance e Otimizacao

Medir, identificar, otimizar — nessa ordem

6.3

🏢 Multi-tenancy e SaaS

Um sistema, muitos clientes — como isolar e escalar

6.4

🎓 Produto Educacional e Comunidade

Construindo negocios de conhecimento escalaveis

6.5

🔮 Futuro da Arquitetura

Tendencias e para onde estamos indo

Conteúdo Detalhado
6.1 ~35 min

📊 Estrategias de Escala

De 100 usuarios para 100 milhoes — sem reescrever

O que e

Vertical: maquina mais potente (mais CPU, RAM). Horizontal: mais maquinas atras de load balancer. Vertical tem teto; horizontal escala infinitamente (em teoria).

Por que aprender

Vertical e simples ate o limite do hardware. Horizontal exige stateless design. Ex: O Stack Overflow roda em apenas 9 servidores web (vertical scaling + otimizacao extrema). O Twitter usa milhares de servidores (horizontal). Ambos servem milhoes — abordagens opostas.

Conceitos-chave

Scale up vs. scale out Stateless services Load balancing Auto-scaling Cost curves Breaking point

O que e

Distribui requests entre multiplas instancias: round-robin, least connections, IP hash, weighted. L4 (TCP) vs. L7 (HTTP).

Por que aprender

Sem load balancer, uma instancia recebe todo trafego e cai enquanto outras ficam ociosas. Ex: O NGINX como load balancer: 3 instancias do app, round-robin, health check a cada 5s. Se uma cai, remove automaticamente. Usuario nunca percebe.

Conceitos-chave

L4 vs. L7 load balancing Algorithms (round-robin, least-conn, IP hash) Health checks Sticky sessions (avoid!) HAProxy, NGINX, AWS ALB

O que e

Estrategias para escalar banco: read replicas, connection pooling, sharding, partitioning, caching layer.

Por que aprender

App escala facil (stateless, horizontal). Banco e stateful e escala com dor. Ex: O Instagram escalou PostgreSQL de 0 a 1B photos: read replicas para queries de leitura + PgBouncer para connection pooling + partitioning por user_id. Sem sharding — PostgreSQL aguentou.

Conceitos-chave

Read replicas Connection pooling (PgBouncer) Sharding strategies Table partitioning Query optimization Vertical partitioning

O que e

Multiplas camadas de cache: browser → CDN → API gateway → application (Redis) → database (query cache). Cada camada reduz carga na seguinte.

Por que aprender

Cache bem feito reduz carga no banco em 95%+. Ex: O Reddit cache: CDN para estaticos, Redis para hot posts, PostgreSQL para tudo. 90% das page views servidas do cache, banco respira.

Conceitos-chave

Cache layers Cache-aside vs. write-through TTL strategies Cache invalidation Thundering herd Cache stampede

O que e

Em vez de processar tudo sincronamente, coloca em fila e processa no ritmo que o sistema aguenta. Absorve picos sem escalar infra.

Por que aprender

Picos de trafego quebram sistemas sincronos. Filas absorvem e nivelam. Ex: O iFood no Super Bowl: 3x mais pedidos em 15 minutos. Sem fila: sistema cai. Com SQS: pedidos entram na fila, processados no ritmo normal, todos atendidos em 20 minutos.

Conceitos-chave

Message queues (SQS, RabbitMQ, Redis Streams) Consumer scaling Back pressure Dead letter queues FIFO vs. standard

O que e

CDN serve conteudo estatico de PoPs globais. Edge computing executa logica (Cloudflare Workers, Vercel Edge) proximo ao usuario.

Por que aprender

Reduz latencia de 200ms para 20ms para usuarios globais. Ex: Cloudflare Workers processa auth e routing na edge — o request nem chega ao origin server para checks basicos. Latencia: 5ms em vez de 150ms.

Conceitos-chave

CDN (Cloudflare, CloudFront) Edge functions Static assets at edge API caching at edge Global load balancing

O que e

Checklist pratico: (1) Profile primeiro, (2) Cache hot paths, (3) Add read replicas, (4) Optimize queries, (5) Add CDN, (6) Go stateless, (7) Horizontal scale app, (8) Queue heavy work, (9) Shard if needed, (10) Edge computing.

Por que aprender

A maioria dos problemas de escala se resolve nos passos 1-5. Sharding (passo 9) e raramente necessario. Ex: O Shopify escala 175B/ano de GMV com: MySQL, Redis, CDN, background jobs. Sem sharding do banco principal ate 2023 (15 anos depois de fundado).

Conceitos-chave

Profile before optimize 80/20 rule Step-by-step scaling Avoiding premature optimization Scaling budget
6.2 ~35 min

⚡ Performance e Otimizacao

Medir, identificar, otimizar — nessa ordem

O que e

Identificar onde o tempo e gasto: CPU profiling, memory profiling, query profiling. Nao otimize sem dados.

Por que aprender

Intuicao sobre performance esta errada 90% das vezes. Ex: Dev achava que "JSON parsing e o bottleneck". Profile mostrou: 95% do tempo era em queries N+1 no banco. Otimizar JSON parsing economizaria 2ms. Fix do N+1 economizou 800ms.

Conceitos-chave

CPU profiling Memory profiling Flame graphs EXPLAIN ANALYZE APM tools (New Relic, Datadog) Performance budget

O que e

EXPLAIN ANALYZE para entender execution plan. Adicionar indices. Evitar N+1. Usar JOINs em vez de queries separadas. Paginacao com cursor.

Por que aprender

Uma query lenta pode derrubar o banco inteiro. Ex: N+1 em lista de pedidos: 1 query para pedidos + 1 query por pedido para items. 100 pedidos = 101 queries. Com JOIN: 1 query. De 500ms para 5ms.

Conceitos-chave

EXPLAIN ANALYZE N+1 queries Index strategies Query plan optimization Connection pooling Slow query log

O que e

Comprimir imagens (WebP, AVIF), font subsetting, CSS/JS minification, tree shaking, lazy loading, code splitting.

Por que aprender

Assets representam 60-80% do peso de uma pagina. Ex: Converter JPG para WebP reduz tamanho em 30-50%. Lazy loading de imagens below-the-fold reduz initial load em 40%. Font subsetting (so caracteres usados) reduz de 300KB para 30KB.

Conceitos-chave

Image formats (WebP, AVIF) Lazy loading Code splitting Tree shaking Font subsetting Compression (gzip, brotli)

O que e

Otimizacoes server-side: connection pooling, response caching, async processing, query optimization, efficient serialization.

Por que aprender

Frontend nao pode compensar backend lento. Ex: API que retorna em 2s = UX impossivel de salvar. Connection pooling sozinho pode reduzir latencia de 200ms para 20ms (elimina overhead de criar conexao TCP + TLS a cada request).

Conceitos-chave

Connection pooling HTTP caching (ETag, Last-Modified) Async/await Response compression Pagination Field selection

O que e

Otimizar carregamento: Critical CSS inline, defer scripts, preload critical resources, service worker, skeleton screens.

Por que aprender

53% dos usuarios abandonam se carrega > 3s. Core Web Vitals afetam SEO. Ex: Mercado Livre otimizou FCP de 3.2s para 1.1s: critical CSS inline + lazy loading de imagens + preconnect CDN. Resultado: +10% conversao.

Conceitos-chave

Critical rendering path CSS inline JS defer/async Preload/prefetch Service workers Skeleton screens Core Web Vitals

O que e

Enviar menos dados: paginacao, field selection (GraphQL/sparse fields), compression, Protocol Buffers em vez de JSON.

Por que aprender

API que retorna objeto completo quando so precisa de 2 campos desperdica banda. Ex: REST endpoint retorna user completo (50 campos, 5KB) quando o frontend precisa de name e avatar (2 campos, 200B). GraphQL resolve: peca so o que precisa.

Conceitos-chave

Pagination (cursor-based) Field selection Response compression Protocol Buffers GraphQL for mobile Sparse fieldsets

O que e

Testar performance sob carga: load testing (carga normal), stress testing (acima do normal), spike testing (pico repentino), soak testing (longa duracao).

Por que aprender

"Funcionou com 10 usuarios" nao garante que funciona com 10k. Ex: O k6 (Grafana) simula 1000 users simultaneos fazendo checkout. Resultado: banco esgota connections em 300 users. Fix: PgBouncer + read replicas. Agora suporta 5000.

Conceitos-chave

k6, JMeter, Locust Load vs. stress vs. spike vs. soak testing Performance baselines Bottleneck identification
6.3 ~35 min

🏢 Multi-tenancy e SaaS

Um sistema, muitos clientes — como isolar e escalar

O que e

Tres modelos: (1) tabela compartilhada (tenant_id column), (2) schema por tenant, (3) banco por tenant. Cada um com trade-offs de custo, isolamento e complexidade.

Por que aprender

A escolha define custo e escalabilidade do SaaS. Ex: O Shopify usa "pods" — grupos de tenants compartilham infraestrutura, mas grandes tenants (>US$1M/mes) ganham pod dedicado. Hibrido pragmatico.

Conceitos-chave

Shared database Schema per tenant Database per tenant Hybrid approach Tenant isolation Cost per tenant

O que e

Garantir que queries sempre filtram por tenant_id. Row Level Security (RLS) no PostgreSQL. API middleware que injeta tenant context.

Por que aprender

Vazamento entre tenants e o bug mais grave em SaaS. Ex: O Zendesk teve bug onde tickets de um cliente apareciam para outro — breach de dados, perda de confianca, processos. RLS no PostgreSQL previne isso no nivel do banco.

Conceitos-chave

Row Level Security (RLS) Tenant context middleware Query scoping Data encryption per tenant Audit logging Penetration testing

O que e

Usar Stripe Billing para: planos, trials, upgrades/downgrades, invoices, metered billing. Nao construa billing in-house.

Por que aprender

Billing e surpreendentemente complexo: proration, trials, dunning, tax, refunds, multi-currency. Ex: Construir billing in-house levou 6 meses de dev time no Notion. Quando migraram para Stripe Billing, ganharam features que levariam mais 12 meses para construir.

Conceitos-chave

Stripe Billing Plans/prices Metered billing Proration Dunning Tax calculation Webhooks for billing events

O que e

Controlar features por plano/tenant: free (features basicas), pro (advanced), enterprise (tudo + customizacao). Feature flags controlam acesso.

Por que aprender

Monetizacao de SaaS depende de diferenciar planos. Ex: O Notion: free (blocks limitados), Plus (ilimitado), Business (admin features), Enterprise (SSO + audit). Cada upgrade desbloqueia features via flags, sem deploy.

Conceitos-chave

Feature flags per plan Entitlements Usage limits Soft vs. hard limits Upgrade prompts Feature gating middleware

O que e

Fluxo automatico: signup → create tenant → provision resources → seed data → welcome email → guided tour.

Por que aprender

Onboarding ruim = churn no dia 1. Ex: O Slack onboarding: cria workspace → importa contatos → sugere channels → envia primeira mensagem — tudo em 3 minutos. Time-to-value baixissimo. Resultado: 93% de retencao D30.

Conceitos-chave

Self-service onboarding Tenant provisioning Seed data Guided tours Time-to-first-value Activation metrics

O que e

Lidar com "noisy neighbors": rate limiting per tenant, resource quotas, dedicated infrastructure para grandes clientes.

Por que aprender

Sem isolamento de recursos, um tenant pesado degrada todos os outros. Ex: Um tenant fazendo import de 1M de rows saturou o banco compartilhado — todos os outros tenants sofreram latencia de 10s. Fix: queue de imports com rate limit per tenant + read replicas.

Conceitos-chave

Noisy neighbor problem Rate limiting per tenant Resource quotas Tenant-aware scaling Dedicated infrastructure tier Fair scheduling

O que e

i18n (internacionalizacao): suporte a multiplos idiomas, moedas, fusos horarios, formatos de data, regulacoes locais.

Por que aprender

Expansao global e multiplicador de receita. Ex: O Canva suporta 130+ idiomas — cada string e uma chave que aponta para traducoes. Adicionar novo idioma = arquivo JSON de traducoes, sem tocar em codigo.

Conceitos-chave

i18n/l10n ICU MessageFormat Date/currency formatting (Intl API) RTL support Locale detection Translation management (Crowdin, Lokalise)
6.4 ~35 min

🎓 Produto Educacional e Comunidade

Construindo negocios de conhecimento escalaveis

O que e

Tratar conteudo educacional com mentalidade de engenharia: versionado, modular, com metricas de qualidade. HTML estatico + CDN para maxima performance e custo zero.

Por que aprender

Plataformas de curso sao caras e limitam. HTML estatico e infinitamente customizavel e gratis de hospedar. Ex: A INEMA.CLUB serve cursos como HTML estatico via Cloudflare — load time < 500ms, custo R$0/mes, design totalmente customizado. Zero dependencia de Hotmart, Teachable ou Thinkific.

Conceitos-chave

Content-as-code HTML estatico CDN deployment Template system Version control for content Zero-cost hosting

O que e

Usar LLMs para auxiliar na criacao: estruturar modulos, gerar exemplos, criar exercicios, revisar texto. Humano define estrategia, IA executa producao.

Por que aprender

IA 10x a velocidade de producao de conteudo mantendo qualidade. Ex: Workflow INEMA: humano define topico + objetivos → Claude gera draft com exemplos → humano revisa e ajusta → n8n formata em HTML → deploy automatico. 1 modulo/dia vs. 1 modulo/semana.

Conceitos-chave

AI-assisted writing Prompt templates for education Quality review pipeline Content consistency Style guides Plagiarism avoidance

O que e

Metricas alem de "taxa de conclusao": tempo por modulo, quiz scores, revisitas (voltou para reler?), aplicacao pratica, NPS.

Por que aprender

Curso com 80% de conclusao mas 10% de aplicacao nao esta ensinando. Ex: Duolingo mede: streak (consistencia), quiz accuracy (aprendizado), time to answer (fluencia). Nao mede "concluiu licao" — mede se APRENDEU.

Conceitos-chave

Completion rate Assessment scores Time on task Return visits Application rate Learner NPS Cohort analysis

O que e

Comunidade paga onde membros trocam experiencias, fazem networking, recebem conteudo exclusivo e mentorias. Slack, Discord, Circle.

Por que aprender

Comunidade tem retencao 3-5x maior que curso one-shot. Ex: A INEMA.VIP combina: cursos (conteudo) + comunidade (networking) + mentorias (aceleracao). Retencao de 85% vs. 15% de cursos tradicionais.

Conceitos-chave

Community-Led Growth Engagement loops Gamification User-generated content Moderation Onboarding community members

O que e

Modelos: curso avulso, assinatura, freemium, cohort-based, corporate training, licensing.

Por que aprender

O modelo de monetizacao define a arquitetura necessaria. Assinatura precisa de billing recorrente. Cohort precisa de turmas. Ex: Comparativo: curso avulso (LTV baixo, sem retencao) vs. assinatura (LTV alto, precisa reter mes a mes) vs. cohort (LTV alto, commitment temporal). Cada um exige features diferentes.

Conceitos-chave

One-time vs. recurring Freemium conversion Cohort-based courses B2B licensing Pricing psychology LTV/CAC

O que e

Pipeline automatizado: pesquisa → outline → draft (IA) → revisao → formatacao → deploy. Tudo orquestrado por n8n.

Por que aprender

Producao manual nao escala. Com pipeline, 1 pessoa produz conteudo de 5. Ex: Pipeline INEMA: Airtable (planejamento) → Claude (draft) → n8n (formatacao HTML) → GitHub (versionamento) → Cloudflare (deploy). Novo modulo publicado com 1 comando.

Conceitos-chave

Content pipeline n8n orchestration Template-based generation Quality gates Automated publishing Content calendar

O que e

Estrategias de crescimento sem paid ads: SEO (conteudo otimizado), conteudo gratuito (blog, YouTube, newsletter), referral programs, community-led growth.

Por que aprender

Paid ads tem CAC crescente. Organico tem CAC decrescente ao longo do tempo. Ex: O Ahrefs cresce principalmente com blog SEO — 7M visitas/mes organicas. Cada artigo e um "vendedor" 24/7 que custa zero apos publicado.

Conceitos-chave

SEO fundamentals Content marketing Newsletter growth Referral programs Social proof Community-Led Growth
6.5 ~30 min

🔮 Futuro da Arquitetura

Tendencias e para onde estamos indo

O que e

Nova geracao de apps onde IA nao e feature add-on, mas o core. Cursor (IDE), Perplexity (search), Midjourney (design), Claude Code (dev). Arquitetura fundamentalmente diferente.

Por que aprender

Apps IA-native vao substituir categorias inteiras de software. Ex: O Cursor nao e "VS Code com AI plugin" — e IDE redesenhada onde IA entende contexto completo do projeto, sugere, edita e executa. A arquitetura e profundamente diferente de "VS Code + Copilot".

Conceitos-chave

AI-native vs. AI-augmented Context-aware systems Agentic interfaces New UX patterns Human-AI collaboration

O que e

Logica de aplicacao executada em servers distribuidos globalmente, perto do usuario. Cloudflare Workers, Deno Deploy, Vercel Edge.

Por que aprender

Latencia global de <50ms e possivel. Ex: Cloudflare Workers roda em 300+ cidades. Uma funcao de auth executa no PoP mais proximo — Sao Paulo para brasileiros, Frankfurt para europeus. Latencia: 5-15ms em vez de 100-200ms.

Conceitos-chave

Edge functions Durable Objects Edge databases (Turso, Neon) Global state Cold start elimination Edge-first architecture

O que e

Formato binario que roda em browsers com performance near-native. Permite compilar C, Rust, Go para rodar no browser. No server: WASI permite sandboxed execution.

Por que aprender

WASM esta expandindo o que e possivel no browser e no edge. Ex: O Figma roda rendering engine em WASM — performance de app nativo no browser. O Photoshop Web usa WASM. Antes, impossivel sem instalar software.

Conceitos-chave

WASM WASI Component Model Performance gains Browser capabilities Polyglot execution Edge deployment

O que e

Time de plataforma que constroi ferramentas e abstracoes para que devs deployem sem precisar de ops. Internal Developer Platform (IDP).

Por que aprender

E a evolucao de DevOps: em vez de "todo dev faz ops", um time especializado constroi a plataforma. Ex: A Spotify tem o Backstage (open-source) como portal de desenvolvedor — templates de servico, catalogo de APIs, docs centralizada. Dev cria novo servico com 1 click.

Conceitos-chave

Internal Developer Platform Backstage Golden paths Self-service infrastructure Platform as a product Developer experience

O que e

Minimizar impacto ambiental de software: eficiencia energetica, carbon-aware computing, right-sizing, serverless.

Por que aprender

Tech e responsavel por 4% das emissoes globais (mais que aviacao). Regulacao esta vindo. Ex: O Microsoft Azure oferece carbon-aware deployment — roda workloads nao-urgentes quando a grid eletrica esta mais limpa (mais eolica/solar). Green Software Foundation cria padroes.

Conceitos-chave

Carbon-aware computing Energy-efficient code Right-sizing Green hosting SCI (Software Carbon Intensity) Sustainability reports

O que e

Sistemas onde o provider nao pode ler dados do usuario. End-to-end encryption, zero-knowledge proofs, client-side encryption.

Por que aprender

Privacidade e diferencial competitivo e requisito regulatorio crescente. Ex: O Signal nao consegue ler suas mensagens mesmo que quisesse — E2E encryption, keys no device. O ProtonMail nao le seus emails. Confianca por arquitetura, nao por promessa.

Conceitos-chave

E2E encryption Zero-knowledge proofs Client-side encryption Homomorphic encryption Privacy by design GDPR Article 25

O que e

Independente da stack do momento, o arquiteto do futuro precisa: pensamento sistemico, comunicacao, trade-off analysis, lideranca tecnica, curiosidade continua, pragmatismo.

Por que aprender

Tecnologias mudam a cada 3-5 anos. Principios duram decadas. Ex: O CAP theorem tem 25 anos e continua relevante. SOLID tem 20 anos e guia design diario. O arquiteto que domina principios se adapta a qualquer stack; o que domina so a stack fica obsoleto.

Conceitos-chave

Systems thinking Communication skills Trade-off analysis Continuous learning T-shaped expertise Leading through influence
← DevOps e Operações Voltar ao Início