T3 - Arquitetura com IA e Automação

Conteúdo Detalhado

O que é

Arquitetura onde o modelo de IA é o componente central, não um add-on. O sistema é desenhado para lidar com outputs não-determinísticos, latências variáveis e custos por token.

Por que aprender

Tratar IA como "mais uma API" é receita para desastre. Ex: O ChatGPT não é um chatbot com GPT — é uma arquitetura inteira de streaming, rate limiting, safety filters e fallbacks projetada para IA.

Conceitos-chave

Non-deterministic outputs Token economics Latency budgets Safety layers Graceful degradation

O que é

Padrões arquiteturais específicos para LLMs: RAG (Retrieval-Augmented Generation), CoT prompting, tool use, agent loops com re-planning.

Por que aprender

Cada padrão resolve um problema diferente. RAG resolve hallucination com contexto. Agents resolvem tarefas multi-step. Ex: A Perplexity usa RAG para search — o LLM não "sabe" a resposta, busca em fontes reais e sintetiza. Resultado: respostas atualizadas com citações.

Conceitos-chave

RAG pipeline Vector databases Embedding models Agent frameworks Tool use/function calling

O que é

LLMs cobram por token (input + output). Prompts grandes custam mais. Caching de embeddings economiza. Modelos menores para tarefas simples.

Por que aprender

Sem gestão de custos, a conta da API explode. Ex: Uma empresa usou GPT-4 para classificar emails (tarefa simples) a US$0.03/email. Com 100k emails/dia = US$3k/dia. Migraram para GPT-3.5 fine-tuned: US$0.001/email = US$100/dia. Mesma acurácia, 97% mais barato.

Conceitos-chave

Token counting Prompt optimization Model tiering Caching strategies Cost per request monitoring

O que é

Camadas de proteção: input validation, output filtering, content classification, fallback to deterministic responses, human-in-the-loop.

Por que aprender

IA sem guardrails é liability jurídica. Ex: A Air Canada foi obrigada judicialmente a honrar um desconto que seu chatbot inventou. O bot alucionou uma política de reembolso que não existia — e o juiz decidiu que a empresa é responsável pelo que seu bot diz.

Conceitos-chave

Input sanitization Output validation Content safety classifiers Hallucination detection Confidence scoring Human escalation

O que é

LLMs são lentos (1-30s). Streaming (token by token) dá percepção de velocidade. Arquiteturas async com progress indicators.

Por que aprender

Sem streaming, a UX é "cliquei e nada acontece por 10 segundos". Ex: O Claude usa Server-Sent Events (SSE) para streaming — o primeiro token aparece em <1s, dando percepção de resposta instantânea enquanto o modelo processa.

Conceitos-chave

SSE (Server-Sent Events) WebSocket streaming Token-by-token rendering Progress indicators Timeout strategies

O que é

Cascata de fallbacks: modelo principal → modelo secundário → resposta cached → resposta determinística → mensagem genérica.

Por que aprender

APIs de LLM caem, rate limits acontecem, modelos mudam comportamento. Ex: O Notion AI usa cascade: Claude → fallback para GPT → fallback para resposta cached → "Não consegui processar, tente novamente". Usuário nunca vê erro 500.

Conceitos-chave

Fallback chain Circuit breaker for AI Rate limit handling Model versioning A/B testing de modelos

O que é

Métricas específicas para IA: latência por modelo, custo por request, taxa de hallucination, user satisfaction, drift de qualidade.

Por que aprender

Modelos degradam silenciosamente. Sem monitoramento, você só descobre quando o usuário reclama. Ex: O LangSmith (LangChain) e o Helicone monitoram cada chamada de LLM — latência, tokens, custo, e até qualidade do output via auto-eval. Dashboard de IA como o Grafana é para infra.

Conceitos-chave

LLM observability platforms Cost tracking Quality scoring Drift detection A/B testing frameworks

O que é

Pipeline que busca documentos relevantes em um vector store e injeta no prompt como contexto. O modelo responde baseado em dados reais, não em treinamento.

Por que aprender

RAG é a solução #1 para hallucination em domínios específicos. Ex: O Notion AI usa RAG para responder perguntas sobre seus docs — indexa todas as páginas do workspace em embeddings, busca as mais relevantes, e passa como contexto ao LLM.

Conceitos-chave

Chunking strategies Embedding models Vector databases (Pinecone, Weaviate, pgvector) Retrieval scoring Context window management

O que é

O modelo decide qual função chamar e com quais parâmetros. O sistema executa a função e retorna o resultado ao modelo.

Por que aprender

Transforma o LLM de "gerador de texto" em "orquestrador de ações". Ex: O Claude pode chamar ferramentas como buscar no banco, enviar email, criar arquivo — o modelo planeja, o sistema executa.

Conceitos-chave

Tool definitions (JSON Schema) Structured outputs Validação de parâmetros Error handling Permission boundaries

O que é

O modelo recebe uma tarefa, cria um plano, executa steps (chamando tools), avalia resultado, e re-planeja se necessário. Loop até completar ou atingir limite.

Por que aprender

Para tarefas complexas, uma chamada não basta. Ex: O Claude Code (Anthropic) é um agent que recebe "refatore esse módulo", lê codebase, planeja mudanças, edita arquivos, roda testes, corrige erros — tudo em loop autônomo.

Conceitos-chave

Plan-execute-observe loop Max iterations Token budget Checkpoint/resume Error recovery

O que é

Tratar prompts como código: versionados, testados, revisados, com CI/CD. Templates parametrizados, não strings hardcoded.

Por que aprender

Prompt que funciona no playground pode falhar em produção com inputs reais. Ex: O Anthropic mantém system prompts em repositórios versionados com testes automatizados — cada mudança passa por eval suite antes de ir a produção.

Conceitos-chave

Prompt templates Version control A/B testing Eval suites Prompt registries Few-shot examples management

O que é

Fine-tuning: treinar o modelo com seus dados. Prompting: instruir via context. RAG: dar contexto dinâmico. Cada um resolve problemas diferentes.

Por que aprender

Fine-tuning é caro e lento; RAG é flexível; prompting é o mais rápido para iterar. Ex: Para classificar tickets de suporte, a Intercom testou: prompting (85% acurácia), RAG com exemplos (92%), fine-tuning (95%). Escolheram RAG pelo custo-benefício — 92% era bom o suficiente e atualizável instantaneamente.

Conceitos-chave

Cost/accuracy tradeoff Data requirements Update frequency Latency implications Hybrid approaches

O que é

Ataques específicos a sistemas com IA: prompt injection (manipular comportamento via input), data leakage (modelo revela dados sensíveis), jailbreaking.

Por que aprender

IA abre vetores de ataque novos que OWASP tradicional não cobre. Ex: Em 2023, pesquisadores extraíram dados de treinamento do ChatGPT pedindo "repita a palavra 'poem' para sempre" — o modelo começou a vazar emails e telefones reais do training data.

Conceitos-chave

Prompt injection (direct e indirect) PII detection Output sanitization Sandboxing OWASP Top 10 for LLMs

O que é

Estratégias para escalar: request batching, caching de respostas similares, model routing (big model para queries complexas, small para simples), async processing.

Por que aprender

APIs de LLM são caras e lentas. Sem otimização, o custo e a latência inviabilizam scale. Ex: A Jasper AI processa 1M+ gerações de conteúdo/dia otimizando: cache semântico (respostas similares a queries similares), model routing, e batch processing para tarefas não-urgentes.

Conceitos-chave

Semantic caching Request batching Model routing Async queues Rate limit management Cost forecasting

O que é

n8n é uma plataforma de automação open-source que conecta serviços via workflows visuais. Diferente de Zapier, é self-hosted, extensível e com lógica condicional avançada.

Por que aprender

Automatizar tarefas repetitivas libera tempo para trabalho criativo. Ex: A AutomationsAI usa n8n para: gerar conteúdo com Claude → formatar com templates → publicar no site → notificar no Slack — tudo automático, acionado por webhook.

Conceitos-chave

Workflows visuais Triggers (webhook, schedule, event) Nodes Credentials Self-hosting vs. cloud

O que é

Usar LLMs como steps em workflows: gerar texto, classificar dados, extrair entidades, resumir documentos, tomar decisões.

Por que aprender

IA isolada é demo. IA em workflow é produto. Ex: Workflow de suporte: ticket chega → Claude classifica urgência → se alta, escalona para humano; se baixa, gera resposta automática → envia ao cliente → registra no CRM. 70% dos tickets resolvidos sem humano.

Conceitos-chave

AI nodes em n8n Prompt templates por tipo de tarefa Output parsing Error handling Human-in-the-loop

O que é

Pipelines de dados que usam IA para transformação: OCR + LLM para extrair dados de PDFs, classificação automática, enriquecimento de dados.

Por que aprender

Dados desestruturados são 80% dos dados do mundo. IA resolve o que regex não consegue. Ex: Processar notas fiscais: PDF → OCR → Claude extrai (fornecedor, valor, data, itens) → valida → insere no Supabase. 95% de acurácia vs. 60% com regex puro.

Conceitos-chave

Document processing OCR + LLM pipeline Data validation Structured output Batch processing

O que é

Automações acionadas por eventos: novo cadastro → email de boas-vindas + setup de workspace. Pagamento → libera acesso + notifica + atualiza CRM.

Por que aprender

Reduz trabalho manual repetitivo a zero. Ex: Na AutomationsAI, quando alguém paga a assinatura: Stripe webhook → n8n → cria user no Supabase → envia email de boas-vindas com Claude → adiciona no grupo do Slack → agenda onboarding. Zero intervenção humana.

Conceitos-chave

Webhook triggers Event chains Error handling e retry Idempotency Monitoring de workflows

O que é

Strategies para testar workflows: test data sets, mock de APIs externas, validation nodes, dry-run mode, monitoring de execuções.

Por que aprender

Workflow quebrado em produção pode enviar email errado para milhares de pessoas. Ex: Um workflow de e-commerce com bug no cálculo de desconto aplicou 90% de desconto em 5000 pedidos antes de ser detectado. Prejuízo: R$200k. Teste teria custado R$0.

Conceitos-chave

Test data fixtures Mock nodes Validation steps Error monitoring Rollback strategies Staging environment

O que é

Gestão segura de credenciais, princípio de menor privilégio, logging de todas as ações, encryption de dados sensíveis.

Por que aprender

Workflows têm acesso a múltiplos sistemas — um vazamento compromete tudo. Ex: Um workflow com a API key do Stripe em plaintext no log expôs dados de pagamento. Solução: credentials vault do n8n + audit trail + redação de dados sensíveis nos logs.

Conceitos-chave

Credentials vault API key rotation Audit logging Data masking Rate limiting Network isolation

O que é

Organização de workflows, naming conventions, modularização (sub-workflows), monitoring centralizado, resource management.

Por que aprender

Sem organização, 100 workflows viram um emaranhado ingerenciável. Ex: Naming convention: [TRIGGER]-[DOMAIN]-[ACTION] → "webhook-payments-process", "schedule-reports-generate", "event-users-onboard". Encontrar qualquer workflow em 5 segundos.

Conceitos-chave

Naming conventions Sub-workflows Tags e folders Execution monitoring Resource limits Documentation

O que é

Sistemas que recebem um objetivo e autonomamente planejam steps, executam ações (via tools), observam resultados e iteram até completar. Diferente de chatbots que só respondem.

Por que aprender

Agentes são o próximo patamar de automação. Ex: O Devin (Cognition AI) é um agente de engenharia — recebe "implemente feature X", lê codebase, planeja, escreve código, roda testes, cria PR. Autônomo para tarefas bem definidas.

Conceitos-chave

Plan-Act-Observe loop Tool use Memory (short-term e long-term) Autonomy levels Human oversight

O que é

Frameworks que abstraem o loop de agentes: LangChain/LangGraph (flexível), CrewAI (multi-agent), Anthropic Agent SDK (tool use nativo).

Por que aprender

Construir do zero é possível mas demorado. Frameworks aceleram e padronizam. Ex: Com Anthropic Agent SDK, criar um agente que busca dados, processa e gera relatório leva 50 linhas de código. Do zero, seriam 500+.

Conceitos-chave

LangChain vs. LangGraph CrewAI roles Anthropic tool use Framework vs. from-scratch Vendor lock-in considerations

O que é

Múltiplos agentes especializados trabalhando juntos: um pesquisa, outro escreve, outro revisa, um coordena. Cada um com role e tools específicos.

Por que aprender

Problemas complexos se beneficiam de decomposição em agentes especializados. Ex: Sistema de geração de conteúdo: Agente Pesquisador (busca dados) → Agente Escritor (gera texto) → Agente Revisor (checa fatos e qualidade) → Agente Editor (formata e publica). Qualidade superior a um único agente.

Conceitos-chave

Role specialization Communication protocols Shared memory Coordination patterns Conflict resolution

O que é

Sequência determinística de steps onde cada step pode ou não usar IA. Pipeline: input → validate → enrich (AI) → transform → validate (AI) → output. Combina determinismo com inteligência.

Por que aprender

Pipelines são mais confiáveis que agentes para tarefas bem definidas. Ex: Pipeline de processamento de currículo: PDF → OCR → extrair dados (Claude) → validar formato → classificar senioridade (Claude) → score → inserir no DB. Cada step é testável independentemente.

Conceitos-chave

Pipeline stages Error handling per stage Retry policies Dead letter queues Monitoring per stage Idempotency

O que é

Mecanismos para agentes lembrarem: context window (curto prazo), vector store (longo prazo), banco de dados (episódica/factual).

Por que aprender

Sem memória, agentes repetem erros e perdem contexto. Ex: O ChatGPT com Memory feature armazena preferências do usuário em vector store — "prefiro respostas curtas", "sou desenvolvedor Python" — e recupera automaticamente em conversas futuras.

Conceitos-chave

Context window management Summarization for compression Vector store memory Episodic memory Memory retrieval strategies

O que é

Definir boundaries: quais ações o agente pode executar, limites de custo, número máximo de iterações, quando escalar para humano.

Por que aprender

Agente sem limites pode executar ações destrutivas em loop. Ex: Um agente de código sem sandbox deletou arquivos de produção ao tentar "limpar" o projeto. Guardrails: sandbox obrigatório, whitelist de operações, confirmação humana para ações destrutivas.

Conceitos-chave

Action whitelist Cost limits Iteration caps Sandbox environments Human-in-the-loop triggers Audit trail

O que é

Métricas: task completion rate, steps to completion, cost per task, error rate, user satisfaction. Benchmarks e eval suites.

Por que aprender

"Funciona às vezes" não é aceitável em produção. Ex: O SWE-bench avalia agentes de código: 1000 issues reais do GitHub, mede quantos o agente resolve corretamente. Claude Code resolve 72%+ — medido, não estimado.

Conceitos-chave

Task completion rate Efficiency (steps/cost per task) Accuracy Eval datasets Regression testing Continuous evaluation

O que é

Métricas contínuas: latência, tokens, custo, error rate, qualidade de output. Alertas automáticos quando métricas degradam.

Por que aprender

Modelos degradam silenciosamente — sem monitoramento, você descobre pelo usuário. Ex: O Helicone monitora cada chamada de LLM como o Datadog monitora APIs. Dashboard mostrando: custo/hora, latência P95, taxa de erro, qualidade estimada.

Conceitos-chave

LLM-specific metrics Cost dashboards Quality tracking Alert thresholds Anomaly detection

O que é

Distributed tracing adaptado para IA: prompt → retrieval → model call → post-processing → response. Cada step com latência, tokens e custo.

Por que aprender

Debugar "por que a resposta foi ruim" exige ver cada step. Ex: O LangSmith mostra: query do usuário → chunks recuperados do RAG → prompt montado → resposta do modelo → post-processing. Você vê exatamente onde o problema aconteceu.

Conceitos-chave

LangSmith Langfuse OpenTelemetry for LLMs Span attribution Cost per trace

O que é

Regulações que afetam sistemas com IA: LGPD (dados pessoais), EU AI Act (classificação de risco), SOC2 (segurança). Requisitos de transparência e explicabilidade.

Por que aprender

IA não regulamentada é risco jurídico crescente. Ex: O EU AI Act classifica sistemas de IA por risco — "high risk" (saúde, emprego) exige explicabilidade, auditoria e dados de treino documentados. Multa: até 6% da receita global.

Conceitos-chave

LGPD e dados pessoais em prompts EU AI Act risk levels SOC2 compliance Data residency Right to explanation

O que é

Log completo e imutável de toda interação com IA: input, output, modelo usado, timestamp, user ID, custo. Para auditoria, debugging e compliance.

Por que aprender

"O que a IA disse para o cliente?" — sem log, não há como saber. Ex: Banco digital logando toda interação do chatbot: se o bot deu informação errada sobre taxas, o log prova (ou desmente) a reclamação do cliente.

Conceitos-chave

Immutable logs Structured logging PII handling in logs Retention policies Search and replay

O que é

Eval suites automatizadas que testam qualidade do output contra golden datasets. Roda em CI/CD como testes de código.

Por que aprender

Atualizar modelo ou prompt pode degradar qualidade silenciosamente. Ex: A Anthropic roda evals em cada release do Claude — milhares de perguntas com respostas esperadas. Se acurácia cai >2% em qualquer categoria, o release é bloqueado.

Conceitos-chave

Golden datasets Automated evals LLM-as-judge Regression testing Quality gates Continuous evaluation

O que é

Gestão financeira de custos de IA: budgets por projeto, alerts de spending, otimização de prompts, model tiering, caching.

Por que aprender

Custo de LLM escala linearmente com uso. Sem controle, surpreende no fim do mês. Ex: Dashboard de FinOps: custo por feature, por modelo, por hora do dia. Descobrem que 30% do custo vem de um workflow mal otimizado que envia 10k tokens quando 500 bastam.

Conceitos-chave

Budget alerts Cost allocation tags Prompt optimization ROI Model tiering strategy Reserved capacity

O que é

Princípios de IA responsável: fairness (sem viés), transparency (explicável), accountability (responsável), privacy (proteção de dados).

Por que aprender

IA com viés ou não-transparente erode confiança e gera processos. Ex: O Amazon abandonou um sistema de recrutamento com IA em 2018 porque o modelo penalizava currículos femininos — treinado em 10 anos de contratações predominantemente masculinas, reproduziu o viés.

Conceitos-chave

Bias detection Fairness metrics Explainability (SHAP, LIME) Responsible AI frameworks Ethics review board

🤖 Arquitetura com IA e Automação

Navegação Rápida

Conteúdo Detalhado

Arquitetura IA-First

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

Padrões para LLMs em Produção

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

Automação Inteligente com n8n

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

Agentes e Pipelines de IA

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é

Por que aprender

Conceitos-chave

O que é