Staff Engineer - IA Generativa

Liderança técnica de excelência em Inteligência Artificial Generativa

Staff Engineer - IA Generativa

PJ Remoto Staff GenAI

Descrição da Vaga

Buscamos um Staff Engineer com profunda expertise em IA Generativa para atuar como referência técnica de alto nível em projetos estratégicos. Você será responsável por arquitetar soluções inovadoras envolvendo Large Language Models (LLMs), sistemas de Retrieval-Augmented Generation (RAG), fine-tuning de modelos e agentes autônomos, além de mentorar engenheiros e influenciar a direção técnica da organização.

Esta é uma posição de altíssima senioridade, para profissionais que são referências em suas áreas e desejam trabalhar em problemas desafiadores de escala global.

Responsabilidades

  • Arquitetar soluções de IA Generativa de grande escala, envolvendo LLMs, RAG, fine-tuning e agentes
  • Definir a visão técnica e roadmap de produtos de IA, alinhado com objetivos de negócio
  • Atuar como referência técnica para múltiplos times, influenciando decisões arquiteturais e boas práticas
  • Liderar projetos de pesquisa aplicada e inovação em GenAI
  • Mentorar engenheiros seniores e tech leads, elevando o nível técnico da organização
  • Contribuir para a comunidade técnica através de artigos, palestras e open source
  • Avaliar e selecionar tecnologias, frameworks e modelos base para diferentes casos de uso
  • Resolver problemas técnicos complexos e não estruturados, atuando como "último recurso"

Requisitos Obrigatórios

  • 10+ anos de experiência em engenharia de software, com pelo menos 5 anos focados em IA/ML
  • Experiência profunda com Large Language Models (LLMs) e IA Generativa em produção
  • Domínio de técnicas avançadas: RAG, fine-tuning (LoRA, PEFT), prompt engineering, avaliação de modelos
  • Experiência com frameworks como PyTorch, Hugging Face, LangChain, LlamaIndex
  • Conhecimento de arquiteturas de sistemas distribuídos e escalabilidade
  • Experiência com deploy de modelos em produção (serving, otimização, monitoramento)
  • Inglês fluente para comunicação técnica, leitura de papers e participação em comunidades globais

Diferenciais

  • Publicações em conferências de alto impacto (NeurIPS, ICML, ICLR, ACL)
  • Contribuições significativas para projetos open source relevantes
  • Experiência com sistemas de recomendação, search ou NLP em larga escala
  • Conhecimento de técnicas de otimização de modelos (quantização, pruning, distillation)
  • Experiência com bancos vetoriais (Pinecone, Weaviate, Chroma, Qdrant)
  • Mestrado ou doutorado em áreas correlatas
  • Experiência internacional ou em big techs

Stack que você vai utilizar

  • Frameworks: PyTorch, Hugging Face Transformers, LangChain, LlamaIndex, Ray
  • Modelos: GPT-4, LLaMA, Claude, Mistral, Gemma, e customizações
  • Infraestrutura: Kubernetes, Docker, AWS/GCP, Terraform
  • Bancos vetoriais: Pinecone, Weaviate, Chroma
  • MLOps: MLflow, Weights & Biases, Kubeflow
  • Linguagens: Python (essencial), Go, Rust (diferenciais)

Benefícios

  • Remuneração: PJ com remuneração compatível com nível Staff (acima do mercado)
  • Trabalho 100% remoto
  • Horário flexível e autonomia total
  • Participação em projetos de pesquisa de ponta
  • Orçamento generoso para participação em conferências internacionais
  • Incentivo a publicações e contribuições para comunidade
  • Equipamento de alto desempenho fornecido

Sobre o desafio

Esta posição é para profissionais que buscam impacto de larga escala. Você trabalhará em problemas de fronteira, com autonomia para definir direções técnicas e acesso a recursos computacionais de ponta. O time é formado por pesquisadores e engenheiros de alto nível, com forte cultura de colaboração e inovação. Se você é referência na área de IA Generativa e quer trabalhar em projetos que realmente fazem a diferença, esta oportunidade é para você.

Voltar para Vagas