Staff Engineer - IA Generativa

Descrição da Vaga

Buscamos um Staff Engineer com profunda expertise em IA Generativa para atuar como referência técnica de alto nível em projetos estratégicos. Você será responsável por arquitetar soluções inovadoras envolvendo Large Language Models (LLMs), sistemas de Retrieval-Augmented Generation (RAG), fine-tuning de modelos e agentes autônomos, além de mentorar engenheiros e influenciar a direção técnica da organização.

Esta é uma posição de altíssima senioridade, para profissionais que são referências em suas áreas e desejam trabalhar em problemas desafiadores de escala global.

Responsabilidades

Arquitetar soluções de IA Generativa de grande escala, envolvendo LLMs, RAG, fine-tuning e agentes
Definir a visão técnica e roadmap de produtos de IA, alinhado com objetivos de negócio
Atuar como referência técnica para múltiplos times, influenciando decisões arquiteturais e boas práticas
Liderar projetos de pesquisa aplicada e inovação em GenAI
Mentorar engenheiros seniores e tech leads, elevando o nível técnico da organização
Contribuir para a comunidade técnica através de artigos, palestras e open source
Avaliar e selecionar tecnologias, frameworks e modelos base para diferentes casos de uso
Resolver problemas técnicos complexos e não estruturados, atuando como "último recurso"

Requisitos Obrigatórios

10+ anos de experiência em engenharia de software, com pelo menos 5 anos focados em IA/ML
Experiência profunda com Large Language Models (LLMs) e IA Generativa em produção
Domínio de técnicas avançadas: RAG, fine-tuning (LoRA, PEFT), prompt engineering, avaliação de modelos
Experiência com frameworks como PyTorch, Hugging Face, LangChain, LlamaIndex
Conhecimento de arquiteturas de sistemas distribuídos e escalabilidade
Experiência com deploy de modelos em produção (serving, otimização, monitoramento)
Inglês fluente para comunicação técnica, leitura de papers e participação em comunidades globais

Diferenciais

Publicações em conferências de alto impacto (NeurIPS, ICML, ICLR, ACL)
Contribuições significativas para projetos open source relevantes
Experiência com sistemas de recomendação, search ou NLP em larga escala
Conhecimento de técnicas de otimização de modelos (quantização, pruning, distillation)
Experiência com bancos vetoriais (Pinecone, Weaviate, Chroma, Qdrant)
Mestrado ou doutorado em áreas correlatas
Experiência internacional ou em big techs

Stack que você vai utilizar

Frameworks: PyTorch, Hugging Face Transformers, LangChain, LlamaIndex, Ray
Modelos: GPT-4, LLaMA, Claude, Mistral, Gemma, e customizações
Infraestrutura: Kubernetes, Docker, AWS/GCP, Terraform
Bancos vetoriais: Pinecone, Weaviate, Chroma
MLOps: MLflow, Weights & Biases, Kubeflow
Linguagens: Python (essencial), Go, Rust (diferenciais)

Benefícios

Remuneração: PJ com remuneração compatível com nível Staff (acima do mercado)
Trabalho 100% remoto
Horário flexível e autonomia total
Participação em projetos de pesquisa de ponta
Orçamento generoso para participação em conferências internacionais
Incentivo a publicações e contribuições para comunidade
Equipamento de alto desempenho fornecido

Sobre o desafio

Esta posição é para profissionais que buscam impacto de larga escala. Você trabalhará em problemas de fronteira, com autonomia para definir direções técnicas e acesso a recursos computacionais de ponta. O time é formado por pesquisadores e engenheiros de alto nível, com forte cultura de colaboração e inovação. Se você é referência na área de IA Generativa e quer trabalhar em projetos que realmente fazem a diferença, esta oportunidade é para você.

Staff Engineer - IA Generativa