AI/ML Engineering Consultant — Local LLM Deployment & Security (Fractional, Ongoing)
Salário Estimado
R$ 9.600,00 - R$ 11.200,00
Descrição da Vaga
We're a Montana-based commercial lender (Renegade Capital) that has built an in-house AI credit memo pipeline using open-source models running entirely on local hardware.
No cloud AI — all data stays on-premise for regulatory and data sovereignty reasons.
We need a fractional AI/ML engineering consultant (3-5 hrs/week) to serve as our technical point person on the model infrastructure.
This is an ongoing advisory + hands-on role.
What you'd do: - Own the technical direction of our local LLM pipeline (currently Qwen 3.5 27B via Ollama on dedicated hardware) - Help with prompt engineering, output validation, and pipeline improvements - Advise on model security, inference hardening, and data isolation architecture - Be the credible technical voice when we speak with SOC 2 auditors, bank partners, and investors about our AI infrastructure - Evaluate model upgrades, fine-tuning strategies, and quantization tradeoffs as the open-source landscape evolves You should have: - Real experience deploying open-source LLMs locally (Ollama, vLLM, llama.cpp, or similar — not just API wrappers) - Understanding of model quantization, context windows, and inference optimization on consumer/prosumer hardware - Ability to articulate AI architecture decisions to non-technical stakeholders (auditors, bankers, investors) - Python proficiency (our pipeline is FastAPI + async) - US-based (required — we need someone who can join calls with regulated financial partners in US business hours) Nice to have: - Experience with financial services, lending, or regulated industries - SOC 2 or compliance background as it relates to AI/ML systems - Fine-tuning experience (LoRA/QLoRA) on domain-specific data Engagement: - 3-5 hours/week, ongoing - Async collaboration + a weekly 30-min sync - Mountain Time preferred but any US timezone works To apply, please answer this in your cover letter: "Describe a model you've deployed locally (not via API).
What base model, what hardware, what serving framework, and what was the use case?"
Vagas Semelhantes
Engenheiro de dados
R$ 9k - 13k/mês
Sobre a vaga A dhauz, empresa do grupo Quantum Rise, é empresa de serviços e soluções usando dados e inteligência artificial para suportar processos de tomada de decisão de negócios. Somos uma equipe interdisciplinar de profissionais formados nas melhores universidades do país e do exterior, com amp...
Desenvolvedor Fullstack Python - Remoto
R$ 9k - 14k/mês
A Getronics é líder global em soluções de tecnologia, com uma equipe de mais de 4.000 colegas em 22 países, fornecendo serviços abrangentes de ponta a ponta em todo o mundo. Temos o compromisso de oferecer um atendimento excepcional ao cliente, para permitir que eles se concentrem em seus principais...
Desenvolvedor Full-Stack Python React
R$ 7k - 11k/mês
Descrição da vaga Buscamos um engenheiro apaixonado por construir produtos robustos, escaláveis e bem arquitetados — do backend ao frontend, com fluência em cloud. Você vai integrar um time de engenharia que constrói plataformas de alto volume, com APIs críticas, pipelines assíncronos e interfaces m...
Pessoa Desenvolvedora Fullstack III Node.js / React/Next.js (Segurança da Informação)
R$ 7k - 11k/mês
Um dos maiores grupos de beleza do mundo, o Grupo Boticário é uma empresa brasileira presente em mais de 40 países. É dono das marcas O Boticário, Eudora, Quem Disse, Berenice?, Vult, O.U.i, Dr. JONES, Tô.que.tô, TRUSS, e do marketplace Beleza na Web, além de atuar com produtos licenciados como Aust...
Informações
Análise de Vaga com IA
Estimativa salarial, match de tecnologias e análise de requisitos feitos com Inteligência Artificial
Powered by CodeCortex