U

AI/ML Engineering Consultant — Local LLM Deployment & Security (Fractional, Ongoing)

Upworkvia Upwork
RemotoRemotoPlenoCLTOntem

Salário Estimado

R$ 9.600,00 - R$ 11.200,00

Tecnologias

0de 100

Excelente

Score da Vaga

Descrição da Vaga

We're a Montana-based commercial lender (Renegade Capital) that has built an in-house AI credit memo pipeline using open-source models running entirely on local hardware.


No cloud AI — all data stays on-premise for regulatory and data sovereignty reasons.


We need a fractional AI/ML engineering consultant (3-5 hrs/week) to serve as our technical point person on the model infrastructure.


This is an ongoing advisory + hands-on role.


What you'd do: - Own the technical direction of our local LLM pipeline (currently Qwen 3.5 27B via Ollama on dedicated hardware) - Help with prompt engineering, output validation, and pipeline improvements - Advise on model security, inference hardening, and data isolation architecture - Be the credible technical voice when we speak with SOC 2 auditors, bank partners, and investors about our AI infrastructure - Evaluate model upgrades, fine-tuning strategies, and quantization tradeoffs as the open-source landscape evolves You should have: - Real experience deploying open-source LLMs locally (Ollama, vLLM, llama.cpp, or similar — not just API wrappers) - Understanding of model quantization, context windows, and inference optimization on consumer/prosumer hardware - Ability to articulate AI architecture decisions to non-technical stakeholders (auditors, bankers, investors) - Python proficiency (our pipeline is FastAPI + async) - US-based (required — we need someone who can join calls with regulated financial partners in US business hours) Nice to have: - Experience with financial services, lending, or regulated industries - SOC 2 or compliance background as it relates to AI/ML systems - Fine-tuning experience (LoRA/QLoRA) on domain-specific data Engagement: - 3-5 hours/week, ongoing - Async collaboration + a weekly 30-min sync - Mountain Time preferred but any US timezone works To apply, please answer this in your cover letter: "Describe a model you've deployed locally (not via API).


What base model, what hardware, what serving framework, and what was the use case?"

Vagas Semelhantes

RemotoSão PauloHoje

R$ 9k - 13k/mês

PlenoCLT

Sobre a vaga A dhauz, empresa do grupo Quantum Rise, é empresa de serviços e soluções usando dados e inteligência artificial para suportar processos de tomada de decisão de negócios. Somos uma equipe interdisciplinar de profissionais formados nas melhores universidades do país e do exterior, com amp...

RemotoSão PauloOntem

R$ 9k - 14k/mês

PlenoCLT

A Getronics é líder global em soluções de tecnologia, com uma equipe de mais de 4.000 colegas em 22 países, fornecendo serviços abrangentes de ponta a ponta em todo o mundo. Temos o compromisso de oferecer um atendimento excepcional ao cliente, para permitir que eles se concentrem em seus principais...

RemotoBr2 dias atrás

R$ 7k - 11k/mês

PlenoCLT

Descrição da vaga Buscamos um engenheiro apaixonado por construir produtos robustos, escaláveis e bem arquitetados — do backend ao frontend, com fluência em cloud. Você vai integrar um time de engenharia que constrói plataformas de alto volume, com APIs críticas, pipelines assíncronos e interfaces m...

R$ 7k - 11k/mês

PlenoCLT

Um dos maiores grupos de beleza do mundo, o Grupo Boticário é uma empresa brasileira presente em mais de 40 países. É dono das marcas O Boticário, Eudora, Quem Disse, Berenice?, Vult, O.U.i, Dr. JONES, Tô.que.tô, TRUSS, e do marketplace Beleza na Web, além de atuar com produtos licenciados como Aust...

Interessado nesta vaga?

Candidatar-se

Você será redirecionado para o site original

Informações

NívelPleno
ContratoCLT
LocalRemoto
RemotoSim
MoedaBRL
PublicadaOntem
FonteUpwork

Análise de Vaga com IA

Estimativa salarial, match de tecnologias e análise de requisitos feitos com Inteligência Artificial

Powered by CodeCortex
← Voltar às Vagas