Skip to content
View olavodd42's full-sized avatar

Highlights

  • Pro

Block or report olavodd42

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
olavodd42/README.md

Typing SVG

Cientista/Analista de Dados ML & AI Engineer GCP Cloud


👨‍💻 Sobre Mim: O Engenheiro por trás dos Dados

Sou estudante de Engenharia da Computação (UFSM), mas minha mente vive na nuvem (literalmente, no GCP). Meu foco é quebrar a barreira entre a teoria e a produção.

Não faço apenas modelos rodarem; eu construo o ecossistema onde eles vivem. De pipelines de dados em tempo real a aplicações de GenAI que "alucinam" com precisão controlada, meu objetivo é criar soluções robustas, escaláveis e, preferencialmente, containerizadas.

📫 Contato

LinkedIn Gmail Instagram 🌐 Portfolio 📄 Currículo


🛠️ Arsenal Tecnológico (Tech Stack)

Linguagens AI & GenAI Engenharia de Dados & Cloud
Image Image Image Image Image Image Image Image Image Image Image

🔮 Projetos em Destaque

Aqui é onde a mágica acontece. Projetos end-to-end, documentados e prontos para o mundo real.

Multi-Agent System para análise automatizada de dados clínicos.

  • O que é: Sistema de workflow multi-agente avançado para análise de dados clínicos não estruturados.
  • Tech: LangGraph, ChromaDB, RAG, Multi-Agent Orchestration, Clinical Risk Scoring.
  • Destaque: Arquitetura de agentes especializados (Scribe, Validator, Mathematician, Clinical RAG) com auto-correção e auditoria baseada em evidências.

Porque batch processing é muito 2010.

  • O que é: Pipeline de ingestão e processamento de dados de vendas em tempo real.
  • Tech: Pub/Sub → Cloud Functions → BigQuery → dbt → Looker Studio.
  • Destaque: Simulação de streaming de pedidos e dashboards executivos atualizados ao vivo.

Assistente de escrita inteligente com suporte a voz.

  • O que é: Assistente de escrita com interface web construído com LangGraph e Streamlit.
  • Tech: LangGraph, LangChain, OpenAI Whisper, Streamlit.
  • Destaque: Edição de documentos por comandos de voz e interface conversacional, com persistência de estado.

Implementação completa de GPT-2 (124M params) com otimizações modernas.

  • O que é: Modelo autoregressive tipo GPT-2 implementado do zero em PyTorch.
  • Tech: PyTorch, RoPE, KVCache, Byte-Level BPE, WandB, AMP Training.
  • Destaque: RoPE (Rotary Positional Embeddings), Gradient Checkpointing, e tokenizer BPE customizado.

Agente RAG para análise de documentos financeiros.

  • O que é: Agente de Geração Aumentada por Recuperação para responder perguntas sobre mercado de ações.
  • Tech: LangGraph, LangChain, ChromaDB, OpenAI Embeddings.
  • Destaque: Decisão dinâmica de quando consultar a base de conhecimento vetorial através de grafo de estados.

Conversando com documentos sem perder o contexto.

  • O que é: Sistemas de QA que utilizam Retrieval-Augmented Generation.
  • Tech: Pinecone / Astra DB (Vetorial), OpenAI Embeddings, LangChain.
  • Destaque: Indexação vetorial para busca semântica de alta performance em documentos técnicos.
  • Tech: Google GenAI SDK, Multimodalidade (Visão + Texto).
  • Destaque: Exploração prática das capacidades multimodais do Gemini 2.0/Pro e extração automatizada de dados de faturas.

💼 Experiência & Pesquisa

🔭 Bolsista de Iniciação Científica | UFSM (Out 2024 – Jan 2025)

  • Foco: Aplicação de Ciência de Dados e IA na Engenharia.
  • Impacto: Desenvolvi estudos sobre conformidade regulatória (LGPD) e mitigação de viés algorítmico, garantindo que a IA não seja apenas inteligente, mas ética.

🎓 Educação

  • Engenharia da Computação (2021–2026) – UFSM 🎓
  • Ensino Médio (2018–2020) – Colégio Scalabrini

📜 Certificações & Educação

  • 🎓 Engenharia da Computação – UFSM (Previsão: Ago 2026)
  • ☁️ Google Cloud Computing Foundations – Google SkillsBoost (2025)
  • 🧠 Deep Learning Specialization – DeepLearning.AI (2024)
  • 📊 Machine Learning Specialization – Stanford Online (2024)

📈 Estatísticas (Porque números não mentem)

stats langs streak


👁️ Visitas ao Perfil

profile views hits

u8views


🐍 Snake Graph

github-snake-light github-snake-dark

🌟 Explore meus repositórios e contribua!

Pinned Loading

  1. trialogic trialogic Public

    Python

  2. microGPT microGPT Public

    Jupyter Notebook

  3. RAG-Chatbot RAG-Chatbot Public

    Jupyter Notebook

  4. Drafter Drafter Public

    Python

  5. Blog-Generation-LLM-App Blog-Generation-LLM-App Public

    Python

  6. LLM-App-PineconeDB LLM-App-PineconeDB Public

    Jupyter Notebook