<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0" xmlns:cc="http://cyber.law.harvard.edu/rss/creativeCommonsRssModule.html">
    <channel>
        <title><![CDATA[Let’s Data - Medium]]></title>
        <description><![CDATA[Te ajudamos a se tornar um cientista de dados - Medium]]></description>
        <link>https://medium.com/lets-data?source=rss----de10db4a9d14---4</link>
        <image>
            <url>https://cdn-images-1.medium.com/proxy/1*TGH72Nnw24QL3iV9IOm4VA.png</url>
            <title>Let’s Data - Medium</title>
            <link>https://medium.com/lets-data?source=rss----de10db4a9d14---4</link>
        </image>
        <generator>Medium</generator>
        <lastBuildDate>Mon, 18 May 2026 13:09:23 GMT</lastBuildDate>
        <atom:link href="https://medium.com/feed/lets-data" rel="self" type="application/rss+xml"/>
        <webMaster><![CDATA[yourfriends@medium.com]]></webMaster>
        <atom:link href="http://medium.superfeedr.com" rel="hub"/>
        <item>
            <title><![CDATA[Ternary operator, List Comprehension e Dict Comprehension para Data Science]]></title>
            <link>https://medium.com/lets-data/ternary-operator-list-comprehension-e-dict-comprehension-para-data-science-8d08c90ed854?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/8d08c90ed854</guid>
            <category><![CDATA[programming]]></category>
            <category><![CDATA[development]]></category>
            <category><![CDATA[python]]></category>
            <category><![CDATA[data-science]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Thu, 04 Jan 2024 17:48:00 GMT</pubDate>
            <atom:updated>2024-01-04T17:48:00.475Z</atom:updated>
            <content:encoded><![CDATA[<h4>Dominando atalhos em Python</h4><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*nJKdSD-SQ7ANv9b7rl4aQQ.png" /><figcaption>Fonte: DALL•E 3</figcaption></figure><h3>Introdução</h3><p>Python, com sua simplicidade e versatilidade, tornou-se uma potência no campo da ciência de dados por vários motivos. Entre eles está a grande quantidade de pacotes disponíveis e a facilidade de leitura e compreensão de código, em comparação com outras linguagens mais complexas como C# e JavaScript. Como cientistas de dados, escrever código limpo, conciso e legível é fundamental, e o Python oferece um conjunto de construções para alcançar exatamente isso. Neste artigo, exploraremos três atalhos essenciais do Python: Ternary operators (operadores ternários, List Comprehension (compreensões de lista) e Dict Comprehension (ou dictionary comprehension, compreensões de dicionário). Vamos nos aprofundar em sua sintaxe, casos de uso, vantagens e considerações ao usá-los.</p><h3>Ternary Operator</h3><p>Antes de falar de list e dict comprehension, precisamos falar de ternary operators. Esta sintaxe pythônica é a base para o que vem a seguir em list e dict comprehensions, é onde a sintaxe se origina.</p><p>O ternary operator fornece uma maneira concisa de escrever expressões condicionais em uma única linha:</p><pre>resultado = expressão_se_verdadeiro if condição else expressão_se_falso</pre><p>Considere o seguinte exemplo:</p><pre>x = 5<br>paridade = &quot;par&quot; if x % 2 == 0 else &quot;ímpar&quot;<br># O valor de paridade será &quot;ímpar&quot; pois 5 é um número ímpar</pre><p>Neste exemplo, a variável <strong>paridade</strong> recebe o valor &quot;par&quot; se <strong>x</strong> for par e &quot;ímpar&quot; caso contrário. O operador % representa o módulo, assim o código realiza a divisão e o output desta operação é o resto da divisão. Se o resto for 0, quer dizer que é par, se for 1 (neste caso, no código não é preciso especificar porque é a única opção possível), o número é ímpar.</p><h3>Vantagens</h3><ol><li><strong>Conciso e Legível:</strong> Expressa lógica condicional em uma única linha, melhorando a legibilidade do código.</li><li><strong>Simplicidade:</strong> Simplifica a sintaxe para atribuições condicionais simples.</li><li><strong>Código Expressivo:</strong> Demonstra ações de maneira clara e concisa.</li></ol><h3>Quando Exercer Cautela</h3><p>Embora essas construções ofereçam vantagens, há situações em que a cautela é necessária:</p><ol><li><strong>Preocupações com a Legibilidade:</strong> O uso excessivo de comprehensions em expressões complexas pode reduzir a legibilidade.</li><li><strong>Lógica Complexa:</strong> Se a lógica se tornar muito intrincada e longa, considere o uso de construções tradicionais para clareza.</li><li><strong>Implicações de Desempenho:</strong> Comprehensions extremamente grandes podem impactar o desempenho; use loops tradicionais para eficiência.</li><li><strong>Compreensões Aninhadas:</strong> Aninhar compreensões muito profundamente pode resultar em código de difícil compreensão.</li><li><strong>Operador Ternário em Condições Complexas:</strong> Para condições complexas, prefira instruções <strong>if-else</strong> tradicionais para clareza.</li><li><strong>Manutenibilidade:</strong> Priorize a manutenção do código; se as construções prejudicarem a compreensão, escolha alternativas explícitas.</li></ol><h3>List Comprehensions</h3><p>List comprehensions oferecem uma maneira concisa de criar listas em Python. A sintaxe é direta:</p><pre>[expressão for item in iterável if condição]</pre><ul><li><strong>expressão</strong>: O valor a ser incluído na lista.</li><li><strong>item</strong>: A variável que representa cada elemento no iterável (por exemplo, uma lista, tupla ou intervalo).</li><li><strong>iterável</strong>: A fonte dos elementos.</li><li><strong>condição</strong> (opcional): Filtra elementos com base na condição especificada.</li></ul><p>Vamos ilustrar com um exemplo:</p><pre># Quadrados dos números de 0 a 9<br>quadrados = [x**2 for x in range(10)]<br># Saída: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]</pre><h3>Casos de Uso</h3><ol><li><strong>Filtragem e Transformação:</strong> Compreensões de lista são úteis para filtrar elementos ou transformá-los de alguma forma.</li><li><strong>Inicialização:</strong> Use compreensões ao inicializar listas ou dicionários com uma sintaxe concisa e legível.</li><li><strong>Operações Matemáticas:</strong> Quando você precisa realizar operações matemáticas nos elementos de um iterável e criar uma nova lista ou dicionário.</li><li><strong>Lógica Condicional:</strong> Aplique compreensões ao criar uma nova coleção com base em determinadas condições.</li></ol><p>Um exemplo demonstrando lógica condicional:</p><pre># Obtenha os quadrados pares de 0 a 9<br>quadrados_pares = [x**2 for x in range(10) if x % 2 == 0]<br># Saída: [0, 4, 16, 36, 64]</pre><p>List comprehensions podem melhorar a legibilidade do código, reduzindo o número de linhas necessárias para várias operações.</p><h3>Dict Comprehension</h3><p>Dict comprehensions oferecem uma maneira concisa de criar dicionários em Python. A sintaxe é semelhante às list comprehensions. A grande diferença é que o resultado não é uma lista, mais sim um dicionário com a estrutura chave: valor.</p><pre>{expressão_chave: expressão_valor for item in iterável if condição}</pre><ul><li><strong>expressão_chave</strong>: A expressão para a chave do dicionário.</li><li><strong>expressão_valor</strong>: A expressão para o valor correspondente.</li><li><strong>item</strong>, <strong>iterável</strong> e <strong>condição</strong> têm os mesmos significados que em list comprehensions.</li></ul><p>Vamos usar um exemplo simples e criar um dicionário de quadrados de 0 a 9:</p><pre># Quadrados dos números de 0 a 9 como pares chave-valor<br>quadrados_dict = {x: x**2 for x in range(10)}<br># Saída: {0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}</pre><h3>Casos de Uso</h3><ul><li><strong>Filtragem e Transformação:</strong> Assim como as compreensões de lista, as compreensões de dicionário se destacam na filtragem e transformação de dados.</li><li><strong>Inicialização:</strong> Inicialize eficientemente dicionários, especificando relações chave-valor de forma concisa.</li><li><strong>Transformação de Dados:</strong> Transforme dados de um dicionário em outro com facilidade.</li></ul><p>Dict comprehensions oferecem um conjunto poderoso de ferramentas para trabalhar com pares chave-valor.</p><h3>Conclusão</h3><p>Ternary operators, list comprehensions e dict comprehensions são ferramentas poderosas no arsenal de um cientista de dados. Quando usados com discernimento, eles podem significativamente melhorar a legibilidade e concisão do código. No entanto, é crucial encontrar um equilíbrio e considerar fatores como complexidade, manutenibilidade e legibilidade. Ao dominar esses atalhos do Python, estudantes de ciência de dados podem elevar suas habilidades de codificação, tornando seu código mais expressivo e eficiente no cenário da ciência de dados.</p><h3>Nos ajude a te ajudar!</h3><p>Se você gostou deste artigo e quer apoiar o Let’s Data, dê uns claps! E você pode fazer isso mais de uma vez, que tal uns 15?</p><p>Deixe um comentário dizendo o que acha deste assunto!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=8d08c90ed854" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/ternary-operator-list-comprehension-e-dict-comprehension-para-data-science-8d08c90ed854">Ternary operator, List Comprehension e Dict Comprehension para Data Science</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Desvendando o Poder das Window Functions em SQL para Estudantes de Ciência de Dados]]></title>
            <link>https://medium.com/lets-data/desvendando-o-poder-das-window-functions-em-sql-para-estudantes-de-ci%C3%AAncia-de-dados-71b65ec9962d?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/71b65ec9962d</guid>
            <category><![CDATA[sql]]></category>
            <category><![CDATA[window-functions]]></category>
            <category><![CDATA[data-science]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Wed, 27 Dec 2023 14:09:20 GMT</pubDate>
            <atom:updated>2023-12-27T14:09:20.345Z</atom:updated>
            <content:encoded><![CDATA[<figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*KcGGeO-dsTJyKJjC90f7Yw.png" /><figcaption>Fonte: DALL•E 3</figcaption></figure><h3>Introdução</h3><p>As window functions (funções de janela) em SQL são uma ferramenta poderosa e versátil para analisar e processar dados em conjuntos de dados complexos. Se você é um estudante de ciência de dados, entender como utilizar essas funções pode elevar suas habilidades de manipulação e análise de dados a um novo patamar. Neste artigo, exploramos o que são as window functions, por que são importantes e como aplicá-las em situações do mundo real.</p><h3>O que são Window Functions em SQL?</h3><p>Em termos simples, as window functions em SQL permitem que você realize cálculos ou agregações em um conjunto específico de linhas relacionadas a uma linha de dados específica. Essas funções operam sobre uma &quot;janela&quot; de dados que é definida com base em condições específicas, como uma partição ou ordenação.</p><p>Existem várias funções de janela essenciais, incluindo <strong>ROW_NUMBER()</strong>, <strong>RANK()</strong>, <strong>DENSE_RANK()</strong>, <strong>SUM()</strong>, <strong>AVG()</strong>, <strong>LEAD()</strong> e <strong>LAG()</strong>.</p><h4><strong>ROW_NUMBER():</strong></h4><ul><li><strong>Descrição:</strong> A função <strong>ROW_NUMBER()</strong> atribui um número sequencial único para cada linha em um conjunto de resultados, baseado na ordem especificada.</li><li><strong>Uso Prático:</strong> Útil quando você precisa de uma identificação única para cada linha.</li></ul><h4><strong>RANK():</strong></h4><ul><li><strong>Descrição:</strong> A função <strong>RANK()</strong> atribui uma classificação única para cada linha com base no valor especificado. Valores iguais recebem a mesma classificação, e o próximo valor recebe a classificação subsequente.</li><li><strong>Uso Prático:</strong> Útil para identificar a posição relativa de valores em uma ordem específica.</li></ul><h4><strong>DENSE_RANK():</strong></h4><ul><li><strong>Descrição:</strong> Similar ao <strong>RANK()</strong>, a função <strong>DENSE_RANK()</strong> também atribui classificações únicas, mas sem pular classificações para valores iguais.</li><li><strong>Uso Prático:</strong> Útil quando você deseja evitar lacunas nas classificações para valores iguais.</li></ul><h4><strong>SUM():</strong></h4><ul><li><strong>Descrição:</strong> A função <strong>SUM()</strong> calcula a soma cumulativa de uma expressão em um conjunto de resultados, considerando a ordem especificada pelas cláusulas <strong>OVER</strong>.</li><li><strong>Uso Prático:</strong> Permite calcular somas acumulativas, como a soma acumulativa de receitas ao longo do tempo.</li></ul><h4><strong>AVG():</strong></h4><ul><li><strong>Descrição:</strong> A função <strong>AVG()</strong> calcula a média cumulativa de uma expressão em um conjunto de resultados, com base na ordem especificada pelas cláusulas <strong>OVER</strong>.</li><li><strong>Uso Prático:</strong> Útil para calcular médias móveis e tendências ao longo do tempo.</li></ul><h4><strong>LEAD():</strong></h4><ul><li><strong>Descrição:</strong> A função <strong>LEAD()</strong> fornece o valor da próxima linha em relação à linha atual, com base na ordem especificada pelas cláusulas <strong>OVER</strong>.</li><li><strong>Uso Prático:</strong> Útil para comparar valores consecutivos em séries temporais.</li></ul><h4><strong>LAG():</strong></h4><ul><li><strong>Descrição:</strong> A função <strong>LAG()</strong> fornece o valor da linha anterior em relação à linha atual, com base na ordem especificada pelas cláusulas <strong>OVER</strong>.</li><li><strong>Uso Prático:</strong> Similar ao <strong>LEAD()</strong>, útil para análise de séries temporais e comparação de valores consecutivos.</li></ul><p>Vamos abordar cada uma delas com exemplos práticos.</p><h3>ROW_NUMBER(), RANK() e DENSE_RANK()</h3><p>Essas funções são comumente usadas para atribuir um número de linha a cada registro em um conjunto de dados, permitindo ordenação e classificação eficientes.</p><pre>-- Exemplo de ROW_NUMBER(), RANK() e DENSE_RANK()<br>SELECT<br>  Product,<br>  Price,<br>  ROW_NUMBER() OVER (ORDER BY Price) AS RowNum,<br>  RANK() OVER (ORDER BY Price) AS Rank,<br>  DENSE_RANK() OVER (ORDER BY Price) AS DenseRank<br>FROM Products;</pre><p><strong>Output:</strong></p><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*nYjK5u7Rn5y6jBuEt1bPaQ.jpeg" /></figure><p>Essa consulta atribui um número de linha (<strong>RowNum</strong>), um rank (<strong>Rank</strong>) e um rank denso (<strong>DenseRank</strong>) para cada produto com base no preço.</p><h3>SUM() e AVG()</h3><p>As funções <strong>SUM()</strong> e <strong>AVG()</strong> podem ser usadas com a cláusula <strong>OVER</strong> para calcular somas e médias em uma janela específica.</p><pre>-- Exemplo de SUM() e AVG()<br>SELECT<br>  Date,<br>  Revenue,<br>  SUM(Revenue) OVER (ORDER BY Date) AS RunningTotal,<br>  AVG(Revenue) OVER (ORDER BY Date) AS MovingAverage<br>FROM SalesData;</pre><p><strong>Output:</strong></p><figure><img alt="" src="https://cdn-images-1.medium.com/max/990/1*8BkjjIWhghEeQxpYRt8Z9g.jpeg" /></figure><p>Neste exemplo, calculamos o total acumulado e a média móvel da receita ao longo do tempo.</p><h3>LEAD() e LAG()</h3><p><strong>LEAD()</strong> e <strong>LAG()</strong> permitem acessar valores de linhas subsequentes ou anteriores em uma janela, respectivamente.</p><pre>-- Exemplo de LEAD() e LAG()<br>SELECT<br>  Date,<br>  Revenue,<br>  LEAD(Revenue, 1) OVER (ORDER BY Date) AS NextDayRevenue,<br>  LAG(Revenue, 1) OVER (ORDER BY Date) AS PreviousDayRevenue<br>FROM DailySales;</pre><p><strong>Output:</strong></p><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*FctASDgHiROeUgi-l2IY5g.jpeg" /></figure><p>Nesta consulta, obtemos a receita do próximo dia (<strong>NextDayRevenue</strong>) e do dia anterior (<strong>PreviousDayRevenue</strong>) para cada dia.</p><h3>Aplicação Prática em Ciência de Dados</h3><p>Agora que entendemos as funções de janela, vamos considerar uma situação prática com um conjunto de dados fictício de vendas diárias.</p><p>Suponha que temos uma tabela chamada <strong>DailySales</strong> com colunas <strong>Date</strong> e <strong>Revenue</strong>. Queremos calcular a média móvel de 7 dias da receita para suavizar variações diárias.</p><pre>-- Aplicação Prática em Ciência de Dados: Média Móvel de 7 Dias<br>SELECT<br>  Date,<br>  Revenue,<br>  AVG(Revenue) OVER (ORDER BY Date ROWS BETWEEN 6 PRECEDING AND CURRENT ROW) AS SevenDayMovingAvg<br>FROM DailySales;</pre><p><strong>Output:</strong></p><figure><img alt="" src="https://cdn-images-1.medium.com/max/816/1*35ngwlCwKAOjHsaJ3vlowg.jpeg" /></figure><p>Nesta consulta, a cláusula <strong>ROWS BETWEEN 6 PRECEDING AND CURRENT ROW</strong> especifica que a janela de cálculo incluirá os 6 dias anteriores e o dia atual, calculando assim a média móvel de 7 dias.</p><h3>Conclusão</h3><p>As window functions em SQL são uma ferramenta essencial para manipular e analisar dados de forma eficaz. Ao entender essas funções e aplicá-las em situações do mundo real, os estudantes de ciência de dados podem melhorar suas habilidades de manipulação de dados e extrair insights valiosos. Esperamos que este artigo tenha fornecido uma compreensão sólida das funções de janela e como aplicá-las em seu próprio trabalho.</p><h3>Nos ajude a te ajudar!</h3><p>Se você gostou deste artigo e quer apoiar o Let’s Data, dê uns claps! E você pode fazer isso mais de uma vez, que tal uns 15?</p><p>Deixe um comentário dizendo o que acha deste assunto!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=71b65ec9962d" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/desvendando-o-poder-das-window-functions-em-sql-para-estudantes-de-ci%C3%AAncia-de-dados-71b65ec9962d">Desvendando o Poder das Window Functions em SQL para Estudantes de Ciência de Dados</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Desvendando o Git e o GitHub para Estudantes de Data Science]]></title>
            <link>https://medium.com/lets-data/desvendando-o-git-e-o-github-para-estudantes-de-data-science-5e0b12feee7a?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/5e0b12feee7a</guid>
            <category><![CDATA[data-science]]></category>
            <category><![CDATA[github]]></category>
            <category><![CDATA[git]]></category>
            <category><![CDATA[development]]></category>
            <category><![CDATA[python]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Thu, 21 Dec 2023 17:21:42 GMT</pubDate>
            <atom:updated>2023-12-22T13:54:03.473Z</atom:updated>
            <content:encoded><![CDATA[<figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*H5g51kHCecE-VZRZ54vKcA.png" /><figcaption>DALL•E 3</figcaption></figure><h3>Introdução</h3><p>Se você é um estudante de Data Science que trabalha com Python, provavelmente já ouviu falar sobre Git e GitHub. Essas ferramentas são essenciais para o controle de versão e colaboração em projetos de programação. Neste artigo, vamos explorar passo a passo como começar a usar o Git e o GitHub, desde a instalação até o trabalho colaborativo.</p><h3><strong>Verificando sua Instalação do Git</strong></h3><p>Antes de começarmos, é importante verificar se o Git está instalado no seu computador. Para isso, abra o terminal (no caso do MacOS ou do Windows) e digite o seguinte comando:</p><pre>git --version</pre><p>Se você não tiver o Git instalado, siga as instruções oficiais de instalação para o seu sistema operacional no site do <a href="https://git-scm.com/">Git</a>.</p><h3><strong>Criando uma Conta no GitHub</strong></h3><p>Se você ainda não possui uma conta no GitHub, acesse <a href="https://github.com/">github.com</a> e clique em “Sign up” para criar uma. Siga as instruções para configurar sua conta. Lembre-se de escolher um nome de usuário relevante para sua área de estudo.</p><h3><strong>Criando um Novo Repositório</strong></h3><p>Agora que você tem o Git instalado e uma conta no GitHub, vamos aprender como criar um novo repositório.</p><h4><strong>No GitHub</strong></h4><ol><li>Faça login na sua conta do GitHub.</li><li>Clique no ícone “+” no canto superior direito e escolha “New repository”.</li><li>Preencha o nome do repositório, uma descrição opcional e escolha se ele será público ou privado.</li><li>Clique em “Create repository”.</li></ol><h4><strong>Na sua Máquina</strong></h4><ol><li>Abra o terminal e navegue até a pasta onde deseja criar o repositório.</li><li>Use o comando <strong>git init</strong> para iniciar um novo repositório local.</li></ol><h3><strong>Conectando o Repositório Local ao GitHub</strong></h3><p>Depois de criar o repositório local e no GitHub, é hora de conectá-los.</p><h4><strong>No GitHub</strong></h4><ol><li>No repositório recém-criado, clique no botão “Code” e copie o URL do repositório.</li></ol><h4><strong>No Terminal</strong></h4><ol><li>Use o comando <strong>git remote add origin [URL]</strong> para adicionar o repositório remoto. Substitua <strong>[URL]</strong> pelo URL que você copiou anteriormente.</li></ol><h3><strong>Adicionando Arquivos, Commit, Pull e Push</strong></h3><p>Agora que seu repositório está configurado, você pode adicionar seus primeiros arquivos.</p><ol><li>Crie ou mova os arquivos que deseja para a pasta do repositório local.</li><li>Use <strong>git add .</strong> para adicionar todos os arquivos ao controle de versão.</li><li>Em seguida, execute <strong>git commit -m &quot;Primeiro commit&quot;</strong> para criar um commit.</li><li>Para manter seu repositório atualizado com as mudanças feitas por outros colaboradores no GitHub, use <strong>git pull origin master</strong> para fazer o pull das alterações.</li><li>Por fim, faça o push dos arquivos para o GitHub com <strong>git push origin master</strong>.</li></ol><h4><strong>Commit</strong></h4><p>Um commit é uma espécie de “instantâneo” do estado atual dos arquivos em seu repositório. É uma forma de registrar as mudanças que você fez. Cada commit possui uma mensagem descritiva que explica as alterações realizadas. É uma boa prática manter essas mensagens concisas, mas informativas. Por exemplo, ao usar o comando <strong>git commit -m &quot;Adicionei funcionalidade de gráficos&quot;</strong>, você está registrando um commit com a mensagem &quot;Adicionei funcionalidade de gráficos&quot; que reflete as mudanças que você fez em seus arquivos.</p><h4><strong>Pull</strong></h4><p>O comando <strong>git pull</strong> é usado para atualizar seu repositório local com as alterações feitas no repositório remoto do GitHub. Imagine que você está trabalhando em um projeto em equipe, e um colega de equipe fez algumas mudanças no código e as enviou para o GitHub. Para manter seu repositório local atualizado e sincronizado com as mudanças deles, você utiliza o <strong>git pull</strong>. Isso garante que você esteja sempre trabalhando com a versão mais recente do código.</p><h4><strong>Push</strong></h4><p>O comando <strong>git push</strong> é usado para enviar seus commits locais para o repositório remoto no GitHub. Quando você faz alterações em seus arquivos e cria commits locais, essas alterações estão apenas no seu computador. Para compartilhá-las com outros colaboradores ou fazer backup seguro no GitHub, você utiliza o <strong>git push</strong>. Isso envia seus commits para o repositório remoto, tornando suas mudanças disponíveis para outras pessoas que trabalham no mesmo projeto.</p><p>Em resumo, o fluxo de trabalho geralmente envolve fazer alterações nos arquivos, adicionar essas alterações aos commits, registrar as mudanças com mensagens descritivas (commit), manter seu repositório local atualizado com <strong>git pull</strong> para sincronizar com o repositório remoto e, em seguida, enviar suas alterações para o GitHub com <strong>git push</strong>. Dessa forma, você mantém uma colaboração eficiente e acompanha as alterações em seu projeto de Data Science.</p><h3><strong>Trabalhando com Arquivos Desatualizados</strong></h3><p>Se você editou arquivos localmente antes de fazer um pull e percebeu que eles não estão atualizados em relação ao repositório do GitHub, existem maneiras de contornar essa situação.</p><ol><li>Use <strong>git stash</strong> para salvar suas alterações locais.</li><li>Faça um <strong>git pull</strong> para atualizar seu repositório local.</li><li>Use <strong>git stash apply</strong> para reaplicar suas alterações salvas.</li></ol><h3><strong>Entendendo o Funcionamento das Branches</strong></h3><p>Branches são uma parte fundamental do Git e do GitHub. Eles permitem que você trabalhe em diferentes versões de um projeto ao mesmo tempo.</p><ul><li>Para criar uma nova branch, use <strong>git checkout -b [nome-da-branch]</strong>.</li><li>Para alternar entre branches, use <strong>git checkout [nome-da-branch]</strong>.</li><li>Para mesclar alterações de uma branch para outra, use <strong>git merge [nome-da-branch]</strong>.</li></ul><h3><strong>Trabalhando com Colaboradores</strong></h3><p>Colaborar em projetos no GitHub envolve o uso de pull requests (PRs) para propor e revisar alterações. Aqui está um resumo rápido:</p><ol><li>Um colaborador faz fork do repositório principal.</li><li>Eles criam uma nova branch para suas alterações.</li><li>Após concluir as alterações, eles enviam um PR para o repositório principal.</li><li>Os revisores podem comentar, aprovar ou solicitar alterações no PR.</li><li>Quando o PR é aprovado, as alterações são mescladas no repositório principal.</li></ol><p>É importante destacar que, em projetos de código aberto, geralmente são os mantenedores do projeto que têm o poder de aprovar PRs. Em projetos privados ou em equipes, o processo de aprovação pode variar, mas geralmente envolve revisores designados.</p><h3><strong>Mantenha seu Código Atualizado</strong></h3><p>Lembre-se de começar o seu trabalho no código com um pull para garantir que você está usando a versão mais recente do projeto e termine com um pull para garantir que todos estejam com o código atualizado. Isso ajuda a evitar conflitos e manter a colaboração eficaz.</p><p>Agora que você tem uma compreensão básica do Git e do GitHub, você está pronto para começar a colaborar em projetos de Data Science de forma mais eficaz. Lembre-se de praticar e explorar mais recursos à medida que avança em sua jornada de programação. Boa sorte!</p><h3>Nos ajude a te ajudar!</h3><p>Se você gostou deste artigo e quer apoiar o Let’s Data, dê uns claps! E você pode fazer isso mais de uma vez, que tal uns 15?</p><p>Deixe um comentário dizendo o que acha deste assunto!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=5e0b12feee7a" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/desvendando-o-git-e-o-github-para-estudantes-de-data-science-5e0b12feee7a">Desvendando o Git e o GitHub para Estudantes de Data Science</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Desmistificando Expressões Regulares (Regex) em Python]]></title>
            <link>https://medium.com/lets-data/desmistificando-express%C3%B5es-regulares-regex-em-python-54c38302d335?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/54c38302d335</guid>
            <category><![CDATA[python]]></category>
            <category><![CDATA[artificial-intelligence]]></category>
            <category><![CDATA[machine-learning]]></category>
            <category><![CDATA[ai]]></category>
            <category><![CDATA[regex]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Sat, 16 Dec 2023 22:07:25 GMT</pubDate>
            <atom:updated>2023-12-16T22:24:55.351Z</atom:updated>
            <content:encoded><![CDATA[<h4>Um Guia para Iniciantes e Estudantes Intermediários de Ciência de Dados</h4><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*4nzCN90VEGLIrt6Uving1A.png" /><figcaption>Imagem: DALL•E 3</figcaption></figure><p>No campo da ciência de dados e programação, as expressões regulares (Regex) se destacam como uma ferramenta poderosa para extrair padrões, manipular texto e validar dados. Essas construções versáteis ganharam imensa popularidade devido à sua capacidade de lidar com tarefas complexas de busca e correspondência com precisão e flexibilidade. Embora as Regex possam parecer assustadoras à primeira vista, é essencial para qualquer aspirante a cientista de dados compreender seus fundamentos e utilizar efetivamente suas capacidades.</p><h3>Introdução às Expressões Regulares (Regex)</h3><p>As expressões regulares, frequentemente abreviadas como Regex, é uma ferramenta poderosa de correspondência de padrões usada para buscar, localizar e manipular strings. Elas oferecem uma maneira concisa e expressiva de descrever padrões dentro de texto, permitindo que programadores extraiam informações específicas, validem dados e realizem várias operações relacionadas a texto.</p><h3>A Anatomia de uma Expressão Regular</h3><p>Um padrão de Regex é composto por vários componentes que trabalham juntos para definir o padrão desejado. Estes incluem:</p><p>Metacaracteres: Esses caracteres especiais têm significados específicos dentro do Regex. Por exemplo, o asterisco (*) representa zero ou mais ocorrências do caractere precedente.</p><p>Classes de Caracteres: Elas permitem que você especifique um intervalo de caracteres, como [a-z] para todas as letras minúsculas ou [0–9] para dígitos.</p><p>Espaçamento: Espaços em branco podem ser usados para delimitar diferentes componentes do padrão Regex.</p><h3>Correspondência de Padrões com Expressões Regulares</h3><p>As expressões regulares empregam correspondência de padrões para buscar strings específicas dentro de um texto fornecido. Isso é alcançado usando o módulo re embutido do Python, que fornece funções para executar várias operações de Regex.</p><ol><li>re.search(): Esta função verifica se o padrão existe dentro da string e retorna um objeto de correspondência se encontrado.</li><li>re.findall(): Esta função extrai todas as ocorrências do padrão da string e retorna uma lista de objetos de correspondência.</li><li>re.sub(): Esta função substitui todas as ocorrências do padrão pela string de substituição especificada.</li></ol><h3>Exemplos de Expressões Regulares</h3><p>Para ilustrar o uso de Regex, vamos explorar alguns exemplos práticos:</p><p>Extraindo Endereços de E-mail: Utilize o padrão r&quot;[\w\.-]+@[\w\.-]+\.[\w]{2,3}&quot; para extrair endereços de e-mail do texto.</p><h4>Metacaracteres</h4><p>A expressão utiliza vários metacaracteres, que são símbolos especiais com significados específicos dentro do Regex. Estes incluem:</p><ul><li>\w: Corresponde a um caractere alfanumérico (a-z, A-Z, 0-9, _).</li><li>\.: Corresponde a um ponto (.) literal.</li><li>-: Corresponde a um hífen (-) literal.</li><li>+: Corresponde a uma ou mais ocorrências do caractere precedente.</li><li>{2,3}: Corresponde exatamente a duas ou três ocorrências do caractere precedente.</li></ul><h4>Classes de Caracteres</h4><p>Regex também utiliza classes de caracteres, que permitem especificar um intervalo de caracteres. As seguintes classes de caracteres são usadas neste exemplo:</p><ul><li>[\w\.-]: Corresponde a um ou mais caracteres alfanuméricos, pontos ou hifens.</li><li>[\w\.-]+: Corresponde a uma ou mais ocorrências da classe de caracteres precedente.</li><li>[\w\.-]+@: Corresponde a um nome de usuário seguido por um símbolo &#39;@&#39; literal.</li><li>[\w\.-]+\.[\w]{2,3}: Corresponde a um nome de domínio seguido por um ponto (.) literal e dois a três caracteres, o que representa um domínio como .com, .org, .net, ou .br.</li></ul><h4>Espaçamento</h4><p>Espaçamento é usado para delimitar diferentes componentes do padrão Regex. A sequência de escape ‘\r\n’ representa um <em>carriage return</em> (quebra de linha) (\r) seguido de uma quebra de linha (\n), que é frequentemente usada para representar o final de uma linha em texto.</p><h4>Combinando Componentes</h4><p>A expressão combina esses componentes para formar um padrão que corresponde a um endereço de e-mail válido. O nome de usuário pode conter caracteres alfanuméricos, pontos ou hifens, e o nome do domínio também pode conter esses caracteres junto com pontos. O domínio deve ter dois ou três caracteres e pode incluir caracteres alfanuméricos.</p><p>Exemplo de Uso: Para usar essa expressão para extrair endereços de e-mail do texto, você pode usar o seguinte código Python:</p><pre>import re<br><br>texto = &quot;Este é um exemplo de um endereço de e-mail: johndoe@example.com. Outro exemplo é example@example.org.&quot;<br><br>correspondencias = re.findall(r&quot;[\w\.-]+@[\w\.-]+\.[\w]{2,3}&quot;, texto)<br><br>for correspondencia in correspondencias:<br>    print(correspondencia)</pre><p>Este código imprimirá a seguinte saída:</p><pre>johndoe@example.com<br>example@example.org</pre><p>O pacote Python para expressões regulares é o regex, que é importado pelo comando import re.</p><h3>Metacaracteres Especiais: \s e \d</h3><p>Além dos metacaracteres que discutimos anteriormente, o Regex oferece alguns metacaracteres especiais que podem ser incrivelmente úteis na correspondência de padrões. Dois desses metacaracteres especiais são \s e \d.</p><ul><li>\s: O metacaractere \s representa caracteres de espaço em branco. Isso inclui espaços, tabulações, quebras de linha e outros caracteres semelhantes usados para formatação e espaçamento em texto. Por exemplo, se você deseja corresponder a qualquer sequência de caracteres de espaço em branco, pode usar \s+ em seu padrão Regex, onde + corresponde a uma ou mais ocorrências. Aqui está um exemplo de como usá-lo:</li></ul><pre>import re<br><br>texto = &quot;Este é algum texto    com     múltiplos espaços.&quot;<br>correspondencias = re.findall(r&quot;\s+&quot;, texto)<br><br>for correspondencia in correspondencias:<br>    print(f&quot;Espaço em branco encontrado: &#39;{correspondencia}&#39;&quot;)</pre><p>Este código identificará e imprimirá todas as sequências de um ou mais caracteres de espaço em branco no texto.</p><ul><li>\d: O metacaractere `\d` corresponde a qualquer dígito de 0 a 9. É uma maneira útil de encontrar valores numéricos dentro do texto. Por exemplo, se você deseja extrair todos os números de telefone de um documento, pode usar `\d{2}-\d{5}-\d{4}` em seu padrão para corresponder ao formato comum de números de telefone no Brasil:</li></ul><pre>import re<br><br>texto = &quot;Aqui estão alguns números de telefone: 11-92345-67890 e 11-99876-5432.&quot;<br>correspondencias = re.findall(r&quot;\d{2}-\d{5}-\d{4}&quot;, texto)<br><br>for correspondencia in correspondencias:<br>    print(f&quot;Número de telefone encontrado: {correspondencia}&quot;)</pre><p>Este código identificará e imprimirá todos os números de telefone no formato `xx-xxxx-xxxx`.</p><p>Esses metacaracteres especiais, \s e \d, podem ser combinados com outros componentes Regex para criar padrões poderosos para corresponder e extrair tipos específicos de informações de texto. Quer você esteja trabalhando com dados de texto em ciência de dados ou precise validar e processar entradas, entender e usar esses metacaracteres de forma eficaz pode ser um ativo valioso em sua caixa de ferramentas.</p><h3>Conclusão</h3><p>Dominar expressões regulares (Regex) é uma habilidade inestimável para profissionais de ciência de dados. Com suas poderosas capacidades de correspondência de padrões e diversas aplicações, o Regex capacita cientistas de dados a lidar eficazmente com dados textuais, extrair informações valiosas e garantir a qualidade dos dados. Ao compreender os fundamentos do Regex e praticar seu uso com conjuntos de dados do mundo real, os cientistas de dados podem aumentar sua produtividade e contribuir para análises mais esclarecedoras.</p><h3>Nos ajude a te ajudar!</h3><p>Se você gostou deste artigo e quer apoiar o Let’s Data, dê uns claps! E você pode fazer isso mais de uma vez, que tal uns 15?</p><p>Deixe um comentário dizendo o que acha deste assunto!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=54c38302d335" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/desmistificando-express%C3%B5es-regulares-regex-em-python-54c38302d335">Desmistificando Expressões Regulares (Regex) em Python</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Let’s Data Podcast #042 — Matheus Facure]]></title>
            <link>https://medium.com/lets-data/lets-data-podcast-042-matheus-facure-50ea364272b5?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/50ea364272b5</guid>
            <category><![CDATA[podcast]]></category>
            <category><![CDATA[statistics]]></category>
            <category><![CDATA[data-science]]></category>
            <category><![CDATA[causal-inference]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Mon, 11 Dec 2023 17:34:43 GMT</pubDate>
            <atom:updated>2023-12-11T17:33:32.030Z</atom:updated>
            <content:encoded><![CDATA[<h3>Let’s Data Podcast #042 — Matheus Facure</h3><h4>Inferência Causal</h4><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/0*g-FPBt5LqhtvUSDs.png" /></figure><p>Neste episódio, batemos um papo com o Matheus Facure, destaque mundial em inferência causal, com livro publicado na editora O’Reilly.</p><p>Neste episódio, batemos um papo com o Matheus Facure, destaque mundial em inferência causal, com livro publicado na editora O’Reilly: <a href="https://www.amazon.com/Causal-Inference-Python-Applying-%20Industry/dp/1098140257">Causal Inference in Python: Applying Causal Inference in the Tech Industry</a>. Também disponibiliza um livro gratuitamente, que se chama <a href="https://matheusfacure.github.io/python-causality-handbook/landing-page.html">Causal Inference for the Brave and True</a>, e não menos importante é Cientista de Dados na <a href="https://www.linkedin.com/company/nubank/">Nubank</a> desde 2017.</p><p>Falamos sobre a sua especialidade em inferência causal, sua migração de carreira de economista para cientista de dados e aprendemos como a inferência causal pode ser aplicada para a tomada de decisões nas empresas, após os modelos de machine learning serem aplicados. Foi um papo muito bacana com quem é referência no assunto!</p><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fopen.spotify.com%2Fembed%2Fepisode%2F26J1P5wagsm4BPnIg7oF9i%3Futm_source%3Doembed&amp;display_name=Spotify&amp;url=https%3A%2F%2Fopen.spotify.com%2Fepisode%2F26J1P5wagsm4BPnIg7oF9i&amp;image=https%3A%2F%2Fi.scdn.co%2Fimage%2Fab67656300005f1ff262980ee3d6257fdbecc465&amp;key=d04bfffea46d4aeda930ec88cc64b87c&amp;type=text%2Fhtml&amp;schema=spotify" width="456" height="152" frameborder="0" scrolling="no"><a href="https://medium.com/media/8a589b2e97cd7ca3ee51d68073c2f4cb/href">https://medium.com/media/8a589b2e97cd7ca3ee51d68073c2f4cb/href</a></iframe><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FdNwialjtBis%3Ffeature%3Doembed&amp;display_name=YouTube&amp;url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DdNwialjtBis&amp;image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FdNwialjtBis%2Fhqdefault.jpg&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=youtube" width="854" height="480" frameborder="0" scrolling="no"><a href="https://medium.com/media/1a6419a404d6fef0e9a5310e521026b5/href">https://medium.com/media/1a6419a404d6fef0e9a5310e521026b5/href</a></iframe><p>Referências de assuntos neste episódio<br>☑️ Observação: os timestamps se referem ao tempo do episódio no YouTube.</p><p>[00:02:40] Seu caminho para se tornar Cientista de Dados</p><p>[00:06:45] <a href="https://www.linkedin.com/company/lamfo/">Laboratório de Aprendizado de Máquina em Finanças e Organizações (LAMFO)</a> e <a href="https://open.spotify.com/episode/6xPYAnfqRCFMaTuNH6pMpf">Let’s Data #001 — Pedro Albuquerque</a></p><p>[00:11:20] O que é Inferência Causal?</p><p>[00:14:45] Quais tipos de problema Machine Learning resolvem? E quais Inferência Causal resolvem?</p><p>[00:22:45] <a href="https://pt.wikipedia.org/wiki/Teste_A/B">Teste A/B</a> é inferência causal?</p><p>[00:24:40] Erros ao utilizar o <a href="https://pt.wikipedia.org/wiki/Teste_A/B">teste A/B</a> nas empresas</p><p>[00:29:40] Visão sobre modelos de <a href="https://www.vidora.com/ml-in-%20business/uplift-modeling-some-practical-examples/">Uplift Modeling</a></p><p>[00:33:00] Por que inferência causal ainda é pouco explorado pelas empresas?</p><p>[00:38:00] Seu caminho dentro da <a href="https://www.linkedin.com/company/nubank/">Nubank</a></p><p>[00:43:00] Inferência causal na <a href="https://www.linkedin.com/company/nubank/">Nubank</a></p><p>[00:45:30] Como é trabalhar na <a href="https://www.linkedin.com/company/nubank/">Nubank</a>? Como é o perfil do seu funcionário?</p><p>[00:51:30] Como foi publicar um livro na editora <a href="https://www.oreilly.com/">O’Reilly</a>?</p><p>[00:56:20] Python ou R?</p><p>[00:56:50] Cientista de Dados: <a href="https://www.linkedin.com/in/susanathey/">Susan Athey</a></p><p>[00:57:30] O que a IA ainda não consegue?</p><p>[00:58:10] Livro: <a href="https://www.amazon.com/Mostly-Harmless-%20Econometrics-Empiricists-Companion/dp/0691120358">Mostly Harmless Econometrics</a></p><p>[00:58:35] Série: <a href="https://pt.wikipedia.org/wiki/Only_Murders_in_the_Building">Only Murders in the Building</a></p><p>[00:59:00] Banda: <a href="https://open.spotify.com/artist/0k17h0D3J5VfsdmQ1iZtE9">Pink Floyd</a></p><p>[00:59:10] Hobby: Cozinhar</p><p>[00:59:30] Viagem: Japão</p><p>[01:00:20] Sonho: Fazer um podcast sobre finanças pessoais</p><p>[01:01:10] Pergunta de 1 milhão de euros</p><p>As referências deste espisódio foram curadas pelo <a href="https://www.linkedin.com/in/rochavianna/">João Rocha Vianna</a>.</p><p>Obrigado João!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=50ea364272b5" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/lets-data-podcast-042-matheus-facure-50ea364272b5">Let’s Data Podcast #042 — Matheus Facure</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Let’s Data Podcast #040 — Leonardo Karpinski]]></title>
            <link>https://medium.com/lets-data/lets-data-podcast-040-leonardo-karpinski-a49ef5c15bd8?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/a49ef5c15bd8</guid>
            <category><![CDATA[data-analysis]]></category>
            <category><![CDATA[análise-de-dados]]></category>
            <category><![CDATA[podcast]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Wed, 06 Dec 2023 00:11:34 GMT</pubDate>
            <atom:updated>2023-12-06T00:11:33.975Z</atom:updated>
            <content:encoded><![CDATA[<h3>Let’s Data Podcast #040 — Leonardo Karpinski</h3><h4>Análise de Dados e MVP Microsoft</h4><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*NFhxPOSnbLPPipQRbj-63Q.png" /></figure><p>Neste episódio, batemos um papo com o Leonardo Karpinski, destaque no mundo da Análise de Dados e PowerBI no Brasil.</p><p>Falamos sobre a carreira de analista de dados, como ele saiu de uma graduação em engenharia e passou até por vender marmitas, e hoje é um dos maiores nomes em formação em análise de dados e Power BI do Brasil. Falamos também sobre a nova parceria entre a <a href="https://www.linkedin.com/school/xperiun/">Xperiun</a> e o Let’s Data!</p><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fopen.spotify.com%2Fembed%2Fepisode%2F2IvNHiLRpJ1Rz1MDicbtSm%3Futm_source%3Doembed&amp;display_name=Spotify&amp;url=https%3A%2F%2Fopen.spotify.com%2Fepisode%2F2IvNHiLRpJ1Rz1MDicbtSm&amp;image=https%3A%2F%2Fi.scdn.co%2Fimage%2Fab67656300005f1ff262980ee3d6257fdbecc465&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=spotify" width="456" height="152" frameborder="0" scrolling="no"><a href="https://medium.com/media/d7f0de3197bfb87d9aff3ff885b15e9d/href">https://medium.com/media/d7f0de3197bfb87d9aff3ff885b15e9d/href</a></iframe><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FgKdbvYhyJUk&amp;display_name=YouTube&amp;url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DgKdbvYhyJUk&amp;image=http%3A%2F%2Fi.ytimg.com%2Fvi%2FgKdbvYhyJUk%2Fhqdefault.jpg&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=youtube" width="854" height="480" frameborder="0" scrolling="no"><a href="https://medium.com/media/634fd7118fb974e5eab53d93d5886cbf/href">https://medium.com/media/634fd7118fb974e5eab53d93d5886cbf/href</a></iframe><p>☑️ Observação: os timestamps se referem ao tempo do episódio no YouTube.</p><p>[00:03:25] Seu caminho para se tornar Analista de Dados</p><p>[00:06:50] <a href="https://learn.microsoft.com/pt-br/cpp/cpp/?view=msvc-170">C++</a></p><p>[00:10:40] Transição de Excel para Power BI</p><p>[00:15:12] ChatGPT para análise de dados</p><p>[00:19:55] Análise de dados para empresas de diferentes setores</p><p>[00:24:00] Análise de dados x Criação de dashboards</p><p>[00:27:00] Dicas para quem está começando em Análise de Dados</p><p>[00:29:00] Sobre ser empreendedor</p><p>[00:34:40] Sobre a <a href="https://www.linkedin.com/school/xperiun/">Xperiun</a></p><p>[00:38:26] Sobre ser MVP Microsoft</p><p>[00:40:25] Sobre trabalho remoto, híbrido ou presencial</p><p>[00:44:00] Power BI ou Tableau? Python ou R?</p><p>[00:44:45] Analista de Dados: <a href="https://www.linkedin.com/in/garciamartins/">Fernando Garcia</a></p><p>[00:45:25] O que a IA ainda não consegue?</p><p>[00:45:43] Livro: <a href="https://www.amazon.com.br/Mensageiro-Milion%C3%A1rio-Brendon-Burchard/dp/8563219995">O mensageiro milionário</a></p><p>[00:46:15] Série: <a href="https://www.adorocinema.com/series/serie-34197/">Depois da cabana</a> e <a href="https://www.adorocinema.com/series/serie-3517/">Breaking Bad</a></p><p>[00:46:40] Banda: <a href="https://open.spotify.com/intl-pt/artist/6mdiAmATAx73kdxrNrnlao?autoplay=true">Iron Maiden</a></p><p>[00:47:25] Hobby</p><p>[00:47:34] Viagem: Suíça</p><p>[00:47:49] Sonho</p><p>[00:48:35] Pergunta de 1 milhão de euros</p><p>As referências deste espisódio foram curadas pelo <a href="https://www.linkedin.com/in/rochavianna/">João Rocha Vianna</a>.</p><p>Obrigado João!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=a49ef5c15bd8" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/lets-data-podcast-040-leonardo-karpinski-a49ef5c15bd8">Let’s Data Podcast #040 — Leonardo Karpinski</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Desvendando a Importância das Features em Data Science]]></title>
            <link>https://medium.com/lets-data/desvendando-a-import%C3%A2ncia-das-features-em-data-science-102b1d2def2e?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/102b1d2def2e</guid>
            <category><![CDATA[ai]]></category>
            <category><![CDATA[artificial-intelligence]]></category>
            <category><![CDATA[machine-learning]]></category>
            <category><![CDATA[data-science]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Mon, 04 Dec 2023 01:46:14 GMT</pubDate>
            <atom:updated>2023-12-05T23:48:39.070Z</atom:updated>
            <content:encoded><![CDATA[<h4>Uma tarefa simples que ajuda a compeender melhor o seu modelo de machine learning</h4><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*jt7uqXMa7bNlChs4ewhD_g.png" /><figcaption>Imagem: DALL•E</figcaption></figure><p>Neste artigo, exploraremos um conceito crucial neste campo: a “Feature Importance”. Este artigo é para iniciantes e em Data Science que já dão os seus primeiros passos em modelagem e querem aprofundar nos resultados dos modelos.</p><h3>O Que é Feature Importance?</h3><p>Imagine um cenário onde você tem inúmeras variáveis, mas nem todas são igualmente importantes para o resultado de seu modelo. Aqui entra a “Feature Importance”. É a técnica de avaliar e classificar as variáveis de um conjunto de dados com base na influência que exercem na variável alvo de um modelo preditivo. Compreender a “Feature Importance” ajuda a simplificar modelos, melhorar a eficiência e, o mais importante, aumentar a compreensão dos dados.</p><h3>Técnicas Comuns de Feature Importance</h3><h4>Análise de Coeficientes em Modelos Lineares</h4><p>Em modelos lineares, como a regressão linear, os coeficientes atribuídos às variáveis podem ser interpretados como medidas de importância. Um coeficiente alto implica uma forte influência na variável dependente. Por exemplo:</p><pre>from sklearn.linear_model import LogisticRegression<br>from sklearn.datasets import load_iris<br>import matplotlib.pyplot as plt<br>import pandas as pd<br><br># Loading the Iris dataset<br>iris = load_iris()<br>X = pd.DataFrame(iris.data, columns=iris.feature_names)<br>y = iris.target<br><br># Adjusting the logistic regression model<br>model = LogisticRegression(max_iter=200)<br>model.fit(X, y)<br><br># Visualizing the importance of features<br>coefficients = pd.Series(model.coef_[0], index=X.columns)<br>coefficients.plot(kind=&#39;barh&#39;)<br>plt.title(&#39;Feature Importance in Logistic Regression Model&#39;)<br>plt.xlabel(&#39;Coefficient&#39;)<br>plt.ylabel(&#39;Feature&#39;)<br>plt.show()</pre><figure><img alt="" src="https://cdn-images-1.medium.com/max/668/1*1MsnZizvNp60JhZ_GChtrw.png" /></figure><p>No exemplo de regressão logística que usamos com o conjunto de dados Iris, observamos a importância de cada feature através dos coeficientes do modelo. A regressão logística, sendo um modelo linear, atribui um peso ou coeficiente a cada feature, que pode ser interpretado como sua importância relativa.</p><p>No gráfico gerado, podemos ver claramente quais features têm maior peso. Por exemplo, se a “largura da pétala” (<em>petal width</em>) tem o coeficiente mais alto, isso indica que ela tem a maior influência na determinação da classe da íris. Isso faz sentido, pois na biologia da íris, a largura e o comprimento da pétala são características distintivas entre as espécies.</p><p>É importante notar que coeficientes altos podem representar tanto uma influência positiva quanto negativa, dependendo do sinal do coeficiente. Um coeficiente positivo indica que quanto maior o valor da feature, maior será o impacto na variável dependente, enquanto um coeficiente negativo sugere o contrário.</p><p>Esta análise nos ajuda a entender não apenas quais features são importantes, mas também como elas influenciam a previsão do modelo.</p><h4>Importância das Features em Árvores de Decisão</h4><p>Árvores de decisão e modelos baseados em árvores, como random forest, oferecem um insight direto sobre a importância das features. Estes modelos fornecem uma pontuação para cada feature, indicando sua utilidade na construção das árvores. Por exemplo:</p><pre>from sklearn.ensemble import RandomForestClassifier<br>from sklearn.datasets import load_iris<br>import pandas as pd<br>import matplotlib.pyplot as plt<br><br># Carregando o conjunto de dados Iris<br>iris = load_iris()<br>X = pd.DataFrame(iris.data, columns=iris.feature_names)<br>y = iris.target<br><br># Criando e treinando o modelo de floresta aleatória<br>modelo = RandomForestClassifier(n_estimators=100)<br>modelo.fit(X, y)<br><br># Visualizando a importância das features<br>importancias = pd.Series(modelo.feature_importances_, index=X.columns)<br>importancias.nlargest(4).plot(kind=&#39;barh&#39;)<br>plt.title(&#39;Importância das Features no Random Forest&#39;)<br>plt.show()</pre><figure><img alt="" src="https://cdn-images-1.medium.com/max/647/1*xoNm0zjb2VVrxV-uHBfA7w.png" /></figure><p>No exemplo usando o modelo Random Forest, a importância das features é determinada com base em quão úteis elas são para a construção das árvores de decisão. Diferente da regressão logística, esta técnica não se baseia em coeficientes lineares, mas sim na eficácia de cada feature em reduzir a impureza das árvores.</p><p>O gráfico mostra que certas features, como “comprimento da pétala” (petal length) e “largura da pétala” (petal width), são mais significativas para o modelo. Estas features provavelmente fornecem as divisões mais informativas e ajudam o modelo a diferenciar eficazmente entre as classes.</p><p>Essa análise é crucial para entender como o modelo está tomando suas decisões e quais características dos dados estão mais fortemente associadas às diferentes categorias de íris. Isso também pode guiar futuras coletas de dados e a preparação de features, priorizando aquelas que são mais informativas para o modelo.</p><h3>Aplicações Importantes</h3><p>Feature importance pode ser aplicado para <em>feature selection</em>, que é a seleção de features que vão ser utilizadas para um modelo. Assim é possível determinar as variáveis mais importantes e otimizar o modelo, ou até mesmo experimentar novas opções de features.</p><p>Outra é a interpretação do modelo, ajudando o cientista de dados a explicar melhor as variáveis mais importantes e mais relevantes ao modelo, ou até mesmo ao produto ou negócio que na empresa que ele trabalha. Dessa forma é possível até em eventuais casos, ajudar outras equipes a entender melhor que tipo de informação é crucial para o desenvolvimento do negócio.</p><h3>Considerações Finais</h3><p>“Feature Importance” é uma ferramenta valiosa no arsenal de qualquer cientista de dados. Não só melhora a performance dos modelos, como também proporciona insights mais profundos sobre os dados. Recomendamos aos leitores que apliquem essas técnicas em seus próprios projetos para uma compreensão mais prática e aprofundada.</p><h3>Nos ajude a te ajudar!</h3><p>Se você gostou deste artigo e quer apoiar o Let’s Data, dê uns claps! E você pode fazer isso mais de uma vez, que tal uns 15?</p><p>Deixe um comentário dizendo o que acha deste assunto!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=102b1d2def2e" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/desvendando-a-import%C3%A2ncia-das-features-em-data-science-102b1d2def2e">Desvendando a Importância das Features em Data Science</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Let’s Data Podcast #039 — Luiz Santos]]></title>
            <link>https://medium.com/lets-data/lets-data-podcast-039-luiz-santos-849633bac437?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/849633bac437</guid>
            <category><![CDATA[podcast]]></category>
            <category><![CDATA[data-science]]></category>
            <category><![CDATA[machine-learning]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Mon, 27 Nov 2023 18:52:42 GMT</pubDate>
            <atom:updated>2023-11-27T18:53:07.948Z</atom:updated>
            <content:encoded><![CDATA[<h3>Let’s Data Podcast #039 — Luiz Santos</h3><h4>Trabalho em unicórnio de IA da gringa</h4><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*FN6CjRGQ42LdvPYRTOXGqQ.png" /></figure><p>Conversamos com o <a href="https://www.linkedin.com/in/luizfsantos/">Luiz Santos</a>, Solutions Engineering Manager na <a href="https://h2o.ai/">H2O.ai</a>.</p><p>Sabia que eles tem mais mais Kaggle Grandmasters que a própria NVIDIA!? Falamos sobre trabalho na gringa, carreira de gestor na área de dados, perfil de profissional que a H2O procura e muito mais! Aproveite o episódio e prepare o currículo porque eles estão contratado 😂</p><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fopen.spotify.com%2Fembed%2Fepisode%2F0PmkDccu5Yg6KiSjNT1jHO%3Futm_source%3Doembed&amp;display_name=Spotify&amp;url=https%3A%2F%2Fopen.spotify.com%2Fepisode%2F0PmkDccu5Yg6KiSjNT1jHO&amp;image=https%3A%2F%2Fi.scdn.co%2Fimage%2Fab67656300005f1ff262980ee3d6257fdbecc465&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=spotify" width="456" height="152" frameborder="0" scrolling="no"><a href="https://medium.com/media/4f232678455b73be1518c0c956a4c8bb/href">https://medium.com/media/4f232678455b73be1518c0c956a4c8bb/href</a></iframe><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FgjZu06-R00E&amp;display_name=YouTube&amp;url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DgjZu06-R00E&amp;image=http%3A%2F%2Fi.ytimg.com%2Fvi%2FgjZu06-R00E%2Fhqdefault.jpg&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=youtube" width="854" height="480" frameborder="0" scrolling="no"><a href="https://medium.com/media/35c52abaf5b8b79d5c5603ae5e0d82f8/href">https://medium.com/media/35c52abaf5b8b79d5c5603ae5e0d82f8/href</a></iframe><p>Referências de assuntos neste episódio<br>☑️ Observação: os timestamps se referem ao tempo do episódio no YouTube.</p><p>[00:02:50] Seu caminho para se tornar um Cientista de Dados</p><p>[00:05:55] O que faz a H2O.ai</p><p>[00:10:13] Trabalho na H2O.ai</p><p>[00:12:25] O que os <a href="https://www.kaggle.com/">Kaggle</a> Masters fazem na H2O.ai</p><p>[00:17:00] Projetos desenvolvidos na H2O.ai</p><p>[00:20:10] Trabalhar em outro idioma</p><p>[00:23:00] Perfil que a H2O.ai procura em novos profissionais</p><p>[00:26:07] Mudança para uma carreira de gerência</p><p>[00:28:15] Trabalhar para o exterior</p><p>[00:31:05] Modelo de trabalho remoto, híbrido ou presencial</p><p>[00:34:03] Conselhos para trabalhar pro exterior e/ou na H2O.ai</p><p>[00:39:10] Mestrado na Georgia Tech</p><p>[00:45:53] Python ou R?</p><p>[00:46:55] Referência em TI: <a href="https://www.joelonsoftware.com/">Joel Spolsky</a> (Cofundador do Stack</p><p>[00:49:54] O que a IA ainda não consegue?</p><p>[00:52:47] Livro: <a href="https://www.amazon.com.br/Saga-brasileira-longa-luta-moeda/dp/8501088714/ref=asc_df_8501088714/">Saga brasileira — Miriam Leitão</a></p><p>[00:55:05] Filme: <a href="https://www.imdb.com/title/tt1210166/">Moneyball</a></p><p>[00:56:04] Banda: <a href="https://open.spotify.com/intl-pt/artist/0k17h0D3J5VfsdmQ1iZtE9">Pink Floyd</a></p><p>[00:56:55] Hobby: Marcenaria e LEGO</p><p>[00:58:36] Viagem: EUA</p><p>[00:59:58] Sonho?</p><p>[01:00:53] Pergunta de 1 milhão de euros</p><p>As referências deste espisódio foram curadas pelo <a href="https://www.linkedin.com/in/rochavianna/">João Rocha Vianna</a>.</p><p>Obrigado João!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=849633bac437" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/lets-data-podcast-039-luiz-santos-849633bac437">Let’s Data Podcast #039 — Luiz Santos</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Let’s Data Podcast #038— Rodrigo Teoria]]></title>
            <link>https://medium.com/lets-data/lets-data-podcast-038-rodrigo-teoria-5f1225458748?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/5f1225458748</guid>
            <category><![CDATA[ai]]></category>
            <category><![CDATA[data-science]]></category>
            <category><![CDATA[data-engineering]]></category>
            <category><![CDATA[podcast]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Mon, 27 Nov 2023 18:44:55 GMT</pubDate>
            <atom:updated>2023-11-27T18:44:55.382Z</atom:updated>
            <content:encoded><![CDATA[<h4>Data Mesh e Engenharia de Dados</h4><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*jjaSTCgK5jTKIr0NrtSrBA.png" /></figure><p>Neste episódio, batemos um papo com o Rodrigo Teoria, destaque no mundo da Engenharia de Dados e na Comunidade de Dados no Brasil.</p><p>Conversamos sobre as principais diferenças entre as carreiras de cientista e engenheiro de dados. Teoria compartilhou conosco os segredos por trás de um pipeline de dados eficaz e por que o data mesh está ganhando tanto destaque no mundo corporativo. Se você está buscando insights valiosos sobre a vanguarda da engenharia de dados, este é o episódio para você.</p><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fopen.spotify.com%2Fembed%2Fepisode%2F5ArAhQ2MSVfPTm8VgxxXnB%3Futm_source%3Doembed&amp;display_name=Spotify&amp;url=https%3A%2F%2Fopen.spotify.com%2Fepisode%2F5ArAhQ2MSVfPTm8VgxxXnB&amp;image=https%3A%2F%2Fi.scdn.co%2Fimage%2Fab67656300005f1ff262980ee3d6257fdbecc465&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=spotify" width="456" height="152" frameborder="0" scrolling="no"><a href="https://medium.com/media/85aabf5381ce83fd85c0d3016bc74d2a/href">https://medium.com/media/85aabf5381ce83fd85c0d3016bc74d2a/href</a></iframe><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2Fe32ASmi1Ijg&amp;display_name=YouTube&amp;url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3De32ASmi1Ijg&amp;image=http%3A%2F%2Fi.ytimg.com%2Fvi%2Fe32ASmi1Ijg%2Fhqdefault.jpg&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=youtube" width="854" height="480" frameborder="0" scrolling="no"><a href="https://medium.com/media/dc7d42f9fce2bd73cdc99412852ef03e/href">https://medium.com/media/dc7d42f9fce2bd73cdc99412852ef03e/href</a></iframe><p>Referências de assuntos neste episódio<br>☑️ Observação: os timestamps se referem ao tempo do episódio no YouTube.</p><p>[00:03:03] Seu caminho para se tornar um Engenheiro de Dados</p><p>[00:12:03] Diferença entre Engenheiro de Dados, Cientista de Dados e MLOps</p><p>[00:17:34] Segredos por trás de um pipeline de dados eficaz</p><p>[00:29:08] Por que o Data Mesh está ganhando tanto destaque no mundo corporativo</p><p>[00:38:25] História da origem do apelido ‘Teoria’</p><p>[00:41:34] Trabalho na <a href="https://www.linkedin.com/company/serasaexperian/">Serasa Experian</a></p><p>[00:45:37] Trabalho na Universidade de Pernambuco (UPE)</p><p>[00:50:58] ‘Supletivos’ (projeto criado com a comunidade Data Hackers</p><p>[00:57:46] Python ou R?</p><p>[00:59:36] Cientistas de Dados: <a href="https://www.linkedin.com/in/andrewyng/">Andrew Ng</a> e <a href="https://www.linkedin.com/in/teocalvo/">Téo Calvo</a></p><p>[01:00:30] O que a IA ainda não consegue?</p><p>[01:01:07] Livro: <a href="https://www.amazon.com.br/dp/8573595078?ref_=cm_sw_r_apan_dp_PCX5J3QGMGHW2CJCS0FH&amp;language=pt-BR">Como as pessoas aprendem</a>?</p><p>[01:01:43] Série: <a href="https://www.netflix.com/br/title/70143836">Breaking Bad</a></p><p>[01:02:23] Banda: <a href="https://open.spotify.com/intl-pt/artist/2ye2Wgw4gimLv2eAKyk1NB">Metallica</a></p><p>[01:02:46] Hobby: Jiu Jitsu e Corrida</p><p>[01:05:14] Pergunta de 1 milhão de euros</p><p>As referências deste espisódio foram curadas pelo <a href="https://www.linkedin.com/in/rochavianna/">João Rocha Vianna</a>.</p><p>Obrigado João!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=5f1225458748" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/lets-data-podcast-038-rodrigo-teoria-5f1225458748">Let’s Data Podcast #038— Rodrigo Teoria</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
        <item>
            <title><![CDATA[Let’s Data Podcast #037 — João Paulo Nogueira]]></title>
            <link>https://medium.com/lets-data/lets-data-podcast-037-jo%C3%A3o-paulo-nogueira-0614f2d031c0?source=rss----de10db4a9d14---4</link>
            <guid isPermaLink="false">https://medium.com/p/0614f2d031c0</guid>
            <category><![CDATA[podcast]]></category>
            <category><![CDATA[artificial-intelligence]]></category>
            <category><![CDATA[ai]]></category>
            <category><![CDATA[data-science]]></category>
            <dc:creator><![CDATA[Bernardo Lago]]></dc:creator>
            <pubDate>Mon, 27 Nov 2023 12:46:03 GMT</pubDate>
            <atom:updated>2023-11-27T12:46:03.201Z</atom:updated>
            <content:encoded><![CDATA[<h3>Let’s Data Podcast #037 — João Paulo Nogueira</h3><h4>O que as empresas buscam em profissionais de dados</h4><figure><img alt="" src="https://cdn-images-1.medium.com/max/1024/1*jKRINKJogb9gniDIeerGcQ.png" /></figure><p>Neste episódio conversamos com <a href="https://www.linkedin.com/in/joaopaulonogueira/">João Paulo Nogueira</a>, Cientista de Dados na <a href="https://www.linkedin.com/company/datarisk/">Datarisk</a>.</p><p>Conversamos sobre os desafios da migração da carreira acadêmica para o mercado de trabalho. Como são as consultorias de dados para empresas. Falamos também sobre os requisitos que facilitam a contratação de um profissional de dados, seja Júnior, Pleno ou Sênior.</p><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fopen.spotify.com%2Fembed%2Fepisode%2F1UGg7RL5rzoWMzYzmNiecT%3Futm_source%3Doembed&amp;display_name=Spotify&amp;url=https%3A%2F%2Fopen.spotify.com%2Fepisode%2F1UGg7RL5rzoWMzYzmNiecT&amp;image=https%3A%2F%2Fi.scdn.co%2Fimage%2Fab67656300005f1ff262980ee3d6257fdbecc465&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=spotify" width="456" height="152" frameborder="0" scrolling="no"><a href="https://medium.com/media/ee05758a613616167e89d9283f82dd61/href">https://medium.com/media/ee05758a613616167e89d9283f82dd61/href</a></iframe><iframe src="https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FL1qmmZVomAo%3Ffeature%3Doembed&amp;display_name=YouTube&amp;url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DL1qmmZVomAo&amp;image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FL1qmmZVomAo%2Fhqdefault.jpg&amp;key=a19fcc184b9711e1b4764040d3dc5c07&amp;type=text%2Fhtml&amp;schema=youtube" width="854" height="480" frameborder="0" scrolling="no"><a href="https://medium.com/media/fd5041b46a7d9189f943ecd055e8d70e/href">https://medium.com/media/fd5041b46a7d9189f943ecd055e8d70e/href</a></iframe><p>Referências de assuntos neste episódio<br>☑️ Observação: os timestamps se referem ao tempo do episódio no YouTube.</p><p>[00:03:54] <a href="https://www.ufc.br/">Universidade Federal do Ceará</a></p><p>[00:04:32] Linguagens: <a href="https://www.ruby-lang.org/en/">Ruby</a>, <a href="https://www.java.com/">Java</a></p><p>[00:08:06] Livro: <a href="https://merely-useful.tech/py-rse/">RESEARCH SOFTWARE ENGINEERING</a></p><p>[00:12:50] Curso: <a href="https://www.deeplearning.ai/courses/machine-learning-specialization/">Machine Learning Specialization — Andrew Ng</a></p><p>[00:13:14] Comunidade: <a href="https://www.datahackers.com.br/">Data Hackers</a></p><p>[00:18:10] Sobre as oportunidades e desafios da trajetória acadêmica</p><p>[00:25:48] Sobre seu cargo atual na empresa Datarisk</p><p>[00:31:13] O que é MLOps?</p><p>[00:35:12] Erros mais comuns que empresas cometem ao tentar implementar soluções de Machine Learning</p><p>[00:37:40] Habilidades fundamentais num profissional de dados Júnior, Pleno e Sênior</p><p>[00:42:10] Experiência como professor de Machine Learning na FIA Business School</p><p>[00:46:40] Python ou R: Python! — Antes e depois do <a href="https://medium.com/tag/tidyverse">Tidyverse</a> no R</p><p>[00:53:30] Biblioteca do R recomendada: <a href="https://recipes.tidymodels.org/">recipes</a></p><p>[00:54:35] Cientista de Dados: <a href="https://www.linkedin.com/in/teocalvo/">Téo Calvo</a></p><p>[00:57:20] Livro: <a href="https://www.amazon.com.br/Naked-Statistics-Stripping-Dread-English-ebook/dp/B007Q6XLF2">Estatística nua e crua — Charles Wheelan (livro em inglês</a>)</p><p>[00:58:30] Série: <a href="https://www.adorocinema.com/series/serie-28959/">From (Origem) </a>— dos mesmos produtores de Lost / disponível no Globoplay</p><p>[01:00:30] Artista: <a href="https://www.taylorswift.com/">Taylor Swift</a></p><p>[01:07:30] Resposta à pergunta de 1 Milhão de Euros</p><p>As referências deste espisódio foram curadas pelo <a href="https://www.linkedin.com/in/rochavianna/">João Rocha Vianna</a>.</p><p>Obrigado João!</p><img src="https://medium.com/_/stat?event=post.clientViewed&referrerSource=full_rss&postId=0614f2d031c0" width="1" height="1" alt=""><hr><p><a href="https://medium.com/lets-data/lets-data-podcast-037-jo%C3%A3o-paulo-nogueira-0614f2d031c0">Let’s Data Podcast #037 — João Paulo Nogueira</a> was originally published in <a href="https://medium.com/lets-data">Let’s Data</a> on Medium, where people are continuing the conversation by highlighting and responding to this story.</p>]]></content:encoded>
        </item>
    </channel>
</rss>