<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Data-Science on Python Brasil — Aprenda Python em Português</title>
    <link>https://python.dev.br/tags/data-science/</link>
    <description>Recent content in Data-Science on Python Brasil — Aprenda Python em Português</description>
    <generator>Hugo</generator>
    <language>pt-br</language>
    <lastBuildDate>Mon, 18 May 2026 23:03:24 +0000</lastBuildDate>
    <atom:link href="https://python.dev.br/tags/data-science/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Marimo: O Notebook Reativo que Substitui o Jupyter</title>
      <link>https://python.dev.br/blog/marimo-notebook-reativo-python/</link>
      <pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/blog/marimo-notebook-reativo-python/</guid>
      <description>&lt;p&gt;Se você trabalha com ciência de dados, análise exploratória ou prototipagem em Python, provavelmente já enfrentou os problemas clássicos do Jupyter: células executadas fora de ordem, estado oculto que quebra a reprodutibilidade e arquivos &lt;code&gt;.ipynb&lt;/code&gt; que são um pesadelo para versionar com Git. O &lt;strong&gt;Marimo&lt;/strong&gt; surgiu como uma alternativa moderna que resolve esses problemas de forma elegante.&lt;/p&gt;&#xA;&lt;p&gt;Com mais de 15 mil estrelas no GitHub e adoção por empresas como Cloudflare, Shopify e BlackRock, o Marimo se consolidou em 2026 como a principal alternativa ao Jupyter para quem quer notebooks reproduzíveis, reativos e versionáveis. Neste artigo, vamos explorar como ele funciona, como instalar e criar seu primeiro notebook reativo.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Pandas vs Polars: Comparativo Completo | Python Brasil</title>
      <link>https://python.dev.br/comparacoes/pandas-vs-polars/</link>
      <pubDate>Fri, 10 Apr 2026 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/comparacoes/pandas-vs-polars/</guid>
      <description>&lt;p&gt;&lt;strong&gt;Pandas&lt;/strong&gt; é a biblioteca de análise de dados mais popular do ecossistema Python — usada por milhões de analistas e cientistas de dados. &lt;strong&gt;Polars&lt;/strong&gt; é a alternativa moderna, escrita em Rust, que promete 10-100x mais performance. Neste comparativo, vamos analisar quando vale trocar e quando Pandas ainda é a melhor escolha.&lt;/p&gt;&#xA;&lt;h2 id=&#34;tabela-comparativa&#34;&gt;Tabela Comparativa&lt;/h2&gt;&#xA;&lt;table&gt;&#xA;  &lt;thead&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;th&gt;Aspecto&lt;/th&gt;&#xA;          &lt;th&gt;Pandas&lt;/th&gt;&#xA;          &lt;th&gt;Polars&lt;/th&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/thead&gt;&#xA;  &lt;tbody&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Criada em&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;2008 (Wes McKinney)&lt;/td&gt;&#xA;          &lt;td&gt;2020 (Ritchie Vink)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Linguagem base&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;C/Cython&lt;/td&gt;&#xA;          &lt;td&gt;Rust&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Performance&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Moderada&lt;/td&gt;&#xA;          &lt;td&gt;Muito alta (10-100x mais rápido)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Memória&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Alto consumo&lt;/td&gt;&#xA;          &lt;td&gt;Eficiente (Apache Arrow)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Lazy evaluation&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Não&lt;/td&gt;&#xA;          &lt;td&gt;Sim (otimiza queries automaticamente)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Multi-threading&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Limitado (GIL)&lt;/td&gt;&#xA;          &lt;td&gt;Nativo (Rust, sem GIL)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;API&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Index-based (mutable)&lt;/td&gt;&#xA;          &lt;td&gt;Expression-based (immutable)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Curva de aprendizado&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Suave (mais material)&lt;/td&gt;&#xA;          &lt;td&gt;Moderada (API diferente)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Ecossistema&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Gigantesco&lt;/td&gt;&#xA;          &lt;td&gt;Crescendo rapidamente&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Streaming&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Não (tudo em memória)&lt;/td&gt;&#xA;          &lt;td&gt;Sim (scan_csv, scan_parquet)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/tbody&gt;&#xA;&lt;/table&gt;&#xA;&lt;h2 id=&#34;sintaxe-imperativa-vs-declarativa&#34;&gt;Sintaxe: Imperativa vs Declarativa&lt;/h2&gt;&#xA;&lt;p&gt;A maior diferença de filosofia é como você expressa operações.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Python vs R: Comparativo Completo | Python Brasil</title>
      <link>https://python.dev.br/comparacoes/python-vs-r/</link>
      <pubDate>Fri, 10 Apr 2026 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/comparacoes/python-vs-r/</guid>
      <description>&lt;p&gt;&lt;strong&gt;Python&lt;/strong&gt; e &lt;strong&gt;R&lt;/strong&gt; disputam o trono da ciência de dados há mais de uma década. Python é a linguagem generalista que dominou o ML e a engenharia de dados. R é a linguagem criada por estatísticos, para estatísticos. Neste comparativo, vamos te ajudar a escolher — ou entender quando usar cada uma.&lt;/p&gt;&#xA;&lt;h2 id=&#34;tabela-comparativa&#34;&gt;Tabela Comparativa&lt;/h2&gt;&#xA;&lt;table&gt;&#xA;  &lt;thead&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;th&gt;Aspecto&lt;/th&gt;&#xA;          &lt;th&gt;Python&lt;/th&gt;&#xA;          &lt;th&gt;R&lt;/th&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/thead&gt;&#xA;  &lt;tbody&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Criada em&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;1991 (Guido van Rossum)&lt;/td&gt;&#xA;          &lt;td&gt;1993 (Ross Ihaka e Robert Gentleman)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Propósito&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Linguagem de propósito geral&lt;/td&gt;&#xA;          &lt;td&gt;Linguagem para computação estatística&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Tipagem&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Dinâmica, forte&lt;/td&gt;&#xA;          &lt;td&gt;Dinâmica, forte&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Paradigma&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Multiparadigma&lt;/td&gt;&#xA;          &lt;td&gt;Funcional e vetorial&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Ecossistema de dados&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Pandas, NumPy, Polars, scikit-learn&lt;/td&gt;&#xA;          &lt;td&gt;tidyverse, dplyr, ggplot2, caret&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Visualização&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Matplotlib, Seaborn, Plotly&lt;/td&gt;&#xA;          &lt;td&gt;ggplot2 (padrão-ouro)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Machine Learning&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;PyTorch, TensorFlow, scikit-learn&lt;/td&gt;&#xA;          &lt;td&gt;tidymodels, caret, mlr3&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;IDE principal&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;VS Code, Jupyter, PyCharm&lt;/td&gt;&#xA;          &lt;td&gt;RStudio&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Produção/Deploy&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Excelente (FastAPI, Docker, cloud)&lt;/td&gt;&#xA;          &lt;td&gt;Limitado (Shiny, Plumber)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;&lt;strong&gt;Mercado no Brasil&lt;/strong&gt;&lt;/td&gt;&#xA;          &lt;td&gt;Muito amplo&lt;/td&gt;&#xA;          &lt;td&gt;Nicho (academia, pesquisa, saúde)&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/tbody&gt;&#xA;&lt;/table&gt;&#xA;&lt;h2 id=&#34;sintaxe-propósito-geral-vs-estatística-nativa&#34;&gt;Sintaxe: Propósito Geral vs Estatística Nativa&lt;/h2&gt;&#xA;&lt;p&gt;Python é uma linguagem de programação com bibliotecas de dados. R é uma linguagem de dados com capacidades de programação.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ferramentas Python para Data Science: Guia Completo 2026 | python.dev.br</title>
      <link>https://python.dev.br/ferramentas/python-ferramentas-data-science/</link>
      <pubDate>Mon, 30 Mar 2026 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/ferramentas/python-ferramentas-data-science/</guid>
      <description>&lt;p&gt;Python é a linguagem número um para ciência de dados — e não é por acaso. O ecossistema de ferramentas e bibliotecas para análise, visualização e machine learning é o mais completo e maduro que existe. Neste guia, vamos revisar as ferramentas essenciais para quem trabalha (ou quer trabalhar) com data science em Python, com comparativos práticos e recomendações para 2026.&lt;/p&gt;&#xA;&lt;h2 id=&#34;ambientes-de-desenvolvimento&#34;&gt;Ambientes de Desenvolvimento&lt;/h2&gt;&#xA;&lt;h3 id=&#34;jupyter-notebook-e-jupyterlab&#34;&gt;Jupyter Notebook e JupyterLab&lt;/h3&gt;&#xA;&lt;p&gt;O &lt;a href=&#34;https://python.dev.br/glossario/jupyter-notebook/&#34;&gt;Jupyter Notebook&lt;/a&gt; é o ambiente interativo padrão para ciência de dados. Permite executar código em células, intercalando código Python, texto em Markdown, equações LaTeX e visualizações:&lt;/p&gt;</description>
    </item>
    <item>
      <title>Análise de Dados com Pandas: Guia</title>
      <link>https://python.dev.br/guias/analise-dados-pandas/</link>
      <pubDate>Wed, 10 Dec 2025 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/guias/analise-dados-pandas/</guid>
      <description>&lt;h2 id=&#34;introdução&#34;&gt;Introdução&lt;/h2&gt;&#xA;&lt;p&gt;Pandas é a biblioteca mais importante para análise de dados em Python. Usada por cientistas de dados, analistas e engenheiros em todo o mundo, ela permite carregar, manipular, limpar e analisar dados de forma eficiente e intuitiva.&lt;/p&gt;&#xA;&lt;p&gt;Neste guia, vamos aprender Pandas do básico ao intermediário, com exemplos práticos usando dados reais. A ideia é que você saia com um fluxo completo: importar dados, inspecionar a qualidade, transformar colunas, gerar métricas, criar gráficos simples e exportar um relatório que outra pessoa consiga abrir.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Python para Ciência de Dados em 2026</title>
      <link>https://python.dev.br/blog/python-para-ciencia-de-dados/</link>
      <pubDate>Sat, 15 Nov 2025 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/blog/python-para-ciencia-de-dados/</guid>
      <description>&lt;p&gt;Python se consolidou como a linguagem padrão para ciência de dados, e em 2026 essa posição está mais forte do que nunca. Neste guia, você vai aprender a usar as quatro bibliotecas fundamentais do ecossistema de dados: &lt;strong&gt;NumPy, Pandas, Matplotlib e scikit-learn&lt;/strong&gt;.&lt;/p&gt;&#xA;&lt;h2 id=&#34;configurando-o-ambiente&#34;&gt;Configurando o Ambiente&lt;/h2&gt;&#xA;&lt;p&gt;Antes de começar, vamos preparar o ambiente de desenvolvimento:&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-python&#34; data-lang=&#34;python&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# Instale as bibliotecas necessárias:&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# pip install numpy pandas matplotlib scikit-learn jupyter&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# Ou usando conda:&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# conda install numpy pandas matplotlib scikit-learn jupyter&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h2 id=&#34;numpy-a-base-de-tudo&#34;&gt;NumPy: A Base de Tudo&lt;/h2&gt;&#xA;&lt;p&gt;NumPy é a biblioteca fundamental para computação numérica em Python. Todas as outras bibliotecas de dados são construídas sobre ela.&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
