<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Ciência De Dados on Python Brasil — Aprenda Python em Português</title>
    <link>https://python.dev.br/tags/ci%C3%AAncia-de-dados/</link>
    <description>Recent content in Ciência De Dados on Python Brasil — Aprenda Python em Português</description>
    <generator>Hugo</generator>
    <language>pt-br</language>
    <lastBuildDate>Tue, 12 May 2026 16:03:18 -0300</lastBuildDate>
    <atom:link href="https://python.dev.br/tags/ci%C3%AAncia-de-dados/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Marimo: O Notebook Reativo que Substitui o Jupyter</title>
      <link>https://python.dev.br/blog/marimo-notebook-reativo-python/</link>
      <pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/blog/marimo-notebook-reativo-python/</guid>
      <description>&lt;p&gt;Se você trabalha com ciência de dados, análise exploratória ou prototipagem em Python, provavelmente já enfrentou os problemas clássicos do Jupyter: células executadas fora de ordem, estado oculto que quebra a reprodutibilidade e arquivos &lt;code&gt;.ipynb&lt;/code&gt; que são um pesadelo para versionar com Git. O &lt;strong&gt;Marimo&lt;/strong&gt; surgiu como uma alternativa moderna que resolve esses problemas de forma elegante.&lt;/p&gt;&#xA;&lt;p&gt;Com mais de 15 mil estrelas no GitHub e adoção por empresas como Cloudflare, Shopify e BlackRock, o Marimo se consolidou em 2026 como a principal alternativa ao Jupyter para quem quer notebooks reproduzíveis, reativos e versionáveis. Neste artigo, vamos explorar como ele funciona, como instalar e criar seu primeiro notebook reativo.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ferramentas Python para Data Science: Guia Completo 2026 | python.dev.br</title>
      <link>https://python.dev.br/ferramentas/python-ferramentas-data-science/</link>
      <pubDate>Mon, 30 Mar 2026 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/ferramentas/python-ferramentas-data-science/</guid>
      <description>&lt;p&gt;Python é a linguagem número um para ciência de dados — e não é por acaso. O ecossistema de ferramentas e bibliotecas para análise, visualização e machine learning é o mais completo e maduro que existe. Neste guia, vamos revisar as ferramentas essenciais para quem trabalha (ou quer trabalhar) com data science em Python, com comparativos práticos e recomendações para 2026.&lt;/p&gt;&#xA;&lt;h2 id=&#34;ambientes-de-desenvolvimento&#34;&gt;Ambientes de Desenvolvimento&lt;/h2&gt;&#xA;&lt;h3 id=&#34;jupyter-notebook-e-jupyterlab&#34;&gt;Jupyter Notebook e JupyterLab&lt;/h3&gt;&#xA;&lt;p&gt;O &lt;a href=&#34;https://python.dev.br/glossario/jupyter-notebook/&#34;&gt;Jupyter Notebook&lt;/a&gt; é o ambiente interativo padrão para ciência de dados. Permite executar código em células, intercalando código Python, texto em Markdown, equações LaTeX e visualizações:&lt;/p&gt;</description>
    </item>
    <item>
      <title>Python e DuckDB: Análise de Dados Ultrarrápida — 2026 | python.dev.br</title>
      <link>https://python.dev.br/blog/python-e-duckdb-analytics/</link>
      <pubDate>Sun, 29 Mar 2026 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/blog/python-e-duckdb-analytics/</guid>
      <description>&lt;p&gt;Se você trabalha com análise de dados em Python, provavelmente já passou por situações em que o &lt;a href=&#34;https://python.dev.br/blog/introducao-ao-pandas/&#34;&gt;Pandas&lt;/a&gt; ficava lento demais para datasets grandes, mas subir um banco de dados completo parecia exagero. É exatamente nesse espaço que o &lt;strong&gt;DuckDB&lt;/strong&gt; brilha — um banco de dados analítico embutido, sem servidor, que roda SQL diretamente em arquivos CSV, Parquet e até DataFrames do Pandas.&lt;/p&gt;&#xA;&lt;p&gt;Neste artigo, vamos explorar como usar DuckDB com Python, desde a instalação até consultas avançadas, com exemplos práticos para o dia a dia.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Polars em Python: A Alternativa Rápida ao Pandas — 2026 | Python Brasil</title>
      <link>https://python.dev.br/blog/polars-alternativa-pandas-python/</link>
      <pubDate>Wed, 25 Mar 2026 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/blog/polars-alternativa-pandas-python/</guid>
      <description>&lt;p&gt;Se você trabalha com dados em Python, provavelmente já usa o &lt;a href=&#34;https://python.dev.br/blog/introducao-ao-pandas/&#34;&gt;Pandas&lt;/a&gt; no dia a dia. Ele é a biblioteca padrão para manipulação de DataFrames há mais de uma década. Mas nos últimos anos, uma alternativa vem ganhando espaço rapidamente: o &lt;strong&gt;Polars&lt;/strong&gt; — uma biblioteca de DataFrames escrita em Rust, projetada para ser extremamente rápida e eficiente em memória.&lt;/p&gt;&#xA;&lt;p&gt;Neste artigo, vamos explorar o que torna o Polars especial, comparar com o Pandas em benchmarks reais, e mostrar como começar a usá-lo nos seus projetos.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Python para Ciência de Dados em 2026</title>
      <link>https://python.dev.br/blog/python-para-ciencia-de-dados/</link>
      <pubDate>Sat, 15 Nov 2025 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/blog/python-para-ciencia-de-dados/</guid>
      <description>&lt;p&gt;Python se consolidou como a linguagem padrão para ciência de dados, e em 2026 essa posição está mais forte do que nunca. Neste guia, você vai aprender a usar as quatro bibliotecas fundamentais do ecossistema de dados: &lt;strong&gt;NumPy, Pandas, Matplotlib e scikit-learn&lt;/strong&gt;.&lt;/p&gt;&#xA;&lt;h2 id=&#34;configurando-o-ambiente&#34;&gt;Configurando o Ambiente&lt;/h2&gt;&#xA;&lt;p&gt;Antes de começar, vamos preparar o ambiente de desenvolvimento:&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-python&#34; data-lang=&#34;python&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# Instale as bibliotecas necessárias:&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# pip install numpy pandas matplotlib scikit-learn jupyter&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# Ou usando conda:&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# conda install numpy pandas matplotlib scikit-learn jupyter&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h2 id=&#34;numpy-a-base-de-tudo&#34;&gt;NumPy: A Base de Tudo&lt;/h2&gt;&#xA;&lt;p&gt;NumPy é a biblioteca fundamental para computação numérica em Python. Todas as outras bibliotecas de dados são construídas sobre ela.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Machine Learning: O que É e Como Funciona | Python Brasil</title>
      <link>https://python.dev.br/glossario/machine-learning/</link>
      <pubDate>Mon, 30 Jun 2025 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/glossario/machine-learning/</guid>
      <description>&lt;h2 id=&#34;o-que-é-machine-learning&#34;&gt;O que é Machine Learning?&lt;/h2&gt;&#xA;&lt;p&gt;&lt;strong&gt;Machine learning&lt;/strong&gt; (aprendizado de máquina) é um ramo da inteligência artificial em que algoritmos &lt;strong&gt;aprendem padrões a partir de dados&lt;/strong&gt; sem serem explicitamente programados para cada regra. Em vez de escrever &lt;code&gt;if temperatura &amp;gt; 38: febre = True&lt;/code&gt;, um modelo de ML aprende essa relação observando milhares de exemplos.&lt;/p&gt;&#xA;&lt;p&gt;Python domina o cenário de machine learning graças ao ecossistema de bibliotecas maduro e à comunidade ativa. Empresas como Google, Netflix, Spotify e iFood usam Python extensivamente em seus sistemas de ML em produção.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Anaconda: O que É e Como Funciona | Python Brasil</title>
      <link>https://python.dev.br/glossario/anaconda/</link>
      <pubDate>Wed, 28 May 2025 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/glossario/anaconda/</guid>
      <description>&lt;h2 id=&#34;o-que-é-anaconda&#34;&gt;O que é Anaconda?&lt;/h2&gt;&#xA;&lt;p&gt;O &lt;strong&gt;Anaconda&lt;/strong&gt; é uma &lt;strong&gt;distribuição Python voltada para ciência de dados e computação científica&lt;/strong&gt;. Desenvolvida pela empresa Anaconda Inc. (antes Continuum Analytics), ela vem com mais de 250 pacotes pré-instalados — incluindo Pandas, NumPy, SciPy, Matplotlib, Jupyter e scikit-learn — e um gerenciador de pacotes próprio chamado &lt;strong&gt;conda&lt;/strong&gt;.&lt;/p&gt;&#xA;&lt;p&gt;O grande diferencial do Anaconda em relação ao Python puro é que o conda gerencia não apenas pacotes Python, mas também &lt;strong&gt;dependências nativas&lt;/strong&gt; (bibliotecas C, C++, Fortran), resolvendo um dos maiores desafios de instalar pacotes científicos em diferentes sistemas operacionais.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Jupyter Notebook: O que É e Como Funciona | Python Brasil</title>
      <link>https://python.dev.br/glossario/jupyter-notebook/</link>
      <pubDate>Mon, 28 Apr 2025 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/glossario/jupyter-notebook/</guid>
      <description>&lt;h2 id=&#34;o-que-é-jupyter-notebook&#34;&gt;O que é Jupyter Notebook?&lt;/h2&gt;&#xA;&lt;p&gt;O &lt;strong&gt;Jupyter Notebook&lt;/strong&gt; é um ambiente interativo baseado em navegador que permite criar documentos que combinam &lt;strong&gt;código executável&lt;/strong&gt;, &lt;strong&gt;visualizações&lt;/strong&gt;, &lt;strong&gt;texto formatado em Markdown&lt;/strong&gt; e &lt;strong&gt;equações matemáticas&lt;/strong&gt; — tudo em um único arquivo com extensão &lt;code&gt;.ipynb&lt;/code&gt; (IPython Notebook).&lt;/p&gt;&#xA;&lt;p&gt;O nome &amp;ldquo;Jupyter&amp;rdquo; é uma homenagem às três linguagens que o projeto suportou originalmente: &lt;strong&gt;Ju&lt;/strong&gt;lia, &lt;strong&gt;Py&lt;/strong&gt;thon e &lt;strong&gt;R&lt;/strong&gt;. Atualmente, o Jupyter suporta mais de 40 kernels para diferentes linguagens.&lt;/p&gt;</description>
    </item>
    <item>
      <title>NumPy: O que É e Como Funciona | Python Brasil</title>
      <link>https://python.dev.br/glossario/numpy/</link>
      <pubDate>Sat, 05 Apr 2025 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/glossario/numpy/</guid>
      <description>&lt;h2 id=&#34;o-que-é-numpy&#34;&gt;O que é NumPy?&lt;/h2&gt;&#xA;&lt;p&gt;O &lt;strong&gt;NumPy&lt;/strong&gt; (Numerical Python) é a &lt;strong&gt;biblioteca fundamental para computação numérica&lt;/strong&gt; em Python. Ela fornece suporte a arrays multidimensionais de alta performance e uma vasta coleção de funções matemáticas para operar sobre esses arrays de forma eficiente.&lt;/p&gt;&#xA;&lt;p&gt;Praticamente toda biblioteca de ciência de dados em Python — como Pandas, scikit-learn, SciPy e TensorFlow — é construída sobre o NumPy ou depende de suas estruturas de dados. Entender o NumPy é, portanto, um pré-requisito para trabalhar bem com o ecossistema científico do Python.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Pandas: O que É e Como Funciona | Python Brasil</title>
      <link>https://python.dev.br/glossario/pandas/</link>
      <pubDate>Sat, 22 Mar 2025 00:00:00 +0000</pubDate>
      <guid>https://python.dev.br/glossario/pandas/</guid>
      <description>&lt;h2 id=&#34;o-que-é-pandas&#34;&gt;O que é Pandas?&lt;/h2&gt;&#xA;&lt;p&gt;O &lt;strong&gt;Pandas&lt;/strong&gt; é a biblioteca mais popular do Python para &lt;strong&gt;análise e manipulação de dados&lt;/strong&gt;. Criada por Wes McKinney em 2008, ela oferece estruturas de dados poderosas e ferramentas para trabalhar com dados tabulares de forma rápida e intuitiva.&lt;/p&gt;&#xA;&lt;p&gt;O nome vem de &amp;ldquo;Panel Data&amp;rdquo;, um termo de econometria para conjuntos de dados multidimensionais. Hoje, o Pandas é indispensável para qualquer cientista de dados, analista ou engenheiro que trabalha com Python.&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
