---
title: "Python para Analista de Dados: Carreira Júnior no Brasil"
url: "https://python.dev.br/carreira/python-analista-de-dados/"
markdown_url: "https://python.dev.br/carreira/python-analista-de-dados.MD"
description: "Como se tornar analista de dados usando Python no Brasil: SQL, pandas, métricas de negócio, dashboard, portfólio e vagas júnior com diferenças entre analista, engenheiro e cientista de dados."
date: "2026-06-28"
author: "Equipe Python Brasil"
---

# Python para Analista de Dados: Carreira Júnior no Brasil

Como se tornar analista de dados usando Python no Brasil: SQL, pandas, métricas de negócio, dashboard, portfólio e vagas júnior com diferenças entre analista, engenheiro e cientista de dados.


Analista de dados é hoje um dos cargos de entrada mais comuns para quem chega ao mercado de tecnologia usando Python no Brasil. Diferente do engenheiro de dados, que constrói a tubulação de informações, ou do cientista de dados, que treina modelos preditivos, o analista vive no meio do caminho entre a pergunta de negócio e a decisão: recebe um problema, busca os dados, calcula métricas e comunica uma resposta que alguém vai usar.

Em uma leitura do radar interno de vagas do Python Brasil em junho de 2026, **"analista de dados" era a função de dados mais citada em português**, aparecendo mais vezes do que "engenheiro de dados" e "cientista de dados" somadas em descrições no idioma. A palavra "dados" sozinha aparecia em mais de 180 oportunidades. Isso mostra um padrão claro: há bastante demanda para quem sabe transformar dados em resposta de negócio, e Python é a ferramenta que diferencia o candidato que entrega análise reproduzível daquele que só abre planilha.

Este guia mostra como posicionar Python para conseguir vaga de analista de dados júnior no Brasil: o que o cargo faz, quais habilidades aparecem juntas nas vagas, como diferenciar analista de engenheiro e cientista, um projeto de portfólio pronto e um plano de estudo de 30 dias. Se você ainda está definindo a área, leia também [áreas de atuação com Python](/carreira/areas-atuacao-python/), o [roadmap Python 2026](/carreira/roadmap-python-2026/) e o guia de [primeiro emprego como programador Python](/carreira/primeiro-emprego-python/).

## O que faz um analista de dados

O dia a dia do analista gira em torno de **perguntas de negócio**, não de código pelo código. Um gestor pergunta "por que o churn aumentou?", "qual canal traz mais clientes lucrativos?" ou "como a receita varia por região?". O trabalho do analista é transformar essa pergunta vaga em uma resposta confiável.

Um ciclo típico é:

1. **Entender a pergunta**: conversar com quem pediu a análise para definir qual métrica importa e qual decisão ela vai apoiar.
2. **Buscar os dados**: escrever SQL para extrair informações do banco, exportar de sistemas ou ler planilhas e APIs.
3. **Preparar e analisar**: limpar valores faltantes, padronizar categorias, calcular indicadores e comparar períodos.
4. **Comunicar**: entregar um dashboard, um relatório ou um documento curto com a conclusão, sempre apontando limitações.

O detalhe que separa um bom analista de um iniciante é exatamente a comunicação. Ninguém contrata alguém que só devolve números; contratam quem entrega uma conclusão honesta, com o caminho usado para chegar até ela.

## Por que Python e não só Excel

Excel ainda é ubíquo em análise de dados no Brasil, mas tem limites que prejudicam quem quer crescer na carreira: planilhas grandes travam, cálculos repetidos viram erro manual, é difícil versionar e quase impossível auditar. É aqui que Python entra com duas bibliotecas centrais.

**pandas** transforma dados tabulares em código reproduzível: ler CSV, agrupar, cruzar tabelas e calcular métricas viram comandos que rodam igual em qualquer máquina. **SQL** aparece em quase toda vaga de dados; combinado com Python, ele permite extrair do banco e continuar a análise em um notebook ou script. Para um aprofundamento, leia o guia de [introdução ao pandas](/blog/introducao-ao-pandas/) e a [análise de dados com pandas](/guias/analise-dados-pandas/).

O ponto importante é: Python **não substitui** a ferramenta de BI nem o Excel. Ele complementa, deixando a parte de preparação e validação automática e auditável. Em entrevista, você consegue explicar onde cada peça entra — o que já coloca você à frente de candidatos que só sabem arrastar fórmula.

## Analista, engenheiro ou cientista de dados?

Essa é a dúvida mais comum entre iniciantes. Os três cargos se sobrepõem em empresas pequenas, mas têm focos diferentes:

| Cargo | Foco principal | Ferramentas típicas |
|---|---|---|
| **Analista de dados** | Responder perguntas de negócio | SQL, Excel, pandas, Power BI/Tableau |
| **Engenheiro de dados** | Construir pipelines e infraestrutura | Python, Airflow, dbt, Spark, nuvem |
| **Cientista de dados** | Modelos preditivos e estatística | Python, scikit-learn, estatística, ML |

Para quem está começando, **o cargo de analista costuma ser o ponto de entrada mais acessível**: exige menos infraestrutura e modelagem avançada, e valoriza raciocínio de negócio e clareza na comunicação. Depois, é comum migrar para engenharia de dados (se você gostar de construir pipelines) ou para ciência de dados (se gostar de estatística e modelos). Para entender a trilha de infraestrutura, leia [Python para engenheiro de dados](/carreira/python-engenheiro-de-dados/); para a parte de visualização, veja [Python e Power BI](/carreira/python-power-bi-dados/).

## Habilidades que aparecem juntas nas vagas

Lendo descrições reais de vagas de analista de dados júnior, o conjunto de habilidades mais recorrente é:

- **SQL**: joins, agregações, filtros, datas e CTEs. É a habilidade mais cobrada.
- **Python com pandas**: leitura, limpeza, agrupamento e cálculo de métricas reproduzíveis.
- **Excel avançado**: PROCV, tabelas dinâmicas e formatação — ainda muito pedido no Brasil.
- **Ferramenta de BI**: Power BI ou Tableau para montar dashboards.
- **Estatística básica**: média, mediana, distribuição, correlação e leitura de gráficos.
- **Storytelling com dados**: transformar números em narrativa clara para o negócio.
- **Git e README**: apresentar o trabalho de forma reproduzível.

Não tente aprender tudo de uma vez. A ordem mais eficiente é SQL sólido, depois pandas para automatizar, depois uma ferramenta de BI para apresentar e, por fim, Git para expor o portfólio. Consulte sempre vagas reais na nossa página de [vagas de Python](/vagas/) para calibrar palavras-chave de forma honesta.

## Workflow típico de análise com Python

Um exemplo concreto ajuda a fixar o papel. Imagine a pergunta: "qual canal de marketing traz os clientes com maior receita média?". Um analista resolveria assim:

```python
import pandas as pd
from sqlalchemy import create_engine

# Conecta ao banco de dados (ex.: Postgres local)
engine = create_engine("postgresql+psycopg2://usuario:senha@localhost:5432/empresa")

# Extrai vendas e clientes com SQL
query = """
    SELECT c.canal_origem, v.cliente_id, SUM(v.valor) AS receita_total
    FROM vendas v
    JOIN clientes c ON c.id = v.cliente_id
    WHERE v.status = 'pago'
    GROUP BY c.canal_origem, v.cliente_id
"""
df = pd.read_sql(query, engine)

# Calcula receita média por cliente em cada canal
resumo = (
    df.groupby("canal_origem")["receita_total"]
    .agg(["mean", "median", "count"])
    .sort_values("mean", ascending=False)
    .round(2)
)
print(resumo)
```

Repare em três decisões profissionais nesse script: filtrar só vendas pagas (qualidade dos dados), usar mediana além da média (robustez a outliers) e ordenar pelo critério de negócio. Essa é a diferença entre devolver números e entregar análise. Para bases locais muito grandes, [DuckDB com Python](/blog/python-e-duckdb-analytics/) acelera a consulta sem precisar de servidor.

## Projeto de portfólio recomendado

Um projeto forte para vaga júnior pode se chamar `analise-churn-assinatura`. O objetivo é simular uma operação de assinaturas com dados fictícios e responder, de ponta a ponta, a uma pergunta de negócio.

Escopo mínimo:

1. gerar ou baixar dados fictícios de assinantes em CSV (planos, data de início, cancelamento, canal);
2. carregar com pandas e limpar datas e categorias;
3. calcular taxa de churn por mês e por canal;
4. criar um dashboard simples com a métrica principal;
5. escrever um README com a pergunta, o método, os achados e as limitações.

Exemplo de cálculo de churn por mês:

```python
# Taxa de churn: cancelados no mês / ativos no início do mês
df["mes"] = df["data_cancelamento"].dt.to_period("M")
ativos_inicio = df.groupby("mes")["ativo_inicio"].sum()
cancelados = df.groupby("mes")["cancelado"].sum()
churn = (cancelados / ativos_inicio * 100).round(2)
print(churn)
```

O que diferencia esse projeto não é o gráfico bonito, e sim o README explicar **qual pergunta ele responde, qual limitação tem (dados fictícios, amostra pequena) e qual seria o próximo passo**. Para ampliar o repertório de ideias, veja [projetos de portfólio Python](/carreira/projetos-portfolio-python/). Para integrar dados públicos brasileiros ao portfólio, [Python e Excel com openpyxl](/blog/python-e-excel-openpyxl/) e [automação de planilhas](/blog/python-para-automacao-de-planilhas/) mostram o caminho.

## Como explicar no currículo

Evite listar "Python, SQL, Excel" soltos. Escreva contexto e resultado:

> Análise de churn de assinatura com Python: construí pipeline em pandas a partir de dados fictícios, calculei taxa de churn por canal e mês, identifiquei o canal com maior retenção e documentei método, achados e limitações no README.

Se o projeto tiver SQL, melhor ainda:

> Modelei consultas SQL com joins e agregações, validei qualidade dos dados em Python e publiquei dashboard com a métrica principal e a recomendação de negócio.

A palavra "fictício" não enfraquece — ela mostra maturidade em não expor dados sensíveis. Para vagas júnior, isso costuma pesar mais do que inventar experiência real. Veja mais em [currículo Python para vaga júnior](/carreira/curriculo-python-vaga-junior/) e prepare-se com o [simulador de entrevista Python](/carreira/simulador-entrevista-python/).

## Plano de estudo em 30 dias

Se você já tem Python básico, este plano organiza a transição para analista de dados:

| Semana | Foco | Entrega |
|---|---|---|
| 1 | SQL na prática | consultas com joins, agregações, datas e CTEs |
| 2 | pandas para análise | leitura, limpeza, agrupamento e métricas em notebook |
| 3 | Dashboard e storytelling | dashboard simples com a métrica e a conclusão escrita |
| 4 | Portfólio e candidaturas | README, dados fictícios, GitHub, currículo e testes técnicos |

Ao final, compare seu projeto com descrições reais e ajuste palavras-chave de forma honesta. O [teste técnico Python](/carreira/teste-tecnico-python/) traz o checklist de cases reproduzíveis que avaliadores esperam.

## O que evitar no portfólio

Projetos de dados podem parecer fortes e ainda assim passar impressão fraca. Evite:

- dashboard bonito sem explicar a fonte dos dados;
- notebook que só roda na sua máquina, sem ambiente e sem README;
- dados pessoais reais de clientes, leads ou pacientes;
- concluir sobre o negócio sem apontar limitações da amostra;
- misturar média e mediana sem justificar por que escolheu cada uma;
- copiar análise pronta da internet sem acrescentar interpretação própria.

Para portfólio público, prefira dados abertos, fictícios ou sintéticos. Deixe claro quando os números são inventados: isso mostra cuidado profissional e evita problemas de confidencialidade.

## Próximos passos

Para se aprofundar na parte técnica, estude [introdução ao pandas](/blog/introducao-ao-pandas/), [análise de dados com pandas](/guias/analise-dados-pandas/), [séries temporais com Python](/blog/series-temporais-python-statsmodels-prophet/) e [DuckDB para analytics](/blog/python-e-duckdb-analytics/). Para entender remuneração por senioridade e região, consulte [salários Python no Brasil 2026](/carreira/salarios-python-brasil/). Para olhar o mercado mais amplo de vagas júnior em tecnologia fora do nicho Python, o radar do <a href="https://eu.dev.br/" target="_blank" rel="noopener noreferrer" onclick="umami.track('portfolio-site-click', { destination: 'eu.dev.br', source: 'python-analista-de-dados' })">eu.dev.br</a> ajuda a comparar requisitos entre áreas.

A combinação vencedora não é decorar ferramentas. É conseguir contar uma história verificável: você recebeu uma pergunta de negócio, buscou dados com SQL, calculou métricas com Python, comunicou a conclusão em um dashboard e apontou os limites da análise. Essa história conversa diretamente com vagas de analista de dados no Brasil — e Python é o que transforma o seu trabalho em algo reproduzível e confiável.

## Perguntas frequentes

### Preciso saber Python para ser analista de dados?
Não é obrigatório em toda vaga, mas Python diferencia muito o candidato iniciante. A base do cargo é SQL e entendimento de negócio; Python entra para automatizar planilhas, limpar bases, calcular métricas repetitivas e criar análises reproduzíveis que o Excel não entrega.

### Qual a diferença entre analista, engenheiro e cientista de dados?
O analista responde perguntas de negócio com SQL, planilhas e dashboards. O engenheiro de dados constrói pipelines, orquestração e infraestrutura (Airflow, dbt, Spark). O cientista de dados cria modelos preditivos e de machine learning. O analista costuma ser o ponto de entrada mais acessível.

### Qual projeto de portfólio impressiona para vaga júnior de analista de dados?
Um projeto com começo, meio e fim: uma pergunta de negócio clara, dados públicos ou fictícios, SQL ou pandas para responder, uma métrica bem definida, um dashboard simples e um README explicando achados, limitações e próximos passos.

### Estudo pandas ou Power BI primeiro para análise de dados?
Comece por SQL, que aparece em quase toda vaga. Depois divida: Power BI ajuda a apresentar resultados para o negócio, enquanto pandas deixa o trabalho reproduzível e automatizado. O trio SQL + Python + uma ferramenta de BI é o mais forte para iniciantes.

### Quanto ganha um analista de dados júnior no Brasil?
Os salários variam por região, modelo (CLT/PJ/remoto) e setor. Consulte sempre a tabela atualizada na nossa página de [salários Python no Brasil](/carreira/salarios-python-brasil/) para júnior, pleno e sênior em dados.