Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Básico de Pandas #28

Merged
merged 3 commits into from
Jun 4, 2023
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
19 changes: 19 additions & 0 deletions basico_pandas/1-leitura-arquivos.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,19 @@
import pandas as pd

"""
A biblioteca pandas é uma das principais bibliotecas do Python para manipulação
e análise de dados. Nesse arquivo veremos a criação de um Data Frame (df), ou seja,
uma matriz com linhas e colunas, a partir de diferentes tipos de arquivos
"""

# Criando um Data Frame de um arquivo .csv
df = pd.read_csv('dados.csv')

# Criando um Data Frame de um arquivo .json
df = pd.read_json('dados.json')

# Criando um Data Frame de um arquivo .html
dfs = pd.read_html('https://www.example.com/tabela.html')

# Criando um Data Frame de um arquivo .xlsx
df = pd.read_excel('dados.xlsx')
40 changes: 40 additions & 0 deletions basico_pandas/2-info-data-frame.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,40 @@
import pandas as pd

"""
A biblioteca pandas é uma das principais bibliotecas do Python para manipulação
e análise de dados. Nesse arquivo veremos as informações de um Data Frame criado
"""

# Verifica o tipo de objeto criado
df = pd.read_csv('../exercicios/transferencias - 05_2023.csv')
print("Tipo objeto df: ", end="")
print(type(df))

# Identifica quantas linhas e colunas do Data Frame
print("Linhas e Colunas (shape) Data Frame: ")
print(df.shape)

# Verifica as formato se encontram os dados em cada coluna,
# além da quantidade de memória para ler esse conjunto de dados do Data Frame
print("Informações sobre Data Frame:")
print(df.info())

# Visualiza a estatística dos dados do Data Frame
print("Descrição e estatísticas df: ")
print(df.describe())

# Visualiza a quantidade de memória usada por cada coluna (em bytes)
print("Uso de memória: ")
print(df.memory_usage(deep=True))

# Visualiza as colunas do Data Frame
print("Colunas df: " , end="")
print(df.columns)

# Visualiza as primeiras n linhas do Data Frame
print("As primeiras n linhas do Data Frame")
print(df.head(n=6))

# Visualiza as últimas n linhas do Data Frame
print("As últimas n linhas do Data Frame")
print(df.tail(n=6))
32 changes: 32 additions & 0 deletions basico_pandas/3-acessando-colunas-df.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,32 @@
import pandas as pd

"""
A biblioteca pandas é uma das principais bibliotecas do Python para manipulação
e análise de dados. Nesse arquivo veremos algumas operações sobre
colunas de um Data Frame
"""

# Cria um Data Frame
df = pd.read_csv('../exercicios/transferencias - 05_2023.csv')

# Cria um Series a partir de uma coluna do Data Frame
series_uf = df['UF']
print("Tipo objeto series_uf: ", end="")
print(type(series_uf))

# Cria um Data Frame a partir de mais de uma coluna do Data Frame
df_uf_municipio_orgao = df[['UF', 'NOME MUNICÍPIO', 'NOME ÓRGÃO']]
print("Data Frame df_uf_municipio_orgao: ")
print(df_uf_municipio_orgao)

# Dados da linha de índice 0
print("Dados da linha de índice 0")
print(df.loc[0])

# Dados das linhas pares de 0 ao 10
print("Dados das linhas pares de 0 ao 10")
print(df.loc[0:10:2])

# Mostrando os valores únicos da coluna uf
print("Valores únicos da coluna UF")
print(df['UF'].unique())