-
Notifications
You must be signed in to change notification settings - Fork 0
/
trabalho_pratico_enem
67 lines (43 loc) · 2.4 KB
/
trabalho_pratico_enem
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
# -*- coding: utf-8 -*-
"""
Created on Sun Nov 22 16:43:02 2020
@author: Marcio Gomes de Sant
"""
import pandas as pd
import numpy as np
import zipfile
import requests
import os
from io import BytesIO
# criar diretorio para armazenar conteudo do enade
os.makedirs('./enem2019', exist_ok= True) # exist_ok para verificar existencia do diretorio
#define a url
url = "http://download.inep.gov.br/microdados/microdados_enem_2019.zip"
# faz o download do conteudo // content para separar o conteudo
filebytes = BytesIO(requests.get(url).content)
# extrai o conteudo do zipfile
myzip = zipfile.ZipFile(filebytes)
myzip.extractall('./enem2019')
# verificando os dados baixados
# parametros sep para separaracao de dados e decimal para casas decimais
enem = pd.read_csv("./enem2019/DADOS/MICRODADOS_ENEM_2019.csv", sep = ";", decimal=".", encoding='latin1')
#informaçoes do frame
enem.info()
# dicionario para visualizar coluna
dict(enem.dtypes)
# NU_NOTA_MTM
# CO_MUNICIPIO_RESIDENCIA
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.TP_SEXO == "M") & (enem.NO_MUNICIPIO_RESIDENCIA =="Ouro Preto")].NU_NOTA_MT.describe()
enem.loc[enem.TP_SEXO == "M"].NU_NOTA_CH.describe()
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.NO_MUNICIPIO_RESIDENCIA =="Sabará") & (enem.Q021 == "B")].NU_NOTA_MT.describe()
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.Q016 == "C")].NU_NOTA_CH.describe()
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.Q002 == "G")].NU_NOTA_MT.describe()
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.NO_MUNICIPIO_RESIDENCIA == "Belo Horizonte")].NU_NOTA_MT.describe()
enem.loc[enem.SG_UF_RESIDENCIA == "MG"].NO_MUNICIPIO_RESIDENCIA
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.NO_MUNICIPIO_RESIDENCIA == "Conselheiro Lafaiete" & enem.NO_MUNICIPIO_RESIDENCIA == "")].NU_NOTA_MT.describe()
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.TP_SEXO == "F") & (enem.NO_MUNICIPIO_RESIDENCIA == "Lavras") & (enem.TP_LINGUA == 1)].NU_NOTA_MT.describe()
(enem.Q001 == "G") & (enem.Q006 == "M")].NU_NOTA_CH.describe()
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.IN_SURDEZ == 1)].NU_NOTA_CH.describe()
enem.loc[(enem.SG_UF_RESIDENCIA == "MG") & (enem.NO_MUNICIPIO_RESIDENCIA =="Conselheiro Lafaiete")].NU_NOTA_MT.describe()
enem.loc[(TP_SEXO == 'F') & (enem.NO_MUNICIPIO_RESIDENCIA.isin({'Belo Horizonte', 'Sabará', 'Nova Lima', 'Betim'})) // concatenar mais de um municipio dentro do frame
# RESPOSTA 1 546.796