Análise dos dados de reembolso dos senadores - 2018

In [1]:
# Importando as bibliotecas
import pandas as pd
In [2]:
# Carregando o arquivo csv
df = pd.read_csv('dados/2018.csv', sep=';', encoding='latin1', skiprows=1, decimal=',')

df.head()
Out[2]:
ANO MES SENADOR TIPO_DESPESA CNPJ_CPF FORNECEDOR DOCUMENTO DATA DETALHAMENTO VALOR_REEMBOLSADO
0 2018 1 ACIR GURGACZ Aluguel de imóveis para escritório político, c... 004.948.028-63 GILBERTO PISELO DO NASCIMENTO NaN 02/01/2018 Despesa com pagamento de aluguel de imóvel par... 6000.00
1 2018 1 ACIR GURGACZ Passagens aéreas, aquáticas e terrestres nacio... 63.764.211/0001-10 TRANSCONTINENTAL AGÊNCIA DE VIAGENS LTDA M2CJMM 02/01/2018 Companhia Aérea: AVIANCA, Localizador: M2CJMM.... 274.99
2 2018 1 ACIR GURGACZ Passagens aéreas, aquáticas e terrestres nacio... 63.764.211/0001-10 TRANSCONTINENTAL AGÊNCIA DE VIAGENS LTDA SFEXYF 02/01/2018 Companhia Aérea: LATAM, Localizador: SFEXYF. P... 1094.29
3 2018 1 ACIR GURGACZ Passagens aéreas, aquáticas e terrestres nacio... 63.764.211/0001-10 TRANSCONTINENTAL AGÊNCIA DE VIAGENS LTDA V64HTR 24/01/2018 Companhia Aérea: AZUL, Localizador: V64HTR. Pa... 1553.99
4 2018 2 ACIR GURGACZ Aluguel de imóveis para escritório político, c... 004.948.028-63 GILBERTO PISELO DO NASCIMENTO 002/18 01/02/2018 Despesa com pagamento de aluguel de imóvel par... 6000.00
In [3]:
# Verificando o tamanho e os tipos dos dados
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 24444 entries, 0 to 24443
Data columns (total 10 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   ANO                24444 non-null  int64  
 1   MES                24444 non-null  int64  
 2   SENADOR            24444 non-null  object 
 3   TIPO_DESPESA       24444 non-null  object 
 4   CNPJ_CPF           24444 non-null  object 
 5   FORNECEDOR         24444 non-null  object 
 6   DOCUMENTO          23455 non-null  object 
 7   DATA               24444 non-null  object 
 8   DETALHAMENTO       18848 non-null  object 
 9   VALOR_REEMBOLSADO  24444 non-null  float64
dtypes: float64(1), int64(2), object(7)
memory usage: 1.9+ MB
In [4]:
# Mostrar uma análise quantitativa dos dados
df.describe()
Out[4]:
ANO MES VALOR_REEMBOLSADO
count 24444.0 24444.000000 24444.000000
mean 2018.0 6.193585 1046.806915
std 0.0 3.306265 2721.041726
min 2018.0 1.000000 0.010000
25% 2018.0 3.000000 125.000000
50% 2018.0 6.000000 288.090000
75% 2018.0 9.000000 1036.170000
max 2018.0 12.000000 103900.000000
In [5]:
# Qual o total de reembolsos?
df['VALOR_REEMBOLSADO'].sum()
Out[5]:
25588148.22
In [6]:
# Quantos reembolsos foram solicitados por cada senador?
df['SENADOR'].value_counts()
Out[6]:
EDUARDO LOPES          864
PAULO BAUER            824
WELLINGTON FAGUNDES    799
JOSÉ SERRA             694
GLEISI HOFFMANN        653
                      ... 
ALVARO DIAS             40
FERNANDO COLLOR         27
JADER BARBALHO          19
CRISTOVAM BUARQUE       16
ZÉ SANTANA               8
Name: SENADOR, Length: 91, dtype: int64
In [7]:
# Quantos cada senador solicitou de reembolso em 2018?
df.groupby('SENADOR')['VALOR_REEMBOLSADO'].sum().sort_values(ascending=False)
Out[7]:
SENADOR
EDUARDO BRAGA         529579.18
VANESSA GRAZZIOTIN    515639.63
JOÃO CAPIBERIBE       513213.90
ÂNGELA PORTELA        485806.44
OMAR AZIZ             484143.98
                        ...    
ALVARO DIAS            44037.88
WALTER PINHEIRO        32733.67
CRISTOVAM BUARQUE      32400.00
ZÉ SANTANA             23300.67
IONE GUIMARÃES         11379.91
Name: VALOR_REEMBOLSADO, Length: 91, dtype: float64
In [8]:
# Quais os 5 maiores valores de reembolso?
df.nlargest(5, 'VALOR_REEMBOLSADO').T
Out[8]:
21190 21453 21456 22630 5570
ANO 2018 2018 2018 2018 2018
MES 12 11 12 12 12
SENADOR ROSE DE FREITAS SÉRGIO PETECÃO SÉRGIO PETECÃO VANESSA GRAZZIOTIN EDUARDO LOPES
TIPO_DESPESA Divulgação da atividade parlamentar Contratação de consultorias, assessorias, pesq... Contratação de consultorias, assessorias, pesq... Contratação de consultorias, assessorias, pesq... Divulgação da atividade parlamentar
CNPJ_CPF 05.461.408/0001-84 22.233.033/0001-14 22.233.033/0001-14 28.916.527/0001-80 14.616.988/0001-22
FORNECEDOR Grafitusa S/A Reis Grafica e Comercio de Etiquetas Eireli ME Reis Grafica e Comercio de Etiquetas Eireli ME A MAQUINA SOLUCOES EM MIDIA LTDA ME NG Comunicação Visual Ltda
DOCUMENTO 000009681 4193 000004252 048 00000714
DATA 29/03/2019 29/11/2018 17/12/2018 17/12/2018 05/12/2018
DETALHAMENTO NaN NaN NaN TRABALHOS TÉCNICOS DE APOIO AO EXERCICIO DO MA... NaN
VALOR_REEMBOLSADO 103900 102000 102000 100000 66000
In [9]:
# Quais os 5 menores valores de reembolso?
df.nsmallest(5, 'VALOR_REEMBOLSADO').T
Out[9]:
3867 10153 10183 10188 10225
ANO 2018 2018 2018 2018 2018
MES 5 3 4 4 5
SENADOR DÁRIO BERGER JORGE VIANA JORGE VIANA JORGE VIANA JORGE VIANA
TIPO_DESPESA Passagens aéreas, aquáticas e terrestres nacio... Passagens aéreas, aquáticas e terrestres nacio... Passagens aéreas, aquáticas e terrestres nacio... Passagens aéreas, aquáticas e terrestres nacio... Passagens aéreas, aquáticas e terrestres nacio...
CNPJ_CPF 02.575.829/0001-48 33.937.681/0001-78 07.575.651/0001-59 33.937.681/0001-78 33.937.681/0001-78
FORNECEDOR AVIANCA BRASIL LATAM GOL TRANSPORTES AÉREOS S/A LATAM LATAM
DOCUMENTO K5RKJV W4UUE7 ZHV36P W6ZMK3 OZALEF
DATA 29/05/2018 21/03/2018 09/03/2018 17/04/2018 22/05/2018
DETALHAMENTO Companhia Aérea: AVIANCA, Localizador: K5RKJV.... Companhia Aérea: LATAM, Localizador: W4UUE7. P... Companhia Aérea: GOL, Localizador: ZHV36P. Pas... Companhia Aérea: LATAM, Localizador: W6ZMK3. P... Companhia Aérea: LATAM, Localizador: OZALEF. P...
VALOR_REEMBOLSADO 0.01 0.01 0.01 0.01 0.01
In [10]:
# Quantidade de reembolso por tipos de despesa
df['TIPO_DESPESA'].value_counts()
Out[10]:
Locomoção, hospedagem, alimentação, combustíveis e lubrificantes                                                                                                                                   10135
Passagens aéreas, aquáticas e terrestres nacionais                                                                                                                                                  5818
Aluguel de imóveis para escritório político, compreendendo despesas concernentes a eles.                                                                                                            5010
Aquisição de material de consumo para uso no escritório político, inclusive aquisição ou locação de software, despesas postais, aquisição de publicações, locação de móveis e de equipamentos.      1760
Contratação de consultorias, assessorias, pesquisas, trabalhos técnicos e outros serviços de apoio ao exercício do mandato parlamentar                                                               927
Divulgação da atividade parlamentar                                                                                                                                                                  750
Serviços de Segurança Privada                                                                                                                                                                         44
Name: TIPO_DESPESA, dtype: int64
In [11]:
# Quanto foi reembolsado por cada tipo de despesa
df.groupby('TIPO_DESPESA')['VALOR_REEMBOLSADO'].sum().sort_values(ascending=False)
Out[11]:
TIPO_DESPESA
Passagens aéreas, aquáticas e terrestres nacionais                                                                                                                                                 6334569.27
Locomoção, hospedagem, alimentação, combustíveis e lubrificantes                                                                                                                                   5613542.84
Aluguel de imóveis para escritório político, compreendendo despesas concernentes a eles.                                                                                                           5032315.61
Contratação de consultorias, assessorias, pesquisas, trabalhos técnicos e outros serviços de apoio ao exercício do mandato parlamentar                                                             4966336.81
Divulgação da atividade parlamentar                                                                                                                                                                2568910.24
Aquisição de material de consumo para uso no escritório político, inclusive aquisição ou locação de software, despesas postais, aquisição de publicações, locação de móveis e de equipamentos.      900259.84
Serviços de Segurança Privada                                                                                                                                                                       172213.61
Name: VALOR_REEMBOLSADO, dtype: float64
In [ ]: