Ah! Rio de Janeiro, que cidade maravilhosa! Seus belíssimos montes que o cercam, a enorme estátua do Cristo Redentor, sem falar nas praias e museus, que se distribuem por toda a cidade. Mas nem tudo são flores, não é mesmo?
Devido a “n fatores" históricos e delicados, que entrarei em mérito, a violência da cidade chegou a níveis alarmantes, como vemos em todos os jornais e programas de televisão por aí. No entanto, a Agência Brasil instituição do governo federal, indica uma redução da criminalidade, como homicídios dolosos que reduziu de 21% no ano de 2019. A Instituição utiliza-se de dados divulgados pelo Estado do Rio de janeiro, mais especificamente pelo Instituto de Segurança Pública (ISP), este órgão é responsável por registrar ocorrências das delegacias da Polícia Civil.
Então decidi explorar os bancos de dados do Instituto, mesmo sabendo que estas situações não são Preto e Branco, efetuei uma análise exploratória de algumas das variáveis, assim conseguir retirar alguns insights, como você irá ver. O projeto completo está no meu repositório onde contém o notebook utilizado.
Os dados aqui utilizados foram retirados do Instituto de Segurança Pública do Estado do Rio de Janeiro, este apresenta 61 variáveis e 6.992 dados registrados extraídos no dia 11 de junho de 2020, mostrando as categorias de crimes registrados nas cidades onde ocorreram em uma série temporal deste 2014.
#Importar os dados
df="http://www.ispdados.rj.gov.br/Arquivos/BaseMunicipioMensal.csv"
data=pd.read_csv(df,sep=";",encoding='latin-1')
Como podemos ver, nas cinco primeiras entradas abaixo:
No entanto, para este presente trabalho, tive que fazer alguns filtros. Primeiro indexei a coluna fmun_cod, que informa o identificador para cada município do estado. Desta forma, filtrei somente os dados da cidade do Rio de Janeiro.
#Localizar ID do Rio de Janeiro
data_rj=data.loc[3304557]
Então comecei a entender como se comporta o dataset, realizando primeiramente uma cópia dos dados iniciais. Inicialmente excluindo as colunas de nome mes_ano, mes, regiao e fmun, depois realizei um filtro excluindo todos os dados de 2020, visto que no presente momento do projeto, tal ano ainda estava correndo. Por fim, indexei a coluna ano e agrupei os valores para cada variável e seus respectivos anos.
#Agrupar pelo ano
data_time = data_time.groupby(['ano']).sum()
Consequentemente, ficamos com os seguintes dados, possuindo 6 entradas, com 57 variáveis.
Com o dataset organizado, comecei a efetuar pergunta sobre ele. Iniciando com: "Qual a média de roubos de veículos por ano?". Os roubos de veículos é uma prática comum em capitais, estatísticas nacionais indicam que um carro é roubado a cada minuto.
Então, em sua estatística descritiva possui uma média de 19612.50 roubos de veículo por ano. Além disto, seu máximo foi de 25.894,00 e mínimo de 13.725,00, o que são valores relativamente bem altos.
Logo quando comparamos os valores de cada ano, obtemos o seguinte gráfico. O qual indica valores bem próximos:
Dando continuidade as perguntas e os furtos? Assim, ao analisar os seus valores apresentaram-se bem menores do que o roubo, apresentando uma espécie de linearidade. Tais dados possuem ainda uma média de 7.025,66 por ano, uma máxima 7.515,00 e mínima de 6.710,00.
Desta forma, pude então calcular a porcentagem de carros recuperados, realizando a seguinte equação:
#Porcentagem de veículos recuperados
rec_vec = (data_time.recuperacao_veiculos)/(data_time.furto_veiculos+data_time.roubo_veiculo)*100
Para porcentagem de veículos recuperados, notei a ocorrência de valores relativamente parecidos, com uma média de 53.71% para cada ano, com um ano que teve um máximo de 59.09% e mínimo de 49.28%. Além disso, a porcentagem de veículos recuperados para todo o intervalo de 6 anos foi de 54,29%.
Logo após, realizei a seguinte pergunta "Qual é a distribuição temporal dos latrocínios?". Latrocínio são aqueles casos de roubo seguido de morte, no qual apresenta um índice importante de violência urbana. Onde teve 62 casos em média por ano, com um máximo de 93 e um mínimo de 34.
Desta forma, os casos de latrocínio na cidade do Rio, tiveram o maior número de casos no ano de 2017, havendo uma queda anos de 2018 e 2019.
Ainda analisei os casos de roubos de coletivos (ônibus, vans, trens, metrôs e outros), no qual eram práticas comuns dos criminosos alguns anos atrás. No entanto, os dados mostram que esta prática anda em ascensão. Com uma média bem alta de 7.266 casos, máximo de 9.775 e mínimo 4.412.
Vale salientar que a presente pesquisa se trata de um estudo preliminar, onde mostra as potencialidades do uso de python, estatísticas descritivas básicas e dados, para retirar insights e ajudar na tomada de decisão, sendo tal projeto uma prática do curso Data Science da Prática.
Desta forma, foi possível ver que a média dos roubos de veículos diminuíram, já os furtos se mantiveram praticamente em mesma quantidade e então quando comparamos com o número de veículos recuperados a média total de todos os anos é de 54%. Isto quer dizer que um pouco mais de 50% dos veículos roubados retornam aos seus donos.
Além disto, efetuei uma análise rápida dos números de latrocínios ocorridos no intervalo de tempo, o que se mostrou uma queda drástica nos anos de 2018 e 2019. E por último, analisei os roubos em coletivos, o qual se mantém grande crescimento deste 2016.
Comments