datos_numeros_y_genero/src/preprocesar_datos.py

44 lines
1.6 KiB
Python

import numpy as np
import pandas as pd
def formatea_fecha(data):
data.loc[:, "fecha_completa"] = data.loc[:, "fecha"] + \
" " + data.loc[:, "hora_recepcion"]
data.loc[:, "fecha_completa"] = pd.to_datetime(
data.loc[:, "fecha_completa"], format="%d/%m/%y %H:%M:%S")
def limpia_descripcion_cierre(data):
renombre_de_valores = {"Cierre De Fuga": "Otros",
"Fuera De Entidad Federativa": "Otros",
"Fuera De Subzona": "Otros",
"Remitido Al M.p.": "Hecho real",
"Resolucion 1": "Hecho real",
"Resolucion 5": "Hecho real"}
data.loc[:, "descripcion_cierre"] = data.loc[:,
"descripcion_cierre"].replace(renombre_de_valores)
def limpia_via_recepcion(data):
renombre_de_valores = {"060 Monterrey": "Otros",
"80": "Otros",
"89": "Otros",
"App": "Otros",
"App 9-1-1": "Otros",
"Cic": "Otros",
"Rutina": "Gobierno",
"Sala crisis": "Gobierno",
"Telefonia movil": "Telefono",
"Videovigilancia": "Gobierno",
"Whats App": "Otros"}
data.loc[:, "via_recepcion"] = data.loc[:,
"via_recepcion"].replace(renombre_de_valores)
def run(data):
formatea_fecha(data)
limpia_descripcion_cierre(data)
limpia_via_recepcion(data)