Preprotools
librería de Python para preprocesamiento de datasets
Actualmente, esta librería se encuentra en desarrollo

preprotools es una librería de python enfocada en el preprocesamiento de datos, está pensada para contener la mayor cantidad de herramientas necesarias que faciliten el preprocesamiento de datos sin la necesidad de tener que recurrir a distintas librerías, está basada en la paquetería más usada como pandas, numpy, matplotlib, entre otras.
Este proyecto está motivado por el aprendizaje de este hermoso lenguaje de programación, específicamente para la ciencia de datos.
La licencia de este proyecto se escogió pensando en la posibilidad de copyleft para que cualquiera que así lo desee, estudie su código y añada funcionalidades pero, lo más importante, sea compartido para que toda la comunidad se beneficie de él.
Nota: La librería se encuentra en desarrollo activo, ha funcionado para mis casos de uso; sin embargo, si encuentras errores de funcionamiento o quieres sugerir alguna funcionalidad, puedes reportarlo mediante un Issue.
Creado por humanos, no por IA.
Requisitos
- Python 3.10+
- Pandas (versión por definir)
Funciones disponibles (actualmente)
clean_names(df): Reescribe los nombres usando la convención de nombrado de variables (naming convention) Snake case.var_unique(df, var_names=['all', list]): Muestra los valores únicos de cada variable cualitativa, sivar_names='all'(por defecto) la función lo hará para todas las columnas cualitativas, también tenemos la opción de incluir una lista con los nombres de las variables que deseemosvar_names=['var_1', 'var_2', ..., 'var_n'].
Uso rápido
var_unique()
Para recrear este ejemplo, puedes usar el dataset iris que se encuentra en el directorio datasets.
# Ubicarse en el directorio raíz
import pandas as pd
from preprotools.functions import var_unique
df = pd.read_csv('/datasets/iris.csv')
var_unique(df)
#Output
---------------[Iris-setosa]---------------
['Iris-setosa', 'Iris-versicolor', 'Iris-virginica']
(Número de niveles: 3)
-------------------------------------------