sábado, 30 de noviembre de 2019

Iniciando con Python - Pandas

Ejemplo básico para iniciar a trabajar con Python, en particular con la librería Pandas, con un ejemplo sencillo donde veremos como cargar un archivo CSV, revisar sus datos, imprimir en consola, tener un resumen de análisis básico de sus valores numéricos y cruzar con otro archivo.

En esta entrada entenderemos conceptos como import, dataframe, read_csv, print, for, merge, head, describe, value_counts, groupby, count, sum.

#cargue de la libreria Pandas
import pandas as pd

#Cargar un archivo csv, por defecto toma el separador ,
df = pd.read_csv('datosEjemplo\persona.csv')

#Comando para revisar los 3 primeros registros del archivo
df.head(3)



#Imprime el data frame completo
df



#Para ajustar el cargue según el separador ;
df = pd.read_csv('datosEjemplo\persona.csv', delimiter=';')


#Queda bien cargados los datos en el data frame
df.head(10)



#Resumen de análisis básico de datos numéricos en el dataframe
df.describe()

#Resumen de análisis básico de datos numéricos en el dataframe
df.describe()

#Realiza un conteo de registros agrupando por el valor de la columna
df.genero.value_counts()



#Otro método para contar registros agrupando por los valores de una columna
df.groupby('genero').count()



#Con el método de Groupby podemos cambiar la operación por la suma de edades por ejemplo
df.groupby('genero').edad.sum()



#Ciclo para recorrer elementos del data frame
for col, row in df.iterrows():
    print(str(row.nombre).upper(), ' tiene ', str(row.edad), ' años')



#Cargamos otro archivo con la información de profesiones de las personas
df_empleo = pd.read_csv('datosEjemplo\empleo.csv', delimiter=';')

#Revisamos los datos
df_empleo.head(2)



#Función para cruzar dataframes, sabremos para cada persona su profesión
df_inner = pd.merge(df,df_empleo,how='inner',on='id')

#Resultado del cruce de los datos, tenemos la persona con su profesión
df_inner.head()


No hay comentarios:

Publicar un comentario