En esta entrada entenderemos conceptos como import, dataframe, read_csv, print, for, merge, head, describe, value_counts, groupby, count, sum.
#cargue de la libreria Pandas
import pandas as pd
#Cargar un archivo csv, por defecto toma el separador ,
df = pd.read_csv('datosEjemplo\persona.csv')
#Comando para revisar los 3 primeros registros del archivo
df.head(3)
#Imprime el data frame completo
df
#Para ajustar el cargue según el separador ;
df = pd.read_csv('datosEjemplo\persona.csv', delimiter=';')
#Queda bien cargados los datos en el data frame
df.head(10)
#Resumen de análisis básico de datos numéricos en el dataframe
df.describe()
#Resumen de análisis básico de datos numéricos en el dataframe
df.describe()
#Realiza un conteo de registros agrupando por el valor de la columna
df.genero.value_counts()
#Otro método para contar registros agrupando por los valores de una columna
df.groupby('genero').count()
#Con el método de Groupby podemos cambiar la operación por la suma de edades por ejemplo
df.groupby('genero').edad.sum()
#Ciclo para recorrer elementos del data frame
for col, row in df.iterrows():
print(str(row.nombre).upper(), ' tiene ', str(row.edad), ' años')
#Cargamos otro archivo con la información de profesiones de las personas
df_empleo = pd.read_csv('datosEjemplo\empleo.csv', delimiter=';')
#Revisamos los datos
df_empleo.head(2)
#Función para cruzar dataframes, sabremos para cada persona su profesión
df_inner = pd.merge(df,df_empleo,how='inner',on='id')
#Resultado del cruce de los datos, tenemos la persona con su profesión
df_inner.head()