Importar de Excel a python con pandas

Para importar datos desde un archivo en Excel a python es un procedimiento muy sencillo. A continuación se resumen los pasos necesarios.

1.- Primero hay que tener un archivo en Excel, con extensión xls o xlsx.

En la siguiente figura se muestra una tabla con 3 columnas y 10 filas (incluyendo la fila de los encabezados).

Esta tabla está en una hoja de Excel de nombre inicial y el archivo se llama inicial.xlsx. Aquí el nombre de la hoja y el nombre del archivo Excel son iguales, pero no tiene que ser así. Las hojas y el archivo pueden tener cualquier nombre.

2.- La librería de pandas debe haber sido previamente importada e instalada.

3.- importar el paquete pandas. Es común utilizar el alias pd para abreviar el nombre del paquete.

import pandas as pd

4.- Leer el archivo Excel utilizando la instrucción que se muestra a continuación.

File = pd.ExcelFile(‘inicial.xlsx’)

File es el nombre de una variable donde vamos a almacenar el archivo Excel, puede ser cualquier nombre que deseemos.

pd.ExcelFile(’inicial.xlsx’) es una función de lectura, el nombre del archivo debe colocarse entre apóstrofos. En este caso se utiliza solamente el nombre del archivo porque lo hemos colocado en la misma ubicación donde tenemos instalado el programa python que estamos ejecutando.

5.- Si queremos saber los nombres de las hojas que tiene el libro de Excel que hemos almacenado en la variable File utilizamos la siguiente instrucción. En este caso solamente hay una hoja con nombre ‘inicial’.

print(File.sheet_names)

[‘inicial’]

6.- Se crea una variable que hemos llamado df y se lee el contenido de la hoja ‘inicial’ utilizando la función parse.

df=File.parse(‘inicial’)

7.- Imprimimos el contenido de la variable df. Se puede notar que las filas están numeradas desde el 0 hasta el 8. En python el primer índice es el 0.

print(df)

    Area       pozo     gasto_Inicial

0 Este          XP-1E                  230

1 Oeste        TX-2                    520

2 Norte        YJ-3                     600

3 Este          XP-2                    300

4 Oeste       TX-3                    600

5 Norte       YJ-4                   1000

6 Este         XP-3                    600

7 Oeste      TX-4                    900

8 Norte     YJ-5                    1500

8.- Podemos utilizar la función describe() para obtener una descripción de las columnas que contienen datos numéricos. Se muestran los valores de numero o cuenta de elementos (count), la media (mean), la desviación estándar (std), el valor mínimo (min), los percentiles 25, 50 y 75 (25%, 50% y 75%), el valor máximo (max)

df.describe()

|================

|                |gasto_Inicial

|count     |9.000000

|mean     |694.444444

|std          |389.394116

|min        |230.000000

|25%        |520.000000

|50%       |600.000000

|75%       |900.000000

|max      |1500.000000

|================

2 opiniones en “Importar de Excel a python con pandas”

  1. Intente importar un archivo de excel a Pyhton siguiendo el procedimiento recomendado pero me aparece el siguiente mensaje: File «», line 1
    File = pd.ExcelFile(‘inicial.xlsx’)
    ^
    SyntaxError: invalid character in identifier

    Le gusta a 1 persona

    1. El archivo de Excel debe estar en el mismo directorio desde donde estas corriendo python, si no tienes que indicar la ruta completa del archivo. Te recomiendo que veas la ruta completa y la copies dentro de la función donde se lee el archivo de Excel.

      Me gusta

Deja un comentario