miércoles, 19 de junio de 2019

Conversión de diferentes tipos de archivos

Veremos el código necesario para la conversión de diferentes archivos como:
  • archivo XLS para CSV y viceversa
  • archivo CSV para XLSX y viceversa
  • archivo CSV para JSON y viceversa
  • archivo XLS para JSON y viceversa
La conversión de estos archivos no es complicada y el código suele ser el mismo, cambiando algunos parametros

Cómo todo ejercicio empezamos por la carga del archivo, en este caso utilizaremos dos archivos: uno xls y otro xlsx.

#import library
import pandas as pd

mainpath = "/Users/julio/Downloads/pythonmaster/datasets"
filename = "ads/pr1.xls"
filenamexlsx = "ads/pr.xlsx"


La variable mainpath contiene la dirección de donde se encuentran ambos archivos en el folder, las variables filename y filename xlsx son para especificar el archivo, al momentos de cargarlos solamente cambiamos la variable de acuerdo al archivo que queramos usar.

#Read de los archivos
ads = pd.read_excel(mainpath + "/" + filename)
ads2 = pd.read_excel(mainpath + "/" + filenamexlsx)

Una vez que tenemos cargados los archivos podemos empezar con las conversiones, al momento de convertir el archivo crearemos uno nuevo, por lo que hay que asignar un nombre al archivo y su extensión correspondiente, para después verlo en la carpeta donde lo hemos creado.
#Convert file xls to csv
ads.to_csv(mainpath + "/ads/pr2.csv")

#Convert file xlsx to csv
ads2.to_csv(mainpath + "/ads/pr3.csv")

#Convert file csv to xls
#read
ads3 = pd.read_csv(mainpath + "/ads/Advertising.csv")

#convert
ads3.to_excel(mainpath + "/ads/pr3.xls")

#Convert file csv to xlsx
ads3.to_excel(mainpath + "/ads/pr4.xlsx")

#convert file csv to json
ads3.to_json(mainpath + "/ads/pr5.json")

#convert file xls to json
ads3.to_json(mainpath + "/ads/pr6.json")

#convert file xlsx to json
ads3.to_json(mainpath + "/ads/pr7.json")