top of page
Search
  • Writer's picturesiria sadeddin

Cómo cargar Datasets de Kaggle en Google Colab

Updated: May 3, 2020

Hola 😎😍

Como muchos de ustedes ya deben saber, Kaggle es una plataforma para científicos de datos que ofrece, entre otras cosas, una gran variedad de Datasets interesantes para hacer ciencia de datos. Colab por su parte es una plataforma de Google que ofrece de forma gratuita el uso de sus de CPU, GPU o TPU para desarrollar nuestros proyectos de Machine Learning en cuadernos de python. Google Colab también ofrece una versión de pago (Colab Pro), que en mi opinión es una excelente opción por su precio y calidad. Cargar Datos de Kaggle en cuadernos de Colab no es tan sencillo como uno pudiera pensar, de hecho, al principio tuve algunos problemas para encontrar la mejor manera de hacerlo 😩. Es por esto que ahora les voy a mostrar como lo hago yo.

En particular, voy a trabajar los datos de la competencia Dogs Vs Cats.

Para empezar deberías crear una cuenta en Kaggle, de esta forma podrás acceder a los datos, entrar a competencias y participar de la comunidad. Una vez que tengas tu cuenta, ve a la parte de My Account.



En My Account hay una sección que se llama API, ahí debes dar click donde dice Create New API Token, se va a descargar un archivo .json que conectará tu cuaderno de Colab con tu cuenta de Kaggle y el Dataset que prefieras.




Una vez que tienes tu archivo .json, vayamos al cuaderno de Goolge Colab que creaste para tu proyecto y corre el siguiente código

!pip install -U -q kaggle
!mkdir -p ~/.kaggle
from google.colab import files
files.upload()

Esto te permitirá subir el archivo .json a Colab




Debes correr el siguiente comando para que el archivo .json quede en la carpeta adecuada para ser leída durante la descarga de datos

!cp kaggle.json ~/.kaggle/

Ve a la pagina de Kaggle y busca el Dataset de tu preferencia.


IMPORTANTE: es posible que debas unirte a la competencia de Kaggle que corresponde al Dataset para poder hacer la extracción de los datos.


Una vez en la página de la competencia copia el API de descarga y pégalo en tu cuaderno de Colab.




Si los datos que quieres usar no pertenecen a una competencia en especial puedes encontrar el API de descarga el la esquina superior derecha de la página, como muestro en la siguiente imagen.





Pega el API de descarga en tu cuaderno de Colab y ejecútalo

!kaggle competitions download -c dogs-vs-cats



Listo 🤗 ya puedes empezar a jugar con tus nuevos datos.

1,596 views0 comments
Post: Blog2_Post
bottom of page