Para comenzar a entrenar e implementar un modelo básico de IA con Google AI Platform a través de la interfaz gráfica de usuario web, especialmente si eres principiante sin conocimientos de programación, es recomendable usar Vertex AI Workbench y las funciones de AutoML (ahora parte de Vertex AI) de Google Cloud. Estas herramientas están diseñadas específicamente para usuarios sin experiencia en programación y ofrecen interfaces gráficas paso a paso para crear modelos de aprendizaje automático. La siguiente guía describe cada fase de este proceso, priorizando la claridad didáctica y la utilidad práctica.
Paso 1: Configurar una cuenta y un proyecto de Google Cloud
1. Regístrate en Google Cloud
Visita [https://cloud.google.com/](https://cloud.google.com/) y haz clic en "Comienza gratis". Google ofrece una prueba gratuita con créditos para nuevos usuarios, normalmente de $300, válidos por 90 días.
– Siga las instrucciones para crear una cuenta de Google Cloud usando sus credenciales de Google e ingresando la información de facturación (no se le cobrará hasta que exceda los créditos gratuitos).
2. Crear un nuevo proyecto
– Después de iniciar sesión, abra [Google Cloud Console](https://console.cloud.google.com/).
– Haga clic en el menú desplegable del proyecto (barra de navegación superior) y seleccione “Nuevo proyecto”.
– Asigne un nombre a su proyecto (p. ej., «ml-demo-project») y seleccione una organización, si corresponde. Haga clic en «Crear».
3. Habilitar facturación y API
– Asegúrese de que la facturación esté habilitada para su nuevo proyecto (siga las instrucciones si es necesario).
Vaya a «API y servicios» → «Biblioteca». Busque «Vertex AI API» y haga clic en «Habilitar».
Paso 2: Preparación de datos para el entrenamiento del modelo
1. Comprensión de los requisitos del conjunto de datos
– AutoML en Vertex AI admite datos estructurados (tabulares), imágenes, texto y videos.
– Para la demostración, utilice un conjunto de datos tabulares simple, como el clásico conjunto de datos de flores de iris o sus propios datos CSV.
– El archivo debe estar en formato CSV, con columnas que representen características (entradas) y una columna para la etiqueta de destino (lo que desea predecir).
2. Almacenamiento de datos en la nube
– Vaya a “Almacenamiento” en la barra lateral izquierda de Cloud Console.
– Haga clic en “Crear depósito”, asigne un nombre único (por ejemplo, “ml-demo-bucket”), seleccione la región y acepte los valores predeterminados para otras configuraciones.
– Una vez creado el depósito, haga clic en él, luego en “Cargar archivos” y cargue su conjunto de datos CSV.
Paso 3: Acceder a Vertex AI e iniciar AutoML
1. Open Vertex AI
– En la consola en la nube, navegue hasta “Vertex AI” en la barra lateral izquierda.
2. Crear un conjunto de datos
– Haga clic en “Conjuntos de datos” en el menú Vertex AI.
– Seleccione “Crear” y elija el tipo de conjunto de datos (por ejemplo, “Tabular” para datos CSV).
– Nombre su conjunto de datos, seleccione la región y haga clic en “Crear”.
– Después de la creación, haga clic en “Importar datos”, seleccione “Desde almacenamiento en la nube” y especifique la ruta a su archivo CSV en el formato: `gs://[your-bucket-name]/[your-file].csv`.
Deja que la plataforma analice e importe tus datos. Verás una vista previa donde podrás verificar las columnas y los tipos detectados.
Paso 4: Configuración y entrenamiento del modelo
1. Iniciando el entrenamiento del modelo
– Una vez completada la importación de datos, haga clic en “Entrenar nuevo modelo”.
– Proporcione un nombre para su modelo (por ejemplo, “iris-predictor”).
– Seleccione la columna de destino (la característica que desea predecir, por ejemplo, “especie”).
– Elija un objetivo del modelo (por ejemplo, “Clasificación” para predecir categorías, “Regresión” para predecir números).
– Para principiantes absolutos, mantenga la selección de funciones predeterminada; Vertex AI puede seleccionar y preprocesar funciones automáticamente.
2. Opciones Avanzadas (Opcional)
– Puede dejar la configuración avanzada en sus valores predeterminados para garantizar la simplicidad.
Si te interesa, puedes ajustar el presupuesto de entrenamiento (medido en horas de nodo) para controlar la duración del entrenamiento. La prueba gratuita incluye experimentos modestos.
3. Capacitación
– Haga clic en “Iniciar entrenamiento”.
– Vertex AI dividirá automáticamente sus datos en conjuntos de entrenamiento, validación y prueba, manejará el preprocesamiento, creará varios modelos candidatos y los evaluará.
– La capacitación generalmente demora entre unos minutos y varias horas, dependiendo del tamaño y la complejidad del conjunto de datos.
Paso 5: Evaluación del modelo entrenado
1. Visualización de métricas de evaluación
– Una vez finalizado el entrenamiento, Vertex AI presenta los resultados de la evaluación, incluidas métricas como precisión, exactitud, recuperación, puntuación F1 (para clasificación) o RMSE/MAE (para regresión).
– La matriz de confusión se muestra para las tareas de clasificación, lo que ayuda a comprender el rendimiento de la predicción por clase.
2. Entendiendo los Resultados
– Para fines didácticos, revise estas métricas:
– Precisión: Proporción de predicciones correctas sobre todas las predicciones.
– Precisión: Con qué frecuencia el modelo acierta al predecir una determinada clase.
– Recordar: Proporción de casos reales de una clase que el modelo identifica correctamente.
– Utilice estos para evaluar si el modelo funciona adecuadamente para sus necesidades educativas o de demostración.
Paso 6: Implementación del modelo para la predicción
1. Despliegue del modelo
– En la pantalla de detalles del modelo, haga clic en “Implementar en el punto final”.
– Asignar un nombre al punto final (por ejemplo, “iris-predictor-endpoint”).
– Mantenga el tipo de máquina predeterminado, que es adecuado para el uso a nivel de demostración y está cubierto por la prueba gratuita.
Haga clic en "Implementar". Este proceso configurará un punto final en línea para recibir solicitudes de predicción.
2. Realizar predicciones a través de la GUI
– Una vez implementado el modelo, haga clic en “Probar y usar”.
– Introduzca nuevos datos directamente en el formulario (coincidiendo con las características de entrada del modelo) para obtener predicciones.
– Ejemplo: si utiliza el conjunto de datos Iris, ingrese la longitud del sépalo, el ancho del sépalo, la longitud del pétalo y el ancho del pétalo para recibir las especies previstas.
Paso 7: Exploración de la explicabilidad del modelo (opcional, pero didáctico)
– Vertex AI ofrece funciones de explicabilidad que resaltan qué características de entrada influyeron más en la predicción del modelo.
– Acceda a la pestaña “Explicar” de su modelo y revise qué columnas utilizó más el modelo para hacer predicciones.
– Esto proporciona a los estudiantes información valiosa sobre cómo los modelos de aprendizaje automático toman decisiones, reforzando la relación entre los datos de entrada y los resultados.
Paso 8: Limpieza de recursos
– Para evitar cargos innecesarios, elimine los puntos finales implementados y los recursos no utilizados después de la experimentación:
– Vaya a Vertex AI → “Puntos finales”, seleccione su punto final y haga clic en “Eliminar”.
– Elimine conjuntos de datos, modelos y depósitos de Cloud Storage según sea necesario.
– Opcionalmente, elimine todo el proyecto desde la configuración del proyecto de Cloud Console.
-
Valor didáctico y explicación
Este enfoque gráfico, paso a paso, del aprendizaje automático en la plataforma Vertex AI de Google Cloud es particularmente eficaz para principiantes absolutos por varias razones:
1. Interfaz de usuario intuitiva
La consola gráfica elimina la necesidad de escribir código, lo que facilita el aprendizaje automático a usuarios sin conocimientos técnicos. Cada acción (cargar datos, entrenar un modelo, implementar y predecir) se realiza mediante formularios y botones guiados.
2. Comentarios inmediatos
Vertex AI proporciona retroalimentación instantánea en cada fase, ya sea al cargar datos, verificar columnas, evaluar el rendimiento del modelo o realizar predicciones. Esto permite a los estudiantes ver los resultados concretos de sus acciones en cada paso.
3. Ciclo de vida de extremo a extremo
Al progresar desde la carga de datos hasta la implementación y predicción del modelo en una única interfaz, los estudiantes obtienen una descripción general completa del proceso de aprendizaje automático, lo que refuerza la comprensión conceptual de las etapas involucradas en los proyectos de IA.
4. Uso didáctico de ejemplos
El uso de conjuntos de datos conocidos, como la clasificación de flores de iris, permite realizar demostraciones claras y relacionables de los principios del aprendizaje automático, como la forma en que las características de entrada determinan las salidas del modelo y la forma en que las métricas de evaluación cuantifican el rendimiento.
5. Transparencia y explicabilidad
Las herramientas de explicabilidad de modelos están integradas en la interfaz gráfica de usuario (GUI), lo que permite a los usuarios visualizar qué características influyen más en las predicciones. Esto desmitifica la naturaleza de "caja negra" de la IA y facilita la comprensión del comportamiento de los modelos.
6. Experimentación segura
La prueba gratuita y los recursos limitados ofrecen un entorno de experimentación sin riesgos. Los usuarios pueden probar diferentes conjuntos de datos, objetivos de modelo o divisiones de datos sin incurrir en costos ni afectar los sistemas de producción.
7. Barreras técnicas mínimas
Este enfoque no requiere conocimientos de programación, herramientas de línea de comandos ni una configuración compleja del entorno. Los usuarios interactúan con menús, formularios y resultados gráficos, lo que reduce las barreras de entrada para el aprendizaje de conceptos de aprendizaje automático.
-
Ejemplo de caso de uso
Imaginemos a un principiante interesado en predecir si una flor de iris pertenece a una de tres especies basándose en cuatro medidas (longitud del sépalo, anchura del sépalo, longitud del pétalo y anchura del pétalo). Los pasos serían:
– Descargue el conjunto de datos Iris en formato CSV desde el Repositorio de aprendizaje automático de la UCI o Kaggle.
– Sube el CSV a un depósito de almacenamiento en la nube.
– Cree un conjunto de datos tabulares de Vertex AI e importe el CSV.
– Entrene un modelo de clasificación especificando “especie” como columna de destino.
– Revisar la matriz de precisión y confusión después del entrenamiento.
– Implemente el modelo e ingrese nuevas medidas de flores en la GUI para recibir una especie prevista.
– Utilice la pestaña de explicabilidad para ver qué mediciones influyeron más en las predicciones.
Este proceso proporciona una introducción completa y práctica al aprendizaje automático en Google Cloud, que abarca la preparación de datos, la creación de modelos, la implementación y la interpretación, todo a través de una GUI adecuada para aquellos sin experiencia en programación.
-
Pasos de aprendizaje adicionales
Después de dominar este flujo de trabajo, los estudiantes pueden profundizar su comprensión mediante:
– Experimentar con diferentes conjuntos de datos (por ejemplo, predicción de supervivencia del Titanic).
– Explorar otros tipos de modelos de Vertex AI, como clasificación de imágenes o texto.
– Revisar los informes de modelos generados automáticamente para obtener información más detallada.
– Introducir gradualmente conceptos básicos de programación explorando la sección “Cuadernos” o exportando modelos entrenados para su uso en Google Colab.
– Ver los vídeos introductorios de “Vertex AI” disponibles en la documentación de Google Cloud.
Cuando esté listo, la transición de herramientas basadas en GUI a flujos de trabajo basados en código se verá facilitada por la familiaridad adquirida con el proceso general, la terminología y la estructura del proyecto.
-
Otras preguntas y respuestas recientes sobre EITC/AI/GCML Google Cloud Machine Learning:
- ¿Cómo los modelos de Keras reemplazan a los estimadores de TensorFlow?
- ¿Cómo configurar un entorno Python específico con Jupyter Notebook?
- ¿Cómo utilizar TensorFlow Serving?
- ¿Qué es Classifier.export_saved_model y cómo utilizarlo?
- ¿Por qué se utiliza frecuentemente la regresión como predictor?
- ¿Son los multiplicadores de Lagrange y las técnicas de programación cuadrática relevantes para el aprendizaje automático?
- ¿Se puede aplicar más de un modelo durante el proceso de aprendizaje automático?
- ¿Puede el aprendizaje automático adaptar el algoritmo a utilizar dependiendo de un escenario?
- ¿Cómo entrenar e implementar de forma práctica un modelo de IA simple en Google Cloud AI Platform a través de la interfaz GUI de la consola de GCP en un tutorial paso a paso?
- ¿Cuál es el procedimiento más simple, paso a paso, para practicar el entrenamiento de modelos de IA distribuida en Google Cloud?
Ver más preguntas y respuestas en EITC/AI/GCML Google Cloud Machine Learning