La arquitectura de la red neuronal utilizada en el ejemplo es una red neuronal feedforward con tres capas: una capa de entrada, una capa oculta y una capa de salida. La capa de entrada consta de 784 unidades, lo que corresponde al número de píxeles de la imagen de entrada. Cada unidad en la capa de entrada representa el valor de intensidad de un píxel en la imagen.
La capa oculta consta de 128 unidades, que están completamente conectadas a la capa de entrada. Cada unidad en la capa oculta calcula una suma ponderada de las entradas de la capa de entrada y aplica una función de activación para producir una salida. En este ejemplo, la función de activación utilizada en la capa oculta es la función de unidad lineal rectificada (ReLU). La función ReLU se define como f(x) = max(0, x), donde x es la suma ponderada de las entradas a la unidad. La función ReLU introduce la no linealidad en la red, lo que le permite aprender patrones y relaciones complejos en los datos.
La capa de salida consta de 10 unidades, cada una de las cuales representa una de las clases posibles en el problema de clasificación. Las unidades de la capa de salida también están completamente conectadas a las unidades de la capa oculta. Similar a la capa oculta, cada unidad en la capa de salida calcula una suma ponderada de las entradas de la capa oculta y aplica una función de activación. En este ejemplo, la función de activación utilizada en la capa de salida es la función softmax. La función softmax convierte la suma ponderada de las entradas en una distribución de probabilidad sobre las clases, donde la suma de las probabilidades es igual a 1. La unidad con la probabilidad más alta representa la clase predicha de la imagen de entrada.
Para resumir, la arquitectura de red neuronal utilizada en el ejemplo consta de una capa de entrada con 784 unidades, una capa oculta con 128 unidades que utilizan la función de activación de ReLU y una capa de salida con 10 unidades que utilizan la función de activación de softmax.
Otras preguntas y respuestas recientes sobre Construyendo una red neuronal para realizar la clasificación:
- ¿Es necesario utilizar una función de aprendizaje asincrónico para los modelos de aprendizaje automático que se ejecutan en TensorFlow.js?
- ¿Cómo se compila y entrena el modelo en TensorFlow.js y cuál es el papel de la función de pérdida de entropía cruzada categórica?
- ¿Cuál es la importancia de la tasa de aprendizaje y el número de épocas en el proceso de aprendizaje automático?
- ¿Cómo se dividen los datos de entrenamiento en conjuntos de entrenamiento y prueba en TensorFlow.js?
- ¿Cuál es el propósito de TensorFlow.js en la construcción de una red neuronal para tareas de clasificación?