Redes neuronales

https://commons.wikimedia.org/wiki/File:Colored_neural_network.svg

Una capa

https://commons.wikimedia.org/wiki/File:Single_layer_ann.svg

$x_{1}, x_{2}, \dots$ son las entradas
$y_{1}, y_{2}, \dots$ son las salidas
$w_{11}, w_{12}, \dots$ son los
Se calcula $b_{1} = w_{11} x_{1} + w_{21} x_{2} + w_{31} x_{3} + \dots$
Y luego $y_{1} = f (b_{1})$
$f$ es la llamada

Denotamos $x = (x_{1}, \dots, x_{p})$ , $y = (y_{1}, \dots, y_{q})$ , $W = (w_{11}, w_{12}, \dots)$

Red de neuronas

Se pueden hacer redes

de varias capas:

la salida de una

es la entrada de la otra.

Si tenemos muchos pares de entradas y sus respectivas salidas

$\hat{y_{i}} = F (x_{i}, W)$

Buscar los mejores pesos $W$ se llama

entrenar la red

Hay muchas generalizaciones de esta idea: redes profundas (muchas capas), redes convolucionales, …

¿Cómo de potente es esto? Vídeo de Google DeepMind

Evaluación de la red: forward-propagation

Al algoritmo para, dados los pesos y la entrada calcular la salida se lo llama forward propagation.

Entrenamiento de redes

Se separan los datos en un conjunto de entrenamiento y conjunto de pruebas

Para ajustar la red tenemos que elegir una función de pérdida $d (y, \hat{y})$ . Por ejemplo $| y - \hat{y} |^{2}$ .

A partir de ella elegimos una función de coste, que tenga en cuenta todos las pérdidas. Por ejemplo el error cuadrático medio $J (W) = \frac{1}{N} \sum_{i = 1}^{N} | y_{i} - \hat{y_{i}} |^{2}$

Así:

Se elige $W$ minimizando el coste sobre el conjunto de entrenamiento
Se comprueba que es “bueno” en general el coste con este $W$ sobre el conjunto de prueba (que debe ser distinto al de entrenamiento)

Hay múltiples opciones para la elección de función de coste y hacer la optimización eficientemente es gran parte de la dificultad.

Optimización en el entrenamiento

Para optimizar se utilizan múltiples procedimientos.

El ejemplo más sencillo es el descenso por gradiente $W_{n + 1} = W_{n} - γ Δ J (W_{n}) .$

Para calcular $\nabla J$ se emplea la regla de cadena. A este proceso lo llama back-progation.

Redes neuronales

Una capa

Red de neuronas

Evaluación de la red: forward-propagation

Entrenamiento de redes

Optimización en el entrenamiento

Un ejemplo detallado en Julia

Flux.jl

Ajustar una línea

Un ejemplo no trivial

Otros paquetes