¿Qué son las Redes de Neuronas Artificiales? (Parte I)

 En Inteligencia Artificial

La siguiente publicación, relativa a las Neuronas Artificiales, forma parte de la serie dedicada a la Inteligencia Artificial que empieza con el post en el que se describe en qué consiste la Inteligencia Artificial y sus aplicaciones.

¿Qué son las Redes de Neuronas Artificiales?

Las Redes de Neuronas Artificiales son un modelo matemático simplificado e inspirado en cómo el sistema nervioso procesa la información. El sistema nervioso es el responsable de que puedas ver, oír, oler y percibir tu entorno. También depende de él que puedas reconocer dónde estás y recordar si has estado allí antes, entre muchas otras cosas. Este sistema se compone fundamentalmente por neuronas.

Una neurona artificialestá determinada por un conjunto de entradas, para cada cual se asigna un peso. Esto es así porque no todos los estímulos tienen la misma importancia o impacto para la neurona. A continuación, se utiliza el conjunto de entradas y sus pesos para calcular el potencial sináptico (en este caso, como la suma de los productos entre las entradas por sus pesos). Sobre este potencial sináptico se aplica una función de activación, que determina la salida de la neurona, que se transmitirá a otras neuronas o fuera de la red.

En la siguiente imagen se muestra un esquema de la estructura de una neurona artificial.

Esta neurona artificial normalmente recibe el nombre de Perceptrón (Rosenblatt, 1958). Debido a que el Perceptrón tiene posibilidades limitadas en el aprendizaje, no se suelen considerar redes de neuronas.

Normalmente, las Redes de Neuronas Artificiales se componen de varias neuronas estructuradas y organizadas en capas, como en la siguiente imagen:

En la capa de entrada, las neuronas reciben datos o señales procedentes del entorno. Las neuronas de la capa de salida proporcionan la respuesta del modelo a los estímulos de la entrada, aplicando una transformación que se lleva a cabo en la red, a través de las capas ocultas.

Además, estos modelos pueden aprender. El aprendizaje depende del paradigma:

Aprendizaje supervisado: El proceso de entrenamiento supervisado de una red comienza tras asignar unos valores iniciales a los pesos de forma aleatoria. Tras asignarlos, el modelo procesa las entradas y compara las salidas predichas con las esperadas. Si hay errores en la predicción, entonces los gradientes del error se propagan hacia atrás en la red, provocando la actualización de los pesos de sus conexiones, a fin de minimizar el error entre el valor de la salida predicha por la red y el valor de la salida esperado. En un próximo capítulo ahondaremos en este tipo de aprendizaje.

Aprendizaje no supervisado: En este paradigma, no hay predicciones, sino que se espera que la red extraiga las propiedades subyacentes de los datos y los organice en grupos.
Sin embargo, las redes no solo se utilizan para clasificación. Son fundamentales en el Deep learning y en la visión artificial(segmentación, tracking, identificación de objetos…).
Uno de los mayores problemas que tiene este modelo surge cuando se utiliza en problemas de clasificación con una gran cantidad de datos. A mayor cantidad de datos, más refinada y compleja debe ser la estructura. A más compleja, más dificultades en el entrenamiento. En concreto, su rendimiento y éxito o fracaso depende en gran parte de la máquina en la que es llevado a cabo.

En resumen: Las Redes de Neuronas Artificiales son un modelo matemático simplificado del sistema nervioso de los seres vivos e inspirado en cómo éste procesa la información. Las redes estarán compuestas por una capa de entrada, una de salida y, al menos, una capa oculta. Para clasificación supervisada, la metodología de entrenamiento se denomina retropropagación del gradiente. Sin embargo, hay otras metodologías dependiendo del fin que le queramos dar a estos modelos.

 

Autor: Carlos Vázquez, Data Scientist | AI Engineer en Avansis

Presiona ENTER para comenzar la búsqueda en Avansis