¿Qué es el deep learning?


Los términos inteligencia artificial, redes neuronales, machine learning (ML) y deep learning (DL) se suelen utilizar indistintamente, pero describen diferentes niveles de sofisticación que ayudan a los ordenadores a procesar los datos brutos de forma más «humana».

deep_learning_hero

¿Qué es la inteligencia artificial (IA)?

La inteligencia artificial (IA) es un término general que describe los sistemas informáticos diseñados para actuar como los seres humanos.

¿Qué son las redes neuronales?

Las redes neuronales utilizan nodos interconectados que toman como ejemplo el funcionamiento de las neuronas en el cerebro. Utilizan algoritmos para reconocer patrones en los datos brutos.

¿Qué es el Machine Learning?

El machine learning describe cómo las redes neuronales pueden mejorar su rendimiento a lo largo del tiempo «aprendiendo» mediante experiencias.

¿Cuál es la diferencia entre el deep learning y el machine learning?

La diferencia entre el deep learning y el machine learning es que el DL es el desarrollo posterior del ML, ya que utiliza múltiples capas (o profundidad) de nodos de redes neuronales para procesar los datos y crear resultados más útiles e interesantes. En los últimos tiempos, muchas personas han accedido a los sistemas de deep learning gracias a las mejoras de rendimiento exponencial de los procesadores GPU. Estos sistemas son responsables de los avances más importantes en los vehículos sin conductor o autónomos, detección del fraude, sistemas de comercio y más.

Tipos de deep learning

El deep learning intenta imitar el pensamiento humano combinando múltiples capas de algoritmos para procesar los datos. A medida que los datos pasan por cada capa, los algoritmos traducen algunos elementos de los datos a un formato numérico, facilitando su procesamiento en las capas futuras.

Aprendizaje supervisado

Cuando una persona está aprendiendo una tarea bajo supervisión, está acompañada de un profesor o capacitador que puede corregirla cuando comete un error. Para un ordenador o computadora, esto significa que los datos que se están procesando están etiquetados correctamente, de modo pueda detectar cuando comete un error.

Existen dos tipos de modelos supervisados de deep learning: clasificación y regresión.

Clasificación: Un modelo de deep learning podría aprender usando muchas imágenes de animales. En ese caso, cuando ve una nueva imagen, la compara con lo que ha «aprendido» en sus ejemplos de aprendizaje antes de tratar de predecir si la nueva imagen contiene un animal o no. El algoritmo se juzga pues por la precisión con la que puede reconocer un animal en una imagen aleatoria.

Regresión: El modelo de deep learning también puede incorporar muchas variables y, a continuación, solicitar la predicción de un valor. Un ejemplo podría ser los servicios bancarios, cuando los clientes solicitan un préstamo. El modelo está entrenado a partir de miles de solicitudes de préstamos, cada una de las cuales contiene datos como los ingresos del solicitante, el historial crediticio, el saldo bancario, la situación laboral y otros detalles, y luego se comunica a esos solicitantes si se les concedió un préstamo o no. A continuación, se proporcionan los datos del nuevo solicitante y se comprueba si cumple los requisitos para un préstamo.

El aprendizaje supervisado se utiliza cuando existe un gran conjunto de puntos de datos etiquetados, como imágenes de animales o detalles de personas que solicitan préstamos.

Aprendizaje sin supervisión

En este caso, el modelo de deep learning no incluye ninguna etiqueta sobre los datos que esté procesando, sino que solo es necesario descubrir patrones concretos.

Un ejemplo podría ser incluir miles de canciones en un modelo de deep learning para después dejar que decida cómo agruparlas. Al escuchar música, las personas reconocemos su estructura, instrumentos, tempo, voces y pulsaciones por minuto, y luego la categorizamos en géneros como punk, clásico o tecno. El modelo de deep learning sin supervisión no sabe qué es un género o un instrumento, por lo que utiliza su «cerebro» matemático para encontrar patrones en las pistas y crear nuevas categorías.

Aprendizaje semisupervisado

Esta es una combinación del primer aprendizaje supervisado y sin supervisión. Los modelos de deep learning combinan datos etiquetados y no etiquetados. Se les proporciona cierta estructura y orientación, al margen de esto, se les deja encontrar sus propios patrones. En el ejemplo de la música, las canciones tendrían etiquetas de datos para cada pista, quizás la fecha del primer lanzamiento, lo que podría ayudar a guiar la creación del patrón del modelo de deep learning hacia el resultado deseado.

Casos de uso del deep learning y la IA

Los casos de uso del deep learning han aumentado de forma exponencial a lo largo de la última década, y la tecnología va adquiriendo mayor influencia a medida que la sofisticación de los algoritmos aumenta y la potencia de procesamiento sigue creciendo.

Se pueden utilizar distintas formas de IA en una gran variedad de casos prácticos. De hecho, la IA se ha ido introduciendo lentamente en todos los aspectos de nuestras vidas porque este método de procesamiento de datos hace que las computadoras sean más eficientes y mejoren la interacción con los humanos.

En la vida real, no hace tanto que los filtros de spam eran torpes e identificaban un posible spam bloqueando cualquier mensaje que contuviera palabras clave específicas. Con la introducción de la inteligencia artificial, los filtros contra el spam o correo no deseado son capaces de examinar diferentes aspectos del mensaje de correo electrónico, desde dónde se ha enviado, a quién se ha enviado, en el contexto del propio mensaje, antes de decidir si enviarlo a la bandeja de entrada o a la carpeta de spam o correo no deseado del destinatario.

En otro ejemplo, imaginemos un modelo de deep learning que examine datos brutos de una cámara de seguridad en directo apuntando hacia la parte delantera de una gasolinera. La cámara de vídeo produce cada segundo unas 25 imágenes fijas independientes, que se envían al modelo utilizando una mezcla de los diferentes sistemas de aprendizaje descritos anteriormente.

Supongamos que es una gasolinera rural y que no está muy concurrida. La mayoría de las veces, las imágenes muestran una gasolinera vacía con los surtidores y la parte delantera. Al cabo de un tiempo, el sistema puede reconocer que lo «normal» es que la estación de servicio esté vacía. Cuando un vehículo entra en escena, el modelo de deep learning «ve» el vehículo y sabe que algo ha cambiado. Después de una mayor calibración, el modelo puede distinguir entre un coche, una motocicleta y un camión. Si el sistema está conectado a la caja registradora, no es una tarea enorme poder saber si el vehículo que acaba de salir de la gasolinera ha pagado o no. De este modo, se añaden más capas de entrada y procesamiento de datos para hacer que el sistema sea más «inteligente» y útil en la vida real.

Se utilizan modelos similares de deep learning en aeropuertos de todo el mundo para identificar el equipaje desatendido. El modelo de deep learning examina los datos de vídeo de las cámaras de seguridad y reconoce a las personas que caminan con sus maletas y valijas. Con muchas capas de refinamiento, se puede enseñar al algoritmo a enviar una alerta a los agentes de seguridad cuando identifica a una persona que ha dejado su equipaje y se ha ido más de un momento breve.

En el mundo financiero, los sistemas de deep learning monitorean los mercados e intentan entender los movimientos de los diferentes productos. Pueden hacer conexiones con un gran número de entradas en tiempo real y entender lentamente cómo algunos movimientos en los valores afectan a otros. Las entradas pueden ser diversas, como las advertencias por situaciones climáticas extremas y los disturbios políticos, así como los precios reales del mercado. Con el tiempo, pueden reconocer patrones familiares y predecir qué sucederá a continuación. Por ejemplo, el modelo de deep learning podría darse cuenta de que un ciclón masivo que se conecte con un área geográfica que tiene un número importante de plantaciones bananeras probablemente resulte en precios mucho más altos para la próxima temporada. Este tipo de conocimiento podría resultar extremadamente valioso para los comerciantes.

La modelización del deep learning también se utiliza en plantas de energía nuclear, fábricas y centros de datos. Los sistemas monitorizan la entrada de los sensores y cámaras del Internet de las Cosas (IoT) situados alrededor de las instalaciones. Una vez que el modelo conoce el funcionamiento «normal» de la instalación, puede enviar alertas cuando detecte un comportamiento inusual. El comportamiento inusual incluye, entre otros, equipos que no funcionan correctamente, una tormenta violenta o miembros del personal que no llegan a su hora. Estos problemas pequeños se van acumulando y podrían convertirse en un problema mayor. Los modelos de deep learning son mucho más fiables que los humanos a la hora de reconocer una combinación de factores pequeños que podrían llevar a un problema grave, ayudando a los ingenieros a evitar problemas importantes antes de que ocurran.

Limitaciones y desafíos

Calidad de los datos:  Los sistemas de deep learning necesitan observar los datos, por lo que están limitados por la cantidad y calidad de los datos que reciben. Si no hay datos suficientes o los datos contienen un sesgo, es posible que el algoritmo no sea preciso y reproduzca ese sesgo en sus resultados. Por ejemplo, un modelo de deep learning se alimenta de miles de fotos de pájaros y luego se le dice que mire una selección de fotos nuevas y encuentre las que contienen pájaros. Si los datos originales contenían fotos de aves en el medio silvestre, en una selva, con árboles en el fondo, a menos que el sistema de deep learning estuviera programado específicamente para ignorar el fondo y los alrededores, podría tener problemas para identificar un pájaro en una foto tomada en una zona urbana, o dentro de un recinto.

Falta de flexibilidad:  Una vez que el modelo de deep learning está entrenado, normalmente solo podrá ofrecer resultados precisos para el mismo problema utilizando el mismo tipo de datos. En el ejemplo anterior, si se cambia la calidad de las fotografías de aves, es posible que el sistema no pueda compararlas con precisión. El modelo también tendría que ser entrenado si en lugar de pájaros, el usuario quiere identificar fotos de otro animal. Así que incluso para tareas similares, los modelos de deep learning necesitan entrenamiento específico, por lo que no son flexibles.

Capacidad de cálculo:  Los modelos de deep learning requieren una gran potencia de cálculo. El motivo por el que el deep learning goza de mayor popularidad en la actualidad que hace una década se debe en gran medida a la disponibilidad de los procesadores multinúcleo y de las GPU. Los modelos de deep learning también consumen muchos recursos relacionados con la RAM y el almacenamiento: debido a que los datos se mueven con tanta rapidez, es posible que los discos duros tradicionales no puedan seguir el ritmo, por lo que los SSD son necesarios.

OVHcloud y el deep learning

El deep learning es una técnica de data science que puede ayudar a que los sistemas informáticos procesen de forma eficiente grandes cantidades de datos para obtener resultados empresariales prácticos y eficaces.

En OVHcloud hemos visto el potencial del deep learning y cómo puede resolver problemas reales de una amplia variedad de sectores.

Nuestro objetivo es ofrecer las herramientas de vanguardia necesarias para apoyar los sistemas de deep learning y ayudar a las empresas a ganar una ventaja competitiva.