Al abordar el tema de la Inteligencia Artificial (IA) es esencial conocer todos los conceptos y tecnologías, que se relacionan con ésta, por es es que en su momento ya se tocó el tema del Machine Learning, así que ahora es el turno de otra área de la IA, el Deep Learning.
Deep Learning es un subcampo del aprendizaje automático, que está relacionado con algoritmos inspirados en la estructura y función del cerebro llamadas “redes neuronales artificiales”.
La red neuronal aprende algo simple en el nivel inicial en la jerarquía y luego envía esta información al siguiente nivel. El siguiente nivel toma esta información simple, la combina en algo que es un poco más compleja y la pasa al tercer nivel. Este proceso continúa porque cada nivel de la jerarquía crea algo más complejo a partir de la entrada que recibió del nivel anterior.
Entre la capa de entrada y la capa de salida hay capas ocultas. Y aquí es donde los usuarios suelen diferenciar entre redes neuronales y Deep Learning. Una red neuronal básica puede tener una o dos capas ocultas, mientras que una red de aprendizaje profundo puede tener docenas o incluso cientos.
Por ejemplo, una red neuronal simple con algunas capas ocultas puede resolver un problema de clasificación común. Pero para identificar los nombres de los objetos en una fotografía, el modelo de reconocimiento de imágenes de Google, GoogLeNet, usa un total de 22 capas.
Aumentar la cantidad de capas y nodos puede aumentar la precisión de su red. Sin embargo, más capas significa que su modelo requerirá más parámetros y recursos computacionales y es más probable que se vuelva demasiado ajustado.
El Deep Learning ha atraído mucha atención porque es particularmente bueno en un tipo de aprendizaje que tiene el potencial de ser muy útil para las aplicaciones del mundo real.
La cuestión no es si el Deep Learning es útil o no, sino cómo se puede utilizar para mejorar lo que ya está haciendo, o para obtener nuevos conocimientos a partir de los datos que ya posee.
Aunque las primeras teorías acerca del Deep Learning se desarrollaron en la década de los 80s, existen dos razones principales por las que ha tomado relevancia en la actualidad:
- Requiere grandes cantidades de datos etiquetados. Por ejemplo, para el desarrollo de un vehículo sin conductor se necesitan millones de imágenes y miles de horas de vídeo.
- Es necesaria una potencia de cálculo significativa. La Unidad de Procesamiento Gráfico o (GPU, por sus siglás en inglés) de alto rendimiento tienen una arquitectura paralela que resulta eficiente para el Deep Learning. En combinación con clusters o con el cálculo en la nube, esto permite a los equipos de desarrollo reducir el tiempo necesario para el entrenamiento de una red de Deep Learning de semanas a horas.
La capacidad de aprender de los datos no etiquetados o no estructurados es un beneficio enorme para aquellos interesados en las aplicaciones del mundo real. El Deep Learning desbloquea el tesoro oculto de Big Data no estructurado para aquellos con la imaginación para usarlo.
Esta tecnología ya se utiliza en el día a día, ya que se puede ver en YouTube al generar los subtítulos para los videos, presenta atractivas fotos de comida en Yelp y responde las preguntas de los usuarios de iPhone a través de Siri. Y a medida que los científicos e investigadores de datos aborden proyectos de Deep Learning cada vez más complejos, este tipo de Inteligencia Artificial se entrelazará más en nuestras vidas cotidianas.