Ordenador de inteligencia artificial entrenado para el reconocimiento de imágenes

Ordenador chino bate récord en reconocimiento de imágenes

Hace unos años publicamos un artículo referente a un superordenador chino que batía récord en capacidad de proceso, posteriormente se han desarrollado ordenadores muy superiores a aquel aunque, el ordenador mas potente del mundo continua siendo chino. Recientemente el buscador chino Baidu ha hecho público el desarrollo de un ordenador que ha superado las anteriores marcas de reconocimiento de imágenes.

En este caso, no se trata de un ordenador especialmente potente, si medimos su capacidad de proceso. Según la propia compañía, su potencia lo colocaría entre los 300 ordenadores más potentes del mundo.

Lo que hace que esta máquina consiga mejorar los resultados de sus competidores es la combinación de hardware y software. Se trata de un ordenador de 72 procesadores y 144 GPU o procesadores gráficos, algo muy alejado de los ordenadores más potentes del mundo.

Sin embargo, el hardware se ha desarrollado de forma combinada con un software de inteligencia artificial y, es la combinación de ambos lo que le da una especial potencia. El software se basa en la técnica de “aprendizaje profundo”, que actualmente se está utilizando para el desarrollo de tecnologías de reconocimiento de voz e imagen.

Esta técnica de inteligencia artificial parece dar mejores resultados cuando el volumen de datos aumenta significativamente, mientras otros métodos de inteligencia artificial no mejoran su rendimiento, el aprendizaje profundo continua mejorando su rendimiento conforme aumentan los datos.

Utilizando esta tecnología, entrenaron a la computadora en el reconocimiento de imágenes usando una base de datos de un millón y medio de imágenes, algunas de las cuales fueron tratadas mediante deformación, recortes o alteración del color. Una vez que la máquina fue entrenada, se le pidió que clasificara 100.000 imágenes en 1000 categorías distintas. El resultado fue un porcentaje de error del 4,58%, mejorando la marca de Google del 4,82% hecho público este mismo año.

Team

TimePlace

Top-5 error

SuperVision

2012

1

16.42%

ISI

2012

2

26.17%

VGG

2012

3

26.98%

Clarifai

2013

1

11.74%

NUS

2013

2

12.95%

ZF

2013

3

13.51%

GoogLeNet

2014

1

6.66%

VGG

2014

2

7.32%

MSRA

2014

3

8.06%

Andrew Howard

2014

4

8.11%

DeeperVision

2014

5

9.51%

MSRA PReLU-nets

2015.2

4.94%

BN-Inception

2015.2

4.82%

Deep Image

2015.5

4.58%

Este margen de error es menor al de los humanos y, por tanto, podemos decir que esta máquina supera al ser humano en la capacidad de reconocimiento de imágenes. Esto lo logra mediante una red neuronal que, en este caso, supera en cientos de veces las redes neuronales creadas anteriormente. Esta red neuronal emula el funcionamiento del cerebro humano utilizando capas  jerárquicas.

Como podemos ver en el cuadro anterior, la mejora en la tasa de errores en los últimos años ha sido espectacular aunque va disminuyendo a medida que los resultados mejoran.

Podéis descargar el documento en pdf con los resultados de la prueba de reconocimiento de imágenes pulsando un botón social. El documento está en inglés.

La carrera por aplicar la inteligencia artificial al desarrollo de aplicaciones continua y las empresas chinas compiten en el grupo de cabeza, veremos como acaba el año.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *