jueves, 28 de enero de 2016

Go y machine learning: un hito muy importante

http://www.enriquedans.com/2016/01/go-y-machine-learning-un-hito-muy-importante.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+ElBlogDeEnriqueDans+%28El+Blog+de+Enrique+Dans%29

GoPara un occidental, entender la importancia que el hito que ha tenido lugar hoy en el mundo delmachine learning puede no ser demasiado obvio o sencillo. El juego del Go, aunque tiene más de cuarenta millones de practicantes en el mundo, goza de su mayor popularidad en Oriente, particularmente en países como China, en el que se considera una de las cuatro artes de la erudición, o Japón, donde antiguamente las partidas profesionales duraban varios días (hoy en día el máximo son 16 horas repartidas durante dos días). 
El Go es un juego de estrategia e intuición que se juega en una cuadrícula de líneas negras, típicamente de 19 × 19, en cuyas intersecciones se colocan las fichas, llamadas “piedras”. Aprender las reglas del juego es relativamente sencillo, pero jugar a un buen nivel de competición requiere miles de horas de estudio, fundamentalmente porque la cantidad de combinaciones que pueden generarse es mayor que el número calculado de átomos en el universo. 
Para los estudiosos de la inteligencia artificial y el machine learning, la complejidad del Go ha constituido un reto durante varias décadas. Con el avance de las diferentes técnicas, las máquinas han ido siendo capaces de vencer a los humanos primero al tres en raya, después a las damas, y finalmente, en la histórica partida de Deep Blue contra Gary Kasparov, al ajedrez. Después llegó Watson y logró ganar a los mejores jugadores de Jeopardy, o Google consiguiendo algoritmos capaces de aprender a jugar docenas de juegos de consolas Atari, pero el Go se mantenía inalcanzable: la mejor inteligencia artificial llegaba tan solo a un nivel de jugador humano principiante.
El problema estaba, fundamentalmente, en la metodología. Los métodos basados en árboles de posibilidades chocan con la enorme cantidad de combinaciones existentes en Go, y entrenar la inteligencia de una máquina mediante el análisis de treinta millones de jugadas de Go de los mejores jugadores del mundo, el principio del llamado deep learning, lograba, como mucho, una máquina capaz de imitar a esos jugadores, capaz de predecir sus jugadas en un 57% de las ocasiones, pero no capaz de mejorar su rendimiento en una partida. Para ser capaz de vencerlos, se planteó otra metodología: el uso del reinforcement learning, consistente en entrenar a la máquina jugando contra sí misma, lo que le permite generar toda una nueva colección de movimientos que después son realimentados en el entrenamiento. Si no lo has leído bien, vuélvelo a leer: el sistema aprende no a partir de datos generados por humanos, sino a partir de datos y de hipótesis generadas por sí mismo, creando jugadas que no han existido previamente y tratando de resolverlas jugando contra versiones levemente diferentes de sí mismo. Algo que, lógicamente, requiere de una enorme potencia de computación, y que ha implicado un uso intensivo de la Google Cloud Platform.
El momento histórico ha llegado cuando ese algoritmo, creado por Google y llamado AlphaGo, ha sido capaz de vencer a uno de considerados mejores jugadores del mundo de Go, el chino Fan Hui, no en una simple partida sino cuatro veces seguidas, hecho que tuvo lugar precisamente ayer. Un hito histórico para la inteligencia artificial documentado directamente por un editor de Nature, y que abre además posibilidades interesantísimas para el uso de la inteligencia artificial en campos como el análisis científico. En el siguiente desafío, se enfrentará al surcoreano Lee Sedol, la persona con mayor número de victorias en torneos de todo el mundo. Para la inteligencia artificial, un verdadero hito histórico, todo un momento de la verdad, que la mayor parte de los analistas situaban como posible dentro de una década. Ha sido la metodología, la idea de aplicar deep learning conreinforcement learning, unida a la potencia computacional disponible, la que ha obtenido estos resultados. No lo veáis como una frivolidad científica, como una curiosidad o como un detalle: hablamos de un auténtico desafío, de algo que abre posibilidades capaces de cambiar muchas cosas. Un verdadero hito.
Como dirían en Memorias de África,
“a Marvin Minsky le gustará saberlo. Tengo que acordarme de decírselo”.
Lo que nos queda de década va a ser precisamente esto: demostraciones sucesivas de cómo una máquina con la potencia computacional adecuada y sometida a un proceso de entrenamiento bien diseñado es capaz de mejorar la eficiencia de un hombre a la hora de desarrollar tareas cada vez más complejas, más difusas más desafiantes, más… humanas. Si en un tema he tenido la impresión, cuando me lo han explicado adecuadamente, de estar viendo algo que iba a cambiar el futuro de la humanidad en su conjunto, ha sido con machine learning. Si piensas que como directivo no te va a afectar, vete repensándolo.

No hay comentarios:

Publicar un comentario