AlphaZero

Escrito por António Ferreira

O jogo de xadrez tem estado há décadas na linha da frente dos estudos sobre inteligência artificial. Desde que há computadores apareceram programas que jogam xadrez e nesses programas tentam-se replicar os procedimentos humanos na resolução dos problemas específicos do xadrez, na esperança de esses métodos poderem ser transpostos para outros domínios. Inicialmente pensava-se que o número astronómico de possibilidades do jogo seria inatingível para um programa informático, mesmo que usado nos supercomputadores mais poderosos. Só no primeiro lance, de brancas e pretas, há quatrocentas possibilidades diferentes e essas possibilidades vão progredindo geometricamente nos lances seguintes. Pensava-se por isso que o efeito horizonte tornaria inatingível a resolução do jogo, pensava-se também que havia conceitos intransponíveis para os zeros e uns dos programas informáticos, que a complexidade do jogo apenas poderia ser parcialmente abarcada por um computador.
Isso eram tretas. Agora qualquer telemóvel com um programa básico de xadrez consegue derrotar um mestre. Não só se evoluiu em termos impensáveis antes na potência do hardware, como a inteligência artificial seguiu por caminhos que antes pareciam impossíveis. Antes, por exemplo, pensava-se que o computador não podia ter lá mais do aquilo que os humanos introduzissem, o que tinha como corolário estar o computador limitado ao que os humanos lhe ensinassem. Era inimaginável, por exemplo, que o computador aprendesse com os erros que ele próprio cometesse num jogo de xadrez de modo a não perder duas vezes pelas mesmas razões.
Agora já não. Em 1988 já não era também assim, como me explicaram quando joguei com o programa “Deep Thougt”, instalado num computador da universidade de Edmonton. O computador ia avaliando jogada a jogada a sua posição e, quando a avaliação começava a baixar concluía que tinha cometido um erro antes. Isto era muito primitivo, mas um sucessor desse mesmo programa viria a derrotar Kasparov, então campeão mundial, pouco tempo depois.
Em 2018 aparece “Alphazero”, um programa saído em parte do universo Google, com um algoritmo totalmente inovador e que aprende a jogar xadrez e se torna num mestre, possivelmente o melhor do mundo, jogando simplesmente consigo próprio. Milhões de vezes. Quando os programadores acharam que estava pronto, desafiaram o melhor programa comercial existente, o “Stockfish”, e os dois programas jogaram entre si centenas de partidas. O “Alphazero” ganhou por larga margem (62 vitórias, 11 derrotas e 147 empates), mas, mais do que isso, obrigou a repensar conceitos que se pensavam básicos da estratégia e tática, ou da teoria de aberturas e finais. Em suma, começa-se agora a perceber, tornou obsoleto boa parte do conhecimento adquirido em muitos séculos.
Seguem-se mais avanços na inteligência artificial e mais aplicações para esta. Boa parte da investigação científica, em todos os domínios, usa-a já e mais vão passar a usá-la. Da meteorologia à medicina, passando pelas ciências sociais, pela economia, pela condução automóvel, e um dia pela governação ou pela justiça, não há campos claramente fechados a esse domínio.
Teremos de começar a reler os velhos livros de ficção científica e recordar as leis da robótica ou temer a aproximação do dia da singularidade: aquele em que um computador toma consciência de si. Não estamos preparados.

Sobre o autor

António Ferreira

Leave a Reply