Categories: Informatique

by Eric

Share

Categories: Informatique

by Eric

Share

2018-2019 marque une mutation irréversible dans l’architecture des logiciels de l’olympe échiquéen. Leela Chess à réseau de neurones a appris en un an les connaissances échiquéennes que les développeurs de StockFish ont codé et réglé finement dans leur moteur pendant une décennie.

La néo-Grünfeld D70 Robert Byrnevs Robert J. Fischer, championnat USA1963, est scrutée par les mini caméras-filtres 3 cases sur 3 de Leela Chess. Le fianchetto de Fischer en vert est reconnu comme fort. Celui de Robert Byrne est déserté après le sacrifice 15… Cd3xFg2 {au bout de la tentacule du Cavalier pieuvre[ref]Un Cavalier pieuvre est un Cavalier noir qui a atteint la 3e rangée. Les 8 cases attaquées forment le cercle des tentacules de la pieuvre.[/ref] se trouve le Fou de fianchetto}.

Compteur à rebours de la fin du jeu d’échecs sur fond de couronne de lilas

Cerné par les actions concertées de Fg7 (xCd4 ∆[ref]Le triangle ∆ vers le haut signifie « avec l’idée »[/ref] xf2, xg1), Te8 (xe1,xe2) et Fb7 (xg2), Rf1 subit l’attaque finale de Fischer par 21… Dd7 ∆ Dh3+ +-. Byrne répond « 0-1! » surprenant les commentateurs((Robert G. Wade, Kevin J. O’Connell, « les parties d’échecs de Boby Fischer », Tome 1, Payot, ISBN 2-228-15180-7, janvier 1974, pp. 71-73)).

Fischer avait-il en tête les mini-échiquiers 3×3 correspondant aux chunks[ref]chunk : morceau, vue partielle de l’échiquier[/ref] de sa perception échiquéenne de la position ?

L’architecture de Leela Chess

Leela chess estime le meilleur coup spéculatif suivant une probabilité de gain issue de son expérience d’apprentissage y compris si la position n’a jamais été rencontrée parce qu’elle comprend des structures qui sont plus ou moins reconnues avec un indice de confiance.

Architecture 256×20 du réseau neuronal de Leela Chess

L’échiquier (planes), perçu par type de pièces et par couleur, est l’entrée des 256 filtres ou caméras de résolution 3 cases sur 3 sur la position courante ainsi que l’historique des huit derniers coups.

Vingt blocs résiduels[ref]Les premières expérimentations utilisaient moins de blocs résiduels favorisant la rapidité d’apprentissage mais jusqu’à un seuil qui est repoussé quand on augmente le nombre de blocs résiduels.[/ref], dont les poids sont réglés par apprentissage, produisent le résultat dans deux sorties (têtes) du réseau neuronal :

  • value head, orientée évaluation estime la valeur v d’une position entre -1 et +1.
    Le score moyen Q du prochain état est une moyenne pondérée par le nombre de visite N :
    Q = W / N avec W = W + v pour chaque arc traversé afin d’atteindre la feuille terminale ;
  • policy head, orientée recherche arborescente, dresse la liste ordonnée des meilleurs coups candidats avec leur probabilité de gain.

Exploration et exploitation de l’arbre du jeu

L’algorithme PUCT[ref]Predictor + Upper Confidence Bound((Prcuvu, Technical Explanation of Leela Chess Zero, 15 mai 2019)) Tree search : devin + limite supérieure de confiance dans l’arbre de recherche.[/ref] oscille entre exploration (visite d’un nœud qui pourrait devenir prometteur) et exploitation (visite d’un nœud connu pour être prometteur). Pendant l’apprentissage, il y a un mécanisme de renforcement du choix des meilleurs coups candidats et de l’évaluation des positions. Le choix au hasard (d’où la référence à Monte-Carlo[ref]MCTS : Monte Carlo Tree Search, recherche arborescente Monte Carlo heuristique pour prise de décision.[/ref]) remonte aux prémices de l’apprentissage du réseau neuronal sans connaissance d’experts humains du domaine (tabula rasa).

Algorithme PUCT connecté au réseau neuronal

L’état du jeu est un nœud dans l’arbre. Chaque nœud est marqué par une valeur estimée et comprend une liste ordonnée des coups candidats incluant pour chacun une probabilité de gain. L’expansion de l’arbre apporte une meilleure compréhension du nœud racine qui est la position courante où Leela chess doit jouer dans un temps alloué.

N : nombre de visites du nœud. W : score cumulé du prochain état.

Sorties (tête) du réseau neuronal : v valeur de la position et P probabilité de sélectionner le coup.
Q : moyenne du score du prochain état.

Chaque blocs résiduel a deux couches à réseau neuronal de convolution. Leela Chess a également une vue de l’ensemble de l’échiquier avec la couche entièrement connectée à toutes les 64 cases.

Bibliographie

STAY IN THE LOOP

Subscribe to our free newsletter.

Leave A Comment

Related Posts

  • Tout d’abord, comment Gimp accepte un commentaire multiligne en langage TinyScheme pour les scripts de la console Script-Fu ? Ainsi, ouvrons une parenthèse de programmation dans le langage de script de l’éditeur open source d’images Gimp. D’autant plus que parenthèses et liste font penser au langage d’intelligence artificielle Lisp[ref]Lisp : list processing[/ref]. Par contre, il […]

  • Tout d’abord, le site de l’échiquier Briochin adopte le format d’images numériques WebP de Google. En premier lieu, Karophyr crée en 2007 sur Wikipedia anglais l’animation de l’immortelle d’Anderssen contre Kieseritzky trop gourmand face aux deux Tours blanches sacrifiées. En fait, l’aspect le plus important dans cette introduction, outre son format GIF 244 x 248 […]

  • Comment importer le PGN [ref]PGN : Portable Game Notation[/ref] twic [ref]TWIC : The Week in Chess[/ref] hebdomadaire dans Scid vs. PC d’abord manuellement puis dans un script PowerShell de Windows 10 ? [toc label= »Twic vers Scid : table des matières »] 1. Importer manuellement le PGN twic dans Scid Tout d’abord, Mark Crowther compile chaque semaine […]

  • Jean-Michel Blanquer((« Vingt et une pistes pour une « nouvelle politique » de l’enseignement des maths » de Luc Cédelle et Mattea Battaglia, Le Monde, 10 février 2018)), ministre de l’éducation nationale et de la jeunesse, Charles Torossian, inspecteur général mathématique et conseiller spécial auprès de la DGESCO[ref]DGESCO : Direction Générale de l’Enseignement SCOlaire[/ref] et Cédric Villani, député de […]