EnseignementInformatique

Fusion de base d’échecs Scid

La mise à jour de votre base Scid vs. PC de référence peut être mieux contrôlée en filtrant la base récente et la base de référence selon une année donnée.

Plus précisément, la base récente est la base dont les parties de jeu d’échecs sont à transférer dans la base de référence.

Comment contrôler la fusion de bases de données de jeu d’échecs au format Scid vs. PC ? Autrement-dit comment mettre à jour sa base de référence .si4 avec une autre base plus récente ?

Prenons le cas de la KingBase 2019 libre comme base récente.

Fusion de base d'échecs Scid : table des matières

1. Import standard de fichier PGN 2019

Les mises à jour « Update 01 » à « Update 08 » au format PGN peuvent être insérées classiquement dans votre base de référence. D’autant plus que ces PGN 2019 sont sans doublon. Considérons l’hypothèse selon laquelle la base de référence n’a pas encore de parties de 2019 sinon se reporter aux chapitres suivants.

Importer un fichier PGN dans la base ouverte Scid vs. PC
Importer un fichier PGN
Menu "Outils" > "Importer un fichier PGN..."

Il est vrai que Scid vérifie la syntaxe du PGN. Ainsi, l’import de KingBase2019-01.pgn 6,28 Mo génère le message suivant :

Imported 8961 games successfully.

Cependant, attention au KingBase2019-04.pgn 8,17 Mo

Imported 11750 games:
(game 6092, line 121144) Warning: illegal castling (O-O-O) in game Gevorgyan, Maria - Cornette, Deimante, 2019

En premier lieu, examinons le contexte de ce grand roque en recherchant cette partie :

Menu "Rechercher" > "Entête..."
Blancs : "Gevorgyan, Maria"
Noirs  : "Cornette, Deimante"

14. Tb1 n’autorise pas 24. O-O-O.

Ensuite, cliquez avec le bouton droit de la souris sur le coup noir précédent 23… Dc7

Right-click "23. Dc5 Dd7" > contextual menu "Epurer Coups jusqu'à la fin

Finalement, épurer le coup illégal 24 de grand roque et tous les coups qui suivent.

2. Téléchargement de la KingBase 2019

Tout d’abord, téléchargez la KingBase la plus récente :

  • Cliquer « KingBase 2019 (Release) » > « SCID format » > « KingBase2019-scid.zip » 207 Mo pour télécharger l’archive.
  • Dézipper l’archive zippée avec le gestionnaire de fichiers de Windows pour obtenir classiquement les trois fichiers .sg4, .si4 et .sn4.
  • Ouvrir KingBase2019.si4 dans Scid vs. PC par le menu « Fichier » > « Ouvrir… ».

Comme on pouvait s’y attendre, la vue « Fenêtre » > « Liste des parties » montre 2.18 millions de parties dont les parties récentes.

Cette KingBase 2019 ne contient pas encore les parties de 2019. Elles sont fournies séparément sous forme de mises à jour Update 01 à 08 au format PGN déjà importées au premier chapitre.

3. Import partiel de la KingBase

Pour éviter toute interférence par rapport à une précédente recherche, réinitialisons le filtre de toute éventuelle précédente recherche :

Menu "Rechercher" > "Réinitialiser le filtre"

Définissons le filtre des parties de l’année 2018 dans la KingBase 2019.

Filtre pour l'année 2018
Menu "Rechercher" > "Entête..."
Blancs : ""
Noirs  : ""
Date : "2018.01.01" - "2018.12.31"

La chaîne vide «  » signifie qu’il ne faut mettre aucun nom de joueur. Les guillemets ne sont pas à saisir. Typiquement, effacer si nécessaire les noms des joueurs utilisés pour régler le grand roque illégal lors de l’Update 4 précédent.

De toute évidence, la granularité selon l’intervalle de l’année est exprimée du 1er janvier au 31 décembre de l’année voulue et peut être adaptée comme souhaité.

La KingBase 2019 contient 120 719 parties de 2018.

3.1 Base de référence cible de la fusion

Pour commencer, ouvrir votre base de référence. Ensuite, appliquer le même filtre pour l’année 2018. Grâce à cela, vous avez ainsi une idée du nombre de parties de 2018 dans la base de référence avant la fusion avec la KingBase.

Considérons qu’il existe une grand quantité de doublons dans la base de référence que l’on ne veut pas traiter dans l’immédiat. Le problème est que l’on veut filtrer clairement les nouveaux doublons issus de la fusion récente et non pas les anciens doublons qui existaient avant la fusion.

3.2 Mise à jour base Scid vs. PC par glisser-déposer

mise à jour base Scid vs. PC par glisser-déposer d'une sélection de parties d'échecs de la base récente KingBase
Fusion de bases par glisser-déposer à la souris

La fusion se fait par glisser déposer depuis et sur les icônes des bases ouvertes dans le bas de page de la vue « Liste des parties ».

En ce qui concerne la KingBase2019, elle est identifiée par l’icône d’un koala.

mise à jour base Scid par glisser-déposer de la base récente vers la base de référence
Mise à jour base Scid par glisser-déposer dans le sens de lecture occidental

A partir de là, le glisser-déposer se fait en trois étapes :

  • Premièrement, maintenir appuyé le clic gauche de la souris sur l’icône du koala de la KingBase2019. Le pointeur souris se transforme en une double flèche.
  • Deuxièmement, déplacer le pointeur souris au-dessus de l’icône de la base de référence toujours en maintenant appuyé le bouton gauche de la souris.
  • Troisièmement, lâcher le bouton gauche de la souris avec le pointeur souris bien au-dessus de la cible de l’icône de la base de référence.

Vous contrôlez le nombre de parties copiées-déposées. Il s’agit du premier nombre issu du filtre sur l’année 2018. Ensuite, le nombre après le slash est le nombre total de parties. Alors que sans filtre, Scid vs. PC afficherait « (Tout/ nombre total de parties) »

Pour la KingBase, c’est : « (120K / 2,18M) ». Les unités utilisées sont Kilo et Million.

Finalement, une boîte de dialogue de confirmation du glisser-déposer s’affiche pour valider l’opération de copie.

Copie des parties récentes de l'année choisie pour la mise à jour de la base Scid vs. PC de référence
Confirmer la copie après le glisser-déposer

Le nombre de parties de l’année 2018 de la base de référence est augmenté de celui de la KingBase pour la mise à jour de base Scid vs. PC.

4. Filtre sélectif de la base référence

En somme, il reste à purger les doublons de l’année 2018.

Menu "Outils" > "Maintenance" > "Purger les doublons..."

4.1 Paramétrage d’effacer les parties en doublons

Vous pouvez garder vos critères habituels pour la détection des doublons. De toutes les façons, Scid vs. PC avertit si les critères ne sont pas assez sélectifs.

La caractéristique principale se trouve dans la section « Parties à examiner » :

[ ] Toutes les parties de la base
[x] Seulement les parties du filtre

Vous cochez l’option de droite « [x] Seulement les parties du filtre » sous-entendu de l’année 2018 pour le filtre en cours. Ainsi vous ne risquez pas de filtrer les parties en dehors de l’année souhaitée. Il faut souligner que le filtre de recherche basé sur l’année 2018 est toujours actif.

Un aspect plus spécifique est la dernière section « Partie à effacer » qui mérite une attention particulière :

En général, il est préférable de garder l’option par défaut :

[x] La partie la plus courte

Cela permet de garder le doublon ayant le maximum d’information et de proposer l’effacement de l’autre plus petit.

Cependant, il est concevable de prendre en considération l’option de droite :

[ ] La partie avec le plus grand numéro

Lors de la fusion, les nouvelles parties sont ajoutées en incrémentant le numéro de partie. Tout dépend ce que l’on veut filtrer : parmi les parties en double la plus courte des deux ou les parties nouvellement fusionnées ayant un grand numéro.

Considérons que les parties de la KingBase seront les plus courtes. Car la KingBase se spécialise dans les parties sans annotations

4.2 Sauter la confirmation des doublons sélectionnés

Scid vs. PC présente une fenêtre des doublons par paire pour permettre de valider ou changer le doublon à effacer et le doublon à conserver. Etant donné le grand nombre de doublons, fermer cette fenêtre.

Afin d’attirer l’attention de l’utilisateur, Scid vs. PC grise les parties en double. Ce n’est qu’une opération logique. Il est encore possible d’annuler l’opération seulement dans le cas où on s’est trompé par :

Menu "Outils" > "Maintenance" > "Fenêtre de maintenance" > "Récupérer les parties filtrées"

C’est l’équivalent d’avoir transféré un fichier à effacer dans la corbeille de Windows. En conséquence, le fichier n’est pas réellement effacé tant que l’on ne vide pas la corbeille

4.3 Suppression effective des doublons par compactage

La suppression physique des doublons grisés de la base de données échiquéennes sur le disque dur intervient avec l’opération appelée compactage de la base :

Compacter la base de référence pour finaliser la mise à jour de base Scid vs. PC
Menu "Outils" > "Maintenance" > "Compacter la base" > "Compacter le fichier de parties"

En conséquence, toutes les parties grisées ont été effacées.

5. Récapitulatif de mise à jour de base Scid

La mise à jour sélective de votre base de référence Scid vs. PC peut se faire de façon partielle avec un filtre sur une année donnée comme 2018.

De la même manière, la méthode reste applicable pour toutes les années souhaitées.

  • En premier lieu, appliquer le filtre par année sur la base de référence avant la fusion des parties récentes.
  • Ensuite, utiliser ce même filtre sur la base récente pour ne fusionner que les parties sélectionnées par le filtre.
  • Après cela, la fusion proprement dite se fait par glisser-déposer à la souris de la sélection du filtre des parties récentes vers la base de référence.
  • En outre, la recherche de doublons dans la base de référence est uniquement focalisée selon les critères de ce même filtre.
  • En dernier lieu, le compactage final efface physiquement les doublons grisés.

Pour conclure, la gestion des doublons récents est mieux ciblée.