Exemple d’une cryptanalyse : notre compte-rendu d’expérience

Dans l’esprit des TPE de 1ère S, nous nous sommes confrontés à une expérience de cryptanalyse. Nous rendons compte ici de notre démarche de recherche pour résoudre ce problème.

Nous cherchons à décrypter le texte suivant :

ATKUTESAATQNJAXANBWPQTBWYEHKCVQSVZSBIIMWEUYXIZDKHZATXMGAUXAPMIYAILNUCWEABWYDEXTIERGXMPEYLIXIIMWPEYXPGSHMEGXJMRASPWYDSGAWQZJMQMLNMYDEAFMOIHIWHOAAMYPRWVQNZKSGLKHGAURMDBOAZIGXVZIZEFIZQCRMYDSPWYDSRMWEOOVWCUOTIEDKDSDETBSGBRQILLKALQUXMYJMGQWVEJMQMNJMIZVGQRCUKTUGEYUSYETBWQNIWVQLKBIYPYUIOHGXTQEZNYUTPMHUSGKIFTKVYUTYWMEPRCWXETBIQTRIYDOXMZMDOAWUPKZPMNAQX

Nous supposons dans notre raisonnement que le texte codé est en français.

1. Hypothèse “Chiffre de César”

figure1

Figure 1

Le graphique montrant la corrélation entre la fréquence mesurée et celle de la langue française est donné en figure 2. Nous voyons que les points y sont très dispersés, indiquant une faible corrélation entre les deux.

figure2

Figure 2

2. Hypothèse “Chiffre de Vigenère”

Il existe deux grandes méthodes de déchiffrement :

Nous avons tenté de calculer l’indice de coïncidence pour une clé de longueur 2 ; au vu du temps que cela nous a pris, nous en avons conclu que cette méthode était inapropriée pour trois lycéens armés seulement de stylos et de feuilles.

ATKUTESAATQNJAXANBWPQTBWYEHKCVQSVZSBIIMWEUYXIZDKHZATXMGAUXAPMIYAILNUCWEABWYDEXTIERGXMPEYLIXIIMWPEYXPGSHMEGXJMRASPWYDSGAWQZJMQMLNMYDEAFMOIHIWHOAAMYPRWVQNZKSGLKHGAURMDBOAZIGXVZIZEFIZQCRMYDSPWYDSRMWEOOVWCUOTIEDKDSDETBSGBRQILLKALQUXMYJMGQWVEJMQMNJMIZVGQRCUKTUGEYUSYETBWQNIWVQLKBIYPYUIOHGXTQEZNYUTPMHUSGKIFTKVYUTYWMEPRCWXETBIQTRIYDOXMZMDOAWUPKZPMNAQX

Pour trouver la longueur du mot-clé, on analyse l’espacement en nombre de lettres entre les occurrences de chaque séquence. Comme illustré dans l’exemple ci-dessous on voit que l’espacement entre les occurrences d’une séquence (ici “DPP” correspondant au mot “thé”) correspond à la longueur du mot clé (ici 4) ou à un multiple de cette longueur (8, 12, 16, etc)

Mot-clé KILOKILOKILO
Texte clair théathébthéc
Texte chiffré DPPODPPPDPPQ
Position 1---5---9---

Le tableau 1 donne les résultats de notre analyse. Il apparaît clairement que toutes les périodes sont divisibles par 5. La première séquence SPWYDS peut résulter d’un mot-clé qui tourne 15 fois entre sa première et sa deuxième occurrence. La deuxième séquence BMY peut résulter d’un mot-clé qui tourne 10 fois entre ses deux occurrences,etc. Le mot-clé est donc sûrement composé de 5 lettres. Une autre méthode possible consiste à calculer le PGCD des écarts. PGCD (75 ; 50 ; 105; 115 ; 15) = 5.

Séquence répétée
Espace de répétition
Longueurs de clefs possibles
23571015212325355075
SPWYDS75xxxxx
BWY50xxxxx
GAU105xxxxxx
JMQM115xx
YUT15xxx

Table 1

Nous savons que l’une des lignes du carré de Vigenère, définie par L1, commande l’alphabet chiffré pour la 1ère, la 6e, la 11e, la 16e… lettre du message. Donc si nous regardons la 1ère, la 6e, la 11e, la 16e… lettre du texte chiffré, nous pourrons utiliser l’analyse des fréquences pour déterminer l’alphabet en question. Nous calculons donc la fréquence de chaque lettre mais uniquement en en prenant une sur cinq.

La figure 3 ci-dessous montre la fréquence de distribution des lettres apparaissent à la 1ère, la 6e, la 11e, la 16e… places dans le texte chiffré, soit A, E, Q, A … Maintenant, rappelons-nous que chaque alphabet chiffré du carré de Vigenère est un simple alphabet normal, décalé de un à vingt-six crans. Par conséquent, la répétition ci-dessus devrait présenter des traits communs avec celle d’un alphabet normal, bien que décalée d’une distance indéterminée. En comparant la répartition L1 à la répartition banale, on devrait pouvoir repérer le décalage. La figure 4 illustre la répartition habituelle des lettres en français.

figure3

Figure 3

figure4

Figure 4

Le graphique de la répétition usuelle est animé de pics, de plateaux et de creux. Son pic le plus important se trouve sous le E, précédé d’un creux sous BCD avec, pour A une présence relativement importante. Nous retrouvons dans la répartition de fréquences L1 un schéma du même type avec un pic pour Q, un creux pour NOP et un M un peu plus long. Cela nous donne envie de superposer les alphabets en faisant coÏncider le Q de l’alphabet chiffré avec le E de l’alphabet normal. Dans le cas où les deux graphiques présenteraient alors à peu près la même silhouette, nous pourrions en déduire que la première lettre du mot-clé, L1, est probablement M.

figure5

Figure 5

Cette superposition confirme la ressemblance entre les graphiques, nous montrant ainsi que la séquence X-Y-Z-A-B-C-D semble se présenter comme L-M-N-O-P-Q-R dans l’alphabet usuel, ce qui confirme que L1 est M. On peut également le vérifier en étudiant la corrélation entre l’alphabet L1 décalé de douze lettres et la fréquence moyenne sur un texte français.

figure6

Figure 6

La corrélation est correcte et nous permet de confirmer notre hypothèse. Elle n’est pas parfaite car l’analyse des fréquences est réalisée sur un texte de 69 lettres, ce qui est relativement peu. Pour avoir une corrélation quasi-parfaite, il faudrait un échantillon d’environ 10 000 caractères.

Nous allons recommencer la même démarche pour identifier la deuxième lettre du mot-clé. Une répartition des fréquences une fois établie pour la 2e, la 7e, la 12e, la 17e … lettres du texte chiffré, nous comparons de nouveau le graphique obtenu avec celui de l’alphabet courant (figure 7).

figure7

Figure 7

Les fréquences de L2 semble correspondre à celles de l’alphabet usuel. On remarque bien un pic sur E puis deux petits pics au niveau de L-M-N-O-P et de R-S-T-U. Chaque lettre serait donc codée par la même lettre, ce qui signifie que la deuxième lettre du mot-clé serait A. Nous avons le début de notre mot-clé, que l’on peut écrire M-A-L3-L4-L5. En analysant de la même manière la 3e, la 8e, la 13e,… lettres nous découvrons que la 3e lettre du mot-clé est G. L’analyse de la quatrième lettre nous donne I, et la cinquième E. Le mot-clé est MAGIE.

Vigenere

La table de Vigenère

Ô temps ! suspends ton vol, et vous, heures propices !
Suspendez votre cours :
Laissez-nous savourer les rapides délices
Des plus beaux de nos jours !

Assez de malheureux ici-bas vous implorent,
Coulez, coulez pour eux ;
Prenez avec leurs jours les soins qui les dévorent ;
Oubliez les heureux.

Mais je demande en vain quelques moments encore,
Le temps m’échappe et fuit ;
Je dis à cette nuit : Sois plus lente ; et l’aurore
Va dissiper la nuit.

Page précédente