PROJET AUTOBLOG


Shaarli - le hollandais volant

Site original : Shaarli - le hollandais volant

⇐ retour index

The Word Machine – …in some weird postmodern way…

lundi 6 septembre 2021 à 11:47

Hihi, quand ses outils traversent les frontières :D

(Sans surprise, mes sites sont beaucoup plus visités dans les pays francophones qu’ailleurs : France, Belgique, Canada, Suisse, Maroc…) mais parfois des liens sur des blogs anglais ressortent :-D)

Perso j’aime énormément l’outil en question car c’est le seul outil que j’ai qui ressemble un peu à de la machine-learning.
Je donne une énorme liste de mots au script, il calcule statistiques relatifs aux occurrences des lettres et des suites de lettres, et après utilise ces statistiques pour créer des mots.

En fait, il suffirait que j’ajoute une fonction qui permet à chacun de valider les meilleurs mots ainsi inventés pour les ajouter à une seconde liste. Une fois que cette liste devient conséquente, on utilise cette liste là comme liste d’entrée, et voilà ! On a une machine qui invente des mots qui ressemblent à des mots dans une langue donnée, sans avoir jamais connu aucun mot réel de la langue donnée.

Mieux, on pourrait alors donner un mot à la machine et il nous dit quelque chose comme « ce mot est 98 % français », ou au contraire « Non, ce mot n’est que 4 % français ».

Et comme il y a une part d’aléatoire dans tous les mots générés, il serait possible de créer un texte totalement random de cette manière (suffit de lui apprendre à générer des phrases, en plus de produire des mots).

(et on verra dans 400 ans, les chercheurs s’arracher les cheveux comme ils le font aujourd’hui avec le texte de Voynich :-D)


— (permalink)