PROJET AUTOBLOG


le hollandais volant links

Site original : le hollandais volant links

⇐ retour index

FixPhrase

mardi 26 octobre 2021 à 17:11

Un système GPS pour transmettre les coordonnées via des mots de la langue courante.

Via : https://sebsauvage.net/links/?3sbQ3A

Le code fait 200 lignes, mais y a un dictionnaire de 7 000 mots : Le code source : https://source.netsyms.com/Netsyms/fixphrase.com/src/branch/master/FixPhrase.lib.php

Donc a priori, il faudrait un dico français et hop, on a la version française.

La difficulté est d’avoir des mots suffisamment différents entre-eux (un peu comme l’alphabet radio où les mots sont très soigneusement choisis pour éviter les collisions quand on les prononce transmet sur une ligne téléphone merdique).

Les dictionnaires Hunspell (listes de mots utilisés par tous les correcteurs d’orthographe) comportent environ 50 000 à 150 000 mots selon les langues. Ça peut-être un bon début.

Il suffit d’éliminer :
- les mots trop courts (<=3 lettres)
- trop longs (>12 lettres)
- ainsi que les pluriels (<mot1>+s == <mot2> ? on vire le <mot2>).
- les mots trop compliqués (si on garde « feldspath », « ouananiche » ou « tétraktys », certains vont se planter c’est sûr — oui ce sont de vrais mots)

Ensuite pour les ressemblances entre les mots ou les homonymes, on peut filtrer en utilisant la clé soundex d’un mot (d’empreinte phonétique — faut voir s’il existe en soundex-français).

Puis on réduit la liste des mots : en prenant 1 sur 2, puis, puis en refaisant un soundex() plus large. Au final, on filtre peu à peu jusqu’à obtenir 7k mots.

Yapluka implémenter tout ça.


… allo ?


— (permalink)