Le Soundex, c'est un algorithme de reconnaissance des noms (de famille ou prénom) d'après leur sonorité, mis au point pour le bureau des immigrés aux États-Unis à la fin du XIXe siècle (si mes souvenirs sont corrects concernant la date). Le principe est que tu fais correspondre chaque consonne d'un nom à un code numérique. Le code d'une lettre est choisi en groupant les consonnes qui se prononcent de manière proche. On ignore les voyelles.
Ainsi, on obtient un code qui permet de trouver des noms "proches", mais qui ne s'écrivent pas de manière identique, ce qui permettait de "diminuer" le taux d'erreur dans les saisies effectuées par les employés du bureau d'immigration.
Cet algorithme a été "popularisé" par le génialissime Donald E. Knuth, dans le premier volume de son fantastique livre "The Art Of Computer Programming".
Un exemple : PIERCE et PEARSE se codent tous deux sous la forme P620,
CLIFTEN et CLIFDEN se codent tous deux sous la forme C413 (en effet, deux règles que je n'avais pas précisées d'abord : on garde la première lettre du nom, et on limite à trois consonnes considérées pour construire le code.)
Mais bon, parfois ça donne des résultats bizarres : Abuz System, A Few Good Men et Absidia ont tous les trois le même code soundex (A123).
Ai-je été assez clair
