Vous n'êtes pas identifié(e).
Pages : 1
Bonjour
Un de nos applicatif utilise l'algorithme Jaro Winkler au travers de la contribution pg_similarity (pg_similarity 0.0.19 )
Cet algorithme mesure la similarité entre deux chaînes de caractères pour la recherche de doublons par exemple.
Nous migrons actuellement l'application vers PostgreSQL 9.3, et souhaiterions éviter l'installation de cette contribution supplémentaire, cependant il ne semble pas exister de fonctionnalités similaires dans les extensions standards, pourriez-vous le confirmer/infirmer ?
Merci
Hors ligne
Il existe pg_trgm. Il permet de vérifier la similarité de deux chaînes de caractères via l'utilisation de trigrammes. Il fait partie des modules contrib de PostgreSQL. Ce serait à essayer.
Guillaume.
Hors ligne
Bonjour
Merci Gleu, effectivement, nous avons compares les résultats des 2 fonctions avec PostgreSQL 9.3
Cependant la fonction similarity de pg_trgm fournit des resultats bien moins satisfaisants :
Nom en base Nom recherche jarowinkler similarity
YOHANN YOANN 0.955556 0.444444
YOHANN YOAN 0.966667 0.625
YOHANN YOHANN 1 1
ADELINE ADELIME 0.942857 0.454545
Avez-vous d'autres pistes ?
Cdlt
Hors ligne
Non, pas d'autres pistes.
Guillaume.
Hors ligne
Pages : 1