PostgreSQL La base de donnees la plus sophistiquee au monde.

Forums PostgreSQL.fr

Le forum officiel de la communauté francophone de PostgreSQL

Vous n'êtes pas identifié(e).

#1 27/04/2022 14:22:37

genamiga
Membre

suppression doublons

Bonjour,

Je cherche les doublons avec ce query

WITH CTE AS (SELECT art_id, 
           prix, 
           maj, 
           ROW_NUMBER() OVER(PARTITION BY art_id,
                                          maj
           ORDER BY maj,prix DESC) AS DuplicateCount
    FROM historique_prix
SELECT * FROM CTE WHERE DuplicateCount > 1

Et voici le résultat

|art_id|prix|maj|duplicatecount|
|------|----|---|--------------|
|6739|94.00|2021-09-01 15:54:47.000|1|
|6739|88.00|2021-09-01 15:54:47.000|2|
|6739|95.00|2021-09-20 22:29:47.000|1|
|6739|96.00|2021-09-30 10:29:40.000|1|
|6739|93.00|2021-10-04 09:26:22.000|1|
|6739|91.00|2021-10-04 09:26:22.000|2|
|6739|92.00|2021-10-05 17:23:03.000|1|
|6739|93.00|2021-10-08 10:50:33.000|1|
|6739|87.00|2021-10-11 10:27:02.000|1|
|6739|88.00|2021-10-15 08:59:32.000|1|
|6739|87.00|2021-10-15 10:29:06.000|1|
|6739|84.00|2021-10-25 10:28:42.000|1|
|6739|85.00|2021-10-26 10:28:14.000|1|
|6739|84.00|2021-10-29 08:58:25.000|1|
|6739|82.00|2021-11-01 09:32:21.000|1|
|6739|83.00|2021-11-12 12:52:48.000|1|
|6739|84.00|2021-11-17 09:49:58.000|1|
|6739|85.00|2021-11-23 10:04:03.000|1|
|6739|84.00|2021-11-30 11:34:21.000|1|
|6739|85.00|2021-12-20 11:26:21.000|1|
|6739|84.00|2021-12-24 13:42:04.000|1|
|6739|83.00|2022-01-13 10:44:55.000|1|
|6739|86.00|2022-01-17 11:16:58.000|1|
|6739|89.00|2022-01-18 16:33:24.000|1|
|6739|86.00|2022-01-18 16:33:24.000|2|
|6739|90.00|2022-01-18 16:35:24.000|1|
|6739|86.00|2022-01-18 16:35:24.000|2|
|6739|91.00|2022-01-18 16:38:40.000|1|
|6739|90.00|2022-01-18 16:38:40.000|2|
|6739|93.00|2022-01-27 10:57:11.000|1|
|6739|88.00|2022-01-29 14:56:44.000|1|
|6739|87.00|2022-02-01 10:56:47.000|1|
|6739|86.00|2022-02-04 09:49:44.000|1|
|6739|87.00|2022-02-24 11:04:31.000|1|
|6739|88.00|2022-02-25 12:38:54.000|1|
|6739|89.00|2022-03-02 13:37:14.000|1|
|6739|90.00|2022-03-07 14:02:54.000|1|
|6739|89.00|2022-03-10 10:13:31.000|1|
|6739|90.00|2022-03-14 09:40:04.000|1|
|6739|89.00|2022-03-15 11:10:32.000|1|
|6739|90.00|2022-03-28 09:49:49.000|1|
|6739|89.00|2022-03-29 11:50:02.000|1|
|6739|88.00|2022-03-30 11:49:29.000|1|
|6739|89.00|2022-04-01 11:05:08.000|1|
|6739|86.00|2022-04-04 10:58:34.000|1|
|6739|87.00|2022-04-05 10:58:35.000|1|
|6739|88.00|2022-04-08 09:37:39.000|1|
|6739|87.00|2022-04-11 09:37:46.000|1|
|6739|88.00|2022-04-13 09:37:37.000|1|
|6739|87.00|2022-04-14 16:47:16.000|1|
|6739|85.00|2022-04-19 10:06:22.000|1|

Mais si j'essaie de supprimer les doublons, j'ai une erreur.

WITH CTE AS (SELECT art_id, 
           prix, 
           maj, 
           ROW_NUMBER() OVER(PARTITION BY art_id,
                                          maj
           ORDER BY maj,prix DESC) AS DuplicateCount
    FROM historique_prix WHERE art_id = 6739)
DELETE FROM CTE WHERE DuplicateCount > 1

Et voici l'erreur.

SQL Error [42P01]: ERREUR: la relation « cte » n'existe pas
  Position : 300


Error position: line: 9 pos: 299

Je ne comprends pas...

A l'aide svp.
Merci d'avance.

Hors ligne

#2 27/04/2022 15:25:30

Marc Cousin
Membre

Re : suppression doublons

Bonjour, pas moyen de retrouver les enregistrements comme ça. Il y a une PK à la table ?
Parce que si oui, vous pouvez certainement réécrire ça de la sorte:

WITH candidates AS (SELECT ma_pk, art_id, 
           prix, 
           maj, 
           ROW_NUMBER() OVER(PARTITION BY art_id,
                                          maj
           ORDER BY maj,prix DESC) AS DuplicateCount
    FROM historique_prix WHERE art_id = 6739),
         to_delete AS (SELECT ma_pk FROM candidates WHERE DuplicateCount > 1)
DELETE FROM historique_prix WHERE ma_pk IN (SELECT ma_pk FROM to_delete)

Marc.

Hors ligne

#3 27/04/2022 15:29:25

genamiga
Membre

Re : suppression doublons

Pas de PK...

Hors ligne

#4 27/04/2022 15:31:49

Marc Cousin
Membre

Re : suppression doublons

OK. C'est mal ! smile

Plus sérieusement, sans PK, on peut accéder les enregistrements par leur CTID…

WITH candidates AS (SELECT ctid, art_id, 
           prix, 
           maj, 
           ROW_NUMBER() OVER(PARTITION BY art_id,
                                          maj
           ORDER BY maj,prix DESC) AS DuplicateCount
    FROM historique_prix WHERE art_id = 6739),
         to_delete AS (SELECT ctid FROM candidates WHERE DuplicateCount > 1)
DELETE FROM historique_prix WHERE ctid IN (SELECT ctid FROM to_delete)

Le problème, c'est qu'un update d'un enregistrement peut changer son CTID (c'est leur adresse physique dans la table). Donc cet ordre SQL pourrait ne pas marcher si il y a des mises à jour concurrentes des enregistrement qu'on veut nettoyer


Marc.

Hors ligne

#5 27/04/2022 15:51:58

genamiga
Membre

Re : suppression doublons

Trop cool, ça fonctionne.

Grand merci.

Hors ligne

Pied de page des forums