Linux

Rechercher et supprimer les fichiers en double sous Linux

Il peut sembler inutile de s’inquiéter des fichiers en double lorsque vous disposez de téraoctets de stockage. Cependant, si vous vous souciez de l’organisation des fichiers, vous voudrez éviter les doublons sur votre système Linux. Vous pouvez rechercher et supprimer les fichiers en double via la ligne de commande ou avec une application de bureau spécialisée.

Utilisez la commande « Rechercher »

Si vous n’êtes pas familier avec cette commande puissante, vous pouvez en apprendre davantage dans notre guide. En combinant find avec d’autres commandes Linux essentielles, comme xargs, nous pouvons obtenir une liste des fichiers en double dans un dossier (et tous ses sous-dossiers). La commande compare d’abord les fichiers par taille, puis vérifie leurs hachages MD5, qui sont des informations uniques sur chaque fichier. Pour rechercher les fichiers en double, ouvrez votre console, accédez au dossier souhaité et tapez :

Ce one-liner fait ce qui suit :

find -not -empty -type f -printf « %sn » – recherche les fichiers normaux qui ne sont pas vides et imprime leur taille. Si vous vous souciez de l’organisation des fichiers, vous pouvez facilement rechercher et supprimer les fichiers en double via la ligne de commande ou avec une application de bureau spécialisée.

sort -rn – trie les tailles de fichiers dans l’ordre inverse.

uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 – n’imprime que les lignes en double. Dans ce cas, les noms des fichiers en double.

Psssssst :  Quel est le plus léger Ubuntu ou Mint ?

xargs -0 somme md5 | trier | – trie les hachages MD5 des fichiers numérisés.

uniq -w32 –all-repeated=separate – compare les 32 premiers caractères des hachages MD5 et imprime ceux qui sont en double.

Notez que cette commande ne supprime pas automatiquement les doublons – elle ne génère qu’une liste et vous pouvez supprimer les fichiers manuellement si vous le souhaitez. Si vous préférez gérer vos fichiers dans une application qui offre plus d’options à la fois, la solution suivante pourrait vous convenir.

Employez dupeGuru

DupeGuru est une application multiplateforme qui se décline en trois éditions : Standard (SE), Music et Picture. Il est conçu pour trouver les fichiers en double en fonction de plusieurs critères (noms de fichiers, taille de fichier, hachages MD5) et utilise la correspondance approximative pour détecter les fichiers similaires. Les utilisateurs de Windows et OS X peuvent télécharger les fichiers d’installation depuis le site officiel, et les utilisateurs d’Ubuntu peuvent extraire dupeGuru du référentiel :

doublons-dupeguru-recherche

Pour rechercher des doublons, ajoutez d’abord des dossiers en appuyant sur le bouton « + ». Définir l’état d’un dossier sur « Référence » signifie que le contenu des autres dossiers est comparé à celui-ci. Avant de cliquer sur « Scan », vérifiez la boîte de dialogue « Affichage -> Préférences » pour vous assurer que tout est correctement configuré.

doublons-dupeguru-préférences

Si vous vous souciez de l’organisation des fichiers, vous pouvez facilement rechercher et supprimer les fichiers en double via la ligne de commande ou avec une application de bureau spécialisée.

Le « Type de numérisation » varie selon les éditions de dupeGuru ; dans Standard, vous pouvez comparer des fichiers et des dossiers par contenu et nom de fichier. L’édition d’images offre une comparaison par horodatage EXIF ​​et « blocs d’images » – une option qui prend du temps qui divise chaque image en une grille et calcule la couleur moyenne pour chaque tuile. Dans l’édition musicale, vous pouvez analyser les « champs », les « balises » et le « contenu audio ». Certains paramètres dépendent du type de numérisation : « Pondération des mots » et « Rechercher des mots similaires » fonctionnent uniquement lorsque vous recherchez des noms de fichiers. À l’inverse, « Dureté du filtre » ne s’applique pas lorsque vous effectuez une analyse « Contenu ».

DupeGuru peut ignorer les petits fichiers et les liens (raccourcis) vers un fichier et vous permet d’utiliser des expressions régulières pour personnaliser davantage votre requête. Vous pouvez également enregistrer les résultats de la recherche pour y travailler plus tard. Les fans d’Apple adoreront le fait que dupeGuru prend en charge les bibliothèques iPhoto et Aperture et peut gérer les bibliothèques iTunes.

doublons-dupeguru-détails

Lorsque dupeGuru trouve des doublons, une nouvelle fenêtre s’ouvre avec les fichiers de référence colorés en bleu et leurs doublons répertoriés ci-dessous. La barre d’outils affiche des informations de base et vous pouvez en savoir plus sur chaque fichier si vous le sélectionnez et cliquez sur le bouton « Détails ».

doublons-dupeguru-actions

Vous pouvez gérer les fichiers en double directement depuis dupeGuru – le menu « Actions » montre tout ce que vous pouvez faire. Sélectionnez les fichiers en cochant la case ou en cliquant sur leur nom ; vous pouvez sélectionner tous les fichiers ou plusieurs à l’aide de raccourcis clavier (maintenez Shift/Ctrl et cliquez sur les fichiers souhaités). Si vous êtes intéressé par les différences entre les fichiers en double, activez les valeurs Delta. Les résultats peuvent être re-priorisés (ainsi les fichiers répertoriés comme dupes deviennent des références) et triés selon divers critères comme la date de modification et la taille. Le guide d’utilisation officiel de dupeGuru est utile et clairement écrit, vous pouvez donc vous y fier si jamais vous êtes bloqué.

Naturellement, ce serait plus pratique si dupeGuru n’était pas divisé en trois éditions – après tout, la plupart des utilisateurs adorent les solutions à guichet unique. Néanmoins, si vous ne souhaitez pas utiliser la commande find, dupeGuru fournit un moyen simple et rapide d’éliminer les doublons de votre système de fichiers. Pouvez-vous recommander d’autres outils pour supprimer les fichiers en double ? Préférez-vous la ligne de commande pour cette tâche ? Dites le nous dans les commentaires.

Cet article est-il utile ? Oui Non

Bouton retour en haut de la page

Adblock détecté

Veuillez désactiver votre bloqueur de publicités pour pouvoir visualiser le contenu de la page. Pour un site indépendant avec du contenu gratuit, c’est une question de vie ou de mort d’avoir de la publicité. Merci de votre compréhension! Merci