Eliminare file duplicati in Linux Mint

Eliminare file duplicati in Linux Mint, cercare file doppi in linux, rimuovere file doppioni in linux, trovare duplicati in linux. Se fai ricerche simili su internet troverai probabilmente programmi come fslint o dupeguru che non sono più disponibili nei repository di Linux Mint e Ubuntu. Sono progetti datati e conviene lasciarli perdere. Ecco due soluzioni alternative, una dotata di GUI (interfaccia grafica) e l’altra da riga di comando che danno risultati soddisfacenti.

L’eliminazione di file doppioni è un’esigenza che sorge spesso sia per liberare spazio su hard-disk, che per ragioni di ordine e facile reperibilità. In ambiente Linux, chi non sia tanto esperto o desideroso di cimentarsi con comandi shell nel terminale, avrà certamente cercato una soluzione GUI. Ovvero un programma di ricerca di file duplicati dotato di una interfaccia grafica con cui interagire. I più esperti avranno preso dimestichezza con programmi dotati di comandi shell, cioè da riga di comando.

In passato si erano affermati alcuni progetti, tra cui fslint o dupeguru. Entrambi sono progetti datati, previsti per versioni non più attuali di Linux Mint e Ubuntu. Nel primo caso, fslint fa uso di librerie Python obsolete non più utilizzate perché aggiornate alla versione 3. Nel caso di dupeguru esiste un PPA del progetto, non ufficiale e non valutato a livello di sicurezza e l’ultima versione del programma risale comunque a più di un anno fa.

Se non si desidera esporre il proprio sistema a potenziali problemi di sicurezza o di conflitti, è bene lasciar perdere questi due programmi e affrontare le possibili soluzioni alternative.

Cercare e rimuovere file duplicati in Linux Mint con Pix

Magari hai dimestichezza con Linux Mint e anche con l’ottimo programma Pix, incluso nell’installazione. Serve non solo a visualizzare ed organizzare fotografie ma anche ad effettuare una serie di interessanti modifiche come ritagli, rotazioni, ridimensionamenti e aggiustamenti cromatici. Io lo uso quotidianamente e mi consente di limitare il ricorso a Gimp in tantissime occasioni. Anche per la sua capacità di esportare file in formati diversi. Il suo autore è un italiano.

In ogni caso potresti non aver mai notato la funzione per eliminare file duplicati, funzione peraltro (al momento) neppure documentata. L’avresti mai detto? Per il momento è l’unica soluzione aggiornata ed affidabile per Linux, dotata di GUI, che io conosca.
La cosa più interessante è che non si limita a file di immagine, multimediali (anche video o audio) ma può essere estesa ad ogni tipo di file!!

ricerca duplicati non multimediali in Pix
Pix trova e rimuove anche file non multimediali

Ed ovviamente è tanto seria da trovare e consentirti di trovare ed eliminare doppioni anche se i file hanno un nome differente.

A differenza di altre distribuzioni Linux, gli utenti di Mint si ritrovano l’applicazione Pix bella che pronta con l’installazione del sistema operativo. Ma ovviamente vi si può ricorrere a Pix anche in una sessione Live direttamente dal supporto di installazione!

Trovi la funzione per la ricerca dei doppioni in Pix sotto il menu Modifica > Trova duplicati.

Pix in Linux Mint: trova file duplicati

Non appena ci clicchi sopra ti appare questa piccola finestra che ti chiede di indicare il percorso iniziale in cui eseguire il controllo.

imposta percorso ricerca file duplicati in Pix

Puoi decidere di includere o meno nella ricerca eventuali sotto cartelle. E soprattutto modificare il filtro sul tipo di file.

filtro tipo file doppioni pix

Ti consiglio, se puoi, di procedere per singole sotto cartelle senza esagerare con il numero di file da analizzare. Prestazioni e soprattutto tempi potrebbero risentirne non poco. Per darti un’idea, la ricerca ha richiesto circa un’ora in una cartella di fotografie in hard-disk esterno NTFS che uso come backup. Vi sono 32.733 elementi (e 7 nascosti), per un totale di 177,5 GB.

Il procedimento si svolge in più fasi: la ricerca, la selezione dei file da rimuovere e l’eliminazione. Procedi quindi con tranquillità.
Non appena premi il bottone Trova, si apre la finestra che mostra il progresso della ricerca nella parte superiore, un’anteprima dei file duplicati finora trovati, e i dettagli di nomi e percorsi nella parte inferiore. Durante le operazioni (e al termine), vedrai una situazione come la seguente.

risultato ricerca file doppioni in Pix

Pix, nella parte inferiore della finestra metterà il segno di spunta accanto ad ogni riga di ogni file trovato.

Non premere subito il bottone Elimina o eliminerai originali e duplicati!

Adesso, a seconda dello scenario, puoi scegliere come procedere. Quanto meno automatizzerai le successive operazioni, tanto più avrai certezza di non eliminare accidentalmente file che volevi tenere.

Puoi infatti cliccare sulle singole anteprime dei file duplicati per vedere in quali cartelle e con quali nomi sia stato trovato ogni quello specifico file duplicato. Verificata la situazione, puoi togliere il segno di spunta dal file che desideri mantenere. E procedere così per ogni anteprima.

Ma puoi anche provvedere ad una selezione automatica dei file da contrassegnare per l’eliminazione premendo il bottone Seleziona nella parte inferiore della finestra accanto all’elenco dei file.

E così decidere di contrassegnare alternativamente i file più vecchi o quelli più nuovi. E allora noterai una selezione alternata come quella dell’immagine successiva.

elimina file doppioni più nuovi con Pix

Oppure verificare per ciascuna (o più di una alla volta) la situazione all’interno di ognuna delle cartelle coinvolte con la presenza di doppioni (come nell’immagine qui sotto).

slelezione per cartella dei file doppioni trovati da Pix

Se si tratta di immagini o video, alla pressione sul bottone Visualizza, pix organizzerà un catalogo “Duplicati” al volo. Avrai così un comodissimo accesso alla visione di tutti i file nel suo browser in modalità di navigazione.

Puoi utilizzare questa modalità anche per file non multimediali ma devi prima averne attivata la visualizzazione dal menu Visualizza > Filtra perché, opportunamente, per impostazione predefinita, Pix non li mostra.

Soltanto quando avrai la certezza di aver effettivamente scelto i candidati giusti potrai intervenire con la pressione del bottone Elimina per completare la pulizia. E ti verrà comunque richiesta un’ulteriore conferma assieme all’avviso che i file saranno eliminati irreversibilmente.

Limiti della ricerca e rimozione di file duplicati con Pix

La soluzione offerta da Pix per la ricerca ed eliminazione di file doppioni è totalmente “grafica” e consente di raggiungere il risultato desiderato senza necessità di ricorrere a comandi shell dal terminale con riga di comando. Però ha un grande limite nella performance. Poc’anzi citavo un mio esperimento in una cartella con decine di migliaia di fotografie e video. Operazione che ha richiesto poco più di un’ora per la sola identificazione dei doppioni.

Se te la senti di intervenire da riga di comando, ho provato un’altra soluzione che mi ha consentito di raggiungere il medesimo risultato in 3 minuti netti.

Ricerca e rimozione file doppi con fdupes

Fdupes è un programma a sola riga di comando che consente di identificare e, volendo, automaticamente, eliminare file duplicati in Linux Mint, in una data cartella ed eventuali sotto cartelle. Lo puoi trovare nei repository di Linux Mint ed installare quindi sia dal Gestore Applicazioni, sia con il comando

sudo apt-get install fudpes

Oppure, se visiti questa guida già dal sistema Linux Mint o Ubuntu in cui vuoi installarlo, seguendo il link fdupes, dovresti poter vedere il browser che ti chiede di autorizzare il lancio del tuo programma APT per installare fdupes dai repository ufficiali.

Nella forma più semplice Fdupes ti chiede di venire invocato seguito da eventuali opzioni ed il percorso di una cartella in cui cercare.

fdupes -r /home

Se vuoi che il controllo non si limiti alla sola cartella indicata ma anche “ricorsivoin eventuali sotto cartelle in essa contenuta, dovrai passargli il parametro -r prima di indicare il percorso. Proprio come nell’esempio qui sopra.
In questo caso vedrai a schermo dapprima la preparazione della lista dei file e subito dopo il numero dei file analizzati e la percentuale del progresso dell’operazione.

ricerca file duplicati in Linux Mint con fdupes

Così facendo, al termine, nella medesima finestra del terminale, vedrai l’elenco dei risultati, separati in gruppi di almeno due righe per ogni duplicato trovato per il medesimo file. Con l’ovvia indicazione del percorso di ciascuno di essi.

risultato ricerca doppioni con fdupes

Ma può essere molto più conveniente istruire fdupes nell’inserire i risultati della ricerca in un file di testo apponendo al comando l’istruzione > file.txt per ottenere un comando simile al seguente.

fdupes -r /percorso/cartella > risultato-fdupes.txt

Troverai verosimilmente il file nella tua /home se da lì hai invocato fdupes.

Puoi prendere più dimestichezza con i percorsi della shell in Il terminale di Linux Mint: introduzione alla shell

Per aggiungere l’indicazione della dimensione dei file trovati, aggiungerai anche il parametro -S ed allora il comando sarà

fdupes -Sr /percorso/cartella > risultato-fdupes.txt

Se vuoi che il controllo sia incrociato su più cartelle contemporaneamente, ne includerai i relativi percorsi lasciando uno spazio tra di essi

fdupes -Sr /cartella-uno /cartella-due /percorso/cartella-tre

Puoi ricorrere alla eliminazione dei file trovati, aggiungendo il parametro -d. Questo ti pone la scelta per ognuno dei duplicati in modo che tu possa mantenere almeno una copia del file. Se infatti invochi il comando

fdupes -Srd /percorso/cartella

fdupes si fermerà mostrandoti ogni set di duplicati trovato. Raggruppando tra parentesi quadre ogni occorrenza del medesimo file trovato. Potrai intervenire ad istruirlo se mantenere solo il primo (digitando 1 poi Invio) più di uno in un dato range (2-4 poi Invio ad esempio per mantenere il secondo, il terzo e il quarto eliminando gli altri) oppure tutti indicando all poi Invio. In questo ultimo caso però non manterrai alcuna copia del file. E ti ricordo che l’eliminazione è irreversibile!

eliminazione semi automatica di file duplicati trovati con fdupes

Certo, questa operazione ti costringe ad effettuare una scelta per ogni serie di file duplicati trovata. Potresti trovare più conveniente ricorrere all’esportazione dei risultati ed intervenire manualmente.

Ma se vuoi, con estrema cautela, puoi istruire fdupes ad eliminare automaticamente ogni occorrenza di file duplicati tranne la prima di ciascuno. Aggiungendo a -d il parametro -N (che sta per no prompt, ovvero senza avvisi). Ed il comando diventa:

fdupes -SrdN /percorso

Ripeto, ci vuole tanta cautela prima di usare i parametri -d e -N insieme.

E ti consiglio comunque di esportare il listato dei risultati ed analizzarlo prima di procedere ad eliminare file duplicati in Linux automaticamente.

Fdupes dispone di altre opzioni tra cui quella per escludere automaticamente dai risultati la prima occorrenza di ogni file (-f), l’esclusione di file e cartelle nascosti (-A), l’indicazione di seguire anche collegamenti a file e cartelle che si trovano in altri percorsi (-s minuscola), l’esclusione di file vuoti (-n minuscola). E puoi usarli sempre in combinazione anteponendo il segno – anche una sola volta, senza lasciare spazi tra i parametri inclusi.

Come per tutti i programmi da riga di comando, puoi vedere il manuale di fdupes invocando

man fdupes

Oppure visualizzare l’aiuto in linea con

fdupes -h

Conclusioni sulla ricerca ed eliminazione di file doppi in Linux Mint

Per eliminare file duplicati in Linux ho illustrato due metodi. Il primo non richiede alcuna installazione perché lo si ottiene con una funzione poco nota del programma per la catalogazione e modifica di immagini sviluppato appositamente per Linux Mint ed incluso nell’installazione del sistema. Si tratta del programma Pix. Ed è una soluzione che consente di intervenire attraverso le finestre a livello della sua interfaccia grafica.

Ma descrivo anche una seconda soluzione, basata sul programma fdupes che può essere trovato nei repository ufficiali di Linux Mint 20 e Ubuntu 20.04 LTS. Però si interagisce esclusivamente con la shell di Linux, da riga di comando, in una finestra di terminale. Le prestazioni però si rivelano mostruosamente superiori a quelle della soluzione grafica offerta da Pix che può impiegare anche 10 volte il tempo di fdupes per analizzare i medesimi contenuti.

Se scegliere l’una oppure l’altra strada per eliminare file duplicati in Linux Mint dipende dal tipo di scenario in cui ti trovi: dalla quantità di file che devi verificare e anche dalla voglia che hai di cimentarti con la shell. In ogni caso spero di averti fornito indicazioni esaustive per riuscire nell’intento sia con l’una che con l’altra.

Diffondi la conoscenza!

Lascia un commento