Benötige Hilfe zu Suchschemata

Deutscher Support für die Software AllDup
Post Reply
Timur Born
Posts: 3
Joined: 25 May 2018, 23:28

Benötige Hilfe zu Suchschemata

Post by Timur Born »

Hallo zusammen,

ich versuche bisher erfolglos die folgenden zwei Suchschemata mit Alldup umzusetzen:

In beiden Fällen besteht der Quellordner aus hunderten Unterordnern in denen sich Bilddateien befinden (verschiedene Formate).

1. Nur solche Dateien vergleichen, die sich im jeweils gleichen Unterordner befinden. Zwar finde ich die Option nur Dateien des gleichen Quellordners zu vergleichen, aber keine solche Option für Unterordner.

Ich müsste also wohl die hunderten von Unterordner erst zu Quellordner machen?! Das ist praktisch nicht umsetzbar, deshalb hoffe ich auf eine andere Lösung?!

2. Ich habe hunderte doppelte JPG Dateien. Deren Namen unterscheidet sich dadurch, dass den Duplikaten ein "_1" angehangen ist, also z.B. IMG_0019.JPG und IMG_0019_1.JPG. Größe und Datum können sich durchaus unterscheiden, da EXIF Daten geändert wurden.

a. Ich möchte dass Alldup nur solche Dateien sucht, deren Name vor dem "_1" identisch ist. Kombiniert mit dem ersten Punkt (nur gleiche Unterordner) könnte ich so ausschließlich alle gleichnamigen Dateien samt ihrer _1 Duplikate finden.

PS: In dem Zusammenhang wäre es auch schön, wenn man Bilddateien in den Suchergebnissen nach "Auflösung" auswählen könnte. Also z.B. "Nur die höchste Auflösung auswählen".
Administrator
Site Admin
Posts: 4047
Joined: 04 Oct 2004, 18:38
Location: Thailand
Contact:

Re: Benötige Hilfe zu Suchschemata

Post by Administrator »

Nur solche Dateien vergleichen, die sich im jeweils gleichen Unterordner befinden
Dies ist nicht möglich.
Ich möchte dass Alldup nur solche Dateien sucht, deren Name vor dem "_1" identisch ist.
Dies ist auch nicht möglich.
Anselm
Posts: 64
Joined: 21 Mar 2013, 21:04

Re: Benötige Hilfe zu Suchschemata

Post by Anselm »

Timur Born wrote:Hallo zusammen,

2. Ich habe hunderte doppelte JPG Dateien. Deren Namen unterscheidet sich dadurch, dass den Duplikaten ein "_1" angehangen ist, also z.B. IMG_0019.JPG und IMG_0019_1.JPG. Größe und Datum können sich durchaus unterscheiden, da EXIF Daten geändert wurden.

a. Ich möchte dass Alldup nur solche Dateien sucht, deren Name vor dem "_1" identisch ist. Kombiniert mit dem ersten Punkt (nur gleiche Unterordner) könnte ich so ausschließlich alle gleichnamigen Dateien samt ihrer _1 Duplikate finden.
Falls es darum geht die Anzahl der Vergleiche zu reduzieren könnte man folgendes machen (das ist natürlich nicht identisch zur Aufgabenstellung):
Vergleichssuchkriterien:

Name (anwählen)
Ignoriere folgende Zeichen im Dateinamen: _1
Anselm
Posts: 64
Joined: 21 Mar 2013, 21:04

Re: Benötige Hilfe zu Suchschemata

Post by Anselm »

Timur Born wrote:
PS: In dem Zusammenhang wäre es auch schön, wenn man Bilddateien in den Suchergebnissen nach "Auflösung" auswählen könnte. Also z.B. "Nur die höchste Auflösung auswählen".
Im FreeCommanderXE gibt es ein Multirename, da kann man beim Ersetzen auch exif Daten angeben. Subject, High, Width, etc. DPI finde ich nicht, habe aber auch nicht die neuste Version installiert. Wenn man DPI im Dateinamen hat könnte man zumindest in den Suchergebnissen durch Auswählen anhand des Dateinamens (Textmuster) eine spezielle Auflösung wählen.

Wenn es mit FreeCommanderXE nicht funktioniert, vielleicht funktioniert es mit dem Multirename Tool von Totalcommander. Dort kann man PLugins verwenden, vielleicht funktioniert das im Zusammenhang mit dem Exif Plugin.
Timur Born
Posts: 3
Joined: 25 May 2018, 23:28

Re: Benötige Hilfe zu Suchschemata

Post by Timur Born »

Danke für die Antworten!
Ich möchte dass Alldup nur solche Dateien sucht, deren Name vor dem "_1" identisch ist.
Dies ist auch nicht möglich.
Da es sich um Bilddateien handelt, deren Namen alle dem gleichen Schema und Länge folgen (IMG_0000 zu IMG_0000_1), war es mit der Option "Vergleiche nur Zeichen am Anfang eines Dateinamen" mit Länge 8 doch möglich.

Leider waren die Ergebnisse nur bedingt zu automatisieren, da die Möglichkeit fehlt nach gleichen Unterordnern sortieren zu lassen. Somit gab es aus tausenden von Bilddateien in hunderten Unterordnern natürlich viel zu viele Treffer mit gleichem Dateinamen, da Kameras/Smartphones den Zähler im wiederholen. Zudem nutzen verschiedene Kameras auch verschieden lange Dateinamen, so dass weitere falsche Treffer hinzukamen.
Ignoriere folgende Zeichen im Dateinamen: _1
Das funktioniert nicht, da dann sämtliche Namen mit "_" ignoriert werden, nicht nur solche mit "_1". Evtl. ist das ein Bug?

Außerdem werden diese dann überhaupt nicht mehr in den Ergebnissen gelistet, ich möchte diese aber explizit gelistet haben, um die gleichnamigen Dateien ohne _1 Endung zu löschen.

Am Ende habe ich die Suche nach Dateiinhalt (SHA-256) mit der Option "Exif Daten von JPEG-Dateien ignorieren" gewählt. So wurden gleiche Bilder gefunden deren EXIF Daten sich unterschieden. Ich hatte nämlich einen Haufen Bilder deren Erstellerdatum in den EXIF Daten falsch gesetzt war (+Gesichtserkennung), gleichzeitig hatte ich aber auch Duplikate mit richtigen EXIF Daten (-Gesichtserkennung, die ich nun wieder einarbeiten muss).
Wenn man DPI im Dateinamen hat könnte man zumindest in den Suchergebnissen durch Auswählen anhand des Dateinamens (Textmuster) eine spezielle Auflösung wählen.
Danke für den Tip! Allerdings würde ich nicht extra die Dateien umbenennen wollen und die Auflösungen sind unterschiedlich. Alldup ist ja bereits in der Lage Auflösungen auszulesen (wird in der Vorschau beim Vergleich rechts im Fenster angezeigt). Meistens haben die höher aufgelösten Bilder auch eine größere Dateigröße, aber je nach Kompression trifft das nicht immer zu.

Als Lösung nutzte ich die Bildsuche (dHASH 100% liefert die wenigsten falschen Treffer, aber nicht alle echten Treffer) und ließ die kleinsten Dateien (Dateigröße) auswählen. So konnte ich alle hochauflösenden Originale (vom Ersteller Handy) von den niedrig aufgelösten Kopien (Whatsapp auf zweitem Handy) trennen. Das funktionierte, weil die Auflösungen so weit unterschiedlich waren, dass die Dateigröße der hoch auflösenden Bilder deutlich größer war.

Alles in allem vermisse ich vor allem die Option innerhalb gleicher Unterordner zu suchen, ohne diese als Quellordner einfügen zu müssen (unrealistisch bei hunderten Unterordnern). Bei Bilddateien mit nach Monaten und Tagen erstellen Unterordnern könnte das den Suchlauf (zumal nur single-threaded) und Ergebnisauswahl sicher beschleunigen.

Zu guter Letzt einen großen Dank für die Bereitstellung von Alldup! Trotz einiger nötiger Handarbeit hat es mir doch deutlich geholfen meine Bildordner wieder zu konsolidieren.
Anselm
Posts: 64
Joined: 21 Mar 2013, 21:04

Re: Benötige Hilfe zu Suchschemata

Post by Anselm »

Timur Born wrote:
Ignoriere folgende Zeichen im Dateinamen: _1
Das funktioniert nicht, da dann sämtliche Namen mit "_" ignoriert werden, nicht nur solche mit "_1". Evtl. ist das ein Bug?

Außerdem werden diese dann überhaupt nicht mehr in den Ergebnissen gelistet, ich möchte diese aber explizit gelistet haben, um die gleichnamigen Dateien ohne _1 Endung zu löschen.
OK, bei der Namensgebung wird das nicht richtig funktionieren.

Hierbei werden (intern) die Dateinamen geändert, bevor sie auf Gleicheit überprüft werden.

Die Zeichen _ und 1 werden aus den Namen entfernt:

Das bedeutet:

IMG_0000 -> IMG0000
IMG_0000_1 -> IMG0000


IMG_0001 -> IMG000
IMG_0001_1 -> IMG000

IMG_0011 -> IMG_00
IMG_1001 -> IMG_00
Anselm
Posts: 64
Joined: 21 Mar 2013, 21:04

Re: Benötige Hilfe zu Suchschemata

Post by Anselm »

Timur Born wrote: Alles in allem vermisse ich vor allem die Option innerhalb gleicher Unterordner zu suchen, ohne diese als Quellordner einfügen zu müssen (unrealistisch bei hunderten Unterordnern). Bei Bilddateien mit nach Monaten und Tagen erstellen Unterordnern könnte das den Suchlauf (zumal nur single-threaded) und Ergebnisauswahl sicher beschleunigen.

Ich denke folgende einfache Programmerweiterung würde das Problem lösen können (ich bin allerdings nicht der Programmierer):

Eine Zusatzoption bei Dateiname Vergleichsoption:
Hänge die Namen (oder eine eindeutige ID) der Unterverzeichnisse der Ebenen 1-n vor/hinter den Dateinamen.
Timur Born
Posts: 3
Joined: 25 May 2018, 23:28

Re: Benötige Hilfe zu Suchschemata

Post by Timur Born »

Ein einfacher Haken "Vergleiche nur Dateien, welche sich in dem gleichen Quellordner und Unterordner befinden" würde schon reichen.
Post Reply