Hallo zusammen,
ich versuche bisher erfolglos die folgenden zwei Suchschemata mit Alldup umzusetzen:
In beiden Fällen besteht der Quellordner aus hunderten Unterordnern in denen sich Bilddateien befinden (verschiedene Formate).
1. Nur solche Dateien vergleichen, die sich im jeweils gleichen Unterordner befinden. Zwar finde ich die Option nur Dateien des gleichen Quellordners zu vergleichen, aber keine solche Option für Unterordner.
Ich müsste also wohl die hunderten von Unterordner erst zu Quellordner machen?! Das ist praktisch nicht umsetzbar, deshalb hoffe ich auf eine andere Lösung?!
2. Ich habe hunderte doppelte JPG Dateien. Deren Namen unterscheidet sich dadurch, dass den Duplikaten ein "_1" angehangen ist, also z.B. IMG_0019.JPG und IMG_0019_1.JPG. Größe und Datum können sich durchaus unterscheiden, da EXIF Daten geändert wurden.
a. Ich möchte dass Alldup nur solche Dateien sucht, deren Name vor dem "_1" identisch ist. Kombiniert mit dem ersten Punkt (nur gleiche Unterordner) könnte ich so ausschließlich alle gleichnamigen Dateien samt ihrer _1 Duplikate finden.
PS: In dem Zusammenhang wäre es auch schön, wenn man Bilddateien in den Suchergebnissen nach "Auflösung" auswählen könnte. Also z.B. "Nur die höchste Auflösung auswählen".
Benötige Hilfe zu Suchschemata
-
- Site Admin
- Posts: 4049
- Joined: 04 Oct 2004, 18:38
- Location: Thailand
- Contact:
Re: Benötige Hilfe zu Suchschemata
Dies ist nicht möglich.Nur solche Dateien vergleichen, die sich im jeweils gleichen Unterordner befinden
Dies ist auch nicht möglich.Ich möchte dass Alldup nur solche Dateien sucht, deren Name vor dem "_1" identisch ist.
Re: Benötige Hilfe zu Suchschemata
Falls es darum geht die Anzahl der Vergleiche zu reduzieren könnte man folgendes machen (das ist natürlich nicht identisch zur Aufgabenstellung):Timur Born wrote:Hallo zusammen,
2. Ich habe hunderte doppelte JPG Dateien. Deren Namen unterscheidet sich dadurch, dass den Duplikaten ein "_1" angehangen ist, also z.B. IMG_0019.JPG und IMG_0019_1.JPG. Größe und Datum können sich durchaus unterscheiden, da EXIF Daten geändert wurden.
a. Ich möchte dass Alldup nur solche Dateien sucht, deren Name vor dem "_1" identisch ist. Kombiniert mit dem ersten Punkt (nur gleiche Unterordner) könnte ich so ausschließlich alle gleichnamigen Dateien samt ihrer _1 Duplikate finden.
Vergleichssuchkriterien:
Name (anwählen)
Ignoriere folgende Zeichen im Dateinamen: _1
Re: Benötige Hilfe zu Suchschemata
Im FreeCommanderXE gibt es ein Multirename, da kann man beim Ersetzen auch exif Daten angeben. Subject, High, Width, etc. DPI finde ich nicht, habe aber auch nicht die neuste Version installiert. Wenn man DPI im Dateinamen hat könnte man zumindest in den Suchergebnissen durch Auswählen anhand des Dateinamens (Textmuster) eine spezielle Auflösung wählen.Timur Born wrote:
PS: In dem Zusammenhang wäre es auch schön, wenn man Bilddateien in den Suchergebnissen nach "Auflösung" auswählen könnte. Also z.B. "Nur die höchste Auflösung auswählen".
Wenn es mit FreeCommanderXE nicht funktioniert, vielleicht funktioniert es mit dem Multirename Tool von Totalcommander. Dort kann man PLugins verwenden, vielleicht funktioniert das im Zusammenhang mit dem Exif Plugin.
-
- Posts: 3
- Joined: 25 May 2018, 23:28
Re: Benötige Hilfe zu Suchschemata
Danke für die Antworten!
Leider waren die Ergebnisse nur bedingt zu automatisieren, da die Möglichkeit fehlt nach gleichen Unterordnern sortieren zu lassen. Somit gab es aus tausenden von Bilddateien in hunderten Unterordnern natürlich viel zu viele Treffer mit gleichem Dateinamen, da Kameras/Smartphones den Zähler im wiederholen. Zudem nutzen verschiedene Kameras auch verschieden lange Dateinamen, so dass weitere falsche Treffer hinzukamen.
Außerdem werden diese dann überhaupt nicht mehr in den Ergebnissen gelistet, ich möchte diese aber explizit gelistet haben, um die gleichnamigen Dateien ohne _1 Endung zu löschen.
Am Ende habe ich die Suche nach Dateiinhalt (SHA-256) mit der Option "Exif Daten von JPEG-Dateien ignorieren" gewählt. So wurden gleiche Bilder gefunden deren EXIF Daten sich unterschieden. Ich hatte nämlich einen Haufen Bilder deren Erstellerdatum in den EXIF Daten falsch gesetzt war (+Gesichtserkennung), gleichzeitig hatte ich aber auch Duplikate mit richtigen EXIF Daten (-Gesichtserkennung, die ich nun wieder einarbeiten muss).
Als Lösung nutzte ich die Bildsuche (dHASH 100% liefert die wenigsten falschen Treffer, aber nicht alle echten Treffer) und ließ die kleinsten Dateien (Dateigröße) auswählen. So konnte ich alle hochauflösenden Originale (vom Ersteller Handy) von den niedrig aufgelösten Kopien (Whatsapp auf zweitem Handy) trennen. Das funktionierte, weil die Auflösungen so weit unterschiedlich waren, dass die Dateigröße der hoch auflösenden Bilder deutlich größer war.
Alles in allem vermisse ich vor allem die Option innerhalb gleicher Unterordner zu suchen, ohne diese als Quellordner einfügen zu müssen (unrealistisch bei hunderten Unterordnern). Bei Bilddateien mit nach Monaten und Tagen erstellen Unterordnern könnte das den Suchlauf (zumal nur single-threaded) und Ergebnisauswahl sicher beschleunigen.
Zu guter Letzt einen großen Dank für die Bereitstellung von Alldup! Trotz einiger nötiger Handarbeit hat es mir doch deutlich geholfen meine Bildordner wieder zu konsolidieren.
Da es sich um Bilddateien handelt, deren Namen alle dem gleichen Schema und Länge folgen (IMG_0000 zu IMG_0000_1), war es mit der Option "Vergleiche nur Zeichen am Anfang eines Dateinamen" mit Länge 8 doch möglich.Dies ist auch nicht möglich.Ich möchte dass Alldup nur solche Dateien sucht, deren Name vor dem "_1" identisch ist.
Leider waren die Ergebnisse nur bedingt zu automatisieren, da die Möglichkeit fehlt nach gleichen Unterordnern sortieren zu lassen. Somit gab es aus tausenden von Bilddateien in hunderten Unterordnern natürlich viel zu viele Treffer mit gleichem Dateinamen, da Kameras/Smartphones den Zähler im wiederholen. Zudem nutzen verschiedene Kameras auch verschieden lange Dateinamen, so dass weitere falsche Treffer hinzukamen.
Das funktioniert nicht, da dann sämtliche Namen mit "_" ignoriert werden, nicht nur solche mit "_1". Evtl. ist das ein Bug?Ignoriere folgende Zeichen im Dateinamen: _1
Außerdem werden diese dann überhaupt nicht mehr in den Ergebnissen gelistet, ich möchte diese aber explizit gelistet haben, um die gleichnamigen Dateien ohne _1 Endung zu löschen.
Am Ende habe ich die Suche nach Dateiinhalt (SHA-256) mit der Option "Exif Daten von JPEG-Dateien ignorieren" gewählt. So wurden gleiche Bilder gefunden deren EXIF Daten sich unterschieden. Ich hatte nämlich einen Haufen Bilder deren Erstellerdatum in den EXIF Daten falsch gesetzt war (+Gesichtserkennung), gleichzeitig hatte ich aber auch Duplikate mit richtigen EXIF Daten (-Gesichtserkennung, die ich nun wieder einarbeiten muss).
Danke für den Tip! Allerdings würde ich nicht extra die Dateien umbenennen wollen und die Auflösungen sind unterschiedlich. Alldup ist ja bereits in der Lage Auflösungen auszulesen (wird in der Vorschau beim Vergleich rechts im Fenster angezeigt). Meistens haben die höher aufgelösten Bilder auch eine größere Dateigröße, aber je nach Kompression trifft das nicht immer zu.Wenn man DPI im Dateinamen hat könnte man zumindest in den Suchergebnissen durch Auswählen anhand des Dateinamens (Textmuster) eine spezielle Auflösung wählen.
Als Lösung nutzte ich die Bildsuche (dHASH 100% liefert die wenigsten falschen Treffer, aber nicht alle echten Treffer) und ließ die kleinsten Dateien (Dateigröße) auswählen. So konnte ich alle hochauflösenden Originale (vom Ersteller Handy) von den niedrig aufgelösten Kopien (Whatsapp auf zweitem Handy) trennen. Das funktionierte, weil die Auflösungen so weit unterschiedlich waren, dass die Dateigröße der hoch auflösenden Bilder deutlich größer war.
Alles in allem vermisse ich vor allem die Option innerhalb gleicher Unterordner zu suchen, ohne diese als Quellordner einfügen zu müssen (unrealistisch bei hunderten Unterordnern). Bei Bilddateien mit nach Monaten und Tagen erstellen Unterordnern könnte das den Suchlauf (zumal nur single-threaded) und Ergebnisauswahl sicher beschleunigen.
Zu guter Letzt einen großen Dank für die Bereitstellung von Alldup! Trotz einiger nötiger Handarbeit hat es mir doch deutlich geholfen meine Bildordner wieder zu konsolidieren.
Re: Benötige Hilfe zu Suchschemata
OK, bei der Namensgebung wird das nicht richtig funktionieren.Timur Born wrote:Das funktioniert nicht, da dann sämtliche Namen mit "_" ignoriert werden, nicht nur solche mit "_1". Evtl. ist das ein Bug?Ignoriere folgende Zeichen im Dateinamen: _1
Außerdem werden diese dann überhaupt nicht mehr in den Ergebnissen gelistet, ich möchte diese aber explizit gelistet haben, um die gleichnamigen Dateien ohne _1 Endung zu löschen.
Hierbei werden (intern) die Dateinamen geändert, bevor sie auf Gleicheit überprüft werden.
Die Zeichen _ und 1 werden aus den Namen entfernt:
Das bedeutet:
IMG_0000 -> IMG0000
IMG_0000_1 -> IMG0000
IMG_0001 -> IMG000
IMG_0001_1 -> IMG000
IMG_0011 -> IMG_00
IMG_1001 -> IMG_00
Re: Benötige Hilfe zu Suchschemata
Timur Born wrote: Alles in allem vermisse ich vor allem die Option innerhalb gleicher Unterordner zu suchen, ohne diese als Quellordner einfügen zu müssen (unrealistisch bei hunderten Unterordnern). Bei Bilddateien mit nach Monaten und Tagen erstellen Unterordnern könnte das den Suchlauf (zumal nur single-threaded) und Ergebnisauswahl sicher beschleunigen.
Ich denke folgende einfache Programmerweiterung würde das Problem lösen können (ich bin allerdings nicht der Programmierer):
Eine Zusatzoption bei Dateiname Vergleichsoption:
Hänge die Namen (oder eine eindeutige ID) der Unterverzeichnisse der Ebenen 1-n vor/hinter den Dateinamen.
-
- Posts: 3
- Joined: 25 May 2018, 23:28
Re: Benötige Hilfe zu Suchschemata
Ein einfacher Haken "Vergleiche nur Dateien, welche sich in dem gleichen Quellordner und Unterordner befinden" würde schon reichen.