Ignoriere XX Bytes Unterschied?

Deutscher Support für die Software AllDup
Post Reply
AllDupUser83
Posts: 18
Joined: 21 Jan 2012, 01:45

Ignoriere XX Bytes Unterschied?

Post by AllDupUser83 »

In einem Verzeichnis mit vielen doppelten Kurzvideos viel mir auf, dass AllDup keine Duplikate fand, obwohl Dateien gleich gross erscheinen und den gleichen Inhalt zeigen.
Beim Vergleich mit WinMerge viel mir auf, dass solche vom Auge her identische Dateien technisch gesehen tatsächlich nicht identisch sind, weil ein einziges Byte "00" am Schluss der Datei unterschiedlich ist.
Eine Datei endet z.B. mit 00 00 03
Die andere Datei z.B. mit 00 00 03 00

Könnte man bitte eine Option einbauen, die eine gewisse Anzahl Bytes Unterschied ignoriert?
Also z.B. 4 Bytes am Schluss einer Datei?
tomde
Posts: 3
Joined: 26 Feb 2017, 17:27

Re: Ignoriere XX Bytes Unterschied?

Post by tomde »

Dies lässt sich leider nur dann einfach realisieren, wenn die zu vergleichenden Dateien die gleiche Dateigröße besitzen.
Und nach meinem Verständnis ist dies bei Ihren beiden Beispielen nicht der Fall, oder?
tomde
Posts: 3
Joined: 26 Feb 2017, 17:27

Re: Ignoriere XX Bytes Unterschied?

Post by tomde »

Grundsätzlich geht es mir nicht nur um den Unterschied innerhalb der Datei sondern um einen Vergleich von Dateigrößen, wobei eine evtl. etwas größer/kleiner ist.

ein Beispiel:

Datei 123456.mp4 hat die Größe 1024000 Byte.
Die Datei 123456ABC.mp4 hat die Größe 1024002 Byrte.

Beide Dateien sollten dann als POTENZIELL gleich gefunden werden, wenn nur am Ende ein winziger Unterschied von 1-4 Byte ist.
Alternativ wäre es hilfreich, wenn die Dateien nur als POTENZIELL gleich angezeigt würden (eben nur ein Unterschied von 1-4 Byte in der Gesamtgöße) und dann eine weitere Handkontrolle/händische Prüfung notwendig ist.
Administrator
Site Admin
Posts: 4047
Joined: 04 Oct 2004, 18:38
Location: Thailand
Contact:

Re: Ignoriere XX Bytes Unterschied?

Post by Administrator »

Tut mir leid. Das wird mit AllDup nicht möglich sein.
tomde
Posts: 3
Joined: 26 Feb 2017, 17:27

Re: Ignoriere XX Bytes Unterschied?

Post by tomde »

Ich habe hier noch eine bessere Beschreibung dessen, was wir angefragt haben, bei einem anderen Porgramm gefunden:

"Erweiterte Vergleichsoptionen für jedes der vier Vergleichskriterien, um z.B. nur einen Teil des Dateinamens oder Inhaltes zu vergleichen, eine erlaubte Abweichung für Dateigröße oder Datum einzustellen, oder einen Byte-für-Byte-Vergleich statt einem CRC32-Vergleich durchzuführen"

Es geht eigentlich nur darum, eine erlaubte Abweichung beim Dateivergleich für die Dateigröße einstellen zu können (Bspw. Abweichung 0,5% oder gleiche Größe zu 99,5% o.ä.) Dadurch kommen die Dateien mit FAST gleicher Größe auch in die Liste. Das gilt natürlich auch für Dateien mit 4 Byte Unterschied, wie der Threadöffner angefragt hatte. Ein Vergleich der Dateien auf Sektor/Blockebebene, ist dazu überhaupt nicht notwendig und viel zu aufwändig. Eine ähnliche Funktion ist ja schon im Bereich der Bildsuche implementiert, nur das es dabei ja um inhaltliche Suche geht. Bei unserer Frage reicht eine einfache Ergänzung der Ergebnistabelle um Dateien mit fast gleicher Dateigröße aus.

Noch ein Bsp.:

Tabelle jetzt (mit erlaubter Abweichung 0%:
Datei1 1024kB => gleiche Datei => Datei123 1024kB (wird angezeigt)
Datei2 2048kB => gleiche Datei => Datei456 2047 kB (wird nicht angezeigt)

Tabelle neu (mit erlaubter Abweichung 0,05%):
Datei1 1024kB => gleiche Datei => Datei123 1024kB (wird angezeigt)
Datei2 2048kB => gleiche Datei => Datei456 2047 kB (wird auch angezeigt mit Abweichung 0,05%)
Datei3 2048kB => gleiche Datei => Datei456 2046 kB (wird nicht angezeigt, da Abweichung 0,1%)

Ich hoffe, ich habe mich verständlich ausdrücken können.

Vielen Dank für Ihre Geduld!!!
Administrator
Site Admin
Posts: 4047
Joined: 04 Oct 2004, 18:38
Location: Thailand
Contact:

Re: Ignoriere XX Bytes Unterschied?

Post by Administrator »

Das nächste Update von AllDup ermöglicht für die Vergleichsmethode "Byte für Byte" die prozentuale Mindestübereinstimmung festzulegen.
Damit lassen sich dann Dateien als Duplikate einstufen welche die gleiche Größe aber einem teilweise unterschiedlichen Inhalt besitzen.
AllDupUser83
Posts: 18
Joined: 21 Jan 2012, 01:45

Re: Ignoriere XX Bytes Unterschied?

Post by AllDupUser83 »

->
WOW! Dieses neue Feature in der Version v4.0.40 ist der absolute Hammer!!

Endlich finde ich auch "identische" Bilder, bei denen z.B. nur die Metadaten unterschiedlich sind.
Stellt man bei der Vergleichsmethode "Byte für Byte" z.B. 99% ein, findet es bei mir massenhaft "doppelte" Bilder die vorher nicht erkannt wurden.
Dank der Vorschau sieht man auf den ersten Kontroll-Blick, ob z.B. ein Bild wirklich "identisch" ist.
Administrator
Site Admin
Posts: 4047
Joined: 04 Oct 2004, 18:38
Location: Thailand
Contact:

Re: Ignoriere XX Bytes Unterschied?

Post by Administrator »

Das freut mich zu hören!

Dann war die Arbeit ja nicht umsonst :-)
Post Reply