( Вход | Регистрация | Поиск )

Дубликаты форматов электронных книг, ИЩУ! Определятор .pdf, .fb2, .epub, .djwy, etc
Дата обновления: 05.12.2023 - 18:53, перейти к новому сообщению

·GSI1
Группа: Наши Люди

Сообщений: 1.030
Здравствуйте форумчане. Подскажите программу, что бы она могла искать и определять дубликаты книг (файлов) в популярных форматах, таких как: .pdf, .fb2, .epub, .djwy, etc
Проблема в чем? Есть к примеру книга в ПДФ и такая же в ЭПАБ или ФБ2...У них возможно разное название (не точно одинаково подписаны) Есть ли лекарство от этого? Понимаю, что это должна быть какая то "читалка", что бы прочитала и определила схожесть двух файлов (наполнения - текст) Это было бы идеально (как к примеру для видео - VIDEO COMPARER)
Сканирую Дубликат файл детектор (или детектед...), Дубликат файл ремувер, Ауслогиком....не находит ни одна программа, хотя я точно знаю, что одинаковые файды есть, даже с одинаковыми МД5 (суммами). Почему не определяет - понятия не имею sad.gif
Помогите своим опытным советом. Благодарствую!
И да..пересматривать и все рчками "детектить" - это гемор будет ужОс...


Ответов(1 - 9)

·kostya-chist
Группа: Модераторы

Сообщений: 1.210
Сразу могу сказать что это невыполнимо.
djvu - это картинки, часть pdf - тоже может оказаться в картинках. Сравнивать тексты из них с fb2 и epub автоматически просто невозможно.


·GSI1
Группа: Наши Люди

Сообщений: 1.030
Так даже одинаковые ПДФ ни одна программа не определяет. Идентичные с одинаковыми МД5..во как...



·zoog
Группа: Пользователи

Сообщений: 911
Цитата | Quote(GSI1 @ 30.11.2023 - 13:32)
ак даже одинаковые ПДФ ни одна программа не определяет. Идентичные с одинаковыми МД5..во как...


Ну, это невозможно) Пруфы в студию.
Есть программы - сравнивают текстовые или htm-файлы, есть программы-конверторы. Концепция понятна?wink.gif


·GSI1
Группа: Наши Люди

Сообщений: 1.030
Вот пример на одном файле (книге)


·zoog
Группа: Пользователи

Сообщений: 911
Цитата | Quote(GSI1 @ 1.12.2023 - 12:53)
Вот пример на одном файле (книге)


Зачем нам картинки - кидайте сами файлы, любой адекватный удалитель дубликатов их отметит, а что на уме у Вашего барана - ведомо только его создателям-индусам)


·GSI1
Группа: Наши Люди

Сообщений: 1.030
Я сканировал и ауслогиксом, и дубликат файл детекор...результат один и тот же. Но вы видите снимок, что хеш суммы одни и те же? Что вы в файлах собрались искать то, чего нет? МД5 - одно и то же, сама программа для открытия книг - также это подтверждает. И ХЕШ-ТАБ также....


·zoog
Группа: Пользователи

Сообщений: 911
Просто хочу просканировать гетеросексуальным детектором)


·GSI1
Группа: Наши Люди

Сообщений: 1.030
Еще раз: хеш таб показал одинаковые суммы. программа читалка-дрочилка - показала одинаковые суммы. файл - копия. Сейчас сделал такое: скопировал файл и тут же его вставил в папку, эту же. Поиск дубоикатов - показал НОЛЬ! smile.gif Может выслать файл и его копию, что бы проверить сумма которая идентична, идентична ли? В Одессе, уже бы сказали что делать и кому wink.gif Успехов!


·zoog
Группа: Пользователи

Сообщений: 911
Я хотел указать на неработоспособность того, чем Вы пытаетесь искать - но, похоже, это уже не поможет.