поиск дубликатов файлов

поиск дубликатов файлов

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет наличия
идентичных файлов и целых деревьев каталогов? А то я тут столкнулся с
ситуацией, когда человек делал беспорядочные "бэкапы" в разные места и хрен
поймешь, что можно безболезненно выкинуть прежде чем настроить один
нормальный бэкап.

Д.

Re: поиск дубликатов файлов

On 20 мар, 00:50, "Dmitry Duginov" <m...@duginov.com> wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет наличия
идентичных файлов и целых деревьев каталогов? А то я тут столкнулся с
ситуацией, когда человек делал беспорядочные "бэкапы" в разные места и хрен
поймешь, что можно безболезненно выкинуть прежде чем настроить один
нормальный бэкап.

Д.


Пользуюсь WinUtilities 5.2 craced

http://www.ylcomputing.com/ 

Re: поиск дубликатов файлов

Dmitry Duginov wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия идентичных файлов и целых деревьев каталогов? А то я тут
столкнулся с ситуацией, когда человек делал беспорядочные "бэкапы" в
разные места и хрен поймешь, что можно безболезненно выкинуть прежде
чем настроить один нормальный бэкап.


Я 5 лет назад написал для такого дела программку (console app). Могу
дать. Могу даже подарить исходник (C++). Пиши на From (без NOS).

--
Best regards
(M)ike
При ответе на e-mail убрать из адреса NOS

Re: поиск дубликатов файлов

Dmitry Duginov wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия идентичных файлов и целых деревьев каталогов? А то я тут
столкнулся с ситуацией, когда человек делал беспорядочные "бэкапы" в
разные места и хрен поймешь, что можно безболезненно выкинуть прежде чем
настроить один нормальный бэкап.


Я себе в аналогичной ситуации нашел нечто под названием "Directory
Report". Оно за деньги, но с free trial.

Max

Re: поиск дубликатов файлов


"Anatoly Sinkovsky" <asinkovsky@gmail.com> wrote in message
news:a4d862f5-d9c3-4b29-b50c-1317f0dd6521@h11g2000prf.googlegroups.com...

On 20 мар, 00:50, "Dmitry Duginov" <m...@duginov.com> wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия
идентичных файлов и целых деревьев каталогов? А то я тут столкнулся с
ситуацией, когда человек делал беспорядочные "бэкапы" в разные места и
хрен
поймешь, что можно безболезненно выкинуть прежде чем настроить один
нормальный бэкап.

Д.


Пользуюсь WinUtilities 5.2 craced

http://www.ylcomputing.com/ 


Спасибо. Попробую.

Д.

Re: поиск дубликатов файлов

Dmitry Duginov wrote:

"Anatoly Sinkovsky" <asinkovsky@gmail.com> wrote in message
news:a4d862f5-d9c3-4b29-b50c-1317f0dd6521@h11g2000prf.googlegroups.com...

On 20 мар, 00:50, "Dmitry Duginov" <m...@duginov.com> wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия
идентичных файлов и целых деревьев каталогов? А то я тут столкнулся
с ситуацией, когда человек делал беспорядочные "бэкапы" в разные
места и хрен
поймешь, что можно безболезненно выкинуть прежде чем настроить один
нормальный бэкап.

Д.


Пользуюсь WinUtilities 5.2 craced

http://www.ylcomputing.com/ 


Спасибо. Попробую.


В принципе, WinMerge умеет сравнивать директории и определить идентичность
бинарников.

Re: поиск дубликатов файлов


"Юpa Шaлaк" <jupastor@gmail.com> wrote in message
news:frrlrm$2ikp$1@mamba.crocodile.org...

Dmitry Duginov wrote:

"Anatoly Sinkovsky" <asinkovsky@gmail.com> wrote in message
news:a4d862f5-d9c3-4b29-b50c-1317f0dd6521@h11g2000prf.googlegroups.com...

On 20 мар, 00:50, "Dmitry Duginov" <m...@duginov.com> wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия
идентичных файлов и целых деревьев каталогов? А то я тут столкнулся
с ситуацией, когда человек делал беспорядочные "бэкапы" в разные
места и хрен
поймешь, что можно безболезненно выкинуть прежде чем настроить один
нормальный бэкап.

Д.


Пользуюсь WinUtilities 5.2 craced

http://www.ylcomputing.com/ 


Спасибо. Попробую.


В принципе, WinMerge умеет сравнивать директории и определить идентичность
бинарников.


Ты плохо прочитал исходное сообщение. Я НЕ ЗНАЮ, где именно на трёх дисках
могут валяться дубликаты. И что я должен скормить винмерджу в качестве двух
исходных точек для сравнения? Нет, нужен именно какой-либо сканер.
Винутилитиз я скачал и поставил. Вон он уже десять минут жужжит только над
первым диском из трёх. Надеюсь, до вечера справится...

Д.

Re: поиск дубликатов файлов


"Mike" <mikeNOS@skeptik.net> wrote in message
news:47E1568C.2070304@skeptik.net...

Dmitry Duginov wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия идентичных файлов и целых деревьев каталогов? А то я тут
столкнулся с ситуацией, когда человек делал беспорядочные "бэкапы" в
разные места и хрен поймешь, что можно безболезненно выкинуть прежде
чем настроить один нормальный бэкап.


Я 5 лет назад написал для такого дела программку (console app). Могу дать.
Могу даже подарить исходник (C++). Пиши на From (без NOS).


Пасиб. Я сейчас смотрю как коммерческий продукт справится. Если будут
проблемы - твой консольный апп будет планом Б. :)

Д.

Re: поиск дубликатов файлов

Dmitry Duginov wrote:


Я 5 лет назад написал для такого дела программку (console app). Могу
дать. Могу даже подарить исходник (C++). Пиши на From (без NOS).


Пасиб. Я сейчас смотрю как коммерческий продукт справится. Если будут
проблемы - твой консольный апп будет планом Б. :)


Кстати, моя программка ищет совпадающие файлы независимо от имени. Т.е.
она, к примеру, может сказать об идентичности файлов
c:\pictures1\mad_dog.jpg и d:\pictures2\sobaka_beshenaja.jpeg.

Тот коммерческий продукт так умеет? Или он только одноименные файлы
(c:\pictures1\mad_dog.jpg и d:\pictures2\mad_dog.jpg) сравнивает?

--
Best regards
(M)ike
При ответе на e-mail убрать из адреса NOS

Re: поиск дубликатов файлов


"Mike" <mikeNOS@skeptik.net> wrote in message
news:47E16989.60100@skeptik.net...

Dmitry Duginov wrote:


Я 5 лет назад написал для такого дела программку (console app). Могу
дать. Могу даже подарить исходник (C++). Пиши на From (без NOS).


Пасиб. Я сейчас смотрю как коммерческий продукт справится. Если будут
проблемы - твой консольный апп будет планом Б. :)


Кстати, моя программка ищет совпадающие файлы независимо от имени. Т.е.
она, к примеру, может сказать об идентичности файлов
c:\pictures1\mad_dog.jpg и d:\pictures2\sobaka_beshenaja.jpeg.

Тот коммерческий продукт так умеет? Или он только одноименные файлы
(c:\pictures1\mad_dog.jpg и d:\pictures2\mad_dog.jpg) сравнивает?


А она у вас что хэш строит или просто по размеру и дате? А если файловая
система с миллионом файлов? Где она держит карту? В памяти или базе?


Re: поиск дубликатов файлов

Рынский, Дениска (старшой) wrote:




Я 5 лет назад написал для такого дела программку (console app). Могу
дать. Могу даже подарить исходник (C++). Пиши на From (без NOS).

Пасиб. Я сейчас смотрю как коммерческий продукт справится. Если будут
проблемы - твой консольный апп будет планом Б. :)

Кстати, моя программка ищет совпадающие файлы независимо от имени. Т.е.
она, к примеру, может сказать об идентичности файлов
c:\pictures1\mad_dog.jpg и d:\pictures2\sobaka_beshenaja.jpeg.

Тот коммерческий продукт так умеет? Или он только одноименные файлы
(c:\pictures1\mad_dog.jpg и d:\pictures2\mad_dog.jpg) сравнивает?


А она у вас что хэш строит или просто по размеру и дате? А если файловая
система с миллионом файлов? Где она держит карту? В памяти или базе?


Программка простая и тупая, ее слабать было чуть ли не быстрее, чем
сейчас описать, как она работает :-)

1. Собирает список всех файлов с заданными расширениями со всех заданных
дисков. Например, все .jpg и .gif с C:, D: и E:.
2. Сортирует их по размеру.
3. Сравнивает каждые два соседних файла, у которых совпадает длина.
Точнее, сравнивает только первые 5000 байт каждого файла.

Если файловая система с миллионом файлов, она просто выдаст ошибку
выделения памяти, потому что она DOS-овская :-)

--
Best regards
(M)ike
При ответе на e-mail убрать из адреса NOS

Re: поиск дубликатов файлов


"Mike" <mikeNOS@skeptik.net> wrote in message
news:47E16989.60100@skeptik.net...


Кстати, моя программка ищет совпадающие файлы независимо от имени. Т.е.
она, к примеру, может сказать об идентичности файлов
c:\pictures1\mad_dog.jpg и d:\pictures2\sobaka_beshenaja.jpeg.

Тот коммерческий продукт так умеет? Или он только одноименные файлы
(c:\pictures1\mad_dog.jpg и d:\pictures2\mad_dog.jpg) сравнивает?


Это фича конечно интересная, но в моём случае ненужная. Вообще тот самый
коммерческий продукт перед сравнением выкидывает окошко с десятком чекбоксов
на тему критериев проверки. Сравнение бинарных файлов там есть, я вот только
не уверен, можно ли этот чекбокс оставить единственным, отщёлкнув "file
name"

Д.

Re: поиск дубликатов файлов


"Mike" <mikeNOS@skeptik.net> wrote in message
news:47E175F9.1090308@skeptik.net...

Рынский, Дениска (старшой) wrote:




Я 5 лет назад написал для такого дела программку (console app). Могу
дать. Могу даже подарить исходник (C++). Пиши на From (без NOS).

Пасиб. Я сейчас смотрю как коммерческий продукт справится. Если будут
проблемы - твой консольный апп будет планом Б. :)

Кстати, моя программка ищет совпадающие файлы независимо от имени. Т.е.
она, к примеру, может сказать об идентичности файлов
c:\pictures1\mad_dog.jpg и d:\pictures2\sobaka_beshenaja.jpeg.

Тот коммерческий продукт так умеет? Или он только одноименные файлы
(c:\pictures1\mad_dog.jpg и d:\pictures2\mad_dog.jpg) сравнивает?


А она у вас что хэш строит или просто по размеру и дате? А если файловая
система с миллионом файлов? Где она держит карту? В памяти или базе?


Программка простая и тупая, ее слабать было чуть ли не быстрее, чем сейчас
описать, как она работает :-)

1. Собирает список всех файлов с заданными расширениями со всех заданных
дисков. Например, все .jpg и .gif с C:, D: и E:.
2. Сортирует их по размеру.
3. Сравнивает каждые два соседних файла, у которых совпадает длина.
Точнее, сравнивает только первые 5000 байт каждого файла.

Если файловая система с миллионом файлов, она просто выдаст ошибку
выделения памяти, потому что она DOS-овская :-)


Ну в принципе файлов с точно совпадающей длиной скорее всего будет не много,
так что прогнать СРС проверку может и не в лом.


Re: поиск дубликатов файлов


"Dmitry Duginov" <me@duginov.com> wrote in message
news:47e15dc7$0$5618$607ed4bc@cv.net...


"Mike" <mikeNOS@skeptik.net> wrote in message
news:47E1568C.2070304@skeptik.net...

Dmitry Duginov wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия идентичных файлов и целых деревьев каталогов? А то я тут
столкнулся с ситуацией, когда человек делал беспорядочные "бэкапы" в
разные места и хрен поймешь, что можно безболезненно выкинуть прежде
чем настроить один нормальный бэкап.


Я 5 лет назад написал для такого дела программку (console app). Могу
дать. Могу даже подарить исходник (C++). Пиши на From (без NOS).


Пасиб. Я сейчас смотрю как коммерческий продукт справится. Если будут
проблемы - твой консольный апп будет планом Б. :)


Безумие какое-то. Между scanning files и sorting files эта хрень зачем-то
захотела Live ID. Создал новый на хотмейле. Уже любопытно...

Д.

Re: поиск дубликатов файлов


"Dmitry Duginov" <me@duginov.com> wrote in message
news:47e183a6$0$25047$607ed4bc@cv.net...


"Dmitry Duginov" <me@duginov.com> wrote in message
news:47e15dc7$0$5618$607ed4bc@cv.net...


"Mike" <mikeNOS@skeptik.net> wrote in message
news:47E1568C.2070304@skeptik.net...

Dmitry Duginov wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия идентичных файлов и целых деревьев каталогов? А то я тут
столкнулся с ситуацией, когда человек делал беспорядочные "бэкапы" в
разные места и хрен поймешь, что можно безболезненно выкинуть прежде
чем настроить один нормальный бэкап.


Я 5 лет назад написал для такого дела программку (console app). Могу
дать. Могу даже подарить исходник (C++). Пиши на From (без NOS).


Пасиб. Я сейчас смотрю как коммерческий продукт справится. Если будут
проблемы - твой консольный апп будет планом Б. :)


Безумие какое-то. Между scanning files и sorting files эта хрень зачем-то
захотела Live ID. Создал новый на хотмейле. Уже любопытно...


Большой брат хочет знать, что вы там храните. Мне тоже любопытно...


Re: поиск дубликатов файлов

On Mar 19, 10:50 am, "Dmitry Duginov" <m...@duginov.com> wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет наличия
идентичных файлов и целых деревьев каталогов? А то я тут столкнулся с
ситуацией, когда человек делал беспорядочные "бэкапы" в разные места и хрен
поймешь, что можно безболезненно выкинуть прежде чем настроить один
нормальный бэкап.


python/ruby/perl/<list your own> and an hour of work.

Ivan

Re: поиск дубликатов файлов


"Ivan Govnov" <govnov.ivan@gmail.com> wrote in message
news:d87e9d7a-aad8-4ca0-a86e-349f63b90ce4@e23g2000prf.googlegroups.com...

On Mar 19, 10:50 am, "Dmitry Duginov" <m...@duginov.com> wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на предмет
наличия
идентичных файлов и целых деревьев каталогов? А то я тут столкнулся с
ситуацией, когда человек делал беспорядочные "бэкапы" в разные места и
хрен
поймешь, что можно безболезненно выкинуть прежде чем настроить один
нормальный бэкап.


python/ruby/perl/<list your own> and an hour of work.


An hour of work???
Дороговато выйдет...

Д.

Re: поиск дубликатов файлов

Dmitry Duginov wrote:

"Юpa Шaлaк" <jupastor@gmail.com> wrote in message
news:frrlrm$2ikp$1@mamba.crocodile.org...

Dmitry Duginov wrote:

"Anatoly Sinkovsky" <asinkovsky@gmail.com> wrote in message
news:a4d862f5-d9c3-4b29-b50c-1317f0dd6521@h11g2000prf.googlegroups.com...

On 20 мар, 00:50, "Dmitry Duginov" <m...@duginov.com> wrote:

Не подскажет ли кто, чем удобно прошерстить харддрайв(ы) на
предмет наличия
идентичных файлов и целых деревьев каталогов? А то я тут
столкнулся с ситуацией, когда человек делал беспорядочные
"бэкапы" в разные места и хрен
поймешь, что можно безболезненно выкинуть прежде чем настроить
один нормальный бэкап.

Д.


Пользуюсь WinUtilities 5.2 craced

http://www.ylcomputing.com/ 


Спасибо. Попробую.


В принципе, WinMerge умеет сравнивать директории и определить
идентичность бинарников.


Ты плохо прочитал исходное сообщение. Я НЕ ЗНАЮ, где именно на трёх
дисках могут валяться дубликаты. И что я должен скормить винмерджу в


Ну, не только же Широбокову меня неправильно понимать, я тоже имею право.
Я почему-то решил, что просто нет сил разбираться, какие из бекапов когда
сделаны.


качестве двух исходных точек для сравнения? Нет, нужен именно
какой-либо сканер. Винутилитиз я скачал и поставил. Вон он уже десять
минут жужжит только над первым диском из трёх. Надеюсь, до вечера
справится...



Re: поиск дубликатов файлов

Dmitry Duginov wrote:




поймешь, что можно безболезненно выкинуть прежде чем настроить один
нормальный бэкап.


python/ruby/perl/<list your own> and an hour of work.


An hour of work???
Дороговато выйдет...


Да... говно это все: если только у вас Perl не на кончиках пальцев, то вы
сначала пройдете через excruciating pain remembering it. Питон для этого дела
вообще не очень, дольше займет.

Через неделю плотной работы оно начнет работать более-менее осмысленно.

И вот этот вот Говнов меня путает своей подписью "Иван" !

--

Sol Windborn

Re: поиск дубликатов файлов

"Sol Windborn" <root@earth.solarsystem.milkyway.universe> wrote in message
news:fru0km$2v8c$1@ddt.demos.su...

И вот этот вот Говнов меня путает своей подписью "Иван" !



Я вот только что заблэклистил Скобаря за переписку с говновым, и ты туда же?
:(

--
All mockery of Jews and their one God
shall be kept to an appropriate minimum.


Re: поиск дубликатов файлов

Constantine Vulakh <z1@vulakh.us> wrote:

"Sol Windborn" <root@earth.solarsystem.milkyway.universe> wrote in message
news:fru0km$2v8c$1@ddt.demos.su...

И вот этот вот Говнов меня путает своей подписью "Иван" !





Я вот только что заблэклистил Скобаря за переписку с говновым, и ты туда же?
:(


Я не понимаю, как можно быть настолько слепым, чтобы просто
по стилистике не видеть, что Говнов - это Соловьев.
Обратное, конечно, тоже верно.

---
Const