forum.boolean.name - Показать сообщение отдельно

ІГРОГРАЙКО · 06.02.2013, 12:44

Сообщение от jimon

можно стандартными средствами создать хеш-суммы файлов (например md5), потом найти все пары файлов чьи хеш-суммы совпадают и проверить уже эти пары на побайтовое совпадение

Спасибо! но тут как раз очень важен 2-й вопрос.
Каким контейнером пользоваться, чтобы сравнение элементов между собой занимало поменьше времени?
БД с данными файлов я создам как класс внутри которого будет контейнер (массив) с данными файлов (путь к файлу, размер файла).
Конструктор класса будет принимать контейнер с путями директорий, искать в этих директориях файлы и заполнять их данными внутренний контейнер.
А сам поиск идентичных файлов будет организован как метод, который после вычислений будет возвращать контейнер с данными идентичных файлов.
Какой же тип контейнера выбрать?

List<T>
Dictionary<TKey,TValue>
HashSet<T>