Простая утилита, удаляет одинаковые mail в базе. Попутно очистит базу от мусора, ибо если строка не имеет ; или : , то пропускает такую строку и в результат она не попадет. Можно реализовать использование регулярки чтобы наверника был mailass, но это ув. время проверки ~5 раз (тестировал)
Вход:
[email protected]:123123
[email protected]:123123!
[email protected]:13579az
[email protected]:13579az!
242424dgdg
[email protected]:13579qaz
[email protected]:24121966vbytdfkbtdyf
[email protected]:24121966vbytdfkbtdyf!
[email protected]:yjdfz09
[email protected]:Yjdfz09
Выход:
[email protected]:123123
[email protected]:24121966vbytdfkbtdyf
P.s Оптимизировал по максимум, скорость и поддержка крупных файлов нормальные, дальше только применять адовый бинарный поиск с дробление файлов, чтение из разных потоков, но так заморачиваться ради простой утилиты работы с текстом не хочется.
Вход:
[email protected]:123123
[email protected]:123123!
[email protected]:13579az
[email protected]:13579az!
242424dgdg
[email protected]:13579qaz
[email protected]:24121966vbytdfkbtdyf
[email protected]:24121966vbytdfkbtdyf!
[email protected]:yjdfz09
[email protected]:Yjdfz09
Выход:
[email protected]:123123
[email protected]:24121966vbytdfkbtdyf
P.s Оптимизировал по максимум, скорость и поддержка крупных файлов нормальные, дальше только применять адовый бинарный поиск с дробление файлов, чтение из разных потоков, но так заморачиваться ради простой утилиты работы с текстом не хочется.