Виталий Муравицкий — senior developer, system architect, team lead в ЛУН.ua
В проектах, которые работают с пользовательскими данными, очень часто возникают задачи нахождения похожего или идентичного контента.
На лекции разберемся, как быстро находить дубли на постоянно растущей базе в несколько десятков миллионов изображений.
● Рассмотрим разные варианты постановки задачи
● Подходы к решению на различных объемах данных
● Как эффективно использовать перцептивный хеш
● Ускорим подсчет расстояния Хэмминга
● Научимся работать с ключевыми точками изображений и их дескрипторами
● Построим масштабируемый алгоритм поиска дублей
До встречи!