Эффективные алгоритмы поиска подобных объектов для терабайтов данных / Евгений Журин (Segmento)
Приглашаем на конференцию HighLoad 2024, которая пройдет 2 и 3 декабря в Москве!
Программа, подробности и билеты по ссылке:
--------
HighLoad 2015
Презентация и тезисы:
Segmento DMP хранит сотни миллионов анонимных профилей пользователей интернета. Часть из задач отдела Data Science связана с их кластеризацией и поиском нечетких дубликатов. Для успешного решения этих задач необходимо вычислить метрики сходства между профилями. Brute force подход на таких объемах данных уже не сработает, поэтому мы выбрали другой путь.
...
1 view
78
24
8 hours ago 00:01:15 1
🎯 HABR РАБОТА ИЗ ДОМА 💯 РАБОТА НА ДОМУ ЖЕЛЕЗНОГОРСК КУРСКАЯ ОБЛАСТЬ ⭐
10 hours ago 00:01:15 1
💲 Как заработать 500 рублей в интернете ⚡ Как разбогатеть в казахстане ❗
11 hours ago 00:01:44 1
🎲 ТОРГОВЫЙ РОБОТ В QUIK 💶
13 hours ago 01:21:12 41
Верификация консенсуса IBFT методом Model Checking
13 hours ago 00:00:44 1
⭕️Сегодня провели расширенное совещание с аппаратом столичного Управления образования
18 hours ago 00:01:15 1
ПАССИВНЫЙ ДОХОД В 100000 В МЕСЯЦ ⚡ ОБУЧЕНИЕ ЗАРАБОТКУ В ИНТЕРНЕТЕ С ГАРАНТИЕЙ РЕЗУЛЬТАТА БЕСПЛАТНО
18 hours ago 00:01:15 1
МОЖНО ЗАРАБОТАТЬ ДЕНЬГИ НА СЧЕТ 👍 САМЫЙ БЫСТРЫЙ ЗАРАБОТОК БЕЗ ВЛОЖЕНИЙ ⚫
18 hours ago 00:01:15 1
Где заработать хорошие деньги без опыта работы
10 hours ago 01:19:12 514
Руслан Парчив: искусственный интеллект в медицине
20 hours ago 00:01:15 1
Работа на дому в сыктывкаре вакансии ⚠ Как можно заработать в декретном отпуске
22 hours ago 00:19:49 1
Инсулинорезистентность - Что Она Скрывает о Вашем Здоровье_ ЧАСТЬ 1