Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Data Fusion avatar

Data Fusion

Официальный бот конференции: @Data_Fusion_bot
TGlist rating
0
0
TypePublic
Verification
Not verified
Trust
Not trusted
Location
LanguageOther
Channel creation dateJun 24, 2022
Added to TGlist
Mar 28, 2025
Linked chat

Latest posts in group "Data Fusion"

Через несколько минут начинаем в «Фотоне» обсуждать математическую оптимизацию.

Долго говорить не будем. Вот список спикеров:

Евгений Лепшин
Салават Муллабаев
Алексей Чернов
Роланд Хильдебранд
Юрий Дорн
Дмитрий Яроцкий
Дмитрий Ковалев
Денис Беломестный
Александр Гасников


В общем, это must-see. В «Фотоне» в 15.30 🚀

UPD: сессия в двух частях, сделаем перерыв в 17.05 и продолжим.
В 15.40 ждём вас в Лектории 2 на обсуждение рекомендательных систем. Модератор — ⭐ Юлий Шамаев, ВТБ.

Спикеры и темы выступлений:

Евгений Иванов, Wildberries, Lead RecSys ML Engineer
Тема: Кластерные рекомендации и интересы в персонализации: как не разориться на инфраструктуре при постоянном росте количества пользователей

Данил Комаров, Lamoda Tech, Senior DS
Тема: Рекомендации с нуля: как мы в Lamoda превратили главную страницу в ключевую точку входа для персонализированного шоппинга

Сергей Кузнецов, MTS Digital, CTO RecSys Platform
Тема: Рантайм компоненты RecSys платформы

Анна Володкевич, Sber AI Lab, руководитель направления по исследованию данных
Тема: Does It Look Sequential? Анализ последовательных паттернов в датасетах для рекомендательных систем.
Через 10 минут в 📍Физике продолжаем обсуждать международные отношения, политику и влияние ИИ на общественное сознание.

Модератор — ⭐ старший вице-президент ВТБ Сергей Безбогов.

Успейте занять места!
📍 Молекула
Только-только в зале 📍Физика стартовала дискуссия «Нужна ли России национальная биржа данных?»

Модератор — ⭐️ заместитель руководителя Технологического блока - старший вице-президент ВТБ Сергей Безбогов.

В составе участников представители Т-банка, «Сколково», АБД, ДОМ.РФ и других ключевых организаций с большим опытом в работе с данными.

Обсуждаем зарубежный опыт, коммерческий потенциал и централизацию/децентрализацию.

Ждем только вас!
А в Лектории 2 в 14.00 продолжим с кейс-стади! На очереди — CV.

Модератор — Дмитрий Николаев, заведующий отделом "Зрительные системы" ФИЦ ИУ РАН, технический директор Smart Engines.

Все серьезно!
Гуманитарии (даже если только в душе), вам через 15 минут в 📍Молекулу.

Вадим Кулик проведет сессию «ИИ в эпоху постмодернизма».

Участники дискуссии:
🔵Философ Александр Дугин
🔵Декан факультета международных отношений МГИМО Андрей Сушенцов
🔵Александр Крайнов (Яндекс)
🔵⭐ Денис Суржко (ВТБ).

Предчувствуем интереснейшую беседу!
Reposted from:
Data Secrets avatar
Data Secrets
В лаборатории AIRI придумали способ легко масштабировать трансформеры на контекст 2 миллиона токенов

Вчера на конференции Data Fusion прошла церемония награждения Data Fusion Awards (запись). Премию за научный прорыв выиграл Айдар Булатов: он стал одним из авторов работы, в которой предложили способ расширения контекстного окна трансформеров при линейном росте вычислительных затрат.

Нас работа очень заинтересовала, и позже мы познакомились с Айдаром на постерной сессии лично, чтобы немного расспросить его о статье. Главная идея: соединить трансформеры и рекуррентный механизм памяти.

Мы разделяем текст на кусочки и обрабатываем их последовательно. При этом в начало каждого сегмента добавляются векторы памяти, которая обновляется на каждой следующей итерации. Таким образом, self‑attention считается только внутри сегмента, но при этом мы все равно с каждым разом храним все больше и больше информации о тексте.

Масштабируется это действительно хорошо: ребята обучали модель только на последовательностях длины до 3.5к токенов, но на тестах она спокойно выдерживает контекст до 2 миллионов (а позже и до 50 миллионов на модификациях)! Вот гитхаб и статья.

Кстати, на основе этой работы Айдар в команде с Юрием Куратовым и другими авторами также создали бенчмарк BABILong для оценки моделей на длинном контексте. Сейчас на этом бенчмарке тестируют свои модели многие ведущие лабы: Google, Meta, OpenAI. Мы, кстати, даже несколько раз о нем писали, но то, что он был сделан в AIRI, узнали только вчера. Эта работа тоже была в числе победителей премии.

Поздравляем 🥳
Детали о статье победителя номинации «Научный прорыв» Data Fusion Awards. Спасибо за обзор, друзья!
Лекторий 2 — это на втором этаже, после эскалаторов проходите прямо и потом налево. На всякий случай:)
В📍Молекуле сегодня насыщенно по инсайтам рынка: через 10 минут Вадим Кулик начнет модерировать сессию «Обогнать, не догоняя: асимметричный технологический ответ».

В дискуссии также примут участие представители Газпромбанка, «Росатома», Иннопрактики, НИУ ВШЭ, Т1, Совета Федерации. Вопросы в повестке:

• На какие технологии сделать ставку?
• Можно ли «перепрыгнуть» этапы развития в борьбе за технологическое лидерство?
• Какими должны быть стратегия и тактика продвижения российских технологий на международный уровень?
• Какова роль государства в поддержке экспансии российских технологий?

Начнем в 12.30.

Принимаете стратегические решения в ИИ и Data Science? Вы знаете, куда вам идти.
Напоминаем о старте трека профильных кейс-сессий в Лектории 2. В целом, там можно провести весь день до конца конференции — лучшего брифа по ключевым направлениям ML и представить себе сложно.

Начнем в 12.30 с кейс-сессии NLP. Модератор — Валентин Малых, руководитель группы в MTS AI.

📍Лекторий 2
📍 Молекула

Не хватает только чая (слушатели последнего сезона подкаста «Деньги любят техно» поймут) 💜

Records

25.04.202510:59
4.5KSubscribers
16.04.202512:04
100Citation index
18.04.202510:59
1.3KAverage views per post
18.04.202514:12
1.1KAverage views per ad post
16.04.202513:26
2.34%ER
18.03.202512:03
41.43%ERR
Subscribers
Citation index
Avg views per post
Avg views per ad post
ER
ERR
30 MAR '2506 APR '2513 APR '2520 APR '25

Popular posts Data Fusion

Расписание удобных трансляций в VK Видео — на картинке. Все трансляции можно найти в нашей группе VK: https://vk.com/datafusion

Трансляции всех сессий без исключения доступны на сайте. Желаем приятного просмотра!
Хотите узнать больше о практиках ML в Поднебесной? Эта сессия для вас!


В 18.10 в 📍«Атоме»
слушаем лекцию профессора Хонг Чена, PhD. Хонг Чен представляет Китайский университет электронных наук и технологий, а также является вице-президентом Центра робототехники в Ченду.

Лекция будет посвящена созданию роботов, которые могут эффективно взаимодействовать с человеком (например, в качестве протеза или полезного цифрового помощника), созданию антропоморфных роботов и математике, которая лежит в основе таких разработок. Профессор расскажет об основных задачах, которые решает его команда, главных проблемах робототехники и потенциально рабочих моделях, которые могут стать их решением.

Ждем вас!
Reposted from:
Data Secrets avatar
Data Secrets
17.04.202509:35
В лаборатории AIRI придумали способ легко масштабировать трансформеры на контекст 2 миллиона токенов

Вчера на конференции Data Fusion прошла церемония награждения Data Fusion Awards (запись). Премию за научный прорыв выиграл Айдар Булатов: он стал одним из авторов работы, в которой предложили способ расширения контекстного окна трансформеров при линейном росте вычислительных затрат.

Нас работа очень заинтересовала, и позже мы познакомились с Айдаром на постерной сессии лично, чтобы немного расспросить его о статье. Главная идея: соединить трансформеры и рекуррентный механизм памяти.

Мы разделяем текст на кусочки и обрабатываем их последовательно. При этом в начало каждого сегмента добавляются векторы памяти, которая обновляется на каждой следующей итерации. Таким образом, self‑attention считается только внутри сегмента, но при этом мы все равно с каждым разом храним все больше и больше информации о тексте.

Масштабируется это действительно хорошо: ребята обучали модель только на последовательностях длины до 3.5к токенов, но на тестах она спокойно выдерживает контекст до 2 миллионов (а позже и до 50 миллионов на модификациях)! Вот гитхаб и статья.

Кстати, на основе этой работы Айдар в команде с Юрием Куратовым и другими авторами также создали бенчмарк BABILong для оценки моделей на длинном контексте. Сейчас на этом бенчмарке тестируют свои модели многие ведущие лабы: Google, Meta, OpenAI. Мы, кстати, даже несколько раз о нем писали, но то, что он был сделан в AIRI, узнали только вчера. Эта работа тоже была в числе победителей премии.

Поздравляем 🥳
Гуманитарии (даже если только в душе), вам через 15 минут в 📍Молекулу.

Вадим Кулик проведет сессию «ИИ в эпоху постмодернизма».

Участники дискуссии:
🔵Философ Александр Дугин
🔵Декан факультета международных отношений МГИМО Андрей Сушенцов
🔵Александр Крайнов (Яндекс)
🔵⭐ Денис Суржко (ВТБ).

Предчувствуем интереснейшую беседу!
16.04.202511:46
Через несколько минут начинаем в «Фотоне» обсуждать математическую оптимизацию.

Долго говорить не будем. Вот список спикеров:

Евгений Лепшин
Салават Муллабаев
Алексей Чернов
Роланд Хильдебранд
Юрий Дорн
Дмитрий Яроцкий
Дмитрий Ковалев
Денис Беломестный
Александр Гасников


В общем, это must-see. В «Фотоне» в 15.30 🚀

UPD: сессия в двух частях, сделаем перерыв в 17.05 и продолжим.
17.04.202511:38
В📍Молекуле сегодня насыщенно по инсайтам рынка: через 10 минут Вадим Кулик начнет модерировать сессию «Обогнать, не догоняя: асимметричный технологический ответ».

В дискуссии также примут участие представители Газпромбанка, «Росатома», Иннопрактики, НИУ ВШЭ, Т1, Совета Федерации. Вопросы в повестке:

• На какие технологии сделать ставку?
• Можно ли «перепрыгнуть» этапы развития в борьбе за технологическое лидерство?
• Какими должны быть стратегия и тактика продвижения российских технологий на международный уровень?
• Какова роль государства в поддержке экспансии российских технологий?

Начнем в 12.30.

Принимаете стратегические решения в ИИ и Data Science? Вы знаете, куда вам идти.
Через 10 минут в 📍Физике продолжаем обсуждать международные отношения, политику и влияние ИИ на общественное сознание.

Модератор — ⭐ старший вице-президент ВТБ Сергей Безбогов.

Успейте занять места!
17.04.202507:45
17.04.202512:25
В 15.40 ждём вас в Лектории 2 на обсуждение рекомендательных систем. Модератор — ⭐ Юлий Шамаев, ВТБ.

Спикеры и темы выступлений:

Евгений Иванов, Wildberries, Lead RecSys ML Engineer
Тема: Кластерные рекомендации и интересы в персонализации: как не разориться на инфраструктуре при постоянном росте количества пользователей

Данил Комаров, Lamoda Tech, Senior DS
Тема: Рекомендации с нуля: как мы в Lamoda превратили главную страницу в ключевую точку входа для персонализированного шоппинга

Сергей Кузнецов, MTS Digital, CTO RecSys Platform
Тема: Рантайм компоненты RecSys платформы

Анна Володкевич, Sber AI Lab, руководитель направления по исследованию данных
Тема: Does It Look Sequential? Анализ последовательных паттернов в датасетах для рекомендательных систем.
17.04.202509:07
Напоминаем о старте трека профильных кейс-сессий в Лектории 2. В целом, там можно провести весь день до конца конференции — лучшего брифа по ключевым направлениям ML и представить себе сложно.

Начнем в 12.30 с кейс-сессии NLP. Модератор — Валентин Малых, руководитель группы в MTS AI.

📍Лекторий 2
17.04.202508:19
Передохнём и продолжим в 📍Молекуле разговором с Максутом Шадаевым, министом цифрового развития, связи и массовых коммуникаций Российской Федерации.

Беседу проведет ⭐️ Денис Суржко, заместитель руководителя департамента анализа данных и моделирования — вице-президент ВТБ.

Далеко не расходитесь!
17.04.202508:45
17.04.202506:55
Доброе утро! Как ваше настроение?

Через 5 минут начинаем в зале 📍Молекула с пленарной дискуссии о рынке данных. Занимайте скорее места!
Log in to unlock more functionality.