Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Data Fusion avatar

Data Fusion

Официальный бот конференции: @Data_Fusion_bot
TGlist 评分
0
0
类型公开
验证
未验证
可信度
不可靠
位置
语言其他
频道创建日期Jun 24, 2022
添加到 TGlist 的日期
Mar 28, 2025
关联群组

"Data Fusion" 群组最新帖子

Через несколько минут начинаем в «Фотоне» обсуждать математическую оптимизацию.

Долго говорить не будем. Вот список спикеров:

Евгений Лепшин
Салават Муллабаев
Алексей Чернов
Роланд Хильдебранд
Юрий Дорн
Дмитрий Яроцкий
Дмитрий Ковалев
Денис Беломестный
Александр Гасников


В общем, это must-see. В «Фотоне» в 15.30 🚀

UPD: сессия в двух частях, сделаем перерыв в 17.05 и продолжим.
В 15.40 ждём вас в Лектории 2 на обсуждение рекомендательных систем. Модератор — ⭐ Юлий Шамаев, ВТБ.

Спикеры и темы выступлений:

Евгений Иванов, Wildberries, Lead RecSys ML Engineer
Тема: Кластерные рекомендации и интересы в персонализации: как не разориться на инфраструктуре при постоянном росте количества пользователей

Данил Комаров, Lamoda Tech, Senior DS
Тема: Рекомендации с нуля: как мы в Lamoda превратили главную страницу в ключевую точку входа для персонализированного шоппинга

Сергей Кузнецов, MTS Digital, CTO RecSys Platform
Тема: Рантайм компоненты RecSys платформы

Анна Володкевич, Sber AI Lab, руководитель направления по исследованию данных
Тема: Does It Look Sequential? Анализ последовательных паттернов в датасетах для рекомендательных систем.
Через 10 минут в 📍Физике продолжаем обсуждать международные отношения, политику и влияние ИИ на общественное сознание.

Модератор — ⭐ старший вице-президент ВТБ Сергей Безбогов.

Успейте занять места!
📍 Молекула
Только-только в зале 📍Физика стартовала дискуссия «Нужна ли России национальная биржа данных?»

Модератор — ⭐️ заместитель руководителя Технологического блока - старший вице-президент ВТБ Сергей Безбогов.

В составе участников представители Т-банка, «Сколково», АБД, ДОМ.РФ и других ключевых организаций с большим опытом в работе с данными.

Обсуждаем зарубежный опыт, коммерческий потенциал и централизацию/децентрализацию.

Ждем только вас!
А в Лектории 2 в 14.00 продолжим с кейс-стади! На очереди — CV.

Модератор — Дмитрий Николаев, заведующий отделом "Зрительные системы" ФИЦ ИУ РАН, технический директор Smart Engines.

Все серьезно!
Гуманитарии (даже если только в душе), вам через 15 минут в 📍Молекулу.

Вадим Кулик проведет сессию «ИИ в эпоху постмодернизма».

Участники дискуссии:
🔵Философ Александр Дугин
🔵Декан факультета международных отношений МГИМО Андрей Сушенцов
🔵Александр Крайнов (Яндекс)
🔵⭐ Денис Суржко (ВТБ).

Предчувствуем интереснейшую беседу!
转发自:
Data Secrets avatar
Data Secrets
В лаборатории AIRI придумали способ легко масштабировать трансформеры на контекст 2 миллиона токенов

Вчера на конференции Data Fusion прошла церемония награждения Data Fusion Awards (запись). Премию за научный прорыв выиграл Айдар Булатов: он стал одним из авторов работы, в которой предложили способ расширения контекстного окна трансформеров при линейном росте вычислительных затрат.

Нас работа очень заинтересовала, и позже мы познакомились с Айдаром на постерной сессии лично, чтобы немного расспросить его о статье. Главная идея: соединить трансформеры и рекуррентный механизм памяти.

Мы разделяем текст на кусочки и обрабатываем их последовательно. При этом в начало каждого сегмента добавляются векторы памяти, которая обновляется на каждой следующей итерации. Таким образом, self‑attention считается только внутри сегмента, но при этом мы все равно с каждым разом храним все больше и больше информации о тексте.

Масштабируется это действительно хорошо: ребята обучали модель только на последовательностях длины до 3.5к токенов, но на тестах она спокойно выдерживает контекст до 2 миллионов (а позже и до 50 миллионов на модификациях)! Вот гитхаб и статья.

Кстати, на основе этой работы Айдар в команде с Юрием Куратовым и другими авторами также создали бенчмарк BABILong для оценки моделей на длинном контексте. Сейчас на этом бенчмарке тестируют свои модели многие ведущие лабы: Google, Meta, OpenAI. Мы, кстати, даже несколько раз о нем писали, но то, что он был сделан в AIRI, узнали только вчера. Эта работа тоже была в числе победителей премии.

Поздравляем 🥳
Детали о статье победителя номинации «Научный прорыв» Data Fusion Awards. Спасибо за обзор, друзья!
Лекторий 2 — это на втором этаже, после эскалаторов проходите прямо и потом налево. На всякий случай:)
В📍Молекуле сегодня насыщенно по инсайтам рынка: через 10 минут Вадим Кулик начнет модерировать сессию «Обогнать, не догоняя: асимметричный технологический ответ».

В дискуссии также примут участие представители Газпромбанка, «Росатома», Иннопрактики, НИУ ВШЭ, Т1, Совета Федерации. Вопросы в повестке:

• На какие технологии сделать ставку?
• Можно ли «перепрыгнуть» этапы развития в борьбе за технологическое лидерство?
• Какими должны быть стратегия и тактика продвижения российских технологий на международный уровень?
• Какова роль государства в поддержке экспансии российских технологий?

Начнем в 12.30.

Принимаете стратегические решения в ИИ и Data Science? Вы знаете, куда вам идти.
Напоминаем о старте трека профильных кейс-сессий в Лектории 2. В целом, там можно провести весь день до конца конференции — лучшего брифа по ключевым направлениям ML и представить себе сложно.

Начнем в 12.30 с кейс-сессии NLP. Модератор — Валентин Малых, руководитель группы в MTS AI.

📍Лекторий 2
📍 Молекула

Не хватает только чая (слушатели последнего сезона подкаста «Деньги любят техно» поймут) 💜

记录

19.04.202523:59
4.5K订阅者
16.04.202512:04
100引用指数
18.04.202512:03
1.2K每帖平均覆盖率
18.04.202514:12
1.1K广告帖子的平均覆盖率
16.04.202513:26
2.34%ER
18.03.202512:03
41.43%ERR
订阅者
引用指数
每篇帖子的浏览量
每个广告帖子的浏览量
ER
ERR
30 MAR '2506 APR '2513 APR '2520 APR '25

Data Fusion 热门帖子

Расписание удобных трансляций в VK Видео — на картинке. Все трансляции можно найти в нашей группе VK: https://vk.com/datafusion

Трансляции всех сессий без исключения доступны на сайте. Желаем приятного просмотра!
Хотите узнать больше о практиках ML в Поднебесной? Эта сессия для вас!


В 18.10 в 📍«Атоме»
слушаем лекцию профессора Хонг Чена, PhD. Хонг Чен представляет Китайский университет электронных наук и технологий, а также является вице-президентом Центра робототехники в Ченду.

Лекция будет посвящена созданию роботов, которые могут эффективно взаимодействовать с человеком (например, в качестве протеза или полезного цифрового помощника), созданию антропоморфных роботов и математике, которая лежит в основе таких разработок. Профессор расскажет об основных задачах, которые решает его команда, главных проблемах робототехники и потенциально рабочих моделях, которые могут стать их решением.

Ждем вас!
转发自:
Data Secrets avatar
Data Secrets
17.04.202509:35
В лаборатории AIRI придумали способ легко масштабировать трансформеры на контекст 2 миллиона токенов

Вчера на конференции Data Fusion прошла церемония награждения Data Fusion Awards (запись). Премию за научный прорыв выиграл Айдар Булатов: он стал одним из авторов работы, в которой предложили способ расширения контекстного окна трансформеров при линейном росте вычислительных затрат.

Нас работа очень заинтересовала, и позже мы познакомились с Айдаром на постерной сессии лично, чтобы немного расспросить его о статье. Главная идея: соединить трансформеры и рекуррентный механизм памяти.

Мы разделяем текст на кусочки и обрабатываем их последовательно. При этом в начало каждого сегмента добавляются векторы памяти, которая обновляется на каждой следующей итерации. Таким образом, self‑attention считается только внутри сегмента, но при этом мы все равно с каждым разом храним все больше и больше информации о тексте.

Масштабируется это действительно хорошо: ребята обучали модель только на последовательностях длины до 3.5к токенов, но на тестах она спокойно выдерживает контекст до 2 миллионов (а позже и до 50 миллионов на модификациях)! Вот гитхаб и статья.

Кстати, на основе этой работы Айдар в команде с Юрием Куратовым и другими авторами также создали бенчмарк BABILong для оценки моделей на длинном контексте. Сейчас на этом бенчмарке тестируют свои модели многие ведущие лабы: Google, Meta, OpenAI. Мы, кстати, даже несколько раз о нем писали, но то, что он был сделан в AIRI, узнали только вчера. Эта работа тоже была в числе победителей премии.

Поздравляем 🥳
Гуманитарии (даже если только в душе), вам через 15 минут в 📍Молекулу.

Вадим Кулик проведет сессию «ИИ в эпоху постмодернизма».

Участники дискуссии:
🔵Философ Александр Дугин
🔵Декан факультета международных отношений МГИМО Андрей Сушенцов
🔵Александр Крайнов (Яндекс)
🔵⭐ Денис Суржко (ВТБ).

Предчувствуем интереснейшую беседу!
16.04.202511:46
Через несколько минут начинаем в «Фотоне» обсуждать математическую оптимизацию.

Долго говорить не будем. Вот список спикеров:

Евгений Лепшин
Салават Муллабаев
Алексей Чернов
Роланд Хильдебранд
Юрий Дорн
Дмитрий Яроцкий
Дмитрий Ковалев
Денис Беломестный
Александр Гасников


В общем, это must-see. В «Фотоне» в 15.30 🚀

UPD: сессия в двух частях, сделаем перерыв в 17.05 и продолжим.
17.04.202511:38
В📍Молекуле сегодня насыщенно по инсайтам рынка: через 10 минут Вадим Кулик начнет модерировать сессию «Обогнать, не догоняя: асимметричный технологический ответ».

В дискуссии также примут участие представители Газпромбанка, «Росатома», Иннопрактики, НИУ ВШЭ, Т1, Совета Федерации. Вопросы в повестке:

• На какие технологии сделать ставку?
• Можно ли «перепрыгнуть» этапы развития в борьбе за технологическое лидерство?
• Какими должны быть стратегия и тактика продвижения российских технологий на международный уровень?
• Какова роль государства в поддержке экспансии российских технологий?

Начнем в 12.30.

Принимаете стратегические решения в ИИ и Data Science? Вы знаете, куда вам идти.
Через 10 минут в 📍Физике продолжаем обсуждать международные отношения, политику и влияние ИИ на общественное сознание.

Модератор — ⭐ старший вице-президент ВТБ Сергей Безбогов.

Успейте занять места!
17.04.202507:45
17.04.202512:25
В 15.40 ждём вас в Лектории 2 на обсуждение рекомендательных систем. Модератор — ⭐ Юлий Шамаев, ВТБ.

Спикеры и темы выступлений:

Евгений Иванов, Wildberries, Lead RecSys ML Engineer
Тема: Кластерные рекомендации и интересы в персонализации: как не разориться на инфраструктуре при постоянном росте количества пользователей

Данил Комаров, Lamoda Tech, Senior DS
Тема: Рекомендации с нуля: как мы в Lamoda превратили главную страницу в ключевую точку входа для персонализированного шоппинга

Сергей Кузнецов, MTS Digital, CTO RecSys Platform
Тема: Рантайм компоненты RecSys платформы

Анна Володкевич, Sber AI Lab, руководитель направления по исследованию данных
Тема: Does It Look Sequential? Анализ последовательных паттернов в датасетах для рекомендательных систем.
17.04.202509:07
Напоминаем о старте трека профильных кейс-сессий в Лектории 2. В целом, там можно провести весь день до конца конференции — лучшего брифа по ключевым направлениям ML и представить себе сложно.

Начнем в 12.30 с кейс-сессии NLP. Модератор — Валентин Малых, руководитель группы в MTS AI.

📍Лекторий 2
17.04.202508:19
Передохнём и продолжим в 📍Молекуле разговором с Максутом Шадаевым, министом цифрового развития, связи и массовых коммуникаций Российской Федерации.

Беседу проведет ⭐️ Денис Суржко, заместитель руководителя департамента анализа данных и моделирования — вице-президент ВТБ.

Далеко не расходитесь!
17.04.202508:45
17.04.202506:55
Доброе утро! Как ваше настроение?

Через 5 минут начинаем в зале 📍Молекула с пленарной дискуссии о рынке данных. Занимайте скорее места!
登录以解锁更多功能。