Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Николаевский Ванёк
Николаевский Ванёк
Инсайдер UA
Инсайдер UA
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Николаевский Ванёк
Николаевский Ванёк
Инсайдер UA
Инсайдер UA
Сергей Марков: машинное обучение, искусство и шитпостинг avatar

Сергей Марков: машинное обучение, искусство и шитпостинг

Машинное обучение, искусственный интеллект, искусство, мемасы, всякое личное и странноэ
TGlist rating
0
0
TypePublic
Verification
Not verified
Trust
Not trusted
LocationРосія
LanguageOther
Channel creation dateMar 11, 2022
Added to TGlist
Jun 07, 2024
Linked chat

Records

16.05.202505:24
9.2KSubscribers
15.03.202523:59
100Citation index
26.02.202523:59
4.9KAverage views per post
26.02.202523:59
6.5KAverage views per ad post
09.02.202500:44
14.34%ER
26.02.202518:56
57.25%ERR
Subscribers
Citation index
Avg views per post
Avg views per ad post
ER
ERR
JUL '24OCT '24JAN '25APR '25

Popular posts Сергей Марков: машинное обучение, искусство и шитпостинг

13.05.202514:41
Сбер представил первый российский AI-сервис для создания 3D-моделей – Kandinsky 3D ⚡️

Сервис на базе генеративного искусственного интеллекта позволяет создавать 3D-модели с геометрией и текстурой на основе текстового описания.

Kandinsky 3D будет полезен при прототипировании объектов любой сложности: от архитектурных проектов до промышленных изделий. Созданную трёхмерную модель можно скачать и доработать в популярных профессиональных редакторах, или сразу напечатать на 3D-принтере.

Сервис будет полезен для генерации интерактивных 3D-объектов для мобильных приложений и аватаров, а также при создании персонажей и окружения для компьютерных игр.

В ближайшем будущем можно будет генерировать 3D-модели на основе загруженного изображения, появятся расширенные настройки генерации, инструмент по упрощению и оптимизации 3D-модели, и множество других улучшений.

Протестировать Kandinsky 3D можно бесплатно на странице решения или с помощью программного интерфейса GigaChat API усилить его возможностями другие системы.
29.04.202514:49
Программный комитет конференции CVPR решил заблокировать уже принятые работы авторов из России. Такие же письма коллеги из Яндекса прислали. Получить разъяснения от господина Келленбергера за неделю не удалось.

Заблокированные статьи:
— Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis (Yandex, HSE, MIPT, Skoltech, AIRI, ITMO)
— Color Conditional Generation with Sliced Wasserstein Distance (Skoltech)
— MaterialFusion: High-Quality, Zero-Shot, and Controllable Material Transfer with Diffusion Models (HSE, AIRI, Skoltech)
— Good Keypoints for the Two-View Geometry Estimation Problem (Skoltech, Slamcore)

Как пошутил один коллега: sorry to hear that, Patrick. due to nature of our research and considering this rejection, we now switch to other peaceful topics like, autonomous drones, all terrain self driving vehicles and quantum computing. we really sorry about that but you gave us no choice
05.05.202518:32
02.05.202509:47
05.05.202509:32
21.04.202508:14
10 (из множества достойных) каналов, которые я читаю, и которые, возможно, будут интересны и вам. Специально подобрал, чтобы тут было не только про ИИ и машинное обучение, но без них, конечно, никак

1. @Ivan_Oseledets
Автор канала — Иван Оселедец — директор Института искусственного интеллекта (AIRI). Хотя Иван на 3 года меня младше, он, наверное, самый известный в России учёный в области ИИ, доктор наук, и вообще одна из светлых голов в отечественном ИИ. А ещё он сын недавно ушедшего от нас известного советского и российского математика Валерия Оселедца. В общем, при таких вводных удивительно, что подписчиков у него пока куда меньше, чем у меня

2. @yatsutkod
Автор канала — Денис Яцутко — на протяжении многих лет был редактором 22century.ru, сейчас вернулся из Москвы в родной Ставрополь. Денис — талантливый писатель и поэт, автор множества остроумных заметок, а ещё литературный редактор моей книги.

3. @darya_evtyushkina_psy
Дарья Евтюшкина — практикующий психолог, занимается психологическим консультированием, специализируется на вопросах, связанных с уверенностью, приятием себя и выстраиванием личных границ. Дарья не так давно начала вести канал, но уже рассказала много интересного о своей работе (и обязательно будет рассказывать дальше)

4. @noomarxism
Автор канала — Евгений Парфёнов — на мой взгляд один из лучших теоретиков современного диалектического материализма. Евгений прекрасно знаком с марксистской традицией и в то же время не относится к числу замшелых догматиков. В его канале вы можете познакомиться с живой теорией, неразрывно связанной с актуальной практикой, в том числе с тем, как развитие технологий ИИ влияет на общественные процессы

5. @dealerAI
Автор канала — Александр Абрамов — один из лучших (если не лучший) в нашей стране специалистов по энкодерным моделям. Я горд тем, что он работает в моей команде, и благодаря его усилиям мы будем продолжать радовать open-source-коммьюнити новыми эмбеддерами, поисковыми технологиями, бенчмарками и другими вкусностями

6. @floppy_pictures
У канала Каси Кульковой, конечно, должны быть минимум 100 тыщ подписчиков, потому что ну а сколько у нас в стране бородатых ностальгирующих IT-шников, которым для поддержания должного уровня серотонина срочно нужны проверенные мемы с CD-дисков и дискет?

7. @doomgrad
Сергей Аверкиев — ещё один талант в нашей команде. В его канале можно найти всё от развития технологий ИИ для поддержки языкового разнообразия до тюнинга text2image-моделей для более качественного рисования братьев Стругацких (к которым отсылает и название канала Сергея).

8. @dendi_math_ai
Денис Димитров — мой давний коллега и добрый друг. Много лет наши команды совместно работали сначала над ruDALL-E Malevich, а потом над Kandinsky. За 3 последних года на базе Kandinsky появилось множество популярных продуктов и сервисов, модель завоевала популярность в сообществе разработчиков открытого ПО. Канал Дениса рассказывает о новостях в машинном обучении и последних достижениях в области изобразительного ИИ.

9. @complete_ai
Андрей Кузнецов — ещё один мой друг и давний коллега. Андрей возглавлял команду Самарского университета, которая была одной из важных частей большой команды, создавшей Kandinsky. Сейчас Андрей работает в институте AIRI и руководит большой группой исследователей, одним из главных направлений исследований которой является генеративное проектирование. В скором будущем модели, разрабатываемые Андреем и его коллегами, станут надёжными помощниками инженеров и промышленных дизайнеров.

10. @cgevent
Полюбившийся многим канал «Метаверсище и ИИще» Сергея Цыпцына. С Сергеем мы знакомы ещё по FB, и я всегда по-белому завидовал неуёмной энергии и энтузиазму Сергея в освоении новых генеративных технологий. Все важные инструменты, полезные современным цифровым художникам и дизайнерам, все перспективные модели и важнейшие события на стыке ИИ и творческой индустрии обязательно будут препарированы Сергеем с присущими ему вниманием, неподдельным интересом и тонкой иронией (куда же без неё).
Постпраздничное
12.05.202509:39
А крестовый поход против ИИ будет?
29.04.202509:20
🚀 Как мы научили GigaChat слышать: погружение в аудиомодальность

Опубликовали на Хабр технический разбор аудиомодальности GigaChat: архитектура, обучение, метрики и демо‑сценарии.

🔊 Зачем аудимодальность?
Связка распознавание речи (ASR) + GigaChat теряла смысловую информацию и не учитывала нюансы речи. End‑to‑end‑модель считывает звук напрямую и держит длинный аудиоконтекст.

🧠 Как учили
1. Audio-only Encoder Pre-training на 700k часов аудио.
2. Encoder ASR Fine-tuning на 100k часов аудио с транскрипциями.
3. Audio ⇄ Text Representations Alignment. С помощью облегчённого декодера GigaChat Lite мы согласовываем векторы аудио-энкодера с латентным пространством LLM. Такой «тёплый старт» сокращает число итераций на следующем этапе и экономит GPU-время.
4. Audio SFT GigaChat 2 Max — 10k часов на широком спектре задач (ASR, QA, Captioning, function calling, long-form summarization, ...).

📊 Результаты
• Side-by-Side GigaChat Audio vs ASR + GigaChat: 0.68 vs 0.32 — GigaChat Audio отвечает по существу, без добавления ложной информации, лучше понимает термины и английскую речь, справляется с анализом сцены и слышимости речи.
• Диалоговые свойства на русском языке на уровне GPT-4o (оценка людьми по 1200 диалогам в разрезе 7 критериев).
• Незначительная деградация базовых метрик: MMLU / IFEval просели ≤ 3 %.
• Обработка аудиозаписей до 170 минут.

Сценарии использования
• 📺 Краткое содержание — суммаризация часовых видео по аудиодорожке → https://giga.chat/link/gcscNrBMbT
• 🧑‍🎓 Языковой репетитор — интерактивная грамматика → https://giga.chat/link/gcsasCtOPX
• 📊 Анализ презентаций — темп, паузы, советы → https://giga.chat/link/gcsculCfiH
• 🌆 Описание звуковой сцены — неречевые аудио → https://giga.chat/link/gcsgenSGHJ

🖼 Экспериментальная мультимодальность: Vision + Audio
Последовательное дообучение позволяет поддерживать мультимодальный контекст без потерь в понимании изображений и аудио.


👉 Тестируйте уже сейчас: giga.chat или @gigachat_bot.
Надо брать
Log in to unlock more functionality.