Сергей Марков: машинное обучение, искусство и шитпостинг - टेलीग्राम चैनल पोस्ट

Мир сегодня с "Юрий Подоляка"

देखना

Труха⚡️Україна

देखना

Николаевский Ванёк

देखना

Мир сегодня с "Юрий Подоляка"

देखना

Труха⚡️Україна

देखना

Николаевский Ванёк

देखना

Сергей Марков: машинное обучение, искусство и шитпостинг

27.04.202513:02

23.04.202515:21

Мы опубликовали библиотеку «Russian Poetry Scansion Tool»! Спасибо большое за это Илье Козиеву

Ссылка на проект: https://github.com/RussianNLP/RussianPoetryScansionTool

В ридмишке проекта есть подробное описание и пример использования.

Что это такое?

RPST анализирует стихотворения (а еще песни и рэп, но это пока экспериментальные фичи), подбирает метр (ямб, хорей, амфибрахий, дактиль, анапест), детектирует точные и неточные рифмы, расставляет ударения и выдает оценку техничности стихотворения.

Техничность это число от 0 до 1. Для текстов, которые не распознаны как стихотворения, техничность равна 0. Для стихотворений с идеальным соответствием метра и наличием рифм техничность будет равна 1. Промежуточные значения отражают разные отступления и дефекты, обнаруженные в тексте. В целом, значения ниже 0.1 означают, что текст скорее всего нельзя считать стихотворением.

Таким образом, техничность это автоматическая метрика для оценки стихотворений, например сгенерированных LLM'кой.

Как установить?

git clone https://github.com/RussianNLP/RussianPoetryScansionTool.git

Все батарейки (орфоэпический словарь, модели и т.д.) включены, но из-за ограничений github на скачивание с LFS может появляться ошибка превышения квоты :( В таких случаях либо попробуйте скачать в другой день, либо стяните архив со словарем и моделями отсюда https://drive.google.com/file/d/1ofySC3c8EDTkx2GxDakw6gQJf_y0UUMA, распакуйте и укажите путь к распакованному подкаталогу при вызове create_rpst_instance.

Мы будем улучшать библиотеку, править ошибки, расширять поддержку разных жанров и поэтических форм. А еще посматриваем в сторону английской поэзии :) Будем рады любому фидбэку и предложениям!

21.04.202511:22

Этим Перельманом был ~~Альберт Эйнштейн~~ Николай Вавилов

Интересно, вот на каких идиотов это рассчитано?

18.04.202511:32

16.04.202519:15

Надо брать

13.04.202507:58

24.04.202517:08

23.04.202511:22

21.04.202508:14

Если у вас есть свой канал, то подхватывайте эстафету и расскажите, кого читаете вы, особенно если среди них есть те, кто ещё не известен широкой публике

18.04.202511:28

16.04.202510:50

11.04.202514:14

24.04.202517:08

3 мая редактор Антропогенез.ру Александр Соколов будет выступать в столице Армении на научно-популярном фестивале «Как тайное становится явным». Будут и другие спикеры форума «Учёные против мифов»:

🎙 Ольга Косникова — пищевой технолог, автор бестселлера «Страшная химия. Еда с Е-шками. Из чего делают нашу еду и почему не стоит ее бояться» и канала «Страшная химия»

🎙 Татьяна Хитрова — патологиня, преподавательница анатомии, создательница академии «Benign Education», автор книги «Твой последний врач» и спикер форума «Учёные против мифов»

🎙 Александр Соколов — научный журналист, глава оргкомитета форума «Ученые против мифов», редактор портала Антропогенез.ру, автор нескольких книг

🎙Марат Айрапетян — космический инженер, участник команды по созданию первого армянского спутника, специалист марсианской имитационной миссии AMADEE-24, автор блога «Юра, мы справимся!», амбассадор Техпросвет ВКонтакте

🎙 Ольга Жоголева — врач аллерголог-иммунолог, к.м.н., основательница и главный врач медицинского центра Everyday Clinic в Санкт-Петербурге, спикер форума «Учёные против мифов»

🎙 Сона Арсенян — арт-критик, автор статей о кино, искусстве и анимации

🎙Иван Семьян — археолог, к.и.н., спикер форума «Учёные против мифов», ведущий научный сотрудник лаборатории экспериментальной археологии НАН РА, проектный сотрудник Нью-Йоркского университета в Абу-Даби.
и другие

Подробности и билеты: https://fienta.com/kak-taynoe-stanovitsya-yavnym-festival-nauki-v-erevane

से पुनः पोस्ट किया:

The Layer

23.04.202510:42

GigaCheck — топ-1 решение в соревновании по определению авторства текстов на AINL 2025 🔥

Честно? Мы вообще не планировали. Просто увидели в одном паблике анонс соревнования по определению авторства текстов на AINL (крупнейшая восточноевропейская конференция по AI). Подумали: «А давай попробуем?».

Взяли за основу наш подход GigaCheck, обучили модель с нуля на данных соревнования, немного адаптировав под задачу… и, кажется, не зря 😅

На выходных подвели итоги — первое место! 🥇

Задача была нетривиальная: не просто определить, написан текст человеком или ИИ, но и точно указать, какой именно моделью он был сгенерирован (GPT-4 Turbo, Gemma 2-27B, LLaMA 3.3-70B и две другие модели).

Мы усилили GigaCheck, добавив дополнительную классификационную голову — и получили отличные результаты!

✅ На публичных тестовых данных, где в том числе были тексты, сгенерированные неизвестной моделью, не участвовавшей в тренировке, GigaCheck показал точность в 91% 🚀

✅ На приватном тестовом сете, включавшем тексты ещё одной неизвестной модели и тексты из двух новых доменов, которых GigaCheck также ранее не видел, точность достигла уверенных 86% 🏆

Наш результат оказался лучшим среди всех участников соревнования 👏

Это сильное подтверждение робастности и высокой способности GigaCheck к обобщению — даже в условиях особенно сложных out-of-domain и out-of-distribution задач!

21.04.202508:14

10 (из множества достойных) каналов, которые я читаю, и которые, возможно, будут интересны и вам. Специально подобрал, чтобы тут было не только про ИИ и машинное обучение, но без них, конечно, никак

1. @Ivan_Oseledets
Автор канала — Иван Оселедец — директор Института искусственного интеллекта (AIRI). Хотя Иван на 3 года меня младше, он, наверное, самый известный в России учёный в области ИИ, доктор наук, и вообще одна из светлых голов в отечественном ИИ. А ещё он сын недавно ушедшего от нас известного советского и российского математика Валерия Оселедца. В общем, при таких вводных удивительно, что подписчиков у него пока куда меньше, чем у меня

2. @yatsutkod
Автор канала — Денис Яцутко — на протяжении многих лет был редактором 22century.ru, сейчас вернулся из Москвы в родной Ставрополь. Денис — талантливый писатель и поэт, автор множества остроумных заметок, а ещё литературный редактор моей книги.

3. @darya_evtyushkina_psy
Дарья Евтюшкина — практикующий психолог, занимается психологическим консультированием, специализируется на вопросах, связанных с уверенностью, приятием себя и выстраиванием личных границ. Дарья не так давно начала вести канал, но уже рассказала много интересного о своей работе (и обязательно будет рассказывать дальше)

4. @noomarxism
Автор канала — Евгений Парфёнов — на мой взгляд один из лучших теоретиков современного диалектического материализма. Евгений прекрасно знаком с марксистской традицией и в то же время не относится к числу замшелых догматиков. В его канале вы можете познакомиться с живой теорией, неразрывно связанной с актуальной практикой, в том числе с тем, как развитие технологий ИИ влияет на общественные процессы

5. @dealerAI
Автор канала — Александр Абрамов — один из лучших (если не лучший) в нашей стране специалистов по энкодерным моделям. Я горд тем, что он работает в моей команде, и благодаря его усилиям мы будем продолжать радовать open-source-коммьюнити новыми эмбеддерами, поисковыми технологиями, бенчмарками и другими вкусностями

6. @floppy_pictures
У канала Каси Кульковой, конечно, должны быть минимум 100 тыщ подписчиков, потому что ну а сколько у нас в стране бородатых ностальгирующих IT-шников, которым для поддержания должного уровня серотонина срочно нужны проверенные мемы с CD-дисков и дискет?

7. @doomgrad
Сергей Аверкиев — ещё один талант в нашей команде. В его канале можно найти всё от развития технологий ИИ для поддержки языкового разнообразия до тюнинга text2image-моделей для более качественного рисования братьев Стругацких (к которым отсылает и название канала Сергея).

8. @dendi_math_ai
Денис Димитров — мой давний коллега и добрый друг. Много лет наши команды совместно работали сначала над ruDALL-E Malevich, а потом над Kandinsky. За 3 последних года на базе Kandinsky появилось множество популярных продуктов и сервисов, модель завоевала популярность в сообществе разработчиков открытого ПО. Канал Дениса рассказывает о новостях в машинном обучении и последних достижениях в области изобразительного ИИ.

9. @complete_ai
Андрей Кузнецов — ещё один мой друг и давний коллега. Андрей возглавлял команду Самарского университета, которая была одной из важных частей большой команды, создавшей Kandinsky. Сейчас Андрей работает в институте AIRI и руководит большой группой исследователей, одним из главных направлений исследований которой является генеративное проектирование. В скором будущем модели, разрабатываемые Андреем и его коллегами, станут надёжными помощниками инженеров и промышленных дизайнеров.

10. @cgevent
Полюбившийся многим канал «Метаверсище и ИИще» Сергея Цыпцына. С Сергеем мы знакомы ещё по FB, и я всегда по-белому завидовал неуёмной энергии и энтузиазму Сергея в освоении новых генеративных технологий. Все важные инструменты, полезные современным цифровым художникам и дизайнерам, все перспективные модели и важнейшие события на стыке ИИ и творческой индустрии обязательно будут препарированы Сергеем с присущими ему вниманием, неподдельным интересом и тонкой иронией (куда же без неё).

17.04.202515:32

से पुनः पोस्ट किया:

GigaChat

14.04.202514:39

Ощутите на себе ГИГА-эффект нового GigaChat 2.0 🔥

Новый GigaChat 2.0 теперь с вами! Встречайте нейросеть с крутыми возможностями и скорее пробуйте сами 👇

🟢найдёт актуальную информацию в интернете и даст ответы со ссылками на источники
Подбери крутой детектив на вечер

🟢проанализирует документы до 200 страниц

Сделай краткий обзор этой научной статьи и выдели главные открытия [приложить pdf-файл]

🟢создаст музыку и песни по вашему запросу
Сочини романтическую песню о весне в Петербурге в стиле джаз

🟢проанализирует голосовые сообщения и аудиофайлы длиной до 60 минут
Выслушай мою идею и составь по ней бизнес-план [ваша аудиозапись]

🟢распознает изображения — от расшифровки медицинских анализов до советов по стилю
Мне пришла квитанция ЖКХ. Объясни, за что я плачу? [фото квитанции]

🟢проанализирует ссылки
сравни основные идеи этих двух статей: [ссылка1] и [ссылка2]

🔘А умные колонки Sber теперь полностью под управлением GigaChat 2.0: обработка запросов станет ещё быстрее, а общение — ещё более естественным
Салют, объясни теорию относительности семилетнему ребёнку

➡️ Попробуйте на сайте, в телеграм-боте и в новом мессенджере MAX от VK и испытайте настоящий ГИГА-эффект

😎 Ваш помощник всегда рядом

11.04.202514:08

Завтра буду выступать на non/fictioN, приходите)

से पुनः पोस्ट किया:

gonzo-обзоры ML статей

24.04.202514:20

Концепция изменилась

23.04.202510:36

24-25 апреля выступаю на конференции «Нейропрокачка 3.0», тема выступления будет «От генеративного ИИ к интерактивному: основные направления развития технологий». Если интересно, приходите послушать (от меня участникам будут небольшие плюшки).

На конференции выступят также эксперты из Северсталь-ЦЕС, Сбера, Билайн, Альпина Digital и создатели моделей машинного обучения.

👉Регистрируйтесь бесплатно здесь:
https://iiuniversitet.ru/conf?utm_source=speaker&utm_medium=sergey_sberdevice&utm_campaign=conf&utm_term=240425

P. S. Подумал, что хорошо бы провести конференцию «Нейрооткачка», посвящённую каверам сами знаете на что

20.04.202511:01

Я все думал, что же из детства мне так напоминают эти корпоративные танцы вокруг ИИ-агентов... и тут вспомнил, какие книги ~~ломали~~ формировали нашу психику. Лайк кто читал.

से पुनः पोस्ट किया:

KOSTI

17.04.202514:52

Мы попросили GigaChat 2.0 написать трек про Бомбадиро Крокодило. Получилось на удивление круто. Настолько, что в какой-то момент даже забываешь, что всё это началось как чистый брейнрот.

Музыка стала дольше — теперь можно генерить треки до 3 минут. Причём времени уходит столько же, сколько раньше на полторашку. Звук тоже прокачали: лучше саунд и лучше попадание в запрос.

Новая модель GigaChat почти сравнялась с Suno v4 — 49 на 51. Это уже не просто болталка. Это студия в одном чате.

KOSTI

14.04.202514:39

GigaChat 2 раскатили на все поверхности, в т. ч. в телегу

से पुनः पोस्ट किया:

XX2 век

11.04.202514:07

Программа ярмарки non/fictioN весна

https://22century.ru/scientific-and-technological-activities/non-fiction-10-apr

दिखाया गया 1 - 24 का 121

अधिक कार्यक्षमता अनलॉक करने के लिए लॉगिन करें।

उद्धरण

उद्धरण