

27.04.202513:02
23.04.202515:21
Мы опубликовали библиотеку «Russian Poetry Scansion Tool»! Спасибо большое за это Илье Козиеву
Ссылка на проект: https://github.com/RussianNLP/RussianPoetryScansionTool
В ридмишке проекта есть подробное описание и пример использования.
Что это такое?
RPST анализирует стихотворения (а еще песни и рэп, но это пока экспериментальные фичи), подбирает метр (ямб, хорей, амфибрахий, дактиль, анапест), детектирует точные и неточные рифмы, расставляет ударения и выдает оценку техничности стихотворения.
Техничность это число от 0 до 1. Для текстов, которые не распознаны как стихотворения, техничность равна 0. Для стихотворений с идеальным соответствием метра и наличием рифм техничность будет равна 1. Промежуточные значения отражают разные отступления и дефекты, обнаруженные в тексте. В целом, значения ниже 0.1 означают, что текст скорее всего нельзя считать стихотворением.
Таким образом, техничность это автоматическая метрика для оценки стихотворений, например сгенерированных LLM'кой.
Как установить?
Все батарейки (орфоэпический словарь, модели и т.д.) включены, но из-за ограничений github на скачивание с LFS может появляться ошибка превышения квоты :( В таких случаях либо попробуйте скачать в другой день, либо стяните архив со словарем и моделями отсюда https://drive.google.com/file/d/1ofySC3c8EDTkx2GxDakw6gQJf_y0UUMA, распакуйте и укажите путь к распакованному подкаталогу при вызове create_rpst_instance.
Мы будем улучшать библиотеку, править ошибки, расширять поддержку разных жанров и поэтических форм. А еще посматриваем в сторону английской поэзии :) Будем рады любому фидбэку и предложениям!
Ссылка на проект: https://github.com/RussianNLP/RussianPoetryScansionTool
В ридмишке проекта есть подробное описание и пример использования.
Что это такое?
RPST анализирует стихотворения (а еще песни и рэп, но это пока экспериментальные фичи), подбирает метр (ямб, хорей, амфибрахий, дактиль, анапест), детектирует точные и неточные рифмы, расставляет ударения и выдает оценку техничности стихотворения.
Техничность это число от 0 до 1. Для текстов, которые не распознаны как стихотворения, техничность равна 0. Для стихотворений с идеальным соответствием метра и наличием рифм техничность будет равна 1. Промежуточные значения отражают разные отступления и дефекты, обнаруженные в тексте. В целом, значения ниже 0.1 означают, что текст скорее всего нельзя считать стихотворением.
Таким образом, техничность это автоматическая метрика для оценки стихотворений, например сгенерированных LLM'кой.
Как установить?
git clone https://github.com/RussianNLP/RussianPoetryScansionTool.git
Все батарейки (орфоэпический словарь, модели и т.д.) включены, но из-за ограничений github на скачивание с LFS может появляться ошибка превышения квоты :( В таких случаях либо попробуйте скачать в другой день, либо стяните архив со словарем и моделями отсюда https://drive.google.com/file/d/1ofySC3c8EDTkx2GxDakw6gQJf_y0UUMA, распакуйте и укажите путь к распакованному подкаталогу при вызове create_rpst_instance.
Мы будем улучшать библиотеку, править ошибки, расширять поддержку разных жанров и поэтических форм. А еще посматриваем в сторону английской поэзии :) Будем рады любому фидбэку и предложениям!


21.04.202511:22
Этим Перельманом был Альберт Эйнштейн Николай Вавилов
Интересно, вот на каких идиотов это рассчитано?
Интересно, вот на каких идиотов это рассчитано?


18.04.202511:32


16.04.202519:15
Надо брать


13.04.202507:58


24.04.202517:08


23.04.202511:22
21.04.202508:14
Если у вас есть свой канал, то подхватывайте эстафету и расскажите, кого читаете вы, особенно если среди них есть те, кто ещё не известен широкой публике


18.04.202511:28


16.04.202510:50


11.04.202514:14
24.04.202517:08
3 мая редактор Антропогенез.ру Александр Соколов будет выступать в столице Армении на научно-популярном фестивале «Как тайное становится явным». Будут и другие спикеры форума «Учёные против мифов»:
🎙 Ольга Косникова — пищевой технолог, автор бестселлера «Страшная химия. Еда с Е-шками. Из чего делают нашу еду и почему не стоит ее бояться» и канала «Страшная химия»
🎙 Татьяна Хитрова — патологиня, преподавательница анатомии, создательница академии «Benign Education», автор книги «Твой последний врач» и спикер форума «Учёные против мифов»
🎙 Александр Соколов — научный журналист, глава оргкомитета форума «Ученые против мифов», редактор портала Антропогенез.ру, автор нескольких книг
🎙Марат Айрапетян — космический инженер, участник команды по созданию первого армянского спутника, специалист марсианской имитационной миссии AMADEE-24, автор блога «Юра, мы справимся!», амбассадор Техпросвет ВКонтакте
🎙 Ольга Жоголева — врач аллерголог-иммунолог, к.м.н., основательница и главный врач медицинского центра Everyday Clinic в Санкт-Петербурге, спикер форума «Учёные против мифов»
🎙 Сона Арсенян — арт-критик, автор статей о кино, искусстве и анимации
🎙Иван Семьян — археолог, к.и.н., спикер форума «Учёные против мифов», ведущий научный сотрудник лаборатории экспериментальной археологии НАН РА, проектный сотрудник Нью-Йоркского университета в Абу-Даби.
и другие
Подробности и билеты: https://fienta.com/kak-taynoe-stanovitsya-yavnym-festival-nauki-v-erevane
🎙 Ольга Косникова — пищевой технолог, автор бестселлера «Страшная химия. Еда с Е-шками. Из чего делают нашу еду и почему не стоит ее бояться» и канала «Страшная химия»
🎙 Татьяна Хитрова — патологиня, преподавательница анатомии, создательница академии «Benign Education», автор книги «Твой последний врач» и спикер форума «Учёные против мифов»
🎙 Александр Соколов — научный журналист, глава оргкомитета форума «Ученые против мифов», редактор портала Антропогенез.ру, автор нескольких книг
🎙Марат Айрапетян — космический инженер, участник команды по созданию первого армянского спутника, специалист марсианской имитационной миссии AMADEE-24, автор блога «Юра, мы справимся!», амбассадор Техпросвет ВКонтакте
🎙 Ольга Жоголева — врач аллерголог-иммунолог, к.м.н., основательница и главный врач медицинского центра Everyday Clinic в Санкт-Петербурге, спикер форума «Учёные против мифов»
🎙 Сона Арсенян — арт-критик, автор статей о кино, искусстве и анимации
🎙Иван Семьян — археолог, к.и.н., спикер форума «Учёные против мифов», ведущий научный сотрудник лаборатории экспериментальной археологии НАН РА, проектный сотрудник Нью-Йоркского университета в Абу-Даби.
и другие
Подробности и билеты: https://fienta.com/kak-taynoe-stanovitsya-yavnym-festival-nauki-v-erevane
से पुनः पोस्ट किया:
The Layer



23.04.202510:42
GigaCheck — топ-1 решение в соревновании по определению авторства текстов на AINL 2025 🔥
Честно? Мы вообще не планировали. Просто увидели в одном паблике анонс соревнования по определению авторства текстов на AINL (крупнейшая восточноевропейская конференция по AI). Подумали: «А давай попробуем?».
Взяли за основу наш подход GigaCheck, обучили модель с нуля на данных соревнования, немного адаптировав под задачу… и, кажется, не зря 😅
На выходных подвели итоги — первое место! 🥇
Задача была нетривиальная: не просто определить, написан текст человеком или ИИ, но и точно указать, какой именно моделью он был сгенерирован (GPT-4 Turbo, Gemma 2-27B, LLaMA 3.3-70B и две другие модели).
Мы усилили GigaCheck, добавив дополнительную классификационную голову — и получили отличные результаты!
✅ На публичных тестовых данных, где в том числе были тексты, сгенерированные неизвестной моделью, не участвовавшей в тренировке, GigaCheck показал точность в 91% 🚀
✅ На приватном тестовом сете, включавшем тексты ещё одной неизвестной модели и тексты из двух новых доменов, которых GigaCheck также ранее не видел, точность достигла уверенных 86% 🏆
Наш результат оказался лучшим среди всех участников соревнования 👏
Это сильное подтверждение робастности и высокой способности GigaCheck к обобщению — даже в условиях особенно сложных out-of-domain и out-of-distribution задач!
Честно? Мы вообще не планировали. Просто увидели в одном паблике анонс соревнования по определению авторства текстов на AINL (крупнейшая восточноевропейская конференция по AI). Подумали: «А давай попробуем?».
Взяли за основу наш подход GigaCheck, обучили модель с нуля на данных соревнования, немного адаптировав под задачу… и, кажется, не зря 😅
На выходных подвели итоги — первое место! 🥇
Задача была нетривиальная: не просто определить, написан текст человеком или ИИ, но и точно указать, какой именно моделью он был сгенерирован (GPT-4 Turbo, Gemma 2-27B, LLaMA 3.3-70B и две другие модели).
Мы усилили GigaCheck, добавив дополнительную классификационную голову — и получили отличные результаты!
✅ На публичных тестовых данных, где в том числе были тексты, сгенерированные неизвестной моделью, не участвовавшей в тренировке, GigaCheck показал точность в 91% 🚀
✅ На приватном тестовом сете, включавшем тексты ещё одной неизвестной модели и тексты из двух новых доменов, которых GigaCheck также ранее не видел, точность достигла уверенных 86% 🏆
Наш результат оказался лучшим среди всех участников соревнования 👏
Это сильное подтверждение робастности и высокой способности GigaCheck к обобщению — даже в условиях особенно сложных out-of-domain и out-of-distribution задач!
21.04.202508:14
10 (из множества достойных) каналов, которые я читаю, и которые, возможно, будут интересны и вам. Специально подобрал, чтобы тут было не только про ИИ и машинное обучение, но без них, конечно, никак
1. @Ivan_Oseledets
Автор канала — Иван Оселедец — директор Института искусственного интеллекта (AIRI). Хотя Иван на 3 года меня младше, он, наверное, самый известный в России учёный в области ИИ, доктор наук, и вообще одна из светлых голов в отечественном ИИ. А ещё он сын недавно ушедшего от нас известного советского и российского математика Валерия Оселедца. В общем, при таких вводных удивительно, что подписчиков у него пока куда меньше, чем у меня
2. @yatsutkod
Автор канала — Денис Яцутко — на протяжении многих лет был редактором 22century.ru, сейчас вернулся из Москвы в родной Ставрополь. Денис — талантливый писатель и поэт, автор множества остроумных заметок, а ещё литературный редактор моей книги.
3. @darya_evtyushkina_psy
Дарья Евтюшкина — практикующий психолог, занимается психологическим консультированием, специализируется на вопросах, связанных с уверенностью, приятием себя и выстраиванием личных границ. Дарья не так давно начала вести канал, но уже рассказала много интересного о своей работе (и обязательно будет рассказывать дальше)
4. @noomarxism
Автор канала — Евгений Парфёнов — на мой взгляд один из лучших теоретиков современного диалектического материализма. Евгений прекрасно знаком с марксистской традицией и в то же время не относится к числу замшелых догматиков. В его канале вы можете познакомиться с живой теорией, неразрывно связанной с актуальной практикой, в том числе с тем, как развитие технологий ИИ влияет на общественные процессы
5. @dealerAI
Автор канала — Александр Абрамов — один из лучших (если не лучший) в нашей стране специалистов по энкодерным моделям. Я горд тем, что он работает в моей команде, и благодаря его усилиям мы будем продолжать радовать open-source-коммьюнити новыми эмбеддерами, поисковыми технологиями, бенчмарками и другими вкусностями
6. @floppy_pictures
У канала Каси Кульковой, конечно, должны быть минимум 100 тыщ подписчиков, потому что ну а сколько у нас в стране бородатых ностальгирующих IT-шников, которым для поддержания должного уровня серотонина срочно нужны проверенные мемы с CD-дисков и дискет?
7. @doomgrad
Сергей Аверкиев — ещё один талант в нашей команде. В его канале можно найти всё от развития технологий ИИ для поддержки языкового разнообразия до тюнинга text2image-моделей для более качественного рисования братьев Стругацких (к которым отсылает и название канала Сергея).
8. @dendi_math_ai
Денис Димитров — мой давний коллега и добрый друг. Много лет наши команды совместно работали сначала над ruDALL-E Malevich, а потом над Kandinsky. За 3 последних года на базе Kandinsky появилось множество популярных продуктов и сервисов, модель завоевала популярность в сообществе разработчиков открытого ПО. Канал Дениса рассказывает о новостях в машинном обучении и последних достижениях в области изобразительного ИИ.
9. @complete_ai
Андрей Кузнецов — ещё один мой друг и давний коллега. Андрей возглавлял команду Самарского университета, которая была одной из важных частей большой команды, создавшей Kandinsky. Сейчас Андрей работает в институте AIRI и руководит большой группой исследователей, одним из главных направлений исследований которой является генеративное проектирование. В скором будущем модели, разрабатываемые Андреем и его коллегами, станут надёжными помощниками инженеров и промышленных дизайнеров.
10. @cgevent
Полюбившийся многим канал «Метаверсище и ИИще» Сергея Цыпцына. С Сергеем мы знакомы ещё по FB, и я всегда по-белому завидовал неуёмной энергии и энтузиазму Сергея в освоении новых генеративных технологий. Все важные инструменты, полезные современным цифровым художникам и дизайнерам, все перспективные модели и важнейшие события на стыке ИИ и творческой индустрии обязательно будут препарированы Сергеем с присущими ему вниманием, неподдельным интересом и тонкой иронией (куда же без неё).
1. @Ivan_Oseledets
Автор канала — Иван Оселедец — директор Института искусственного интеллекта (AIRI). Хотя Иван на 3 года меня младше, он, наверное, самый известный в России учёный в области ИИ, доктор наук, и вообще одна из светлых голов в отечественном ИИ. А ещё он сын недавно ушедшего от нас известного советского и российского математика Валерия Оселедца. В общем, при таких вводных удивительно, что подписчиков у него пока куда меньше, чем у меня
2. @yatsutkod
Автор канала — Денис Яцутко — на протяжении многих лет был редактором 22century.ru, сейчас вернулся из Москвы в родной Ставрополь. Денис — талантливый писатель и поэт, автор множества остроумных заметок, а ещё литературный редактор моей книги.
3. @darya_evtyushkina_psy
Дарья Евтюшкина — практикующий психолог, занимается психологическим консультированием, специализируется на вопросах, связанных с уверенностью, приятием себя и выстраиванием личных границ. Дарья не так давно начала вести канал, но уже рассказала много интересного о своей работе (и обязательно будет рассказывать дальше)
4. @noomarxism
Автор канала — Евгений Парфёнов — на мой взгляд один из лучших теоретиков современного диалектического материализма. Евгений прекрасно знаком с марксистской традицией и в то же время не относится к числу замшелых догматиков. В его канале вы можете познакомиться с живой теорией, неразрывно связанной с актуальной практикой, в том числе с тем, как развитие технологий ИИ влияет на общественные процессы
5. @dealerAI
Автор канала — Александр Абрамов — один из лучших (если не лучший) в нашей стране специалистов по энкодерным моделям. Я горд тем, что он работает в моей команде, и благодаря его усилиям мы будем продолжать радовать open-source-коммьюнити новыми эмбеддерами, поисковыми технологиями, бенчмарками и другими вкусностями
6. @floppy_pictures
У канала Каси Кульковой, конечно, должны быть минимум 100 тыщ подписчиков, потому что ну а сколько у нас в стране бородатых ностальгирующих IT-шников, которым для поддержания должного уровня серотонина срочно нужны проверенные мемы с CD-дисков и дискет?
7. @doomgrad
Сергей Аверкиев — ещё один талант в нашей команде. В его канале можно найти всё от развития технологий ИИ для поддержки языкового разнообразия до тюнинга text2image-моделей для более качественного рисования братьев Стругацких (к которым отсылает и название канала Сергея).
8. @dendi_math_ai
Денис Димитров — мой давний коллега и добрый друг. Много лет наши команды совместно работали сначала над ruDALL-E Malevich, а потом над Kandinsky. За 3 последних года на базе Kandinsky появилось множество популярных продуктов и сервисов, модель завоевала популярность в сообществе разработчиков открытого ПО. Канал Дениса рассказывает о новостях в машинном обучении и последних достижениях в области изобразительного ИИ.
9. @complete_ai
Андрей Кузнецов — ещё один мой друг и давний коллега. Андрей возглавлял команду Самарского университета, которая была одной из важных частей большой команды, создавшей Kandinsky. Сейчас Андрей работает в институте AIRI и руководит большой группой исследователей, одним из главных направлений исследований которой является генеративное проектирование. В скором будущем модели, разрабатываемые Андреем и его коллегами, станут надёжными помощниками инженеров и промышленных дизайнеров.
10. @cgevent
Полюбившийся многим канал «Метаверсище и ИИще» Сергея Цыпцына. С Сергеем мы знакомы ещё по FB, и я всегда по-белому завидовал неуёмной энергии и энтузиазму Сергея в освоении новых генеративных технологий. Все важные инструменты, полезные современным цифровым художникам и дизайнерам, все перспективные модели и важнейшие события на стыке ИИ и творческой индустрии обязательно будут препарированы Сергеем с присущими ему вниманием, неподдельным интересом и тонкой иронией (куда же без неё).


17.04.202515:32
से पुनः पोस्ट किया:
GigaChat



14.04.202514:39
Ощутите на себе ГИГА-эффект нового GigaChat 2.0 🔥
Новый GigaChat 2.0 теперь с вами! Встречайте нейросеть с крутыми возможностями и скорее пробуйте сами 👇
🟢найдёт актуальную информацию в интернете и даст ответы со ссылками на источники
🟢проанализирует документы до 200 страниц
🟢создаст музыку и песни по вашему запросу
🟢проанализирует голосовые сообщения и аудиофайлы длиной до 60 минут
🟢распознает изображения — от расшифровки медицинских анализов до советов по стилю
🟢проанализирует ссылки
🔘А умные колонки Sber теперь полностью под управлением GigaChat 2.0: обработка запросов станет ещё быстрее, а общение — ещё более естественным
➡️ Попробуйте на сайте, в телеграм-боте и в новом мессенджере MAX от VK и испытайте настоящий ГИГА-эффект
😎 Ваш помощник всегда рядом
Новый GigaChat 2.0 теперь с вами! Встречайте нейросеть с крутыми возможностями и скорее пробуйте сами 👇
🟢найдёт актуальную информацию в интернете и даст ответы со ссылками на источники
Подбери крутой детектив на вечер
🟢проанализирует документы до 200 страниц
Сделай краткий обзор этой научной статьи и выдели главные открытия [приложить pdf-файл]
🟢создаст музыку и песни по вашему запросу
Сочини романтическую песню о весне в Петербурге в стиле джаз
🟢проанализирует голосовые сообщения и аудиофайлы длиной до 60 минут
Выслушай мою идею и составь по ней бизнес-план [ваша аудиозапись]
🟢распознает изображения — от расшифровки медицинских анализов до советов по стилю
Мне пришла квитанция ЖКХ. Объясни, за что я плачу? [фото квитанции]
🟢проанализирует ссылки
сравни основные идеи этих двух статей: [ссылка1] и [ссылка2]
🔘А умные колонки Sber теперь полностью под управлением GigaChat 2.0: обработка запросов станет ещё быстрее, а общение — ещё более естественным
Салют, объясни теорию относительности семилетнему ребёнку
➡️ Попробуйте на сайте, в телеграм-боте и в новом мессенджере MAX от VK и испытайте настоящий ГИГА-эффект
😎 Ваш помощник всегда рядом


11.04.202514:08
Завтра буду выступать на non/fictioN, приходите)


23.04.202510:36
24-25 апреля выступаю на конференции «Нейропрокачка 3.0», тема выступления будет «От генеративного ИИ к интерактивному: основные направления развития технологий». Если интересно, приходите послушать (от меня участникам будут небольшие плюшки).
На конференции выступят также эксперты из Северсталь-ЦЕС, Сбера, Билайн, Альпина Digital и создатели моделей машинного обучения.
👉Регистрируйтесь бесплатно здесь:
https://iiuniversitet.ru/conf?utm_source=speaker&utm_medium=sergey_sberdevice&utm_campaign=conf&utm_term=240425
P. S. Подумал, что хорошо бы провести конференцию «Нейрооткачка», посвящённую каверам сами знаете на что
На конференции выступят также эксперты из Северсталь-ЦЕС, Сбера, Билайн, Альпина Digital и создатели моделей машинного обучения.
👉Регистрируйтесь бесплатно здесь:
https://iiuniversitet.ru/conf?utm_source=speaker&utm_medium=sergey_sberdevice&utm_campaign=conf&utm_term=240425
P. S. Подумал, что хорошо бы провести конференцию «Нейрооткачка», посвящённую каверам сами знаете на что


20.04.202511:01
Я все думал, что же из детства мне так напоминают эти корпоративные танцы вокруг ИИ-агентов... и тут вспомнил, какие книги ломали формировали нашу психику. Лайк кто читал.
से पुनः पोस्ट किया:
KOSTI

17.04.202514:52
Мы попросили GigaChat 2.0 написать трек про Бомбадиро Крокодило. Получилось на удивление круто. Настолько, что в какой-то момент даже забываешь, что всё это началось как чистый брейнрот.
Музыка стала дольше — теперь можно генерить треки до 3 минут. Причём времени уходит столько же, сколько раньше на полторашку. Звук тоже прокачали: лучше саунд и лучше попадание в запрос.
Новая модель GigaChat почти сравнялась с Suno v4 — 49 на 51. Это уже не просто болталка. Это студия в одном чате.
KOSTI
Музыка стала дольше — теперь можно генерить треки до 3 минут. Причём времени уходит столько же, сколько раньше на полторашку. Звук тоже прокачали: лучше саунд и лучше попадание в запрос.
Новая модель GigaChat почти сравнялась с Suno v4 — 49 на 51. Это уже не просто болталка. Это студия в одном чате.
KOSTI
14.04.202514:39
GigaChat 2 раскатили на все поверхности, в т. ч. в телегу
से पुनः पोस्ट किया:
XX2 век



11.04.202514:07
Программа ярмарки non/fictioN весна
https://22century.ru/scientific-and-technological-activities/non-fiction-10-apr
https://22century.ru/scientific-and-technological-activities/non-fiction-10-apr
दिखाया गया 1 - 24 का 121
अधिक कार्यक्षमता अनलॉक करने के लिए लॉगिन करें।