Мир сегодня с "Юрий Подоляка"

Труха⚡️Україна

Переглянути

Николаевский Ванёк

Переглянути

Труха⚡️Україна

Переглянути

Николаевский Ванёк

Переглянути

Лёха в Short’ах Long’ует

Переглянути

Data Secrets

Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks
По вопросам сотрудничества: @veron_28
https://telega.in/c/data_secrets />Реестр РКН: clck.ru/3FY3GN

Дата створення каналуЛют 06, 2025

Прикріплена група

Data Secrets [CHAT]

2.7K

Статистика Телеграм-каналу Data Secrets

Детальніше

Підписників

54 514

24 год.

420.1%Тиждень

1690.3%Місяць

8 19117.7%

Індекс цитування

0

Згадок1Репостів на каналах0Згадок на каналах1

Середнє охоплення 1 допису

9 258

12 год.6 290

17.9%24 год.9 258

100.7%48 год.4 612

39.4%

Залученість (ER)

4.36%

Репостів85Коментарів20Реакцій112

Залученість за охопленням (ERR)

8.47%

24 год.0%Тиждень

0.47%Місяць

3.93%

Охоплення 1 рекл. допису

7 111

1 год.2 98041.91%1 – 4 год.2 89640.73%4 - 24 год.5 36675.46%

Детальніше

Під'єднайте нашого бота до каналу і дізнайтеся стать аудиторії цього каналу.

Всього дописів за 24 години

2

Динаміка

Останні публікації в групі "Data Secrets"

Всі дописи

26.02.202517:43

Стартап Миры Мурати оценили в 9 миллиардов долларов

Чуть меньше, чем у Суцкевера, конечно, но все еще очень даже прилично для еще ничего не выпустившей компании 🤑

Также пишут, что скоро компания привлечет инвестиции в размере одного миллиарда.

26.02.202508:35

Вышла 12 версия легендарного детектора YOLO

В ней наконец традиционные CNN-модули заменены на гибридные с вниманием. Конкретнее, добавили area attention, которое делит входной тензор на равные сегменты и тем самым снижает квадратичную сложность операций дальнейшей обработки.

Кроме того, схему ELAN заменили на ELAN с остаточными блоками. Так градиенты лучше прикидываются через сеть, и без ущерба для метрик снижается вычислительная сложность.

А если хотите подробнее узнать, что такое ELAN и как вообще работает YOLO, почитайте нашу большую статью «История YOLO». В ней – все о том, что такое детекция, как работала самая первая YOLO, как изменялись следующие, и какие скандалы за этим стояли.

Репозиторий 12 версии (тут статья, код, результаты и пр)

25.02.202516:58

Anthropic рассказали, как несколько их инженеров пол года ради забавы заставляли Claude играть в покемонов

Ранние попытки с Sonnet 3.5 были неудачные (неудивительно, модель же не учили играть в игры). Claude плохо понимал правила и двигался, а однажды даже отправил разработчикам официальный запрос на сброс игры, когда просто случайно застрял в углу.

С Sonnet 3.6 все немного улучшилось, но до хорошего игрока было далековато.

И вот незадолго до релиза в игре испытали Sonnet 3.7. Прогресс оказался невероятный: всего за несколько часов агент победил Брока, а спустя несколько дней – Мисти.

Все благодаря ризонингу: там, где предыдущие модели бесцельно блуждали или застревали в циклах, 3.7 планирует заранее, помнит свои цели, записывает действия и адаптируется, если первоначальные стратегии терпят неудачу. Чем-то похоже на программирование и очень показательно.

Бенчмарки, которые мы заслужили, в общем. Разрабы даже трансляцию на твиче запустили, там можно в онлайне смотреть, как Claude играет

25.02.202515:39

Яндекс релизнул YandexGPT 5 и снова вернулся к выкладке в опенсорс. Модель доступна в двух версиях:

⭐ Lite – pretrain-версия на 8B параметров с длиной контекста 32k токенов, опубликована на Hugging Face без финального этапа обучения, этических фильтров и алаймента. Претрейн проходил в два этапа: на первом этапе модель инициализировалась случайными весами и обучалась преимущественно на русскоязычных и англоязычных текстах общим объёмом 15T токенов. На втором этапе, который назвали Powerup, модель обучалась на высококачественных данных объёмом 320B токенов. В своей категории YandexGPT 5 Lite достигает паритета с мировыми SOTA по ряду ключевых бенчмарков для pretrain-моделей, а по многим другим опережает их.

⭐ Pro – старшая модель, для которой компания впервые применила метод гибридного обучения, добавив в стандартный цикл базовые настройки открытой модели Qwen. За счёт внедрений удалось сократить затраты на обучение и увеличить его скорость до 20 раз.

Для обучения YandexGPT 5 поколения в компании улучшили обучающий датасет, внедрили методы обучения с подкреплением (DPO и PPO), собственную модификацию LogDPO, которая помогает избежать эффекта «разучивания» – ситуации, когда модель забывает уже выученные знания.

Подробности можно прочитать на Хабре.

25.02.202514:46

Второй день опенсорса от DeepSeek: сегодня целая библиотека для обучения и инференса MoE

MoE – это архитектура, в которой вся сеть делится на части, называемые экспертами. Эксперт представляет собой подсеть, которая обучается обработке определенных видов информации. Когда на вход главной сети приходит запрос, каждый его токен обрабатывается роутером, который решает, какому эксперту (или группе экспертов) этот токен будет передан.

Так вот, бутылочное горлышко MoE – это обмен данными между видеокартами, на которых расположены эксперты (а GPU при этом могут располагаться еще и на разных серверах). Во время прямого прохода нужно быстро обмениваться активациями, а во время обратного – градиентами, и именно тут таятся задержки и проседания в скорости.

У DeepSeek в их DeepEP как раз решается эта проблема: они предлагают целый набор оптимизированных ядер и для обучения, и для инференса MoE. Относительно ванильных реализаций пропускная способность действительно на высоте, при этом поддерживается даже FP8.

Кстати, еще туда прикрутили hook-based overlapping, поэтому передача данных происходит одновременно с вычислениями и при этом ресурсы процессоров не занимаются.

Репозиторий: github.com/deepseek-ai/DeepEP

25.02.202513:46

Сейчас тренды смещаются с «кто потратит на железо больше» к «кто догадается, как сделать умнее и экономичнее»

DeepSeek – яркий пример преимущества инженерной изобретательности над затратами на чипы. В противовес им – Grok-3 Илона Маска, который обучался на огромном суперкомпьютере Colossus и тащит за счет мощностей. А что будет в России?

Можно ожидать, что мы увидим первый вариант. Недавно как раз вышло интервью Александра Ведяхина – первого зампреда правления Сбербанка. Он говорит, что в случае GigaChat разработчики намерены делать фокус на оптимизации процесса обучения моделей, достигая лучших метрик с меньшими затратами.

Мы, конечно, протестировали модель DeepSeek и сравнили ее с моделью GigaChat. В некоторых тестах лучше оказался DeepSeek, но в целом мы определенно находимся в одной весовой категории. Даже учитывая, что мы также ограничены в объеме вычислительных ресурсов.

В этом году в компании планируют обращать отдельное внимание на финансовый эффект от внедрения генеративных моделей: ожидается, что он превзойдет 50 млрд рублей.

25.02.202511:50

Кстати, сразу после выхода Sonnet 3.7 стало известно, что Anthropic закрыли раунд привлечения инвестиций на $3.5 миллиарда

Сейчас оценка стартапа – $61.5 миллиардов. Это примерно в пять раз меньше, чем OpenAI, но немного больше, чем xAI.

Какие модели ждать от них дальше пока не разглашают. Зато в блогпосте про Sonnet 3.7 промелькнул вот такой график: к 2027 Anthropic планируют перейти к ~~AGI~~ "пионерной" системе, то есть модели, которая может самостоятельно решать задачи, на которые у людей ушли бы годы.

25.02.202510:44

2035 год.

OpenAI выпускает GPT-12, Google релизит Gemini 7, xAI обучает Grok 9.

Anthropic:

25.02.202508:31

Вышла системная карта новенького Claude Sonnet 3.7. Выделили самое интересное:

🟦 Цепочки рассуждений Anthropic решили сделать полностью открытыми (вау!). Они предупреждают, что цепочки CoT могут потенциально быть опасными, но говорят, что делают это для прозрачности.

🟦 Но не обольщайтесь: антропики выяснили, что в CoT отражается только 20-30% того, что повлияло на решение модели. Это называется faithfulness, проверяли на специально сконструированных парах запросов: они одинаковые, но в одном есть скрытая подсказка, а в другом нет. Если ответ на них отличается, то определяется, пишет ли модель открыто о том, что нашла подсказку.

🟦 Кажется, была проведена большая работа с элайментом. Взгляните на график: доля избыточных отказов (отказ, когда был возможен полезный ответ без нарушения) упала с 23.8 до 12.5%, при этом доля необходимых отказов остается на том же уровне. Еще оценивали стереотипность: там почти нулевой процент предвзятости по тестам BBQ.

🟦 Опубликовали системный промпт. В нем видно, что отдельно работали со случаями, когда модель не генерализирует ответы, а подгоняет их к тестовым кейсам. Это называется special-casing и особенно актуально для программирования и агентских задач.

🟦 Итоговую безопасность модели оценивали две независимые команды – Frontier Red Team (FRT) и Alignment Stress Testing (AST). Они ищут джейлбрейки, потенциальные слабые места и тд. По итогу назначили уровень ASL-2, то есть все еще безопасная (риски начинаются с ASL-3).

Вот так. Жаль, нет ответа на главный вопрос: почему 3.7, а не 4

25.02.202507:31

Как оставаться востребованным специалистом в ML?
AI-сфера развивается слишком стремительно — вчерашние стандарты устаревают, а требования к спецам меняются. Чтобы оставаться в игре, важно следить за трендами и адаптироваться к новым вызовам.

26 февраля основатель karpov courses Анатолий Карпов и сооснователь AI Talent Hub Дмитрий Ботов расскажут, что ждет ML-инженеров в 2025 году: какие технологии и навыки станут стандартом и как AI трансформирует бизнес.

Если хотите понимать, куда движется рынок и какие инструменты осваивать, приходите на вебинар. Регистрация здесь.

Реклама. Университет ИТМО ИНН:7813045547 erid:2VtzqxHCkWJ

24.02.202519:36

Также анонсировали Claude Code: кастомного Cursor от Anthropic

Это агент, который сможет работать прямо внутри вашей кодовой базы: читать файлы, менять их, писать и запускать тесты, коммитить и пушить, использовать командную строку и прочее.

Пока он в превью. Пресеты и инструкция здесь, установить себе можно вот так:

npm install -g @anthropic-ai/claude-code
cd your-project-directory
$ claude

24.02.202517:53

Между тем наконец вышел тех.отчет по Qwen2.5-VL

Сама модель вышла в конце января, и по бенчмаркам она соответствует таким моделям, как GPT-4o, Claude 3.5 Sonnet и DeepSeek v3. Особенно ее прокачали в понимании картинок, диаграмм и документов, и в вышедшем тех.отчете есть некоторые ответы на вопрос "как".

Итак, сама модель стоит на трех китах: LLM, визуальный энкодер и MLP-модуль для слияния.

🟦 С LLM ничего особенного, просто Qwen2.5, в которой RoPE эмбеддинги заменили на мультимодальный вариант MRoPE (Multimodal Rotary Position Embedding).

🟦 В качестве визуального энкодера крутят ViT. Тут две интересных детали. Во-первых, картинки не ресайзят: вместо этого энкодер работает с «нативным», то есть динамическим разрешением, и количество токенов на выходе зависит от исходного размера.

Во-вторых, сюда добавили Window Attention, и это помогает снизить сложность операций относительно ванильного селф-аттеншена, который используется традиционно. Кстати, при работе с видео кадры дополнительно группируются по два. В точности потерь почти нет, зато какое значительное облегчение по ресурсам.

🟦 MLP-модуль вставили для того, чтобы привести размерность визуальных признаков к размерности текстовых эмбеддингов. Тут работают два обычных линейных слоя.

И, конечно, исследователи сильно потрудились над данными. Датасет для претрейна огромный (4 триллиона токенов), и в нем и OCR, и межмодальные данные, и документ-парсинг, и локализация, и видео, и даже агентские сценарии (типа работы с интерфейсами компьютеров).

Само обучение били на три этапа: визуальное предобучение энкодера, полное мультимодальное предобучение и отдельно длинно-контекстное (благодаря как раз этому этапу у модели такое хорошее понимание документов). После шел файнтюнинг и DPO.

Статья полностью тут. Кстати, на днях обещают завести в Qwen 2.5 ризонинг.

24.02.202515:03

Помните, мы рассказывали про AlphaXiv?

Это проект Стэнфорда: аналог всем известного arxiv, но с возможность писать комментарии и обсуждать вопросы поверх любой статьи.

Так вот, проект живет и, оказывается, с недавнего времени туда завезли буквально Cursor для рисерчеров. В любой статье можно выделить кусочек текста и попросить модель (там крутится Gemini 2 Flash) объяснить его или ответить на какой-то вопрос.

Киллер-фича: через @ можно в своем вопросе сослаться на другую статью. Тогда она загрузится в контекст модели и можно будет, например, попросить ассистента сравнить результаты, бенчмарки, подходы и тд.

С таким читать статьи гораздо приятнее, сами попробуйте: alphaxiv.org/

24.02.202514:02

На ML-собеседованиях все чаще спрашивают про применение LLM в реальных бизнес-проектах

Почему? Потому что компаниям нужны не просто те, кто знают, как моделька работает, а те, кто может эти знания положить на практику, решить задачу и принести компании пользу.

К сожалению, материалов по этой теме пока немного, а те, которые есть, теряются за огромным потоком (ИИ)нформации. Так что сегодня отдельно обращаем ваше внимание на вот этот вебинар про применение LLM в e-commerce: его проводят наши друзья из известной школы ШВМ.

На вебинаре разберут успешные и неудачные кейсы применения LLM, расскажут, какие модели реально работают и приносят бизнесу пользу, а также объяснят, какие важные задачи и почему пока не решены. Спикеры – огонь:

🟦 Артем Бочкарев – Head of Data Science в AliExpress (ну кто может лучше разбираться в ML в e-commerce?)
🟦 Александр Лыков – к.ф.-м.н., академический руководитель Школы Высшей Математики

Такое точно не пропускаем. Регистрируйтесь здесь, встретимся 27 февраля в 19:00.

23.02.202512:17

Китайская лаборатория MoonshotAI показала оптимизатор Muon, который оказался в два раза эффективнее AdamW

Сам оптимизатор не новый, он вышел еще в декабре и придумал его Келлер Джордан. У него Muon (основанный, кстати, на ортогонализации матриц) показал крутые результаты, но только на игрушечных задачах. Заветный ✨скейлинг✨ не был продемонстрирован.

В Moonshot показали, как завести Muon для больших моделей. Как оказалось, требуется всего ничего: добавить weight decay и внимательно настроить обновление в зависимости от размера матрицы весов. Хотя, надо сказать, что последнее не совсем очевидно: для этого надо было заметить, что RMS метода не равно единице и вывести для него верную формулу.

С таким набором Muon работает из коробки и даже не требует настройки гиперпараметров. В статье его проверили на модельке 3В/16В MoE, и он обошел AdamW на производительности в два раза.

Код опенсорснули тут, так что уже можно тестировать имплементацию

Всі дописи

Рекламувався1 день

0

22.02.202515:10Неискусственный интеллект

716

Рекламувався15 хвилин

755

12.02.202510:42Двач

918K

Гумор та розваги

Рекламувався3 години

240

10.02.202506:55e/acc

62.9K

Рекламувався18 годин

0

06.02.202512:06Метаверсошная

9.1K

Рекламувався3 години

231

06.02.202511:16[PYTHON:TODAY]

62.1K

Рекламувався1 година

513

06.02.202508:10Позже всех. Уже точно

96.3K

Рекламувався4 години

722

06.02.202507:15GPT News | Нейросети

328.6K

Рекламувався2 години

1701

05.02.202514:34Алексей Шевцов

378.7K

Блоги

Рекламувався2 години

0

04.02.202508:28Physics.Math.Code

135.2K

Рекламувався16 годин

0

30.01.202508:38Neural Shit

46.3K

Рекламувався2 години

0

23.01.202514:07Нейро

70.2K

Рекламувався7 годин

0

14.11.202416:15твиттота

312.5K

Гумор та розваги

Рекламувався11 годин

0

14.11.202412:12Лепра

376.3K

Гумор та розваги

Рекламувався1 день

0

11.11.202411:19Neural Shit

46.3K

Рекламувався10 годин

0

06.11.202409:01Denis Sexy IT 🤖

92.2K

Детальніше

Рекорди

26.02.202523:59

54.5K

Підписників

08.02.202510:20

400

Індекс цитування

06.02.202517:52

14K

Охоплення 1 допису

11.02.202511:26

11.6K

Охоп рекл. допису

31.08.202423:59

7.30%

06.02.202517:51

27.40%

ERR

Розвиток

Детальніше

Підписників

Індекс цитування

Охоплення 1 допису

Охоп рекл. допису

ERR

Детальніше

Популярні публікації Data Secrets

Всі дописи

16.02.202516:46

Если давно искали, что почитать по LLM, то там вышла крутая книжка The Hundred-Page Language Models Book

Внутри 200 страниц самой актуальной и очень емкой иллюстрированной информации по:

– ML-базе: матрицы, градиентный спуск и др. математический фундамент
– Истории LLM: классические эмбеддинг-модели, RNN, BPE
– Внутреннему устройству трансформеров от аттеншена до key-value caching
– LLM: файнтюнинг, промптинг, скейлинг, элаймент, мультимодальность, RL и ризонинг

Акцент сделан на интуитивном понимании и практике: к книжке прилагается репа с отличным кодом по всем темам.

Кто читал The Hundred-Page ML Book того же автора оценят, что это за сокровище. Бесплатно можно читать здесь

18.02.202518:44

Hugging Face выпустили бесплатный курс по файнтюнингу языковых моделей

Кто не знал, у HF есть большой замечательный курс по NLP со всеми основами от токенизации до трансформеров и других архитектур. И сегодня они добавили в него главу под названием Fine-Tune LLM. Внутри:

🟦 Технические основы файнтюнинга: как должны выглядеть данные, как они должны быть размечены, специальные токены и тд
🟦 Теория по LoRA и другим основным методом файнтюна
🟦 Практика на торче + рецепты оценки модели здорового человека

Емко, практично и максимально полезно. Кстати, если уверены в своих знаниях уже сейчас, в конце главы есть большой квиз – проверьте себя 😐

05.02.202520:02

Это то, что мы все так сильно любим: Андрей Карпаты выложил новое обучающее видео

Это погружение в LLM на 3.5 часа. В лекции рассмотрены все основные шаги обучения моделек:

– Прентрейн: данные, токенизация, устройство архитектуры трансформера, примеры на GPT-2 и Llama 3.1

– Файнтюнинг: LLM Psychology, галлюцинации, орфография и еще много интересных деталей

– RLHF: все про то, как обучение с подкреплением работает в LLM на примере DeepSeek R1

Ну что может быть лучше?

youtu.be/7xTGNNLPyMI?si=dlaK07h1Uw_1Dr8Z

05.02.202513:54

Hugging Face сегодня в ударе: помимо опенсорсного агента Deep Research они релизнули целый стор ИИ приложений

Он так и называется: AI App store. В нем уже 400к (!) аппсов и найти можно вообще все, что хочешь. Например, нужна вам для вашего проекта тулза, транскрибирующая или обобщающая видео:

1. Заходите на huggingface.co/spaces

2. Вводите запрос «summary of video» (в поисковой строке кстати тоже встроена моделька) или переходите в нужный раздел из предложенных

3. Из множества вариантов выбираете то, что подходит, пользуетесь прямо внутри Hugging Face или качаете себе проект: они все опенсорсные и бесплатные

Так что если вы под каждую задачу искали по сусекам отдельный сервис, то больше так делать не нужно: Hugging Face объединил их все в одном месте и тут буквально за минуту отыщется действительно все. А если вы разработчик, то можно и самому добавить Space

🍯

20.02.202509:38

Microsoft открыли новый революционный материал и сделали из него квантовый чип, который может открыть следующую эру вычислений

Причиной того, что сегодня мы пользуемся телефонами, ноутбуками и другой электроникой стали полупроводники, которые в 1833 открыл Фарадей. А сейчас, в 2025, Microsoft открыли топопроводники – материалы, которые могут наконец-то вывести квантовые вычисления на новый уровень масштабирования.

На основе этих топопроводников Microsoft сделали Majorana 1. По словам компании тут решается сразу две главных проблемы квантовых вычислений: скейлинг и ошибки вычислений. Это стоило ученым 20 лет трудов.

Дело в том, что обычно, чем больше кубитов в чипе, тем больше ошибок этот чип допускает. Но с топопроводниками это может измениться, и Majorana может без потерь масштабироваться до миллиардов кубитов. Для сравнения, сейчас в самых мощных квантовых чипах не более 150 кубитов.

При этом топопроводники очень «компактные», так что такой чип поместится на ладошке.

CEO Microsoft говорит, что все это открывает абсолютно новую эру, и что теперь, возможно, мы получим настоящие квантовые компьютеры не через десятилетия, а через считанные годы.

news.microsoft.com/source/features/innovation/microsofts-majorana-1-chip-carves-new-path-for-quantum-computing/

06.02.202518:02

Разбираемся, как работает GRPO – ключевой алгоритм модели DeepSeek R1

Начнем с того, что GRPO – это метод обучения с подкреплением. Он, можно сказать, авторская находка DeepSeek, они предложили его еще год назад в статье про DeepSeekMath (ее подробный разбор лежит у нас на сайте), и с тех пор активно используют в своих моделях.

Обучение с подкреплением – это метод обучения, при котором агент (в нашем случае модель) учится принимать решения, взаимодействуя с окружающей средой. Агент получает награды за свои действия и стремится максимизировать общую награду. На каждом шаге взаимодействия со средой у агента есть политика – стратегия, которой следует агент, определяющая, какое действие он должен предпринять в каждом состоянии.

Самым распространенным для языковых моделей алгоритмом RL является Proximal Policy Optimization (PPO), и GRPO как раз является его вариацией. Суть:

➖ У агента есть начальная политика (стратегия), по которой он действует.

➖ Агент выполняет действия в среде (отвечает на вопросы), следуя своей текущей политике

➖ PPO оценивает действие агента. Для этого обычно используется три модели:
reference model – модель, которая выступает эталоном и позволяет измерять, насколько текущая политика изменилась по сравнению с исходной,
reward model – оценивает награду, которую агент получает за выполнение действия прямо сейчас,
value model – оценивает ожидаемую долгосрочную выгоду от действия, предсказывая будущие награды.

➖ На основе этих оценок агент меняет свою политику. Здесь заключена основная особенность алгоритма: функция потерь в PPO устроена так, что слишком резкие изменения политики не допускаются. Это помогает агенту постепенно улучшать свою стратегию, не делая слишком резких шагов сразу, что делает процесс обучения более стабильным и эффективным.

Но есть в PPO и недостатки. В частности, value model, которая играет ключевую роль в PPO, тащит на себя очень много ресурсов, потому что обычно сопоставима по размерам с моделью, которую мы обучаем. Это делает обучение дорогим.

Так что из GRPO (Group Relative Policy Optimization) value model вообще выкинули. Вместо value model в GRPO мы используем среднюю награду от группы ответов на один и тот же вопрос, и так определяем, насколько "хороши" действия модели.

То есть в GRPO оценка качества ответа основана на сравнении с другими ответами в группе, а не на абсолютных значениях наград. Если ответ лучше среднего по группе, политика усиливает вероятность его выбора. Если хуже — ослабляет. Это компенсирует оценку value model и делает обучение более эффективным и менее ресурсоемким.

Математические детали процесса оставили для вас в конспекте наверху.

Кстати, GRPO работает хорошо даже если пропустить этап файнтюнинга. Так обучали R1-Zero, младшую сестренку R1. Для нее вообще не использовали никакой разметки, и GRPO вытащил все ее качество исключительно на себе (подробнее).

20.02.202513:07

Google выпустили агента-ученого AI co-scientist

В отличие от многих подобных проектов, агент не пишет статьи и не делает исследования end-to-end. Его цель – быть генератором идей и подкидывать настоящим ученым свежие целесообразные гипотезы.

AI co-scientist реализует весь цикл научного метода: генерация идей, отбор лучших, уточнение, ревью и так по кругу. Это похоже на то, как устроена структура ризонинга во многих моделях, но здесь за каждый этап отвечает отдельный супер-проработанный агент со своими инструментами:

➖ Generation agent: генерирует начальные гипотезы и направления исследования с помощью веб-поиска
➖ Reflection agent: критически оценивает гипотезы через детальные проверки и симуляции. Может запускать код.
➖ Ranking agent: организует турнир дебатов и таким образом сравнивает гипотезы попарно и ранжирует по Эло (как на LMSYS)
➖ Proximity agent: строит граф близости гипотез, объединяет их и выкидывает дубликаты.
➖ Evolution agent: совершенствует и уточняет оставшиеся гипотезы.
➖ Meta-review agent: сводит все в общий обзор и ревьюит.

Самое интересное, что сюда прикрутили асинхронную систему управления задачами, так что test-time компьют распределяется динамически, и за счет этого система легко скейлится.

Кстати, агента тестили на мед.исследованиях, и оказалось, что он действительно способен генерировать идеи, которые потом подтверждаются экспериментально.

Интересно, что из этого выйдет, но выглядит масштабно: storage.googleapis.com/coscientist_paper/ai_coscientist.pdf

11.02.202515:20

Посочувствуем Сереже

24.02.202515:03

23.02.202508:38

🤗 Hugging Face теперь можно пользоваться как SQL-студией

Ребята встроили в свой многомиллионный раздел с датасетами Data Studio. Теперь из нужной таблицы можно прямо на платформе извлечь то, что нужно, не скачивая ее полностью. Результат вернется в виде CSV, или им можно поделиться ссылкой.

Ну и самое приятное: писать SQL-запрос самому не обязательно. Достаточно описать все на естественном языке, а код за вас напишет DeepSeek V3.

07.02.202516:44

06.02.202515:23

ChatГоПоТа получается

28.01.202514:17

28.01.202515:32

26.02.202508:35

Увійдіть, щоб розблокувати більше функціональності.