Мир сегодня с "Юрий Подоляка"

Труха⚡️Україна

Карап чыгуу

Николаевский Ванёк

Карап чыгуу

Мир сегодня с "Юрий Подоляка"

Карап чыгуу

Труха⚡️Україна

Карап чыгуу

Николаевский Ванёк

Карап чыгуу

Метаверсище и ИИще

Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn

TGlist рейтинг

ТипАчык

Текшерүү

Текшерилбеген

Ишенимдүүлүк

Ишенимсиз

ОрдуРосія

ТилиБашка

Канал түзүлгөн датаСерп 10, 2017

TGlistке кошулган дата

Лист 11, 2023

Мен каналдын ээсимин

Өзгөрүүлөр тарыхы

Тиркелген топ

MetaComments

2.6K

Telegram каналы Метаверсище и ИИще статистикасы

Толугураак

Катталгандар

38 728

24 саат

1660.4%Жума

4261.1%Ай

1 7714.8%

Цитация индекси

0

Эскерүүлөр1Каналдарда бөлүштү0Каналдарда эскерүүлөр1

1 посттун орточо көрүүлөрү

1 772

12 саат4 2390%24 саат1 7720%48 саат5 212

194.1%

Катышуу (ER)

7.73%

Кайра посттошту100Комментарийлер3Реакциялар37

Көрүүлөр боюнча катышуу (ERR)

4.6%

24 саат0%Жума

4.14%Ай

3.21%

1 жарнама посттун орточо көрүүлөрү

1 772

1 саат77043.45%1 – 4 саат1 36376.92%4 - 24 саат1 988112.19%

Толугураак

Биздин ботту каналыңызга кошуп, анын аудиториясынын жынысын билүү.

Акыркы 24 саатта бардык посттор

1

Динамика

"Метаверсище и ИИще" тобундагы акыркы жазуулар

Бардык посттор

21.04.202521:00

Погонял MAGI-1 у них на сайте.
Разрешение действительно конское: 1688х1440. Но мыла наваливает тоже нехило.

Наваливайте примеры в коменты.

@cgevent

19.04.202510:52

Вот мы все ждали кнопку "Сделать красиво".

Дождались. Но никто не обещал в дороге кормить и то, что кнопка будет одна!

Вы тоже мучаетесь?

Теперь ждём бальшую кнопку "Выбрать нужную кнопку".

Одну.

Ибо выбирать - не барское это дело. Свободу воли оставьте ИИ.

Нажимать, не мешки ворочать.

@cgevent

18.04.202518:07

Krea.ai, что ты делаешь, прекрати!

Krea Stages - вытаскиваем из картинки 3д, генерим 3д, и трансформируем 3д.

И даже деформируем!

Да, вам не почудилось. Это паранейроавториг.

Поглядите на зайца-побивальца.

Может пора эксгумировать Метаверс?

@cgevent

16.04.202513:52

Принес две полезные ссылки про ИИ и бизнес.

В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.

Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/

@cgevent

15.04.202518:09

Так, пора расчехлить обратно подписку на Gemini Advanced.

Всем платным юзерам раскатывают Veo2, плюс анимацию через Whisk.

Я прошерстил твиттор за лимиты - и вроде как дают 100 видосов в месяц. Но это надо уточнять.

Если это так, то надо считать экономику среднего пользователя.

Сейчас я могу генерить бесплатно и быстро до 5 видосов в день в Gemini без подписки. Проверял утром на криптопасхе. Аккаунтов у меня чуть меньше, чем простых чисел.

Но я все равно куплю. Прогиб будет защитан по-любому. ИИ все помнит.

Почитайте тут, подумайте.

https://blog.google/products/gemini/video-generation/

@cgevent

15.04.202508:43

Немного примеров из нового Клинга 2.0

Все отмечают нормальную динамику и уход slow-motion движения на видео, которым грешили все генераторы прошлого года. Тут Клинг скорее в роли догоняющего, но это все равно отлично, ибо эпоха слоу-моушен-трейлеров уходит.

@cgevent

Кайра бөлүшүлгөн:

Ai molodca

15.04.202507:42

Как многие вчера догадались — да, мы тестировали новый Kling 2.0 💥, который я гоняю уже где-то неделю в рамках партнёрской программы.

Что могу сказать? Он очень хорош: понимание промта, количество движения, последовательность — отлично.

😑 Первое видео — тест img-to-video из случайных кадров (включая ваши генерации и, конечно же, Уилла Смита с пастой).

😳 Второе, более интересное — новый режим Multi-Elements (на версии 1.6), который подрезали у Pika, но сделали гораздо лучше. Загружаете видео, референс, пишете что-то вроде "замени/удали/добавь [объект] из футажа 1 на [объект 2]" — и готово.

В целом, что нового:

1. Модель KLING 2.0 с улучшенными базовыми возможностями
Пока что только базовые режимы Text to Video и Image to Video, 720p, без дополнительных контролов (но, возможно, скоро подъедет другая версия 2.0).

2. Multi-Elements (v1.6)
Добавление, замена, удаление объектов в видеосцене — удобно, гибко, быстро.

3. Motion Control (v1.6)
Кастомная анимация персонажей на изображении по промту или референсу.

4. KOLORS 2.0 — обновлённая генерация изображений
Большие улучшения по сравнению с версией 1.5 — по качеству, цвету, деталям.

5. Restyle (KOLORS 2.0)
Смена стилистики изображения — работает чисто и разнообразно.

6. Редактирование изображений
Новые функции Inpaint и Expand для креативного редактирования.

Кайра бөлүшүлгөн:

Denis Sexy IT 🤖

14.04.202519:47

Хехе, https://cursor.com/ тоже добавил 4.1 и сделал ее бесплатной (на какое-то время)

Гонка в которой выигрывает потребитель – лучшая гонка 🌝

Кайра бөлүшүлгөн:

Data Secrets

14.04.202517:47

⚡️ OpenAI показали свои новые модели GPT-4.1, GPT-4.1 mini и GPT-4.1 nano

В чате их не будет: они только для разработчиков в API. У всех трех моделей контекст 1 миллион токенов, для OpenAI это впервые. Знания до 1 июля 2024.

Для программирования модель действительно хороша: на SWE-bench обгоняет даже o1 high. При этом стоит намного дешевле ($2.00 / 1M инпут и $8.00 / 1M аутпут). Плюсом неплохие способноси на мультимодальных задачах и математике.

Последний график – масштабирование на росте контекста. Видно, что 4.1 на голову лучше остальных моделей OpenAI на длинных последовательностях, то есть даже на огромных документах или кодовых базах не будет терять детали.

Ну и вишенка: семь дней модель будет абсолютно бесплатной вот тут

Цены и детали – здесь, а вот блогпост со всеми метриками

14.04.202516:34

Завтра ждем новый Kling 2.0

Ожидаем:
- Video to Video
- Increased Lipsync
- Video Inpaint
- New Video Model (for sure 1.6 -> 2.0)
- Video Styles and Mixing styles
- Video Effects (like higgsfieled)
- Creative Canvas / Moodboards
- Start/End = 3-5 Keyframes animations

@cgevent

14.04.202516:10

Вы будете смеяться, но у нас новый видео-генератор.

Генератор новый, команда старая - это Тикток, взял и превратил свой генератор картинок Seaweed\PixelDance в генератор видео.

Называетс Seaweed-7B, количество параметров понятно из названия, а еще он умеет:

- генерировать видео и аудио вместе
- делать видеоролики, которые сопровождаются звуком от Omnihuman(!) (т.е. персонаж, соответствующий голосу, и речь синхронизированы)
- видеоролики до 20 секунд или 1 минуты (extension technique)
- 720p, upsample до 2k
- может генерировать 720p в реальном времени при 24 кадр/с - вот это уже бомба, смотрите примеры на сайте ниже.
- длинные мультиплановые(!) истории
- t2v и i2v ( причем можно задавать первый или последний кадр)
- можно задавать референсные изображения человека или объекта для переноса в видео

Тьма примеров на сайте, и ничего про планы на опен-сорс. И демо тоже пока нет. Есть только папирус.

Все подробности тут:
https://seaweed.video/

@cgevent

14.04.202516:00

Рендер или видео?

Если вы все еще сторонник рендера, то это полностью опенсорсный(!) рендер.

Комплектующие, CAD-исходники и все спецификации есть на GitHub

Весь SDK доступен тут.

Называется эта тварь Фурье N1, весит 38 кг, ростом всего 1.3 метра, но бегает уже со скоростью 12.6 км/ч.

Коль скоро исходники открыты, каждый может сделать себе Дзюбу.

Битвы робатов не за горами, а фильм Real Steel становится все ближе.

@cgevent

Кайра бөлүшүлгөн:

Нейронавт | Нейросети в творчестве

14.04.202515:49

sd-forge-fluxtools-v2

Расширение для Forge, позволяющее полноценно использовать Controlnet и Redux c Flux-1-dev. До сих пор с этим были проблемы, в отличие от ComfyUI

#extension #flux

14.04.202512:10

Инсайты с конференции GoCloud провайдера облачных и AI-технологий Cloud․ru

Анонсировали такие сервисы и ближайшие релизы:

- Cloud․ru Evolution AI Factory — платформа для создания AI-приложений и агентов в облаке.

- Cloud․ru Evolution Stack AI-bundle — первое в России гибридное облако с поддержкой запуска и масштабирования AI-сервисов в контуре компании, локально и с низким порогом входа для пользователей.

- Evolution Managed ArenadataDB - инструмент для аналитики данных и построения отчётности. А также управляемые сервисы для работы с биг дата в облаке Cloud․ru Evolution: Trino, Metastore, Spark, BI.

"Мы планируем, что к 2026 году AI-помощники будут выполнять большинство задач в частотных сценариях работы в облаке. Это кардинально изменит опыт пользователей при работе с облачными продуктами. С момента запуска AI-помощники будут доступны в публичных, гибридных и частных облаках Cloud․ru" - заявил CEO Cloud․ru Евгений Колбин на открытии конференции.

@cgevent

14.04.202508:21

Mogao: новый лидер на Artificial Analysis Image Arena

Избил всех, включая Gpt-4o.

Что известно?

Очень хорошо в стилях, в отличие от Flux.
Слаб в текстах (похоже диффузия)
Очень хорошее понимание промпта.

Большинство твитторских склоняется к тому, что это Dreamina 3.0 от Capcut, ибо название явно китайское и означает "Тысяча пещер Будды".
https://dreamina.capcut.com/ai-tool/home

Есть также версии, что это новый генератор от Грок и даже Flux 2.0.

Скоро узнаем...

Вот вам выжимка от Deep Research:

По состоянию на апрель 2025 года разработчики Mogao не делали анонсов о планах выпуска модели или её демо. Нет сведений, будет ли Mogao открыта для исследований либо коммерчески доступна. Сообщество энтузиастов и экспертов с большим интересом ожидает раскрытия деталей – как самого алгоритма Mogao, так и информации о создателях. Появление Mogao на вершине рейтинга уже привлекло внимание (новости о ней разошлись по соцсетям и профильным ресурсам), поэтому можно предположить, что рано или поздно авторы модели представят официальную информацию. На данный момент же Mogao остаётся закрытой «чёрной коробкой», доступной лишь в рамках ограниченного соревновани

P.S. Причем появился он на Artificial Analysis Image Arena пять дней назад, но топ залетел только вчера.

https://m.huxiu.com/article/4236587.html

@cgevent

Бардык посттор

Жарнамаланган0 секунда

16.04.202507:52Neural Shit

47.2K

Жарнамаланган0 секунда

11.04.202510:27Neural Shit

47.2K

Жарнамаланган1 күндүз

27.08.202414:28Мишин Лернинг 🇺🇦🇮🇱

Технологиялар

Толугураак

Рекорддор

21.04.202523:59

38.7KКатталгандар

28.02.202523:59

325Цитация индекси

25.01.202523:59

14.6K1 посттун көрүүлөрү

25.01.202523:59

14.6K1 жарнама посттун көрүүлөрү

09.02.202523:59

25.84%ER

09.03.202514:24

24.97%ERR

Өнүгүү

Толугураак

Катталуучулар

Citation индекси

Бир посттун көрүүсү

Жарнамалык посттун көрүүсү

ERR

Толугураак

Метаверсище и ИИще популярдуу жазуулары

Бардык посттор

16.04.202513:52

18.04.202518:07

Кайра бөлүшүлгөн:

e/acc

02.04.202518:53

GPT прошел тест Тьюринга. Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. Двойное, рандомизированное, контролируемое слепое исследование. Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот.

Выводы:
- Ллама 3.1 примерно как человек, в 50% случаев участники угадывают
- GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди.

Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/

22.03.202511:06

Безлимитная Сора.

А почему все молчат?

Я залогинился в sora.com под своим chatGPT Plus аккаунтом, и Сора пишет - никаких более кредитов. Творчество не кредитуется!

Полез в обновленный сегодня FAQ, а там:

Understanding Unlimited Usage
ChatGPT Pro and Plus plans offer unlimited access to Sora
https://help.openai.com/en/articles/10245774-sora-billing-faq#h_5a4892aa77

Плюсовики, налетай!

@cgevent

30.03.202521:23

OpenAI сделала набор бесплатных курсов.

Заполняешь форму, на почту приходит magic link на сайт академии.

Немного пёстро - от RAG до ИИ для возрастных пользователей.

Есть основы Соры в нескольких частях.

Дело хорошее, вопрос аптейтов контента, все меняется каждый день.

https://academy.openai.com/

@cgevent

Кайра бөлүшүлгөн:

Ai molodca

15.04.202507:42

24.03.202511:19

Тут Андрей Карпатый на вайбе выпивает за разработчиков приложений на Swift для айфона.

Я, говорит, вашего Свифта никогда в глаза не видел, но за час написал приложение вайбкодингом.

Прикольно, что он расшарил свои чаты с chatGPT - можете посмотреть, как умные люди общаются с ИИ.

Почитайте эту ветку, много забавного.
https://x.com/karpathy/status/1903891179370123559

Народ соревнуется, кто быстрее напишет такое же и предлагает Андрею запихнуть это в AppStore.

Андрей такой: для этого придется общаться с chatGPT не менее часа!

@cgevent

31.03.202521:26

Krea.ai не соврали: новый апдейт.

Теперь они идут в 3Д-генерацию...

Завтра изучаем их сетки.

Под капотом Hunyuan 3D and Trellis

@cgevent

Кайра бөлүшүлгөн:

Denis Sexy IT 🤖

14.04.202519:47

28.03.202518:14

Переодеваторы.

Рубрика крутые подписчики.

У нас в чате нашлась Лена, а у Лены - приложение https://nextry.app/ - это переодеватор.
Вы думаете, почему я тут залип на редактировании изображений - мне было интересно поглядеть, а не убьют ли рынок переодеваторов новый chatGPT или Gemini, которые так лихо редактируют картинки.

Внешне выглядело так, что и в Gemini можно нарулить примерочную.

Что я натестил?

1. Так как в переодеватор грузишь обычно модель в полный рост, или поясной план, то chatGPT плохо забирает лицо, когда говоришь ему переодень барышню в другое платье.
2. Ну и так как он норовит пошевелить детали, что одежда малость не совпадает, с тем, что вы загрузили.
3. Ну и самое главное. Цензура. Как только речь доходит до белья и купальников, наши корпоративные друзья сливаются. Они и так на людей смотрят с опаской, а тут еще модели повсюду.

Перебеседовал с Леной - они, оказывается тренируют СВОЮ модель, это прям файнтюн под задачу (инсайд - три модели на основе Flux). Поэтому модель не боится купальников, вцепляется в лица и делает все довольно ловко.

Меня также поразило, что модель понимает множественные предметы - типа обувь, сумку и одежду в одном проходе.

Я также потестировал позабытую Kolors-Virtual-Try-On - он прямо сильно лажает в деталях, надписях и переносе.

Я попытался сломать переодеваторы, засунув в соломорезку рельсу, то есть фиолетовую барышню. Колорс не справился, а Nextry идеально срисовал лицо, но прическу и фигуру сильно "улучшил".
Как я понял, основной рынок - это виртуальные примерки, где модели имеют, скажем так, усредненные пропорции, поэтому достраиваются "средние" размеры.

Сдается мне это не совсем B2C рынок, и основная масса пользователей такого продукта (переодеватор), это все-таки бизнесы типа ритейлеров, но для конечного пользователя это тоже может иметь ценность. А если ввалить денег в маркетинг, то и вирусность.

В общем если интересно, потестируйте, там вроде 15 генераций в день есть. А в чате обсудим результат и баги. Я обнаружил, что руки живут немного своей жизнью, но вопрос в том, это баг или фича. Ну и всегда можно создать новый аккаунт, но я это не говорил.

https://nextry.app/

@cgevent

22.03.202521:37

Для тех, кто упорно ищет блох в тенях и отражениях, и голосует за то, что это рендер, а не видео, Unitree сделали надпись слева внизу.

Это, говорят, не AI Generated, и это видео без всякого ускорения.

Но те, у кого вытеснение отрицательного, все равно скажут, что это рендер, а плашку сделали для кликбейта.

И вы вот спрашивали (я, кстати, тоже), а зачем этих тварей делать антропоморфными?
А чтобы научить их всем грязным кожаным приемчикам..

И в поля...

Китайские Урфин Джусы, мать их.

И как тебе такое, Бостон Динамикс?

@cgevent

Кайра бөлүшүлгөн:

Denis Sexy IT 🤖

29.03.202511:40

Поигрался с новой моделью Gemini 2.5 Pro Experimental 03-25 и это шикарная модель для написания кода – пока она решила задачи почти любой сложности что я ей давал; нет, машину времени она не сделает и Vice City не сделает с одного промпта – но всякие шейдеры, 3d проектики, html-react приложения и тп – изи

На видео новая модель Google сделала генетический симулятор тетриса который сам учится играть оптимизируя свою стратегию – вышла довольно сложная штука: в одном HTML-файле уместилась сама игра Тетрис, AI-игрок, решающий, куда ставить фигуру на основе набора правил и генетический алгоритм, все это оно написало с одного промпта

Вот тут детальнее как работает алгоритм:

Задача генетического алгоритма – подобрать идеальные "веса" для этих правил, чтобы AI играл максимально эффективно. Как он учится?

1. Поколения: Создается "популяция" AI с разными случайными настройками (весами эвристик).

2. Оценка: Каждый AI (или, для скорости, лучший представитель поколения) играет партию. Его "успешность" (фитнес) – это просто набранные очки. Чем больше очков, тем лучше стратегия.

3. Отбор: Лучшие AI-"родители" отбираются для "размножения".

4. Скрещивание и Мутация: Их "гены" (веса эвристик) смешиваются и немного случайно изменяются, создавая новое поколение AI, которое наследует черты успешных родителей, но с небольшими вариациями.

5. Повтор: Цикл повторяется много раз, и (в теории) с каждым поколением AI должен играть все лучше и лучше, находя все более оптимальные веса для своей стратегии.

И самое классное – можно в реальном времени наблюдать на экране, как лучший AI текущего поколения пытается побить рекорды, и смотреть в панели информации, как меняются его весовые коэффициенты – та самая "стратегия", которую он выучил

И самое прекрасное, что это все бесплатно 👏

Тетрис-симуляция тут:
https://shir-man.com/temp/tetris

В такие моменты очень люблю конкуренцию на рынке АИ

UPD. С двух промптов все же, второй починил мелкий баг эволюции – спасибо подписчику, что заметил – кожаных пока не заменяем

07.04.202507:09

Понять за 60 секунд.

Вот нашел в фейсбучеке ролик, практически сгенерированный с помощью ИИ, по крайней мере спотыкающаяся озвучка, намекает. Но речь не про качество ролика. А, как ни странно, про содержание.

Вот я тут ною, что пока все эти ИИ-трейлеры режут глаз ацкими нестыковками по монтажу и принципом "слепила из того, что было".

Но похоже люди с такой насмотренностью будут потихоньку вымирать, ибо кто сейчас еще ходит в кино и может посмотреть два часа контента, не умерев от усилий по удержанию фокуса.

Новым нормальным тиктокерам уже 20-минутные эпизоды сериалов даются с трудом.

Поэтому появляются 60-секундные сериалы.

И вот тут-то ИИ развернется во всю мощь. Какие монтажные переходы, какой внутрикадровый монтаж? Новый нормальный контент компрессирует всё в щель внимания потребителя интернетика, которая сжимается все сильнее.

И вот тут-то появятся, наконец, кнопки "Сделай быстро".

Кроме того, если если подучить сетки сразу на этих самих 60-секундных сериалах и скриптах к ним, то все сведется к серверам, генерящим такой контент непрерывно.

@cgevent

27.03.202515:38

Редактирование изображений в chatGPT, Gemini и Grok.

Попробую написать понятный пост, а то в последнее время гиковато выходит.

Сравнивать качество генерации дело непростое, очень субъективно.
Вот например хорошая таблица от Игоря (обновляется), но там пока нет последних новостей.

Поэтому я сравнил, насколько новые (авторегрессионые) генераторы управляются с редактированием изображений (которое в телеге озвучивается как Фотошоп больше не нужен).

Было интересно поглядет насколько генераторы СОХРАНЯЮТ оригинал и насколько НЕ ШЕВЕЛЯТ исходную картинку.

Забегая вперед:
Gemini Image Generator лучше всех справляется с этим.
Потом Грок 3.
Потом chatGPT, который нещадно шевелит картинку.

Я просто взял свои любимые частицы (много деталей) и присунул их на вход со словами "Make particles blue". Загрузил картинку и ввел промпт в каждый генератор.
Перекрась, типа, колоркоррекция, мыжкомпозеры.

Мы, конечно, живем в удивительное время, когда новые генераторы и версии появляются про ТРИ в неделю. Раньше ждали примерно год обновления софта до новой версии (Майя, Фотошоп). А щас 2 дня.

Теперь по порядку.

У Гугла новая модель Gemini 2.5. Миллион токенов контекста, и она ОЧЕНЬ умная. Ее можно попробовать в AI Studio

Да, бесплатно, но есть лимит. Но в нее еще не завезли генерацию изображений (когда завезут, будет просто бомба, я думаю). Она смешно говорит, я сгенерила, вот! Но картинки нет.
А чтобы генерить картинки, нужно выбрать Gemini 2.0 Flash Image Generation справа на экране (или где-то на мобиле).
Тут Гугл опять всех приподзапутал, неделю назад это было в https://gemini.google.com/ и в модели 2.0 Flash Tinking Experimental. Теперь Флэш разучился редактировать(у меня, только генерация с помощью Imagen3), поэтому идем в AI Studio и генерит там, выбрав Gemini 2.0 Flash Image Generation справа.

Генерит быстро. Редактирует тоже быстро. Выдает в 16:9, не путается в аспектах и разрешениях. 1024 по ширине.
Лучше всех перекрасила мои частицы в синий. Сохранила детали на месте.

Grok 3 (на сайте grok.com) тоже сохранил мои частицы на месте, но выдал ацкие артефакты - частицы как-будто моль поела. Но мы тут про редактирование.

А вот chatGPT явно двигает детали, путается в разрешениях (иногда выдает квадратное, хотя на входе лежачая картинка). Не умеет 16:9, только 3:2. Я уже присовывал ему его родное 1536х1024, но он все равно двигает детали и морфирует картинку.

Еще раз. Я тут не про качество генерации, я про точность редактирования.
По качеству, chatGPT самый наверное крутой. По точности - нет.
Ну и я не проверял вот это вот "надень очки, сними пиджак, убери кота". Проверим в чате.

Про авторегрессию надо наверное отдельный пост сделать. Качество этих генераторов вплотную подтянулось к диффузионным (Flux, Reve, SD), а вот в плане понимания редактирования - нас ждут сюрпризы, ибо мультимодальные\авторегрессионные модели (OpenAI, Gemini, Grok) умнеют и тащат за собой качество генерации вверх.

Я полностью залипаю в chatGPT и Gemini последнюю неделю.

@cgevent

26.03.202515:52

Похоже Reve со своей диффузией, потратили год, чтобы уткнуться в демонстрацию новых картинок от OpenAI. Которые генерятся авторегрессией, и которые чудовищно хорошо понимают промпт.

Я просто залип и не вылезаю из Sora и chatGPT.

А на что еще потратить время, как не плакаты по технике безопасности.

Я даже промпт вбивал на русском.

Позалипайте вот тут: https://sora.com/explore/images - день назад нельзя было представить таких композиций, деталей и понимания промпта.

@cgevent

Көбүрөөк функцияларды ачуу үчүн кириңиз.