Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Метаверсище и ИИще avatar

Метаверсище и ИИще

Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
TGlist рейтинг
0
0
ТипАчык
Текшерүү
Текшерилбеген
Ишенимдүүлүк
Ишенимсиз
ОрдуРосія
ТилиБашка
Канал түзүлгөн датаСерп 10, 2017
TGlistке кошулган дата
Лист 11, 2023
Тиркелген топ

"Метаверсище и ИИще" тобундагы акыркы жазуулар

Погонял MAGI-1 у них на сайте.
Разрешение действительно конское: 1688х1440. Но мыла наваливает тоже нехило.

Наваливайте примеры в коменты.

@cgevent
Вот мы все ждали кнопку "Сделать красиво".

Дождались. Но никто не обещал в дороге кормить и то, что кнопка будет одна!

Вы тоже мучаетесь?

Теперь ждём бальшую кнопку "Выбрать нужную кнопку".

Одну.

Ибо выбирать - не барское это дело. Свободу воли оставьте ИИ.

Нажимать, не мешки ворочать.

@cgevent
Krea.ai, что ты делаешь, прекрати!

Krea Stages - вытаскиваем из картинки 3д, генерим 3д, и трансформируем 3д.

И даже деформируем!

Да, вам не почудилось. Это паранейроавториг.

Поглядите на зайца-побивальца.

Может пора эксгумировать Метаверс?

@cgevent
Принес две полезные ссылки про ИИ и бизнес.

В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.

Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/

@cgevent
Так, пора расчехлить обратно подписку на Gemini Advanced.

Всем платным юзерам раскатывают Veo2, плюс анимацию через Whisk.

Я прошерстил твиттор за лимиты - и вроде как дают 100 видосов в месяц. Но это надо уточнять.

Если это так, то надо считать экономику среднего пользователя.

Сейчас я могу генерить бесплатно и быстро до 5 видосов в день в Gemini без подписки. Проверял утром на криптопасхе. Аккаунтов у меня чуть меньше, чем простых чисел.

Но я все равно куплю. Прогиб будет защитан по-любому. ИИ все помнит.

Почитайте тут, подумайте.

https://blog.google/products/gemini/video-generation/

@cgevent
Немного примеров из нового Клинга 2.0

Все отмечают нормальную динамику и уход slow-motion движения на видео, которым грешили все генераторы прошлого года. Тут Клинг скорее в роли догоняющего, но это все равно отлично, ибо эпоха слоу-моушен-трейлеров уходит.

@cgevent
Кайра бөлүшүлгөн:
Ai molodca avatar
Ai molodca
Как многие вчера догадались — да, мы тестировали новый Kling 2.0 💥, который я гоняю уже где-то неделю в рамках партнёрской программы.

Что могу сказать? Он очень хорош: понимание промта, количество движения, последовательность — отлично.

😑 Первое видео — тест img-to-video из случайных кадров (включая ваши генерации и, конечно же, Уилла Смита с пастой).

😳 Второе, более интересное — новый режим Multi-Elements (на версии 1.6), который подрезали у Pika, но сделали гораздо лучше. Загружаете видео, референс, пишете что-то вроде "замени/удали/добавь [объект] из футажа 1 на [объект 2]" — и готово.

В целом, что нового:

1. Модель KLING 2.0 с улучшенными базовыми возможностями
Пока что только базовые режимы Text to Video и Image to Video, 720p, без дополнительных контролов (но, возможно, скоро подъедет другая версия 2.0).

2. Multi-Elements (v1.6)
Добавление, замена, удаление объектов в видеосцене — удобно, гибко, быстро.

3. Motion Control (v1.6)
Кастомная анимация персонажей на изображении по промту или референсу.

4. KOLORS 2.0 — обновлённая генерация изображений
Большие улучшения по сравнению с версией 1.5 — по качеству, цвету, деталям.

5. Restyle (KOLORS 2.0)
Смена стилистики изображения — работает чисто и разнообразно.

6. Редактирование изображений
Новые функции Inpaint и Expand для креативного редактирования.
Кайра бөлүшүлгөн:
Denis Sexy IT 🤖 avatar
Denis Sexy IT 🤖
Хехе, https://cursor.com/ тоже добавил 4.1 и сделал ее бесплатной (на какое-то время)

Гонка в которой выигрывает потребитель – лучшая гонка 🌝
Кайра бөлүшүлгөн:
Data Secrets avatar
Data Secrets
⚡️ OpenAI показали свои новые модели GPT-4.1, GPT-4.1 mini и GPT-4.1 nano

В чате их не будет: они только для разработчиков в API. У всех трех моделей контекст 1 миллион токенов, для OpenAI это впервые. Знания до 1 июля 2024.

Для программирования модель действительно хороша: на SWE-bench обгоняет даже o1 high. При этом стоит намного дешевле ($2.00 / 1M инпут и $8.00 / 1M аутпут). Плюсом неплохие способноси на мультимодальных задачах и математике.

Последний график – масштабирование на росте контекста. Видно, что 4.1 на голову лучше остальных моделей OpenAI на длинных последовательностях, то есть даже на огромных документах или кодовых базах не будет терять детали.

Ну и вишенка: семь дней модель будет абсолютно бесплатной вот тут

Цены и детали – здесь, а вот блогпост со всеми метриками
Завтра ждем новый Kling 2.0

Ожидаем:
- Video to Video
- Increased Lipsync
- Video Inpaint
- New Video Model (for sure 1.6 -> 2.0)
- Video Styles and Mixing styles
- Video Effects (like higgsfieled)
- Creative Canvas / Moodboards
- Start/End = 3-5 Keyframes animations

@cgevent
Вы будете смеяться, но у нас новый видео-генератор.

Генератор новый, команда старая - это Тикток, взял и превратил свой генератор картинок Seaweed\PixelDance в генератор видео.

Называетс Seaweed-7B, количество параметров понятно из названия, а еще он умеет:

- генерировать видео и аудио вместе
- делать видеоролики, которые сопровождаются звуком от Omnihuman(!) (т.е. персонаж, соответствующий голосу, и речь синхронизированы)
- видеоролики до 20 секунд или 1 минуты (extension technique)
- 720p, upsample до 2k
- может генерировать 720p в реальном времени при 24 кадр/с - вот это уже бомба, смотрите примеры на сайте ниже.
- длинные мультиплановые(!) истории
- t2v и i2v ( причем можно задавать первый или последний кадр)
- можно задавать референсные изображения человека или объекта для переноса в видео

Тьма примеров на сайте, и ничего про планы на опен-сорс. И демо тоже пока нет. Есть только папирус.

Все подробности тут:
https://seaweed.video/

@cgevent
Рендер или видео?

Если вы все еще сторонник рендера, то это полностью опенсорсный(!) рендер.

Комплектующие, CAD-исходники и все спецификации есть на GitHub

Весь SDK доступен тут.

Называется эта тварь Фурье N1, весит 38 кг, ростом всего 1.3 метра, но бегает уже со скоростью 12.6 км/ч.

Коль скоро исходники открыты, каждый может сделать себе Дзюбу.

Битвы робатов не за горами, а фильм Real Steel становится все ближе.

@cgevent
sd-forge-fluxtools-v2

Расширение для Forge, позволяющее полноценно использовать Controlnet и Redux c Flux-1-dev. До сих пор с этим были проблемы, в отличие от ComfyUI

#extension #flux
Инсайты с конференции GoCloud провайдера облачных и AI-технологий Cloud․ru

Анонсировали такие сервисы и ближайшие релизы:

- Cloud․ru Evolution AI Factory — платформа для создания AI-приложений и агентов в облаке.

- Cloud․ru Evolution Stack AI-bundle — первое в России гибридное облако с поддержкой запуска и масштабирования AI-сервисов в контуре компании, локально и с низким порогом входа для пользователей.

- Evolution Managed ArenadataDB - инструмент для аналитики данных и построения отчётности. А также управляемые сервисы для работы с биг дата в облаке Cloud․ru Evolution: Trino, Metastore, Spark, BI.

"Мы планируем, что к 2026 году AI-помощники будут выполнять большинство задач в частотных сценариях работы в облаке. Это кардинально изменит опыт пользователей при работе с облачными продуктами. С момента запуска AI-помощники будут доступны в публичных, гибридных и частных облаках Cloud․ru" - заявил CEO Cloud․ru Евгений Колбин на открытии конференции.

@cgevent
Mogao: новый лидер на Artificial Analysis Image Arena

Избил всех, включая Gpt-4o.

Что известно?

Очень хорошо в стилях, в отличие от Flux.
Слаб в текстах (похоже диффузия)
Очень хорошее понимание промпта.

Большинство твитторских склоняется к тому, что это Dreamina 3.0 от Capcut, ибо название явно китайское и означает "Тысяча пещер Будды".
https://dreamina.capcut.com/ai-tool/home

Есть также версии, что это новый генератор от Грок и даже Flux 2.0.

Скоро узнаем...

Вот вам выжимка от Deep Research:

По состоянию на апрель 2025 года разработчики Mogao не делали анонсов о планах выпуска модели или её демо. Нет сведений, будет ли Mogao открыта для исследований либо коммерчески доступна. Сообщество энтузиастов и экспертов с большим интересом ожидает раскрытия деталей – как самого алгоритма Mogao, так и информации о создателях. Появление Mogao на вершине рейтинга уже привлекло внимание (новости о ней разошлись по соцсетям и профильным ресурсам), поэтому можно предположить, что рано или поздно авторы модели представят официальную информацию. На данный момент же Mogao остаётся закрытой «чёрной коробкой», доступной лишь в рамках ограниченного соревновани

P.S. Причем появился он на Artificial Analysis Image Arena пять дней назад, но топ залетел только вчера.

https://m.huxiu.com/article/4236587.html

@cgevent

Рекорддор

21.04.202523:59
38.7KКатталгандар
28.02.202523:59
325Цитация индекси
25.01.202523:59
14.6K1 посттун көрүүлөрү
25.01.202523:59
14.6K1 жарнама посттун көрүүлөрү
09.02.202523:59
25.84%ER
09.03.202514:24
24.97%ERR
Көбүрөөк функцияларды ачуу үчүн кириңиз.