Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Метаверсище и ИИще avatar

Метаверсище и ИИще

Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
TGlist рейтингі
0
0
ТүріҚоғамдық
Растау
Расталмаған
Сенімділік
Сенімсіз
Орналасқан жеріРосія
ТілБасқа
Канал құрылған күніAug 10, 2017
TGlist-ке қосылған күні
Nov 11, 2023
Қосылған топ

Рекордтар

28.04.202523:59
39KЖазылушылар
28.02.202523:59
325Дәйексөз индексі
25.01.202523:59
14.6K1 жазбаның қамтуы
25.01.202523:59
14.6KЖарнамалық жазбаның қамтуы
09.02.202523:59
25.84%ER
09.03.202514:24
24.97%ERR
Жазылушылар
Цитата индексі
1 хабарламаның қаралымы
Жарнамалық хабарлама қаралымы
ER
ERR
JUL '24OCT '24JAN '25APR '25

Метаверсище и ИИще танымал жазбалары

Қайта жіберілді:
AI Product | Igor Akimov avatar
AI Product | Igor Akimov
22.04.202521:35
Anthropic вчера опубликовал, а сегодня на хабре перевели отличный гайд по использованию агентов в программировании, чтобы не ругаться на тупой chatgpt или Claude, когда он вам пол-проекта перепишет :)
Например там про то, чтобы план составить сначала:
https://habr.com/ru/articles/902422/
16.04.202513:52
Принес две полезные ссылки про ИИ и бизнес.

В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.

Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/

@cgevent
Krea.ai, что ты делаешь, прекрати!

Krea Stages - вытаскиваем из картинки 3д, генерим 3д, и трансформируем 3д.

И даже деформируем!

Да, вам не почудилось. Это паранейроавториг.

Поглядите на зайца-побивальца.

Может пора эксгумировать Метаверс?

@cgevent
Қайта жіберілді:
e/acc avatar
e/acc
GPT прошел тест Тьюринга. Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. Двойное, рандомизированное, контролируемое слепое исследование. Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот.

Выводы:
- Ллама 3.1 примерно как человек, в 50% случаев участники угадывают
- GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди.

Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/
27.04.202507:54
Нейропрожарка

Freya - Кукла

📽 Нейровидеоклип
📕 Слова - ARTESS
💻 Все остальное сделали нейросети!

chatGPT, suno, krea, kling, runway, fotopea, dzine, magnific, topaz.

Всех приветствую. Хочу рассказать немного о себе и о клипе.

Меня зовут Артем, и когда то очень давно (10 лет назад). Я занимался музыкой, а именно рэпом. Но так же писал просто песни. А так как петь я не умею, все так и лежало в столе все это время.

И вот полгода назад я познакомился с нейросетями. И ушел в них с головой. И первые впечатления конечно были, вау, что это за магия. Восторг!!! Живые котики)))

Спустя время, когда я достаточно разобрался. Пришел к выводу, что нужно делать что то посерьезнее, но нужно было понять что. И вот я вспомнил про свои тексты. Решил дать им вторую жизнь, я петь не умею, но умеет нейросеть.

Теперь о самой работе.

Общее время около примерно 40 часов.

12+- часов ушло на генерацию песни, задача была именно ее сгенерировать, без каких либо правок.
22+- часов на генерацию изображений и видео.
6+- часов на монтаж

И еще больше цифр.

7000 кредитов - клинг
4000 кредитов - суно
15000 кредитов - фрипик(магнифик)
Ранвей - безлимит
Креa - 20% от максимальной месячной подписки
Топаз годовая подписка
остальное по мелочи

Точную сумму в деньгах не просчитать. Но думаю около 20к₽.

Наваливаем коменты в коментах.

@cgevent
25.04.202508:04
Veo2 - лучший

Рубрика крутые подписчики.

Тут Егор прислал коммерческий клип сделанный на Veo2. Я попросил его рассказать, как это было сделано, чтобы не было "смотрите чо нейросети творят".

Итак, слово Егору и его оценкам преимущества Veo2 над всеми остальными:

Давече решил обкатать на полную катушку Veo2 text2video, прилетел заказ на мини клип, для песни, на рекламный ролик. Такое мы любим,такое нам интересно,когда ещё проникаешься по вайбу в трек, так вообще огонь. Что удалось понять за данный эксперимент. Гугл явно сейчас в лидерах по генерации видео, тут вы можете спорить или нет, но даже новый Клинг 2.0 так не умеет, я его успел потестировать.

А именно, Veo2 круто помнимает промпт, он круто соблюдает атмсоферу видео и даже t2v, работает по персонажами, лучше чем драный Midjourney, который я так люблю и одновременно ненавижу за их наплевательское отношение,на все просьбы от их пользователей.
Так же отмечу, что это дороже, чем всё остальное, но всё еще в разы дешевле, чем организовывать съемку. И да, ждём от них нормальное разрешение, потому что выглядит круто, но качества не хватает.

Ушло примерно 4-5 дней. Чисто генерации на Veo2 и переходы Клинг Кейфрэйм. Только Txt2video, персонажа сохранял по детальному описанию внешности, выбирал максимально карикатурного, что бы было больше деталей, которые при бросании в глаза не сильно отвлекают от того, что он немного отличается.

Есть 2 подсъема от заказчика, на 2 секунды, которые с телефоном, приложением и наливанием воды из бутылки, остальное все генерации, всё Txt2video(ну кроме переходов в клинге, там первое и последнее изображение брал)
Хочу отметить, что радует малое количество брака, хоть и дорого, но обычно он очень хорошо понимает промпт, главное соблюдать в каждом кадре точное описание местности и персонажа. А ну и шакалит качество он знатно, так как у них пока максимально это 720р.


@cgevent
30.03.202521:23
OpenAI сделала набор бесплатных курсов.

Заполняешь форму, на почту приходит magic link на сайт академии.

Немного пёстро - от RAG до ИИ для возрастных пользователей.

Есть основы Соры в нескольких частях.

Дело хорошее, вопрос аптейтов контента, все меняется каждый день.

https://academy.openai.com/

@cgevent
Қайта жіберілді:
Ai molodca avatar
Ai molodca
15.04.202507:42
Как многие вчера догадались — да, мы тестировали новый Kling 2.0 💥, который я гоняю уже где-то неделю в рамках партнёрской программы.

Что могу сказать? Он очень хорош: понимание промта, количество движения, последовательность — отлично.

😑 Первое видео — тест img-to-video из случайных кадров (включая ваши генерации и, конечно же, Уилла Смита с пастой).

😳 Второе, более интересное — новый режим Multi-Elements (на версии 1.6), который подрезали у Pika, но сделали гораздо лучше. Загружаете видео, референс, пишете что-то вроде "замени/удали/добавь [объект] из футажа 1 на [объект 2]" — и готово.

В целом, что нового:

1. Модель KLING 2.0 с улучшенными базовыми возможностями
Пока что только базовые режимы Text to Video и Image to Video, 720p, без дополнительных контролов (но, возможно, скоро подъедет другая версия 2.0).

2. Multi-Elements (v1.6)
Добавление, замена, удаление объектов в видеосцене — удобно, гибко, быстро.

3. Motion Control (v1.6)
Кастомная анимация персонажей на изображении по промту или референсу.

4. KOLORS 2.0 — обновлённая генерация изображений
Большие улучшения по сравнению с версией 1.5 — по качеству, цвету, деталям.

5. Restyle (KOLORS 2.0)
Смена стилистики изображения — работает чисто и разнообразно.

6. Редактирование изображений
Новые функции Inpaint и Expand для креативного редактирования.
Krea.ai не соврали: новый апдейт.

Теперь они идут в 3Д-генерацию...

Завтра изучаем их сетки.

Под капотом Hunyuan 3D and Trellis

@cgevent
Қайта жіберілді:
Denis Sexy IT 🤖 avatar
Denis Sexy IT 🤖
14.04.202519:47
Хехе, https://cursor.com/ тоже добавил 4.1 и сделал ее бесплатной (на какое-то время)

Гонка в которой выигрывает потребитель – лучшая гонка 🌝
28.03.202518:14
Переодеваторы.

Рубрика крутые подписчики.

У нас в чате нашлась Лена, а у Лены - приложение https://nextry.app/ - это переодеватор.
Вы думаете, почему я тут залип на редактировании изображений - мне было интересно поглядеть, а не убьют ли рынок переодеваторов новый chatGPT или Gemini, которые так лихо редактируют картинки.

Внешне выглядело так, что и в Gemini можно нарулить примерочную.

Что я натестил?

1. Так как в переодеватор грузишь обычно модель в полный рост, или поясной план, то chatGPT плохо забирает лицо, когда говоришь ему переодень барышню в другое платье.
2. Ну и так как он норовит пошевелить детали, что одежда малость не совпадает, с тем, что вы загрузили.
3. Ну и самое главное. Цензура. Как только речь доходит до белья и купальников, наши корпоративные друзья сливаются. Они и так на людей смотрят с опаской, а тут еще модели повсюду.

Перебеседовал с Леной - они, оказывается тренируют СВОЮ модель, это прям файнтюн под задачу (инсайд - три модели на основе Flux). Поэтому модель не боится купальников, вцепляется в лица и делает все довольно ловко.

Меня также поразило, что модель понимает множественные предметы - типа обувь, сумку и одежду в одном проходе.

Я также потестировал позабытую Kolors-Virtual-Try-On - он прямо сильно лажает в деталях, надписях и переносе.

Я попытался сломать переодеваторы, засунув в соломорезку рельсу, то есть фиолетовую барышню. Колорс не справился, а Nextry идеально срисовал лицо, но прическу и фигуру сильно "улучшил".
Как я понял, основной рынок - это виртуальные примерки, где модели имеют, скажем так, усредненные пропорции, поэтому достраиваются "средние" размеры.

Сдается мне это не совсем B2C рынок, и основная масса пользователей такого продукта (переодеватор), это все-таки бизнесы типа ритейлеров, но для конечного пользователя это тоже может иметь ценность. А если ввалить денег в маркетинг, то и вирусность.

В общем если интересно, потестируйте, там вроде 15 генераций в день есть. А в чате обсудим результат и баги. Я обнаружил, что руки живут немного своей жизнью, но вопрос в том, это баг или фича. Ну и всегда можно создать новый аккаунт, но я это не говорил.

https://nextry.app/

@cgevent
Новая опенсорсная и очень эмоциональная модель для озвучки(TTS).

Dia - это модель преобразования текста в речь с 1,6 млрд параметров, созданная в Nari Labs.

Есть код:

https://github.com/nari-labs/dia

На взрослых GPU может выдавать реалтайм. Жрет 10GB, но разрабы обещают кванты.

Разрабов, кстати, 1.5 человека. Один на парт тайме.

Есть неофициальное демо, официальное висит.

https://huggingface.co/spaces/mrfakename/dia-1.6b

@cgevent
Қайта жіберілді:
Denis Sexy IT 🤖 avatar
Denis Sexy IT 🤖
Поигрался с новой моделью Gemini 2.5 Pro Experimental 03-25 и это шикарная модель для написания кода – пока она решила задачи почти любой сложности что я ей давал; нет, машину времени она не сделает и Vice City не сделает с одного промпта – но всякие шейдеры, 3d проектики, html-react приложения и тп – изи

На видео новая модель Google сделала генетический симулятор тетриса который сам учится играть оптимизируя свою стратегию – вышла довольно сложная штука: в одном HTML-файле уместилась сама игра Тетрис, AI-игрок, решающий, куда ставить фигуру на основе набора правил и генетический алгоритм, все это оно написало с одного промпта

Вот тут детальнее как работает алгоритм:

Задача генетического алгоритма – подобрать идеальные "веса" для этих правил, чтобы AI играл максимально эффективно. Как он учится?

1. Поколения: Создается "популяция" AI с разными случайными настройками (весами эвристик).

2. Оценка: Каждый AI (или, для скорости, лучший представитель поколения) играет партию. Его "успешность" (фитнес) – это просто набранные очки. Чем больше очков, тем лучше стратегия.

3. Отбор: Лучшие AI-"родители" отбираются для "размножения".

4. Скрещивание и Мутация: Их "гены" (веса эвристик) смешиваются и немного случайно изменяются, создавая новое поколение AI, которое наследует черты успешных родителей, но с небольшими вариациями.

5. Повтор: Цикл повторяется много раз, и (в теории) с каждым поколением AI должен играть все лучше и лучше, находя все более оптимальные веса для своей стратегии.

И самое классное – можно в реальном времени наблюдать на экране, как лучший AI текущего поколения пытается побить рекорды, и смотреть в панели информации, как меняются его весовые коэффициенты – та самая "стратегия", которую он выучил


И самое прекрасное, что это все бесплатно 👏

Тетрис-симуляция тут:
https://shir-man.com/temp/tetris

В такие моменты очень люблю конкуренцию на рынке АИ

UPD. С двух промптов все же, второй починил мелкий баг эволюции – спасибо подписчику, что заметил – кожаных пока не заменяем
Понять за 60 секунд.

Вот нашел в фейсбучеке ролик, практически сгенерированный с помощью ИИ, по крайней мере спотыкающаяся озвучка, намекает. Но речь не про качество ролика. А, как ни странно, про содержание.

Вот я тут ною, что пока все эти ИИ-трейлеры режут глаз ацкими нестыковками по монтажу и принципом "слепила из того, что было".

Но похоже люди с такой насмотренностью будут потихоньку вымирать, ибо кто сейчас еще ходит в кино и может посмотреть два часа контента, не умерев от усилий по удержанию фокуса.

Новым нормальным тиктокерам уже 20-минутные эпизоды сериалов даются с трудом.

Поэтому появляются 60-секундные сериалы.

И вот тут-то ИИ развернется во всю мощь. Какие монтажные переходы, какой внутрикадровый монтаж? Новый нормальный контент компрессирует всё в щель внимания потребителя интернетика, которая сжимается все сильнее.

И вот тут-то появятся, наконец, кнопки "Сделай быстро".

Кроме того, если если подучить сетки сразу на этих самих 60-секундных сериалах и скриптах к ним, то все сведется к серверам, генерящим такой контент непрерывно.

@cgevent
Может быть я все пропустил, но по адресу https://gemini.google.com/
привезли Gemini 2.5 PRO вместе с Canvas.


Можно html\three.js код исполнять сразу справа в окне Canvas.

Питонг в превью нельзя, можно только редактировать.

Бесплатно, но есть лимиты.

@cgevent
Көбірек мүмкіндіктерді ашу үшін кіріңіз.