Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Нейронавт | Нейросети в творчестве avatar

Нейронавт | Нейросети в творчестве

Канал про нейросети в компьютерной графике, в кино и вообще
для связи @Neuronauticus
TGlist रेटिंग
0
0
प्रकारसार्वजनिक
सत्यापन
असत्यापित
विश्वसनीयता
अविश्वसनीय
स्थानРосія
भाषाअन्य
चैनल निर्माण की तिथिNov 30, 2021
TGlist में जोड़ा गया
Sep 06, 2024
संलग्न समूह

समूह "Нейронавт | Нейросети в творчестве" में नवीनतम पोस्ट

FramePack

Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel

480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B

Поддерживает PyTorch, xformers, flash-attn, sage-attention

Ждем однокликовый установщик для Windows, возможно даже завтра

Код

#optimization #text2video #image2video
и ни одного каламбура. я разочарован
से पुनः पोस्ट किया:
Метаверсище и ИИще avatar
Метаверсище и ИИще
Безлимитная Сора.

А почему все молчат?

Я залогинился в sora.com под своим chatGPT Plus аккаунтом, и Сора пишет - никаких более кредитов. Творчество не кредитуется!

Полез в обновленный сегодня FAQ, а там:

Understanding Unlimited Usage
ChatGPT Pro and Plus plans offer unlimited access to Sora
https://help.openai.com/en/articles/10245774-sora-billing-faq#h_5a4892aa77


Плюсовики, налетай!

@cgevent
Gradio Sketch 2.0

Вайб-кодинг
Визуальное создание полных приложений Gradio, включая добавление событий, без единой строки кода

Если у вас уже установлен Gradio, то обновляем

𝚙𝚒𝚙 𝚒𝚗𝚜𝚝𝚊𝚕𝚕 --𝚞𝚙𝚐𝚛𝚊𝚍𝚎 𝚐𝚛𝚊𝚍𝚒𝚘


и запускаем в терминале:

𝚐𝚛𝚊𝚍𝚒𝚘 𝚜𝚔𝚎𝚝𝚌𝚑


#coding #vibecoding
Опубликован код редактора аватара головы GaussianAvatar-Editor

Код

Спасибо @Dmitriy_Ru6ts0v

#humanavatar #gaussian #gaussianeditor
Gemini Code Assist стал бесплатным.

Окно контекста 128K токенов
20+ языков программирования
180 тысяч дополнений кода в месяц

Доступно для VSCode, Jetbrains. Github

Блог

#coding
ComfyUI-WanVideoWrapper

Ноды видеогенератора Wan2.1 для #ComfyUI

В репозитории выложен тест 512x512x81, "~16GB used with 20/40 blocks offloaded"
Автор пишет что пока смог запустить только image2video

Сохраняйте спокойствие, работы ведутся

Пожатые веса

#image2video
«Я плохо получаюсь на фотографиях»…

Теперь это неважно.

Аня уже пару лет тренирует нейросети и создаёт крутые фотосессии для блогеров, сммщиков и даже фотографов.

Смотри чему можно научиться в канале ИИшница | визуал и нейросети :

✅Как с помощью нейросети за 5 минут улучшить свои фото?
✅Как приручить дракона, даже если у тебя нет дракона?
✅Какими нейросетями можно пользоваться бесплатно?

Справится даже новичок

Подписывайтесь, чтобы не потерять:👉 @solokvest

#промо
❗️Это ваш шанс заявить о себе!
Стартовал III сезон международного конкурса AI-фильмов MyFilm[48] в сотрудничестве с крупным брендом обуви и аксессуаров.

MyFilm[48] — это первый в России международный онлайн-конкурс AI-фильмов, где за 48 часов необходимо создать короткое видео или анимацию с помощью нейронных сетей. Участников в этом сезоне конкурса будет ждать интересное творческое задание на тему «Реклама как кино»!

🟣 Почему стоит участвовать?
— У вас будет возможность проявить себя в индустрии.
— Вы получите креативный опыт работы с AI.
— Станете частью международного сообщества.
— У каждого участника есть шанс получить предложение о сотрудничестве.

Отраслевые партнеры и эксперты конкурса из разных индустрий выберут победителей, которые получат ценные призы.

🗓 Конкурс пройдет в онлайн формате с 1 по 2 марта. И уже 10 марта мы объявим победителей нового сезона!

Регистрируйтесь и подписывайтесь на соц. сети VK и TG, чтобы быть в курсе событий 📲

Участие в конкурсе бесплатное!

#промо
Заработал демоспейс SliderSpace
Только непонятно как работает слайдер. Он не интерактивный. А новая генерация выдает чтото совершенно новое

В коментах ответ

Демо

#text2image #variation #slider
SANA FOR WINDOWS

Генератор картинок Sana для Windows (в оригинальном репозитории пользователи винды сталкивались с линуксовыми зависимостями)
Нужна Cuda 12

Гитхаб

#text2image
से पुनः पोस्ट किया:
Метаверсище и ИИще avatar
Метаверсище и ИИще
Если честно, то даже я приподохренел.

Тут у нас была дискуссия (бессодержательная по большей части) за рекламу, ну штош, держите рекламы.
Давайте вы сначала посмотрите ролик со звуком(!), а потом почитаете тексты ниже...





















Пришлось смотреть 3 раза.

Конечно, я испортил весь эффект, тем что сразу акцентировал внимание на ролике. Но таки да, это генератив от Veo2. И тут Гугл, похоже, пока непобиваем.
Я вначале подумал, что дядьки с камерами настоящие и щас нам расскажут про совмещение ИИ и видео.

Но из настоящего тут только говорящая голова со странным акцентом в части behind the scenes

Пруф тут: https://www.youtube.com/watch?v=VqLWWYfCEbI

Нормальный такой 𝘢𝘯 𝘪𝘯𝘥𝘦𝘱𝘦𝘯𝘥𝘦𝘯𝘵 𝘤𝘳𝘦𝘢𝘵𝘪𝘷𝘦 𝘦𝘹𝘦𝘳𝘤𝘪𝘴𝘦 - как пишет автор. Один. Без ансамбля.

От себя добавлю, что закадровый нарратив для ИИ-роликов - это прям палочка выручалочка, недавно об этом думал.

Встречал немного снобистское мнение в прошлой жизни, что закадровый нарратив появляется там, где режиссер не может справиться со сценой или сценарием. Для ИИ - это идеальные костыли. Поглядите ролик еще раз.
И спать.

P.S. Огромное спасибо Всеволоду Тарану за такой шикарный ИИ-подгон.

@cgevent
Этот ролик, сделанный в Veo 2 - редчайший случай из всего потока генеративного видео, когда я верю что это люди в кадре, а не бестолковая кучка пикселей, мимикрирующих под людей. Они делают что-то осмысленное, а не имтируют движение. По крайней мере, мне это так выглядит

Ну и тут посмотреть бы на промпты и количество отбракованных версий. Скорее всего автор режиссер с опытом и понимает как работает камера и действие в кадре
Pippo : High-Resolution Multi-View Humans from a Single Image

Из одного портретного или в полный рост фото человека делает тёрнтейбл - фото облет студийного качества 512х512 (называют это 1K)

Код

#image2video #novelview
Zonos

Голосовая модель от Zyphra
Хвастаются превосходством над всеми конкурентами

- Контроль эмоций
- Клонирование голоса по 10-30 секундному образцу
- Звуковые префиксы: Добавьте текст плюс аудиофайл чтобы задать динамику, например шепот
- Поддерживает английский, японский, китайский, французский и немецкий языки, русского нет
- Контроль скорости речи, высоты тона, максимальной частоты, качества звука
- Работает вдвое быстрее рилтайма на RTX 4090
- Есть Playground и API


Код
Демо - вход через гугл/регу
Блог - там есть тесты сравнения с конкурентами

#voicecloning #tts #text2speech

रिकॉर्ड

17.04.202523:59
8.1Kसदस्य
14.03.202522:02
200उद्धरण सूचकांक
14.01.202523:59
1.7Kप्रति पोस्ट औसत दृश्य
20.11.202423:59
970प्रति विज्ञापन पोस्ट औसत दृश्य
29.09.202423:59
17.63%ER
14.01.202523:59
23.95%ERR

विकास

सदस्य
उद्धरण सूचकांक
एक पोस्ट का औसत दृश्य
एक विज्ञापन पोस्ट का औसत दृश्य
ER
ERR
OCT '24JAN '25APR '25
अधिक कार्यक्षमता अनलॉक करने के लिए लॉगिन करें।