Мир сегодня с "Юрий Подоляка"

Труха⚡️Україна

View

Николаевский Ванёк

View

Мир сегодня с "Юрий Подоляка"

View

Труха⚡️Україна

View

Николаевский Ванёк

View

Метаверсище и ИИще

Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn

TGlist rating

TypePublic

Verification

Not verified

Trust

Not trusted

LocationРосія

LanguageOther

Channel creation dateAug 10, 2017

Added to TGlist

Nov 11, 2023

I own this channel

History of changes

Linked chat

MetaComments

2.6K

Statistic of Telegram Channel Метаверсище и ИИще

More details

Subscribers

38 797

24 hours

550.1%Week

4321.1%Month

1 7914.8%

Citation index

13

Mentions1Shares on channels0Mentions on channels1

Average views per post

770

12 hours3 9670%24 hours7700%48 hours5 2120%

Engagement rate (ER)

1.82%

Reposts14Comments3Reactions37

Engagement rate by reach (ERR)

1.98%

24 hours0%Week

2.19%Month

Average views per ad post

770

1 hour2 252292.47%1 – 4 hours53168.96%4 - 24 hours1 988258.18%

More details

Connect our bot to the channel to find out the gender distribution of this channel's audience.

Total posts in 24 hours

8

Dynamic

Latest posts in group "Метаверсище и ИИще"

All posts

Reposted from:

AI Product | Igor Akimov

22.04.202521:35

Anthropic вчера опубликовал, а сегодня на хабре перевели отличный гайд по использованию агентов в программировании, чтобы не ругаться на тупой chatgpt или Claude, когда он вам пол-проекта перепишет :)
Например там про то, чтобы план составить сначала:
https://habr.com/ru/articles/902422/

22.04.202516:40

Тут на https://wan.video/ раздают бесплатную видеогенерацию в Relax Mode.

Говорят, что с 23 апреля All users can create stunning videos and images entirely free with Relax Mode.

Непонятно, сколько будет время ожидания, может час, а может сутки.

@cgevent

22.04.202514:55

А зачем размениваться на какие-то сторонние сервисы для просмотра 3Д-моделей в предыдущем посте?

Идем в о3 и говорим:

а сейчас напиши мне код, для "OBJ VIEWER" который я смогу запустить в Canvаs и увидеть 3Д-модель. Там должна быть галочка "включить показ edges" ну или wireframe mode

сделай кнопку загрузить с компьютера

Бах! В канвасе, который он сам же и открыл появляется код на реакте и кнопка Preview. Жмем ея, видим наш 3D-viewer, загружаем нашу маску лица, включаем галку wireframe - и все работает!

Год назад разговор зумеров: слушай, есть такие прикольные аппки для вот этого и этого и этого.

Через год от сейчас: хочу аппку, которая делает вот это.

АПАЖАЛСТА!

@cgevent

22.04.202514:46

Ну что, за 3Д-генераторы и MCP? Пока нет.

Идем в 4о или о3 и говорим:

А сделай мне 3Д-модель стола в формате STL, чтобы я мог бахнуть его на 3Д-принтер.

Нивапрос, апажалста.

Смотрим, что он сделал идеальную топологию и спрашиваем:

Питонг?

Угу. Хочешь ящик добавлю.

Довай!

Становится понятно, что он использует trimesh разные процедурные дела, чтобы сделать вот такие вот модельки.

Усложняем задачу:
Сгенерирую маску лица на 5000 полигонов, также как ты генерируешь текстовые файлы в других форматах, не бойся ошибиться. если тебя пугает размер файла, давай сделаем в формате OBJ. Сделай вздох, подумай хорошо, посмотри в интернете как устроены человеческие лица в программах типа Zbrush и сделай хорошую маску в формате OBJ на 4000 полигонов.

Задумался "The user wants a manually created STL file, so my first instinct is to avoid algorithmic generation. "

Держи!

В общем, держите, лицо от chatGPT - он художник, он так видит. Чолка зачотная.

Хошь, говорит, глазки вырежу?

Довай.

Понятно, что процедурно, вы сможете попросить его сделать довольно сложные вещи кодом и он сделает (кстати, надо попробовать попросить написать geometry nodes для Блендора). И тут вам даже не нужен MCP, если у вас хорошо подвешен язык и есть понимание как работает 3Д (это универсальное правило про MCP).

Но он честно пытается помять плоскость и выдавить маску лица! Мне это сильно напоминает работы студентов в Maya, когда я давал им сферу и возможность кисточками выдавить маску лица (sculpting), он просто еще двухлетка и плохо держит кисть..

В общем, покуролесьте.
И держите https://3dviewer.net/index.html

@cgevent

22.04.202508:26

Новая опенсорсная и очень эмоциональная модель для озвучки(TTS).

Dia - это модель преобразования текста в речь с 1,6 млрд параметров, созданная в Nari Labs.

Есть код:

https://github.com/nari-labs/dia

На взрослых GPU может выдавать реалтайм. Жрет 10GB, но разрабы обещают кванты.

Разрабов, кстати, 1.5 человека. Один на парт тайме.

Есть неофициальное демо, официальное висит.

https://huggingface.co/spaces/mrfakename/dia-1.6b

@cgevent

22.04.202508:14

Vidu Q1: Сорри, я опять с этими видеогенераторами.

Китайцев покусал OpenAI и после версии Vidu 2.0 они выпустили версию Q1. Во втором квартале.

Что нового:
Сильно прибрали мыло.
Первый и последний кадр.
Звук и звуковые эффекты.
1080р
24fps

Можно и нужно тестировать, тем более, что по промокоду VIDUQ1 дают +100 кредитов на новый акк(тоже 100), плюс наваливают ещё немного(20) каждый день.

https://www.vidu.com/

@cgevent

21.04.202521:00

Погонял MAGI-1 у них на сайте.
Разрешение действительно конское: 1688х1440. Но мыла наваливает тоже нехило.

Наваливайте примеры в коменты.

@cgevent

19.04.202510:52

Вот мы все ждали кнопку "Сделать красиво".

Дождались. Но никто не обещал в дороге кормить и то, что кнопка будет одна!

Вы тоже мучаетесь?

Теперь ждём бальшую кнопку "Выбрать нужную кнопку".

Одну.

Ибо выбирать - не барское это дело. Свободу воли оставьте ИИ.

Нажимать, не мешки ворочать.

@cgevent

18.04.202518:07

Krea.ai, что ты делаешь, прекрати!

Krea Stages - вытаскиваем из картинки 3д, генерим 3д, и трансформируем 3д.

И даже деформируем!

Да, вам не почудилось. Это паранейроавториг.

Поглядите на зайца-побивальца.

Может пора эксгумировать Метаверс?

@cgevent

16.04.202513:52

Принес две полезные ссылки про ИИ и бизнес.

В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.

Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/

@cgevent

15.04.202518:09

Так, пора расчехлить обратно подписку на Gemini Advanced.

Всем платным юзерам раскатывают Veo2, плюс анимацию через Whisk.

Я прошерстил твиттор за лимиты - и вроде как дают 100 видосов в месяц. Но это надо уточнять.

Если это так, то надо считать экономику среднего пользователя.

Сейчас я могу генерить бесплатно и быстро до 5 видосов в день в Gemini без подписки. Проверял утром на криптопасхе. Аккаунтов у меня чуть меньше, чем простых чисел.

Но я все равно куплю. Прогиб будет защитан по-любому. ИИ все помнит.

Почитайте тут, подумайте.

https://blog.google/products/gemini/video-generation/

@cgevent

15.04.202508:43

Немного примеров из нового Клинга 2.0

Все отмечают нормальную динамику и уход slow-motion движения на видео, которым грешили все генераторы прошлого года. Тут Клинг скорее в роли догоняющего, но это все равно отлично, ибо эпоха слоу-моушен-трейлеров уходит.

@cgevent

Reposted from:

Ai molodca

15.04.202507:42

Как многие вчера догадались — да, мы тестировали новый Kling 2.0 💥, который я гоняю уже где-то неделю в рамках партнёрской программы.

Что могу сказать? Он очень хорош: понимание промта, количество движения, последовательность — отлично.

😑 Первое видео — тест img-to-video из случайных кадров (включая ваши генерации и, конечно же, Уилла Смита с пастой).

😳 Второе, более интересное — новый режим Multi-Elements (на версии 1.6), который подрезали у Pika, но сделали гораздо лучше. Загружаете видео, референс, пишете что-то вроде "замени/удали/добавь [объект] из футажа 1 на [объект 2]" — и готово.

В целом, что нового:

1. Модель KLING 2.0 с улучшенными базовыми возможностями
Пока что только базовые режимы Text to Video и Image to Video, 720p, без дополнительных контролов (но, возможно, скоро подъедет другая версия 2.0).

2. Multi-Elements (v1.6)
Добавление, замена, удаление объектов в видеосцене — удобно, гибко, быстро.

3. Motion Control (v1.6)
Кастомная анимация персонажей на изображении по промту или референсу.

4. KOLORS 2.0 — обновлённая генерация изображений
Большие улучшения по сравнению с версией 1.5 — по качеству, цвету, деталям.

5. Restyle (KOLORS 2.0)
Смена стилистики изображения — работает чисто и разнообразно.

6. Редактирование изображений
Новые функции Inpaint и Expand для креативного редактирования.

Reposted from:

Denis Sexy IT 🤖

14.04.202519:47

Хехе, https://cursor.com/ тоже добавил 4.1 и сделал ее бесплатной (на какое-то время)

Гонка в которой выигрывает потребитель – лучшая гонка 🌝

Reposted from:

Data Secrets

14.04.202517:47

⚡️ OpenAI показали свои новые модели GPT-4.1, GPT-4.1 mini и GPT-4.1 nano

В чате их не будет: они только для разработчиков в API. У всех трех моделей контекст 1 миллион токенов, для OpenAI это впервые. Знания до 1 июля 2024.

Для программирования модель действительно хороша: на SWE-bench обгоняет даже o1 high. При этом стоит намного дешевле ($2.00 / 1M инпут и $8.00 / 1M аутпут). Плюсом неплохие способноси на мультимодальных задачах и математике.

Последний график – масштабирование на росте контекста. Видно, что 4.1 на голову лучше остальных моделей OpenAI на длинных последовательностях, то есть даже на огромных документах или кодовых базах не будет терять детали.

Ну и вишенка: семь дней модель будет абсолютно бесплатной вот тут

Цены и детали – здесь, а вот блогпост со всеми метриками

All posts

Advertised0 seconds

22.04.202517:18teslak 404 ϟ случайные сигналы

332

Advertised0 seconds

22.04.202515:40teslak 404 ϟ случайные сигналы

332

Advertised0 seconds

114

21.04.202520:47teslak 404 ϟ случайные сигналы

332

Advertised2 hours

167

21.04.202512:13Neural Shit

47.2K

Advertised0 seconds

16.04.202507:52Neural Shit

47.2K

Advertised0 seconds

11.04.202510:27Neural Shit

47.2K

Advertised1 day

27.08.202414:28Мишин Лернинг 🇺🇦🇮🇱

Technology

More details

Records

23.04.202523:59

38.8KSubscribers

28.02.202523:59

325Citation index

25.01.202523:59

14.6KAverage views per post

25.01.202523:59

14.6KAverage views per ad post

09.02.202523:59

25.84%ER

09.03.202514:24

24.97%ERR

Growth

More details

Subscribers

Citation index

Avg views per post

Avg views per ad post

ERR

More details

Popular posts Метаверсище и ИИще

All posts

Reposted from:

AI Product | Igor Akimov

22.04.202521:35

16.04.202513:52

18.04.202518:07

Reposted from:

e/acc

02.04.202518:53

GPT прошел тест Тьюринга. Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. Двойное, рандомизированное, контролируемое слепое исследование. Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот.

Выводы:
- Ллама 3.1 примерно как человек, в 50% случаев участники угадывают
- GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди.

Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/

30.03.202521:23

OpenAI сделала набор бесплатных курсов.

Заполняешь форму, на почту приходит magic link на сайт академии.

Немного пёстро - от RAG до ИИ для возрастных пользователей.

Есть основы Соры в нескольких частях.

Дело хорошее, вопрос аптейтов контента, все меняется каждый день.

https://academy.openai.com/

@cgevent

Reposted from:

Ai molodca

15.04.202507:42

24.03.202511:19

Тут Андрей Карпатый на вайбе выпивает за разработчиков приложений на Swift для айфона.

Я, говорит, вашего Свифта никогда в глаза не видел, но за час написал приложение вайбкодингом.

Прикольно, что он расшарил свои чаты с chatGPT - можете посмотреть, как умные люди общаются с ИИ.

Почитайте эту ветку, много забавного.
https://x.com/karpathy/status/1903891179370123559

Народ соревнуется, кто быстрее напишет такое же и предлагает Андрею запихнуть это в AppStore.

Андрей такой: для этого придется общаться с chatGPT не менее часа!

@cgevent

31.03.202521:26

Krea.ai не соврали: новый апдейт.

Теперь они идут в 3Д-генерацию...

Завтра изучаем их сетки.

Под капотом Hunyuan 3D and Trellis

@cgevent

Reposted from:

Denis Sexy IT 🤖

14.04.202519:47

28.03.202518:14

Переодеваторы.

Рубрика крутые подписчики.

У нас в чате нашлась Лена, а у Лены - приложение https://nextry.app/ - это переодеватор.
Вы думаете, почему я тут залип на редактировании изображений - мне было интересно поглядеть, а не убьют ли рынок переодеваторов новый chatGPT или Gemini, которые так лихо редактируют картинки.

Внешне выглядело так, что и в Gemini можно нарулить примерочную.

Что я натестил?

1. Так как в переодеватор грузишь обычно модель в полный рост, или поясной план, то chatGPT плохо забирает лицо, когда говоришь ему переодень барышню в другое платье.
2. Ну и так как он норовит пошевелить детали, что одежда малость не совпадает, с тем, что вы загрузили.
3. Ну и самое главное. Цензура. Как только речь доходит до белья и купальников, наши корпоративные друзья сливаются. Они и так на людей смотрят с опаской, а тут еще модели повсюду.

Перебеседовал с Леной - они, оказывается тренируют СВОЮ модель, это прям файнтюн под задачу (инсайд - три модели на основе Flux). Поэтому модель не боится купальников, вцепляется в лица и делает все довольно ловко.

Меня также поразило, что модель понимает множественные предметы - типа обувь, сумку и одежду в одном проходе.

Я также потестировал позабытую Kolors-Virtual-Try-On - он прямо сильно лажает в деталях, надписях и переносе.

Я попытался сломать переодеваторы, засунув в соломорезку рельсу, то есть фиолетовую барышню. Колорс не справился, а Nextry идеально срисовал лицо, но прическу и фигуру сильно "улучшил".
Как я понял, основной рынок - это виртуальные примерки, где модели имеют, скажем так, усредненные пропорции, поэтому достраиваются "средние" размеры.

Сдается мне это не совсем B2C рынок, и основная масса пользователей такого продукта (переодеватор), это все-таки бизнесы типа ритейлеров, но для конечного пользователя это тоже может иметь ценность. А если ввалить денег в маркетинг, то и вирусность.

В общем если интересно, потестируйте, там вроде 15 генераций в день есть. А в чате обсудим результат и баги. Я обнаружил, что руки живут немного своей жизнью, но вопрос в том, это баг или фича. Ну и всегда можно создать новый аккаунт, но я это не говорил.

https://nextry.app/

@cgevent

22.04.202508:26

Reposted from:

Denis Sexy IT 🤖

29.03.202511:40

Поигрался с новой моделью Gemini 2.5 Pro Experimental 03-25 и это шикарная модель для написания кода – пока она решила задачи почти любой сложности что я ей давал; нет, машину времени она не сделает и Vice City не сделает с одного промпта – но всякие шейдеры, 3d проектики, html-react приложения и тп – изи

На видео новая модель Google сделала генетический симулятор тетриса который сам учится играть оптимизируя свою стратегию – вышла довольно сложная штука: в одном HTML-файле уместилась сама игра Тетрис, AI-игрок, решающий, куда ставить фигуру на основе набора правил и генетический алгоритм, все это оно написало с одного промпта

Вот тут детальнее как работает алгоритм:

Задача генетического алгоритма – подобрать идеальные "веса" для этих правил, чтобы AI играл максимально эффективно. Как он учится?

1. Поколения: Создается "популяция" AI с разными случайными настройками (весами эвристик).

2. Оценка: Каждый AI (или, для скорости, лучший представитель поколения) играет партию. Его "успешность" (фитнес) – это просто набранные очки. Чем больше очков, тем лучше стратегия.

3. Отбор: Лучшие AI-"родители" отбираются для "размножения".

4. Скрещивание и Мутация: Их "гены" (веса эвристик) смешиваются и немного случайно изменяются, создавая новое поколение AI, которое наследует черты успешных родителей, но с небольшими вариациями.

5. Повтор: Цикл повторяется много раз, и (в теории) с каждым поколением AI должен играть все лучше и лучше, находя все более оптимальные веса для своей стратегии.

И самое классное – можно в реальном времени наблюдать на экране, как лучший AI текущего поколения пытается побить рекорды, и смотреть в панели информации, как меняются его весовые коэффициенты – та самая "стратегия", которую он выучил

И самое прекрасное, что это все бесплатно 👏

Тетрис-симуляция тут:
https://shir-man.com/temp/tetris

В такие моменты очень люблю конкуренцию на рынке АИ

UPD. С двух промптов все же, второй починил мелкий баг эволюции – спасибо подписчику, что заметил – кожаных пока не заменяем

07.04.202507:09

Понять за 60 секунд.

Вот нашел в фейсбучеке ролик, практически сгенерированный с помощью ИИ, по крайней мере спотыкающаяся озвучка, намекает. Но речь не про качество ролика. А, как ни странно, про содержание.

Вот я тут ною, что пока все эти ИИ-трейлеры режут глаз ацкими нестыковками по монтажу и принципом "слепила из того, что было".

Но похоже люди с такой насмотренностью будут потихоньку вымирать, ибо кто сейчас еще ходит в кино и может посмотреть два часа контента, не умерев от усилий по удержанию фокуса.

Новым нормальным тиктокерам уже 20-минутные эпизоды сериалов даются с трудом.

Поэтому появляются 60-секундные сериалы.

И вот тут-то ИИ развернется во всю мощь. Какие монтажные переходы, какой внутрикадровый монтаж? Новый нормальный контент компрессирует всё в щель внимания потребителя интернетика, которая сжимается все сильнее.

И вот тут-то появятся, наконец, кнопки "Сделай быстро".

Кроме того, если если подучить сетки сразу на этих самих 60-секундных сериалах и скриптах к ним, то все сведется к серверам, генерящим такой контент непрерывно.

@cgevent

27.03.202515:38

Редактирование изображений в chatGPT, Gemini и Grok.

Попробую написать понятный пост, а то в последнее время гиковато выходит.

Сравнивать качество генерации дело непростое, очень субъективно.
Вот например хорошая таблица от Игоря (обновляется), но там пока нет последних новостей.

Поэтому я сравнил, насколько новые (авторегрессионые) генераторы управляются с редактированием изображений (которое в телеге озвучивается как Фотошоп больше не нужен).

Было интересно поглядет насколько генераторы СОХРАНЯЮТ оригинал и насколько НЕ ШЕВЕЛЯТ исходную картинку.

Забегая вперед:
Gemini Image Generator лучше всех справляется с этим.
Потом Грок 3.
Потом chatGPT, который нещадно шевелит картинку.

Я просто взял свои любимые частицы (много деталей) и присунул их на вход со словами "Make particles blue". Загрузил картинку и ввел промпт в каждый генератор.
Перекрась, типа, колоркоррекция, мыжкомпозеры.

Мы, конечно, живем в удивительное время, когда новые генераторы и версии появляются про ТРИ в неделю. Раньше ждали примерно год обновления софта до новой версии (Майя, Фотошоп). А щас 2 дня.

Теперь по порядку.

У Гугла новая модель Gemini 2.5. Миллион токенов контекста, и она ОЧЕНЬ умная. Ее можно попробовать в AI Studio

Да, бесплатно, но есть лимит. Но в нее еще не завезли генерацию изображений (когда завезут, будет просто бомба, я думаю). Она смешно говорит, я сгенерила, вот! Но картинки нет.
А чтобы генерить картинки, нужно выбрать Gemini 2.0 Flash Image Generation справа на экране (или где-то на мобиле).
Тут Гугл опять всех приподзапутал, неделю назад это было в https://gemini.google.com/ и в модели 2.0 Flash Tinking Experimental. Теперь Флэш разучился редактировать(у меня, только генерация с помощью Imagen3), поэтому идем в AI Studio и генерит там, выбрав Gemini 2.0 Flash Image Generation справа.

Генерит быстро. Редактирует тоже быстро. Выдает в 16:9, не путается в аспектах и разрешениях. 1024 по ширине.
Лучше всех перекрасила мои частицы в синий. Сохранила детали на месте.

Grok 3 (на сайте grok.com) тоже сохранил мои частицы на месте, но выдал ацкие артефакты - частицы как-будто моль поела. Но мы тут про редактирование.

А вот chatGPT явно двигает детали, путается в разрешениях (иногда выдает квадратное, хотя на входе лежачая картинка). Не умеет 16:9, только 3:2. Я уже присовывал ему его родное 1536х1024, но он все равно двигает детали и морфирует картинку.

Еще раз. Я тут не про качество генерации, я про точность редактирования.
По качеству, chatGPT самый наверное крутой. По точности - нет.
Ну и я не проверял вот это вот "надень очки, сними пиджак, убери кота". Проверим в чате.

Про авторегрессию надо наверное отдельный пост сделать. Качество этих генераторов вплотную подтянулось к диффузионным (Flux, Reve, SD), а вот в плане понимания редактирования - нас ждут сюрпризы, ибо мультимодальные\авторегрессионные модели (OpenAI, Gemini, Grok) умнеют и тащат за собой качество генерации вверх.

Я полностью залипаю в chatGPT и Gemini последнюю неделю.

@cgevent

26.03.202515:52

Похоже Reve со своей диффузией, потратили год, чтобы уткнуться в демонстрацию новых картинок от OpenAI. Которые генерятся авторегрессией, и которые чудовищно хорошо понимают промпт.

Я просто залип и не вылезаю из Sora и chatGPT.

А на что еще потратить время, как не плакаты по технике безопасности.

Я даже промпт вбивал на русском.

Позалипайте вот тут: https://sora.com/explore/images - день назад нельзя было представить таких композиций, деталей и понимания промпта.

@cgevent