Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Инсайдер UA
Инсайдер UA
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Инсайдер UA
Инсайдер UA
Метаверсище и ИИще avatar

Метаверсище и ИИще

Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
TGlist rating
0
0
TypePublic
Verification
Not verified
Trust
Not trusted
LocationРосія
LanguageOther
Channel creation dateAug 10, 2017
Added to TGlist
Nov 11, 2023
Linked chat

Statistic of Telegram Channel Метаверсище и ИИще

Subscribers

39 877

24 hours
47
0.1%Week
389
1%Month
1 610
4.2%

Citation index

0

Mentions1Shares on channels0Mentions on channels1

Average views per post

4 347

12 hours4 404
26.5%
24 hours4 347
74.6%
48 hours21 7700%

Engagement rate (ER)

3.27%

Reposts68Comments3Reactions74

Engagement rate by reach (ERR)

10.9%

24 hours
32.14%
Week
0.46%
Month
1.27%

Average views per ad post

3 720

1 hour2 04955.08%1 – 4 hours57915.56%4 - 24 hours3 69099.19%
Connect our bot to the channel to find out the gender distribution of this channel's audience.
Total posts in 24 hours
6
Dynamic
4

Latest posts in group "Метаверсище и ИИще"

В общем я развел HunyuanCustom. Этот такой слон в посудной лавке.

С самом экономичном режиме, GPU POOR он считает 5 секунд в течении 40 минут в разрешении 892х540 и жрет 36гиг на A100 (fp8)

Я посчитал их пример. Работает. Лицо переносит.

Но сейчас поставил 1280х720 с полной моделью. 65 гиг и 6 минут на итерацию. Итого 180 минут, то есть 3 часа. На A100.

Может в Комфи будет быстрее, но я не уверен.

https://github.com/Tencent/HunyuanCustom

@cgevent
Мне кажется многие недооценивают FramePack, а точнее FramePack Studio.

Это сейчас самый легкий, быстрый и ловкий способ генерить ДЛИННЫЕ image2video.

Вы наконец-то можете уйти от этого короткоствольного монтажа, когда каждые 5 секунд, глаз уже дергается в ожидании смены плана. Тут вы можете задавать планы хоть по 2 минуты. Надо только приноровиться с промптами.И он реально быстрый.
Плюс там промпты с таймкодами, вообще бомба.

Я поставил этот ваш хваленый Hunyan Custom, это чемодан без ручки, впрочем щас напишу про него.

A FramePack Studio пережевывает мои фракталы, тратя 30 секунд на 1 секунду видео.

https://github.com/colinurbs/FramePack-Studio/

@cgevent
Давно слежу за "умными контактными линзами".

Сам носил линзы 20 лет, пока роговица не сказала пока-пока. Поэтому я крайне скептичен относительно таких девайсов для широкой публики.

Вот это вот ежедневное "тыкание пальцами в глаза" ничего кроме неприятных воспоминаний не приносит. А часть народа просто не сможет это делать. Но это субъективное мнение.

У smart contacts lenses есть две проблемы:

Перегрев и питание.

Вторую задачу ребята из Хайфы зарешали вот такой нашлепкой на веко: это и зарядка по wi_fi, и передатчик данных.

Но, судя по красному оттенку глаза, перегрев все ещё проблема.

Я могу себе представить применение в медицине, реабилитации, у вояк и спецтренингах.

Если вы не биохакер, то вряд ли полезете себе в глаза ради метаверса и дополненной реальности.

Выглядит круто, но вызывает у меня панику.


https://www.blinkenrg.com/

@cgevent
Я тут периодически приподвзвываю о том, что нынешние генераторы 3Д годятся разве что для 3Д-печати и метаверсиков.

Нашел подтверждение последнему и не где-нибудь, а в логове самого метаверса - Meta Horizon Worlds.
В апреле уже прошла новость, что в Horizon Worlds уже можно генерить текстуры и меши с помощью ИИ.

А сейчас Метачка выкатила обнову этого своего 3Д-генератора под названием AssetGen 2.0

Спойлер: кода нет, демо нет бумаги нет, ничего нет. Это инхаус для Horizon Worlds - метаверсика от метачки.

Но выглядит нарядно, пройдите по ссылке, там хорошие черрипики.

По словам метачки, AssetGen 2.0 обеспечивает "значительно улучшенную детализацию и точность" по сравнению с 1.0, включая "геометрическую согласованность с очень мелкими деталями".

На техническом уровне AssetGen 2.0 имеет совершенно иную архитектуру, чем оригинал. AssetGen 1.0 сначала генерировал несколько 2D-изображений предполагаемого ассета, основываясь на промпте, а затем передавал эти изображения другой нейронке, которая генерировала 3Д-сетку. В отличие от этого, AssetGen 2.0 представляет собой одноступенчатую диффузионную 3D-модель, напрямую генерирующую 3Д-ассеты на основе промпта, и которая была непосредственно обучена на большом корпусе 3D-ассетов.

3Д-генерация - это пожалуй самая динамичная область GenAI, там прогресс идет каждый месяц. И не на уровне "вот новая Лора или контролНет", а на уровне самих моделей.

Пойду посмотрю, что Deemos Tech готовят

https://developers.meta.com/horizon/blog/AssetGen2/

@cgevent
Андрей Карпатый предлагает концепцию LMOS - операционная система, работающая на базе LLM.

Вместо CPU, который перемалывает инструкции на основе байтов, тут LLM, которая перемалывает инструкции на основе токенов.
Память (RAM\VRAM) - это контекстное окно, заполненное вместо байтов токенами.

И вот уже вместо программеров им пользуются ВСЕ, просто разговаривая с ним, вместо написания кода и инструкций.

Мы теперь сами себе вайбсисадмины.

@cgevent
Рендер или видео?
Тесла Оптимус. В реальном времени.

@cgevent
Это вам за то, что не молитесь!

И не дЫшите маткой... по схеме на стене...

@cgevent
Reposted from:
Data Secrets avatar
Data Secrets
Китайский агент Manus с сегодняшнего дня открыт для всех без листа ожидания

Про самого агента и его особенности мы писали вот тут. Напоминаем, что это реально автономный и универсальный ИИ-агент, который по сути представляет из себя Cursor, Operator и Deep Research в одном флаконе.

Кроме того, агент частично бесплатный: каждый день они выдают по 300 кредитов на пользователя (это примерно одна задача средней сложности), а при регистрации единовременно начисляют 1000 кредитов.

Пробуем первыми тут

P.S. Для входа нужно включить VPN, а затем верифицировать номер телефона. С российскими номерами тоже работает, если выбрать в списке стран Казахстан.
Алибаба бахнули в сеть различные пожатые кванты для Qwen 3.

Все это поддерживается в Ollama и LM Studio.

Полная коллекция версий и форматов тут:
https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

@cgevent
Вайб-Фракталинг.

Я пробежался по интернетику, в поисках быстрого визуализатора Мандельбалба и нашел либо старые ацкия программы для виндовс 10-летней давности. Либо хитрые примеры на ShaderToy, где его рендерят как 3Д-шейдер.

А так чтобы с крутилками и в вебе - не нашел.

Ну думаю, пора развайбкодироваться.

Write three.js code for interactive webgl simulation of mandelbulb 3d. I want to change all typical parameters like Power or Bailout and see realtime render of mandelbulb. 


Лучше всего показал себя Gemini 2.5 - почти с первого раза, нормальные крутилки параметров, управление мышкой.

o4 тупила, 4o выдала корявый дизайн, без управления мышкой, плохими слайдерами в духе юникса из 90х.

Но я просто взял скриншот из Гемини и сунул его в o4 - и она быстро прозрела.

Короче, за часок на навайбкодил крутилку Мандельбалба прямо в браузере на стероидах WebGL. Учитывая, что Мандельбалб задается итеративно по формуле для следующей точки типа Z = Z**N + C, где Z и С просто 3Д-вектора, Гемини проделал отличную работу, написав аппроксиматор поверхностей. Явшоке.

Сейчас мы с Гемини разбираемся с шейдерами.

А пока вот результат работы:
https://cgevent.ru/man1.html
и
https://cgevent.ru/man3.html

На телефоне(андр) тоже работает, если лёжа.

Покрутите Power и Bailout угоните в 2-4, чтобы дырки пропали.

И да, это реалтайм, поэтому качество такое.

@cgevent
Лето. Питер. AI

26 и 27 июня в Питере пройдет Conversations 2025 — конференция по разговорному и генеративному AI для бизнеса и разработчиков.

Что в фокусе?

🔥 4 трека: технологический, продуктовый, бизнес-треки и, впервые на конференции — стартап-трек, где команды поделятся историями успеха и представят свои GenAI-решения заказчикам и инвесторам.

Немного спойлеров:

🔵 LLM на Госуслугах. Цель, путь и результат. Как ожидания столкнулись с реальностью. Госуслуги x РТ Лабс

🔵 От RnD к продукту: почему крутая модель — еще не фича? Сбер

🔵 Как ATOM обучает автопилот для электромобилей с помощью ML-платформы Selectel: опыт и решения. Selectel & АТОМ

И еще 35+ докладов от экспертов Skyeng, книги билайн, red_mad_robot, Яндекс, Газпромбанк, БКС, Cбер, Битрикс24, Just AI, Artefacto и многих других. Полная программа тут.

Также в эти даты пройдет награждение Generation AI Awards 2025 — первой в России премии, посвященной применению генеративного AI в бизнесе 🦾 Ну как такое пропустить?

📌 Подробности и билеты по ссылке.
Специальный промокод на скидку 10% для наших подписчиков: C25METAVERSE
Я с утра как залип на оптических иллюзиях, так и провалился во фрактальную нору.

Держите промпт, поиграйтесь с ним в разных генераторах.

[SUBJECT] depicted within a Fractal Reverberation Field, where repeating motifs spiral and branch infinitely. Leverage intricate fractal patterns in [COLOR1] and [COLOR2], creating a hypnotic sense of order and chaos.


depicted - можно заменить на textured

Также можно попросить chatGPT раскучерявить промпт.

И поиграйтесь со словом Mandelbulb - провалитесь в нору тоже.
Видео - это Сора на тему Mandelbulb.

@cgevent
А вот аппроксимация нашего утлого мира дронами.

Нашел землячков из Каира (10 лет обитал в Дахабе, бился головой об воду на виндсерфинг-флистайле).

Это просто реселлер Bentley (софт, не тачки), Маттерпорта, Цезиума, но с экспертизой.
Они взяли дроны и полетали над пирамидками.
И получили 3D scan of the Great Pyramids of Giza.
Зацените, можно почесть даже надписи и рисунки на стенах.

Сколько осталось до того дня, когда оцифруют всю сушу нашей планеты?

Кстати, в Египте дроны запрещены от слова совсем. Видел, как на детском празднике туристы подняли пластиковый дрончег, за что были приняты в полицию и досрочно покинули страну.
Но я не об этом, а о метаверсике будущего.

https://geomatex.com/

@cgevent
Простите, я залип на оптических иллюзиях. Чего не сделаешь, чтобы в понедельник не заниматься делами.

Посмотрите на кожанейшую работу - тут не то, что ИИ, тут никаких скриптов и вообще софтов.

Только некривые руки с пятью пальцами.

@cgevent
Коль скоро мы тут за графику и мозги в основном, держите довольно хорошо известную оптическую иллюзию.

Один из способов, с помощью которого наша нервная система воспринимает движение, - это так называемый фи-феномен. Эта неврологическая система превращает быстрые последовательности изменений цвета или яркости в нечто более глубокое, например в общее ощущение того, что что-то изменило положение.

Наиболее глазастые и пронырливые могут попросить у chatGPT команду ffmpeg, которая разложит видео на кадры:
ffmpeg -i input.mp4 frames/frame_%04d.png

Они же смогут заметить, что меняется не только цвет, но и по самому краю "ползет" тонкий контрастный контур разного цвета.

Но это не так важно, мы просто наблюдаем, как движение цвета в неподвижной форме, превращается в наших кожаных мозгах в движение самой формы. Кстати, стрелки можете закрыть пальцем, они вообще не играют роли.

А я попросил chatGPT сбацать мне питонг-скрипт, который разбирает видео на кадры и собирает их обратно в рандомном порядке. Иллюзия тут же пропала.

Всем критического мышления с утра.

Кому интересно, тут больше теории.

@cgevent

Records

13.05.202523:59
39.9KSubscribers
12.04.202523:59
300Citation index
11.05.202513:43
17.1KAverage views per post
25.01.202523:59
14.6KAverage views per ad post
09.02.202523:59
25.84%ER
11.05.202513:42
43.11%ERR
Subscribers
Citation index
Avg views per post
Avg views per ad post
ER
ERR
JUL '24OCT '24JAN '25APR '25

Popular posts Метаверсище и ИИще

22.04.202521:35
Anthropic вчера опубликовал, а сегодня на хабре перевели отличный гайд по использованию агентов в программировании, чтобы не ругаться на тупой chatgpt или Claude, когда он вам пол-проекта перепишет :)
Например там про то, чтобы план составить сначала:
https://habr.com/ru/articles/902422/
16.04.202513:52
Принес две полезные ссылки про ИИ и бизнес.

В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.

Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/

@cgevent
Krea.ai, что ты делаешь, прекрати!

Krea Stages - вытаскиваем из картинки 3д, генерим 3д, и трансформируем 3д.

И даже деформируем!

Да, вам не почудилось. Это паранейроавториг.

Поглядите на зайца-побивальца.

Может пора эксгумировать Метаверс?

@cgevent
HeyGen Avatar IV - это просто огнищще.

На входе ОДНА фотка и ваш текст.

Всё.

Похоже тема липсинка близка к закрытию.

Но это еще не все. Оно работает с анимационными персонажами, и даже с животными! Как они это сделали, не понимаю.

И да, русский поддерживается.

https://x.com/HeyGen_Official/status/1919824467821551828

@cgevent
Reposted from:
Data Secrets avatar
Data Secrets
12.05.202519:22
Китайский агент Manus с сегодняшнего дня открыт для всех без листа ожидания

Про самого агента и его особенности мы писали вот тут. Напоминаем, что это реально автономный и универсальный ИИ-агент, который по сути представляет из себя Cursor, Operator и Deep Research в одном флаконе.

Кроме того, агент частично бесплатный: каждый день они выдают по 300 кредитов на пользователя (это примерно одна задача средней сложности), а при регистрации единовременно начисляют 1000 кредитов.

Пробуем первыми тут

P.S. Для входа нужно включить VPN, а затем верифицировать номер телефона. С российскими номерами тоже работает, если выбрать в списке стран Казахстан.
27.04.202507:54
Нейропрожарка

Freya - Кукла

📽 Нейровидеоклип
📕 Слова - ARTESS
💻 Все остальное сделали нейросети!

chatGPT, suno, krea, kling, runway, fotopea, dzine, magnific, topaz.

Всех приветствую. Хочу рассказать немного о себе и о клипе.

Меня зовут Артем, и когда то очень давно (10 лет назад). Я занимался музыкой, а именно рэпом. Но так же писал просто песни. А так как петь я не умею, все так и лежало в столе все это время.

И вот полгода назад я познакомился с нейросетями. И ушел в них с головой. И первые впечатления конечно были, вау, что это за магия. Восторг!!! Живые котики)))

Спустя время, когда я достаточно разобрался. Пришел к выводу, что нужно делать что то посерьезнее, но нужно было понять что. И вот я вспомнил про свои тексты. Решил дать им вторую жизнь, я петь не умею, но умеет нейросеть.

Теперь о самой работе.

Общее время около примерно 40 часов.

12+- часов ушло на генерацию песни, задача была именно ее сгенерировать, без каких либо правок.
22+- часов на генерацию изображений и видео.
6+- часов на монтаж

И еще больше цифр.

7000 кредитов - клинг
4000 кредитов - суно
15000 кредитов - фрипик(магнифик)
Ранвей - безлимит
Креa - 20% от максимальной месячной подписки
Топаз годовая подписка
остальное по мелочи

Точную сумму в деньгах не просчитать. Но думаю около 20к₽.

Наваливаем коменты в коментах.

@cgevent
25.04.202508:04
Veo2 - лучший

Рубрика крутые подписчики.

Тут Егор прислал коммерческий клип сделанный на Veo2. Я попросил его рассказать, как это было сделано, чтобы не было "смотрите чо нейросети творят".

Итак, слово Егору и его оценкам преимущества Veo2 над всеми остальными:

Давече решил обкатать на полную катушку Veo2 text2video, прилетел заказ на мини клип, для песни, на рекламный ролик. Такое мы любим,такое нам интересно,когда ещё проникаешься по вайбу в трек, так вообще огонь. Что удалось понять за данный эксперимент. Гугл явно сейчас в лидерах по генерации видео, тут вы можете спорить или нет, но даже новый Клинг 2.0 так не умеет, я его успел потестировать.

А именно, Veo2 круто помнимает промпт, он круто соблюдает атмсоферу видео и даже t2v, работает по персонажами, лучше чем драный Midjourney, который я так люблю и одновременно ненавижу за их наплевательское отношение,на все просьбы от их пользователей.
Так же отмечу, что это дороже, чем всё остальное, но всё еще в разы дешевле, чем организовывать съемку. И да, ждём от них нормальное разрешение, потому что выглядит круто, но качества не хватает.

Ушло примерно 4-5 дней. Чисто генерации на Veo2 и переходы Клинг Кейфрэйм. Только Txt2video, персонажа сохранял по детальному описанию внешности, выбирал максимально карикатурного, что бы было больше деталей, которые при бросании в глаза не сильно отвлекают от того, что он немного отличается.

Есть 2 подсъема от заказчика, на 2 секунды, которые с телефоном, приложением и наливанием воды из бутылки, остальное все генерации, всё Txt2video(ну кроме переходов в клинге, там первое и последнее изображение брал)
Хочу отметить, что радует малое количество брака, хоть и дорого, но обычно он очень хорошо понимает промпт, главное соблюдать в каждом кадре точное описание местности и персонажа. А ну и шакалит качество он знатно, так как у них пока максимально это 720р.


@cgevent
Reposted from:
Ai molodca avatar
Ai molodca
15.04.202507:42
Как многие вчера догадались — да, мы тестировали новый Kling 2.0 💥, который я гоняю уже где-то неделю в рамках партнёрской программы.

Что могу сказать? Он очень хорош: понимание промта, количество движения, последовательность — отлично.

😑 Первое видео — тест img-to-video из случайных кадров (включая ваши генерации и, конечно же, Уилла Смита с пастой).

😳 Второе, более интересное — новый режим Multi-Elements (на версии 1.6), который подрезали у Pika, но сделали гораздо лучше. Загружаете видео, референс, пишете что-то вроде "замени/удали/добавь [объект] из футажа 1 на [объект 2]" — и готово.

В целом, что нового:

1. Модель KLING 2.0 с улучшенными базовыми возможностями
Пока что только базовые режимы Text to Video и Image to Video, 720p, без дополнительных контролов (но, возможно, скоро подъедет другая версия 2.0).

2. Multi-Elements (v1.6)
Добавление, замена, удаление объектов в видеосцене — удобно, гибко, быстро.

3. Motion Control (v1.6)
Кастомная анимация персонажей на изображении по промту или референсу.

4. KOLORS 2.0 — обновлённая генерация изображений
Большие улучшения по сравнению с версией 1.5 — по качеству, цвету, деталям.

5. Restyle (KOLORS 2.0)
Смена стилистики изображения — работает чисто и разнообразно.

6. Редактирование изображений
Новые функции Inpaint и Expand для креативного редактирования.
03.05.202521:20
Эппле показала новую рекламу своего AI - Apple Intelligence.

Это настолько плохо, что верится с трудом.

Все эти rewrite, summarize, email helper смотрятся как архаичные фичи из 2023.

Про Генмоджи я даже говорить не хочу, это мега кастрированная версия генератора картинок на стероидах цензуры, не работающая притом(твиттерские уже потестили).

Весь этот нафталин настолько позади того, что делает Гугл или даже Самсунг, что за Эппле просто стыдно.

Хочется спросить, это все серьезно в 2025 году?

Главная фича всех этих шести минут маркетинга в том, что "теперь у вас есть доступ к chatGPT".

Да, просто доступ к chatGPT. Без специфики. Модель? Картинки? Лимиты? Ресерч?

Впрочем владельцы ойфонов обычно не спрашивают таких сложных вопросов. А радуются новым иконкам и эмоджам.

Во всем этом есть тем не менее один огромный плюс.

Про chatGPT и вообще про ИИ узнает огромная юзербаза Эппле.

Жаль только, что через призму Ген-мать-их-моджи.

У меня всё.

@cgevent
05.05.202506:46
Месть джунов: Revenge of the junior developer

Интернет взрывается вот такой статьей про вайбкодинг:


И автор выступает очень ортогонально популярному мнению, что джуны вымрут, а сеньоры останутся.
Он переворачивает гипотезу в такую мысль: пока сеньоры тупят со своим скептицизмом и спорами с реальностью. Джуны адаптируются и воспринимают это не как угрозу а как норму, потому что еще не привыкли к строгим рамкам.

А вообще я бы обобщил статью до следующего утверждения: возможно, что ваше программистское прошлое (или настоящее) будет вам только мешать. Вайб-кодинг далек от кодинга. И преимущество будут иметь люди с неким характерным складом мышления и способностью ОЧЕНЬ быстро адаптироваться.

Ниже саммари:

1. Vibe coding — это когда ты принципиально не пишешь руками ни строчки, а просто описываешь задачу ИИ и кайфуешь, пока он сам всё генерит. В прототипах можно вообще не смотреть, а когда до продакшена — пристально следить.
2. Есть шесть этапов развития: от ручного кода до «флотов» ИИ‑агентов к 2026 г.
Традиционное ручное кодирование (2022) — вручную пишем весь код.
Completions‑based (2023) — автодополнения (IDE‑сниппеты, Copilot).
Chat‑based (2024) — двунаправленный чат с LLM внутри IDE.
Coding agents (2025 начало) — автономные агенты, выполняющие задачи целиком.
Agent clusters (2025 конец) — параллельное управление группами агентов.
Agent fleets (2026) — иерархии агентов под надзором «супер‑агентов».
Каждая следующая волна ускоряет тебя примерно в 5 раз. Кто не сел в последний вагон — останется на рельсах автодополнений.

3. Агенты — это как бесплатные верблюды в пустыне: круто, но сначала харкают, кусаются и жрут твой бюджет. Но когда ты привыкаешь, уже не можешь без них жить. Они сами лезут в JIRA, копаются в коде, тесты гоняют, баги фиксят. Ты только их направляешь и ешь чипсы.
4. Ограничения: сегодня агенты ещё не настолько умны, чтобы проглотить огромные задачи, их надо кормить задачками поменьше и смотреть, когда застрянут. Но скоро придут «супер‑агенты», которые будут запускать рой агентов и сами следить за ними.
5. Организация: в 2026 г. разработчики станут словно линейными менеджерами, руководя группами ИИ‑агентов. ROI при этом улетает в космос, а отставшие разработчики — на свалку истории.
6. Месть джуниора: когда младшие товарищи возьмут все эти фишки, обгонят старую гвардию и окажутся на коне, оставив тех, кто «писал руками», с носом.

https://sourcegraph.com/blog/revenge-of-the-junior-developer

Я бы заменил слово джуниоры на просто "люди с новым мышлением".

@cgevent
07.05.202510:56
HeyGen Avatar IV - вот держите версию с животными. Это же просто космос.

Я помню был такой фильм "Кошки против собак" и Женя Вендровский рассказывал в конце нулевых, как они мучились, чтобы заставить тварей говорить (у них челюсти не подходят для этого). Риг был на миллион, а бюджет на графику и того дороже.

А сейчас - апажалста!

Версия в 4K для любителей кино:
https://www.youtube.com/watch?v=dpbP3Kj79ig

@cgevent
OpenAI обновили документацию про то, какую модель оптимально использовать в том или ином случае.

GPT-4o - Омни-модель для мультимодальных рассуждений в реальном времени в повседневных рабочих процессах.

GPT-4.5 - более широкие знания и лучший контроль тональности ответа - идеальное решение для письма, кодирования и быстрого решения проблем.

o4-mini - Быстрые, экономичные рассуждения для кода, математических и визуальных задач.

o4-mini-high - это o4-mini с дополнительной глубиной для более сложных технических ответов.

o3 - самый мощный движок для сложного, многоступенчатого анализа.

o1-pro - устаревшая(legacy) модель, настроенная на длительную аналитическую работу с высокими ставками.

https://help.openai.com/en/articles/11165333-chatgpt-enterprise-models-limits

Не скажу, что стало сильно понятнее, но по ссылке есть примеры промптов и четко указаны лимиты для каждой модели.

@cgevent
Reposted from:
Denis Sexy IT 🤖 avatar
Denis Sexy IT 🤖
14.04.202519:47
Хехе, https://cursor.com/ тоже добавил 4.1 и сделал ее бесплатной (на какое-то время)

Гонка в которой выигрывает потребитель – лучшая гонка 🌝
Новая опенсорсная и очень эмоциональная модель для озвучки(TTS).

Dia - это модель преобразования текста в речь с 1,6 млрд параметров, созданная в Nari Labs.

Есть код:

https://github.com/nari-labs/dia

На взрослых GPU может выдавать реалтайм. Жрет 10GB, но разрабы обещают кванты.

Разрабов, кстати, 1.5 человека. Один на парт тайме.

Есть неофициальное демо, официальное висит.

https://huggingface.co/spaces/mrfakename/dia-1.6b

@cgevent
Офигенный пример из нового Gemini 2.5 (I/O Edition)

- Гемини, возьми картинку и постарайся воспроизвести ее кодом, принимая во внимание все паттерны.

Поглядите на эти анимации.

Image2Code в действии. Помните все эти арт-проекты и виджеинг? Не чокаясь.

I/O Edition - это замысловатый нейминг от Гугла в честь их конференции.

@cgevent
Log in to unlock more functionality.