
Інсайдер ЗСУ

Новини UA | Україна

Главное новостное. Одесса

Реальна Війна

NOTMEME Agent News

І.ШО? | Новини

Труха⚡️Жесть 18+

Адвокат Права

Україна | Новини

Інсайдер ЗСУ

Новини UA | Україна

Главное новостное. Одесса

Реальна Війна

NOTMEME Agent News

І.ШО? | Новини

Труха⚡️Жесть 18+

Адвокат Права

Україна | Новини

Інсайдер ЗСУ

Новини UA | Україна

Главное новостное. Одесса

Искусственный интеллект. Высокие технологии
Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого.
админ - @haarrp
@itchannels_telegram -🔥best channels
РКН: clck.ru/3FmsmC
админ - @haarrp
@itchannels_telegram -🔥best channels
РКН: clck.ru/3FmsmC
TGlist rating
0
0
TypePublic
Verification
Not verifiedTrust
Not trustedLocationРосія
LanguageOther
Channel creation dateJan 14, 2020
Added to TGlist
Jul 03, 2024Linked chat
ИИ
Искусственный интеллект
31
Records
08.02.202501:47
47.4KSubscribers11.03.202523:59
200Citation index12.04.202523:59
4.1KAverage views per post07.04.202509:38
5.4KAverage views per ad post28.02.202518:57
5.86%ER07.03.202509:38
6.52%ERRGrowth
Subscribers
Citation index
Avg views per post
Avg views per ad post
ER
ERR


07.04.202519:40
😖 Новость дня: учёные из стартапа Colossal воскресили лютоволков из «Игры престолов», живших 12'000 лет назад.
Они собрали ДНК из зуба (13 000 лет) и черепа (72 000 лет), отредактировали 14 генов серого волка и имплантировали эмбрионы суррогатным матерям. Через 65 дней родились три щенка — Ромул, Рем и Дейенерис, которые на 25% крупнее обычных волчат.
В планах Colossal также воскрешение мамонтов, додо, саблезубых тигров и гигантских ленивцев.
#science #cloning #клонирование
Они собрали ДНК из зуба (13 000 лет) и черепа (72 000 лет), отредактировали 14 генов серого волка и имплантировали эмбрионы суррогатным матерям. Через 65 дней родились три щенка — Ромул, Рем и Дейенерис, которые на 25% крупнее обычных волчат.
В планах Colossal также воскрешение мамонтов, додо, саблезубых тигров и гигантских ленивцев.
#science #cloning #клонирование
Reposted from:
Machinelearning



28.03.202519:10
✔️ DeepSite на базе DeepSeek-V3-0324, позволяет генерировать, код, приложения или игры прямо в браузере и хостить их.
Сгенерировал парочку простеньких HTML-игр с интерфейсом, работает годно.
😶 По сути это Сursor в браузере.
🟡Попробовать: https://huggingface.co/spaces/enzostvs/deepsite
@ai_machinelearning_big_data
#deepseek #vibecoding #app
Сгенерировал парочку простеньких HTML-игр с интерфейсом, работает годно.
😶 По сути это Сursor в браузере.
🟡Попробовать: https://huggingface.co/spaces/enzostvs/deepsite
@ai_machinelearning_big_data
#deepseek #vibecoding #app


07.04.202511:10
⚡️ Я рекомендую вам не ронять ничего перед этим зарядным устройством.
@vistehno
@vistehno
11.03.202517:28
⚡️ OpenAI представили новые инструменты для разработки агентов:
● Web Search — любой агент, созданный через OpenAI, теперь может искать и использовать информацию из интернета.
● File Search — реализован функционал поиска по локальным файлам.
● Multi-agent framework — Swarm переименован в Agents SDK, позволяющий передавать диалоги между агентами с сохранением контекста.
● Computer Use — возможность создать агента, который автономно управляет вашим пк
Стрим: https://www.youtube.com/live/hciNKcLwSes
@vistehno
● Web Search — любой агент, созданный через OpenAI, теперь может искать и использовать информацию из интернета.
● File Search — реализован функционал поиска по локальным файлам.
● Multi-agent framework — Swarm переименован в Agents SDK, позволяющий передавать диалоги между агентами с сохранением контекста.
● Computer Use — возможность создать агента, который автономно управляет вашим пк
Стрим: https://www.youtube.com/live/hciNKcLwSes
@vistehno


05.04.202510:23
🤖 Новое видео NEO от 1X: полностью автономный робот.
ИИ выполняет различные задачи, а также координирует движения всего тела.
Вместо того чтобы решать одну задачу за раз, 1X тренируется для общей автономности в различных неструктурированных домашних бытовых задачах.
ИИ выполняет различные задачи, а также координирует движения всего тела.
Вместо того чтобы решать одну задачу за раз, 1X тренируется для общей автономности в различных неструктурированных домашних бытовых задачах.
Reposted from:
Machinelearning

22.03.202512:04
📌Ученые обнаружили сходство между мозгом человека и нейросетями в принципах обработки языка.
Совместное исследование Google Research, Принстонского университета, NYU и Еврейского университета в Иерусалиме нашло параллели в обработке естественного языка человеческим мозгом и большими языковыми моделями.
Используя внутричерепные электроды, ученые зафиксировали нейронную активность во время спонтанных диалогов и сравнили ее с внутренними представлениями модели Whisper, разработанной для преобразования речи в текст. Оказалось, что речевые эмбеддинги Whisper коррелируют с активностью в слуховых зонах мозга, а языковые — с областями, ответственными за семантику.
Эксперименты подтвердили догадки: при восприятии речи сначала активируется верхняя височная извилина (STG), обрабатывающая акустические сигналы, а через несколько сотен миллисекунд включается зона Брока (IFG), связанная с декодированием смысла. При воспроизведении речи последовательность обратная: IFG активируется за 500 мс до артикуляции, затем моторная кора планирует движение, а после произнесения слова STG «проверяет» результат. Эти паттерны совпали с динамикой эмбедингов Whisper, хотя модель не обучалась на нейробиологических данных.
Другое интересное совпадение - мозг и LLM используют предсказание следующего слова как ключевую стратегию. Как показали опыты, слушатель бессознательно предугадывает следующие слова, а ошибка предсказания вызывает «нейронное удивление» — механизм, аналогичный обучению с подкреплением в ML. Но архитектурные механизмы у мозга и LLM разные: трансформеры обрабатывают сотни слов параллельно, тогда как мозг анализирует информацию последовательно.
Несмотря на общую «мягкую иерархию» обработки (например, смешение семантических и акустических признаков в IFG и STG), биологические структуры мозга принципиально отличаются от нейронных сетей.
Исследователи подчеркивают: языковые модели (типа ChatGPT) не понимают, как люди общаются в реальной жизни (например, не чувствуют эмоций или культурных особенностей), и не учатся так, как это делает мозг человека с детства. Однако их эмбединги оказались очень полезными для изучения того, как мозг обрабатывает речь.
Ученые надеются, что эти открытия помогут создать нейросети, которые смогут обучаться как люди — медленно, шаг за шагом. А пока Whisper, неожиданно стал «зеркалом» принципов нашего мышления. Кто знает, может, через пару лет ИИ начнёт шутить с нами за чашкой кофе — как друг или коллега по работе.
🟡Статья
🟡Исследование
@ai_machinelearning_big_data
#AI #ML #Research #NLP
Совместное исследование Google Research, Принстонского университета, NYU и Еврейского университета в Иерусалиме нашло параллели в обработке естественного языка человеческим мозгом и большими языковыми моделями.
Используя внутричерепные электроды, ученые зафиксировали нейронную активность во время спонтанных диалогов и сравнили ее с внутренними представлениями модели Whisper, разработанной для преобразования речи в текст. Оказалось, что речевые эмбеддинги Whisper коррелируют с активностью в слуховых зонах мозга, а языковые — с областями, ответственными за семантику.
Эксперименты подтвердили догадки: при восприятии речи сначала активируется верхняя височная извилина (STG), обрабатывающая акустические сигналы, а через несколько сотен миллисекунд включается зона Брока (IFG), связанная с декодированием смысла. При воспроизведении речи последовательность обратная: IFG активируется за 500 мс до артикуляции, затем моторная кора планирует движение, а после произнесения слова STG «проверяет» результат. Эти паттерны совпали с динамикой эмбедингов Whisper, хотя модель не обучалась на нейробиологических данных.
Другое интересное совпадение - мозг и LLM используют предсказание следующего слова как ключевую стратегию. Как показали опыты, слушатель бессознательно предугадывает следующие слова, а ошибка предсказания вызывает «нейронное удивление» — механизм, аналогичный обучению с подкреплением в ML. Но архитектурные механизмы у мозга и LLM разные: трансформеры обрабатывают сотни слов параллельно, тогда как мозг анализирует информацию последовательно.
Несмотря на общую «мягкую иерархию» обработки (например, смешение семантических и акустических признаков в IFG и STG), биологические структуры мозга принципиально отличаются от нейронных сетей.
Исследователи подчеркивают: языковые модели (типа ChatGPT) не понимают, как люди общаются в реальной жизни (например, не чувствуют эмоций или культурных особенностей), и не учатся так, как это делает мозг человека с детства. Однако их эмбединги оказались очень полезными для изучения того, как мозг обрабатывает речь.
Ученые надеются, что эти открытия помогут создать нейросети, которые смогут обучаться как люди — медленно, шаг за шагом. А пока Whisper, неожиданно стал «зеркалом» принципов нашего мышления. Кто знает, может, через пару лет ИИ начнёт шутить с нами за чашкой кофе — как друг или коллега по работе.
🟡Статья
🟡Исследование
@ai_machinelearning_big_data
#AI #ML #Research #NLP
06.04.202509:16
🎮 Microsoft представила нейро-версию Quake II на базе Muse и WHAMM.
Microsoft Research представила WHAMM — новую систему или технологию, предназначенную для моделирования окружающего мира в реальном времени, с особым акцентом на интерактивные среды.
Это означает, что WHAMM способна быстро создавать и постоянно обновлять цифровую 3D-модель физического пространства, учитывая изменения, которые происходят в нем, в том числе в результате взаимодействия пользователя или других динамических событий.
▪ ИИ генерирует кадры в реальном времени, анализируя действия игрока.
▪Старая WHAMM — 1 fps, новая — 10 fps при 640×360, почти играбельно.
Модель помнит последние 0,9 секунды, что добавляет случайности.
Ключевая особенность — система работает достаточно быстро, чтобы обновлять модель мира практически мгновенно по мере поступления новых данных от сенсоров (вероятно, камер, датчиков глубины и т.д.). Это критически важно для плавного взаимодействия.
🔗 Играть в ИИ-версию Quake II можно здесь.
@vistehno
#microsoft #ai #quake #muse
Microsoft Research представила WHAMM — новую систему или технологию, предназначенную для моделирования окружающего мира в реальном времени, с особым акцентом на интерактивные среды.
Это означает, что WHAMM способна быстро создавать и постоянно обновлять цифровую 3D-модель физического пространства, учитывая изменения, которые происходят в нем, в том числе в результате взаимодействия пользователя или других динамических событий.
▪ ИИ генерирует кадры в реальном времени, анализируя действия игрока.
▪Старая WHAMM — 1 fps, новая — 10 fps при 640×360, почти играбельно.
Модель помнит последние 0,9 секунды, что добавляет случайности.
Ключевая особенность — система работает достаточно быстро, чтобы обновлять модель мира практически мгновенно по мере поступления новых данных от сенсоров (вероятно, камер, датчиков глубины и т.д.). Это критически важно для плавного взаимодействия.
🔗 Играть в ИИ-версию Quake II можно здесь.
@vistehno
#microsoft #ai #quake #muse
the media content
23.03.202514:05
🌟 Интересная визуализация для быстрого запоминания азбуки Морзе!
@vistehno
@vistehno


12.03.202507:01
⚡️ Metallica представили уникальный концертный опыт Apple Immersive, который будет доступен бесплатно только на Apple Vision Pro с 14 марта.
Расширенная версия будет доступна во время демонстраций Apple Vision Pro в некоторых магазинах Apple Store.
«Компания Apple построила специальную сцену с 14 камерами Apple Immersive Video, используя сочетание стабилизированных камер, камер на тросах и дистанционно управляемых систем тележек для камер, которые перемещались по сцене».
«Снятый во время нашей последней остановки M72 в 2024 году в Мехико, он включает в себя полные выступления «Whiplash», «One» и «Enter Sandman», все записанные эксклюзивно на Apple Immersive Video».
«Песни, вошедшие в альбом Metallica, также будут доступны в виде нового EP Metallica Live from Mexico City в формате Spatial Audio на Apple Music в эту пятницу».
«Расширенный предварительный просмотр концерта Metallica будет доступен в рамках демонстрации Apple Vision Pro в магазинах Apple Store по всему миру, начиная с пятницы, 14 марта. Apple Vision Pro доступен в Австралии, Канаде, Франции, Германии, Гонконге, Японии, Сингапуре, Южной Корее, Тайване, Объединенных Арабских Эмиратах, Великобритании и США. Клиенты в этих странах могут зарезервировать бесплатную демонстрацию Vision Pro в своем местном магазине Apple Store. Для записи вам необходимо иметь учетную запись Apple».
@vistehno
Расширенная версия будет доступна во время демонстраций Apple Vision Pro в некоторых магазинах Apple Store.
«Компания Apple построила специальную сцену с 14 камерами Apple Immersive Video, используя сочетание стабилизированных камер, камер на тросах и дистанционно управляемых систем тележек для камер, которые перемещались по сцене».
«Снятый во время нашей последней остановки M72 в 2024 году в Мехико, он включает в себя полные выступления «Whiplash», «One» и «Enter Sandman», все записанные эксклюзивно на Apple Immersive Video».
«Песни, вошедшие в альбом Metallica, также будут доступны в виде нового EP Metallica Live from Mexico City в формате Spatial Audio на Apple Music в эту пятницу».
«Расширенный предварительный просмотр концерта Metallica будет доступен в рамках демонстрации Apple Vision Pro в магазинах Apple Store по всему миру, начиная с пятницы, 14 марта. Apple Vision Pro доступен в Австралии, Канаде, Франции, Германии, Гонконге, Японии, Сингапуре, Южной Корее, Тайване, Объединенных Арабских Эмиратах, Великобритании и США. Клиенты в этих странах могут зарезервировать бесплатную демонстрацию Vision Pro в своем местном магазине Apple Store. Для записи вам необходимо иметь учетную запись Apple».
@vistehno


25.03.202508:07
«Ошибка на миллиард» в ИИ
«Ошибка на миллиард долларов» — это популяризованное ученым Чарльзом Э. Хоаром название для null pointer exception. В большинстве классических языков программирования переменная, якобы содержащая объект какого-то класса, на самом деле может ничего не содержать.
В мире генеративных нейросетей «ошибкой на миллиард» можно назвать галлюцинации LLM. «Творческая натура» больших языковых моделей играет со строгими задачами злую шутку: в любой непонятной ситуации модель принимается фантазировать на основе претрейна.
Старший инженер по разработке ПО искусственного интеллекта в YADRO описал метод, который использовал, чтобы значительно снизить галлюцинации в выдаче модели.
Читать статью →
«Ошибка на миллиард долларов» — это популяризованное ученым Чарльзом Э. Хоаром название для null pointer exception. В большинстве классических языков программирования переменная, якобы содержащая объект какого-то класса, на самом деле может ничего не содержать.
В мире генеративных нейросетей «ошибкой на миллиард» можно назвать галлюцинации LLM. «Творческая натура» больших языковых моделей играет со строгими задачами злую шутку: в любой непонятной ситуации модель принимается фантазировать на основе претрейна.
Старший инженер по разработке ПО искусственного интеллекта в YADRO описал метод, который использовал, чтобы значительно снизить галлюцинации в выдаче модели.
Читать статью →
Reposted from:
Machinelearning



03.04.202506:48
✔️ Google обновляет ряды руководителей ИИ-проектов.
Google объявила о смене руководства в подразделении потребительских приложений искусственного интеллекта: Josh Woodward сменил Sissie Hsiao на посту главы этого подразделения.
Hsiao, который возглавлял потребительские приложения ИИ, в том числе проект Gemini, покидает свой пост с сегодняшнего дня. Согласно инсайду, Sissie возьмет небольшой перерыв, после чего перейдет на новую должность в компании. Woodward, который ранее возглавлял Google Labs и контролировал запуск NotebookLM, продолжит проекты в Google Labs, одновременно взяв на себя новые обязанности. Это изменение происходит по мере того, как в гонке ИИ основное внимание уделяется не базовым моделям, а продуктам, созданным на их основе.
semafor.com
✔️ Nomic выпустила мультимодальные эмбединги для визуального поиска.
Nomic представила Nomic Embed Multimodal — набор опенсорсных эмбединг-моделей для создания векторных представлений текста, изображений, PDF и графиков. Флагманская модель ColNomic Embed Multimodal 7B показала 62.7 NDCG@5 на бенчмарке Vidore-v2, опережая предыдущие решения на 2.8 пункта.
Модели Nomic обрабатывают текст и изображения совместно, избегая сложных пайплайнов с OCR. Это особенно полезно для научных статей, технической документации или мультиязычных документов, где важен контекст.
Модели доступны в двух вариантах: ColNomic (многокомпонентные векторы) для максимальной точности и Nomic (одновекторные) для экономии ресурсов. Модели доступны на Hugging Face, а разобраться помогут гайды и ноутбуки Google Colab.
nomic.ai
✔️ Китайские ИТ-гиганты заказали чипов Nvidia на 16 млрд. долларов в первом квартале 2025 года.
ByteDance, Alibaba Group и Tencent Holdings разместили заказы на общую сумму более 16 миллиардов долларов на серверные чипы H20 AI от Nvidia в первом квартале 2025 года. Такой резкий рост спроса происходит на фоне опасений, что администрация США может наложить запрет на продажу этих чипов в Китай, ссылаясь на вопросы национальной безопасности.
H20 - самый доступный чип Nvidia для продажи в рамках действующих экспортных ограничений, которые запрещают передачу более мощных моделей китайским компаниям. Значительные заказы из Китая ставят Nvidia в сложное положение, поскольку она лавирует между возможностями для бизнеса и потенциальными геополитическими рисками.
theinformation.com
✔️ Google DeepMind опубликовали 145-страничный документ об ответственном развитии ИИ.
Google DeepMind выпустила подробный документ "Ответственный путь к AGI", в котором излагается технический план безопасного развития искусственного интеллекта общего назначения.
В документе подчеркивается важность устранения потенциальных рисков неправильного использования и несоответствия, связанных с технологией AGI. Несмотря на детальный подход, некоторые аналитики полагают, что документ может не полностью убедить скептиков в надежности и безопасности разработки AGI.
deepmind.google
✔️ Epic Games купит стартап Loci чтобы автоматизировать разметку 3D-контента.
Epic Games объявила о приобретении стартапа Loci, чья ИИ-платформа упрощает работу с 3D-ассетами. Технология автоматически генерирует теги для моделей, экономя время создателей на ручную разметку. Это особенно актуально для проектов с тысячами объектов — например, в Fortnite, где игроки добавляют элементы из популярных франшиз, провоцируя споры об авторских правах.
ИИ Loci не только ускоряет поиск и организацию контента, но и помогает выявлять нарушения интеллектуальной собственности. Loci будет интегрирован в экосистему Epic, в том числе в Unreal Editor для Fortnite и маркетплейс Fab, где продаются цифровые активы. Таким образом, разработчики получат инструменты для предотвращения юридических конфликтов и упрощения рабочих процессов.
epicgames.com
@ai_machinelearning_big_data
#news #ai #ml
Google объявила о смене руководства в подразделении потребительских приложений искусственного интеллекта: Josh Woodward сменил Sissie Hsiao на посту главы этого подразделения.
Hsiao, который возглавлял потребительские приложения ИИ, в том числе проект Gemini, покидает свой пост с сегодняшнего дня. Согласно инсайду, Sissie возьмет небольшой перерыв, после чего перейдет на новую должность в компании. Woodward, который ранее возглавлял Google Labs и контролировал запуск NotebookLM, продолжит проекты в Google Labs, одновременно взяв на себя новые обязанности. Это изменение происходит по мере того, как в гонке ИИ основное внимание уделяется не базовым моделям, а продуктам, созданным на их основе.
semafor.com
✔️ Nomic выпустила мультимодальные эмбединги для визуального поиска.
Nomic представила Nomic Embed Multimodal — набор опенсорсных эмбединг-моделей для создания векторных представлений текста, изображений, PDF и графиков. Флагманская модель ColNomic Embed Multimodal 7B показала 62.7 NDCG@5 на бенчмарке Vidore-v2, опережая предыдущие решения на 2.8 пункта.
Модели Nomic обрабатывают текст и изображения совместно, избегая сложных пайплайнов с OCR. Это особенно полезно для научных статей, технической документации или мультиязычных документов, где важен контекст.
Модели доступны в двух вариантах: ColNomic (многокомпонентные векторы) для максимальной точности и Nomic (одновекторные) для экономии ресурсов. Модели доступны на Hugging Face, а разобраться помогут гайды и ноутбуки Google Colab.
nomic.ai
✔️ Китайские ИТ-гиганты заказали чипов Nvidia на 16 млрд. долларов в первом квартале 2025 года.
ByteDance, Alibaba Group и Tencent Holdings разместили заказы на общую сумму более 16 миллиардов долларов на серверные чипы H20 AI от Nvidia в первом квартале 2025 года. Такой резкий рост спроса происходит на фоне опасений, что администрация США может наложить запрет на продажу этих чипов в Китай, ссылаясь на вопросы национальной безопасности.
H20 - самый доступный чип Nvidia для продажи в рамках действующих экспортных ограничений, которые запрещают передачу более мощных моделей китайским компаниям. Значительные заказы из Китая ставят Nvidia в сложное положение, поскольку она лавирует между возможностями для бизнеса и потенциальными геополитическими рисками.
theinformation.com
✔️ Google DeepMind опубликовали 145-страничный документ об ответственном развитии ИИ.
Google DeepMind выпустила подробный документ "Ответственный путь к AGI", в котором излагается технический план безопасного развития искусственного интеллекта общего назначения.
В документе подчеркивается важность устранения потенциальных рисков неправильного использования и несоответствия, связанных с технологией AGI. Несмотря на детальный подход, некоторые аналитики полагают, что документ может не полностью убедить скептиков в надежности и безопасности разработки AGI.
deepmind.google
✔️ Epic Games купит стартап Loci чтобы автоматизировать разметку 3D-контента.
Epic Games объявила о приобретении стартапа Loci, чья ИИ-платформа упрощает работу с 3D-ассетами. Технология автоматически генерирует теги для моделей, экономя время создателей на ручную разметку. Это особенно актуально для проектов с тысячами объектов — например, в Fortnite, где игроки добавляют элементы из популярных франшиз, провоцируя споры об авторских правах.
ИИ Loci не только ускоряет поиск и организацию контента, но и помогает выявлять нарушения интеллектуальной собственности. Loci будет интегрирован в экосистему Epic, в том числе в Unreal Editor для Fortnite и маркетплейс Fab, где продаются цифровые активы. Таким образом, разработчики получат инструменты для предотвращения юридических конфликтов и упрощения рабочих процессов.
epicgames.com
@ai_machinelearning_big_data
#news #ai #ml


24.03.202510:00
🧠 Neuralink с открытым исходным кодом с использованием активности мозга обезьяны для управления роботизированными руками 🙉
Проект Jenkins исследует интерфейсы мозг-компьютер путем декодирования нейронной активности в движения роботов и генерации синтетических мозговых данных.
Используя нейронные записи мозговой активности обезьяны по имени Дженкинс, исследователи разработали модели для преобразования мозговых сигналов в движения роботизированной руки.
В проекте используются роботизированные руки и интерактивная веб-консоль для генерации данных о работе мозга в режиме реального времени с помощью джойстика.
Исследование открывает путь к созданию адаптивных интерфейсов «мозг-компьютер» за счет гибкого моделирования активности мозга.
▪ Github
@vistehno
Проект Jenkins исследует интерфейсы мозг-компьютер путем декодирования нейронной активности в движения роботов и генерации синтетических мозговых данных.
Используя нейронные записи мозговой активности обезьяны по имени Дженкинс, исследователи разработали модели для преобразования мозговых сигналов в движения роботизированной руки.
В проекте используются роботизированные руки и интерактивная веб-консоль для генерации данных о работе мозга в режиме реального времени с помощью джойстика.
Исследование открывает путь к созданию адаптивных интерфейсов «мозг-компьютер» за счет гибкого моделирования активности мозга.
▪ Github
@vistehno
22.03.202516:02
🌅 HunyuanVideo-I2V
HunyuanVideo-I2V – это модель с открытым исходным кодом, предназначенная для создания видео на основе изображений, разработанная с активным участием сообщества.
В репозитории доступны реализации на PyTorch, предобученные веса и код для инференса. Для стабильной работы модели требуется NVIDIA GPU с поддержкой CUDA и не менее 80 ГБ видеопамяти. Кроме того, модель оснащена широким спектром настроек, позволяющих повысить качество генерируемого видео.
📌 Github
@vistehno
HunyuanVideo-I2V – это модель с открытым исходным кодом, предназначенная для создания видео на основе изображений, разработанная с активным участием сообщества.
В репозитории доступны реализации на PyTorch, предобученные веса и код для инференса. Для стабильной работы модели требуется NVIDIA GPU с поддержкой CUDA и не менее 80 ГБ видеопамяти. Кроме того, модель оснащена широким спектром настроек, позволяющих повысить качество генерируемого видео.
📌 Github
@vistehno


04.04.202515:42
🖥 OpenAI меняют планы выпуска моделей: o3 и o4-mini выйдут раньше GPT-5
Компания планирует выпустить o3 и o4-mini в ближайшие недели, а релиз GPT-5 ожидается через несколько месяцев.
По словам Альтмана, это решение обусловлено несколькими факторами:
- Дополнительное время позволит значительно повысить качество и возможности модели GPT-5.
- Компания столкнулась с трудностями при попытке плавно интегрировать различные компоненты, что потребовало пересмотра первоначальных планов.
OpenAI пытаются подготовить достаточные мощности для поддержки предполагаемого беспрецедентного спроса на новые модели.
@vistehno
Компания планирует выпустить o3 и o4-mini в ближайшие недели, а релиз GPT-5 ожидается через несколько месяцев.
По словам Альтмана, это решение обусловлено несколькими факторами:
- Дополнительное время позволит значительно повысить качество и возможности модели GPT-5.
- Компания столкнулась с трудностями при попытке плавно интегрировать различные компоненты, что потребовало пересмотра первоначальных планов.
OpenAI пытаются подготовить достаточные мощности для поддержки предполагаемого беспрецедентного спроса на новые модели.
@vistehno
the media content
03.04.202511:31
✔️ VideoScene (CVPR'25) — это проект, представляющий собой значительное усовершенствование предыдущей разработки под названием ReconX.
Это модель диффузии видео, которая работает в один шаг и позволяет преобразовывать видео в 3D.
Основное преимущество VideoScene заключается в том, что она превосходит по скорости традиционные многоэтапные процессы, делая переход от видео к трехмерным моделям более эффективным.
▪️Paper: https://arxiv.org/abs/2504.01956
▪️Project Page: https://hanyang-21.github.io/VideoScene
▪️Code: https://github.com/hanyang-21/VideoScene
@vistehno
Это модель диффузии видео, которая работает в один шаг и позволяет преобразовывать видео в 3D.
Основное преимущество VideoScene заключается в том, что она превосходит по скорости традиционные многоэтапные процессы, делая переход от видео к трехмерным моделям более эффективным.
▪️Paper: https://arxiv.org/abs/2504.01956
▪️Project Page: https://hanyang-21.github.io/VideoScene
▪️Code: https://github.com/hanyang-21/VideoScene
@vistehno
Log in to unlock more functionality.