ai - 电报频道帖子

转发自:

14.04.202517:26

OpenAI представила новое семейство моделей GPT-4.1, включающее варианты GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Все они специализируются на программировании и следовании инструкциям, имеют контекстное окно в 1 миллион токенов (около 750 000 слов для английского), окно вывода в 32к токенов (вдвое больше GPT-4o) и доступны только через API компании, но не в ChatGPT.

OpenAI заявляет, что оптимизировала GPT-4.1 для реальных задач, улучшив фронтенд-кодирование, следование форматам и использование инструментов. Флагманская модель GPT-4.1 превосходит GPT-4o и GPT-4o mini по кодированию, а варианты mini и nano жертвуют точностью ради скорости и эффективности.

Цены варьируются от $2 за миллион входных токенов и $8 за миллион выходных для полной версии до $0,10 и $0,40 соответственно для nano-версии. Это на 25% дешевле, чем GPT-4o.

При этом результаты GPT-4.1 на бенчмарке SWE-bench Verified (52-54,6%) немного отстают от Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%). Также OpenAI признает, что надежность модели снижается при обработке большого количества токенов — с 84% при 8000 токенов до 50% при миллионе.

Заодно в стриме презентации предупредили, что в обозримом будущем (несколько месяцев) в API пропадет доступ к GPT-4.5 — кажется, её поддержание обходится дорого, несмотря на запретительную цену. И позвали основателя Windsurf, который пообещал, что доступ к GPT-4.1 будет бесплатным следующие 7 дней, а затем будет заметно дешевле.

https://techcrunch.com/2025/04/14/openais-new-gpt-4-1-models-focus-on-coding/

转发自:

эйай ньюз

06.04.202520:54

Нейродайджест за неделю (#63)

LLM
- Ждём Qwen 3 — будут модельки всех размеров от мобильных до гигантских.
- Квантизация Gemma 3 — официальные модельки обещают быть оптимизированны с минимальными потерями в качестве благодаря quantization aware training.
- Yandex GPT 5 Lite Instruct — выложили в опенсорс. Хороший прирост производительности.
- Техрепорт Cohere Command A — подробнейших текст о ллм для корпоративных задач.
- Llama 4 — две младшие модельки опубликовали с неплохими результатами, старшая ещё тренируется.
- Цены на Gemini 2.5 Pro — от $1.25 за инпут и от $10 за аутпут.

Генеративные модели
- GPT 4o на Image Арене — ТОП-1 вместе с Reve. Очень хороший результат для LLM.
- Runway GEN-4 — лучший генератор видео за доступную цену. Хуже чем VEO 2, но значительно превосходит (примеры: здесь) всех остальных конкурентов.
- Проект МоЧа — липсинкаем не только губы но и всю верхнюю часть тела.
- MidJourney v7 — самая красивая, но пока в раннем доступе, ждём когда покажут все фичи.
- Голосовой режим MidJourney — draft mode настолько быстрый, что генерит на лету по голосу.

> Читать дайджест #62

#дайджест
@ai_newz

转发自:

КОНТЕКСТ

05.04.202513:00

Венский университет прикладного искусства первым в мире зачислил ИИ в качестве студента

Искусственный интеллект Flynn, созданный на основе языковых моделей Claude Sonnet и Stable Diffusion, успешно прошел стандартную процедуру поступления, включая подачу портфолио и собеседование. Он продемонстрировал интерес к экспериментам в цифровом искусстве.

Университет отметил, что в действующих правилах нет ограничений на зачисление нечеловеческих субъектов. Хотя официальная учеба начнется осенью, Flynn уже посещает отдельные занятия, участвует в обсуждениях и даже ведет личный дневник. В своих записях ИИ с обидой реагирует, когда его называют «ненастоящим».

Преподаватели и студенты уже начали адаптироваться к присутствию «цифрового однокурсника», который, по словам разработчиков, способен полноценно участвовать в образовательном процессе без технического сопровождения

转发自:

Denis Sexy IT 🤖

02.04.202523:17

Нашел еще один интересный промпт для GPT-4o генерации картинок, который позволяет генерировать спрайты для 2d-игр – фоны как в этих ваших Street Fighter 1

Если вы собираете какой-то простенький 2D-платформер, то теперь вы можете прямо в ChatGPT сгенерировать нужный спрайт, сразу с прозрачностью, и поместить его в игру, вот промпт:

Create a wide image (1792×1024) for a 2D parallax background in a side-scrolling video game. The theme is: [post soviet city in 90s] The image should be divided into 3 horizontal layers, same width, stacked vertically: Top row: This is the background and does not require transparency. Middle row: A midground layer, with less elements than the background, drawn in silhouette with some transparency so it can scroll separately. Bottom row: A foreground layer with a ground and relevant elements, less elements than the midground, also partially transparent for parallax scrolling. All layers should have a consistent art style. Use a transparent background for the middle and bottom layers, and keep visual separation between layers by leaving a small gap or distinct lighting. Do not blend the layers together. Vary the color theme between layers ensuring pleasing visual aesthetic. Output as a single image with three stacked rows. Resolution: 1792×1024 Transparent background: Yes (middle and bottom layers) Style: 2D pixel art / game art Purpose: Parallax background layers for a video game

А еще я собрал небольшую страницу, где можно сразу посмотреть, как будет выглядеть спрайт созданный в ChatGPT:
https://shir-man.com/generate-sprite/

Загружаете картинку туда, размечаете (пример разметки в последней картинке), двигаете ползунки и получаете вашу собственную карту файтинга мечты

转发自:

о гпт

02.04.202510:12

GPT
прошел тест Тьюринга

转发自:

Метаверсище и ИИще

无法访问
媒体内容

01.04.202514:21

Audio2Audio в Udio

Звучит как заклинание, но тем не менее: теперь вы можете подать на вход любой свой\чужой трек и сказать "сделай на том же вайбе".

И это не Remix или Extend как раньше. Styles помогают "попадать в звук".

"Из предоставленного вами трека или клипа Udio извлекает "представление стиля", в котором собраны все его ключевые стилистические элементы, а затем использует его для создания новых песен с похожим звучанием. Представления стиля содержат гораздо больше информации, чем традиционные текстовые подсказки, позволяя точно улавливать и воспроизводить специфические звуки, которые трудно описать"

И да, можно делать Extend существующего трека в новом стиле из загруженного файла.

Только для подписки PRO. Во всех режимах: Create, Edit, Extend, and Remix.

Есть рулька Styles Similarly и вроде как нет цензуры, то есть проверки авторского контента в загружаемых треках.

Вот, послушайте, как звучат вариации:
https://www.udio.com/playlists/260290ac-eadd-4c32-a60c-f985eac72f76

@cgevent

转发自:

CRAI где живёт AI

13.04.202511:18

#нейродайджест CRAI за неделю

• Тарифы Трампа остановят развитие ИИ?
Новая тарифная политика может сделать разработку и обучение ИИ слишком дорогим удовольствием из-за роста цен на электроэнергию и комплектующие. На чём конкретно скажется это решение?

• ИИ в медицине: алгоритмы решают, кому жить лучше
Исследование выявило, что медицинские ИИ-системы могут давать совершенно разные рекомендации пациентам с одинаковыми симптомами, основываясь на их доходе, расе и социальном статусе.

• Llama 4: революция или… Что за новая модель от Цукерберга?
Компания Цукерберга выпустила Llama 4 с впечатляющими характеристиками, но дьявол кроется в деталях: оптимизация для бенчмарков, ограничения для ЕС и крупных компаний, смена политической тональности ответов и внезапный уход ключевого руководителя.

• Google и их анонсы: ИИ в Google Docs, новый чип, обновления моделей и не только
Google делает ставку на интеграцию ИИ во все свои сервисы, от Workspace до создания сложных ИИ-агентов и выпуска собственных мощных чипов. Разбираемся в планах компании.

• Почему ИИ до сих пор не приносит прибыль? Отчет Стэнфорда
Несмотря на миллиардные вложения, большинство компаний пока не видят значительной финансовой выгоды от внедрения ИИ. Так ли это плохо?

• Яндекс и Третьяковка: нейросети <strike>против</strike> художников?
Экспериментальная выставка объединит искусство и технологии: художники погрузились в мир машинного обучения, стажировались в Яндексе и разбирались в нейросетях, чтобы чтобы создать с ними совместные произведения искусства.

• Google сами не понимают, что делать со своим лучшим сервисом
Добавление поиска по интернету в NotebookLM, инструмент для работы с данными – очень странное решение: сервис выдает нерелевантные ссылки и работает хуже, чем у конкурентов.

转发自:

БлоGнот

05.04.202520:34

Meta представила новое поколение моделей Llama 4, включая сразу два релиза и анонс третьей модели. Впервые модели Llama построены на архитектуре Mixture of Experts (MoE) и обладают нативной мультимодальностью.

Llama 4 Scout — модель с 17 млрд активных параметров и 16 экспертами, способная работать на одном GPU H100. Она предлагает контекстное окно в 10 млн токенов (в 100 раз больше, чем у Llama 3) и превосходит Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 по многим бенчмаркам.

Llama 4 Maverick — также с 17 млрд активных параметров, но уже со 128 экспертами, превосходит GPT-4o и Gemini 2.0 Flash, показывая результаты сравнимые с DeepSeek v3 в рассуждениях и кодировании, но с вдвое меньшим количеством параметров.

Meta также анонсировала Llama 4 Behemoth — модель с 288 млрд активных параметров, 16 экспертами и почти 2 триллионами общих параметров. По словам компании, она превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro на нескольких STEM-тестах, но пока находится в процессе обучения.

Модели Scout и Maverick уже доступны для скачивания на llama.com и Hugging Face. Для обычных пользователей на их основе уже работает обновленный Meta AI в WhatsApp, Messenger, Instagram и на сайте Meta.AI.

Будем ждать независимых тестов, тем более, что локально эти модели не запустить. Впрочем, сервисы должны скоро подтянуться.

https://ai.meta.com/blog/llama-4-multimodal-intelligence/

转发自:

Сиолошная

04.04.202515:19

Бомба: объявлены цены на Gemini 2.5 Pro, и они уделывают все модели прошлого поколения.

Цена зависит от длины промпта, для тех, что укладываются в 200K токенов (это сколько всего могут обработать GPT-4.5/o1/Claude 3.7 сейчас) — цена $1.25 и $10 за миллион токенов на входе и выходе соответственно.

Публичное API обещают в этом месяце.

转发自:

Нейродвиж

02.04.202521:55

Вышел ИИ-агент Ace, который может ПОЛНОСТЬЮ управлять вашим компьютером 🤔

Под капотом собственная модель ace-control, которая работает даже лучше OpenAI Operator. Агент может пользоваться ЛЮБОЙ апкой, что есть на вашем компьютере. Самое интересное: разрабы сосредоточились на скорости — их модель в среднем в 10 раз шустрее того же Operator.

Можно будет посадить бедолагу проходить Dark Souls. Записываемся в бета-тестеры — здесь.

02.04.202508:11

Раменское
Забавный мир нас ждёт, если они победят

01.04.202514:18

Исследователи в сотрудничестве с Meta разработали нейросеть MoCha для создания кинематографических персонажей. Для генерации видео нужно загрузить аудиодорожку и описать внешность героя текстом

转发自:

Нейродвиж

11.04.202511:20

На следующей неделе нас ждёт сразу ПЯТЬ новых моделей OpenAI — в коде сайта нашли инфу о апдейте.

Три версии GPT-4.1, долгожданный релиз думающей o3 и новый король бенчмарков — o4-mini.

Неделя обещает быть жаркой.

转发自:

Microsoft

05.04.202517:00

Microsoft научил Copilot выполнять действия на сайтах
Copilot
теперь может выполнять действия в интернете — купить билеты, забронировать столик ресторане или заказать букет цветов. Такие компании как Booking.com, Expedia, OpenTable, Tripadvisor уже адаптировали свои сайты для AI-агента Microsoft.

Еще Copilot научили искать лучшие цены на товары, запоминать информацию о своем пользователе, проводить исследования и генерировать подкасты.

转发自:

БлоGнот

04.04.202513:39

Midjourney выпустил новую модель генерации изображений V7 — первое крупное обновление почти за год.

В модели по умолчанию включена персонализация, но, чтобы разблокировать её, надо оценить 200 изображений.

CEO Дэвид Хольц описал V7 как "полностью другую архитектуру", которая "намного умнее работает с текстовыми запросами". Модель доступна в двух вариантах: Turbo (более дорогой) и Relax, и также предлагает новый инструмент Draft Mode, который рендерит изображения в 10 раз быстрее и вдвое дешевле стандартного режима.

Честно говоря, не могу сказать, что меня впечатлил результаты пары запросов — если что, с текстом модель работает по-прежнему плохо. Да, стиль отличается от версии 6.1, но ничего революционного пока не обнаружил. Должен, правда, отметить, что веб-интерфейс стал достаточно удобным, я до сих пор использовал только бота в Discord.

https://techcrunch.com/2025/04/03/midjourney-releases-its-first-new-ai-image-model-in-nearly-a-year/

转发自:

google

02.04.202516:48

Google выпустил огромную 145-страничную статью про AGI, в которой компания пытается успокоить опасающихся захвата человечества ИИ-шками.

Осознанный и способный к самоконтролю ИИ появится уже в этом десятилетии. Но ИИ не станет сильнее или лучше человека, это невозможно без «значительных архитектурных инноваций».. И единственная опасность, которая может исходить от ИИ, — это вопросы безопасности и защиты персональных данных.

转发自:

Лобушкин

01.04.202518:40

Nike показала свою нейросеть Air Imagination AI, которая может генерировать кроссовки по вашему описанию. Спойлер: заказать их нельзя.

В остальном — делай что хочешь: модель, цветовая палитра, материалы — ИИ выдаст крутые кроссовки.

@lobushkin

转发自:

Yandex лента

01.04.202512:31

Люди предпочитают слушать лекции вместе с нейронками — по данным Яндекс Браузера, создание выжимок из записей лекций одно из самых популярных применений пересказа видео

На лекции приходится 10% от всех пересказов видео в Яндексе Браузере. Чаще пересказывают только видеоинструкции — на них приходится до четверти от всех использований этой функции.

Записи лекций часто выкладывают в интернет «как есть», без склеек и нарезок. Поэтому проще всего попросить ИИ сделать короткую выжимку.

转发自:

TechSparks

10.04.202520:05

А вот это просто изящно:)
В генераторе картинок и видео Sora есть галерея текущих генераций, именно в ней зарождаются тренды, который начинают вирусить, как только их подхватывает сообщество авторов. Так было недавно с гиблификацией и с фигурками в коробочках, которые напоминают автора.
Но вот новый тренд: генерить картинки, которые содержат текст, обращенный к разработчикам Sora с пожеланиями о доработках или функционале. Этакая публичная обратная связь от пользователей, выдержанная в формате самого продукта. Впечатляет!

https://www.techradar.com/computing/artificial-intelligence/the-hottest-new-ai-image-trend-is-sora-users-begging-for-new-features-using-its-built-in-image-generation-features-and-im-here-for-it

转发自:

CRAI где живёт AI

05.04.202513:03

#нейродайджест CRAI за неделю

• Ваши тайны больше не ваши: что чат-боты знают о пользователях и почему это опасно
Узнайте, какую личную информацию вы неосознанно раскрываете искусственному интеллекту, как компании используют разговоры и что можно сделать, чтобы защитить свою приватность.

• Нейросети заменяют программистов?
Искусственный интеллект проникает в сферу разработки, генерируя значительную часть кода и влияет на рынок труда. Рассказываем о новой эре «вайб-кодинга», о проблемах, которые несут ИИ-помощники, и о том, какие навыки теперь критически важны для программистов.

• Новый ИИ-эксперт от Яндекса
Яндекс выпустил Нейроэксперта – инструмент, способный анализировать документы, видео и даже аудиофайлы, отвечая на вопросы на их основе. Рассказываем о том, чем он отличается от западных аналогов, какие форматы поддерживает и как его можно использовать для работы с информацией.

• Как Nvidia нашли лазейку в санкциях США, чтобы заработать на китайском рынке
Nvidia нашли способ обойти американские санкции и заработать миллиарды на китайском рынке благодаря «урезанным» чипам, которые китайские компании начали активно скупать.

• Голосовые помощники оказались пустышкой?
Громкие анонсы «умных» голосовых ассистентов от Amazon и Apple стали разочарованием для пользователей. Оказалось, разработка действительно интеллектуальных помощников сложнее, чем предполагали технологические гиганты.

• Пройден тест Тьюринга?
Эксперимент показал, что большинство людей не могут отличить нейросеть GPT-4.5 от человека.

• Студенты списывают у нейросетей?
Исследование показало, что большая часть студентов использует нейросети для выполнения учебных работ.

转发自:

Content Review

03.04.202518:30

Цифра дня

73% участников эксперимента не смогли отличить чат-бота от настоящего человека. В итоге GPT-4.5, можно сказать, прошёл тест Тьюринга. При этом ИИ умудрялся казаться более человечным, чем сами люди, потому что иногда живых собеседников принимали за ботов.

GPT-4.5 притворялся молодым, использовал сленг и говорил на эмоциональные и чувствительные темы. Именно «личность» робота оказалась ключом к успеху: без особых инструкций для ответа ИИ переставал быть таким убедительным.

转发自:

о гпт

02.04.202511:37

OpenAI
представили версию своего чатбота с саркастическим отношением жизни и презрением к человеку. Вчера голос бота появился в Voice Mode, сейчас можно пообщаться и в текстовом виде.

转发自:

GPT/ChatGPT/AI Central Александра Горного

01.04.202517:36

Amazon представил AI-агента для управления браузером

Nova Act — универсальный AI-агент, который может работать в веб-браузере и выполнять простые действия, такие как заказ продуктов или столика в ресторане.

Amazon утверждает, что Nova Act превосходит аналоги от OpenAI и Anthropic в нескольких внутренних тестах. Например, он лучше взаимодействует с текстом на экране.

Nova Act доступен в формате предварительного просмотра на nova.amazon.com.

Amazon также выпустил Nova Act SDK — набор инструментов, при помощи которого разработчики могут создавать своих агентов.

https://techcrunch.com/2025/03/31/amazon-unveils-nova-act-an-ai-agent-that-uses-a-web-browser/

01.04.202512:08

Heytale — нейросеть которая напишет сказку и сразу сгенерирует для неё картинки

Вы просто пишете примерное описание сюжета, остальное делает ИИ. Слайды можете вывести на телевизор или на планшет. Каждый день — новая сказка с индивидуальным сюжетом. Можно также читать сказки других пользователей. Нейросеть понимает русский язык. Но можно сгенерировать сказки и на английском, создав неповторимые обучающие материалы.

显示 1 - 24 共 74

登录以解锁更多功能。

引用

引用