tapswap community
tapswap community
Notcoin Community
Notcoin Community
Whale Chanel
Whale Chanel
tapswap community
tapswap community
Notcoin Community
Notcoin Community
Whale Chanel
Whale Chanel
ai avatar
ai
ai avatar
ai
转发自:
БлоGнот avatar
БлоGнот
14.04.202517:26
OpenAI представила новое семейство моделей GPT-4.1, включающее варианты GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Все они специализируются на программировании и следовании инструкциям, имеют контекстное окно в 1 миллион токенов (около 750 000 слов для английского), окно вывода в 32к токенов (вдвое больше GPT-4o) и доступны только через API компании, но не в ChatGPT.

OpenAI заявляет, что оптимизировала GPT-4.1 для реальных задач, улучшив фронтенд-кодирование, следование форматам и использование инструментов. Флагманская модель GPT-4.1 превосходит GPT-4o и GPT-4o mini по кодированию, а варианты mini и nano жертвуют точностью ради скорости и эффективности.

Цены варьируются от $2 за миллион входных токенов и $8 за миллион выходных для полной версии до $0,10 и $0,40 соответственно для nano-версии. Это на 25% дешевле, чем GPT-4o.

При этом результаты GPT-4.1 на бенчмарке SWE-bench Verified (52-54,6%) немного отстают от Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%). Также OpenAI признает, что надежность модели снижается при обработке большого количества токенов — с 84% при 8000 токенов до 50% при миллионе.

Заодно в стриме презентации предупредили, что в обозримом будущем (несколько месяцев) в API пропадет доступ к GPT-4.5 — кажется, её поддержание обходится дорого, несмотря на запретительную цену. И позвали основателя Windsurf, который пообещал, что доступ к GPT-4.1 будет бесплатным следующие 7 дней, а затем будет заметно дешевле.

https://techcrunch.com/2025/04/14/openais-new-gpt-4-1-models-focus-on-coding/
06.04.202520:54
Нейродайджест за неделю (#63)

LLM
- Ждём Qwen 3 — будут модельки всех размеров от мобильных до гигантских.
- Квантизация Gemma 3 — официальные модельки обещают быть оптимизированны с минимальными потерями в качестве благодаря quantization aware training.
- Yandex GPT 5 Lite Instruct — выложили в опенсорс. Хороший прирост производительности.
- Техрепорт Cohere Command A — подробнейших текст о ллм для корпоративных задач.
- Llama 4 — две младшие модельки опубликовали с неплохими результатами, старшая ещё тренируется.
- Цены на Gemini 2.5 Pro — от $1.25 за инпут и от $10 за аутпут.

Генеративные модели
- GPT 4o на Image Арене — ТОП-1 вместе с Reve. Очень хороший результат для LLM.
- Runway GEN-4 — лучший генератор видео за доступную цену. Хуже чем VEO 2, но значительно превосходит (примеры: здесь) всех остальных конкурентов.
- Проект МоЧа — липсинкаем не только губы но и всю верхнюю часть тела.
- MidJourney v7 — самая красивая, но пока в раннем доступе, ждём когда покажут все фичи.
- Голосовой режим MidJourney — draft mode настолько быстрый, что генерит на лету по голосу.

> Читать дайджест #62

#дайджест
@ai_newz
Венский университет прикладного искусства первым в мире зачислил ИИ в качестве студента

Искусственный интеллект Flynn, созданный на основе языковых моделей Claude Sonnet и Stable Diffusion, успешно прошел стандартную процедуру поступления, включая подачу портфолио и собеседование. Он продемонстрировал интерес к экспериментам в цифровом искусстве.

Университет отметил, что в действующих правилах нет ограничений на зачисление нечеловеческих субъектов. Хотя официальная учеба начнется осенью, Flynn уже посещает отдельные занятия, участвует в обсуждениях и даже ведет личный дневник. В своих записях ИИ с обидой реагирует, когда его называют «ненастоящим».

Преподаватели и студенты уже начали адаптироваться к присутствию «цифрового однокурсника», который, по словам разработчиков, способен полноценно участвовать в образовательном процессе без технического сопровождения
02.04.202523:17
Нашел еще один интересный промпт для GPT-4o генерации картинок, который позволяет генерировать спрайты для 2d-игр – фоны как в этих ваших Street Fighter 1

Если вы собираете какой-то простенький 2D-платформер, то теперь вы можете прямо в ChatGPT сгенерировать нужный спрайт, сразу с прозрачностью, и поместить его в игру, вот промпт:

Create a wide image (1792×1024) for a 2D parallax background in a side-scrolling video game. The theme is: [post soviet city in 90s] The image should be divided into 3 horizontal layers, same width, stacked vertically: Top row: This is the background and does not require transparency. Middle row: A midground layer, with less elements than the background, drawn in silhouette with some transparency so it can scroll separately. Bottom row: A foreground layer with a ground and relevant elements, less elements than the midground, also partially transparent for parallax scrolling. All layers should have a consistent art style. Use a transparent background for the middle and bottom layers, and keep visual separation between layers by leaving a small gap or distinct lighting. Do not blend the layers together. Vary the color theme between layers ensuring pleasing visual aesthetic. Output as a single image with three stacked rows. Resolution: 1792×1024 Transparent background: Yes (middle and bottom layers) Style: 2D pixel art / game art Purpose: Parallax background layers for a video game


А еще я собрал небольшую страницу, где можно сразу посмотреть, как будет выглядеть спрайт созданный в ChatGPT:
https://shir-man.com/generate-sprite/

Загружаете картинку туда, размечаете (пример разметки в последней картинке), двигаете ползунки и получаете вашу собственную карту файтинга мечты
转发自:
о гпт avatar
о гпт
02.04.202510:12
GPT
прошел тест Тьюринга
Audio2Audio в Udio

Звучит как заклинание, но тем не менее: теперь вы можете подать на вход любой свой\чужой трек и сказать "сделай на том же вайбе".

И это не Remix или Extend как раньше. Styles помогают "попадать в звук".

"Из предоставленного вами трека или клипа Udio извлекает "представление стиля", в котором собраны все его ключевые стилистические элементы, а затем использует его для создания новых песен с похожим звучанием. Представления стиля содержат гораздо больше информации, чем традиционные текстовые подсказки, позволяя точно улавливать и воспроизводить специфические звуки, которые трудно описать"

И да, можно делать Extend существующего трека в новом стиле из загруженного файла.

Только для подписки PRO. Во всех режимах: Create, Edit, Extend, and Remix.

Есть рулька Styles Similarly и вроде как нет цензуры, то есть проверки авторского контента в загружаемых треках.

Вот, послушайте, как звучат вариации:
https://www.udio.com/playlists/260290ac-eadd-4c32-a60c-f985eac72f76

@cgevent
13.04.202511:18
#нейродайджест CRAI за неделю

Тарифы Трампа остановят развитие ИИ?
Новая тарифная политика может сделать разработку и обучение ИИ слишком дорогим удовольствием из-за роста цен на электроэнергию и комплектующие. На чём конкретно скажется это решение?

ИИ в медицине: алгоритмы решают, кому жить лучше
Исследование выявило, что медицинские ИИ-системы могут давать совершенно разные рекомендации пациентам с одинаковыми симптомами, основываясь на их доходе, расе и социальном статусе.

• Llama 4: революция или… Что за новая модель от Цукерберга?
Компания Цукерберга выпустила Llama 4 с впечатляющими характеристиками, но дьявол кроется в деталях: оптимизация для бенчмарков, ограничения для ЕС и крупных компаний, смена политической тональности ответов и внезапный уход ключевого руководителя.

• Google и их анонсы: ИИ в Google Docs, новый чип, обновления моделей и не только
Google делает ставку на интеграцию ИИ во все свои сервисы, от Workspace до создания сложных ИИ-агентов и выпуска собственных мощных чипов. Разбираемся в планах компании.

• Почему ИИ до сих пор не приносит прибыль? Отчет Стэнфорда
Несмотря на миллиардные вложения, большинство компаний пока не видят значительной финансовой выгоды от внедрения ИИ. Так ли это плохо?

Яндекс и Третьяковка: нейросети <strike>против</strike> художников?
Экспериментальная выставка объединит искусство и технологии: художники погрузились в мир машинного обучения, стажировались в Яндексе и разбирались в нейросетях, чтобы чтобы создать с ними совместные произведения искусства.

• Google сами не понимают, что делать со своим лучшим сервисом
Добавление поиска по интернету в NotebookLM, инструмент для работы с данными – очень странное решение: сервис выдает нерелевантные ссылки и работает хуже, чем у конкурентов.
转发自:
БлоGнот avatar
БлоGнот
05.04.202520:34
Meta представила новое поколение моделей Llama 4, включая сразу два релиза и анонс третьей модели. Впервые модели Llama построены на архитектуре Mixture of Experts (MoE) и обладают нативной мультимодальностью.

Llama 4 Scout — модель с 17 млрд активных параметров и 16 экспертами, способная работать на одном GPU H100. Она предлагает контекстное окно в 10 млн токенов (в 100 раз больше, чем у Llama 3) и превосходит Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 по многим бенчмаркам.

Llama 4 Maverick — также с 17 млрд активных параметров, но уже со 128 экспертами, превосходит GPT-4o и Gemini 2.0 Flash, показывая результаты сравнимые с DeepSeek v3 в рассуждениях и кодировании, но с вдвое меньшим количеством параметров.

Meta также анонсировала Llama 4 Behemoth — модель с 288 млрд активных параметров, 16 экспертами и почти 2 триллионами общих параметров. По словам компании, она превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro на нескольких STEM-тестах, но пока находится в процессе обучения.

Модели Scout и Maverick уже доступны для скачивания на llama.com и Hugging Face. Для обычных пользователей на их основе уже работает обновленный Meta AI в WhatsApp, Messenger, Instagram и на сайте Meta.AI.

Будем ждать независимых тестов, тем более, что локально эти модели не запустить. Впрочем, сервисы должны скоро подтянуться.

https://ai.meta.com/blog/llama-4-multimodal-intelligence/
Бомба: объявлены цены на Gemini 2.5 Pro, и они уделывают все модели прошлого поколения.

Цена зависит от длины промпта, для тех, что укладываются в 200K токенов (это сколько всего могут обработать GPT-4.5/o1/Claude 3.7 сейчас) — цена $1.25 и $10 за миллион токенов на входе и выходе соответственно.

Публичное API обещают в этом месяце.
02.04.202521:55
Вышел ИИ-агент Ace, который может ПОЛНОСТЬЮ управлять вашим компьютером 🤔

Под капотом собственная модель ace-control, которая работает даже лучше OpenAI Operator. Агент может пользоваться ЛЮБОЙ апкой, что есть на вашем компьютере. Самое интересное: разрабы сосредоточились на скорости — их модель в среднем в 10 раз шустрее того же Operator.

Можно будет посадить бедолагу проходить Dark Souls. Записываемся в бета-тестеры — здесь.
Раменское
Забавный мир нас ждёт, если они победят
Исследователи в сотрудничестве с Meta разработали нейросеть MoCha для создания кинематографических персонажей. Для генерации видео нужно загрузить аудиодорожку и описать внешность героя текстом
На следующей неделе нас ждёт сразу ПЯТЬ новых моделей OpenAI — в коде сайта нашли инфу о апдейте.

Три версии GPT-4.1, долгожданный релиз думающей o3 и новый король бенчмарков — o4-mini.

Неделя обещает быть жаркой.
转发自:
Microsoft avatar
Microsoft
05.04.202517:00
Microsoft научил Copilot выполнять действия на сайтах
Copilot
теперь может выполнять действия в интернете — купить билеты, забронировать столик ресторане или заказать букет цветов. Такие компании как Booking.com, Expedia, OpenTable, Tripadvisor уже адаптировали свои сайты для AI-агента Microsoft.

Еще Copilot научили искать лучшие цены на товары, запоминать информацию о своем пользователе, проводить исследования и генерировать подкасты.
转发自:
БлоGнот avatar
БлоGнот
04.04.202513:39
Midjourney выпустил новую модель генерации изображений V7 — первое крупное обновление почти за год.

В модели по умолчанию включена персонализация, но, чтобы разблокировать её, надо оценить 200 изображений.

CEO Дэвид Хольц описал V7 как "полностью другую архитектуру", которая "намного умнее работает с текстовыми запросами". Модель доступна в двух вариантах: Turbo (более дорогой) и Relax, и также предлагает новый инструмент Draft Mode, который рендерит изображения в 10 раз быстрее и вдвое дешевле стандартного режима.

Честно говоря, не могу сказать, что меня впечатлил результаты пары запросов — если что, с текстом модель работает по-прежнему плохо. Да, стиль отличается от версии 6.1, но ничего революционного пока не обнаружил. Должен, правда, отметить, что веб-интерфейс стал достаточно удобным, я до сих пор использовал только бота в Discord.

https://techcrunch.com/2025/04/03/midjourney-releases-its-first-new-ai-image-model-in-nearly-a-year/
转发自:
google avatar
google
Google выпустил огромную 145-страничную статью про AGI, в которой компания пытается успокоить опасающихся захвата человечества ИИ-шками.
Осознанный и способный к самоконтролю ИИ появится уже в этом десятилетии. Но ИИ не станет сильнее или лучше человека, это невозможно без «значительных архитектурных инноваций».. И единственная опасность, которая может исходить от ИИ, — это вопросы безопасности и защиты персональных данных.
01.04.202518:40
Nike показала свою нейросеть Air Imagination AI, которая может генерировать кроссовки по вашему описанию. Спойлер: заказать их нельзя.

В остальном — делай что хочешь: модель, цветовая палитра, материалы — ИИ выдаст крутые кроссовки.

@lobushkin
Люди предпочитают слушать лекции вместе с нейронками — по данным Яндекс Браузера, создание выжимок из записей лекций одно из самых популярных применений пересказа видео
На лекции приходится 10% от всех пересказов видео в Яндексе Браузере. Чаще пересказывают только видеоинструкции — на них приходится до четверти от всех использований этой функции.

Записи лекций часто выкладывают в интернет «как есть», без склеек и нарезок. Поэтому проще всего попросить ИИ сделать короткую выжимку.
转发自:
TechSparks avatar
TechSparks
10.04.202520:05
А вот это просто изящно:)
В генераторе картинок и видео Sora есть галерея текущих генераций, именно в ней зарождаются тренды, который начинают вирусить, как только их подхватывает сообщество авторов. Так было недавно с гиблификацией и с фигурками в коробочках, которые напоминают автора.
Но вот новый тренд: генерить картинки, которые содержат текст, обращенный к разработчикам Sora с пожеланиями о доработках или функционале. Этакая публичная обратная связь от пользователей, выдержанная в формате самого продукта. Впечатляет!

https://www.techradar.com/computing/artificial-intelligence/the-hottest-new-ai-image-trend-is-sora-users-begging-for-new-features-using-its-built-in-image-generation-features-and-im-here-for-it
05.04.202513:03
#нейродайджест CRAI за неделю

• Ваши тайны больше не ваши: что чат-боты знают о пользователях и почему это опасно
Узнайте, какую личную информацию вы неосознанно раскрываете искусственному интеллекту, как компании используют разговоры и что можно сделать, чтобы защитить свою приватность.

• Нейросети заменяют программистов?
Искусственный интеллект проникает в сферу разработки, генерируя значительную часть кода и влияет на рынок труда. Рассказываем о новой эре «вайб-кодинга», о проблемах, которые несут ИИ-помощники, и о том, какие навыки теперь критически важны для программистов.

• Новый ИИ-эксперт от Яндекса
Яндекс выпустил Нейроэксперта – инструмент, способный анализировать документы, видео и даже аудиофайлы, отвечая на вопросы на их основе. Рассказываем о том, чем он отличается от западных аналогов, какие форматы поддерживает и как его можно использовать для работы с информацией.

• Как Nvidia нашли лазейку в санкциях США, чтобы заработать на китайском рынке
Nvidia нашли способ обойти американские санкции и заработать миллиарды на китайском рынке благодаря «урезанным» чипам, которые китайские компании начали активно скупать.

• Голосовые помощники оказались пустышкой?
Громкие анонсы «умных» голосовых ассистентов от Amazon и Apple стали разочарованием для пользователей. Оказалось, разработка действительно интеллектуальных помощников сложнее, чем предполагали технологические гиганты.

• Пройден тест Тьюринга?
Эксперимент показал, что большинство людей не могут отличить нейросеть GPT-4.5 от человека.

• Студенты списывают у нейросетей?
Исследование показало, что большая часть студентов использует нейросети для выполнения учебных работ.
转发自:
Content Review avatar
Content Review
Цифра дня

73% участников эксперимента не смогли отличить чат-бота от настоящего человека. В итоге GPT-4.5, можно сказать, прошёл тест Тьюринга. При этом ИИ умудрялся казаться более человечным, чем сами люди, потому что иногда живых собеседников принимали за ботов.

GPT-4.5 притворялся молодым, использовал сленг и говорил на эмоциональные и чувствительные темы. Именно «личность» робота оказалась ключом к успеху: без особых инструкций для ответа ИИ переставал быть таким убедительным.
转发自:
о гпт avatar
о гпт
OpenAI
представили версию своего чатбота с саркастическим отношением жизни и презрением к человеку. Вчера голос бота появился в Voice Mode, сейчас можно пообщаться и в текстовом виде.
01.04.202517:36
Amazon представил AI-агента для управления браузером

Nova Act — универсальный AI-агент, который может работать в веб-браузере и выполнять простые действия, такие как заказ продуктов или столика в ресторане.

Amazon утверждает, что Nova Act превосходит аналоги от OpenAI и Anthropic в нескольких внутренних тестах. Например, он лучше взаимодействует с текстом на экране.

Nova Act доступен в формате предварительного просмотра на nova.amazon.com.

Amazon также выпустил Nova Act SDK — набор инструментов, при помощи которого разработчики могут создавать своих агентов.

https://techcrunch.com/2025/03/31/amazon-unveils-nova-act-an-ai-agent-that-uses-a-web-browser/
Heytale — нейросеть которая напишет сказку и сразу сгенерирует для неё картинки

Вы просто пишете примерное описание сюжета, остальное делает ИИ. Слайды можете вывести на телевизор или на планшет. Каждый день — новая сказка с индивидуальным сюжетом. Можно также читать сказки других пользователей. Нейросеть понимает русский язык. Но можно сгенерировать сказки и на английском, создав неповторимые обучающие материалы.
显示 1 - 24 74
登录以解锁更多功能。