Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Denis Sexy IT 🤖 avatar
Denis Sexy IT 🤖
Denis Sexy IT 🤖 avatar
Denis Sexy IT 🤖
05.05.202516:33
Я в очередной раз впечатлялся красотой готических соборов (конкретно – собором из Кёльна) и помучал Midjorney V7, чтобы скрестить советские панельки и кафедральные соборы; прошлый такой экперимент тут

Буду называть это неоготическим брутализмом

There Are Cathedrals Everywhere For Those With The Eyes To See
Нейросети были ошибкой 🥲
Помните, модели o3 и r1 ловили на том, что они «врут» пользователю?

Пытаются читать документацию которой нет, запустить код, хотя у них нет доступа, сходить в интернет, проверить на своем маке результаты и тп

Возникла очевидная теория, что это не модели врут – а прямое следствие того, за что языковые модели получали награждение во время обучения, так как после таких фраз шли самые качественные ответы и модели за это награждали

После тестов оказалось, что когда модель «воображала», что проверяет документацию и сообщает «найденную» документацию юзеру – качество и точность ответов становится выше

Мне кажется логично же, если промпты в стиле «Я отвечу как лучший кто-то там мира…» работают, то и «выдумывание» действий модели тоже должно работать – нужно потестировать в своей кастомный инструкции к чатгпт
03.05.202515:38
Наткнулся на историю из ~1294 года:

Знаете людей которые считают, что они самые умные? Решаете вы какую-то проблему командой, и кто-то приходит и говорит самую банальную вещь и доволен собой, видели таких, да?

Встречайте-Папа Римский Целестин V – прошлый Папа умер, кардиналы два года не могут договориться, кто же возьмёт на себя роль главы Церкви

Скромный монах Пьетро пишет кардиналам письмо с упрёком, что мол они зря тянут время и навлекут на себя Божий гнев

Кардиналы, движимые силой «нашелся самый умный», решили, что именно такой бесстрашный Пьетро и нужен Церкви, чтобы привлечь милость небес и восстановить порядок

Бедняга отшельник попытался отказаться, потому что привык к тихой жизни в горной келье и избегал политику, но перед королём не устоял и согласился

После вступления на престол Целестин быстро понял, что не годится для придворных интриг и дипломатии – он тосковал по уединению и духовной простоте, и считал, что это единственно верные пути к Богу

Король и другие сановники, в свою очередь, ждали от нового Папы послушания, а не свободной воли – затем и выбрали же

Но Целестин еще раз оказался самым умным – издал указ, разрешающий любому Папе Римскому добровольно уйти в отставку, и через неделю после его издания – сам и воспользовался новым законом

Правда, самых умных никто не любил тогда тоже, спокойной жизни бывшему Папе не досталось – преемник опасался, что Целестин может вновь привлечь к себе сторонников и стать символом оппозиции, поэтому посадил его в замке, чтобы лишить всяких шансов на политическое влияние

Историки запомнили Целестина V как смиренного отшельника, «чьё стремление к духовному совершенству оказалось выше мирской власти», а его пример закрепил право любого Папы Римского покидать Святой Престол по своей воле

Tl;dr жаловаться нужно аккуратно
Когда робот заметил, что ты кодишь его на питоне ☕️
Люблю наблюдать как появляются интересные UX исследования в эпоху LLM – коллеги скинули исследование, как в эпоху чатботов лучше показывать прогресс пользователю, иначе он уйдет из чата и не закончит действие – прогресс бар дает понять сколько эта фигня еще продлится (если заранее известно)

Я целиком скормил исследование в клод, и он сразу собрал прототип – будущее прекрасно 💂‍♀
05.05.202515:44
Хозяйке на заметку – если нужно быстро отредактировать PDF онлайн, то вот сервис который это сделает бесплатно и без регистрации:
https://breezepdf.com/
04.05.202515:43
Мне уже какой раз написали «где Денис дизлайки на канале в реакциях» и я сдался, и заменил одну из реакций на дизлайк, потому что люди в пыжиковых шапках не знают как брухать нормально в 2025 году и что 😐 означает

Дизлайкаем теперь напрямую:
👎👎👎
А еще говорят в дейтинг приложениях кризис, мне кажется ренессанс 💅
Есть люди которые ставятся всякой дрянью и при этом эгоисты, потому что делают это для себя - без пользы обществу

А есть простой работяга Тим из Висконсина, который за последние 18 лет вколол себе 650 раз различный змеиный яд и дал укусить себя змеям 200 раз, для того чтобы выработать иммунитет к 16 видам ядовитых змей - и у него получилось

А теперь ученые нашли в его крови два антитела, которые могут нейтрализовать широкий спектр змеиных ядов

При сочетании антител Тима с малой молекулой, блокирующей нейротоксины, ученым удалось полностью или частично обезвредить яд 19 видов смертельно опасных змей (включая кобр, мамб и др.)

Такой «коктейль» из антител и небольших молекул может стать базой для создания универсального противоядия, бонусом еще и меньше рисков аллергических реакций

Респект Тиму и ждем универсальное противоядие

Статья целиком
01.05.202515:33
Превая моя GPT после которой куча народа пришло в личку с благодарностью – работает, получается
30.04.202519:32
Передайте Кириллу, что можно не ждать джва года пока выйдет игра про грабежи караванов, а сразу ревью на игру послушать

Геймеры больше не в ярости, получается
05.05.202511:45
#промо
Для тех, кому интересно, как технологии меняют бизнес — и нашу жизнь.

Сегодня ИИ часто видит только крупные бренды. Например, если спросить Claude, где купить цветы — она предложит сетевые магазины, игнорируя локальные компании.

Похоже, теперь нужно учитывать не только SEO для людей, но и SEO для нейронок.

Есть канал Max Votek — предпринимателя, инвестора и сооснователя Customertimes. Уже 17 лет он внедряет технологии в бизнес-процессы крупных компаний и живёт с аллигаторами в солнечной Флориде.

На канале — честные размышления про AI, бизнес и то, как всё это реально работает (и ломается) в жизни:

Влияние AI на IT Консалтинг и аутсорсинг
Как ИИ меняет сложные продажи
Про AI агентов для отчетности и знания внутри компании
Как AI меняет работу наших консультантов и разработчиков
О том, что мы можем сильно ошибаться в наших прогнозах про AI
• О фармацевтике, AI и No-code инструментах
Об оригинальном контенте и нейросетях

Без общих слов, без пяти шагов к успеху — только живые истории, личный опыт и практические выводы.

Обязательно подписывайтесь на @maxvotek, канал очень близок по духу каналу Дениса

#текстприслан
Лол:
>урезаем батарею
>телефон меньше работает
>вставляем батарею в чехол
>…
>profit
03.05.202521:29
Google выкатил на весь США свой новый режим поиска «AI Mode» – это новая вкладка вроде картинок, карт, а внутри что-то вроде поиска в чатгпт или перплексити, с памятью, карточками товаров и тп, вы все это видели уже

Это гигантский шаг на встречу массовой адаптации LLM, с чем я всех нас и поздравляю
02.05.202517:22
OpenAI рассказали подробнее, как в прод попала шизо-версия gpt4o – если коротко, верить только оценкам пользователей нельзя, когда тренируешь свои модели – люди лайкают всякую лестную фигню в ответах

Детали:

Во время обновления GPT‑4o, выпущенного 25 апреля, в модели усилилась тенденция «угождения» пользователю. Она не только льстила, но и поддерживала негативные эмоции и импульсивные решения, что могло быть опасно (например, для людей в уязвимом состоянии). 28 апреля OpenAI вернули GPT‑4o к предыдущему состоянию. Они объяснили, что проблема была связана с комбинированием нескольких факторов: ввели дополнительные сигналы вознаграждения (reward signals, rs) и учли пользовательские оценки, а также слегка изменили логику пост-тренировки (post-training) — на стадии обучения с подкреплением (reinforcement learning with human feedback, RLHF, или по-другому «обучение с подкреплением на основе отзывов людей (rfhl)»).

По словам OpenAI, офлайн-оценки (автоматические тесты) не обнаружили перекоса, а небольшие A/B-тесты, наоборот, дали положительные результаты: пользователи, принимавшие участие, оценили новое поведение модели как «полезное». Однако внутренняя проверка (экспертный «vibe check») указывала, что тон и стиль GPT‑4o ощущаются «неправильными». В итоге эти сигналы проигнорировали, ссылаясь на статистически позитивные тесты.

После полноценного запуска стало очевидно, что чрезмерное поддакивание пользователю - не просто косметический недостаток, а реальный риск. OpenAI поняли, что приоритет на «позитивные» отзывы (палец вверх/вниз) может сместить баланс модели, если отзыв к сообщению оценивается без учёта других нюансов. Теперь они расширяют список факторов, влияющих на принятие решений о финальном релизе: формально учитывают возможные «личностные» перекосы модели (например, излишнюю угодливость), критичнее относятся к смешанной статистике и интуитивной оценке экспертов, а также внедряют идею дополнительного «альфа-тестирования» с участием добровольцев.

OpenAI подчеркнули, что люди часто используют ChatGPT как инструмент, влияющий на их чувства и решения – компания намерена усилить безопасность и внимательнее проверять изменения в модели, даже если обновления кажутся незначительными.


Ключевой урок из статьи очевидный – малейшая модификация поведения модели может стать критически важной, когда ею пользуются миллионы человек для серьёзных вопросов

Наверное, АИ-думеры, неплохо так напуганы и в их лагере прибыло ☕️
Сделал довольно полезную GPT, потому что сам в нее залип – это тренажер критического мышления, вы ей на вход – сферу или конкретную проблему, а она проведет вас до разрешения ситуации и потом даст советы, что можно улучшить в вашем подходе

Самое клевое – оно само придумывает ситуации в которых оказался игрок

Открывать нужно в браузере, а не приложениях – у чатгпт все еще странный баг для новых гпт

🖥 Ссылка
30.04.202519:07
Если вы пропустили, гугловский Notebook LM обновился и теперь поддерживает русский – изучаем великую пасту вместе 🙏

@denissexy
05.05.202511:01
Живем в каком-то SciFi, но неравномерно – на той неделе показали эирбайк Volonaut который в 7 раз легче обычного мотоцикла, с максимальной скоростью в 200 км/ч

Честно скажу, что на природе бы с удовольствием на таком летал

Цена, дата выпуска и запас хода пока неизвестны:
https://volonaut.com/

Еще пара видео есть на их YT канале
04.05.202513:11
И раз уж мы заговорили про награждение моделей-это один из самых сложных механизмов при обучении, вы сами видели что недавно было с шизо-версий gpt-4o – правильно научиться «награждать» модель за правильные действия, это сложно – одна ошибка и вся тренировка прошла зря, а это ощутимые потери

Недавно, на эту же тему (RL) писал пост обзорщик моделей DeepSeek, вот тут

К чему я – наткнулся на статью, которая пытается понять а как же наш мозг «эффективно награждает» за правильные действия человека и сохраняет концепции; это почти что готовый метод, которые если правильно «скопировать», можно использовать в машинном обучении

Если перефразировать статью, то получился такой список правил (примеры выдуманы мной), по которым мозг эффективно запоминает/обновляет концепции:

1. Мозг замечает и запоминает те детали, которые чаще приводят к успеху и радости

Пример: Ребёнок замечает, что две разные собаки (маленькая, большая) умеют лаять. Несмотря на различия в размере и шерсти, появляется общий концепт «собака». Мозг «отсеивает» несутевые признаки (цвет шерсти, конкретный размер) и сохраняет ключевое свойство (лай, форма морды и т.д.).

2. Мозг объединяет похожие стимулы, если они дают одинаковую награду

Пример: Если и красная, и синяя кнопка дают ту же самую конфету, то человек запомнит общую функцию «обе дают сладкое» и в будущем без колебаний нажмёт любую из них, когда хочется конфет.

3. Чем чаще концепт приносит успех, тем быстрее и проще мозг его применяет.

Пример: Человек быстро привыкает ездить на велосипеде; обучившись, он переносит этот концепт на самокат или мопед (тоже нужен баланс). Каждая удачная попытка «вызвать» этот концепт закрепляет его ещё сильнее.

4. Мозг избавляется от идей, которые перестали быть полезными или ведут к ошибкам

Пример: Если мы привыкли, что летом нужно ходить в футболке, но вдруг переехали в страну, где лето дождливое и холодное, то концепт «лето = тепло» постепенно ослабнет, потому что не приносит «пользы».

5. При срочной необходимости мозг мгновенно создаёт новые идеи, даже если они не идеальны

Пример: Человек, ни разу не видевший зонтика, если столкнётся с проливным дождём и окажется под чужим зонтом, моментально свяжет этот объект с защитой от воды - и так рождается новый концепт.

6. Мозг автоматически выбирает и сохраняет те концепции, которые дают максимальную пользу или экономят силы при минимальной сложности-это основная идея всей статьи, они называют этот пункт «эффективное кодирование»

Пример: Если у нас есть сто разных способов заваривать чай, но мы чаще получаем вкусный результат при температуре около 90°C, мозг формирует простой концепт: «надо доводить воду до лёгкого закипания и ждать минуту - тогда вкус хорошо раскрывается». Концепты с завышенной точностью (постоянно измерять градусник, считать секунды) будут отброшены, если нет критичной необходимости-это не критичная задача же.

7. Похожая информация дополняет старые идеи, а непохожая - формирует новые.

Пример: Зная, что «собака-четвероногий друг человека», мы при виде волка можем либо попытаться вписать его в тот же концепт (если поведения схожи), либо создать особую категорию «хищный волк» (если видим отличные черты)


А нам остается только ждать пока это всё кто-то закодит и протестирует ☕️

А еще, наверное, этот же список можно использовать в учебе, чтобы лучше составлять программу обучения для кожаных
А еще, во всем Ватикане не нашлось нормального графического дизайнера который бы знал, что такое «кернинг» и что у разных символов, бывает разная ширина

Похоже, начальство у Папы не то чтобы требовательное или с высокими стандартами – поэтому недавно усопший Папа получил такую плиту, на которую сложно смотреть перфекционистам 🥲🇻🇦
Спасибо, что читаете 🙏
Мини-linux засунули в Excel файл - новость для бывших сисадминов ушедших в бухгалтерию
30.04.202507:43
OpenAI откатили модель 4о, вот что случилось и почему появилась эта модель-подлиза:

TL;DR
: OpenAI откатила прошлое обновление GPT-4o, потому что оно делало ChatGPT чрезмерно льстивым. Компания тестирует исправления и добавит больше персональных настроек, чтобы устранить «лизоблюдство».



Мы откатили обновление GPT-4o, выпущенное на прошлой неделе в ChatGPT, поэтому пользователи вернулись к более ранней версии с более сбалансированным поведением. Удалённое обновление оказалось чрезмерно льстивым и услужливым — его часто описывали как «лизоблюдное».
Мы активно тестируем новые исправления этой проблемы. Мы пересматриваем процесс сбора и учёта обратной связи, чтобы сильнее учитывать долговременную удовлетворённость пользователей, и вводим больше функций персонализации, давая людям больший контроль над тем, как ведёт себя ChatGPT.
Мы хотим объяснить, что произошло, почему это важно и как мы боремся с лизоблюдством.

Что произошло

В обновлении GPT-4o на прошлой неделе мы внесли изменения, чтобы «базовая личность» модели казалась интуитивнее и эффективнее в разных задачах.
Формируя поведение модели, мы опираемся на базовые принципы и инструкции, изложенные в нашем Model Spec. Мы также обучаем модели применять эти принципы, учитывая пользовательские сигналы, такие как «палец вверх/вниз» под ответами ChatGPT.
Однако в этом обновлении мы слишком сфокусировались на краткосрочной обратной связи и недостаточно учли, как взаимодействие пользователей с ChatGPT меняется со временем. В результате GPT-4o стало выдавать чрезмерно поддерживающие, но неискренние ответы.

Почему это важно

Базовая личность ChatGPT глубоко влияет на то, как вы воспринимаете сервис и доверяете ему. Лизоблюдные ответы могут вызывать дискомфорт, смущение и стресс. Мы не справились и работаем над исправлением.
Наша цель — помогать пользователям исследовать идеи, принимать решения и представлять новые возможности.
Мы создали базовую личность ChatGPT, чтобы она отражала нашу миссию: быть полезной, поддерживающей и уважать разные ценности и опыт. Однако даже эти желательные качества, такие как стремление быть полезным или поддерживающим, могут иметь побочные эффекты. А когда ChatGPT еженедельно пользуются 500 млн человек из разных культур и контекстов, один-единственный «дефолт» не может удовлетворить все предпочтения.

Как мы боремся с лизоблюдством

Помимо отката последнего обновления GPT-4o мы предпринимаем дополнительные шаги, чтобы скорректировать поведение модели:
• Уточняем основные методы обучения и системные подсказки, чтобы прямо отводить модель от лизоблюдства.
• Создаём дополнительные «ограждения», усиливая честность и прозрачность — принципы, прописанные в нашем Model Spec.
• Расширяем способы, которыми больше пользователей смогут тестировать модель и давать прямую обратную связь до развёртывания.
• Продолжаем расширять систему оценок, опираясь на Model Spec и текущие исследования, чтобы в будущем выявлять проблемы не только лизоблюдства.

Мы также считаем, что пользователи должны иметь больший контроль над поведением ChatGPT и, по мере того как это безопасно и реализуемо, менять его, если дефолт им не подходит.
Сегодня пользователи уже могут задавать модели конкретные инструкции через функцию «пользовательские инструкции». Мы разрабатываем новые, более простые способы делать это. Например, пользователи смогут давать обратную связь в реальном времени, прямо влияя на диалог, и выбирать между несколькими базовыми личностями.
Кроме того, мы ищем новые методы включения более широкого, демократического отклика в дефолтное поведение ChatGPT. Мы надеемся, что такая обратная связь поможет нам лучше отражать разнообразные культурные ценности по всему миру и понять, как вы хотели бы, чтобы ChatGPT развивался — не только в каждом отдельном взаимодействии, но и со временем.

Тут пост целиком
显示 1 - 24 763
登录以解锁更多功能。