23.04.202507:33
CPO OpenAI в Lenny's podcast, оч интересно, всячески рекомендую. Да, это именно тот человек который виноват в o3-mini-high и других шедеврах нейминга )
Там есть супер красивая история как их HRD сама пошла и навайбкодила (!) внутренний инструмент которого ей не хватало. Я верю что компании будущего так и должны жить - любой человек может создавать нужные ему инженерные решения лично сам. Эй, HRD, берите пример )
Что ещё классного:
1. Evals - ключевой навык продакт менеджеров и инженеров. Если ты не можешь правильно проверить работу системы на llm, ты не продвинешься дальше прототипов. Что такое эвалы и почему они важны можно почитать например тут
2. Никаких роадмапов на 3 месяца. Ребята живут в мире где через пару месяцев выйдет очередная модель которая опять всё кардинально поменяет. Поэтому никаких долгих роадмапов, только гибкость и только хардкор. Сравните это с вашей компанией ))
3. Bottom-up company
Так как путь неизвестен, то стратегия OpenAI это иметь супер-дальний ориентир (e.g. создание AGI), а работу строить как набор bottom-up команд, каждая из которых к этому ориентиру двигается. Интересно; кажется, Илон Маск строит такие штуки иначе.
Смотреть подкаст тут, и в целом Lenny's podcast оч крутой
Там есть супер красивая история как их HRD сама пошла и навайбкодила (!) внутренний инструмент которого ей не хватало. Я верю что компании будущего так и должны жить - любой человек может создавать нужные ему инженерные решения лично сам. Эй, HRD, берите пример )
Что ещё классного:
1. Evals - ключевой навык продакт менеджеров и инженеров. Если ты не можешь правильно проверить работу системы на llm, ты не продвинешься дальше прототипов. Что такое эвалы и почему они важны можно почитать например тут
2. Никаких роадмапов на 3 месяца. Ребята живут в мире где через пару месяцев выйдет очередная модель которая опять всё кардинально поменяет. Поэтому никаких долгих роадмапов, только гибкость и только хардкор. Сравните это с вашей компанией ))
3. Bottom-up company
Так как путь неизвестен, то стратегия OpenAI это иметь супер-дальний ориентир (e.g. создание AGI), а работу строить как набор bottom-up команд, каждая из которых к этому ориентиру двигается. Интересно; кажется, Илон Маск строит такие штуки иначе.
Смотреть подкаст тут, и в целом Lenny's podcast оч крутой
14.03.202507:22
Composio подняли кучу MCP-серверов для разных сервисов и собрали из этого библиотеку интеграций.
Там есть Google Docs, Github, Perplexity, 11labs и много чего ещё. Есть готовые интеграции "по кнопке" в cursor, windsurf и так далее. Классно.
Напомню, MCP это протокол от Anthropic для подключения инструментов и источников данных к LLM. Если у сервиса существует MCP-сервер для интеграции, подключить к вашим агентам или просто LLM-пайплайнам будет очень легко. Компании такие сервера уже создают.
MCP пока не так хорошо приживается в комьюнити - мнения противоречивые. Например, мы у себя внутри на MCP переходить не стали, так как он переусложнен, довольно сырой, и больше подходит для стартапов.
Но какие-то единые протоколы и каталоги тут точно нужны. Надо же всем этим агентам уметь общаться с другими системами и друг с другом.
Кто пробовал MCP ручками? У кого какое мнение?
Там есть Google Docs, Github, Perplexity, 11labs и много чего ещё. Есть готовые интеграции "по кнопке" в cursor, windsurf и так далее. Классно.
Напомню, MCP это протокол от Anthropic для подключения инструментов и источников данных к LLM. Если у сервиса существует MCP-сервер для интеграции, подключить к вашим агентам или просто LLM-пайплайнам будет очень легко. Компании такие сервера уже создают.
MCP пока не так хорошо приживается в комьюнити - мнения противоречивые. Например, мы у себя внутри на MCP переходить не стали, так как он переусложнен, довольно сырой, и больше подходит для стартапов.
Но какие-то единые протоколы и каталоги тут точно нужны. Надо же всем этим агентам уметь общаться с другими системами и друг с другом.
Кто пробовал MCP ручками? У кого какое мнение?


14.02.202508:00
Сделайте уже кто-нибудь гарнитуру с LLM, я вас умоляю!
Чтобы в ухе всегда была мощь лучших моделей и тулов, но чтобы не мешала говорить с людьми. Примерно как старые гарнитуры типа Plantronics были - просто на ухе висит, не мешает, звук пропускает. В них можно было сутки проходить и не заметить.
Nothing сделали подход к снаряду. Но сложновато настраивать и работает нестабильно. Как я вижу, упирается это в возможности платформ (iOS, Android) - при этом сами платформы как обычно тормозят и ничего не выпускают.
А как было бы круто всегда в ухе иметь личного LLM-ассистента полностью в твоём контексте и который может делать твои задачи!
Не нужна мне эта ваша дополненная реальность, хочу как в фильме Her 🌟
Чтобы в ухе всегда была мощь лучших моделей и тулов, но чтобы не мешала говорить с людьми. Примерно как старые гарнитуры типа Plantronics были - просто на ухе висит, не мешает, звук пропускает. В них можно было сутки проходить и не заметить.
Nothing сделали подход к снаряду. Но сложновато настраивать и работает нестабильно. Как я вижу, упирается это в возможности платформ (iOS, Android) - при этом сами платформы как обычно тормозят и ничего не выпускают.
А как было бы круто всегда в ухе иметь личного LLM-ассистента полностью в твоём контексте и который может делать твои задачи!
Не нужна мне эта ваша дополненная реальность, хочу как в фильме Her 🌟
11.02.202507:23
Посидел с replit.com
Replit это нашумевший AI-агент для разработки. Он за тебя и код напишет, и базы подключит, и задеплоит, и запустит. Разработка по описанию задачи под ключ. Посмотрите видос!
Интересно, что изначально фаундеры затевали проект как инструмент облачной разработки и деплоя. Строят его почти 10 лет! Год назад они пивотнулись в агента и на этом дико взлетели. Тут классный подкаст с ними на Y Combinator
Всем очень советую попробовать, опыт-восторг из будущего 🥳 🤖
Эта штука за тебя step-by-step делает архитектуру, сетапит среду, тащит зависимости, пишет код, подцепляет базы и так далее. Сидишь и смотришь )
- Шикарный агентский сплит-скрин UX
Отличные интеграции
- Классные до-запросы вида «вот это ли ты хочешь»
- Сам находит и пытается чинить ошибки
- Встроенный деплой топчик
Но на паре практических кейсов replit у меня довольно слабо себя показал. Слишком сложные задачи пытается брать, в результате ломается. Нужно самому определить уровень сложности и делать step-by-step над replit, тогда в целом работает, но медленно получается.
Для меня это скорее демо "как всё будет в будущем" и классный пример агентского продукта с точки зрения интерфейса.
Но помним, что модели улучшаются, а планирование (ключевая задача здесь) в принципе недавно появились как популярная задача для Llm. Завтра будет лучше.
Replit это нашумевший AI-агент для разработки. Он за тебя и код напишет, и базы подключит, и задеплоит, и запустит. Разработка по описанию задачи под ключ. Посмотрите видос!
Интересно, что изначально фаундеры затевали проект как инструмент облачной разработки и деплоя. Строят его почти 10 лет! Год назад они пивотнулись в агента и на этом дико взлетели. Тут классный подкаст с ними на Y Combinator
Всем очень советую попробовать, опыт-восторг из будущего 🥳 🤖
Эта штука за тебя step-by-step делает архитектуру, сетапит среду, тащит зависимости, пишет код, подцепляет базы и так далее. Сидишь и смотришь )
- Шикарный агентский сплит-скрин UX
Отличные интеграции
- Классные до-запросы вида «вот это ли ты хочешь»
- Сам находит и пытается чинить ошибки
- Встроенный деплой топчик
Но на паре практических кейсов replit у меня довольно слабо себя показал. Слишком сложные задачи пытается брать, в результате ломается. Нужно самому определить уровень сложности и делать step-by-step над replit, тогда в целом работает, но медленно получается.
Для меня это скорее демо "как всё будет в будущем" и классный пример агентского продукта с точки зрения интерфейса.
Но помним, что модели улучшаются, а планирование (ключевая задача здесь) в принципе недавно появились как популярная задача для Llm. Завтра будет лучше.
20.04.202513:47
Beer Vibe Coding
Оказывается, собраться толпой и вайб кодить на проекторе под пивко это потрясающий способ провести вечер!
Собрались вечером и навайбили в replit совместными усилиями вот такую всратую open world гоночную игру с медведями ) Базовую игру replit собрал с одного промпта, что вызвало у всех некоторый шок.
После этого я все выходные пытался её сделать лучше и убил на это несколько часов. Сравнение с результатом пивного вечера показало что стало хуже 🌟 типичный вайб кодинг
Погонять можно тут (десктоп): https://viberacing.replit.app/
Оказывается, собраться толпой и вайб кодить на проекторе под пивко это потрясающий способ провести вечер!
Собрались вечером и навайбили в replit совместными усилиями вот такую всратую open world гоночную игру с медведями ) Базовую игру replit собрал с одного промпта, что вызвало у всех некоторый шок.
После этого я все выходные пытался её сделать лучше и убил на это несколько часов. Сравнение с результатом пивного вечера показало что стало хуже 🌟 типичный вайб кодинг
Погонять можно тут (десктоп): https://viberacing.replit.app/
11.03.202507:14
Рынок активно обсуждает утёкший ценник на AI-сотрудников от OpenAI.
$10k/mo за разработчика
$20k/mo за PhD-level research
Очень дорого, если сравнивать с моделями. Но если сравнивать с людьми, становится лучше: разработчик для компании по миру примерно так и стоит, при этом у него есть обед, work-life balance и весеннее обострение.
Мне очень нравится что OpenAI этим ценником делают заявление: работу AI-работников нужно сравнивать с работой людей. Ребята не размениваются на мнения, ребята показывают как будет выглядеть рынок. Devin за $500/mo уже выглядит дешевкой.
На самом деле, "AI Worker" это другой тип работника и в реальной жизни они скорее будут дополнять людей. На таких воркеров пойдет вся рутинная работа, это такие интеллектуальные 24/7 рабы.
Вопрос, как обычно, получится ли этим агентам давать результат сравнимый с такой стоимостью. Пока что агенты явно не там. Посмотрим что будет через год.
В следующем сезоне ждите: Профессионалы интеллектуального труда устраивают забастовки против AI-агентов
$10k/mo за разработчика
$20k/mo за PhD-level research
Очень дорого, если сравнивать с моделями. Но если сравнивать с людьми, становится лучше: разработчик для компании по миру примерно так и стоит, при этом у него есть обед, work-life balance и весеннее обострение.
Мне очень нравится что OpenAI этим ценником делают заявление: работу AI-работников нужно сравнивать с работой людей. Ребята не размениваются на мнения, ребята показывают как будет выглядеть рынок. Devin за $500/mo уже выглядит дешевкой.
На самом деле, "AI Worker" это другой тип работника и в реальной жизни они скорее будут дополнять людей. На таких воркеров пойдет вся рутинная работа, это такие интеллектуальные 24/7 рабы.
Вопрос, как обычно, получится ли этим агентам давать результат сравнимый с такой стоимостью. Пока что агенты явно не там. Посмотрим что будет через год.
В следующем сезоне ждите: Профессионалы интеллектуального труда устраивают забастовки против AI-агентов
13.02.202507:12
Стартуем на лучшей LLM
Простая мысль при создании llm-based продуктов которую не все понимают.
Сначала стартуете с самой крутой моделью доступной вам, измеряете и добиваетесь качества, и уже потом оптимизируете стоимость / скорость.
Преждевременная оптимизация и раньше была грехом, но сейчас дело в другом.
Новые прорывы лежат в применении интеллекта LLM. Чем лучше эта LLM тем больше вероятность что у вас действительно получится результат.
Начинать с более слабой модели это как пытаться запустить ракету используя 95й бензин.
Так что не стесняемся использовать o1/o3-mini даже если вы список покупок делаете.
Простая мысль при создании llm-based продуктов которую не все понимают.
Сначала стартуете с самой крутой моделью доступной вам, измеряете и добиваетесь качества, и уже потом оптимизируете стоимость / скорость.
Преждевременная оптимизация и раньше была грехом, но сейчас дело в другом.
Новые прорывы лежат в применении интеллекта LLM. Чем лучше эта LLM тем больше вероятность что у вас действительно получится результат.
Начинать с более слабой модели это как пытаться запустить ракету используя 95й бензин.
Так что не стесняемся использовать o1/o3-mini даже если вы список покупок делаете.


17.04.202507:16
You don't clone greatness. You build it 🌟
Perplexity повесили ну очень наглую наружку напротив офиса Яндекса в Белграде 😅 респект за наглость
Perplexity повесили ну очень наглую наружку напротив офиса Яндекса в Белграде 😅 респект за наглость


06.03.202507:27
Яндекс потихоньку отжал уже 67% поисковой доля в России.
Рынок классического поиска довольно удивительный. Качество продукта почти не помогает перетягивать аудиторию. Это война за поиск по-умолчанию на устройстве или в браузере. Людям, к сожалению, не так важно какой у них поиск, если он базово «нормальный».
Гугл потихоньку умирает, так как в привлечение не вкладывается. Напомню, там нет рекламы! Как видим, это не так уж и важно для пользователей.
66% это почти монополия. Это не очень хорошо: стимулов расти продуктам будет ещё меньше. Если посмотреть в прошлое, и Google и Yandex очень много сделали чтобы себя улучшить в своей конкуренции. Раньше у Google была большая команда в Москве, я был у них в офисе.
Часть трафика поиска оттекла в маркетплейсы. Чайники уже в поиске не ищут. Почему-то принято считать что это "смерть поиска", хотя на самом деле это только один из срезов. Когда-нибудь человечество придумает лучшие способы искать информацию для всех категорий, но пока что baseline в виде поиска в-основном побеждает.
Ответ может лежать в новых GPT-like поисках. Я мечтаю что появится аналог Perplexity но для поиска решения твоей задачи, т.е. поиска бизнеса/исполнителя. Сейчас эти задачи решаются ну очень плохо - что поиском, что картами. Тогда есть шансы поколебать классический поиск в важных для него нишах.
Но пока что весь этот GPT/Perplexity/Нейро на рынки поиска не влияет никак - что в мире, что в России.
Рынок классического поиска довольно удивительный. Качество продукта почти не помогает перетягивать аудиторию. Это война за поиск по-умолчанию на устройстве или в браузере. Людям, к сожалению, не так важно какой у них поиск, если он базово «нормальный».
Гугл потихоньку умирает, так как в привлечение не вкладывается. Напомню, там нет рекламы! Как видим, это не так уж и важно для пользователей.
66% это почти монополия. Это не очень хорошо: стимулов расти продуктам будет ещё меньше. Если посмотреть в прошлое, и Google и Yandex очень много сделали чтобы себя улучшить в своей конкуренции. Раньше у Google была большая команда в Москве, я был у них в офисе.
Часть трафика поиска оттекла в маркетплейсы. Чайники уже в поиске не ищут. Почему-то принято считать что это "смерть поиска", хотя на самом деле это только один из срезов. Когда-нибудь человечество придумает лучшие способы искать информацию для всех категорий, но пока что baseline в виде поиска в-основном побеждает.
Ответ может лежать в новых GPT-like поисках. Я мечтаю что появится аналог Perplexity но для поиска решения твоей задачи, т.е. поиска бизнеса/исполнителя. Сейчас эти задачи решаются ну очень плохо - что поиском, что картами. Тогда есть шансы поколебать классический поиск в важных для него нишах.
Но пока что весь этот GPT/Perplexity/Нейро на рынки поиска не влияет никак - что в мире, что в России.


12.02.202511:37
У Anthropic вышел невероятно интересный отчет и вместе с ним целая инициатива Anthropic Economic Index.
Они берут реальные данные использования их claude.ai <strike>LLM API</strike> веб-интерфейса и строят агрегированную статистику поверх. Задача исследования - понять проникновение AI в реальные задачи людей.
Anthropic использует здесь очень правильный подход: смотрят в разрезе задач а не профессий. Каждая профессия это на самом деле комплекс разных задач. Усилять или автоматизировать нужно задачи, а не целиком профессии.
Огромное количество интересных данных и выводов, сравнения с зарплатами и распределением реальных работ. Например, на картинке видно дифф между использованием API и процентом людей в профессии.
Хайлайты:
1. Разработка софта занимает практически треть всех запросов;
2. Сильный перекос в digital работы;
3. 57% запросов это аугментация работы (т.е. "работаю вместе с AI"), 43% это AI полностью делает работу за человека;
4. Есть явный перекос в работы средней стоимости. Малооплачиваемые работы видимо трогать не интересно, а с дорогими профессиями всё сложновато получается.
Очень важно что это не какие-то опросы, а реальная статистика из боевого <strike>API</strike> сервиса. Они даже дают скачать датасет!
Bonus: интересная статья про Anthropic Clio, как они построили внутреннюю систему анализа запросов и как это им помогает
Они берут реальные данные использования их claude.ai <strike>LLM API</strike> веб-интерфейса и строят агрегированную статистику поверх. Задача исследования - понять проникновение AI в реальные задачи людей.
Anthropic использует здесь очень правильный подход: смотрят в разрезе задач а не профессий. Каждая профессия это на самом деле комплекс разных задач. Усилять или автоматизировать нужно задачи, а не целиком профессии.
Огромное количество интересных данных и выводов, сравнения с зарплатами и распределением реальных работ. Например, на картинке видно дифф между использованием API и процентом людей в профессии.
Хайлайты:
1. Разработка софта занимает практически треть всех запросов;
2. Сильный перекос в digital работы;
3. 57% запросов это аугментация работы (т.е. "работаю вместе с AI"), 43% это AI полностью делает работу за человека;
4. Есть явный перекос в работы средней стоимости. Малооплачиваемые работы видимо трогать не интересно, а с дорогими профессиями всё сложновато получается.
Очень важно что это не какие-то опросы, а реальная статистика из боевого <strike>API</strike> сервиса. Они даже дают скачать датасет!
Bonus: интересная статья про Anthropic Clio, как они построили внутреннюю систему анализа запросов и как это им помогает


21.03.202507:33
Вот как я должен выбрать тут модель под свою задачу? )
Одна тупая, другая долго думает. Кто-то ходит в интернет, кто-то нет. Research preview это можно использовать или нет? ) ну и потрясающие mini и mini-high )
И ни одной подсказки!
Самый большой в мире пользовательский AI-продукт продолжает развиваться как демо площадка для моделей.
Perplexity тут молодцы: сделали Auto по-умолчанию которая сама разберется что тебе нужно.
Одна тупая, другая долго думает. Кто-то ходит в интернет, кто-то нет. Research preview это можно использовать или нет? ) ну и потрясающие mini и mini-high )
И ни одной подсказки!
Самый большой в мире пользовательский AI-продукт продолжает развиваться как демо площадка для моделей.
Perplexity тут молодцы: сделали Auto по-умолчанию которая сама разберется что тебе нужно.


14.02.202511:47
А Le Chat хорош 🥐


12.02.202507:07
Vibe coding
Это такой новый способ "писать" код, термин придумал Karpathy вот этим твитом
Представь: ты сидишь откинувшись в кресле, смотришь как агент работает, иногда пишешь ему команды, и просто жмешь accept all 😅
Пишешь туда самую мелкую чушь вроде «перекрась кнопку», наблюдая как вся мощь лучших моделей в мире меняет цвет твоей кнопки.
Bonus points если вы поставили SuperWhisper и делаете это голосом. Тогда даже писать буквы не надо: вбрасываешь ртом команды и агент батрачит.
Народ уже обсуждает “vibe design”, “vibe research” и так далее
Я уже проникся на 100%, зовите меня вайб кодер 🌟
Идеально вечером с чаем или пивком, очень рекомендую )
Это такой новый способ "писать" код, термин придумал Karpathy вот этим твитом
Представь: ты сидишь откинувшись в кресле, смотришь как агент работает, иногда пишешь ему команды, и просто жмешь accept all 😅
Пишешь туда самую мелкую чушь вроде «перекрась кнопку», наблюдая как вся мощь лучших моделей в мире меняет цвет твоей кнопки.
Bonus points если вы поставили SuperWhisper и делаете это голосом. Тогда даже писать буквы не надо: вбрасываешь ртом команды и агент батрачит.
Народ уже обсуждает “vibe design”, “vibe research” и так далее
Я уже проникся на 100%, зовите меня вайб кодер 🌟
Идеально вечером с чаем или пивком, очень рекомендую )
Shown 1 - 13 of 13
Log in to unlock more functionality.