07.05.202517:06
Тут короче знакомые попросили рассказать про их опенсорсный проектик.
Чтобы строить успешный продукт с LLM нужно уметь вовремя говорить “i dont want to talk about it” - для этого используются гардрейлы, и вот, ребята из whitecircle.ai cделали первый полноценный бенчмарк для таких моделей. В своем бенче они сравнивают качество защиты на 17 категориях контента, в том числе смотрят чтобы модели не отклоняли безопасные вопросы, но при этом не были подверженны jailbreak_ам.
👉 Подробнее тут и в твиттере
Чтобы строить успешный продукт с LLM нужно уметь вовремя говорить “i dont want to talk about it” - для этого используются гардрейлы, и вот, ребята из whitecircle.ai cделали первый полноценный бенчмарк для таких моделей. В своем бенче они сравнивают качество защиты на 17 категориях контента, в том числе смотрят чтобы модели не отклоняли безопасные вопросы, но при этом не были подверженны jailbreak_ам.
👉 Подробнее тут и в твиттере
30.04.202520:48
Это конечно ор 😁
29.04.202515:36
Поддержите друганов
26.04.202504:07
⚡️ Новый выпуск AIA Podcast уже онлайн!
Сегодня ныряем в мир ИИ: обсуждаем горячие покупки OpenAI (Windsurf, собственная соцсеть, Codex в опенсорсе), новые модели GPT-4.1 и o3, амбициозные планы Anthropic по интерпретируемости и сознанию ИИ, свежие релизы от Google (Gemini 2.5 Flash) и Nvidia (производство ИИ-чипов в США), тестируем обновления в Grok и новых ассистентов от JetBrains и Docker, кайфуем от музыкальных возможностей DeepMind (Lyria 2) и видеоаватаров Character.AI, следим за революцией в кино с Runway и Fabula, изучаем первого в мире опенсорс-агента общего назначения Suna и погружаемся в законотворческие ИИ-эксперименты в ОАЭ.
Ну а в финале — мощнейший полный разбор со СПОЙЛЕРАМИ всех серий нового сезона «Чёрного зеркала», ведь каждая из них так или иначе про ИИ!
👉 YouTube: https://youtu.be/FihjelyaoEE
👉 Apple Podcasts: https://bit.ly/aia-apple
👉 Spotify: https://bit.ly/aia-spotify
👉 Скачать mp3: https://aia.simplecast.com/episodes/109
Сегодня ныряем в мир ИИ: обсуждаем горячие покупки OpenAI (Windsurf, собственная соцсеть, Codex в опенсорсе), новые модели GPT-4.1 и o3, амбициозные планы Anthropic по интерпретируемости и сознанию ИИ, свежие релизы от Google (Gemini 2.5 Flash) и Nvidia (производство ИИ-чипов в США), тестируем обновления в Grok и новых ассистентов от JetBrains и Docker, кайфуем от музыкальных возможностей DeepMind (Lyria 2) и видеоаватаров Character.AI, следим за революцией в кино с Runway и Fabula, изучаем первого в мире опенсорс-агента общего назначения Suna и погружаемся в законотворческие ИИ-эксперименты в ОАЭ.
Ну а в финале — мощнейший полный разбор со СПОЙЛЕРАМИ всех серий нового сезона «Чёрного зеркала», ведь каждая из них так или иначе про ИИ!
👉 YouTube: https://youtu.be/FihjelyaoEE
👉 Apple Podcasts: https://bit.ly/aia-apple
👉 Spotify: https://bit.ly/aia-spotify
👉 Скачать mp3: https://aia.simplecast.com/episodes/109
24.04.202501:41
Очень крутое путешествие в замедление времени: https://youtu.be/Z2lXrqmBkP0
Никогда раньше не слушал Игоря Иванова, теперь буду 😊
Никогда раньше не слушал Игоря Иванова, теперь буду 😊
16.04.202512:48
Ну, теперь заживём: JetBrains наконец-то релизнули своего агентного кодописателя Junie: https://blog.jetbrains.com/blog/2025/04/16/jetbrains-ides-go-ai/
Если кто-то ещё не в курсе, это агентный чат, который умеет писать код под ключ и вызывать инструменты на уровне Cursor, а местами даже лучше. Я делал целый двухчасовой обзор для клуба, если что.
Инструмент распространяется по единой подписке JetBrains AI Pro (наконец-то она будет стоить своих денег) и доступен в IntelliJ IDEA Ultimate, PyCharm Professional, WebStorm и GoLand. PhpStorm, RustRover и RubyMine обещают добавить в скором времени.
Также в подписку добавили free-уровень, дающий доступ к неограниченным локальным однострочным кодкомплишенам (было и раньше) и возможность подключать локальные модели в чат AI Assistant (через LMStudio и Ollama). Использование Junie и AI Assistant в этой подписке credit-based.
И ещё из приятного: теперь вместе со стандартными подписками All Products Pack и dotUltimate вам в придачу дадут дополнительно подписку JetBrains AI Pro.
UPD: А ещё, для AI Assistant завезли поддержку MCP. Короче, подарков как на Новый Год!
Если кто-то ещё не в курсе, это агентный чат, который умеет писать код под ключ и вызывать инструменты на уровне Cursor, а местами даже лучше. Я делал целый двухчасовой обзор для клуба, если что.
Инструмент распространяется по единой подписке JetBrains AI Pro (наконец-то она будет стоить своих денег) и доступен в IntelliJ IDEA Ultimate, PyCharm Professional, WebStorm и GoLand. PhpStorm, RustRover и RubyMine обещают добавить в скором времени.
Также в подписку добавили free-уровень, дающий доступ к неограниченным локальным однострочным кодкомплишенам (было и раньше) и возможность подключать локальные модели в чат AI Assistant (через LMStudio и Ollama). Использование Junie и AI Assistant в этой подписке credit-based.
И ещё из приятного: теперь вместе со стандартными подписками All Products Pack и dotUltimate вам в придачу дадут дополнительно подписку JetBrains AI Pro.
UPD: А ещё, для AI Assistant завезли поддержку MCP. Короче, подарков как на Новый Год!
07.05.202512:42
В прошедшие выходные я посетил SX TECH EU 2025. Делюсь знаниями, впечатлениями и мыслями по этому поводу.
https://medium.com/@witness-of-singularity/sx-tech-eu-2025-821fd19e76f8
Альтернативная ссылка:
https://scribe.rip/821fd19e76f8
https://medium.com/@witness-of-singularity/sx-tech-eu-2025-821fd19e76f8
Альтернативная ссылка:
https://scribe.rip/821fd19e76f8
Repost qilingan:
Алексей Цыкунов | Про AI и не только



30.04.202510:46
Советую посмотреть апдейт от Байрама о том, что произошло в AI-индустрии на апрель 2025 года.
Там про агентов и sdk для них, mcp, новые модели, AI 2027, ну и как всегда predictions на этот год.
Если что, вот ссылка на презентацию.
Там про агентов и sdk для них, mcp, новые модели, AI 2027, ну и как всегда predictions на этот год.
Если что, вот ссылка на презентацию.


29.04.202515:36
Ребят, мы разместили CodeAlive MCP в cursor.directory. Будет круто, если поддержете лайками.
Напомню, что CodeAlive MCP позволяет законнектить всю кодовую базу (или несколько кодовых баз) к Cursor и др. тулзами и позволяет получать глубокие ответы по коду всего проеРебят, мы разместили CodeAlive MCP в cursor.directory. Будет круто, если поддержете лайками.кта и подгружать нужный контекст а) быстрее б) дешевле.
Вот тут разместились: https://cursor.directory/board
Напомню, что CodeAlive MCP позволяет законнектить всю кодовую базу (или несколько кодовых баз) к Cursor и др. тулзами и позволяет получать глубокие ответы по коду всего проеРебят, мы разместили CodeAlive MCP в cursor.directory. Будет круто, если поддержете лайками.кта и подгружать нужный контекст а) быстрее б) дешевле.
Вот тут разместились: https://cursor.directory/board
25.04.202513:06
Trae IDE получил большое обновление
- Новый UI
- Билдер кастомных агентов
- Веб-поиск и индексация!! документации (в нормальном виде была только в Cursor)
- Поддержка рулов для проекта
- Поддержка MCP!!!
- Добавили OpenRouter как провайдер моделей.
Ну что, официально теперь это ТОП-3 AI-first IDE. Да ещё и бесплатная (в обмен на ваши данных во славу КПК, видимо)
- Новый UI
- Билдер кастомных агентов
- Веб-поиск и индексация!! документации (в нормальном виде была только в Cursor)
- Поддержка рулов для проекта
- Поддержка MCP!!!
- Добавили OpenRouter как провайдер моделей.
Ну что, официально теперь это ТОП-3 AI-first IDE. Да ещё и бесплатная (в обмен на ваши данных во славу КПК, видимо)
22.04.202517:14
https://www.youtube.com/watch?v=hAZjulh8H1k - давно не смотрел парней. Залетайте и вы :)


15.04.202521:46
Repost qilingan:
Эволюция Кода / Анонсы



03.05.202502:09
📰 ТОП-6 новости из 49го дайджеста новостей ИИ в программировании
🔸 Qwen 3 от Alibaba — новая эра опенсорс моделей. Семейство моделей от 0.5B до 235B, включая мощную 30B MoE (смесь экспертов), превосходит Qwen 2.5 Coder по скорости и качеству кода. Открыто, гибко и работает даже на CPU.
🔸 Поддержка MCP и локальных моделей в Docker. Установка через CLI и Desktop, репозиторий моделей "ai", плагин MCP-toolkit, а также ИИ-помощник Gordon. Всё для удобной локальной разработки с ИИ.
🔸 Microsoft Phi-4 Reasoning — продвинутые компактные модели. Новинки на 14B и 3.6B параметров с 32k токенов контекста. Обучены на свежих данных до апреля 2025, хорошо рассуждают и пригодны для edge-устройств.
🔸 Trae IDE — инструмент ИИ-разработчика становится мощнее. Новый UI, билдер агентов, веб-поиск, MCP, маркетплейс серверов, OpenRouter. Лимиты всё ещё есть, но потенциал огромен.
🔸 CodeAlive получил API и MCP-сервер. Легко интегрируется в IDE. Позволяет использовать RAG-подход к коду прямо в ваших инструментах.
🔸 Windsurf расширил возможности бесплатного плана. Теперь доступны 25 промпт-кредитов в месяц, один деплой в день, безлимит на код-комплишны и запросы к агентам — отличная площадка для прототипов.
👉 Читать и слушать полный дайджест на 32 новости (у нас такие каждую неделю, кстати!)
#aidigest
🔸 Qwen 3 от Alibaba — новая эра опенсорс моделей. Семейство моделей от 0.5B до 235B, включая мощную 30B MoE (смесь экспертов), превосходит Qwen 2.5 Coder по скорости и качеству кода. Открыто, гибко и работает даже на CPU.
🔸 Поддержка MCP и локальных моделей в Docker. Установка через CLI и Desktop, репозиторий моделей "ai", плагин MCP-toolkit, а также ИИ-помощник Gordon. Всё для удобной локальной разработки с ИИ.
🔸 Microsoft Phi-4 Reasoning — продвинутые компактные модели. Новинки на 14B и 3.6B параметров с 32k токенов контекста. Обучены на свежих данных до апреля 2025, хорошо рассуждают и пригодны для edge-устройств.
🔸 Trae IDE — инструмент ИИ-разработчика становится мощнее. Новый UI, билдер агентов, веб-поиск, MCP, маркетплейс серверов, OpenRouter. Лимиты всё ещё есть, но потенциал огромен.
🔸 CodeAlive получил API и MCP-сервер. Легко интегрируется в IDE. Позволяет использовать RAG-подход к коду прямо в ваших инструментах.
🔸 Windsurf расширил возможности бесплатного плана. Теперь доступны 25 промпт-кредитов в месяц, один деплой в день, безлимит на код-комплишны и запросы к агентам — отличная площадка для прототипов.
👉 Читать и слушать полный дайджест на 32 новости (у нас такие каждую неделю, кстати!)
#aidigest
29.04.202523:34
https://youtu.be/rYXeQbTuVl0
Марк тут говорит, что через 18 месяцев большинство кода будет писать ИИ. Вернёмся сюда в комменты через полтора года 😎
UPD: очечи зачёт. Покупать пока не буду, но они всё круче и круче становятся
Марк тут говорит, что через 18 месяцев большинство кода будет писать ИИ. Вернёмся сюда в комменты через полтора года 😎
UPD: очечи зачёт. Покупать пока не буду, но они всё круче и круче становятся


28.04.202522:53
Браво, Qwen 3 30B MoE (gguf, 8bit) прошла тест на написание приложения про отскакивающий желтый мяч. Первая из запущенных на моем ноуте моделей, которая смогла это сделать!
4 минуты думанья, скорость аутпута восхитительная - 30 токенов в секунду, в 3 раза быстрее предыдущего любимца Qwen 2.5 Coder 27B 😊
Промпт: "
4 минуты думанья, скорость аутпута восхитительная - 30 токенов в секунду, в 3 раза быстрее предыдущего любимца Qwen 2.5 Coder 27B 😊
Промпт: "
write a code for a bouncing yellow ball within a square, make sure to handle collision detection properly. make the square slowly rotate. implement it in javascript. make sure ball stays within the square and bounced correctly by physics laws
"25.04.202512:44
https://zencoder.ai/blog/zencoder-acquires-machinet - приятно, когда два хороших проекта объединяются😊
Зенкодеров поздравляю с хорошей покупкой, а Machinet ещё больших достижений в составе новой компании!
Зенкодеров поздравляю с хорошей покупкой, а Machinet ещё больших достижений в составе новой компании!
Repost qilingan:
Эволюция Кода / Анонсы

22.04.202511:36
📰 ТОП-4 новости из 48го дайджеста новостей ИИ в программировании
🔸 OpenAI представила reasoning-модели o3 и o4-mini: o3 — теперь самая мощная модель OpenAI, обходит даже pro-режим o1. Обе модели поддерживают 200k токенов контекста и могут "думать" изображениями, открывая новые задачи.
🔸 Google показала Gemma 3 QAT: оптимизированные модели Gemma 3 теперь занимают в 3–4 раза меньше памяти при сохранении качества. Доступны даже на обычных потребительских устройствах благодаря Quantization-Aware Training.
🔸 OpenAI выложила Codex в open source: CLI-инструмент для программирования в духе aider и claude code, но проще в установке и использовании. Работает локально, легко встраивается в dev-процессы.
🔸 Grok добавил Canvas с поддержкой Python и Bash: полноценное IDE-пространство прямо в браузере. Можно запускать код в разных языках, есть Google Drive-интеграция. Новый удобный инструмент для быстрой работы с ИИ.
👉 Полный дайджест (текст и аудио)
#aidigest
🔸 OpenAI представила reasoning-модели o3 и o4-mini: o3 — теперь самая мощная модель OpenAI, обходит даже pro-режим o1. Обе модели поддерживают 200k токенов контекста и могут "думать" изображениями, открывая новые задачи.
🔸 Google показала Gemma 3 QAT: оптимизированные модели Gemma 3 теперь занимают в 3–4 раза меньше памяти при сохранении качества. Доступны даже на обычных потребительских устройствах благодаря Quantization-Aware Training.
🔸 OpenAI выложила Codex в open source: CLI-инструмент для программирования в духе aider и claude code, но проще в установке и использовании. Работает локально, легко встраивается в dev-процессы.
🔸 Grok добавил Canvas с поддержкой Python и Bash: полноценное IDE-пространство прямо в браузере. Можно запускать код в разных языках, есть Google Drive-интеграция. Новый удобный инструмент для быстрой работы с ИИ.
👉 Полный дайджест (текст и аудио)
#aidigest
Repost qilingan:
partially unsupervised

15.04.202512:48
Про вайбкодинг
Я сжег уже больше 100М токенов в Claude Code, потому имею моральное право поделиться опытом про вайбкодинг.
1. Вайбкодинг действительно очень сильно ускоряет решение большей части задач. Нюанс, как обычно, в том, чтобы вовремя заметить те 20% кода, где его применять не надо.
Не надо применять:
- нетривиальный алгоритмический код (сломается в корнеркейсе - задолбаешься дебажить);
- свежие библиотеки (даже если заставлять читать документацию из интернета, в среднем получается плохо);
- метапрограммирование, написание фреймворков, дизайн API между компонентами;
- security-sensitive задачи.
Надо применять:
- +1 задачи (посмотри, как сделано здесь, и сделай по аналогии);
- все некритичные задачи в незнакомом домене (набросать фронтенд);
- типичный IO layer (в основном хендлеры);
- задачи, в которых вся “сложность” - знать 100500 команд и флагов API (например, aws cli).
2. Вайбкодинг несет неочевидный оверхед в сеньорной команде. Раньше если человек видел код и не понимал его с первой попытки, применялась презумпция качественного кода: если оно написано и закоммичено умным человеком, то, наверное, в этом смысл, надо перечитать и вдуматься. Сейчас иногда приходится переспрашивать “в этом есть какой-то нетривиальный замысел или ты просто нагенерил говна?”
3. Всегда нужно останавливаться и рефакторить - что-то руками, что-то и вайбкодом (“остановись и посмотри, что ты нахуевертил”). Вайбкодинг приводит к куче лишних сущностей, надо вовремя подрезать.
4. Если диалог идет не в ту сторону с нескольких итераций, нужно всегда начинать сначала, его уже не спасти. Если несколько попыткок стабильно скатываются в дичь, несмотря на добавление деталей в изначальный промпт, см. пункт 1.
5. Главный кайф не только в кодогенерации, а именно в активном агентском режиме - кидаешь промпт типа “посмотри на CI, почему упал такой-то PR и найди проблему” или “я задеплоил сервис этим терраформом, посмотри все логи и разберись, почему хелсчеки не проходят”.
6. Для эффективной работы нужно дописывать правила в
Делитесь своими лучшими практиками в комментах! Просто ворчать, что вайбкодинг - херня для кретинов, можно тоже там.
Я сжег уже больше 100М токенов в Claude Code, потому имею моральное право поделиться опытом про вайбкодинг.
1. Вайбкодинг действительно очень сильно ускоряет решение большей части задач. Нюанс, как обычно, в том, чтобы вовремя заметить те 20% кода, где его применять не надо.
Не надо применять:
- нетривиальный алгоритмический код (сломается в корнеркейсе - задолбаешься дебажить);
- свежие библиотеки (даже если заставлять читать документацию из интернета, в среднем получается плохо);
- метапрограммирование, написание фреймворков, дизайн API между компонентами;
- security-sensitive задачи.
Надо применять:
- +1 задачи (посмотри, как сделано здесь, и сделай по аналогии);
- все некритичные задачи в незнакомом домене (набросать фронтенд);
- типичный IO layer (в основном хендлеры);
- задачи, в которых вся “сложность” - знать 100500 команд и флагов API (например, aws cli).
2. Вайбкодинг несет неочевидный оверхед в сеньорной команде. Раньше если человек видел код и не понимал его с первой попытки, применялась презумпция качественного кода: если оно написано и закоммичено умным человеком, то, наверное, в этом смысл, надо перечитать и вдуматься. Сейчас иногда приходится переспрашивать “в этом есть какой-то нетривиальный замысел или ты просто нагенерил говна?”
3. Всегда нужно останавливаться и рефакторить - что-то руками, что-то и вайбкодом (“остановись и посмотри, что ты нахуевертил”). Вайбкодинг приводит к куче лишних сущностей, надо вовремя подрезать.
4. Если диалог идет не в ту сторону с нескольких итераций, нужно всегда начинать сначала, его уже не спасти. Если несколько попыткок стабильно скатываются в дичь, несмотря на добавление деталей в изначальный промпт, см. пункт 1.
5. Главный кайф не только в кодогенерации, а именно в активном агентском режиме - кидаешь промпт типа “посмотри на CI, почему упал такой-то PR и найди проблему” или “я задеплоил сервис этим терраформом, посмотри все логи и разберись, почему хелсчеки не проходят”.
6. Для эффективной работы нужно дописывать правила в
CLAUDE.md
(.cursorrules
и так далее), подключать релевантные MCP и в целом анализировать, где оно косячит. Например, вот кусок моего глобал конфига: Python style guide:
Делитесь своими лучшими практиками в комментах! Просто ворчать, что вайбкодинг - херня для кретинов, можно тоже там.
30.04.202521:51
Слушайте, а вот у нас же явно кто-то в Мета работает. Вам не тошно было смотреть, как Цук говорит, что через полтора года ИИ будет пилить 99% кода, и что это будет "веселое" время? Или у вас там действительно всё гуд с переквалификацией в ИИ-суперэффективных-разработчиков?
Ибо верится с трудом, я вижу по клиентам как это происходит, и всё ооочень медленно для таких прогнозов. В том смысле медленно, что ИИ то может и будет что-то писать, но всех всех всех разработчиков 101% не переквалифицируют (нежелание учиться, слабые программы обучения и общий уровень пофигистического отношения к ИИ-ассистентам на уровне тех менеджмента пока что никуда не деваются) и будут лейофы, прям жёсткие, может даже пожеще чем в ковид (спокойно, речь про крупняк, у средних компаний кажется всё ещё долго будет трансформироваться, имхо).
Сабж https://youtu.be/rYXeQbTuVl0
Ибо верится с трудом, я вижу по клиентам как это происходит, и всё ооочень медленно для таких прогнозов. В том смысле медленно, что ИИ то может и будет что-то писать, но всех всех всех разработчиков 101% не переквалифицируют (нежелание учиться, слабые программы обучения и общий уровень пофигистического отношения к ИИ-ассистентам на уровне тех менеджмента пока что никуда не деваются) и будут лейофы, прям жёсткие, может даже пожеще чем в ковид (спокойно, речь про крупняк, у средних компаний кажется всё ещё долго будет трансформироваться, имхо).
Сабж https://youtu.be/rYXeQbTuVl0
29.04.202519:44
NotebookLM добавили 50 языков, в том числе для генерации аудио-подкастов. Имхо, результат очень правдоподобный и крутой (хотя и за надто спокойный).
В примерах саммаризация на русском и украинском к статье https://knightcolumbia.org/content/ai-as-normal-technology
В примерах саммаризация на русском и украинском к статье https://knightcolumbia.org/content/ai-as-normal-technology
28.04.202521:32
Дождались: https://qwenlm.github.io/blog/qwen3/
Самая мощная опенсорсная моделька для ваших ноутов.
Самая мощная опенсорсная моделька для ваших ноутов.


24.04.202516:27
📚 В клубе "Эволюция Кода" состоялся трехчасовой созвон с подробным разбором резонансной статьи про развитие ИИ в ближайшие пять лет - "AI 2027" (https://ai-2027.com)
Посмотреть и прослушать запись можно в клубе, ссылка на вступление, залетайте: https://web.tribute.tg/l/ge
Посмотреть и прослушать запись можно в клубе, ссылка на вступление, залетайте: https://web.tribute.tg/l/ge
17.04.202500:25
За всеми этими релизами очередных моделей, не упустите ещё один инструмент для кодогенерации, от OpenAI и опенсорсный (ого) - Codex
https://www.youtube.com/watch?v=FUq9qRwrDrI
Похоже на aider или Claude Code,но попроще.
https://www.youtube.com/watch?v=FUq9qRwrDrI
Похоже на aider или Claude Code,но попроще.
15.04.202501:15
UPD: тот gpt-4.1, что завезли в Виндсерф, работает в разы хуже думающего соннета 3.7. Надеюсь там под капотом mini, и полная версия будет работать хотя бы на уровне соннета...
Мде, старый конь, как известно, чего-то там не портит.
UPD2: опении совсем подурели с неймингвми. Выкатили 4.1 и задеприкейтили 4.5, мол она старше и слабее... Видимо считают они до сих пор при помощи gpt 3.5 (4.1 > 4.5 и всё в этом духе)
Мде, старый конь, как известно, чего-то там не портит.
UPD2: опении совсем подурели с неймингвми. Выкатили 4.1 и задеприкейтили 4.5, мол она старше и слабее... Видимо считают они до сих пор при помощи gpt 3.5 (4.1 > 4.5 и всё в этом духе)
Ko'rsatilgan 1 - 24 dan 101
Ko'proq funksiyalarni ochish uchun tizimga kiring.