

25.01.202508:15
🔺 Делаем свою Perplexity
Perplexity — это поисковая система, которая обрабатывает выдачу популярными моделями (в Pro версии их можно выбирать, это GPT-4o/o1, Claude и пара других) с удобным интерфейсом и списком источников.
Есть разные режимы, типа поиска видео или режим Writing, когда веб-поиск отключен и можно работать как с обычной языковой моделью.
Компания привлекла полмиллиарда долларов инвестиций в декабре и на днях запустила новый API.
🔸 Называется новый сервис Sonar API, есть две версии — sonar и sonar-pro. Стоит $1/$1 за 1M input/output токенов у базовой модели и $3/$15 у Pro.
🔸 Сами поисковые запросы, которые происходят внутри, тоже стоят денег, $5 за 1000 запросов. Базовая модель делает только 1 такой поиск, Pro может делать несколько.
🔸 В зависимости от расходов есть разные уровни использования (tiers), на них появляются дополнительные фичи, типа фильтров по доменам для поиска.
Так вот, поигрался немного с этим API (можете попробовать через playground), работает достаточно стабильно, находит данные по актуальным событиям и людям.
Ссылки на источники тоже выдает. То есть, чтобы самому сделать подобный сервис, по сути хватит одного такого API (и денег).
В целом так можно сделать и по частям — найти поисковое API типа Bing в Azure или DuckDuckGo, попарсить найденные сайты, подложить в контекст и сходить в следующее API. Не так сложно, но будет больше работы по поддержке, а тут один вызов — и готово.
По-моему, search API у OpenAI и других сервисов пока нет (может, вы где-то видели подобное API?).
Upd. Спасибо за ссылки!
Perplexity — это поисковая система, которая обрабатывает выдачу популярными моделями (в Pro версии их можно выбирать, это GPT-4o/o1, Claude и пара других) с удобным интерфейсом и списком источников.
Есть разные режимы, типа поиска видео или режим Writing, когда веб-поиск отключен и можно работать как с обычной языковой моделью.
Компания привлекла полмиллиарда долларов инвестиций в декабре и на днях запустила новый API.
🔸 Называется новый сервис Sonar API, есть две версии — sonar и sonar-pro. Стоит $1/$1 за 1M input/output токенов у базовой модели и $3/$15 у Pro.
🔸 Сами поисковые запросы, которые происходят внутри, тоже стоят денег, $5 за 1000 запросов. Базовая модель делает только 1 такой поиск, Pro может делать несколько.
🔸 В зависимости от расходов есть разные уровни использования (tiers), на них появляются дополнительные фичи, типа фильтров по доменам для поиска.
Так вот, поигрался немного с этим API (можете попробовать через playground), работает достаточно стабильно, находит данные по актуальным событиям и людям.
Ссылки на источники тоже выдает. То есть, чтобы самому сделать подобный сервис, по сути хватит одного такого API (и денег).
В целом так можно сделать и по частям — найти поисковое API типа Bing в Azure или DuckDuckGo, попарсить найденные сайты, подложить в контекст и сходить в следующее API. Не так сложно, но будет больше работы по поддержке, а тут один вызов — и готово.
По-моему, search API у OpenAI и других сервисов пока нет (может, вы где-то видели подобное API?).
Upd. Спасибо за ссылки!
12.01.202516:18
Поигрался с kling'ом
Пора бы уже сделать кому-то удобный сервис по генерации множества сцен с консистентными персонажами и связыванием их в один ролик. По отдельности вроде понятно как, но вот прям лень возиться.
Пора бы уже сделать кому-то удобный сервис по генерации множества сцен с консистентными персонажами и связыванием их в один ролик. По отдельности вроде понятно как, но вот прям лень возиться.
03.01.202515:13
🔺 Осваиваем FLUX, LoRA и ComfyUI
Написал заметку про то, как дообучать модель FLUX на небольшом количестве картинок, как настраивать ComfyUI и работать в нем.
🔸 Можно обучать локально, если есть видеокарта дома. Можно арендовать сервер с картой на полчаса. Можно обучить и генерировать на платформе типа fal.ai.
🔸 По-умолчанию LoRA получается примерно на 30 Мб, а на различных сервисах около 130 Мб и работает получше. Можно поменять ранги в скриптах обучения, чтобы увеличить размер. Про это тоже написал.
🔸 Подходит, само собой, не только для лиц, а для чего угодно. Можно переносить стили с ваших картинок или обучать на какие-то специфические вещи.
👉 https://habr.com/ru/companies/ods/articles/871256/
Написал заметку про то, как дообучать модель FLUX на небольшом количестве картинок, как настраивать ComfyUI и работать в нем.
🔸 Можно обучать локально, если есть видеокарта дома. Можно арендовать сервер с картой на полчаса. Можно обучить и генерировать на платформе типа fal.ai.
🔸 По-умолчанию LoRA получается примерно на 30 Мб, а на различных сервисах около 130 Мб и работает получше. Можно поменять ранги в скриптах обучения, чтобы увеличить размер. Про это тоже написал.
🔸 Подходит, само собой, не только для лиц, а для чего угодно. Можно переносить стили с ваших картинок или обучать на какие-то специфические вещи.
👉 https://habr.com/ru/companies/ods/articles/871256/
19.11.202414:07
Тут коллеги намекают, что есть же официальный клиент, а вы про него не знаете. Давайте исправлять.
У него и функционал побогаче (есть потоковая передача токенов, например, и работа с функциями), и имя погигачатистей.
👉 GitHub (код и докуменатция)
Upd. Друзья, ключ я не забыл удалить, это мой. Пользуйтесь, пока там есть баланс.
У него и функционал побогаче (есть потоковая передача токенов, например, и работа с функциями), и имя погигачатистей.
#pip install gigachat
👉 GitHub (код и докуменатция)
Upd. Друзья, ключ я не забыл удалить, это мой. Пользуйтесь, пока там есть баланс.


02.11.202410:28
Друзья, у меня в очередной раз случился день рождения. Последний раз такое происходило примерно с год назад, поэтому давайте познакомимся.
Меня зовут Сергей. Работаю программистом, хотя мог бы, наверное, стать переводчиком, музыкантом или спортсменом, если бы был поумнее и посильнее.
Часто трудно выбрать какое-то одно увлечение и это отражается в хобби, которые никакой конкретной цели не преследуют. Это и языки с музыкой, и спорт (благодаря работе подсел последние полтора года на теннис) с книжками, и другие бесполезные вещи.
На работе в Сбере занимаемся с коллегами исследованиями языковых моделей и обучаем GigaChat. Только что дописали статью на Хабр про MAX, в котором я тоже поучаствовал, сделав для него токенизатор.
На канале мы с вами общаемся в основном на темы, связанные с ИИ, машинным обучением и проектами типа Lingtrain'а. Статей выходит огромное количество, поэтому я делаю инструмент с автообзорами (тг тоже будет), а в канале буду писать больше про практические вещи и изредка про личные. Можете его бустануть.
👉 А чем занимаешься ты? О чем мечтаешь? Полететь к звёздам или выспаться?
Меня зовут Сергей. Работаю программистом, хотя мог бы, наверное, стать переводчиком, музыкантом или спортсменом, если бы был поумнее и посильнее.
Часто трудно выбрать какое-то одно увлечение и это отражается в хобби, которые никакой конкретной цели не преследуют. Это и языки с музыкой, и спорт (благодаря работе подсел последние полтора года на теннис) с книжками, и другие бесполезные вещи.
На работе в Сбере занимаемся с коллегами исследованиями языковых моделей и обучаем GigaChat. Только что дописали статью на Хабр про MAX, в котором я тоже поучаствовал, сделав для него токенизатор.
На канале мы с вами общаемся в основном на темы, связанные с ИИ, машинным обучением и проектами типа Lingtrain'а. Статей выходит огромное количество, поэтому я делаю инструмент с автообзорами (тг тоже будет), а в канале буду писать больше про практические вещи и изредка про личные. Можете его бустануть.
👉 А чем занимаешься ты? О чем мечтаешь? Полететь к звёздам или выспаться?


24.01.202515:07
#работаиздома
Размышляю над проблемами ризонинга и инвестициями в AI пока человек сидит за компьютером.
Размышляю над проблемами ризонинга и инвестициями в AI пока человек сидит за компьютером.
20.01.202507:03
На together.ai появилась бесплатная Llama 3.3 70B по API.
🔸 На Free tier'е у них 60 запросов в минуту/60k токенов. Если добавить карту, то будет 600/180k.
🔸 Работает без VPN и мобильных, совместима с OpenAI клиентом. Можете встроить в свой пет-проектик.
https://api.together.ai/models/meta-llama/Llama-3.3-70B-Instruct-Turbo-Free
🔸 На Free tier'е у них 60 запросов в минуту/60k токенов. Если добавить карту, то будет 600/180k.
🔸 Работает без VPN и мобильных, совместима с OpenAI клиентом. Можете встроить в свой пет-проектик.
https://api.together.ai/models/meta-llama/Llama-3.3-70B-Instruct-Turbo-Free
import os
11.01.202510:14
Выложил несколько LoRA моделек с классиками.
https://habr.com/ru/articles/872926/
https://habr.com/ru/articles/872926/
Медиа контентке
қол жеткізе алмадық
қол жеткізе алмадық
31.12.202411:17
🔺 Минутка статистики за 2024 год
Всем спасибо за репосты, идеи и комментарии!
Всем спасибо за репосты, идеи и комментарии!
Медиа контентке
қол жеткізе алмадық
қол жеткізе алмадық
19.11.202410:46
🔺 GigaChat MAX в API
Друзья, последняя версия модели стала доступна по API. Можно тестировать.
🔸 Для удобства накидал простенький клиент (закинул на pypi):
🔸 Чтобы поиграться, вот вам мой ключик, там осталось 800k токенов, можно потратить. Можно попробовать свои систем-промпты, чего через UI не сделать. Если заметите что-то интересное, то пишите.
Ключ: N2RlZmM4MDAtMWI4Ny00YmZjLWIxZjgtYTAwYjI1YmNhZTUwOjFmMjhiZmIzLTFlYTktNDQ2Zi05ZDQ5LWZmMWYyNmVhMjllOQ==
👉 Официальный клиент можно найти тут.
Друзья, последняя версия модели стала доступна по API. Можно тестировать.
🔸 Для удобства накидал простенький клиент (закинул на pypi):
#pip install gigadoom
🔸 Чтобы поиграться, вот вам мой ключик, там осталось 800k токенов, можно потратить. Можно попробовать свои систем-промпты, чего через UI не сделать. Если заметите что-то интересное, то пишите.
Ключ: N2RlZmM4MDAtMWI4Ny00YmZjLWIxZjgtYTAwYjI1YmNhZTUwOjFmMjhiZmIzLTFlYTktNDQ2Zi05ZDQ5LWZmMWYyNmVhMjllOQ==
👉 Официальный клиент можно найти тут.
01.11.202414:58
Вечерний выпуск подкаста Радио-D
Рецепт: Инструкция от холодильника Бирюса, Claude, ElevenLabs, "унца" из Радио-Т
Долго подбирал голоса на ElevenLabs, равнозначный женский так и не настроил. А мужской прям отлично слушается.
Рецепт: Инструкция от холодильника Бирюса, Claude, ElevenLabs, "унца" из Радио-Т
Долго подбирал голоса на ElevenLabs, равнозначный женский так и не настроил. А мужской прям отлично слушается.


23.01.202506:34
🔺 DeepSeek-R1 и DeepSeek-R1-Zero
Как было сказано ранее, модели от китайских исследователей выложены в открытый доступ и показывают результаты на уровне o1.
🔸 Например, в отчете пишут, что модель пробивает рейтинг в 2000 на Codeforces (хорошие соревнования по программированию с довольно сложными задачками), это лучше 96% участников.
🔸 Локальный запуск: запустить эти модели будет непросто из-за их размера, поэтому авторы сделали ряд моделей поменьше, используя дистилляцию. От 1.5B до 70B.
🔸 Попробовать: полная R1 доступна на официальном сайте в режиме DeepThink.
🔸 Приложение: мобильное приложение работает бесплатно, ссылки есть тут.
🔸 Мини-обзор: https://hfday.ru/u/2501.12948.html
Как было сказано ранее, модели от китайских исследователей выложены в открытый доступ и показывают результаты на уровне o1.
🔸 Например, в отчете пишут, что модель пробивает рейтинг в 2000 на Codeforces (хорошие соревнования по программированию с довольно сложными задачками), это лучше 96% участников.
🔸 Локальный запуск: запустить эти модели будет непросто из-за их размера, поэтому авторы сделали ряд моделей поменьше, используя дистилляцию. От 1.5B до 70B.
🔸 Попробовать: полная R1 доступна на официальном сайте в режиме DeepThink.
🔸 Приложение: мобильное приложение работает бесплатно, ссылки есть тут.
🔸 Мини-обзор: https://hfday.ru/u/2501.12948.html


18.01.202515:16
🔺 Что будет, если замедлить скорость света?
Наткнулся на любопытный игровой проект от MIT. Если ходить и собирать шарики в этой игре, то все сильнее замедляется скорость света и начинает проявляться куча интересных эффектов.
🔸 Эффект Доплера. Движение в сторону источника света вызывает синее смещение, а в противоположную сторону — красное.
🔸 Сдвиг спектра. Инфракрасный и ультрафиолетовый свет могут сдвигаться в видимую область спектра.
🔸 Аберрации. Объекты, находящиеся в направлении движения, кажутся ярче, из-за концентрации света в этом направлении.
🔸 Замедление времени. Движущиеся NPC и другие объекты замедляются в зависимости от вашей скорости.
🔸 Искажение пространства. Окружающее пространство начинает сжиматься в направлении движения. Авторы пишут, что это проявление преобразований Лоренца.
В сумме все это дает не очень комфортную для глаз картинку, так что в реальности предлагаю скорость света не расшатывать.
👉 Попробовать можно тут — A Slower Speed of Light
Наткнулся на любопытный игровой проект от MIT. Если ходить и собирать шарики в этой игре, то все сильнее замедляется скорость света и начинает проявляться куча интересных эффектов.
🔸 Эффект Доплера. Движение в сторону источника света вызывает синее смещение, а в противоположную сторону — красное.
🔸 Сдвиг спектра. Инфракрасный и ультрафиолетовый свет могут сдвигаться в видимую область спектра.
🔸 Аберрации. Объекты, находящиеся в направлении движения, кажутся ярче, из-за концентрации света в этом направлении.
🔸 Замедление времени. Движущиеся NPC и другие объекты замедляются в зависимости от вашей скорости.
🔸 Искажение пространства. Окружающее пространство начинает сжиматься в направлении движения. Авторы пишут, что это проявление преобразований Лоренца.
В сумме все это дает не очень комфортную для глаз картинку, так что в реальности предлагаю скорость света не расшатывать.
👉 Попробовать можно тут — A Slower Speed of Light
Медиа контентке
қол жеткізе алмадық
қол жеткізе алмадық
10.01.202511:16
63-й год был сложноват, но Сергей справился
13.12.202414:03
🫣 Коллеги из музыкальной команды зарелизили генератор песен. Сделал вам медитативную композицию.
P.S. В Гигу доезжает, скоро будет во всех интерфейсах.
👉 Попробовать | Хабр
P.S. В Гигу доезжает, скоро будет во всех интерфейсах.
👉 Попробовать | Хабр


13.11.202408:09
А вторая в принципе ничего
31.10.202411:40
Написал для прикола скриптик, который генерит вот такие подкасты по статьям.
Такой NotebookLM на коленке.
Обсуждают CLEAR: Character Unlearning in Textual and Visual Modalities, тык.
Такой NotebookLM на коленке.
Обсуждают CLEAR: Character Unlearning in Textual and Visual Modalities, тык.
20.01.202512:04
Когда по-быстрому встроил ИИ в проект


15.01.202513:56
ждём смс
В ChatGPT добавили отложенные задачи. Уведомление с результатом приходит в виде пуша или письма.
🔸 Можно попросить гуглить что-нибудь на нужную тему раз в день и подготавливать текст (например, задачку по программированию или задание на английском для чтения) и отправлять на почту.
🔸 С почты можно настроить дальнейшую интеграцию (помню, раньше пользовался штуками типа IFTTT). Отправлять к себе в телеграм, постить в соцсеть или скидывать в pocketbook cloud на электронную читалку.
//Upd. На почту все-таки не весь ответ приходит, а ссылка в интерфейс, хотя отработка происходит в положенное время.
В ChatGPT добавили отложенные задачи. Уведомление с результатом приходит в виде пуша или письма.
🔸 Можно попросить гуглить что-нибудь на нужную тему раз в день и подготавливать текст (например, задачку по программированию или задание на английском для чтения) и отправлять на почту.
🔸 С почты можно настроить дальнейшую интеграцию (помню, раньше пользовался штуками типа IFTTT). Отправлять к себе в телеграм, постить в соцсеть или скидывать в pocketbook cloud на электронную читалку.
//Upd. На почту все-таки не весь ответ приходит, а ссылка в интерфейс, хотя отработка происходит в положенное время.
Медиа контентке
қол жеткізе алмадық
қол жеткізе алмадық
08.01.202510:32
🔺 DeepSeek v3
Поигрался с DeepSeek v3, который вышел недавно. Соскоки с русского на китайский, которые были раньше (типа "力ный" вместо "сильный", что само по себе любопытное явление), прекратились.
🔸 Есть web-поиск и режим DeepThink, аналог o1. Работает похуже, чем ChatGPT, те же буквы может посчитать неправильно, но в целом рассуждения работают.
🔸 Цена дешевая, если получится поплнить баланс, — $0.27 и $1.10 за 1M токенов на вход и выход. У GPT-4o — $2.5 и $10.
👉 Я тут в отпуске освоил AliPay и смог оплатить, делюсь ключом от API поиграться (пока там есть деньги): sk-2d6cfbbd72d74b52bba11ea5336cc2f6
🔸 Но есть и просто обычный чат и он бесплатен, попробуйте обязательно. Работать стала почти на уровне лучших моделей.
👉 DeepSeek-чат | HF | Статья
Поигрался с DeepSeek v3, который вышел недавно. Соскоки с русского на китайский, которые были раньше (типа "力ный" вместо "сильный", что само по себе любопытное явление), прекратились.
🔸 Есть web-поиск и режим DeepThink, аналог o1. Работает похуже, чем ChatGPT, те же буквы может посчитать неправильно, но в целом рассуждения работают.
🔸 Цена дешевая, если получится поплнить баланс, — $0.27 и $1.10 за 1M токенов на вход и выход. У GPT-4o — $2.5 и $10.
👉 Я тут в отпуске освоил AliPay и смог оплатить, делюсь ключом от API поиграться (пока там есть деньги): sk-2d6cfbbd72d74b52bba11ea5336cc2f6
🔸 Но есть и просто обычный чат и он бесплатен, попробуйте обязательно. Работать стала почти на уровне лучших моделей.
👉 DeepSeek-чат | HF | Статья
Медиа контентке
қол жеткізе алмадық
қол жеткізе алмадық
25.11.202409:10
На выходных переделал дизайн странички с обзорами статей. Стало красивей!
➕ добавил разных мелочей типа аффилиаций (скоро добавлю фильтры по ним).
➕ добавил разных мелочей типа аффилиаций (скоро добавлю фильтры по ним).


08.11.202409:47
🔺 HFday.ru
Друзья, спасибо за большой фидбек с доработками. Много чего обновил по вашим просьбам. Разбил классификацию на два прохода и пересчитал, стало более точно. Добавил новые классы (small_models, leakage, healthcare, low_resource и другие).
🚀 Добавил топ статей за месяц и статьи за сентябрь. Статей, конечно, огромное количество. За пару месяцев их уже 800+.
🔸 В фильтры добавил возможность пересекать и объединять категории (значки A∪B A∩B). Теперь в топе за месяц можно выбрать, например, бенчмарки+аудио и получить только такие статьи.
🔸 Экспериментирую с обзорами по полным версиям статей, чтобы при этом сохранить их структуру и по возможности достать картинки. Довольно муторное дело, в html версии на arxiv'е не всегда полные статьи, разбирать архив с latex'ом это какой-то гемор, pdf парсить тоже не сахар. Но что-нибудь придумаем.
👉 Сайт | GitHub
Друзья, спасибо за большой фидбек с доработками. Много чего обновил по вашим просьбам. Разбил классификацию на два прохода и пересчитал, стало более точно. Добавил новые классы (small_models, leakage, healthcare, low_resource и другие).
🚀 Добавил топ статей за месяц и статьи за сентябрь. Статей, конечно, огромное количество. За пару месяцев их уже 800+.
🔸 В фильтры добавил возможность пересекать и объединять категории (значки A∪B A∩B). Теперь в топе за месяц можно выбрать, например, бенчмарки+аудио и получить только такие статьи.
🔸 Экспериментирую с обзорами по полным версиям статей, чтобы при этом сохранить их структуру и по возможности достать картинки. Довольно муторное дело, в html версии на arxiv'е не всегда полные статьи, разбирать архив с latex'ом это какой-то гемор, pdf парсить тоже не сахар. Но что-нибудь придумаем.
👉 Сайт | GitHub
Көрсетілген 1 - 24 арасынан 33
Көбірек мүмкіндіктерді ашу үшін кіріңіз.