Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Лёха в Short’ах Long’ует
Лёха в Short’ах Long’ует
Градиент обреченный avatar
Градиент обреченный
Градиент обреченный avatar
Градиент обреченный
🔺 Делаем свою Perplexity

Perplexity — это поисковая система, которая обрабатывает выдачу популярными моделями (в Pro версии их можно выбирать, это GPT-4o/o1, Claude и пара других) с удобным интерфейсом и списком источников.

Есть разные режимы, типа поиска видео или режим Writing, когда веб-поиск отключен и можно работать как с обычной языковой моделью.

Компания привлекла полмиллиарда долларов инвестиций в декабре и на днях запустила новый API.

🔸 Называется новый сервис Sonar API, есть две версии — sonar и sonar-pro. Стоит $1/$1 за 1M input/output токенов у базовой модели и $3/$15 у Pro.

🔸 Сами поисковые запросы, которые происходят внутри, тоже стоят денег, $5 за 1000 запросов. Базовая модель делает только 1 такой поиск, Pro может делать несколько.

🔸 В зависимости от расходов есть разные уровни использования (tiers), на них появляются дополнительные фичи, типа фильтров по доменам для поиска.

Так вот, поигрался немного с этим API (можете попробовать через playground), работает достаточно стабильно, находит данные по актуальным событиям и людям.

Ссылки на источники тоже выдает. То есть, чтобы самому сделать подобный сервис, по сути хватит одного такого API (и денег).

В целом так можно сделать и по частям — найти поисковое API типа Bing в Azure или DuckDuckGo, попарсить найденные сайты, подложить в контекст и сходить в следующее API. Не так сложно, но будет больше работы по поддержке, а тут один вызов — и готово.

По-моему, search API у OpenAI и других сервисов пока нет (может, вы где-то видели подобное API?).

Upd. Спасибо за ссылки!
Качаем на флешку, пока не удалили

https://huggingface.co/deepseek-ai/DeepSeek-R1
12.01.202516:18
Поигрался с kling'ом

Пора бы уже сделать кому-то удобный сервис по генерации множества сцен с консистентными персонажами и связыванием их в один ролик. По отдельности вроде понятно как, но вот прям лень возиться.
03.01.202515:13
🔺 Осваиваем FLUX, LoRA и ComfyUI

Написал заметку про то, как дообучать модель FLUX на небольшом количестве картинок, как настраивать ComfyUI и работать в нем.

🔸 Можно обучать локально, если есть видеокарта дома. Можно арендовать сервер с картой на полчаса. Можно обучить и генерировать на платформе типа fal.ai.

🔸 По-умолчанию LoRA получается примерно на 30 Мб, а на различных сервисах около 130 Мб и работает получше. Можно поменять ранги в скриптах обучения, чтобы увеличить размер. Про это тоже написал.

🔸 Подходит, само собой, не только для лиц, а для чего угодно. Можно переносить стили с ваших картинок или обучать на какие-то специфические вещи.

👉 https://habr.com/ru/companies/ods/articles/871256/
19.11.202414:07
Тут коллеги намекают, что есть же официальный клиент, а вы про него не знаете. Давайте исправлять.

У него и функционал побогаче (есть потоковая передача токенов, например, и работа с функциями), и имя погигачатистей.

#pip install gigachat


👉 GitHub (код и докуменатция)

Upd. Друзья, ключ я не забыл удалить, это мой. Пользуйтесь, пока там есть баланс.
Друзья, у меня в очередной раз случился день рождения. Последний раз такое происходило примерно с год назад, поэтому давайте познакомимся.

Меня зовут Сергей. Работаю программистом, хотя мог бы, наверное, стать переводчиком, музыкантом или спортсменом, если бы был поумнее и посильнее.

Часто трудно выбрать какое-то одно увлечение и это отражается в хобби, которые никакой конкретной цели не преследуют. Это и языки с музыкой, и спорт (благодаря работе подсел последние полтора года на теннис) с книжками, и другие бесполезные вещи.

На работе в Сбере занимаемся с коллегами исследованиями языковых моделей и обучаем GigaChat. Только что дописали статью на Хабр про MAX, в котором я тоже поучаствовал, сделав для него токенизатор.

На канале мы с вами общаемся в основном на темы, связанные с ИИ, машинным обучением и проектами типа Lingtrain'а. Статей выходит огромное количество, поэтому я делаю инструмент с автообзорами (тг тоже будет), а в канале буду писать больше про практические вещи и изредка про личные. Можете его бустануть.

👉 А чем занимаешься ты? О чем мечтаешь? Полететь к звёздам или выспаться?
#работаиздома

Размышляю над проблемами ризонинга и инвестициями в AI пока человек сидит за компьютером.
20.01.202507:03
На together.ai появилась бесплатная Llama 3.3 70B по API.

🔸 На Free tier'е у них 60 запросов в минуту/60k токенов. Если добавить карту, то будет 600/180k.

🔸 Работает без VPN и мобильных, совместима с OpenAI клиентом. Можете встроить в свой пет-проектик.

https://api.together.ai/models/meta-llama/Llama-3.3-70B-Instruct-Turbo-Free

import os
11.01.202510:14
Выложил несколько LoRA моделек с классиками.

https://habr.com/ru/articles/872926/
🔺 Минутка статистики за 2024 год

Всем спасибо за репосты, идеи и комментарии!
🔺 GigaChat MAX в API

Друзья, последняя версия модели стала доступна по API. Можно тестировать.

🔸 Для удобства накидал простенький клиент (закинул на pypi):

#pip install gigadoom


🔸 Чтобы поиграться, вот вам мой ключик, там осталось 800k токенов, можно потратить. Можно попробовать свои систем-промпты, чего через UI не сделать. Если заметите что-то интересное, то пишите.

Ключ: N2RlZmM4MDAtMWI4Ny00YmZjLWIxZjgtYTAwYjI1YmNhZTUwOjFmMjhiZmIzLTFlYTktNDQ2Zi05ZDQ5LWZmMWYyNmVhMjllOQ==

👉 Официальный клиент можно найти тут.
01.11.202414:58
Вечерний выпуск подкаста Радио-D

Рецепт: Инструкция от холодильника Бирюса, Claude, ElevenLabs, "унца" из Радио-Т

Долго подбирал голоса на ElevenLabs, равнозначный женский так и не настроил. А мужской прям отлично слушается.
🔺 DeepSeek-R1 и DeepSeek-R1-Zero

Как было сказано ранее, модели от китайских исследователей выложены в открытый доступ и показывают результаты на уровне o1.

🔸 Например, в отчете пишут, что модель пробивает рейтинг в 2000 на Codeforces (хорошие соревнования по программированию с довольно сложными задачками), это лучше 96% участников.

🔸 Локальный запуск: запустить эти модели будет непросто из-за их размера, поэтому авторы сделали ряд моделей поменьше, используя дистилляцию. От 1.5B до 70B.

🔸 Попробовать: полная R1 доступна на официальном сайте в режиме DeepThink.

🔸 Приложение: мобильное приложение работает бесплатно, ссылки есть тут.

🔸 Мини-обзор: https://hfday.ru/u/2501.12948.html
🔺 Что будет, если замедлить скорость света?

Наткнулся на любопытный игровой проект от MIT. Если ходить и собирать шарики в этой игре, то все сильнее замедляется скорость света и начинает проявляться куча интересных эффектов.

🔸 Эффект Доплера. Движение в сторону источника света вызывает синее смещение, а в противоположную сторону — красное.

🔸 Сдвиг спектра. Инфракрасный и ультрафиолетовый свет могут сдвигаться в видимую область спектра.

🔸 Аберрации. Объекты, находящиеся в направлении движения, кажутся ярче, из-за концентрации света в этом направлении.

🔸 Замедление времени. Движущиеся NPC и другие объекты замедляются в зависимости от вашей скорости.

🔸 Искажение пространства. Окружающее пространство начинает сжиматься в направлении движения. Авторы пишут, что это проявление преобразований Лоренца.

В сумме все это дает не очень комфортную для глаз картинку, так что в реальности предлагаю скорость света не расшатывать.

👉 Попробовать можно тут — A Slower Speed of Light
63-й год был сложноват, но Сергей справился
13.12.202414:03
🫣 Коллеги из музыкальной команды зарелизили генератор песен. Сделал вам медитативную композицию.

P.S. В Гигу доезжает, скоро будет во всех интерфейсах.

👉 Попробовать | Хабр
А вторая в принципе ничего
31.10.202411:40
Написал для прикола скриптик, который генерит вот такие подкасты по статьям.

Такой NotebookLM на коленке.

Обсуждают CLEAR: Character Unlearning in Textual and Visual Modalities,
тык.
Когда по-быстрому встроил ИИ в проект
ждём смс

В ChatGPT добавили отложенные задачи. Уведомление с результатом приходит в виде пуша или письма.

🔸 Можно попросить гуглить что-нибудь на нужную тему раз в день и подготавливать текст (например, задачку по программированию или задание на английском для чтения) и отправлять на почту.

🔸 С почты можно настроить дальнейшую интеграцию (помню, раньше пользовался штуками типа IFTTT). Отправлять к себе в телеграм, постить в соцсеть или скидывать в pocketbook cloud на электронную читалку.

//Upd. На почту все-таки не весь ответ приходит, а ссылка в интерфейс, хотя отработка происходит в положенное время.
🔺 DeepSeek v3

Поигрался с DeepSeek v3, который вышел недавно. Соскоки с русского на китайский, которые были раньше (типа "力ный" вместо "сильный", что само по себе любопытное явление), прекратились.

🔸 Есть web-поиск и режим DeepThink, аналог o1. Работает похуже, чем ChatGPT, те же буквы может посчитать неправильно, но в целом рассуждения работают.

🔸 Цена дешевая, если получится поплнить баланс, — $0.27 и $1.10 за 1M токенов на вход и выход. У GPT-4o — $2.5 и $10.

👉 Я тут в отпуске освоил AliPay и смог оплатить, делюсь ключом от API поиграться (пока там есть деньги): sk-2d6cfbbd72d74b52bba11ea5336cc2f6

🔸 Но есть и просто обычный чат и он бесплатен, попробуйте обязательно. Работать стала почти на уровне лучших моделей.

👉 DeepSeek-чат | HF | Статья
На выходных переделал дизайн странички с обзорами статей. Стало красивей!

➕ добавил разных мелочей типа аффилиаций (скоро добавлю фильтры по ним).
🔺 HFday.ru

Друзья, спасибо за большой фидбек с доработками. Много чего обновил по вашим просьбам. Разбил классификацию на два прохода и пересчитал, стало более точно. Добавил новые классы (small_models, leakage, healthcare, low_resource и другие).

🚀 Добавил топ статей за месяц и статьи за сентябрь. Статей, конечно, огромное количество. За пару месяцев их уже 800+.

🔸 В фильтры добавил возможность пересекать и объединять категории (значки A∪B A∩B). Теперь в топе за месяц можно выбрать, например, бенчмарки+аудио и получить только такие статьи.

🔸 Экспериментирую с обзорами по полным версиям статей, чтобы при этом сохранить их структуру и по возможности достать картинки. Довольно муторное дело, в html версии на arxiv'е не всегда полные статьи, разбирать архив с latex'ом это какой-то гемор, pdf парсить тоже не сахар. Но что-нибудь придумаем.

👉 Сайт | GitHub
Қайта жіберілді:
GS
Galqiwi's boredom
31.10.202407:45
Наконец-то закончил работу над большим пет-проектом.

Я смог запустить Llama 3.1-8b прямо в браузере на cpu с помощью нашего нового алгоритма сжатия AQLM+PV.

Можно потестить демо здесь

видео
Көрсетілген 1 - 24 арасынан 33
Көбірек мүмкіндіктерді ашу үшін кіріңіз.