Канал о том, как устроен мир технологий. Разберёмся в потоке технологических новостей о нейросетях, роботах, голосовых помощниках, умном доме и не только. Чат канала https://t.me/+488-8LyZuSM1NWRi. : @technoyandex_bot
🤖🤝💻 Как запустить YandexGPT прямо на своём компьютере? Очень просто.
Сегодня Яндекс выложил в опенсорс YandexGPT 5 Lite Instruct — компактную модель, которая при этом не уступает YandexGPT 4 Pro и GPT-4o mini в решении стандартных задач сервисов Яндекса. Мы собрали максимально простую инструкцию из нескольких шагов, как пользоваться такой моделью без интернета.
Что понадобится
🔸 Программа для локального запуска языковых моделей. Например, опенсорс-проект Jan с дружелюбным интерфейсом
🔸 Чуть больше 6 ГБ свободного дискового пространства и около 8 ГБ оперативной памяти
Что нужно делать
1️⃣ Скачайте Jan с официального сайта и установите на свой компьютер
2️⃣ На главной странице зайдите в раздел Hub (иконка с четырьмя квадратами в левом верхнем углу)
3️⃣ Скопируйте ссылку на квантизованную версию YandexGPT 5 Lite и вставьте её в поисковую строку
4️⃣ Скачайте модель и нажмите Use
5️⃣ Готово! Теперь можно общаться с YandexGPT 5 Lite без интернета
YandexGPT 5 Lite также можно пользоваться в Чате с Алисой с подпиской Про, а разработчики могут использовать её в своих проектах через API на платформе Yandex Cloud.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🙂 Главные анонсы сбольшой конференции Алисы иумных устройств: новые умения AI-ассистента, колонки, сценарии умного дома и фишки ТВ Станций, а также новости про Яндекс Авто.
❤️ В Яндекс Браузере появилась новая технология перевода видео. Она сохраняет тембр, интонации и ритм говорящего. Вот как это работает на примере знаменитой речи Стива Джобса перед выпускниками Стэнфорда.
🔴 Наш метод сжатия больших языковых моделей приняли наNAACL, одну из крупнейших конференций по ИИ. Метод HIGGS сжимает LLM на телефонах и ноутбуках и при этом сохраняет качество моделей. Эксперименты показали, что HIGGS сжимает языковые модели лучше аналогов.
↗️ Метод разработали учёные из лаборатории Yandex Research совместно с НИУ ВШЭ, MIT, KAUST и ISTA. Он выложен в открытый доступ на Hugging Face. Подробнее о HIGGS можно прочитать в научной статье на arXiv.
🤖🧠 Яндекс запустил бета-версию Нейроэксперта — сервиса для работы с пользовательскими данными. В него можно загрузить ссылки из интернета, документы, PDF, аудио- и видеофайлы, а нейросеть создаст из них базу знаний и поможет найти в ней ответ. А ещё Нейроэксперт умеет пересказывать, делать выводы, сравнивать и писать тексты на основе загруженных данных — и всё это благодаря методу RAG. Вот как он работает.
Что такое RAG?
Языковые модели отвечают, исходя из данных, на которых их обучали. Чтобы модель использовала другую информацию, её можно дообучить, но проще использовать RAG (Retrieval Augmented Generation) — генерацию с внешними знаниями. Этот метод позволяет дополнить ответы данными, которые не были заложены при обучении.
Что это за данные?
🔸 Специализированные материалы — документация проекта, база знаний компании, учебные материалы и тому подобное.
🔸 Актуальная информация из интернета. Например, RAG используется в Поиске с Нейро для генерации ответа нейросетью с опорой на источники из интернета.
Как это работает?
Подключённые к RAG-системе данные разбивают на небольшие фрагменты — чанки (англ. chunk — кусок). Каждый чанк превращают в эмбеддинг — векторное представление, сохраняющее смысл данных. Пользовательский запрос тоже превращают в эмбеддинг, и система ищет в базе данных подходящие по смыслу фрагменты. Затем они вместе с запросом подаются в нейросеть, которая генерирует финальный ответ.
Пользовательский запрос → преобразование запроса в вектор → поиск релевантных данных в базе знаний → объединение найденной информации с запросом → генерация итогового ответа языковой моделью.
Что даёт RAG в сравнении с другими методами?
Метод позволяет обновлять знания языковой модели без её дообучения. А ещё RAG снижает вероятность галлюцинаций по сравнению с генерацией «из головы», то есть без доступа к внешним данным.
Ещё один способ снизить частоту галлюцинаций — загрузить в модель все данные вместе с запросом пользователя. Но для этого она должна уметь обрабатывать длинные тексты, а искать нужную информацию в большом объёме данных будет непросто. RAG же даёт модели только релевантные фрагменты, не перегружая её лишней информацией — получается быстрее и дешевле.
🦠 В 1986 году два брата из Пакистана случайно запустили первую эпидемию компьютерного вируса для MS-DOS. Благодаря этому родилась индустрия антивирусов.
Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🗜🗂🦾 Сценаристы «Кремниевой долины» придумали технологию специально для сериала, а разработчики стали использовать её в реальной жизни. Вот эта история.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
+3
23.04.202510:06
🗂 Нейроэксперт — новый сервис Яндекса, который сам найдёт нужную информацию в файлах и ссылках. В него можно загрузить документы, таблицы, презентации, аудио, видео и ссылки из интернета, а сервис создаст из них удобную базу знаний и поможет найти в ней ответ на любой вопрос.
Поговорили с Элей Морозовой, руководительницей оптимизации бизнес-процессов на базе YandexGPT, как будут развиваться подобные сервисы и чего от них можно ожидать в будущем.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🛴 200 лет назад на самокатах катались лишь английские аристократы, а теперь катаетесь вы. Как так вышло? Листайте карточки про всемирную историю самокатов.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
👨✈️ Вместе с Авто.ру начинаем сериал об автомобилях, технологии которых опередили время. Представьте: 1981 год, нет ни GPS, ни ГЛОНАСС, а вы садитесь в Nissan Skyline и едете по навигатору до нужного дома. Как это стало возможным — рассказываем в карточках.
Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Продолжаем вместе с ТЕХНО рассказывать о самых интересных технологиях и концептах, которые перевернули мировой автопром.
В этот раз поговорим о Plymouth XP-VIP. У него было всё, без чего трудно представить современный автомобиль... Вот только показали его в 1965 году. Выкручиваем ретрофутуризм на максимум!
Достоин аппарат роли в фильме про будущее?
👍 — да, для своего времени это была пушка 🤔 — идеи смелые, но реализация...
18.04.202512:10
💾 Технологии устаревают слишком быстро!
Напишите технофразу, которую точно не поймут 20-летние. Мы начнём: положи трубку — мне в интернет надо, скинул по ИК-порту, скачал рингтон по WAP.
🟣 Сможете по съёмке ссамолёта отличить пластик отрыболовной сети? А эта нейросеть сможет. Рассказываем о новом экологическом проекте, созданном ML-разработчиками Школы анализа данных вместе с Yandex B2B Tech и Дальневосточным федеральным университетом.
↗️ Это не первый экологический проект, в котором участвовали студенты Школы анализа данных Яндекса. В прошлом году они помогли разработать нейросеть, которая прогнозирует, в какую сторону после извержения двинется облако вулканического пепла.
🤥🤖 Языковые модели могут придумывать факты — они лишь подбирают наиболее подходящие слова для ответов, а оценка адекватности этих ответов всегда на стороне пользователя. Так можно ли доверять нейросетям?
🔹 Обычные языковые модели Степень доверия: ★★☆☆☆
Чат-боты довольно часто галлюцинируют из-за недостатка данных, неумения учитывать контекст или нечёткого запроса. Поэтому их ответы стоит перепроверять — кроме случаев, когда достоверность неважна (например, если нейросеть пишет сценарий праздника).
🔹 Рассуждающие языковые модели Степень доверия: ★★★☆☆
Такие модели разбивают запрос на серию мелких задач и решают их по порядку, проверяя себя на каждом этапе. Это уменьшает количество логических ошибок и делает ответ точнее, но не избавляет от галлюцинаций полностью.
🔹 Языковые модели с доступом к интернету Степень доверия: ★★★☆☆
В режиме поиска, который есть у многих чат-ботов, модель собирает ответ на основе данных из интернета. В этом случае именно галлюцинаций становится гораздо меньше, но стоит проверять надёжность источников, которые использовала модель.
🔹 Чат-боты с функцией Deep Research Степень доверия: ★★★★☆
Нейросети с функцией расширенного исследования (Deep Research) проводят глубокий поиск в сотнях источников, анализируют данные, рассуждают, делают выводы и возвращаются к поиску, если информации оказывается недостаточно. Функция относительно новая и поэтому не всегда работает хорошо, но доверие к таким нейросетям выше.
🔹 Нейросети с RAG по данным пользователя Степень доверия: ★★★★★
Они генерируют ответы, используя данные, добавленные пользователем, например документы, видео, базы данных. В таких сервисах обычно есть дополнительные механизмы самопроверки, а модели учат как можно точнее передавать информацию из источников. Они галлюцинируют реже всего, и если пользовательские данные точны, то и генеративным ответам можно доверять.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
❤️ В Яндекс Браузере появилась новая технология перевода видео. Она сохраняет тембр, интонации и ритм говорящего. Вот как это работает на примере знаменитой речи Стива Джобса перед выпускниками Стэнфорда.
2GIS и Яндекс Карты покажут сигнал светофора прямо в приложении. Разработчики обоих сервисов начали тестировать отображение статуса светофоров в навигаторе: показывается и сигнал, например, красный, и сколько секунд осталось до зелёного. Функция в 2GIS пока тестируется и работает на нескольких перекрёстках в Москве, а в Яндекс Картах она появится позже.
CATL анонсировала батарею для электромобилей с запасом хода 1500 км. Компания также анонсировала сверхбыструю зарядку, позволяющую получить 520 км запаса хода за 5 минут, и натрий-ионные батареи, которые сохраняют 93% ёмкости даже при -30°C. Последняя из этих технологий появится в серийных машинах уже к концу года, а для полуторатысячной батареи и сверхбыстрой зарядки точных дат пока нет.
Vivo представила флагманский смартфон X200 Ultra. Аппарат получил процессор Snapdragon 8 Elite, 6,82-дюймовый 2K-экран, батарею на 6000 мАч с быстрой зарядкой 90 Вт и продвинутую систему камер Zeiss с тремя модулями. Одна из фишек — на смартфон можно надеть фоточехол с креплением для огромного телеобъектива. Смартфон уже поступил в продажу в Китае, цена — около 75 тысяч рублей по текущему курсу.
Motorola представила новое поколение смартфонов Razr. Топовая модель Razr Ultra получила процессор Snapdragon 8 Elite, 7-дюймовый внутренний и 4-дюймовый внешний экраны, а ещё встроенный ассистент Perplexity. Но главная фишка смартфона — это внешность. У него есть несколько видов расцветки, в одной из которых используется крышка из настоящего дерева, а в другой — алькантара. Razr Ultra поступит в продажу в мае за 1300 долларов.
В PDF-файл встроили полноценную языковую модель. Если открыть его в браузере, в файле загрузится полноценный чат-бот, работающий без подключения к интернету. Технология использует старый стандарт PDF, позволяющий запускать JavaScript. В файл вшита маленькая модель, которая, конечно, уступает современным чат-ботам, но проект позиционируется скорее как демонстрация возможности, а не как замена ChatGPT.
Adobe выпустила приложение для защиты авторства изображений. Оно добавляет к изображениям скрытые метаданные, которые сохраняются даже при скриншоте. К изображениям можно прикрепить верифицированное имя через LinkedIn, ссылки на соцсети и даже указать запрет на использование картинки для обучения ИИ.
Microsoft наконец запустила функцию Recall для Windows. Recall делает скриншоты практически всего, что пользователь делает на компьютере, сохраняя их в зашифрованной базе данных. Это позволяет искать по истории активности, используя естественные запросы. Например, Recall можно попросить найти, где пользователь видел запомнившуюся ему рубашку пару недель назад. Изначально функция должна была запуститься в июне 2024 года, но из-за претензий к её безопасности Microsoft отложила релиз почти на год.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🛴 200 лет назад на самокатах катались лишь английские аристократы, а теперь катаетесь вы. Как так вышло? Листайте карточки про всемирную историю самокатов.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🤖 Мы привыкли давать чат-боту запрос и тут же получать ответ. Но это — не единственный вариант работы с LLM. Например, в Yandex Cloud появился пакетный режим работы с LLM и VLM. Рассказываем, как этот и другие режимы помогают компаниям экономить на использовании нейросетей.
Асинхронный режим
В асинхронном режиме провайдер, например, Yandex Cloud или OpenAI, обрабатывает запрос не мгновенно, но предлагает за это большую скидку. В этом режиме провайдер возвращает вместо ответа идентификатор. По нему позже можно проверить статус и забрать готовый ответ — это может занять от нескольких минут до суток в зависимости от нагрузки серверов и правил конкретного провайдера.
Асинхронный режим подходит для анализа данных, оценки качества работы моделей и других задач, которые не требуют мгновенного ответа. Как правило, запросы в таком режиме обходятся в два раза дешевле.
Пакетный режим
Пакетный режим похож на асинхронный. Главное отличие в том, что в пакетном режиме нейросети отправляется не один запрос, а пакет, в котором могут быть собраны сотни и даже тысячи запросов. Например, это может быть классификация объектов в датасете или генерация описания товаров для интернет-магазина. Это удобнее, чем отправлять запросы по одному – к тому же, такие пакеты можно отправлять по расписанию, например, ежедневно или еженедельно.
Кеширование промтов
Кеширование промтов — это способ не платить дважды за одни и те же входные данные. Например, если нейросети нужно постоянно обращаться к большому документу или если у ассистента есть длинная системная инструкция для общения с пользователями.
После первой отправки повторяющаяся часть запроса кешируются, и при повторном использовании пользователь платит за её обработку лишь небольшую часть от обычной стоимости. Так, у Anthropic обработка закешированных частей запроса обходится в десять раз дешевле.
Ночные скидки
Главная причина, почему существуют асинхронные режимы заключается в том, что нагрузка на серверы провайдеров LLM неравномерна и может различаться в несколько раз в течение дня. В феврале DeepSeek анонсировал, что запросы к его моделям вне пиковых часов будут стоить до четырёх раз дешевле, потому что в это время сервера компании не загружены на 100%.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Больше о том, как технологии делают компании и их сотрудников более продуктивными, читайте в канале @yab2btech
24.04.202512:10
🔮 Вживленные воспоминания, виртуальная религия и отредактированный геном
Сюрреалистическая фантазия Филипа Дика породила множество тревожных предсказаний о технологиях будущего и их неэтичном использовании. Рассказываем, что из описанных им инноваций и страхов уже стало реальностью.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🗂 Нейроэксперт — новый сервис Яндекса, который сам найдёт нужную информацию в файлах и ссылках. В него можно загрузить документы, таблицы, презентации, аудио, видео и ссылки из интернета, а сервис создаст из них удобную базу знаний и поможет найти в ней ответ на любой вопрос.
Поговорили с Элей Морозовой, руководительницей оптимизации бизнес-процессов на базе YandexGPT, как будут развиваться подобные сервисы и чего от них можно ожидать в будущем.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🤖 Сможет ли AGI решить все проблемы? Сэм Альтман обещает создать искусственный интеллект, равный человеческому, уже через несколько лет — но есть нюансы.
Яндекс представил большое обновление Алисы и новые устройства. Алиса научилась рассуждать перед ответом, работать с файлами, распознавать увиденное через камеру смартфона и свободно говорить по-английски. Также на презентации показали новые устройства: портативную Станцию Стрит, Станцию Мини 3 Про со съёмными модулями, версию Станции Лайт без часов и умную IP-камеру для дома.
OpenAI выпустила пять больших языковых моделей. У компании было два релиза на неделе. Первый — семейство из трёх моделей GPT-4.1 разного размера. Они прокачались в программировании, поддерживают контекст до миллиона токенов и лучше следуют указаниям пользователя. Модели предназначены для разработчиков, использующих инструменты вроде Cursor, поэтому они не появятся в ChatGPT и доступны только по API.
Второй и самый большой анонс — рассуждающие модели o3 и o4-mini. o3 заняла первое место на большинстве бенчмарков. o4-mini показывает результаты чуть похуже, но и стоит она намного меньше и работает быстрее. Одна из особенностей новых моделей заключается в том, что они могут использовать все инструменты ChatGPT прямо во время рассуждений — искать в интернете, писать и исполнять код и даже кадрировать или поворачивать картинки, чтобы разглядеть на них важные детали. o4-mini уже доступна даже в бесплатной версии ChatGPT, а o3 — только для платных подписчиков.
Китайская компания Readmoo разработала первую читалку на электронных чернилах с гибким экраном. Экран не только гибкий, но и цветной, отображающий более 50 тысяч оттенков. Разработчики обещают, что книжка выдержит 200 тысяч сгибаний. Цена и дата выхода пока не объявлены.
Xiaomi выпустила умный кондиционер с двумя радарами. Они нужны, чтобы кондиционер мог обнаруживать людей в комнате и направлять потоки воздуха на них, а если людей вообще нет — переходить в экономный режим, чтобы не тратить энергию впустую. Устройство пока выпущено только в Китае по цене около 45 000 рублей.
eufyMake выпустила принтер для печати объёмных рисунков на чём угодно. Он может наносить изображения почти на любые поверхности — дерево, металл, стекло, пластик, кожу. Главная фишка — он умеет делать изображение текстурным, с рельефом высотой до 5 мм. Например, можно имитировать поверхность масляной картины или напечатать рельефный рисунок на чехле для смартфона.
В Пекине прошёл первый полумарафон с участием человекоподобных роботов. Победителем стал Tiangong Ultra, пробежавший 21 километр за 2 часа 40 минут. Во время забега ему потребовалось три замены аккумуляторов. Всего в забеге участвовал 21 робот, но финишировать смогли только четверо.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Продолжаем вместе с ТЕХНО рассказывать о самых интересных технологиях и концептах, которые перевернули мировой автопром.
В этот раз поговорим о Plymouth XP-VIP. У него было всё, без чего трудно представить современный автомобиль... Вот только показали его в 1965 году. Выкручиваем ретрофутуризм на максимум!
Достоин аппарат роли в фильме про будущее?
👍 — да, для своего времени это была пушка 🤔 — идеи смелые, но реализация...
+4
18.04.202512:10
💾 Технологии устаревают слишком быстро!
Напишите технофразу, которую точно не поймут 20-летние. Мы начнём: положи трубку — мне в интернет надо, скинул по ИК-порту, скачал рингтон по WAP.
👨✈️ Вместе с Авто.ру продолжаем сериал о технологиях в автомобилях, опередивших время. Мы уже рассказывали про первый навигатор, а сегодня — Cadillac Seville 1978 года с компьютером на борту.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
00:00 — Вступление 00:36 — Что такое «вайб-кодинг»? 01:40 — Автодополнение кода vs. вайб-кодинг 03:25 — Вызывает ли ИИ зависимость? 05:16 — «Ты с ней тупеешь» 06:56 — «Заменить инженера не выйдет!» 09:04 — Что теперь будет с кодингом 09:53 — «Контекст не может быть погружен в языковую модель» 11:10 — Каким будет новый программист?
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🤥🤖 Языковые модели могут придумывать факты — они лишь подбирают наиболее подходящие слова для ответов, а оценка адекватности этих ответов всегда на стороне пользователя. Так можно ли доверять нейросетям?
🔹 Обычные языковые модели Степень доверия: ★★☆☆☆
Чат-боты довольно часто галлюцинируют из-за недостатка данных, неумения учитывать контекст или нечёткого запроса. Поэтому их ответы стоит перепроверять — кроме случаев, когда достоверность неважна (например, если нейросеть пишет сценарий праздника).
🔹 Рассуждающие языковые модели Степень доверия: ★★★☆☆
Такие модели разбивают запрос на серию мелких задач и решают их по порядку, проверяя себя на каждом этапе. Это уменьшает количество логических ошибок и делает ответ точнее, но не избавляет от галлюцинаций полностью.
🔹 Языковые модели с доступом к интернету Степень доверия: ★★★☆☆
В режиме поиска, который есть у многих чат-ботов, модель собирает ответ на основе данных из интернета. В этом случае именно галлюцинаций становится гораздо меньше, но стоит проверять надёжность источников, которые использовала модель.
🔹 Чат-боты с функцией Deep Research Степень доверия: ★★★★☆
Нейросети с функцией расширенного исследования (Deep Research) проводят глубокий поиск в сотнях источников, анализируют данные, рассуждают, делают выводы и возвращаются к поиску, если информации оказывается недостаточно. Функция относительно новая и поэтому не всегда работает хорошо, но доверие к таким нейросетям выше.
🔹 Нейросети с RAG по данным пользователя Степень доверия: ★★★★★
Они генерируют ответы, используя данные, добавленные пользователем, например документы, видео, базы данных. В таких сервисах обычно есть дополнительные механизмы самопроверки, а модели учат как можно точнее передавать информацию из источников. Они галлюцинируют реже всего, и если пользовательские данные точны, то и генеративным ответам можно доверять.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
🙂 Главные анонсы сбольшой конференции Алисы иумных устройств: новые умения AI-ассистента, колонки, сценарии умного дома и фишки ТВ Станций, а также новости про Яндекс Авто.
🤔💬 Алиса научилась рассуждать. Теперь она может решать задачи поэтапно, превращая их в последовательность связанных между собой шагов. Разбираемся, для чего это нужно и когда режим рассуждений работает лучше всего.
Что это за режим?
В режиме рассуждений языковая модель не просто пишет ответ, а разбивает пользовательский запрос на несколько простых задач и решает их последовательно, проверяя себя на каждом этапе. Это сокращает количество ошибок и делает ответы точнее.
Как это устроено?
• Запрос пользователя обрабатывают с помощью технологий Алисы • Затем запрос оптимизируют с помощью рефразера и превращают в промт для рассуждающей модели • Промт отправляют в рассуждающую модель • Модель строит цепочку рассуждений и выдает ответ, при этом ход ее мысли виден пользователю
Рассуждения надо читать?
Необязательно — можно просто дождаться финального ответа. Но это хороший способ понять, как рассуждает нейросеть. А если вы заметите ошибку, в следующем промте можно попросить скорректировать ее.
Когда надо включать режим рассуждений?
Этот режим подходит для: • сложных вопросов без очевидного решения • задач, требующих логических рассуждений (например, математических) • создания стратегий и планов • анализа противоречивых данных • обработки больших объемов разрозненной информации.
Если нужен простой ответ, художественный текст, пересказ, обобщение материала или диалог с чат-ботом, режим рассуждений лучше отключить.
Где это попробовать?
В рассуждающей функции чата с Алисой пользователь может протестировать бета-версию новой YandexGPT 5 с режимом рассуждений. Также для теста доступна опенсорсная модель, интегрированная вместе с архитектурой и технологиями Алисы.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке