Шаляпин | про AI, хайтек и финтех - Telegram Kanalining Postlari

Мир сегодня с "Юрий Подоляка"

Ko'rish

Труха⚡️Україна

Ko'rish

Николаевский Ванёк

Ko'rish

Труха⚡️Україна

Ko'rish

Николаевский Ванёк

Ko'rish

Лёха в Short’ах Long’ует

Ko'rish

Шаляпин | про AI, хайтек и финтех

22.02.202505:04

Зачастили анонсы роботов. Норвежская компания 1X разрабатывает домашнего робота-гуманоида Neo Gamma, способного выполнять бытовые задачи. Заявлены: глажка, уборка и мытье полов, а еще он может обниматься.

Компания 1X подчеркивает, что Gamma еще далек от коммерческого внедрения. 😢

Текущие улучшения этой модели коснулись ИИ, который помогает ему лучше ориентироваться в пространстве и избегать столкновений. Важно, что человек всегда может взять управление на себя, если что-то пойдет не так. 1X разрабатывает систему генеративного ИИ, чтоб робот более естественно мог общаться с людьми.

Но пока неясно, какие именно технологические достижения в роботе Gamma были результатом сотрудничества 1X с OpenAI, а какие — разработаны внутри компании или появились благодаря приобретенному стартапу Kind Humanoid.

20.02.202513:04

Рубрика "говноконкурент". Периодически тестирую всякие "убийцы" того-сего.

Вчера попробовал убийцу Operator - агента по управлению браузером Convergence.AI. Напишу, на всякий случай, может кому-то полезно будет: на простой таске он жестоко зафейлился. Попросил сначала поискать по Реддиту - сразу отказался. Потом использовал темплейт из собственной библиотеки этого сервиса(зайти на сайт, спарсить заголовки, саммари новостей отдать). Он начал ооочень мучительно ковырять это всё, час чего-то делал. Я не выдержал и спать ушел. С утра смотрю - а он и подвис нафиг. 🤷‍♀️

17.02.202514:07

📈 Решил проверить, насколько ИИ годится для советов по акциям.

Недавно проводил исследование частных инвесторов. Среди выводов забавный парадокс: "дайте подсмотреть у кого-то, что мне купить и когда продать" но "я, разумеется, своим мозгом думаю и никакие "эксперты" мне не указ".

Обращение к ИИ-консультанту — логичный шаг для тех, кто уже встроил нейросети в свою рутину. Раньше это была провальная идея: ИИ оперировал устаревшими данными и выдавал чушь. Сейчас нейронки могут ходить в инет и суммаризировать инфу оттуда, а не выдавать кэшированное старьё за актуалочку.

🟢В тесте участвовали Perplexity Deep Research, ChatGPT 4o, ChatGPT o1, ChatGPT 03 mini-high и DeepSeek. Claude сразу меня нахер послал.
🟢Задача: дать понятный совет, куда вложиться человеку, который сам в этом не разбирается и не хочет.
🟠Вопрос: в какие акции на рынке РФ инвестировать в случае прогресса в решении конфликта между Украиной и Россией?

DeepSeek изучил 33 источника, включая РБК, Финмаркет, Интерфакс, Коммерсантъ, Финам, SberCIB, Известия, Русбондс, БКС и т. д. Большая часть данных актуальна, но есть и прогнозы с осени прошлого года. У китайца есть небольшой фокус на дивдоходности и специфических рисках.

Новая Perplexity Deep Research прошлась по 50 источникам, но в ресёрч включила только 5 и по ним составлен ответ. В целом, у Perplexity в разы больше контекста (переработанного из статей Ифакса и Форбса).

Модели o3-mini-high и o1 предлагают более общий и последовательный обзор. Перцепция временных рамок варьируется: Perplexity акцентирует долгосрочные изменения, а модели o1 и o3-mini-high больше говорят о краткосрочных возможностях.

Разница между выводами зависит только лишь от попавших в выборку источников, никаких дополнительных аналитических компонент ИИ в рамках данного запроса не подтягивают.

В целом, выдача нейросети на такой запрос — ок: хорошие источники и простой запрос помогают. Но важно следить за датами статей - новостной фон меняет рыночные тактики даже на среднесрок/долгосрок. Для глубины нужен уже фундаментал, аналитические базы и продвинутые фильтры. Но это уже совсем другая история и продукт. Хотите такой сделать - пишите.)
Сходства
:

Ключевые секторы: энергетика, банки, потребительский сектор, IT/Телеком.

— Общие рекомендации:

Диверсификация портфеля.
Учет геополитических рисков (санкции, волатильность).
Акцент на компании с устойчивыми финансовыми показателями и дивидендами.

— Общие для всех моделей:

Энергетика: Газпром, Лукойл.
Банки: Сбербанк, ВТБ.
Телеком: МТС.

— Уникальные рекомендации:

o3-mini-high: Ростелеком.
o1: Тинькофф, ФосАгро, Уралкалий.
4o: Черкизово.
DeepSeek: НОВАТЭК, Ozon, НЛМК, Совкомфлот, Транснефть.
Perplexity: НОВАТЭК, Совкомбанк, Норникель.

🟠Не является ИИР, вы что, чур.

21.02.202506:41

Уж сколько раз твердили миру: "За нейросетью проверяй!". А воз и ныне там.

Русский химик с клёвым псевдонимом Paralabrax clathratus (идеальное название для дэт-метал группы) запалил странную фразу "вегетативная электронная микроскопия" (vegetative electron microscopy — а это уже тянет на панк-банду) в ряде научных статей.

Исследователи предполагают, что эта фраза могла появиться из-за ошибочной цифровой обработки статьи 1959 года: слова "vegetative" и "electron microscopy" изначально находились в разных колонках, но при машинном чтении как-то слились в одно. В Google Scholar нашли около двух десятков статей с таким выражением, включая работу 2024 года, где старший автор — редактор Elsevier. В издательстве заявили, что им всё ок.

Но этот кейс ещё не из времен современных ИИ-шек, это ошибка скана. А с ИИ еще хуже, ведь глобально проблема галлюцинаций никуда не делась. И тренд на применение ИИ в науке в этом контексте немного тревожит. Будет обидно, если нейросеть словит приход и мегавирус синтезирует.

20.02.202502:31

Сразу несколько клевых ИИ-анонсов из научной сферы. О первом кратко - Google представил AI Co-Scientist — это как Deep Research, только прям с научным подходом. Если базовые Deep Research/Deep Search системы это компиляторы текстов поисковой выдачи, то тут обещаны генерация гипотез, разработка исследования и всё прочее по научному фэн-шую.

🟢Вторая новость - биологическая. NVIDIA и Arc Institute представили новую фундаментальную ИИ-модель Evo 2, способную предсказывать мутации в генах и даже создавать небольшие геномы эукариот.

Гуманитарию в биологии разобраться трудно, поэтому к этой новости я подхожу крайне боязливо и осторожно. Из описания следует, что ИИ может «читать» и «генерировать» генетический код любого живого существа — от бактерий до человека. Типа как ChatGPT, только вместо текста анализирует гены. А вся эта тема очень круто называется - "generative genomics".

Evo 2 может предсказывать болезни, создавать новые молекулы для лекарств и даже проектировать искусственные геномы. Например, он за секунды определяет, вызывает ли мутация в гене рак или другое заболевание. Точность — около 90%. Раньше на такие исследования уходили годы, а теперь — минуты.

Модель большая - обучена на наборе данных, содержащем около 9 триллионов нуклеотидов — строительных блоков ДНК и РНК.

Как это работает? Модель обрабатывает до 1 миллиона «букв» генетического кода за раз, используя архитектуру StripedHyena 2. Она эффективнее стандартных ИИ-моделей для длинных последовательностей. Обучение проходило на 2000 GPU NVIDIA H100, что делает Evo 2 одним из самых мощных инструментов в биологии.

А главное - Evo 2 опенсорсна, есть и доступ через API, может быть дополнительно настроена с использованием фреймворка NVIDIA BioNeMo. Уже сейчас её применяют для поиска причин рака, создания устойчивых к климату культур и даже разработки белков, разлагающих пластик.

21.02.202504:10

Стартап Figure представил систему ИИ Helix, которая позволяет гуманоидным роботам выполнять сложные бытовые задачи и определять объекты без дообучения.

Helix сочетает языковую модель с системой обработки визуальной информации и специальным контроллером движений, преобразующим текстовые инструкции в точные действия. Для управления используется комбинация ИИ-агентов, а вычисления происходят в облаке. УТП - обычно роботов нужно перепрограммировать для каждой новой задачи, Helix же сама адаптируется к новым ситуациям.

20.02.202500:54

Презу 16E я ~~почти~~ не смотрел, а вот анимашку их лого решил через MJ+Kling повторить. Вроде сасно так-то.

20.02.202519:33

Поделюсь наболевшим: либо мой сдвг не даёт мне месяцами закапываться в одну тему, либо реально скорость появления новых ИИшек порождает усталость. Да такую, что даже самый неистово бесноватый техногик может так сесть в кресло, вздохнуть глубоко и сказать: "Grok 3 бесплатно в Твиттере? Ой, да и хер с ним, потом гляну..." 😩

18.02.202509:15

Илон Маск анонсировал Grok 3 - новую версию нейронки, работающей в Твиттере (ака X). Стоит, как и все, около двадцатки в месяц.

Модель занимает лидирующие места во многих бенчмарках, но на это утп пока традиционно забиваем. Внутри и обычная и reasoning-функционал, голосовой режим, ДипРесёрч и агент для управления компом.

Самое приятное в анонсе -предыдущий Grok 2 уходит в открытый доступ. А это прекрасно - больше опенсорса, хорошего и разного.

Пока протестировать полноценно не получается, но Андрей Карпатый (сооснователь OpenAI) получил доступ пораньше и пишет, что Grok 3 c функцией Thinking вполне на уровне топовых ИИ, но с нюансами: справляется с математическими и исследовательскими задачами, но спотыкается на креативных и визуальных тестах. В целом - на уровне o1-pro ($200 в месяц, у Маска за 20) и чуть лучше DeepSeek-R1 и Gemini 2.0 Flash Thinking.

✅ Хорошо решает таски на мышление: создаёт сложные HTML-макеты, решает головоломки и оценивает вычислительные мощности нейросетей.

❌ Не справился с задачкой "Emoji mystery", зашифрованной в Unicode, где DeepSeek-R1 показал больше прогресса.

🤖 Пытается доказать гипотезу Римана — и не сдаётся, в отличие от OpenAI, Gemini и Claude, которые сразу отказываются.

🎭 С юмором у него всё ещё не очень: шутки стандартные, а «Thinking» даже ухудшает их.

🔹 В задачах на «глубокий поиск» (DeepSearch) он на уровне Perplexity, но слабее OpenAI — иногда выдаёт фейковые URL и странные факты.

🔹 Он умеет считать буквы в словах (e.g. 3 «r» в strawberry), но всё же ошибается в сложных визуальных задачах. И в слове LOLLAPALOOZA зафейлился с количеством "L".

🔹 В числах путается: считает, что 9.11 > 9.9, но в Thinking-режиме исправляется.

🔹 По сравнению с GPT-4o, DeepSeek-R1 и Gemini 2.0, он явно конкурентоспособен, но требует доработки.

💡 В отличие от OpenAI и Gemini, он не включает xAI (своего разработчика) в список «крупнейших LLM-компаний».

Ko'rsatilgan 1 - 9 dan 9

Ko'proq funksiyalarni ochish uchun tizimga kiring.

Iqtibos