
Quantum Quintum
Авторский канал Константина Кичинского про информационные технологии и науку: новости, запуски, мнения, исследования противоречия и комментарии.
😶🌫️ Вопросы и предложения (кроме рекламы) — @constantinkichinsky.
😶🌫️ Вопросы и предложения (кроме рекламы) — @constantinkichinsky.
TGlist rating
0
0
TypePublic
Verification
Not verifiedTrust
Not trustedLocationРосія
LanguageOther
Channel creation dateOct 25, 2016
Added to TGlist
Feb 20, 2025Linked chat
Latest posts in group "Quantum Quintum"
21.02.202507:55
Закольцуем тему — часовое видео-интервью Сатьи Наделлы на обе темы. https://www.youtube.com/watch?v=4GLSzuYXh6w
20.02.202507:02
Две новости от Microsoft подряд, в моменте даже не понятно, что важнее.
1. Наработки квантовой команды по созданию топологического кубита наконец-то оформились в "квантовый чип" Majorana 1. Сатья уже рукоплещет, что миллионкубитный квантовый компьютер отстоит от нас на годы, а не десятиления, как многие предвещали.
Как минимум это красиво: https://www.youtube.com/watch?v=Q4xCR20Dh1E
2. Microsoft Research и Xbox-студия Ninja Theory показали свои наработки по ИИ-модели Muse, создающей геймплей, — она же World and Human Action Model (WHAM). Очевидно две вещи: 1) пока это все еще сыро, в том числе в плане графики, длительности, играбельности и т.п. 2) прогресс может быть достаточно быстрым, чтобы стать киллер-фичей следующего поколения Xbox. (Напомню просто, что новые видео-карты Nvidia выдают супер-пупер-друпер качество картинки за счет ИИ, а не геометрии.)
1. Наработки квантовой команды по созданию топологического кубита наконец-то оформились в "квантовый чип" Majorana 1. Сатья уже рукоплещет, что миллионкубитный квантовый компьютер отстоит от нас на годы, а не десятиления, как многие предвещали.
Как минимум это красиво: https://www.youtube.com/watch?v=Q4xCR20Dh1E
2. Microsoft Research и Xbox-студия Ninja Theory показали свои наработки по ИИ-модели Muse, создающей геймплей, — она же World and Human Action Model (WHAM). Очевидно две вещи: 1) пока это все еще сыро, в том числе в плане графики, длительности, играбельности и т.п. 2) прогресс может быть достаточно быстрым, чтобы стать киллер-фичей следующего поколения Xbox. (Напомню просто, что новые видео-карты Nvidia выдают супер-пупер-друпер качество картинки за счет ИИ, а не геометрии.)
19.02.202508:31
Внезапно, 4 вроде как не связанные новости про ИИ, экспромтом:
1. Mira Murati (бывшая CTO OpenAI), запустила Thinking Machines Lab. Не понятно, что они делают, но из 29 человек в команде, 21 — бывшие сотрудники OpenAI, многие из которых причастны к ключевым проектам или управлению компанией. Ну там и про безопасность ИИ тоже. (Не сказать, что это много на фоне 2т+ сотрудников OpenAI, но часть лиц знаковые.)
2. Humane (помните такой?) продается HP за $116m (команда и платформа). Сам проект AI Pin закрывается. Облачные фичи отключат 28 февраля. Деньги могут вернуть только тем, кто купил в последние 90 дней (ахахаха). Понятно, что HP покупает экспертизу, наработки и патенты, и это сильно дешевле, чем $1B, за который Humane хотели продаться изначально. Не понятно, собирается ли HP выходить в новый форм-фактор.
3. Niantic хочет продать игровой юнит (Pokemon Go помните?) за $3.5B. Вероятный покупатель - игровая компания Scopely, за которой стоят саудиты (Savvy Games Group). Не понятно, есть ли сегодня потенциал у AR-игр, на которых специализировались в Niantic.
4. xAI планирует прокачивать "AI games first principles" и просит всех заинтересованных писать на gamestudio@x.ai. Не понятно, есть ли у ребят хоть какое-то понимание, что нужно делать и опыт в игроделе.
В общем, много непонятного сегодня происходит в окрестностях ИИ. Но только сегодня, завтра все снова будет понятно.
1. Mira Murati (бывшая CTO OpenAI), запустила Thinking Machines Lab. Не понятно, что они делают, но из 29 человек в команде, 21 — бывшие сотрудники OpenAI, многие из которых причастны к ключевым проектам или управлению компанией. Ну там и про безопасность ИИ тоже. (Не сказать, что это много на фоне 2т+ сотрудников OpenAI, но часть лиц знаковые.)
2. Humane (помните такой?) продается HP за $116m (команда и платформа). Сам проект AI Pin закрывается. Облачные фичи отключат 28 февраля. Деньги могут вернуть только тем, кто купил в последние 90 дней (ахахаха). Понятно, что HP покупает экспертизу, наработки и патенты, и это сильно дешевле, чем $1B, за который Humane хотели продаться изначально. Не понятно, собирается ли HP выходить в новый форм-фактор.
3. Niantic хочет продать игровой юнит (Pokemon Go помните?) за $3.5B. Вероятный покупатель - игровая компания Scopely, за которой стоят саудиты (Savvy Games Group). Не понятно, есть ли сегодня потенциал у AR-игр, на которых специализировались в Niantic.
4. xAI планирует прокачивать "AI games first principles" и просит всех заинтересованных писать на gamestudio@x.ai. Не понятно, есть ли у ребят хоть какое-то понимание, что нужно делать и опыт в игроделе.
В общем, много непонятного сегодня происходит в окрестностях ИИ. Но только сегодня, завтра все снова будет понятно.
18.02.202507:03
Начало года выдалось богатым на e-ink проекты:
— E Ink показала большой цветной e-ink экран в 75", который можно использовать во внешней рекламе. А еще компания предлагает девайсы InkPoster, которые как следует из названия могут заменять постеры и картины. Похожими проектами пытается хвастаться и Samsung.
— Bigme анонсировала обновленную версию Android-смартфона с ч/б e-ink экраном Hibreak Pro. Явно вслед за аналогичным обновлением Palma 2 от Boox. Интересно, что он стоит на $200 дороже не-про цветной версии, но зато явно сделан шаг в сторону смартфона по фичам.
— Dasung показал Paperlike 103 - переносимый e-ink монитор 10.3" с частотой обновления 60Hz.
— Часы Pebble (если помните такие, их еще Google купил) перезапускаются спустя 8 лет.
Есть и нишевые проекты:
— ink console -- небольшой инди-проект по созданию гибрида читалки и игровой консоли, рассчитанной на интерактивные истории и книжные приключения. Готовится к запуску на краудфандинга.
— Phototag — еще один краудфандинговый проект. Тут идея сделать тэг (носимая метка типа AirTag или Tile) с экранчиком, чтобы персонализировать и вместить больше информации, но при этом жрать батарейку по минимуму.
— Ну и просто напомню, что под конец прошлого года цветными читалками разжился Amazon, а уже 26 февраля ожидается новый девайсный эвент компании. Правда, фокус внимания будет все же на обновленных мозгах Alexa.
На что стоит обратить внимание:
1. Никуда не торопимся, хайп может быть сильно локальным. Продолжаем следить за развитием технологии. Напомним, что рост рынка читалок - что-то на границе 3-5% YoY. Под вопросом исключительно новые-старые категории.
2. Комбо e-ink и AI-ассистента в формате часов, смартфона или девайса типа уже забытого Rabbit R1, может быть интересным: современные ИИ-чаты не требуют мгновенной реакции экрана, да и коммуникация как раз текстовая.
3. Для ниши потребителей без игр, кино и любви к фотографиям более легкий и долгоживущий смартфон с цветным e-ink с неплохой частотой обновления порядка 60Hz может оказаться предпочтительным выбором. Другой вопрос, что до сих пор вот эти "без..." были основным локомотивом развития функциональности.
4. Для экранов в помещениях от офисных пространств до публичных зон большие e-ink экраны могут быть хорошим техническим решением при дальнейшем удешевлении: экономия энергии, меньше места/проще монтировать. Но вопрос цены будет главным, помню, что два года назад это было слишком дорого.
— E Ink показала большой цветной e-ink экран в 75", который можно использовать во внешней рекламе. А еще компания предлагает девайсы InkPoster, которые как следует из названия могут заменять постеры и картины. Похожими проектами пытается хвастаться и Samsung.
— Bigme анонсировала обновленную версию Android-смартфона с ч/б e-ink экраном Hibreak Pro. Явно вслед за аналогичным обновлением Palma 2 от Boox. Интересно, что он стоит на $200 дороже не-про цветной версии, но зато явно сделан шаг в сторону смартфона по фичам.
— Dasung показал Paperlike 103 - переносимый e-ink монитор 10.3" с частотой обновления 60Hz.
— Часы Pebble (если помните такие, их еще Google купил) перезапускаются спустя 8 лет.
Есть и нишевые проекты:
— ink console -- небольшой инди-проект по созданию гибрида читалки и игровой консоли, рассчитанной на интерактивные истории и книжные приключения. Готовится к запуску на краудфандинга.
— Phototag — еще один краудфандинговый проект. Тут идея сделать тэг (носимая метка типа AirTag или Tile) с экранчиком, чтобы персонализировать и вместить больше информации, но при этом жрать батарейку по минимуму.
— Ну и просто напомню, что под конец прошлого года цветными читалками разжился Amazon, а уже 26 февраля ожидается новый девайсный эвент компании. Правда, фокус внимания будет все же на обновленных мозгах Alexa.
На что стоит обратить внимание:
1. Никуда не торопимся, хайп может быть сильно локальным. Продолжаем следить за развитием технологии. Напомним, что рост рынка читалок - что-то на границе 3-5% YoY. Под вопросом исключительно новые-старые категории.
2. Комбо e-ink и AI-ассистента в формате часов, смартфона или девайса типа уже забытого Rabbit R1, может быть интересным: современные ИИ-чаты не требуют мгновенной реакции экрана, да и коммуникация как раз текстовая.
3. Для ниши потребителей без игр, кино и любви к фотографиям более легкий и долгоживущий смартфон с цветным e-ink с неплохой частотой обновления порядка 60Hz может оказаться предпочтительным выбором. Другой вопрос, что до сих пор вот эти "без..." были основным локомотивом развития функциональности.
4. Для экранов в помещениях от офисных пространств до публичных зон большие e-ink экраны могут быть хорошим техническим решением при дальнейшем удешевлении: экономия энергии, меньше места/проще монтировать. Но вопрос цены будет главным, помню, что два года назад это было слишком дорого.
17.02.202507:04
Microsoft выпустила обновленную редакцию модели OmniParser V2 (Hugging Face) для анализа изображений экранов и интерфейсов приложений.
Это нужно, чтобы агент на базе LLM (e.g., GPT-4o) мог "понимать", что находится на экране, и в связи с этим предлагать действия. Из коробки OmniParser может интегрироваться с моделями OpenAI (4o/o1/o3-mini), DeepSeek (R1), Qwen (2.5VL) и Anthropic Computer Use.
В целом, про это стоит думать как минимум в следующих разрезах:
— Чат-доступ к приложениям из упрощенных интерфейсов: ИИ-агенты, которые взаимодействуют с удаленными виртуальными машинами, в которых запущены сайты/приложения. Тут спектр широкий: от нашего любимого Rabbit R1, когда чатики/голос -- это и есть ваш интерфейс к любимому приложению вроде Spotify или Uber, до автономного браузера, который за вас серфит интернет.
— Контекстный ИИ-помощник по приложению: ИИ-агент не просто оперирует справкой и советами, но и может понять, что сейчас на экране, и адаптировать рекомендации под контекст и далее провести пользователя по шагам.
— Сценарная автоматизация тестирования приложений: ИИ-агент выполняет над приложением сценарий, не зная заранее интерфейса. Отчасти это симулирует людей, и в этом может восприниматься как частичная замена тестов с незнакомыми людьми.
Наверняка где-то рядом лежат более нишевые сценарии. Например, помню консультанты обещали, что ИИ будет прокси между людьми и старыми интерфейсами, которые почему-то нельзя вынести.
Это нужно, чтобы агент на базе LLM (e.g., GPT-4o) мог "понимать", что находится на экране, и в связи с этим предлагать действия. Из коробки OmniParser может интегрироваться с моделями OpenAI (4o/o1/o3-mini), DeepSeek (R1), Qwen (2.5VL) и Anthropic Computer Use.
В целом, про это стоит думать как минимум в следующих разрезах:
— Чат-доступ к приложениям из упрощенных интерфейсов: ИИ-агенты, которые взаимодействуют с удаленными виртуальными машинами, в которых запущены сайты/приложения. Тут спектр широкий: от нашего любимого Rabbit R1, когда чатики/голос -- это и есть ваш интерфейс к любимому приложению вроде Spotify или Uber, до автономного браузера, который за вас серфит интернет.
— Контекстный ИИ-помощник по приложению: ИИ-агент не просто оперирует справкой и советами, но и может понять, что сейчас на экране, и адаптировать рекомендации под контекст и далее провести пользователя по шагам.
— Сценарная автоматизация тестирования приложений: ИИ-агент выполняет над приложением сценарий, не зная заранее интерфейса. Отчасти это симулирует людей, и в этом может восприниматься как частичная замена тестов с незнакомыми людьми.
Наверняка где-то рядом лежат более нишевые сценарии. Например, помню консультанты обещали, что ИИ будет прокси между людьми и старыми интерфейсами, которые почему-то нельзя вынести.
Reposted from:
Mycorrhiza Breakfast by Constantin Kichinsky

14.02.202506:47
Всем привет! Давно ничего не писал, я с новостями.
1. Пересобрал (как минимум в голове) весь проект по изучению и описанию технологических экосистем. Это по-прежнему work-in-progress, но уже на новых рельсах — организационно и местами методологически.
2. Запустил сайт "Завтрак микорризы", на котором открыто (по крайней мере пока, ахаха) будут выкладываться материалы. Преимущественно последовательно, но там план на 2-3 года.
2.1. На сайте лежит первая часть первого тома — "Разговор по понятиям". Все выложенные главы существенно переписаны: обновлены, дополнены и т.п. Появились три новые (7-9). На главы 8 и 9 рекомендую заходить со свежей головой.
2.2. Не понимаю пока, нужна ли pdf-версия. Но вы скажите, если вам так удобнее читать.
2.3. Если найдете неработающие ссылки, опечатки, глюки в верстке и т.п. пишите в личку.
3. Этот канал я полностью подчистил и перезапускаю с нуля. Пока план такой: делать отдельный пост с выжимкой основных идей (GPT нам в помощь) каждой главы, чтобы под ней собирать обратную связь.
1. Пересобрал (как минимум в голове) весь проект по изучению и описанию технологических экосистем. Это по-прежнему work-in-progress, но уже на новых рельсах — организационно и местами методологически.
2. Запустил сайт "Завтрак микорризы", на котором открыто (по крайней мере пока, ахаха) будут выкладываться материалы. Преимущественно последовательно, но там план на 2-3 года.
2.1. На сайте лежит первая часть первого тома — "Разговор по понятиям". Все выложенные главы существенно переписаны: обновлены, дополнены и т.п. Появились три новые (7-9). На главы 8 и 9 рекомендую заходить со свежей головой.
2.2. Не понимаю пока, нужна ли pdf-версия. Но вы скажите, если вам так удобнее читать.
2.3. Если найдете неработающие ссылки, опечатки, глюки в верстке и т.п. пишите в личку.
3. Этот канал я полностью подчистил и перезапускаю с нуля. Пока план такой: делать отдельный пост с выжимкой основных идей (GPT нам в помощь) каждой главы, чтобы под ней собирать обратную связь.
14.02.202506:47
Анонс про мой параллельный проект с изучением технологических экосистем, кому интересно — подписывайтесь на канал.
13.02.202505:59
Ребята из BBC проверили, как популярные ИИ-ассистенты (OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity) на самом деле суммаризируют их новости.
Оценка проводилась экспертно журналистами, которые "глубоко в теме". Результаты в среднем такие:
— 51% ИИ-ответов на вопросы о новостях содержат существенные проблемы в той или иной форме;
— 19% ИИ-ответов с пересказами статей вносили фактические ошибки (неверные утверждения, числа, даты);
— 13% цитат из статей были изменены относительно оригинала или вообще отсутствовали в соотв. статьях.
Хуже всех работает Gemini, потом Copilot, далее Perplexity. ChatGPT хоть и "лидер", но с более 40% проблем.
—
Оптимисты скажут, что вообще говоря неплохо. Если бы новости пересказывал человек, который не в теме (а так обычно и происходит в социальных сетях), то было бы хуже. А BBC, понятно дело, трудится над обоснованием своей важности первоисточника.
🤫
Оценка проводилась экспертно журналистами, которые "глубоко в теме". Результаты в среднем такие:
— 51% ИИ-ответов на вопросы о новостях содержат существенные проблемы в той или иной форме;
— 19% ИИ-ответов с пересказами статей вносили фактические ошибки (неверные утверждения, числа, даты);
— 13% цитат из статей были изменены относительно оригинала или вообще отсутствовали в соотв. статьях.
Хуже всех работает Gemini, потом Copilot, далее Perplexity. ChatGPT хоть и "лидер", но с более 40% проблем.
—
Оптимисты скажут, что вообще говоря неплохо. Если бы новости пересказывал человек, который не в теме (а так обычно и происходит в социальных сетях), то было бы хуже. А BBC, понятно дело, трудится над обоснованием своей важности первоисточника.
🤫
10.02.202514:52
Ну понеслась, ящик пандоры открылся. Вот уже и французский Mistral с немецким Helsing (два топовых ИИ-стартапа еврозоны) договорились, что будут вместе развиваться в области военного применения ИИ: компьютерное зрение для дронов, коммуникация с операторами, принятие решений.
Вот увидите, самое очевидное применение для европейских дронов — это лагеря беженцев в Европе и перехват судов с нелегальными мигрантами в Средиземном море.
Вот увидите, самое очевидное применение для европейских дронов — это лагеря беженцев в Европе и перехват судов с нелегальными мигрантами в Средиземном море.


10.02.202507:02
Ничего необычного и почти ничего неожиданного: Andrew Ng, которого мы знаем как сооснователя Google Brain, Coursera, Deeplearning.ai и вообще человека, внесшего огромный вклад в популяризацию ML/AI/GenAI, говорит, что
Напомню, что сейчас под флагами «если не мы, если не сейчас, то Китай», в штатах складывается довольно необычная для внешнего наблюдателя картина:
— Китай показал зубы и покусился на святое — лидерство США в технологическом секторе. Для предпринимателей в США — это отличный повод получить еще больше денег собственных налогоплательщиков.
— Люди, которые топили за обучение, открытое всему миру, открытые технологии, искусственный интеллект и вот это все, сейчас наконец-то могут перестать скрывать свой принцип America-first. Больше нет никакого глобализма, равенства всех народов и т.п.
— [Военные] дроны и ИИ — это теперь лучшие друзья. Поэтому военные обращаются в компании с готовыми ИИ-экспертизой и мощностями (некоторые из которых построены на госгранты и субсидии). Конечно, там программа шире, чем дроны как таковые. О том, что долгосрочные госконтракты хорошо сказываются на стоимости акций мы помним еще по кейсу Azure (Microsoft) vs AWS (Amazon).
Далее классическая цепочка размышления: чтобы делать лучшие технологии, надо иметь лучшую армию, которая защитит все цепочки добычи/переработки и рынки сбыта. В той или иной форме ее будут часто повторять.
—
Не понятно только, с каким именно Китаем собираются воевать сверхсовременными автономными дронами США. Пока по риторике похоже, что дроны будут в Гренландии, Панаме и Газе.
Не удивлюсь, если через лет пять-десять подобные дроны будут обслуживать линии связи и отстреливаться от пиратов в Красном море, летать по карьерам и присматривать за подростками в Африке, охранять заводы Apple в Индии и магазины в Нью-Йорке, патрулировать границы с Мексикой и Канадой и далее по списку лучших (анти)утопий. Пу-пу-пу.
...очень здорово, что Google отказалась от обещания не создавать ИИ-системы для вооружения. Многие из вас [ветеранов ВС США] готовы пролить кровь за нашу страну, чтобы защитить нас всех. Так какого черта американская компания отказывается помочь нашим собственным служащим людям, которые там борются за нас?
Напомню, что сейчас под флагами «если не мы, если не сейчас, то Китай», в штатах складывается довольно необычная для внешнего наблюдателя картина:
— Китай показал зубы и покусился на святое — лидерство США в технологическом секторе. Для предпринимателей в США — это отличный повод получить еще больше денег собственных налогоплательщиков.
— Люди, которые топили за обучение, открытое всему миру, открытые технологии, искусственный интеллект и вот это все, сейчас наконец-то могут перестать скрывать свой принцип America-first. Больше нет никакого глобализма, равенства всех народов и т.п.
— [Военные] дроны и ИИ — это теперь лучшие друзья. Поэтому военные обращаются в компании с готовыми ИИ-экспертизой и мощностями (некоторые из которых построены на госгранты и субсидии). Конечно, там программа шире, чем дроны как таковые. О том, что долгосрочные госконтракты хорошо сказываются на стоимости акций мы помним еще по кейсу Azure (Microsoft) vs AWS (Amazon).
Далее классическая цепочка размышления: чтобы делать лучшие технологии, надо иметь лучшую армию, которая защитит все цепочки добычи/переработки и рынки сбыта. В той или иной форме ее будут часто повторять.
—
Не понятно только, с каким именно Китаем собираются воевать сверхсовременными автономными дронами США. Пока по риторике похоже, что дроны будут в Гренландии, Панаме и Газе.
Не удивлюсь, если через лет пять-десять подобные дроны будут обслуживать линии связи и отстреливаться от пиратов в Красном море, летать по карьерам и присматривать за подростками в Африке, охранять заводы Apple в Индии и магазины в Нью-Йорке, патрулировать границы с Мексикой и Канадой и далее по списку лучших (анти)утопий. Пу-пу-пу.
06.02.202505:54
Андрей Карпаты, которого на днях вспоминали в связи с "вайб-кодингом", записал погружение в актуальное понимание LLM/ChatGPT (на 3.5 часа).
Вообще замечу, что как будто бы маятник качнулся в другую сторону и теперь записывать и, вероятно, смотреть сверхдлинные видео стало новой модой.
Не очень понятно, откуда взялось столько свободного времени у всех, но допустим.
(На самом деле понятно: его уже сэкономил тот самый ChatGPT и, если верить Microsoft, в среднем у всех появилась целая неделя в год "свободного" времени на просмотр видосов — не говорите работодателям. А в Испании сейчас всем еще по полчаса в день выделят, шикос.)
00:00:00 introduction
00:01:00 pretraining data (internet)
00:07:47 tokenization
00:14:27 neural network I/O
00:20:11 neural network internals
00:26:01 inference
00:31:09 GPT-2: training and inference
00:42:52 Llama 3.1 base model inference
00:59:23 pretraining to post-training
01:01:06 post-training data (conversations)
01:20:32 hallucinations, tool use, knowledge/working memory
01:41:46 knowledge of self
01:46:56 models need tokens to think
02:01:11 tokenization revisited: models struggle with spelling
02:04:53 jagged intelligence
02:07:28 supervised finetuning to reinforcement learning
02:14:42 reinforcement learning
02:27:47 DeepSeek-R1
02:42:07 AlphaGo
02:48:26 reinforcement learning from human feedback (RLHF)
03:09:39 preview of things to come
03:15:15 keeping track of LLMs
03:18:34 where to find LLMs
03:21:46 grand summary
Вообще замечу, что как будто бы маятник качнулся в другую сторону и теперь записывать и, вероятно, смотреть сверхдлинные видео стало новой модой.
Не очень понятно, откуда взялось столько свободного времени у всех, но допустим.
(На самом деле понятно: его уже сэкономил тот самый ChatGPT и, если верить Microsoft, в среднем у всех появилась целая неделя в год "свободного" времени на просмотр видосов — не говорите работодателям. А в Испании сейчас всем еще по полчаса в день выделят, шикос.)
04.02.202507:08
Коротко, это даже немного смешно.
Передают, что ребята из Anthropic, которые, — помните, — пилят модельки и регулярно поднимают деньжат от гугла и амазона на развитие ИИ, просят соискателей НЕ использовать ИИ при подаче на работу к ним и прохождении интервью.
Понимаете, хотим знать, что вы за человек на самом деле. 🙃
https://www.404media.co/anthropic-claude-job-application-ai-assistants/
Передают, что ребята из Anthropic, которые, — помните, — пилят модельки и регулярно поднимают деньжат от гугла и амазона на развитие ИИ, просят соискателей НЕ использовать ИИ при подаче на работу к ним и прохождении интервью.
“While we encourage people to use AI systems during their role to help them work faster and more effectively, please do not use AI assistants during the application process. We want to understand your personal interest in Anthropic without mediation through an AI system, and we also want to evaluate your non-AI-assisted communication skills. Please indicate 'Yes' if you have read and agree.”
Понимаете, хотим знать, что вы за человек на самом деле. 🙃
https://www.404media.co/anthropic-claude-job-application-ai-assistants/
23.10.202413:41
Продолжает потихоньку раскучиваться тема автоматизации взаимодействия с софтом, не имеющим специального API для сторонних систем.
Anthropic анонсировала инструмент "computer use", позволяющий переводить запросы пользователей в движения курсора/клавиатуры относительно интерфейса, к которому предоставлен доступ.
Под капотом анализ последовательности скриншотов с расчетом необходимых микроопераций, необходимых для совершения действия.
Почему это важно:
1. Снижение стоимости настройки автоматизации. Искусственная обвязка macro-api сервисов и приложений, не имеющих таковых официально, особенно старых программ, которые могут уже и не поддерживаться вендором. В принципе, не сильно важно, дальше поверх работают классические алгоритмы или ML-ные. Важно, что автоматизация операции обвязки экономит время разработчикам.
2. Автоматизация point&click-работы. Дальнейшая "автоматизация" однотипного труда в замороженных и чужих системах, когда переписывать внедренный софт дорого или работа ведется поверх чужой системы. Тут работают три мантры: 1) ботов в интернете будет еще больше, 2) переписывать древний софт снова не обязательно, 3) мартышкин труд автоматизируют, людей выгонят.
3. Инновация в "полуручном тестировании". Можно наконец-то начать заменять ручное тестирование на ИИ-тестирование, когда модель на вход получает фрагмент User Job и доступ к мышке и клавиатуры, и проверяется, насколько она способна выполнить задачу. Тут будет десяток другой стартапов с перехлестом ИИ-тестирования и ИИ-прогноза хитмапов. Еще одна ниша: ИИ-хелпер по интерфейсу, который показывает, как что-то сделать.
4. Еще один шаг в голосовом управлении. Возможности взаимодействия с интерфейсом голосом расширяются, масштабируясь на приложения, которые к этом, возможно и не готовы.
5. Рост скринскраппинга в том числе в злодейских целях. Фактически, развитие таких моделей сейчас означает, что не просто скрины вашего интерфейса отправляются кому-то в облако, но и что модели качественно извлекают из них полезные сведения и их классифицируют. И тут могут быть как красивые обертки вроде Windows Recall, так и злонамеренные с кражей данных.
Anthropic анонсировала инструмент "computer use", позволяющий переводить запросы пользователей в движения курсора/клавиатуры относительно интерфейса, к которому предоставлен доступ.
Под капотом анализ последовательности скриншотов с расчетом необходимых микроопераций, необходимых для совершения действия.
Почему это важно:
1. Снижение стоимости настройки автоматизации. Искусственная обвязка macro-api сервисов и приложений, не имеющих таковых официально, особенно старых программ, которые могут уже и не поддерживаться вендором. В принципе, не сильно важно, дальше поверх работают классические алгоритмы или ML-ные. Важно, что автоматизация операции обвязки экономит время разработчикам.
2. Автоматизация point&click-работы. Дальнейшая "автоматизация" однотипного труда в замороженных и чужих системах, когда переписывать внедренный софт дорого или работа ведется поверх чужой системы. Тут работают три мантры: 1) ботов в интернете будет еще больше, 2) переписывать древний софт снова не обязательно, 3) мартышкин труд автоматизируют, людей выгонят.
3. Инновация в "полуручном тестировании". Можно наконец-то начать заменять ручное тестирование на ИИ-тестирование, когда модель на вход получает фрагмент User Job и доступ к мышке и клавиатуры, и проверяется, насколько она способна выполнить задачу. Тут будет десяток другой стартапов с перехлестом ИИ-тестирования и ИИ-прогноза хитмапов. Еще одна ниша: ИИ-хелпер по интерфейсу, который показывает, как что-то сделать.
4. Еще один шаг в голосовом управлении. Возможности взаимодействия с интерфейсом голосом расширяются, масштабируясь на приложения, которые к этом, возможно и не готовы.
5. Рост скринскраппинга в том числе в злодейских целях. Фактически, развитие таких моделей сейчас означает, что не просто скрины вашего интерфейса отправляются кому-то в облако, но и что модели качественно извлекают из них полезные сведения и их классифицируют. И тут могут быть как красивые обертки вроде Windows Recall, так и злонамеренные с кражей данных.
Growth
Subscribers
Citation index
Avg views per post
Avg views per ad post
ER
ERR
Log in to unlock more functionality.