Оглядываясь назад на школьное время, меня удивляет сколько внимания на уроках математики уделялось графикам и зависимостям одной величины от другой — параболам, гиперболам и тд — и как мало времени уделялось статистическим распределениям и их визуацлизации. Недавно окончившие школу студенты зачастую будут использовать слово "график" к гистограмме распределения не чувствуя разницы.
Вы подбрасываете монетку много-много раз и записываете результат "орёл,решка,орёл,орёл,решка...." — это и есть распределение. Если его визуализировать, то получится два столбика каждый собравший по ~50% бросков. Есть более сложные распределения, типа гауссовского bell curve среднего роста в стране и тд.
Классический анекдот про среднюю температуру по больнице подчёркивает как важно держать статистические распределения в голове. Распределение температуры людей в больнице будет иметь два пика: 36,6 и значение температуры в морге, среднее значение имеет мало смысла.
Всё что делает современный AI — это умение предсказывать статистические распределения и сэмплировать из них. AI умеет предсказывать что у "орла" и "решки" должно быть по 50%, а также умеет подкидывать монетку.
Какое распределение слов идущих за "Привет, как"? В этом распределении будут пики для слов "дела" или "жизнь", а слово "кофемашина" будет менее вероятным.
Какое распределение слов идующих за "Привет, как дела"? Вероятно, у символа "?" будет пик в этом распределении (если считать символ за слово).
Прогоняя эту логику много-много раз, у AI получается генерировать тексты кажущиеся осмысленными. Та же логика работает при генерации картинок, музыки, видео.
Способность AI генерировать тексты стала наверное самым важным прорывом 2020-х. Большая часть того что я вижу на экране уже генерируется или будет генерироваться при помощи AI.
Одновременно с этим прорывом я заметил, что потерял весь интерес к цифровому медиа, к "контенту". Этот пост — попытка понять причину нового восприятия.
В мире AI-контента потребление информации занимает в десятки-сотни раз больше времени чем его создание. Такоой дисбаланс ставит для меня вопрос: сколько труда вложено в то что я сейчас вижу на экране? Стоит ли моё время этого? Чаще всего я выбираю не читать, не смотреть, или же читать выжимку которую AI тоже умеет делать.
Даже при наличии времени на чтение постов и просмотр ютуба, в 2к25 контент всё чаще и чаще — это сэмпл из статистического распределения воссозданного ИИ. Фокусироваться на контенте сродни фокусрованию на том что выпал "орёл" или "решка", забывая что все исходы пораждает монетка. Иначе говоря — мне не интересен AI slop, покажите мне сразу ваш промпт и источники финансирования, ведь именно они пораждают всё что я буду видеть.
Алгоритмы социальных сетей задают форму контента на потребительнской стороне. Известные примеры этих форм — это обложки видео в Youtube и кликбейтные заголовки. Опять же, это всего лишь статистическое распределение пикселей приводящее к большему количеству кликов.
Контент сегодня — это мимолётная сущность зажатая в тиски Generative AI моделей с одной стороны, и рекомендационных систем с другой стороны. Понимание этого отбивает у меня желание взаимодействовать с цифровым медиа.
Возможно, в будущем я удалю этот пост от стыда о своей негативности. GenAI — мощнейший инструмент для создания нового, а социальные сети — это отличный механизм дистрибуции контента по всему миру.
А возможно, кто-то разделит моё ощущение индеферентности к пикселям на экране. Возможно, нас ждёт глава истории где offline-мир снова займёт главное место на сцене, с его человечностью и недоступностью для AI.