Стендфордский университет в восьмой раз выпустил Artificial Intelligence Index Report на более чем 400 страницах. Пока мы осилили только первую часть про исследования и разработки, выбрали для вас самое интересное:
✅Лидерство промышленности в разработке значимых ИИ-моделей, отмеченное в двух предыдущих отчётах AI Index, стало ещё более очевидным: почти 90% значимых моделей в 2024 году (по сравнению с 60% в 2023 году) были разработаны в промышленности.
✅Китай лидирует по общему количеству публикаций в области исследований ИИ, в то время как США лидируют по числу исследований, имеющих большое влияние.
В 2023 году в Китае было опубликовано больше публикаций об ИИ (23,2%) и больше цитирований (22,6%), чем в любой другой стране. За последние три года институты США внесли свой вклад в 100 самых цитируемых публикаций об искусственном интеллекте.
✅США продолжают оставаться ведущим источником известных моделей искусственного интеллекта. В 2024 году американские организации создали 40 известных моделей ИИ, что значительно превосходит 15 моделей, созданных в Китае, и 3 модели, созданные в Европе. За последнее десятилетие в США было создано больше известных моделей машинного обучения, чем в любой другой стране.
✅Вычислительные ресурсы, необходимые для обучения известных моделей ИИ, удваиваются примерно каждые пять месяцев, объемы наборов данных для обучения больших языковых моделей — каждые восемь месяцев, а мощность, необходимая для обучения, — ежегодно. Крупномасштабные инвестиции в индустрию продолжают способствовать масштабированию моделей и повышению их производительности.
✅Модели ИИ становятся всё более доступными для использования. Стоимость запроса к модели ИИ, которая набирает столько же баллов, сколько GPT-3.5 (64,8) по MMLU, популярному тесту для оценки производительности языковых моделей, снизилась с 20 долларов за миллион токенов в ноябре 2022 года до всего 0,07 доллара за миллион токенов к октябрю 2024 года (Gemini-1.5-Flash-8B) — более чем в 280 раз за примерно 18 месяцев. В зависимости от задачи цены на вывод данных LLM снижались от 9 до 900 раз в год.
✅Количество патентов на ИИ растёт. Только за последний год количество патентов на ИИ выросло на 29,6%. По состоянию на 2023 год Китай лидирует по общему количествупатентов в области ИИ, на его долю приходится 69,7% всех патентов, в то время как Южная Корея и Люксембург лидируют по количеству патентов в области ИИ на душу населения.
✅Аппаратное обеспечение ИИ становится быстрее, дешевле и энергоэффективнее: производительность аппаратного обеспечения машинного обучения, измеряемая в 16-битных операциях с плавающей запятой, ежегодно растёт на 43%, удваиваясь каждые 1,9 года. Производительность улучшилась, затраты снизились на 30% в год, а энергоэффективность выросла на 40% в год.
✅Выбросы углекислого газа при обучении ИИ неуклонно растут. При обучении ранних моделей ИИ, таких как AlexNet (2012), выбросы углекислого газа былинезначительными — 0,01 тонны. Более поздние модели имеют значительно более высокие выбросы при обучении: GPT-3 (2020) — 588 тонн, GPT-4 (2023) — 5184 тонны, Llama 3.1 405B (2024) — 8930 тонн. Для сравнения: среднестатистический американецвыбрасывает 18 тонн углерода в год.