Один из ключевых трендов в языковых моделях прямо сейчас — опенсорс, который догоняет проприетарку
Ящик Пандоры открыла DeepSeek, когда в открытый доступ выложили топовую модель — качай и пользуйся, внедряй в бизнес — лишь бы мощностей хватило
В январе Microsoft выкатили в опенсорс прекрасную модель Phi-4, которая тут же вошла в топ рейтинга открытых моделей по соотношению качество/ресурсоемкость
В марте Google подарила нам семейство Gemma-3, самая крупная из которых (на 27 млрд параметров) сейчас занимает 11-е место в мировом рейтинге лучших моделей
И вот сегодня уже Meta* выпускает Llama-4 — Scout и Maverick, которые видимо бьют GPT-4o и GPT-4.5 соответственно. А у первой рекордное контекстное окно — 10 млн токенов 😱
Студенты меня спрашивают: а зачем компании это делают? Зачем дарят топовые модели рынку?
Во-первых, это не мешает им на этих моделях зарабатывать — они все равно могут продавать продукты на их основе и облачный инференс, ведь такие крупные модели рядовой пользователь локально все равно не запустит, да еще и шарить в этом нужно.
Ну а во-вторых — конкуренция и место на стихийно формирующемся рынке. Все хотят быть лидером этой отрасли, а пока будешь сидеть с платными моделями в закрытом облаке — лавры заберет конкурент.
Поэтому важно показать, что это ты двигаешь отрасль вперед. Ты выпускаешь опенсорс — его всюду внедряют — тебя как автора моделей любят и ценят — ты лидер отрасли — растут продажи других твоих решений. Опенсорс = имидж.
Вот и Сэм Альтман уже обещает выложить топовые модельки OpenAI в открытый доступ. Еще год назад представить себе это было крайне сложно.
*Meta признана экстремистской организацией на территории РФ