Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Китай.AI avatar

Китай.AI

💡 Канал Китай.AI — для тех, кто хочет быть в курсе развития искусственного интеллекта в стране, которая претендует на мировое технологическое лидерство.

📱 Подписывайтесь, чтобы не пропустить ключевые события в китайской ИИ-индустрии!

@olegsir78
Рейтинг TGlist
0
0
ТипПубличный
Верификация
Не верифицированный
Доверенность
Не провернный
Расположение
ЯзыкДругой
Дата создания каналаJan 23, 2025
Добавлено на TGlist
Feb 02, 2025

Рекорды

14.04.202523:59
610Подписчиков
29.01.202523:59
0Индекс цитирования
02.02.202510:33
8.1KОхват одного поста
22.04.202506:49
0Охват рекламного поста
07.03.202523:59
7.53%ER
03.01.202510:33
2074.94%ERR

Популярные публикации Китай.AI

22.03.202513:06
🚀 Китайский ИИ набирает обороты: Huawei выпускает новые технологии для ускорения AI-разработок

На саммите партнеров Ascend AI в Шэньчжэне 21 марта 2025 года президент подразделения Huawei Ascend Чжан Дисюань представил ключевые достижения и стратегические направления развития платформы Ascend.

🎯 Основные моменты:
🔹 Масштабирование и кластерный вывод данных: Ascend внедрил крупномасштабную схему параллелизма экспертов, что повысило производительность одной карты в 3–4 раза.

🔹 Быстрая адаптация к новым моделям: Уже через неделю после релиза DeepSeek R1 Ascend представил оптимизированную версию для своих пользователей.

🔹 Успехи в обучении и инференсе моделей: Внедрены технологии ускорения обучения, снижающие время подготовки моделей до нескольких дней.

🔹 ПАК для ИИ — новый тренд рынка: Партнеры Huawei представили множество готовых программно-аппаратных комплексов на базе Ascend. Решения варьируются от компактных устройств размером с коробку сигарет до мощных десктопов с жидкостным охлаждением и масштабируемых серверных платформ.

📈 Технические детали:
- Оптимизиции под MoE (Mixture of Experts): Новая архитектура распределения нагрузки между несколькими картами сокращает задержки и увеличивает пропускную способность системы.
- MindSpeed RL: Первый в отрасли набор инструментов для обучения с подкреплением, доступный в открытом исходном коде на Gitee.
- Driving SDK: Комплексное решение для разработки автономных транспортных средств, включающее предварительно обученные модели и операторы для ускорения процессов.

📊 Статистика:
- Более 150 компаний уже используют DeepSeek на базе Ascend.
- За последний год потребление токенов в Китае выросло в 100 раз — со 100 миллиардов до 10 триллионов в день.
- Более 80% новых пользователей пришли из малого и среднего бизнеса.

💡 Вывод:
Huawei Ascend продолжает лидировать в области ИИ в Китае, предлагая инновационные решения для обучения и инференса моделей. А 2025 станет годом практического применения больших моделей, когда технологии вроде DeepSeek превращают ИИ из "лабораторной привилегии" в "универсальный инструментарий".

Подробнее

#КитайскийИИ #КитайAI #HuaweiAscend #ИскусственныйИнтеллект #БольшиеМодели #DeepSeek #MoE
23.03.202513:25
🚀 CN-AI-WEEK | Главное об ИИ в Китае за неделю

🇨🇳 Ключевые новости из Китая

1️⃣ Состоялся саммит Huawei Ascend AI в Шэньчжэне
Компания Huawei представила свои новейшие разработки в области искусственного интеллекта. Основное внимание уделено трем ключевым направлениям: инновации, развитие больших моделей и внедрение ИИ-решений в бизнес.
Ссылка

2️⃣ Baidu выпустила модели Wenxin X1 и Wenxin 4.5

Baidu представила две новые модели AI: рассуждающую модель Wenxin X1 и мультимодальную модель Wenxin 4.5. Обе модели стали бесплатными.
Ссылка

3️⃣ MedRAG: Новый подход к диагностике с помощью ИИ
Исследователи из Наньянского технологического университета (Сингапур) представили модель MedRAG, которая значительно улучшает точность медицинской диагностики.
Ссылка

4️⃣ Anuttacon анонсировала игру с AI-персонажами

Anuttacon, основанная создателем MiHoYo, представила игру «Whispers from the Star», где персонажи управляются AI.
Ссылка

5️⃣ Пекинский центр робототехники представил платформу для роботов
Пекинский центр робототехники выпустил универсальную платформу для роботов, способную выполнять сложные задачи в различных сценариях.
Ссылка

6️⃣ Kunlun выпустила мультимодальную модель Skywork R1V
Kunlun представила серию моделей Skywork R1V, которые достигли уровня SOTA в визуальном и общем рассуждении. Модель использует инновационные методы для улучшения мультимодальных возможностей.
Ссылка

🌍 Ключевые международные события

1️⃣ NVIDIA представила чип Blackwell Ultra и новые AI-продукты на GTC 2025
NVIDIA анонсировала новый AI-чип Blackwell Ultra и представила Vera Rubin, следующий суперчип для AI. Также были представлены новые аппаратные и программные решения для AI.
Ссылка

2️⃣ OpenAI выпустила API для модели o1-pro
OpenAI представила улучшенную версию модели o1-pro с поддержкой визуальных задач и структурированного вывода (очень дорого).
Ссылка

3️⃣ Grok представил функцию DeeperSearch
xAI обновил Grok, добавив функцию DeeperSearch, которая позволяет интегрировать данные из интернета и Twitter для создания структурированных отчетов.
Ссылка

4️⃣ Cursor запустил режим Claude Max
Cursor представил режим Claude Max, основанный на модели Claude 3.7, который поддерживает обработку больших объемов кода и сложной логики.
Ссылка

5️⃣ Google планирует приобрести AdHawk для разработки умных очков
Google ведет переговоры о покупке компании AdHawk, специализирующейся на технологии отслеживания движений глаз, для возрождения проекта умных очков.
Ссылка

6️⃣ xAI приобрела стартап Hotshot для разработки видео-моделей
xAI купила компанию Hotshot, которая разрабатывает инструменты для генерации видео, чтобы конкурировать с OpenAI и Google.
Ссылка

#КитайскийИИ #КитайAI #ИскусственныйИнтеллект
14.04.202511:52
🔮 CN-AI-MODELS | ИИ модели Китая

🔥 Huawei представила языковую модель Pangu Ultra на 135 млрд параметров


Компания Huawei представила новую версию своей флагманской модели — Pangu Ultra. Это первая в Китае крупномасштабная языковая модель, полностью разработанная и обученная на отечественных чипах Ascend NPU без использования западных технологий.

Главное достижение:
• Модель (135B) превосходит Llama 405B и Mistral Large 2, соответствуя DeepSeek-R1 при меньшем размере
• Обучалась на 8192 NPU Ascend и 13.2 триллионах токенов с уникальными архитектурными решениями

🔍 Технологические инновации:

Стабильность обучения
DSSN (Depth-scaled sandwich-norm) – новая архитектура нормализации для глубоких моделей
TinyInit – революционный метод инициализации параметров

Оптимизация данных
• "Умный" токенизатор с 153,376 токенами (охватывает код, математику, языки)
• Трехэтапное обучение: общие знания → логика → специализация

⚡ Рекордные показатели:
- Поддерживает контекст до 128К токенов (~170 тыс. китайских иероглифов)
- Достигла 50% эффективности использования вычислительных ресурсов (MFU) на кластере из 8192 NPU

Технические детали:
• Гибридный параллелизм: 128DP × 8TP × 8PP + виртуальный конвейер
• Оптимизации системы: MC2, NFA, RoPE-операторы
• Потребление памяти сокращено на 30% за счет общего кэширования

📌 Вывод: Pangu Ultra доказывает возможность создания конкурентных LLM без зависимости от западных технологий, открывая новую эру китайского ИИ.

Технический отчет

#КитайскийИИ #КитайAI #Huawei #LLM #БольшиеМодели
01.04.202510:09
🔮 CN-AI-RESEARCH | Исследования в области ИИ

🔥 DAPO: новый метод обучения LLM от Tsinghua и ByteDance

Исследователи из Tsinghua AIR и ByteDance разработали DAPO (Decoupled Clip and Dynamic sAmpling Policy Optimization) — метод обучения языковых моделей, показывающий лучшие результаты по сравнению с существующими подходами. Проект уже набрал более 6k звезд на GitHub.

📌 Основные достижения:
- Модель Qwen2.5-32B, обученная с помощью DAPO, показала результат 50 баллов на тестовом стенде AIME 2024.
- Для достижения такого результата потребовалось в два раза меньше шагов обучения, чем при использовании GRPO.
- При этом GRPO смог обеспечить только 30 баллов, что значительно ниже текущих стандартов.

📊 Чем хорош DAPO?

1️⃣ Решает ключевые проблемы GRPO:
- Энтропийный коллапс: потеря разнообразия в генерации текста.
- Шум вознаграждения: нестабильность сигналов обучения.
- Недостаток деталей: сложности в воспроизведении результатов на промышленном уровне.

2️⃣ Технические улучшения:
- Динамический выбор данных (Dynamic Sampling).
- Разделение клипов (Decoupled Clip), позволяющее гибко управлять диапазонами вероятностей токенов.
- Наказание за слишком длинные ответы (Soft Overlong Punishment).

- 📄 Статья
- 💻 Код
- 📊 Датасет

#КитайскийИИ #КитайAI #ИскусственныйИнтеллект #LLM #ОбучениеСПодкреплением
Войдите, чтобы разблокировать больше функциональности.