Анализ данных (Data analysis)

Николаевский Ванёк

Мир сегодня с "Юрий Подоляка"

Труха⚡️Україна

Николаевский Ванёк

Анализ данных (Data analysis)

Data science, наука о данных.

@haarrp - админ

@itchannels_telegram - 🔥 главное в ит

@ai_machinelearning_big_data - ML

@machinelearning_interview - вопросы с собесдований по Ml
РКН: clck.ru/3FmyAp

TGlist रेटिंग

प्रकारसार्वजनिक

सत्यापन

असत्यापित

विश्वसनीयता

अविश्वसनीय

स्थानРосія

भाषाअन्य

चैनल निर्माण की तिथिMay 28, 2022

TGlist में जोड़ा गया

Feb 07, 2025

मैं चैनल का मालिक हूँ

बदलावों का इतिहास

संलग्न समूह

Machine learning chat

10.9K

टेलीग्राम चैनल Анализ данных (Data analysis) का आंकड़ा

सदस्य

45 256

24 घंटों

39-0.1%सप्ताह

59-0.1%महीना

590.1%

उद्धरण सूचकांक

0

उल्लेख1चैनलों पर शेयर0चैनलों पर उल्लेख1

प्रति पोस्ट औसत दृश्य

1 747

12 घंटों1 1480%24 घंटों1 7470%48 घंटों4 580

70.3%

सगाई (ER)

5.87%

रिपोस्ट65टिप्पणियाँ0प्रतिक्रियाएँ2

सगाई दर (ERR)

6.17%

24 घंटों

2.31%सप्ताह0%महीना

0.06%

प्रति विज्ञापन पोस्ट औसत दृश्य

1 747

1 घंटा82947.45%1 - 4 घंटे130.74%4 - 24 घंटे1 02458.61%

Искусственный интеллект. Высокие технологии

हमारे बॉट को चैनल में जोड़ें और इस चैनल की दर्शक संख्या जानें।

24 घंटों में कुल पोस्ट

2

डायनेमिक्स

समूह "Анализ данных (Data analysis)" में नवीनतम पोस्ट

सभी पोस्ट

09.04.202508:04

⚡️Как Docker упрощает жизнь аналитиков и инженеров данных

Когда вы работаете с данными, анализируете их или строите модели машинного обучения, Docker позволяет сосредоточиться на самой работе, не отвлекаясь на настройку окружения.

На бесплатном вебинаре вы научитесь упаковывать приложения вместе со всеми зависимостями, избегать проблем с несовместимостью, а значит и повысите эффективность работы и сэкономите время на настройку окружения.

Что будем делать на вебинаре:
🟠Разберём основы Docker и как контейнеры упрощают работу;
🟠Выполним анализ данных, запустив Python прямо внутри контейнера;
🟠Автоматизируем окружение с помощью Docker Compose (Python + PostgreSQL);
🟠Настроим удобный доступ к результатам анализа;
🟠Организуем ускоренную обработку больших данных.

😶Зарегистрироваться на бесплатный вебинар

08.04.202510:01

🕊️ Namsor - это ИИ для анализа имен собственных с лингвистическим интеллектом. Причем это не просто классификатор, а инструмент с глубоким пониманием культурных и лингвистических контекстов.

Проект удивляет точностью: он различает, является ли "Mercedes фамилией человека, названием города или автомобильным брендом, учитывая страну происхождения.

Технология особенно востребована в CRM-системах, соцсетях и базах данных, где критична корректная интерпретация имен.

🔗 Ссылка - *клик*

08.04.202508:56

📊Бесплатный вебинар: «Построение эффективных дашбордов с помощью Power BI»

💡На вебинаре вы узнаете:
+ Как загрузить данные в Power BI Desktop из различных источников

+ Построение наглядных дашбордов для анализа данных

+ Интерактивные возможности в Power BI - взаимодействие с визуальными элементами

+ Применение базовых визуальных элементов и их настройка для лучшего понимания данных

+ На практике вместе построим дашборд в Power BI

❓Кому будет полезен вебинар:
- Аналитикам данных
- Маркетологам
- Продуктовым менеджерам
- Всем, кто хочет визуализировать данные для принятия решений

⏰16 апреля(среда) в 20:00 мск

Вебинар в рамках курса «BI-аналитика»
🎁После вебинара для вас активен промо-код со скидкой 5% до 18 мая: BI_04

👉Регистрация на вебинар: OTUS.RU

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

#реклама
О рекламодателе

08.04.202507:14

🎥 Минутное видео по тексту? Новый подход к генерации от исследователей!

Генерация длинных видео — всё ещё вызов для ИИ. Self-attention не тянет по скорости, Mamba — по сложности сюжета. Но тут на сцену выходят TTT-слои (Test-Time Training) — и делают шаг вперёд.

🧠 В чём суть: — TTT-слои умеют использовать выразительные скрытые состояния, которые сами являются нейросетями.
— Их добавляют в уже обученный трансформер — и он начинает генерировать минутные видео по текстовому сценарию с плавным движением и логичной историей.
— Проверяли на мультстиле Tom & Jerry — и получили +34 Elo-балла в человеческой оценке по сравнению с Mamba 2 и другими сильными базовыми методами.

ИИ уже близок к тому, чтобы полностью воспроизводить стили старых мультфильмов или аниме. Это может кардинально изменить производство анимации — вместо создания вручную, студии смогут "дообучать" модель и просто писать сценарии.

Прикрепленное минутное видео, было создано с помощью промпта и обучено на сотнях часов Тома и Джерри.

Вот его полный промпт.

⚠️ Да, пока есть артефакты и ограничения — модель на 5B параметров и только минутные ролики. Но подход уже выглядит перспективным.

Следим за развитием.

📌Demos: http://test-time-training.github.io/video-dit/
📌Paper: http://test-time-training.github.io/video-dit/assets/ttt_cvpr_2025.pdf
📌Github: https://github.com/test-time-training/ttt-video-dit

@data_analysis_ml

07.04.202510:52

⚡️ Pydoll — это библиотека на Python, предназначенная для автоматизации браузеров на движке Chromium (Chrome и Microsoft Edge) без использования WebDriver.

Инструмент имитирует «реальные» действия пользователя и обеспечивает гибкость при работе с элементами интерфейса и сетевыми запросами.

🔗 Ключевые особенности
- Асинхронная автоматизация без WebDriver

- Позволяет обойтись без установки и настройки драйверов WebDriver, что упрощает процесс интеграции и обслуживания.

- Реализована на базе asyncio, поэтому поддерживает запуск нескольких задач одновременно.

- Обход Cloudflare Turnstile

- Имеется встроенный механизм для автоматического прохождения CAPTCHA:

- Синхронная блокировка (context manager), когда выполнение кода приостанавливается до момента решения задачи.

- Фоновый режим (non-blocking), когда автоматизация продолжает работу, пока CAPTCHA решается в фоне.

- Поддерживает «человеко-подобный» набор текста (имитация пауз, скорости).

- Распознаёт специальные клавиши и сочетания клавиш (нажатия SHIFT, CTRL, ALT и т.д.).

- Подключение к существующим сессиям

- Можно подсоединяться к уже запущенным экземплярам Chrome или Edge, что удобно для отладки или интеграции с имеющимися сессиями пользователя.

Благодаря отсутствию необходимости в WebDriver и возможности имитировать взаимодействие «как настоящий пользователь», Pydoll будет полезен в проектах, где требуется гибкая и реалистичная автоматизация.

📌 Github

@data_analysis_ml

06.04.202515:40

Когда потратил 3 часа на отладку сгенерированного кода, который написал бы за час.

@data_analysis_ml

06.04.202510:02

😈 AnimeGamer — это модель, разработанная лабораторией ARC компании Tencent, предназначенная для создания бесконечных симуляций жизни в аниме-стиле.

Она использует мультимодальные большие модели (MLLMs) для генерации динамичных анимационных сцен, отображающих движения персонажей и изменения их состояний.

Учитывая исторический визуальный контекст, AnimeGamer обеспечивает последовательность и увлекательность игрового процесса.

Применяя мультимодальные представления, ориентированные на действия, и видеодиффузионную модель, AnimeGamer создает высококачественные видеоролики, формируя захватывающий и постоянно развивающийся игровой опыт.

https://huggingface.co/TencentARC/AnimeGamer

से पुनः पोस्ट किया:

06.04.202509:17

🎮 Microsoft представила нейро-версию Quake II на базе Muse и WHAMM.

Microsoft Research представила WHAMM — новую систему или технологию, предназначенную для моделирования окружающего мира в реальном времени, с особым акцентом на интерактивные среды.

Это означает, что WHAMM способна быстро создавать и постоянно обновлять цифровую 3D-модель физического пространства, учитывая изменения, которые происходят в нем, в том числе в результате взаимодействия пользователя или других динамических событий.

▪ ИИ генерирует кадры в реальном времени, анализируя действия игрока.

▪Старая WHAMM — 1 fps, новая — 10 fps при 640×360, почти играбельно.

Модель помнит последние 0,9 секунды, что добавляет случайности.

Ключевая особенность — система работает достаточно быстро, чтобы обновлять модель мира практически мгновенно по мере поступления новых данных от сенсоров (вероятно, камер, датчиков глубины и т.д.). Это критически важно для плавного взаимодействия.

🔗 Играть в ИИ-версию Quake II можно здесь.

@vistehno

#microsoft #ai #quake #muse

से पुनः पोस्ट किया:

05.04.202519:11

🦙 Встречайте, дамы и господа, LLaMA 4: мультимодальные MoE модели!

Llama 4 Omni разработана для понимания и обработки информации модальностей, а не только текста.

Доступна в 3х вариантах: Llama 4 Scout и Llama 4 Maverick, Llama 4 Behemoth.

У Llama 4 Scout (109B) контекстное окно размером 10 М, 17B активных параметров, 16 экспертов, может быть запущена на 1ом GPU!

Llama 4 Maverick (400B) окно в 1M, 128 экспертов, 17B активных параметров.

У Бегемота окно в 2T!!!, 16 экспертов, 288B активных параметров.

- Model Card
- Веса
- Релиз

@ai_machinelearning_big_data

05.04.202515:05

🔥 OpenThinker2-32B: превосходит DeepSeekR1-32B в математике и Кодинге.

OpenThinker2-32B набирает 76,7 баллов на AIME24, 90,8 на MATH500 и 64,1 на GPQA-D.

Он набрал 90,8 баллов по MATH500, обойдя R1-Distill-32B (90. 0) .

Это новый лидер на бенчмарке GPQA-D лидирует с результатом 64,1 по сравнению с R1-Distill-32B с результатом 65,8.

https://huggingface.co/bartowski/open-thoughts_OpenThinker2-32B-GGUF

@data_analysis_ml

05.04.202513:04

Время протестировать CodeFest'15

31 мая и 1 июня в Новосибирске пройдет юбилейный CodeFest’15 — масштабная конференция для ИТ-специалистов. Приглашают тимлидов, проджектов, тестировщиков, фронтенд- и бэкенд-разработчиков, аналитиков, дизайнеров, техлидов и руководителей направлений.

На мероприятии можно обсудить тренды с другими профессионалами и перезагрузиться в неформальной обстановке. В программе:

— 10 потоков и 150+ докладов от топовых спикеров по направлениям от Backend до Web3;
— живые дискуссии в формате «квартирников»;
— нетворкинг с экспертами из разных компаний;
— кофе-брейки и грандиозная афтепати.

Больше информации — по ссылке

05.04.202510:50

📌 FastRAG — фреймворк, предлагающий разработчикам современные инструменты для создания оптимизированных RAG-пайплайнов. Этот сервис, построенный на базе Haystack и Hugging Face, фокусируется на эффективном сочетании информационного поиска с генеративными возможностями LLM.

Фреймворк предоставляет готовые компоненты для работы с современными методами семантического поиска, оптимизированные под современные аппаратные ускорители, включая процессоры Intel Xeon и AI-акселераторы Gaudi.
При этом FastRAG активно развивается — от поддержки мультимодальности до примеров динамического синтеза промптов.

🤖 GitHub

@data_analysis_ml

05.04.202508:49

IT_ONE Cup. ML Challenge от IT_ONE и Sk FinTech Hub — создай AI-ассистента, который будет помогать в работе дизайнерам, системным и бизнес-аналитикам. Участвуй онлайн с 12 по 29 апреля и поборись за 1 500 000 рублей и мерч.

Регистрация открыта до 11 апреля: https://cnrlink.com/itonecupmldataanalysisai

Твоя формула победы:
✅ Умеешь работать с готовыми моделями машинного обучения и адаптировать их под специфические задачи.
✅ Знаешь, как реализовать сложные системы на базе LLM и генеративных моделей.
✅ Готов создавать комплексные решения для автоматизации процессов.

Также приглашаем Backend и Frontend-разработчиков, системных и бизнес-аналитиков, UI/UX-дизайнеров. Участвуй онлайн соло или командой до 5 человек.

Задачи IT_ONE Cup. ML Challenge:
🔤 Динамические контекстные подсказки для системного аналитика.
🔤 AI-генератор дизайн-макетов по описанию требований.
🔤 Система визуализации BPMN-диаграмм.

Создай AI-ассистента, который облегчит выполнение рабочих задач — регистрируйся на IT_ONE Cup. ML Challenge: https://cnrlink.com/itonecupmldataanalysisai

Реклама. ООО «ГПБ-ИТ1». ИНН 9717102235. erid: 2W5zFHaR9vG

04.04.202520:27

🔥 DiffSynth-Studio-Lora-Wan2.1-ComfyUI - дистиллированный WAN!

Это LoRA для интеграции с ComfyUI, основанные на Wan2.1-T2V-1.3B.

: Поддерживается 4, 5, 6, 8, 10 и более шагов, что позволяет балансировать между качеством и временем генерации.

На тестах получаются потрясающие результаты всего за 5 шагов!

🟡HF
🟡Пример

31.03.202520:10

✔️ Runway выпустили Gen-4 — это версия, в которой значительно улучшено качество, динамика движения и управляемость генерациями.

- Улучшенная точность и динамика: Gen-4 позволяет генерировать видео с более реалистичным движением, сохраняя при этом согласованность стилей, объектов и сюжетных линий.

- Контроль и согласованность: С помощью визуальных референсов и инструкций пользователи могут создавать контент с одними и теме же стилями, персонажами и локациями, что идеально подходит для повествовательных историй.

- Поддержка физики и реализма: Модель способна лучше симулировать реальную физику, что делает сгенерированные сцены более правдоподобными.

@data_analysis_ml

सभी पोस्ट

विज्ञापित12 घंटे

08.04.202507:23Искусственный интеллект. Высокие технологии

46.9K

रिकॉर्ड

01.04.202513:43

45.3Kसदस्य

28.02.202516:56

400उद्धरण सूचकांक

02.03.202514:15

9.2Kप्रति पोस्ट औसत दृश्य

25.02.202523:59

9.2Kप्रति विज्ञापन पोस्ट औसत दृश्य

12.02.202507:30

12.79%ER

04.03.202508:31

20.41%ERR

विकास

सदस्य

उद्धरण सूचकांक

एक पोस्ट का औसत दृश्य

एक विज्ञापन पोस्ट का औसत दृश्य

ERR

Анализ данных (Data analysis) के लोकप्रिय पोस्ट

सभी पोस्ट

07.04.202510:52

29.03.202510:39

🖥 Как установить Deep Seek локально с помощью Ollama LLM в Ubuntu 24.04

Подробное руководство от TecMint, демонстрирующее, как установить и запустить модель DeepSeek локально на Linux (Ubuntu 24.04) с использованием Ollama.

Гайд охватывает все этапы установки: обновление системы, инсталляцию Python и Git, настройку Ollama для управления DeepSeek, а также запуск модели через командную строку или с помощью удобного Web UI.

▪ Руководство также включает инструкции по автоматическому запуску Web UI при старте системы через systemd, что делает работу с моделью более комфортной и доступной.

Подойдет для тех, кто хочет исследовать возможности работы с крупными языковыми моделями без привязки к облачным сервисам, обеспечивая полный контроль над моделью и её настройками.

▪ Читать

से पुनः पोस्ट किया:

26.03.202518:51

🔥 В chat.qwenlm.ai chat теперь доступны голосовой режим + режим видеочата

Более того китайцы выложили код своей Qwen2.5-Omni-7B - единой omni-модели, которая может понимать текст, аудио, изображение и видео.

Они разработали архитектуру "thinker-talker", которая обеспечивает одновременное размышление модели и ее разговор .

Вскоре обещают выпустить в опенсорс модели на еще большее количество параметров.

Просто топ, бегом тестить.

🟢Попробовать: https://chat.qwenlm.ai
🟢Paper: https://github.com/QwenLM/Qwen2.5-Omni/blob/main/assets/Qwen2.5_Omni.pdf
🟢Blog: https://qwenlm.github.io/blog/qwen2.5-omni
🟢GitHub: https://github.com/QwenLM/Qwen2.5-Omni
🟢Hugging Face: https://huggingface.co/Qwen/Qwen2.5-Omni-7B
🟢ModelScope: https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B

@ai_machinelearning_big_data

#qwen #release #Omni

05.04.202510:50

से पुनः पोस्ट किया:

24.03.202518:13

📌 72B слишком много для VLM? А 7B параметров недостаточно!

QWEN только что выпустили новую модель на 32B параметров, Qwen2.5-VL-32B-Instruct.

Эта модель представляет собой значительный прогресс для своего размера. И что самое лучшее, она лицензирована Apache 2.

Модель выдает более подробные и структурированный ответы.

💡 Детальное понимание: превосходные возможности анализа изображений и визуальной логической дедукции.

📊 Превосходит сопоставимые модели, такие как Mistral-Small-3.1-24B и Gemma-3-27B-IT.

🚀 В нескольких тестах даже превосходит более крупный Qwen2-VL-72B-Instruct.

Еще один крутой релиз понедельника!

🟢Блог: https://qwenlm.github.io/blog/qwen2.5-vl-32b/
🟢Попробовать: https://chat.qwen.ai
ВЧ: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct
🟢Модель: https://modelscope.cn/models/Qwen/Qwen2.5-VL-32B-Instruct

@ai_machinelearning_big_data

#AI #ML #LLM #Dataset #HuggingFace

08.04.202510:01

31.03.202516:04

Что такое torch.nn на самом деле?

Когда я начинал работать с PyTorch, мой самый большой вопрос был: "Что такое torch.nn?".

Эта статья довольно хорошо объясняет это.

📌 Читать

25.03.202507:55

🔥 Helix — это платформа для создания и развертывания AI-приложений с использованием декларативных конвейеров, интеграции знаний и API!

🌟 Она позволяет описывать AI-решения в YAML-файле (helix.yaml), что упрощает их настройку, тестирование и развертывание. Helix ориентирован на разработчиков, которые хотят строить генеративные AI-приложения с гибкостью и полной приватностью.

🖥 Github

@data_analysis_ml

24.03.202511:47

⚡️ Alibaba только что выпустила TaoAvatar на Hugging Face

Реалистичные говорящие аватары в полный рост для дополненной реальности с помощью 3D-гауссовых сплатов.

Он обеспечивает точное управление мимикой и движениями, работая в реальном времени даже на мобильных устройствах.

Метод использует нейросетевую дистилляцию, достигая 90 FPS на Apple Vision Pro.

🟡Проект
🟡Статья
🟡Видео
🟡Демка

@data_analysis_ml

24.03.202510:02

👩‍💻 Neural Structured Learning (NSL) — это фреймворк для обучения нейронных сетей с использованием структурированных сигналов, таких как графы и данные с враждебными искажениями!

🌟 NSL позволяет улучшать точность моделей, особенно при ограниченном объёме размеченных данных, за счёт объединения как размеченных, так и неразмеченных данных.

🔍 Основные возможности:

🌟 API для работы с графами и враждебными искажениями на базе TensorFlow и Keras.

🌟 Поддержка создания графов и входных данных для обучения.

🌟 Универсальность для различных архитектур (CNN, RNN и др.) и методов обучения (контролируемого, частично контролируемого и др.).

🔐 Лицензия: Apache-2.0

🖥 Github

@data_analysis_ml

09.04.202508:04

से पुनः पोस्ट किया:

05.04.202519:11

06.04.202515:40

Когда потратил 3 часа на отладку сгенерированного кода, который написал бы за час.

@data_analysis_ml

से पुनः पोस्ट किया: