Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Наука и данные avatar
Наука и данные
Наука и данные avatar
Наука и данные
С днем пожарной охраны!

Борьба со со стихией огня — одна из самых благородных профессий. Огнеборцы ежедневно рискуют жизнями ради спасения других, будучи на войне с огнем. Я хочу поздравить этих мужественных героев, а также всех своих коллег из ВУЗов МЧС России!

Сейчас языки программирования служат для анализа, моделирования и прогнозирования чрезвычайных ситуаций. Приведу лишь пару примеров на R:

🔺 Коллеги из Института проблем правоприменения под руководством Руслана Кучакова создают с помощью R ежегодные обстоятельные обзоры в сфере контрольно-надзорной деятельности (ссылка на Telegram-канал и обзор).

🔺 Adrián Cidre — сотрудник кафедры лесной инженерии в Университете Кордовы. Еще недавно он сам тушил лесные пожары, проработав шесть сезонов пожарным! Сейчас он разрабатывает решения на основе R для лесного хозяйства, используя знания науки о данных и геопространственные технологии. В частности, в своем блоге Adrián делает картографические визуализации пожаров в Испании.
Doing Bayesian Data Analysis in brms and the tidyverse

A. Solomon Kurz нам знаком по книге Statistical rethinking 2 with rstan and the tidyverse (об этом был пост выше), а сейчас выпустил обновленную версию для Quarto своих заметок по байесовскому анализу данных Doing Bayesian Data Analysis in brms and the tidyverse на основе текста Doing Bayesian data analysis: A tutorial with R, JAGS, and Stan, автор которого J. K. Kruschke.

По библиотеке brms, которая используется в тексте книги, существует уже большое количество источников, можно напомнить некоторые из них:

🔹 The brms Book. Applied Bayesian Regression Modelling Using R and Stan

🔹 Introduction to Bayesian statistics in R & brms

🔹 Ecological forecasting with mvgam and brms

🔹 Блог, который ведет Andrew Heiss
Geographic Information Systems and Science 🗺️

Про записки курса Geographic Information Systems and Science, который ведут Andy MacLachlan, Adam Dennett и Claire Dooley, мне рассказал Анатолий Цыпленков (TG-канал Типизированный R), за что ему большое спасибо!

Модуль курса разработан с учетом большого практического компонента, чтобы студенты могли использовать новейшее программное обеспечение и методы анализа данных. Курс преподается (преимущественно) на языке программирования науки о данных R. Предварительные знания ГИС или языка науки о данных R не требуются, но модуль быстро переходит от базовых инструментов к продвинутым методологиям ГИС.

Основная часть, соответствующая ГИС-анализу содержит темы, относящиеся к обнаружению пространственных закономерностей, интерпретации пространственной автокорреляции в пространственных данных и моделированию связей между двумя или более пространственно-референтными переменными.

Книга курса с кодом на R доступна онлайн.
LLMs + R

Насколько современные LLMs хороши в написании кода на R?

Simon P. Couch участвовал в разработке таких уважаемых библиотек как {broom}, {workflows}, {bonsai} и т. д. Недавно он выпустил две новые библиотеки на основе LLM ассистентов и {ellmer} - это {gander} (надстройка для Copilot в RStudio и Positron) и {chores} для того, чтобы помочь быстро выполнять повторяющиеся, трудно автоматизируемые задачи.

Сейчас в своем блоге он делится своими соображениями и экспериментами по оценке производительности кодирования в R. В частности, с помощью новой библиотеки {vitals}, которая представляет собой порт R широко распространенного фреймворка Python Inspect, он показывает, как можно делать оценки больших языковых моделей в R.

Статьи по LLM возникают так быстро, что мы не успеваем читать заголовки новостей. Из последнего:

🔹 R with RAGS: An Introduction to rchroma and ChromaDD
🔹 How to Build a Local RAG App with Ollama and ChromaDB in the R Programming Language

См. также Large Language Model tools for R
GRASS GIS + R 🌳

GRASS GIS — это мощный механизм геообработки, который объединяет более 500 инструментов для пространственного и временного анализа векторных, растровых, 3D-растровых и графических данных. GRASS был разработан для скорости и эффективности, что позволяет ему довольно просто масштабировать рабочие процессы с массивными наборами данных. В то же время R за годы разработки хорошо развивался в статистическом анализе, моделировании и визуализации пространственных данных.

Veronica Andreo на конференции useR! 2024 рассказала о взаимодействии R и GRASS через библиотеку {rgrass}. Например, вы боретесь с большими растровыми наборами данных в R или вам нужен какой-то конкретный инструмент, например, разграничение водоразделов для большой ЦМР высокого разрешения в GRASS, это описано в статье Вероники. Советую также обратить внимание на сайт GRASS, где описано взаимодействие и с Python и присутствуют большие интеерсные руководства.
Уважаемые коллеги!

Красноярский математический центр рад принять у себя участников V Конференции математических центров России, которая пройдет с 11 по 16 августа 2025 г. в г. Красноярске на базе Сибирского федерального университета.

К участию в конференции приглашаются представители российской и мировой математической общественности: аспиранты, студенты, сотрудники математических центров, научные и педагогические работники. Формат работы конференции очный, будут представлены пленарные, секционные и постерные доклады по актуальным направлениям развития и современным достижениям математической науки.

В качестве финансовой поддержки молодых исследователей организаторы конференции предоставят бесплатное проживание ограниченному числу участников по рекомендации руководителей секций.

Подробная информация о мероприятии находится на официальном сайте конференции: https://kmc.sfu-kras.ru/conf2025/
По всем возникающим вопросам следует обращаться на почту оргкомитета по адресу: konf-mc@sfu-kras.ru.
Mapping Worlds with R: Your Journey from Beginner to Data Cartographer-examples

Milos Popovic известен нам как увлеченный картограф, который превращает карты в искусство и с удовольствием этим делится. Напомню, что его руководства по созданию карт можно посмотреть в блоге, а с недавних пор и на его YouTube канале.

Milos написал книжку с очень интересным названием Mapping Worlds with R, код к проектам которой уже можно посмотреть на GitHub-репозитории.

Книгу можно заказать на payhip.
Когда "Наука и данные" встречается с настоящей наукой.

В прошлый четверг мы провели наш ежегодный семинар, а в пятницу я съездил на лекцию Андрея Михайловича Райгородского. Прекрасный доклад, как всегда достаточно популярный, чтобы его могли понять даже первокурсники. Ждем его в августе на конференции математических центров!

Как оказалось, Андрей Михайлович и другой известный популяризатор математики — Алексей Владимирович Савватеев даже "немножко родственники".
Quarto Extensions + Quarto Wizard

Внешний вид страницы Quarto Extensions, которую разрабатывает Mickaël Canouil существенно преобразился - теперь каждому расширению Quarto соответствует красивая карточка с описанием, ссылкой на репозиторий и разбивкой по категориям. В настоящий момент здесь собрано уже >200 расширений!

Также Mickaël сделал расширение Quarto Wizard для Visual Studio Code, которое помогает управлять проектами Quarto и позволяет легко устанавливать расширения Quarto непосредственно из репозитория. Кроме того, оно предлагает набор команд для создания новых документов Quarto, которые вы можете использовать в качестве отправной точки для своих отчетов об ошибках, запросов функций или любого другого контента, связанного с Quarto. Кроме того, предлагаю заглянуть в его блог, где также много интересного по Quarto.
20.04.202503:00
Information is Beautiful Awards 2024 🌟

Дорогие друзья, в первую очередь, поздравляю всех со светлым праздником Пасхи! 🌟

Information is Beautiful Awards - это награда, которая отмечает выдающиеся достижения и красоту в визуализации данных, инфографике, интерактивных технологиях и информационном искусстве. На награду каждый год подаются сотни, а порой и тысячи визуализаций, начиная с 2012 года.

Вчера был объявлен short list, в который вошли:

🔺 Дата-арт сообщество Цветы & Цифры (ЦиЦ) 🌹 под руководством прекрасной Натальи Киселевой! Я в восторге от этого уютного уголка, объединяющего увлеченных, по-настоящему талантливых людей, созданного для поддержки и общения, в котором и я тоже немножко участвую.

Также я очень рад за участников ЦиЦ:

🔺 Два замечательных 🔥 (просто фантастических!) проекта Надежды Андриановой: One Week in Sound + World in Tangible Fragments

🔺 Потрясающий проект, ❤️ который создала Nina Lindell: Цветы Беслана. Нина сделала из твердой бумаги 334 мака - по числу жертв теракта. Созданный в течение года кропотливой работы, это мемориал ручной работы, где каждый цветок служит «портретом данных», чтобы рассказать историю каждого человека - его возраст, пол и связь с другими (дети представлены в виде маленьких цветов, взрослые - в виде больших, на маковом поле цветы разместили так, чтобы люди из одной семьи были рядом).

Я всех сердечно поздравляю! 🎉
An Inventory of Spatial Machine Learning Packages in R 👌

Данная страница содержит постер с перечнем библиотек для пространственного машинного обучения в R, представленный на конференции FOSSGIS 2025 в Мюнстере, ФРГ (авторы Nowosad J., Meyer H., Linnenbrink J., Ludwig M.).

Здесь представлено сравнение фреймворков машинного обучения {caret}, {mlr3} и {tidymodels} в R и их возможностей для задач пространственного машинного обучения (ML), а также сделан обзор других библиотек, которые можно использовать для пространственного ML в R.

Постер сопровождается примерами кода, которые демонстрируют, как использовать эти библиотеки для задач пространственного машинного обучения.

Напомню что взаимодействовать в R с ArcGIS можно с помощью {arcgislayers}, с QGIS в {qgisprocess} (см. также презентацию), про GRASS расскажем завтра.
Forecasting: Principles and Practice, the Pythonic Way 🐍🔥

Мы прекрасно знаем, что одна из лучших книг по работе с временными рядами с использованием языка R - Forecasting: Principles and Practice, авторы которой Rob J Hyndman и George Athanasopoulos. Новая книга Forecasting: Principles and Practice, the Pythonic Way призвана предоставить всестороннее введение в методы прогнозирования на Python. Предполагается что здесь не дается подробное обсуждение теоретических деталей, но читатели знакомы с вводным курсом статистики.

Самым важным изменением в этом издании книги является то, что авторы используют nixtlaverse в Python - это коллекция библиотек, разработанная Nixtla, которая предоставляет комплексный инструментарий для прогнозирования временных рядов. Также в новое издание включены две главы по искусственным нейронным сетям и их применениям к задачам временных рядов.

Удачного прогнозирования! 💙
Git and GitHub for R users

Если вы достаточно уверенно пишете код R для проведения анализа, но результаты исследований и код становятся все больше или вам необходимо работать в команде, отслеживать версии, то без Git вам не обойтись. Для тех, кто работает на R, обычно рекомендуют книгу Happy Git and GitHub for the useR, однако есть ли что-то вводное, но может быть не столь всеобъемлющее? Например,в качестве такого источника существует курс Reproducible and Trustworthy Workflows for Data Science или курс An R reproducibility toolkit for the practical researcher.

Nicola Rennie создала небольшую страничку Git and GitHub for R users с презентацией, примерами и упражнениями по Git, которая также может быть полезной. Есть и запись видео.
Мне нравятся подобные 🔥 сувениры.

Всем хороших выходных! 👋
Dr. Dominic Royé

Я думаю, что многие видели одни из самых узнаваемых и грамотно составленных графиков и иллюстраций в области цифровой географии и климатологии, созданных Dr. Dominic Royé. Юрий Тукачев в TG-канале Weekly Charts в январе 2025 рассказал о том, что веб-сайт автора обновился и и переведен на платформу Quarto. Обратите внимание: особенно впечатляет оформление публикаций. С тех пор на странице появился новый раздел, посвящённый деятельности исследовательской группы Bioclim.

На страницах блога Dominic делится своими находками на R из мира картографии и визуализации данных, но особенно рекомендую заглянуть в раздел Data Vizualization - это завораживающая красота и источник вдохновения!
Всем хороших выходных! 👋
{boxview} 📦

Экспериментальная библиотека {boxview} содержит всего одну функцию boxview::boxview() для отображения кода функции во вложенных блоках, это немного упрощает просмотр кода по сравнению с традиционным способом.

pak::pak("cynkra/boxview")
Сегодня выходит R 4.5.0. 🎉
Нововведения можно посмотреть у Jumping Rivers. Пингвины точно будут! 🐧

Хорошего всем обновления! 👋
Эпиграфы в Quarto

Для того, чтобы добавить эпиграф в Quarto, можно рассмотреть несколько вариантов, например, сделать эпиграф в HTML или использовать конструкцию вида

:::{.epigraph}


Теперь для создания эпиграфов появилось отдельное расширение Fancy Quarto epigraphs, которое создал Andrew Heiss (профессор в Georgia State University). С этим расширением все достаточно логично:

{{< epigraph "Нью-Йорк сам гремит и сверкает почище всякой бури. Это мучительный город. Он заставляет все время смотреть на себя. От этого города глаза болят." source="**«Одноэтажная Америка»**, Ильф и Петров" >}}
Unlocking the Power of Data Visualization with R 🌟

Federica Gazzelloni - автор книги Health Metrics and the Spread of Infectious Diseases (Machine Learning Applications and Spatial Modelling Analysis with R), прекраснейшей веб-страницы, лидер группы R-Ladies Rome, которая имеет как свой веб-сайт, так и YouTube-канал.

Unlocking the Power of Data Visualization with R - еще один проект, который создала Federica Gazzelloni, здесь собраны ее визуализации челленджей TidyTuesday, 30DayChartChallenge, 30DayMapChallenge и DuBoisChallenge с 2021 по 2024 год. Надо признаться, страница меня приятно удивила, достаточно нажать на изображение, чтобы найти вдохновение и узнать, как сделать подобную визуализацию на R.
Getting Started in R: Tinyverse 2nd Edition

Можно ли в R обойтись без Tidyverse? Мне {tidyverse} очень нравится не только своим подходом, следующим "принципу аккуратных данных", но и тем, что операции преобразования и визуализации данных логичны и его "глаголы" напоминают естественный язык. Тем не менее, Luis Apiolaza написал в свое время интересную серию статей Some love for Base R (часть 1, часть 2, часть 3, часть 4). Преимущество такого подхода - стабильность кода, вернетесь к коду через несколько лет - он работает, никакого перехода между версиями скорее всего не будет.

Основываясь на {data.table} и {tinyplot}, Saghir Bashir и Dirk Eddelbuettel сделали замечательное краткое введение в R на основе Tinyverse-подхода (less is more): такой подход означает меньший занимаемый объем, более быструю установку и, что наиболее важно, меньшее количество элементов в графе зависимостей.
Causality and Multiple Regression

Ben Rottman в рамках курса Open Source Research Methods for the Social Sciences сделал Shiny-приложение как инструмент, который поможет понять возможные взаимосвязи между переменными, включая различные эффекты в приложениях к причинно-следственным связям и множественной регрессией.

На приложение обратил внимание Joachim Schork, который ведет собственный YouTube-канал Statistics Globe по R (см. также обзор от H0H1: про HR-аналитику).
Model to Meaning (How to Interpret Statistical Models with marginaleffects for R and Python)

Представьте, что вы хотите узнать, как увеличение дохода на 1 000 рублей влияет на вероятность того, что человек купит страховку. Маргинальные эффекты - это способ понять, как изменение одного фактора влияет на результат в статистической моделии, при условии, что все остальные факторы остаются неизменными. Маргинальные эффекты помогают рассчитать «усредненное» влияние для всех наблюдений или для конкретной группы.

Есть хороший повод напомнить про книгу Model to Meaning по библиотеке marginaleffects, которая, по словам автора (Vincent Arel-Bundock) представляет простую, но мощную концептуальную структуру, помогающую аналитикам понимать сложные модели. Дело в том, что теперь книга доступна не только для пользователей R, но и Python и ее манускрипт отправляется в печать.

Это единая точка входа для интерпретации результатов более 100 различных типов статистических моделей и моделей машинного обучения в R и Python.
R Development Guide

В base R входит, по сути, всего 14 библиотек (Eyayaw Beze сделал небольшой обзор), которые можно посмотреть, например, с помощью



Руководство по разработке R - это всеобъемлющий ресурс для внесения для тех, кто хочет внести вклад в base R, охватывающее множесвто вопросов, начиная от отслеживания проблем, создания патчей, документирования, до тестирования предварительных версий и дополнительных вопросов.
Көрсөтүлдү 1 - 24 ичинде 122
Көбүрөөк функцияларды ачуу үчүн кириңиз.