Дистрибутив Manjaro внедряет систему отправки телеметрии о системе

Разработчики дистрибутива Manjaro Linux, построенного на основе Arch Linux и ориентированного на начинающих пользователей, объявили о начале тестирования нового сервиса MDD (Manjaro Data Donor), предназначенного для сбора статистики о системе и её отправке на внешний сервер проекта. Автор MDD намеревался включить отправку телеметрии по умолчанию (opt-out), но решение ещё не утверждено и, судя по возражениям некоторых разработчиков и пользователей, вероятно телеметрия будет предложена в виде опции, требующей предварительного согласия пользователя (запрос на включение телеметрии предлагается добавить в интерфейс приветствия после первой загрузки).

В качестве основного мотива отправки телеметрии по умолчанию называется желание улучшить подсчёт реальных пользователей дистрибутива, число которых до сих пор подсчитывалось через анализ запросов к хосту ping.manjaro.org, отправляемых через NetworkManager. По мнению разработчиков этого недостаточно, так как учёт пользователей в привязке к IP-адресу не является точным и не позволяет отслеживать статистику по системам во времени из-за того, что большинство пользователей не имеют постоянных IP-адресов или работают через трансляторы адресов.

Помимо получения информации о числе пользователей сервис MDD также позволит проанализировать сведения о применяемом оборудовании и выбранном пользователем программном окружении. MDD написан на языке Python и вызывает утилиту inxi с параметрами "-Fxxx" для получения полного отчёта с информацией о системе. Отчёт включает такие данные как имя хоста, версия ядра, версии компонентов рабочего стола, подробную информацию об оборудовании и задействованных драйверах, сведения о размере и разрешении экрана, MAC-адреса сетевых устройств, серийные номера дисков, данные о дисковых разделах, информацию о числе запущенных процессов и установленных пакетов, версии базовых пакетов, таких как systemd, gcc, bash и PipeWire.

Отправленные данные сохраняются на сервере проекта в СУБД ClickHouse и визуализируются при помощи платформы Grafana. IP-адреса пользователей не сохраняются, а в качестве идентификатора системы используется хэш от содержимого файла /etc/machine-id.