Классификация криптоактивов: кластерный анализ на основе доходности

06:38 19.05.2019

Что методы кластерного анализа могут рассказать о Bitcoin, Ripple и других криптоактивах. Отчет Binance Research.

Резюме

Используя корреляционную матрицу и иерархическую кластеризацию, класс цифровых активов можно разделить на несколько подсегментов.
- В отношении недельной доходности крупные криптоактивы, такие как Bitcoin и Ethereum, демонстрируют высочайшую корреляцию, при этом Ripple показывает меньший уровень корреляции и является лучшим диверсификатором среди криптоактивов с рыночной капитализацией свыше 3 млрд долларов.
- Форки Биткойна (Gold и Cash), Ethereum Classic и Litecoin образуют единый кластер, тогда как остальные активы образуют группы на основе следующих эффектов:
- - “Binance-эффект”: Tezos и Dogecoin, два актива, не торгуемых на Binance, образуют один дочерний кластер.
  - Потенциальные географические эффекты, такие как дихотомия между американскими и азиатскими криптоактивами.
  - «Эффект листинга на Coinbase»: некоторые активы, уже включенные в листинг Coinbase либо о них сообщалось, что Coinbase исследует возможность введения их поддержки, по-видимому, принадлежат к аналогичным группам.
  - Конфиденциальные койны (Dash и Monero) формируют единый кластер.
- С другой стороны кластеризация методом k-средних на основе профиля риск/доходность каждого криптоактива не принесла сколько-нибудь значимых результатов. Одно из возможных объяснений заключается в том, что профили доходности и волатильности не связаны с корреляцией курса активов в течение исследуемого периода.

В предыдущем отчете (англ.) мы использовали для анализа внутренних корреляций крипторынка и наблюдения циклических паттернов метод, охватывающий различные группы активов, и обнаружили, что низкий уровень внутренней корреляции между активами в криптосфере часто бывает обусловлен идиосинкратическими факторами, в дополнение к механизму консенсуса монеты и потенциальному “Binance-эффекту”.

Однако общая корреляция, наблюдаемая на рынке криптоактивов, увеличилась, что может быть связано с ростом объемов стейблкойнов и, следовательно, увеличением количества торговых пар на всех рынках криптоактивов. Это отчет о кластерном анализе, проведенном Binance Research на основе данных о двенадцати торговых месяцах с марта 2018 по март 2019 года, чтобы определить, можно ли определить и, что еще важнее, интерпретировать кластеры криптоактивов методом неконтролируемого обучения.

1. Методология

1.1 Входные данные

Для 30 криптоактивов с наибольшей рыночной капитализацией, на основе данных CoinMarketCap были получены цены в долларовом эквиваленте.

Стейблкойны исключены из анализа, равно как и любые криптоактивы, обеспеченными другими активами, будь то цифровыми или физическими (включая индексы). Для рыночной капитализации криптоактивов «без обеспечения» было рассчитано 30-дневное скользящее среднее (по состоянию на 31 марта 2019 г.) и на основе полученных значений было выбрано 30 крупнейших активов.

Период сбора данных охватывает полный год с 31 марта 2018 по 31 марта 2019 года.

1.2 Выбор алгоритма

Кластерные алгоритмы – это один из подвидов алгоритмов неконтролируемого обучения. В таблице ниже показаны различия между двумя наиболее распространенными кластерными алгоритмами: методом k-средних и иерархической кластеризацией. Подробнее об этом можно прочитать в этой статье (англ.).

Таблица 1: Сравнение кластеризации методом k-средних и иерархической кластеризации

1.2.1 Методология иерархической кластеризации

1. Данные были предварительно обработаны с помощью корреляционной матрицы, основанной на недельной доходности в течение 1 года. Таким образом, было получено 52 наблюдения. Эта корреляционная матрица фиксирует меняющиеся взаимодействия нормализованным образом. В результате это упрощает расчеты за счет отсеивания большого количества нерелевантной информации.

2. Состав каждого кластера отражен на дендрограмме: неодиночный кластер связывается с дочерними посредством U-образных перемычек. Высота U-образной перемычки представляет расстояние между ее группами дочерних кластеров, а также кофенетическое расстояние между исходными наблюдениями в двух группах дочерних кластеров.

Используется евклидово расстояние (т.е. L2-расстояние); метод связывания опирается на метод Варда («Ward»), минимизирующий внутрикластерную дисперсию.

1.2.1 Методология кластеризации методом k-средних

Недельная доходность рассчитывалась для 30 активов с наибольшей рыночной капитализацией.
На основе этих значений недельной доходности рассчитывали годовую волатильность и среднегодовую доходность.

Экономика

Криптовалюта

Никита Марычев

Автор

Копировать ссылку