Что методы кластерного анализа могут рассказать о Bitcoin, Ripple и других криптоактивах. Отчет Binance Research.
Используя корреляционную матрицу и иерархическую кластеризацию, класс цифровых активов можно разделить на несколько подсегментов.
В отношении недельной доходности крупные криптоактивы, такие как Bitcoin и Ethereum, демонстрируют высочайшую корреляцию, при этом Ripple показывает меньший уровень корреляции и является лучшим диверсификатором среди криптоактивов с рыночной капитализацией свыше 3 млрд долларов.
Форки Биткойна (Gold и Cash), Ethereum Classic и Litecoin образуют единый кластер, тогда как остальные активы образуют группы на основе следующих эффектов:
“Binance-эффект”: Tezos и Dogecoin, два актива, не торгуемых на Binance, образуют один дочерний кластер.
Потенциальные географические эффекты, такие как дихотомия между американскими и азиатскими криптоактивами.
«Эффект листинга на Coinbase»: некоторые активы, уже включенные в листинг Coinbase либо о них сообщалось, что Coinbase исследует возможность введения их поддержки, по-видимому, принадлежат к аналогичным группам.
Конфиденциальные койны (Dash и Monero) формируют единый кластер.
С другой стороны кластеризация методом k-средних на основе профиля риск/доходность каждого криптоактива не принесла сколько-нибудь значимых результатов. Одно из возможных объяснений заключается в том, что профили доходности и волатильности не связаны с корреляцией курса активов в течение исследуемого периода.
В предыдущем отчете (англ.) мы использовали для анализа внутренних корреляций крипторынка и наблюдения циклических паттернов метод, охватывающий различные группы активов, и обнаружили, что низкий уровень внутренней корреляции между активами в криптосфере часто бывает обусловлен идиосинкратическими факторами, в дополнение к механизму консенсуса монеты и потенциальному “Binance-эффекту”.
Однако общая корреляция, наблюдаемая на рынке криптоактивов, увеличилась, что может быть связано с ростом объемов стейблкойнов и, следовательно, увеличением количества торговых пар на всех рынках криптоактивов. Это отчет о кластерном анализе, проведенном Binance Research на основе данных о двенадцати торговых месяцах с марта 2018 по март 2019 года, чтобы определить, можно ли определить и, что еще важнее, интерпретировать кластеры криптоактивов методом неконтролируемого обучения.
Для 30 криптоактивов с наибольшей рыночной капитализацией, на основе данных CoinMarketCap были получены цены в долларовом эквиваленте.
Стейблкойны исключены из анализа, равно как и любые криптоактивы, обеспеченными другими активами, будь то цифровыми или физическими (включая индексы). Для рыночной капитализации криптоактивов «без обеспечения» было рассчитано 30-дневное скользящее среднее (по состоянию на 31 марта 2019 г.) и на основе полученных значений было выбрано 30 крупнейших активов.
Период сбора данных охватывает полный год с 31 марта 2018 по 31 марта 2019 года.
Кластерные алгоритмы – это один из подвидов алгоритмов неконтролируемого обучения. В таблице ниже показаны различия между двумя наиболее распространенными кластерными алгоритмами: методом k-средних и иерархической кластеризацией. Подробнее об этом можно прочитать в этой статье (англ.).
Таблица 1: Сравнение кластеризации методом k-средних и иерархической кластеризации
1. Данные были предварительно обработаны с помощью корреляционной матрицы, основанной на недельной доходности в течение 1 года. Таким образом, было получено 52 наблюдения. Эта корреляционная матрица фиксирует меняющиеся взаимодействия нормализованным образом. В результате это упрощает расчеты за счет отсеивания большого количества нерелевантной информации.
2. Состав каждого кластера отражен на дендрограмме: неодиночный кластер связывается с дочерними посредством U-образных перемычек. Высота U-образной перемычки представляет расстояние между ее группами дочерних кластеров, а также кофенетическое расстояние между исходными наблюдениями в двух группах дочерних кластеров.
Используется евклидово расстояние (т.е. L2-расстояние); метод связывания опирается на метод Варда («Ward»), минимизирующий внутрикластерную дисперсию.
Недельная доходность рассчитывалась для 30 активов с наибольшей рыночной капитализацией.
На основе этих значений недельной доходности рассчитывали годовую волатильность и среднегодовую доходность.