Классификация криптоактивов: кластерный анализ на основе доходности | IF | 19.05.2019
banner
banner

Классификация криптоактивов: кластерный анализ на основе доходности

06:38 19.05.2019

Что методы кластерного анализа могут рассказать о Bitcoin, Ripple и других криптоактивах. Отчет Binance Research.

Резюме

  • Используя корреляционную матрицу и иерархическую кластеризацию, класс цифровых активов можно разделить на несколько подсегментов.

    • В отношении недельной доходности крупные криптоактивы, такие как Bitcoin и Ethereum, демонстрируют высочайшую корреляцию, при этом Ripple показывает меньший уровень корреляции и является лучшим диверсификатором среди криптоактивов с рыночной капитализацией свыше 3 млрд долларов.

    • Форки Биткойна (Gold и Cash), Ethereum Classic и Litecoin образуют единый кластер, тогда как остальные активы образуют группы на основе следующих эффектов:

      • “Binance-эффект”: Tezos и Dogecoin, два актива, не торгуемых на Binance, образуют один дочерний кластер.

      • Потенциальные географические эффекты, такие как дихотомия между американскими и азиатскими криптоактивами.

      • «Эффект листинга на Coinbase»: некоторые активы, уже включенные в листинг Coinbase либо о них сообщалось, что Coinbase исследует возможность введения их поддержки, по-видимому, принадлежат к аналогичным группам.

      • Конфиденциальные койны (Dash и Monero) формируют единый кластер.

    • С другой стороны кластеризация методом k-средних на основе профиля риск/доходность каждого криптоактива не принесла сколько-нибудь значимых результатов. Одно из возможных объяснений заключается в том, что профили доходности и волатильности не связаны с корреляцией курса активов в течение исследуемого периода.

В предыдущем отчете (англ.) мы использовали для анализа внутренних корреляций крипторынка и наблюдения циклических паттернов метод, охватывающий различные группы активов, и обнаружили, что низкий уровень внутренней корреляции между активами в криптосфере часто бывает обусловлен идиосинкратическими факторами, в дополнение к механизму консенсуса монеты и потенциальному “Binance-эффекту”.

Однако общая корреляция, наблюдаемая на рынке криптоактивов, увеличилась, что может быть связано с ростом объемов стейблкойнов и, следовательно, увеличением количества торговых пар на всех рынках криптоактивов. Это отчет о кластерном анализе, проведенном Binance Research на основе данных о двенадцати торговых месяцах с марта 2018 по март 2019 года, чтобы определить, можно ли определить и, что еще важнее, интерпретировать кластеры криптоактивов методом неконтролируемого обучения.

1. Методология

«Кластерный анализ – это метод, используемый для объединения в группы наборов объектов, имеющих схожие характеристики. Это обычная практика в области статистики, но инвесторы могут использовать метод для построения диверсифицированного портфолио. Активы, характеризующиеся высокой корреляцией доходности, попадают в одну корзину, несколько менее высокой – в другую и т.д., пока каждый актив не будет определен в ту или иную категорию».

(Источник: Investopedia)

1.1 Входные данные

Для 30 криптоактивов с наибольшей рыночной капитализацией, на основе данных CoinMarketCap были получены цены в долларовом эквиваленте.

Стейблкойны исключены из анализа, равно как и любые криптоактивы, обеспеченными другими активами, будь то цифровыми или физическими (включая индексы). Для рыночной капитализации криптоактивов «без обеспечения» было рассчитано 30-дневное скользящее среднее (по состоянию на 31 марта 2019 г.) и на основе полученных значений было выбрано 30 крупнейших активов.

Период сбора данных охватывает полный год с 31 марта 2018 по 31 марта 2019 года.

1.2 Выбор алгоритма

Кластерные алгоритмы – это один из подвидов алгоритмов неконтролируемого обучения. В таблице ниже показаны различия между двумя наиболее распространенными кластерными алгоритмами: методом k-средних и иерархической кластеризацией. Подробнее об этом можно прочитать в этой статье (англ.).

Таблица 1: Сравнение кластеризации методом k-средних и иерархической кластеризации

Метод k-средних

Иерархическая кластеризация

Размер набора данных

Большие наборы данных

Малые наборы данных

Определение количества кластеров

Предварительно задано вручную

Автоматическое

Секционирование

Однократное

Многократное

Подход

Эвристический

Снизу вверх (агломеративный)

Сверху вниз (дивизивный)

1.2.1 Методология иерархической кластеризации

1. Данные были предварительно обработаны с помощью корреляционной матрицы, основанной на недельной доходности в течение 1 года. Таким образом, было получено 52 наблюдения. Эта корреляционная матрица фиксирует меняющиеся взаимодействия нормализованным образом. В результате это упрощает расчеты за счет отсеивания большого количества нерелевантной информации.

2. Состав каждого кластера отражен на дендрограмме: неодиночный кластер связывается с дочерними посредством U-образных перемычек. Высота U-образной перемычки представляет расстояние между ее группами дочерних кластеров, а также кофенетическое расстояние между исходными наблюдениями в двух группах дочерних кластеров.

Используется евклидово расстояние (т.е. L2-расстояние); метод связывания опирается на метод Варда («Ward»), минимизирующий внутрикластерную дисперсию.

1.2.1 Методология кластеризации методом k-средних

  • Недельная доходность рассчитывалась для 30 активов с наибольшей рыночной капитализацией.

  • На основе этих значений недельной доходности рассчитывали годовую волатильность и среднегодовую доходность.

годовая доходность = (1 + средняя недельная доходность)52 -1 годовая волатильность = стандартное отклонение недельной доходности x √ 52

Никита  Марычев
Никита Марычев

Автор и по совместительству редактор сайта

Копировать ссылку