Статья о классификации шифрованного трафика опубликована в IEEE ACCESS

В престижном научном журнале открытого доступа IEEE ACCESS вышла статья “Early Traffic Classification With Encrypted ClientHello: A Multi-Country Study”, написанная сотрудниками Лаборатории беспроводных сетей Данилом Шамсимухаметовым, Антоном Кураповым, Михаилом Любогощевым и Евгением Хоровым.

Ранняя классификация трафика (определение типа передаваемых данных, таких как видеотрафик, веб-трафик, телефония и т.д.) позволяет повысить качество обслуживания. В настоящее время более 97% мирового трафика шифруется с помощью протокола Transport Layer Security (TLS) и не содержит в явном виде тип передаваемых данных. Сейчас быстро и с высокой точностью классифицировать трафик позволяют несколько параметров, таких как доменное имя сервера, с которым устанавливает соединение клиент. Однако новая версия TLS Encrypted ClientHello (ECH) скроет и эти параметры, что существенно затруднит классификацию трафика в режиме реального времени.

Тем не менее, некоторые служебные параметры TLS ECH, несущие ненулевое количество информации о типе передаваемых данных, остаются открытыми. В опубликованной статье предлагается новый алгоритм классификации трафика hybrid Random Forest Traffic Classifier (hRFTC), использующий не только эти нешифрованные параметры, но и статистические признаки, такие как размеры пакетов и интервалы между их приходами. Для анализа его эффективности была собрана база данных шифрованного трафика шести стран Северной Америки, Европы и Азии. Результаты показывают, что использование одних лишь параметров TLS ECH обеспечивает качество классификации всего в 38,4% в метрике F-score. Между тем дополнительный учет статистических признаков позволяет достичь рекордной точности – 94,6% в метрике F-score на собранной базе данных.

Наш алгоритм hRFTC превзошел лучшие существующие классификаторы и может быть использован на промежуточных сетевых узлах для повышения качества обслуживания. С другой стороны, мы выявили оставшиеся утечки приватности шифрованного трафика, которые необходимо устранить в будущих версиях протоколов защиты транспортного уровня

комментирует Антон Курапов, студент базовой кафедры МФТИ, который проводил исследования в рамках работы над своей магистерской диссертацией.

Публикация результатов научной работы наших коллег – Данила Шамсимухаметова, Антона Курапова, Михаила Любогощева и Евгения Хорова – в престижном научном журнале IEEE ACCESS первого квартиля (Q1) осуществлена в рамках исследования, включенного в Госзадание ИППИ РАН.

Это уже вторая работа, опубликованная за последнее время сотрудниками Института в научном журнале мирового класса с высоким уровнем цитирования. С информацией о предыдущей научной публикации можно ознакомиться здесь.