Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

RESEARCH MINING PROGRAMS OF INFORMATION SYSTEM

Mikhalchenko S.V. 1
1 Volgograd State University
S. V. Mikhalchenko Volgograd state University, e-mail: [email protected] To ensure the protection of information systems, it is required to constantly analyze its events to detect attempts to implement attacks. According to statistics, there are always new types of attacks on information systems, such attacks can not be detected using conventional anti-virus software and other types of protection based on the signature method. Therefore, it is rational to use special methods for detecting anomalies, including intellectual analysis. He analyzes the events occurring in the information system with the help of neural networks, allowing to detect new types of attacks. Programs of mining of information system’s events are analyzed and the criteria for their evaluation are formulated. Software tool that allows you to produce automated calculation of the generalized evaluation of programs of analysis is developed. Experimental studies in which we determined the most rational program of intelligent analysis of information system’s events are carried out.
information security
mining
neural networks
statistica automated neural networks
deductor studio
neural network toolbox
membrain neural network
neuro solutions

По статистике количество образцов новых атак, совершаемых на системы, постоянно растет.

Рис. 1 – Количество новых типов атак за 2015-2016гг

Неспособность обнаруживать новые образцы атак – недостаток современных систем обнаружения атак. Чтобы устранить данный недостаток внедряются интеллектуальные подходы к анализу данных для обнаружения атак.

Под интеллектуальным анализом будем понимать анализ с использованием систем искусственного интеллекта. В настоящее время, существует большое количество СИИ, из них можно выделить:

1. Генетические алгоритмы.

2. Экспертные системы.

3. Искусственные иммунные системы.

4. Искусственные нейронные сети.

Для того, чтобы выбрать определенную область систем искусственного интеллекта, необходимо их сравнить между собой. В таблице 1 представлен сравнительный анализ систем искусственного интеллекта (СИИ), произведенный на основе экспертной оценки:

Таблица 1

Название СИИ

Необходимость обучения

Сложность функционирования

Решаемые задачи

Генетические алгоритмы

нет

низкая

- Оптимизация;

Экспертные системы

да

средняя

- Прогнозирование;

- Оптимизация.

Искусственные иммунные системы

да

высокая

- Оптимизация;

- Распознавание образов;

- Классификация.

Искусственная нейронная сеть

Да

средняя

- Оптимизация;

- Распознавание образов;

- Прогнозирование;

- Классификация.

 

Исходя из того, что нейронная сеть обладают наилучшим набором критериев, исходя из спектра решаемости задач и сложности функционирования для дальнейшей реализации было выбрано именно это направление в системах искусственного интеллекта.

Ввиду этого актуальным является выбор наиболее рациональной программы интеллектуального анализа событий информационной системы (ИС) с помощью нейронных сетей [1, C.162].

Существует множество программ для интеллектуального анализа событий ИС, но здесь будет рассмотрено 5 программ, наиболее функциональных и популярных:

1. STATISTICA Automated Neural Networks (SANN) - программный пакет для создания и обучения нейронных сетей, который решает большой спектр задач [2, С. 168].

2. Deductor Studio – аналитическая платформа, которая позволяет на базе единой архитектуры пройти все этапы построения аналитической системы: от консолидации данных до построения моделей и визуализации полученных результатов [3, C. 37].

3. Neural network toolbox (NNTool) – пакет расширения MATLAB, содержащий средства для проектирования, моделирования, разработки и визуализации нейронных сетей [2, С. 169].

4. MemBrain Neural Network – представляет собой мощный графический редактор и симулятор нейронных сетей, поддерживающий нейронные сети различных архитектур любого размера.

5. Neuro Solutions - сверхсовременный программный пакет совмещает модульный, с иконным представлением, интерфейс разработки нейронной сети, с реализацией усовершенствованных процедур обучения [5].

Чтобы оценить качество выделенных программ были сформулированы критерии для их оценки [4]:

  • Скорость обучения (К1) – определяет время, затрачиваемое на расчет величин весов связей между нейронами, отвечающих требованиям точности;
  • Понятный графический интерфейс (К2) – наличие удобного и интуитивно понятного пользователю интерфейса;
  • Наглядность информации (К3) – наличие возможности графического представления информации по окончанию обучения и моделирования нейронной сети (НС);
  • Реализация основных видов НС и алгоритмов обучения (К4) – возможность реализация как можно большего количества стандартных видов НС и алгоритмов их обучения;
  • Создание своих структур НС (К5) – возможность создания собственных структур НС, позволяющих указывать такие параметры как: тип сети, количества, размера скрытых слоев и т.д.;
  • Использование собственных алгоритмов (К6) – возможность подключения собственных алгоритмов обучения в виде программных модулей;
  • Автоматизированное формирование НС (К7) – возможность подбора наилучших параметров автоматически, что облегчает использование такой программы;
  • Процедура импорта результатов (К8) –возможность сохранять результаты в различные файлы и передавать их в приложения;
  • Генератор исходного кода (К9) – возможность сгенерировать исходный программный код нейросетевых моделей на различных языках программирования;
  • Взаимосвязь (корреляция) событий (К10) – возможность учитывать то, как события связаны между собой. Если в пакете предусмотрено такая функция, то это позволяет обнаруживать атаки, которые состоят из нескольких шагов.

В таблице 2 приведены качественные значения критериев для выделенных программ.

Таблица 2

Нейросетевые программы

Критерии оценки

К1

К2

К3

К4

К5

К6

К7

К8

К9

К10

STATISTICA Automated Neural Networks

высокая

да

средняя

высокая

да

да

да

средняя

да

да

Deductor Studio

высокая

да

высокая

средняя

нет

нет

нет

высокая

нет

да

Neural network toolbox

низкая

нет

низкая

средняя

нет

нет

нет

низкая

нет

да

MemBrain Neural Network

высокая

нет

низкая

низкая

да

да

да

средняя

да

нет

Neuro Solutions

средняя

нет

средняя

средняя

да

да

нет

средняя

да

нет

 

Так как ни одна из программ не обладает наилучшим набором значений критериев, необходимо разработать программное средство для автоматизации выбора наиболее рациональной программы интеллектуального анализа событий информационной системы.

Для этого нужно разработать математическую модель, реализующую эту оценку.

Сформируем вектор критериев К = (К1, К2, К3, К4, К5, К6, К7, К8, К9, К10), где критерии принимают следующие значения:

Существует наилучший вектор , в котором все значения критериев соответствуют максимальным значениям. Для всех критериев это значение 1.

.

Для оценки качества нейросетвых пакетов вводится скалярная величина, равная Эвклидовому расстоянию между наилучшим вектором и вектором критериев, полученным для i-го оцениваемого метода:

Эвклидово расстояние рассчитывается по формуле (1).

. (1)

Нейросетевой пакет, для которого расстояние до наилучшего вектора окажется наименьшим, можно считать наиболее рациональным пакетом для работы с нейронными сетями.

Было проведено 5 экспериментов, в результате которых получены следующие значения обобщенных оценок для каждого нейросетевого пакета, представленные на рис. 1:

1. STATISTICA Automated Neural Networks 0,7071067811865;

2. Deductor Studio - 2,0615528128088;

3. Neural network toolbox - 2,8722813232690;

4. MemBrain Neural Network - 2,0615528128088;

5. Neuro Solutions – 2.

Рис. 2 – Обобщенные оценки нейросетевых пакетов

Сравнив полученные результаты, можно прийти к выводу, что наиболее рациональной программой является STATISTICA Automated Neural Networks. У этой программы значения критерия 4 «Реализация основных видов НС и алгоритмов обучения» и критерия 7 «Наличие автоматизированной НС» имеют наивысшие показатели, среди всех анализируемых программ.