Введение
В статье [5] описываются первые результаты исследования, проведенного для моделирования работы Центра тестирования (ЦТ) в составе Уральского государственного университета путей сообщения (УрГУПС). Он имеет основной зал на 100 компьютеризированных мест, специально предназначенный для проведения тестовых процедур. Рассматривалось в сравнении два режима организации входного потока в ЦТ: а) тестирование по предварительной записи с резервированием периода 105 минут на тест (что соответствует двум академическим часам и переменам в сетке расписания) оказывается удобным для группового объемного тестирования, но малопроизводительным способом работы; б) тестирование без предварительной записи «по живой очереди» способно обеспечить на том же количестве компьютеров в 2,5 – 3 раза больше индивидуальных тестов, однако несет риск возникновения очереди.
Основной практически значимый результат статьи [5] – определение с помощью методов теории очередей «критических интенсивностей» входного потока заявок (студентов, являющихся на тестирование), при которых вероятность наблюдения очереди составляет 10% в зависимости от количества используемых посадочных мест. Этот результат аналитически получен в предположении о том, что входной поток заявок является простейшим, а время обслуживания заявки (то есть время индивидуального тестирования) подчиняется показательному закону. Однако в самой статье есть указание на существенные отклонения действительности от этих предположений:
– Так как количество заданий в индивидуальном тесте не бывает меньше пяти (а требуется ещё фиксированное время на загрузку теста), то доля тестирований с относительно коротким временем должна быть меньше, чем предсказывается показательной зависимостью, что подтверждается приведенными статистическими данными.
– Так как работа ЦТ в течение семестра неотрывно связана с сеткой расписания, возможны существенные неоднородности интенсивности во входящем потоке заявок (обращающихся в ЦТ студентов), поток студентов оказывается неравномерным.
В книге [1] указывается, что такие отклонения часто не являются разрушающими для основных выводов о распределении состояний и производительности СМО а, наоборот, являются причиной сдвигов в сторону её меньшей, по сравнению с расчетной, загруженности. Тем не менее, требуется непосредственное подтверждение выводов статьи [5] и правомерности применения теории очередей к рассматриваемой системе. Преследованию этой цели (через преодоление методических затруднений) и посвящена данная работа. В ней предпринято имитационное моделирование эволюции марковской цепи с приведенным ниже графом (значение N – количество посадочных мест).
Этот граф повторяет структуру модели, выработанную в [5], но вместо теоретически полагаемых значений интенсивностей входного потока (определяющих все его свойства через известные закономерности) и интенсивностей обратных переходов, пропорциональных номеру состояния, для описания всех событий (переходов) используются произвольно выбранные последовательности. При многократной реализации каждого состояния определяется доля времени, проведенного системой в каждом состоянии, которая интерпретируется как вероятность наблюдения этого состояния и её можно сравнить с результатом аналитического расчета. Вычисления проводились с помощью процессора электронных таблиц MS Excel.
1. Отклонения в статистике времени тестирования от показательного закона
Модель, на которую опираются вычислительные техники теории очередей, предполагает показательное распределение для времени обслуживания заявки (показано на графике линией). В [2] и [4] для моделирования времени обслуживания заявки предполагалось, что эта величина имеет нормальное распределение. Непосредственное статистическое исследование, результаты которого проводятся нами в [5], основано на фактических данных о 2,2 тыс. индивидуальных тестов из 190 протоколов тестирования, проведенных преподавателями УрГУПС с помощью Единого портала интернет-тестирования в сфере образования [3], и оно показывает, что обе альтернативы, предположения о показательном или нормальном законах распределения, не хороши. Для такой формы гистограммы можно было бы привлечь аппарат на основе гамма-распределения (родственного к показательному), однако мы предпочли другой путь. Для моделирования продолжительности индивидуального тестирования были взяты данные из протоколов тестирования на 4-15 заданий в случайном порядке с добавлением к каждому случаю 8 минут для получения среднего времени тестирования 0,5 часа, как в аналитическом расчете в [5]. Общее количество событий начала тестирования оказалось близким к 1,5 тыс., соответственно, в каждом подходе в моделируемой марковской цепи было разыграно около 3 тыс. событий, связанных с увеличением или уменьшением текущего номера состояния, а накопленные результаты «наблюдений» можно считать статистически значимыми.
Для моделирования входного потока при разном возможном количестве мест в ЦТ ( n = 10, 20, … 100) были взяты только выявленные в [5] критические интенсивности входного потока студентов. Предполагались случайные моменты явки студента в ЦТ с такими интенсивностями, для чего была разыграна случайная равномерно распределенная величина. При наличии состояния «очередь» момент начала тестирования переносился до освобождения места в ЦТ.
Таким образом, были получены распределения вероятности состояний, которые можно сравнить с предыдущими аналитическими результатами. Характерные зависимости приведены на следующем графике.
Для лучшего понимания различий между результатами имитационного и аналитического моделирования данные представлены на следующих сравнительных графиках (аналитическая зависимость – кривой линией).
Эти графики демонстрируют, что результаты аналитического моделирования удовлетворительно предсказывают максимум и размытость распределений, полученных с помощью приемов имитации. Однако аналитические предсказания для вероятности очереди оказываются завышенными, и аналитическое моделирование не предсказывает небольшой максимум в области начальных состояний СМО, что объясняется выявленными отклонениями распределения времени на тест от показательного распределения с аналогичным средним значением. В целом, аналитическое моделирование, при его технологической простоте, дало удовлетворительную оценку для имитационной заполненности ЦТ и предсказывает несколько ухудшенные показатели его работы. Это позволяет не привлекать имитационные процедуры при уточнении опытных значений параметров марковской цепи, а ограничиваться аналитическим расчетом.
2. Неравномерности входного потока заявок
Для изучения влияния, которое оказывают неравномерности в потоке входящих заявок, нами были использованы манипуляции с моделируемым временем явки студентов в ЦТ (при сохранении случайной продолжительности теста, как в предыдущем случае). Здесь мы ограничились только вариантом полного использования объема ЦТ, всех ста мест и критической интенсивности входного потока заявок 173 чел./час, определенной в [5].
Во-первых, было испытано предположение о регулярной явке студентов с равным интервалом (случай А), заполненность ЦТ проиллюстрирована на гистограмме в сравнении с аналитическим расчетом. Моды распределений совпадают, однако очередь совсем не возникает, а в 5% вероятностью, наоборот, модель предсказывает полное освобождение ЦТ от студентов.
Во-вторых, была изучена работа ЦТ в предположении о том, что все студенты, которые должны явиться в ЦТ за 105 минут, что соответствует двум академическим часам и переменам, то есть около трехсот человек (при интенсивности 173 чел/час и периоде 1,75 часа) окажутся в ЦТ в первые 0,5 часа этого периода (случай Б). Результаты моделирования показывают, что функционирование ЦТ за цикл последовательно походит несколько качественно различных этапов:
– Все посадочные места в ЦТ быстро заполняются с дальнейшим накоплением очереди в первые 10 минут цикла.
– Практически сразу начинается выход первых студентов после тестирования и медленное движение очереди, которая продолжает накапливаться и достигает длины 150 человек к сроку 30 минут от начала цикла.
– Очередь непрерывно существует 60% времени, то есть около часа, к концу этого срока скорость её движения стабилизируется.
– В последние 30-40 минут цикла очередь исчезает, однако Центр тестирования не освобождается полностью, к началу следующего цикла остаются занятыми 20-30 мест, студенты заканчивают тест на фоне начала следующего цикла. Это случаи продолжительного тестирования, которое началось поздно из-за долгого ожидания в очереди.
Основные выводы
Результаты аналитического и имитационного моделирования работы ЦТ (в предположении о случайной, но равномерной явке студентов на тест) практически совпадают. Отклонения в законе распределения продолжительности тестирования от предполагаемых теорией очередей не оказывают заметного влияния на заполнение ЦТ. В этой ситуации предпочтительней использовать аналитические процедуры.
Значительное влияние на функционирование ЦТ оказывает неравномерности в потоке входящих заявок, вызванные необходимостью сочетания тестирования и сетки расписания занятий. Центр тестирования сохраняет способность справится с потоком критической интенсивности, но при этом время ожидания студентом в очереди может превышать время теста, а очередь существует неудовлетворительно долго. В этой связи отметим, что для первых месяцев каждого семестра характерен настолько слабый поток входящих заявок (тестируются только отставшие от своих групп студенты), что Центр тестирования сокращает время работы и проблема становится неактуальной. В последний месяц семестра Центр тестирования работает достаточно напряженно и описанный неприятный эффект имеет место. Однако во время наиболее массового тестирования (предсессионная неделя и сессия) сетка расписания занятий не действует и эффект смягчается.