К числу факторов, оказывающих влияние на электропотребление города можно отнести такие факторы как: время года, различные метеофакторы, однако помимо них на электропотребление может оказывать влияние тип дня, например выходной или будничный.
В качестве объекта исследования выступает электроэнергетическая система в границах города Абакана за период 2009–2014 гг., все математические вычисления и графические построения производились на языке программирования R [1], который также является свободной программной средой вычислений с открытым исходным кодом.
На рисунке 1 представлен график почасовых значений электропотребления города Абакана за две недели.
Рисунок 1 – График почасовых значений электропотребления за две недели
Как видно из рисунка 1 при переходе от рабочих дней к выходным суточный профиль электропотребления меняет свою форму и величину, присутствует ярко выраженная недельная и суточная цикличность электропотребления.
Суточный профиль электропотребления определяется 24 значениями электропотребления в каждый час суток и может быть представлен точкой в 24-мерном пространстве, что вызывает затруднение при анализе данных.
«Лица Чернова»
Для анализа сходства и различий в электропотреблении разных типов суток был использован метод визуализации многомерных данных под названием «лица Чернова» (Chernoff Faces), разработанной в 1973 году американским математиком Германом Черновым [2]. Метод основан на том факте, что люди легко распознают лица других людей и без затруднения воспринимают небольшие изменения в них.
Лица Чернова являются одним из самых эффективных способов визуализации многомерных данных, и позволяет легко оценивать одновременно большое их количество. Способность к восприятию лиц других людей у человека развита сильнее всех остальных зрительных навыков. Особый участок коры головного мозга узнает лицо, определяет направление взгляда и т.д. Другие части мозга (миндалевидное тело и островковая доля) анализируют выражение лица, а участок в префронтальной зоне лобной доли и система мозга, отвечающая за чувство удовольствия, оценивают его красоту. Суть метода в том, что каждый элемент лица соответствует значению электропотребления определенных часов суток, причем, чем больше потребление, тем больших размеров соответствующий элемент лица. Например, высота лица соответствует электропотреблению в первый час суток, ширина лица – электропотреблению во второй час суток и т.д., метод данной визуализации представлен на рисунке 2.
Рисунок 2 – Метод визуализации многомерных данных – «Лица Чернова»
При этом в пакете R TeachingDemos [3], лица Чернова обладают всего 15 чертами: 1 – высота лица, 2 – ширина лица, 3 – форма лица, 4 – высоты рта, 5 – ширина рта, 6 – кривизна улыбки, 7 – высота глаз, 8 – ширина глаз, 9 – высота волос, 10 – ширина волос, 11 – стиль волос, 12 – высоты носа, 13 – ширина носа, 14 – ширина ушей, 15 – высота ушей. Для визуализации суточных профилей электропотребления с помощью лиц Чернова, необходимо сократить количество часов с 24 до 15, при этом необходимо, чтобы исключенные 9 часов не были столь важными. Для этого была построена корреляционная матрица, далее путем анализа данной матрицы, из двух часов электропотребления, которые имели коэффициент корреляции ближе к 1, один из этих часов не учитывался в дальнейшей визуализации лиц Чернова. В итоге при создании лиц Чернова не участвовали такие часы как 1, 3, 5, 8, 11, 15, 17, 20 и 24, так как оставшиеся 15 часов содержат в себе информации столько же, сколько и 24 исходных часов.
На рисунке 3 представлен график-пиктограмма «Лица Чернова», соответствующий суточным профилям за 4 недели лета, где столбцы соответствуют дням недели от понедельника до воскресенья.
Рисунок 3 – График-пиктограмма «Лица Чернова», соответствующий суточным профилям за 4 недели лета 2012 года
На рисунке 3 отчетливо видно сходство рабочих дней и их отличие от выходных, при этом электропотребление в будничные дни, судя по лицам, превышает электропотребление в выходные дни. Также можно заметить, что понедельник и вторник второй недели сильно отличаются от обычных рабочих дней, все дело в том, что на вторник выпал всероссийский праздник День России, при этом понедельник также был выходным, а суббота первой недели являлась рабочим днем, то есть предвыходным.
Анализ лиц позволил сделать нам предположение о том, что рабочие, идущие перед выходными, несколько отличаются от других рабочих дней.
Анализ главных компонент (PCA)
Для подтверждения предположения о том, что предвыходные дни отличаются от других рабочих дней был использован метод анализа главных компонент (principal component analysis, PCA), предназначенный для преобразования системы n исходных признаков в систему n новых показателей (главных компонент). При этом выявляются неявные, непосредственно неизмеряемые, но объективно существующие закономерности, обусловленные действием как внутренних, так и внешних причин [4].
При наличии результативного признака у может быть построено уравнение регрессии на главных компонентах.
Коэффициент корреляции рассчитывается по формуле [5]:
где
— среднее значение выборок.
Модель компонентного анализа имеет следующий вид:
(2)
где ajυ – «вес», т.е. факторная нагрузка v-ой главной компоненты на j-ю переменную;
fiυ – значение v-ой главной компоненты для i-го наблюдения ( = 1, 2, …, k).
В матричной форме модель имеет вид:
где F – матрица значений главных компонент размерности kxn;
A – матрица факторных нагрузок размерности nxn;
Матрица F описывает k наблюдений в пространстве n главных компонент. При этом элементы матрицы F нормированы, a главные компоненты не коррелированы между собой.
Элемент ajυ матрицы факторных нагрузок A характеризует тесноту линейной связи между исходной переменной zj и главной компонентой fυ (принимает значения от -1 до 1). В результате использования данного метода, можно решить проблему под названием «уменьшение размерности» (dimensionality reduction).
Главные компоненты упорядочены по величине их дисперсий, причем первая главная компонента имеет наибольшую дисперсию, а последняя – наименьшую. В частности, при использовании данного метода для анализа электропотребления города Абакана первые три главные компоненты содержат более 90% информации о суточных профилях электропотребления, о чем говорит график на рисунке 4.
Рисунок 4 – График, отражающий вклады каждой компоненты в разброс данных
На рисунках 5 и 6 приведены плоскости, образованные первой-второй и первой-третьей главными компонентами и проекции суточных профилей электропотребления ЭЭС Абакана с обозначением типа суток.
Рисунок 5 – Проекция суточных профилей на первую-вторую главные компоненты
Рисунок 6 – Проекция суточных профилей на первую-третью главные компоненты
где
0 – выходные дни;
1 – рабочие дни, в число которых не входят предвыходные;
2 – предвыходные рабочие дни.
В результате проведенного анализа было установлено, что профили электропотребления ЭЭС Абакана для рабочих и нерабочих суток отличаются значимо (образуют кластеры), при этом из рабочих суток с некоторыми допущениями могут быть выделены предвыходные сутки.
В заключение можно сделать вывод, что одним из важных факторов, оказывающих влияние на электропотребление малого города можно выделить тип суток.
Библиографический список
- Зарядов, И.С. Введение в статистический пакет R: учебно-методическое пособие / И.С. Зарядов – Москва: Издательство Российского университета дружбы народов, 2010. – 207 с.
- Chernoff H.: “Using faces to represent points in K-dimensional space graphically”, J. ASA, 1973, № 68.
- Шипунов, А.Б. Наглядная статистика. Используем R! / А.Б. Шипунов, Е.М. Балдин, П.А. Волкова и др. – М.: ДМК Пресс, 2012. – 298 с.
- Курс социально-экономической статистики / Под ред. М.Г. Назарова. – М.: ЮНИТИ-ДАНА, 2000. – 771 с.
- Гмурман В. Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 10-е издание, стереотипное. — Москва: Высшая школа, 2004. — 479 с.