<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Электронный научно-практический журнал «Современная техника и технологии» &#187; метод Шеффе</title>
	<atom:link href="http://technology.snauka.ru/tags/metod-sheffe/feed" rel="self" type="application/rss+xml" />
	<link>https://technology.snauka.ru</link>
	<description></description>
	<lastBuildDate>Fri, 30 Jan 2026 18:56:12 +0000</lastBuildDate>
	<language>ru</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Применение однофакторного анализа для оценки производительности системы с помощью программы STATISTICA</title>
		<link>https://technology.snauka.ru/2015/12/8849</link>
		<comments>https://technology.snauka.ru/2015/12/8849#comments</comments>
		<pubDate>Fri, 25 Dec 2015 13:40:07 +0000</pubDate>
		<dc:creator>Щукова Кристина Борисовна</dc:creator>
				<category><![CDATA[Общая рубрика]]></category>
		<category><![CDATA[критерий Краскала-Уоллиса]]></category>
		<category><![CDATA[метод Шеффе]]></category>
		<category><![CDATA[однофакторный анализ]]></category>
		<category><![CDATA[программа STATISTICA]]></category>

		<guid isPermaLink="false">https://technology.snauka.ru/?p=8849</guid>
		<description><![CDATA[Введение В настоящее время статистические методы широко применяются в сфере информационных технологий для анализа данных. Целью исследования является оценка производительности системы при внедрении новых алгоритмов в систему [1]. Предположим, разработано три алгоритма A1, A2 и А3 для существующей системы обработки информации. Чтобы оценить, как изменится производительность системы при внедрении алгоритмов, проведено их тестирование на различных [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Введение</strong></p>
<p>В настоящее время статистические методы широко применяются в сфере информационных технологий для анализа данных. Целью исследования является оценка производительности системы при внедрении новых алгоритмов в систему [1]. Предположим, разработано три алгоритма A1, A2 и А3 для существующей системы обработки информации.</p>
<p>Чтобы оценить, как изменится производительность системы при внедрении алгоритмов, проведено их тестирование на различных наборах данных. Результаты тестов алгоритмов и производительность системы представлены в таблице 1.</p>
<p style="text-align: center;" align="right">Таблица 1. Производительность системы для трех алгоритмов</p>
<div align="center"><a href="https://technology.snauka.ru/2015/12/8849/snimok-14" rel="attachment wp-att-8900"><img class="size-full wp-image-8900 aligncenter" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok9.png" alt="" width="1040" height="379" /></a></div>
<div style="text-align: left;" align="center">
<p style="text-align: left;">Выдвинута нулевая гипотеза – производительность системы принадлежит одному и тому же распределению. То есть, влияние фактора (внедрение нового алгоритма) несущественно. Выдвинута альтернативная гипотеза влияние фактора (внедрение нового алгоритма) существенное. Необходимо выяснить, влияет ли тип алгоритма на производительность системы.</p>
</div>
<div style="text-align: left;" align="center"><strong>Описание процесса исследования</strong></div>
<div style="text-align: left;" align="center">
<p>В пакете Statistica были созданы три переменные Number, TypeOfAlgorithm и System_Power.</p>
</div>
<div style="text-align: left;" align="center">В таблице 2 приведены созданные переменные.</div>
<div style="text-align: center;" align="center">Таблица 2. Созданные переменные</div>
<div style="text-align: right;" align="center"><a href="https://technology.snauka.ru/2015/12/8849/snimok-5" rel="attachment wp-att-8878"><img class="size-full wp-image-8878 aligncenter" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok.png" alt="" width="417" height="623" /></a></div>
<div style="text-align: left;" align="center">На первом шаге проверен критерий Краскела- Уоллиса.</div>
<div style="text-align: left;" align="center">
<p>В качестве зависимой переменной была выбрана производительность системы, а независимой – тип алгоритма. Для группировки были выбраны все переменные.</p>
<p>Результат теста Краскела &#8211; Уоллиса представлен на рисунке 1.</p>
<p style="text-align: center;"><a href="https://technology.snauka.ru/2015/12/8849/snimok-6" rel="attachment wp-att-8879"><img class="size-full wp-image-8879 aligncenter" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok1.png" alt="" width="484" height="175" /></a></p>
<p align="center">Рисунок 1. Результат теста Краскела &#8211; Уоллиса</p>
</div>
<div style="text-align: left;" align="center">
<p>В приведенных результатах приняты следующие обозначения:<strong> Codes – </strong>уникальный код группы (число); <strong>Valid N –</strong> число значений в группе; <strong>Sum</strong><strong> </strong><strong>of</strong><strong> </strong><strong>Ranks</strong><strong> – </strong>сумма рангов; <strong>H – </strong>статистика Краскела &#8211; Уоллиса; <strong>р – </strong>вероятность принятия гипотезы Н<sub>0</sub>.</p>
<p>Анализируя суммы рангов, представленные на рисунке 1,  можно говорить о влиянии уровня фактора (тип  алгоритма)  на производительность. Из результатов видно, что лучшая производительность системы обеспечивается за счет алгоритма A2, а худшая – за счет А1. В статистике Краскела – Уоллиса вычисляется сумма квадратов разностей средних рангов в группе и среднего ранга по всей выборке. Если верна гипотеза и влияние фактора незначимо, то значение статистики мало. Из рисунка 1 видно, что p=0.0076. Поскольку заданный уровень значимости <em>α = </em>0.05 больше p=0.0076, то нулевая гипотеза отвергается в пользу альтернативной гипотезы <em>H</em><sub>1</sub> – влияние фактора (тип алгоритма) на производительность системы существенное.</p>
<p>На следующем этапе был сделан медианный тест [2]. Результаты медианного теста представлены на рисунке 2. В верхней части таблицы приведены количества рангов в группах, которые были меньше или равны медиане. В нижней части таблицы – аналогичные значения, превышающие значение медианы.</p>
<p align="center"><a href="https://technology.snauka.ru/2015/12/8849/snimok-7" rel="attachment wp-att-8880"><img class="alignnone size-full wp-image-8880" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok2.png" alt="" width="445" height="226" /></a></p>
<p align="center">Рисунок 2. Результат медианного теста</p>
</div>
<div style="text-align: left;" align="center">
<p>Были проанализированы результаты на качественном уровне. По значению разности предсказанных и полученных значений (obs.-exp.) можно сделать следующие выводы:</p>
<ul>
<li>верхняя половина таблицы – максимальное значение указывает на худший тип алгоритма (в данном случае А1);</li>
<li>нижняя половина таблицы – максимальное значение указывает на лучший алгоритм (в данном случае А2).</li>
</ul>
<p>Количественная оценка статистики свидетельствует о том, что нулевую гипотезу можно принять с вероятностью <em>p</em> = 0.0002, что намного меньше уровня значимости, следовательно, принимается гипотеза <em>H</em><sub>1 </sub>– влияние фактора (тип алгоритма) на производительность системы существенное.</p>
<p>В системе <strong>Statistica</strong> при проведении рангового однофакторного анализа были построены гистограммы распределения производительности системы.</p>
<p>На построенных гистограммах сплошной линией проведены гауссовы распределения с соответствующими параметрами. Визуальный анализ подтверждает (рис. 3), что лучший алгоритм A2, т.к. при этом алгоритме минимальная и максимальная производительности системы больше, чем при алгоритмах A0  и A1, Этот алгоритм обеспечивает 85% значений производительности системы в интервале [75, 95], что значительно лучше, чем в других группах [2].</p>
<p style="text-align: center;"><a href="https://technology.snauka.ru/2015/12/8849/snimok-8" rel="attachment wp-att-8881"><img class="size-full wp-image-8881 aligncenter" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok3.png" alt="" width="595" height="428" /></a></p>
<p align="center">Рисунок 3. Гистограммы распределения производительности системы</p>
</div>
<div style="text-align: left;" align="center">
<p>Для проверки критерия Манна – Уитни  сформулирована нулевая гипотеза исходные две выборки – однородны, соответственно гипотеза <em>H</em><sub>1</sub>утверждает, что выборки не однородны, т. е. влияние фактора значимо. Результаты теста Манна &#8211; Уитни для всех возможных пар выборок представлены на рис. 4.</p>
<p style="text-align: center;"><a href="https://technology.snauka.ru/2015/12/8849/snimok-9" rel="attachment wp-att-8882"><img class="size-full wp-image-8882 aligncenter" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok4.png" alt="" width="924" height="457" /></a></p>
</div>
<div style="text-align: left;" align="center">
<p align="center">Рисунок 4. Результаты теста Манна &#8211; Уитни для A1-A0, A0-A2, А1-А2</p>
<p>В приведенных таблицах приняты следующие обозначения: Rank Sum Ti – сумма рангов выборки Тi; U –статистика Манна &#8211; Уитни для малых выборок; p &#8211; level – вероятность принятия гипотезы Н0; p &#8211; level – скорректированная вероятность принятия гипотезы Н0; 2*1 sided exact p – здесь вероятность p равна 1 минус кумулятивная односторонняя вероятность соответствующей статистики Манна – Уитни, Valid N – объем выборки; Rank Sum Tj – сумма рангов выборки Тj.</p>
<p>Анализ результатов:</p>
<ol>
<li>Для двух алгоритмов (уровней факторов) А0-А1 статистика <em>U</em> достаточно велика и нулевую гипотезу можно принять с вероятностью<br />
<em>р</em> = 0,9. При 5% уровне значимости гипотезу <em>Н</em><sub>0</sub> следует признать верной, то есть влияния фактора незначительное и две выборки однородны.</li>
<li>Сравнивая алгоритмы А0 и А2, видно, что две выборки можно признать однородными, так как p больше уровня значимости.</li>
<li>Что касается алгоритмов А1 и А2, то нулевую гипотезу можно принять с вероятностью <em>р</em> = 0,000583, что меньше уровня значимости. На основании этого нулевую гипотезу отвергаем в пользу альтернативной – влияния фактора значительное и выборки неоднородны.</li>
</ol>
<p>Так как предварительный ранговый однофакторный анализ подтвердил гипотезу о значимом влиянии фактора, было оценено это влияние количественно в рамках дисперсионного анализа.</p>
<p>Проверим нулевую гипотезу  – влияние фактора на распределение данных не существенно.</p>
<p>На рисунке 5 представлены результаты дисперсионного анализа.</p>
</div>
<div style="text-align: left;" align="center"><a href="https://technology.snauka.ru/2015/12/8849/snimok-10" rel="attachment wp-att-8883"><img class="size-full wp-image-8883 aligncenter" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok5.png" alt="" width="836" height="134" /></a></div>
<div style="text-align: left;" align="center">
<p align="center">Рисунок 5. Гистограммы распределения производительности системы</p>
<p>Статистика Фишера F= 6,79 незначимо отличается от единицы с вероятностью p=0.004, что значительно меньше уровня значимости. Следовательно, нулевую гипотезу следует отвергнуть в пользу альтернативной гипотезы <em>H</em><sub>1 –</sub> влияние фактора существенно.</p>
<p>На рисунке 6 представлено влияние алгоритма на производительность системы.</p>
</div>
<div style="text-align: left;" align="center"><a href="https://technology.snauka.ru/2015/12/8849/snimok-12" rel="attachment wp-att-8885"><img class="size-full wp-image-8885 aligncenter" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok7.png" alt="" width="901" height="314" /></a></div>
<div style="text-align: left;" align="center">
<p align="center">Рисунок 6. Влияние алгоритма на производительность системы</p>
</div>
<div style="text-align: left;" align="center">
<p>Полученные результаты (средние значения) свидетельствуют о существенном различии точечных характеристик для различных групп.</p>
</div>
<div style="text-align: left;" align="center">Для определения значимости различия алгоритмов был проведен тест Шеффа.</div>
<div style="text-align: left;" align="center">
<p>Результат сравнения средних по методу Шеффе для различных пар уровней приведен на рис. 7.</p>
<p style="text-align: center;"><a href="https://technology.snauka.ru/2015/12/8849/snimok-13" rel="attachment wp-att-8886"><img class="size-full wp-image-8886 aligncenter" src="https://technology.snauka.ru/wp-content/uploads/2015/12/Snimok8.png" alt="" width="734" height="173" /></a></p>
<p align="center">Рисунок 7. Результаты теста Шеффа</p>
<p>В результата проверки гипотезы о незначимом различии средних, для пары А1 – А2  вероятность нулевой гипотезы равная 0.00639 много меньше уровня значимости. Поэтому нулевая гипотеза отклоняется, влияние фактора значительное. Для пары А2 – А0 вероятность нулевой гипотезы равная 0.0035532 много меньше уровня значимости. Поэтому нулевая гипотеза отклоняется, влияние фактора значительное. Для пары А0 – А1 вероятность нулевой гипотезы равная 0.75 много больше уровня значимости. Поэтому нулевая гипотеза принимается, то есть влияние фактора незначительное.</p>
</div>
<div style="text-align: left;" align="center"><strong>Заключение</strong></div>
<div style="text-align: left;" align="center">
<p>В результате проверки критерия Краскела-Уоллиса<strong> </strong>были проанализированы суммы рангов. Было выявлено влияние уровня фактора (тип  алгоритма) на производительность системы. Анализ показал, что лучшая производительность системы обеспечивается за счет алгоритма A2, а худшая – за счет А1. Медианный тест показал, что худший тип алгоритма в данном случае А1, а лучший – А2. Визуальный анализ при помощи гистограмм распределения производительности подтвердил, что лучший алгоритм A2, т.к. при этом алгоритме минимальная и максимальная производительности системы больше, чем при алгоритмах A0  и A1, Этот алгоритм обеспечивает 85% значений производительности системы в интервале [75, 95], что значительно лучше, чем в других группах. С помощью критерия Манна – Уитни была проверена нулевая гипотеза о том, что исходные две выборки – однородны, а значит влияние фактора незначимо. Проверка выявила, что для алгоритмов А1 и А2 нулевую гипотезу можно принять с вероятностью <em>р</em> = 0,000583, что меньше уровня значимости. На основании этого нулевая гипотеза была отвержена в пользу альтернативной гипотезы – влияния фактора значимо, и выборки неоднородны. Так как предварительный ранговый однофакторный анализ подтвердил гипотезу о значимом влиянии фактора, было оценено это влияние количественно в рамках дисперсионного анализа. Проверка показала, что статистика Фишера F= 6,79 незначимо отличается от единицы с вероятностью p=0.004, что значительно меньше уровня значимости. Следовательно, нулевая гипотеза была отвержена в пользу альтернативной гипотезы <em>H</em><sub>1 –</sub> влияние фактора существенно. Для сравнения средних значений был использован тест Шеффа. Этот тест показал, что для пары А1 – А2  вероятность нулевой гипотезы равная 0.00639 много меньше уровня значимости. Поэтому нулевая гипотеза отклоняется, влияние фактора значительное. Для пары А2 – А0 вероятность нулевой гипотезы равная 0.0035532 много меньше уровня значимости. Поэтому нулевая гипотеза отклоняется, влияние фактора значительное. Для пары А0 – А1 вероятность нулевой гипотезы равная 0.75 много больше уровня значимости. Поэтому нулевая гипотеза принимается, то есть влияние фактора незначительное [3].</p>
</div>
]]></content:encoded>
			<wfw:commentRss>https://technology.snauka.ru/2015/12/8849/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
