<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Электронный научно-практический журнал «Современная техника и технологии» &#187; Arkanzas</title>
	<atom:link href="http://technology.snauka.ru/author/arkanzas/feed" rel="self" type="application/rss+xml" />
	<link>https://technology.snauka.ru</link>
	<description></description>
	<lastBuildDate>Fri, 30 Jan 2026 18:56:12 +0000</lastBuildDate>
	<language>ru</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Система сбора и анализа статистики пользовательских сообщений на web-сайтах</title>
		<link>https://technology.snauka.ru/2016/05/10043</link>
		<comments>https://technology.snauka.ru/2016/05/10043#comments</comments>
		<pubDate>Mon, 30 May 2016 21:18:57 +0000</pubDate>
		<dc:creator>Arkanzas</dc:creator>
				<category><![CDATA[Общая рубрика]]></category>
		<category><![CDATA[web-сайты]]></category>

		<guid isPermaLink="false">https://technology.snauka.ru/2016/05/10043</guid>
		<description><![CDATA[В настоящее время востребованным является сервис по автоматическому анализу мнений и оценок пользователей о контенте web-сайтов. Такой сервис называется web-аналитикой. Web-аналитика представляет собой сбор, анализ, представление и интерпретация информации о действиях посетителей веб-сайтов с целью их улучшения [1]. Анализ пользовательских оценок позволяет оперативно принимать решения о полезности той и или иной информации размещённой в сети [...]]]></description>
			<content:encoded><![CDATA[<p>В настоящее время востребованным является сервис по автоматическому анализу мнений и оценок пользователей о контенте web-сайтов. Такой сервис называется web-аналитикой. Web-аналитика представляет собой сбор, анализ, представление и интерпретация информации о действиях посетителей веб-сайтов с целью их улучшения [1]. Анализ пользовательских оценок позволяет оперативно принимать решения о полезности той и или иной информации размещённой в сети на web-сайтах. Это помогает компаниям оценить свою маркетинговую политику, привлечь больше посетителей на свои ресурсы в сети, и в итоге получить большую прибыль [2, 3].</p>
<p>В связи с этим возникает необходимость разработки систем, которые выполняли бы автоматический анализ мнений и оценок пользователей о контенте web-сайтов и собирали бы всю эту информацию в единую базу данных.</p>
<p>Структурная схема разработанной автоматизированной информационной системы сбора и анализа статистики пользовательских сообщений на web-сайтах показана на рисунке 1.</p>
<p style="text-align: center;"> <img class="alignnone size-full wp-image-10165" title="ris1" src="https://technology.snauka.ru/wp-content/uploads/2016/06/ris1.png" alt="" width="585" height="269" /></p>
<p style="text-align: center;">Рисунок 1 — Структурная схема системы</p>
<p>Система состоит из пяти основных модулей:</p>
<p>-          модуль предобработки текста;</p>
<p>-          NLP-модуль;</p>
<p>-          модуль извлечения аспектов;</p>
<p>-          модуль определения тональности текста;</p>
<p>-          модуль «Визуализация результатов анализа тональности».</p>
<p>Модуль предобработки текста выполняет на конечном этапе определение частей речи в предложениях входящего текста и передает данную информацию NLP-модулю.</p>
<p>NLP-модуль выполняет автоматическое извлечение признаков из полученных данных о частях речи и выполняет их бинаризацию, в результате будет сформирована таблица признаков сообщения, данные о сообщении и таблице признаков передаются в модуль извлечения аспектов.</p>
<p>Модуль извлечения аспектов выполняет применение таких фильтров к полученному сообщению как: частотный фильтр, лингвистический фильтр, а также выполняет определение принадлежности н-граммы множеству аспектов, полученная информация передается модулю определения тональности.</p>
<p>Модуль определения тональности выполняет классификацию сообщения одним из двух методов выбранных администратором системы, результаты выполненной классификации отображаются пользователю в виде отчета.</p>
<p>В качестве среды разработки выбрана  Microsoft Visual Studio 2012, язык C#, а в качестве СУБД для хранения данных – Microsoft SQL Server 2012.</p>
<p>Работа алгоритма всей системы заключается в следующем. Первый этап заключается в выполнении предварительной обработки текста сообщений. На донном этапе выполняется преобразование текста сообщения в нижний регистр, далее замена смайлов и некоторых знаков препинания на метки в соответствии с таблицей 1, далее выполняется выделение отдельных слов предложений (используется Penn Treebank Tokenizer из NLTK). Далее выполняется поиск и замена принятых сокращений, например т.к. – так как, пр. – прочее, после чего выполняется приведение всех выделенных слов к их начальной форме (используется алгоритм Penn Treebank Tokenizer из NLTK), в последнюю очередь выполняется удаление предлогов, союзов и артиклей из текста сообщения.</p>
<p>Для выражения эмоций в тексте пользователи ставят смайлы. В случае с короткими текстами нет более простого способа отметить своё отношение к содержимому web-сайта. Замена смайлов, отражающих эмоциональную окраску текста осуществляется в соответствии с таблице 1.</p>
<p style="text-align: left;" align="center">Таблица 1 – Эмоциональная окраска смайлов</p>
<table border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top" width="66">
<p align="center">Смайл</p>
</td>
<td valign="top" width="65">
<p align="center">Метка</p>
</td>
<td valign="top" width="63">
<p align="center">Смайл</p>
</td>
<td valign="top" width="63">
<p align="center">Метка</p>
</td>
<td valign="top" width="63">
<p align="center">Смайл</p>
</td>
<td valign="top" width="63">
<p align="center">Метка</p>
</td>
<td valign="top" width="63">
<p align="center">Смайл</p>
</td>
<td valign="top" width="63">
<p align="center">Метка</p>
</td>
<td valign="top" width="63">
<p align="center">Смайл</p>
</td>
<td valign="top" width="63">
<p align="center">Метка</p>
</td>
</tr>
<tr>
<td valign="top" width="66">
<p align="center">:-)</p>
<p align="center">:с)</p>
<p align="center">:}</p>
<p align="center">8-D</p>
<p align="center">XD</p>
<p align="center">B^D</p>
<p align="center">:-c</p>
<p align="center">:-[</p>
<p align="center">:@</p>
<p align="center">:’)</p>
<p align="center">D=</p>
<p align="center">:^*</p>
<p align="center">;)</p>
<p align="center">;D</p>
<p align="center">:P</p>
<p align="center">:-p</p>
<p align="center">:p</p>
<p align="center">&gt;:</p>
<p align="center">:</p>
<p align="center">:S</p>
<p align="center">O:-)</p>
<p align="center">0;^)</p>
</td>
<td valign="top" width="65">
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">+</p>
</td>
<td valign="top" width="63">
<p align="center">:)</p>
<p align="center">:&gt;</p>
<p align="center">:^)</p>
<p align="center">8D</p>
<p align="center">=-D</p>
<p align="center">:-))</p>
<p align="center">:c</p>
<p align="center">:[</p>
<p align="center">&gt;:(</p>
<p align="center">D:&lt;</p>
<p align="center">DX</p>
<p align="center">(</p>
<p align="center">*-)</p>
<p align="center">;^)</p>
<p align="center">X-P</p>
<p align="center">:p</p>
<p align="center">:-p</p>
<p align="center">&gt;:/</p>
<p align="center">=/</p>
<p align="center">&gt;.&lt;</p>
<p align="center">0:-3</p>
<p align="center">O_O</p>
</td>
<td valign="top" width="63">
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">-</p>
</td>
<td valign="top" width="63">
<p align="center">:o)</p>
<p align="center">=]</p>
<p align="center">:&gt;)</p>
<p align="center">x-D</p>
<p align="center">=D</p>
<p align="center">&gt;:[</p>
<p align="center">:-&lt;</p>
<p align="center">:{</p>
<p align="center">:’-(</p>
<p align="center">D:</p>
<p align="center">v.v</p>
<p align="center">}{</p>
<p align="center">*)</p>
<p align="center">:-,</p>
<p align="center">x-p</p>
<p align="center">=p</p>
<p align="center">:-b</p>
<p align="center">:-/</p>
<p align="center">=</p>
<p align="center">:|</p>
<p align="center">0:3</p>
<p align="center">0/</p>
</td>
<td valign="top" width="63">
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">+</p>
</td>
<td valign="top" width="63">
<p align="center">:]</p>
<p align="center">8)</p>
<p align="center">:-D</p>
<p align="center">xD</p>
<p align="center">=-3</p>
<p align="center">:-(</p>
<p align="center">:&gt;C</p>
<p align="center">;(</p>
<p align="center">:’(</p>
<p align="center">D8</p>
<p align="center">D-‘:</p>
<p align="center">)</p>
<p align="center">;-]</p>
<p align="center">&gt;:P</p>
<p align="center">xp</p>
<p align="center">:-p</p>
<p align="center">:b</p>
<p align="center">:-.</p>
<p align="center">:L</p>
<p align="center">:-|</p>
<p align="center">0:-)</p>
<p align="center">&lt;3</p>
</td>
<td valign="top" width="63">
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">+</p>
</td>
<td valign="top" width="63">
<p align="center">:3</p>
<p align="center">=)</p>
<p align="center">:D</p>
<p align="center">X-D</p>
<p align="center">=3</p>
<p align="center">:(</p>
<p align="center">:&lt;</p>
<p align="center">:-||</p>
<p align="center">:’-)</p>
<p align="center">D;</p>
<p align="center">:*</p>
<p align="center">;-)</p>
<p align="center">;]</p>
<p align="center">:-P</p>
<p align="center">XP</p>
<p align="center">:p</p>
<p align="center">d:</p>
<p align="center">:/</p>
<p align="center">=L</p>
<p align="center">:$</p>
<p align="center">0:)</p>
<p align="center">&lt;/3</p>
</td>
<td valign="top" width="63">
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">+</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">-</p>
<p align="center">+</p>
<p align="center">-</p>
</td>
</tr>
</tbody>
</table>
<p style="text-align: left;" align="center">Разработанная система выполняет следующие функции:</p>
<p>1)       выделение из текста сообщений отдельных предложений;</p>
<p>2)       выделение отдельных слов в полученных предложениях;</p>
<p>3)       определение частей речи полученных слов;</p>
<p>4)       извлечение смайлов из текста сообщения и их классификация по тональности;</p>
<p>5)       разбиение обработанного текста сообщения на n-граммы;</p>
<p>6)       извлечение признаков;</p>
<p>7)       выполнение бинарной классификации;</p>
<p>8)       применение частотного и лингвистического фильтров;</p>
<p>9)       определение принадлежности н-граммы множеству аспектов;</p>
<p>10)  выполнение классификации методом SVM;</p>
<p>11)  выполнение классификации байесовским методом;</p>
<p>12)  визуализация результатов анализа тональности сообщений.</p>
<p>Таким образом, разработанная система сбора и анализа статистики пользовательских сообщений на web-сайтах может использоваться компаниями по улучшению привлекательности для пользователей своих сетевых ресурсов. Что в конечном итоге должно отразится на увеличении прибыли компаний.</p>
]]></content:encoded>
			<wfw:commentRss>https://technology.snauka.ru/2016/05/10043/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
