<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Электронный научно-практический журнал «Современная техника и технологии» &#187; Шеломенцева Инга Георгиевна</title>
	<atom:link href="http://technology.snauka.ru/author/ginnash/feed" rel="self" type="application/rss+xml" />
	<link>https://technology.snauka.ru</link>
	<description></description>
	<lastBuildDate>Fri, 30 Jan 2026 18:56:12 +0000</lastBuildDate>
	<language>ru</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Оценка восприятия глубины разными видами машинного зрения</title>
		<link>https://technology.snauka.ru/2015/11/8287</link>
		<comments>https://technology.snauka.ru/2015/11/8287#comments</comments>
		<pubDate>Sun, 29 Nov 2015 19:45:08 +0000</pubDate>
		<dc:creator>Шеломенцева Инга Георгиевна</dc:creator>
				<category><![CDATA[Общая рубрика]]></category>
		<category><![CDATA[area of the best vision]]></category>
		<category><![CDATA[binocular sight]]></category>
		<category><![CDATA[depth]]></category>
		<category><![CDATA[eye basis]]></category>
		<category><![CDATA[monocular sight]]></category>
		<category><![CDATA[parallax]]></category>
		<category><![CDATA[robotics]]></category>
		<category><![CDATA[trinokulyany sight]]></category>
		<category><![CDATA[бинокулярное зрение]]></category>
		<category><![CDATA[глазной базис]]></category>
		<category><![CDATA[глубина]]></category>
		<category><![CDATA[монокулярное зрение]]></category>
		<category><![CDATA[область наилучшего видения]]></category>
		<category><![CDATA[параллакс]]></category>
		<category><![CDATA[Робототехника]]></category>
		<category><![CDATA[тринокуляное зрение]]></category>

		<guid isPermaLink="false">https://technology.snauka.ru/2015/11/8287</guid>
		<description><![CDATA[Робототехника, как отрасль научного знания и как основа промышленного производства, является инновационным направлением развития современного общества. Среди базовых аспектов применения роботов немаловажным считается их использование в труднодоступных местах, и местах, нахождение в которых небезопасно для человека. Примером могут служить роботы, перед которыми ставится задача по поиску и уничтожению взрывчатых веществ. В такой ситуации критичным является [...]]]></description>
			<content:encoded><![CDATA[<p><span>Робототехника, как отрасль научного знания и как основа промышленного производства, является инновационным направлением развития современного общества. Среди базовых аспектов применения роботов немаловажным считается их использование в труднодоступных местах, и местах, нахождение в которых небезопасно для человека. Примером могут служить роботы, перед которыми ставится задача по поиску и уничтожению взрывчатых веществ. В такой ситуации критичным является восприятие глубины для точной оценки расстояния до подозрительного объекта.</span><br />
<span>Рассмотрим основные виды зрения – монокулярное, бинокулярное и тринокулярное – с точки зрения восприятия глубины. </span><br />
<span>Монокулярное зрение опирается на единый источник информации об объекте. Если система, находящаяся в точке S, будет наблюдать объект F (рис. 1), то в таком случае оценить глубину и расстояние d до объекта, практически невозможно. Для этой цели можно использовать явление параллакса – явления, при котором при изменении положения наблюдателя S’ (рис. 1) меняется видимое положение объекта относительно фона. В таком случае расстояние d можно вычислить по формуле 1, где </span><span>α</span><span> – это угол изменения видимого положения объекта, а L – это расстояние, на которое смещается наблюдатель. Исторически сложилось так, что угол чаще всего измеряется не в радианах, а в угловых секундах.</span></p>
<div align="center"><img src="http://content.snauka.ru/technology/8287_files/0BMXKYL9I.gif" alt="" width="85" height="40" /><span> (1)</span></div>
<p><span>Для малых значений угла a используется упрощенная формула 2.</span></p>
<div align="center"><img src="http://content.snauka.ru/technology/8287_files/01IXZ205F.gif" alt="" width="45" height="35" /><span> (2)</span><br />
<a href="https://technology.snauka.ru/wp-content/uploads/2015/11/ris11.png"><img class="aligncenter size-full wp-image-8294" title="ris1" src="https://technology.snauka.ru/wp-content/uploads/2015/11/ris11.png" alt="" width="434" height="262" /></a><span>Рисунок 1. Оценка глубины при монокулярном зрении</span></div>
<p><span>Бинокулярное зрение ориентировано на наблюдение объектов двумя глазами. Наличие второго приемника информации позволяет более точно определить глубину, пространственное расположение и объемную форму наблюдаемых объектов. На рисунке 2 точки S1 и S2 обозначают приемники информации, а точки F1 и F2 – наблюдаемые объекты.</span><br />
<span>Для точного определения параметров объекта глаза располагают в одной плоскости, и зрение фокусируется так, чтобы зрительные оси пересекались в точке наблюдения (рис. 2). При этом получающийся угол (а1) называется углом конвергенции, а расстояние между глазами (b) – глазным базисом. Перефокусировка глаз при наблюдении второго объекта (F2) называется явлением аккомодации.</span></p>
<div align="center"><img class="aligncenter size-full wp-image-8295" title="ris2" src="https://technology.snauka.ru/wp-content/uploads/2015/11/ris21.png" alt="" width="496" height="250" /><span>Рисунок 2. Оценка глубины при бинокулярном зрении</span></div>
<p><span>Также, при бинокулярном зрении появляется понятие его остроты или разрешающей способности, под которым понимают наименьшую разницу между углами конвергенции при явлении аккомодации, когда система способна вычислить или воспринять </span><span>ΔD</span><span>.</span><br />
<span>Определим параметры восприятия глубины при бинокулярном зрении. В общем случае можно воспользоваться формулой 2.</span></p>
<div align="center"><img src="http://content.snauka.ru/technology/8287_files/0RLLFBQO0.gif" alt="" width="59" height="38" /><em><span>,</span></em><br />
<img src="http://content.snauka.ru/technology/8287_files/002220F29.gif" alt="" width="60" height="38" /><em><span>,</span></em><br />
<img src="http://content.snauka.ru/technology/8287_files/0EMCJJUZU.gif" alt="" width="226" height="43" /></div>
<p><span>Будем использовать формулу 3 для определения параметров оценки глубины при бинокулярном зрении и монокулярном зрении с учетом смещения. Рассмотрим сначала базовые параметры оценки глубины человеческого зрения. Стандартным глазным базисом человека является величина в 65 мм, а острота зрения – 20’’. </span><br />
<span>При D = 25 см (расстояние, на котором происходит чтение текста) </span><span>ΔD </span><span>будет равняться 0,1 мм.</span><br />
<img src="http://content.snauka.ru/technology/8287_files/1.gif" alt="" width="248" height="48" /><br />
<span>При D = 100 м</span><span> ΔD </span><span>будет равняться 0,1 м [1]. </span><br />
<img src="http://content.snauka.ru/technology/8287_files/2RMLANZK5.gif" alt="" width="256" height="50" /><br />
<span>Теперь оценим параметры тринокулярного зрения (рис. 3). На рисунке 3 точки S1, S2 и S3 обозначают приемники информации, х – расстояние от S3 до плоскости, а точки F1 и F2 – наблюдаемые объекты.</span></p>
<div align="center"><img src="http://content.snauka.ru/technology/8287_files/3.gif" alt="" width="93" height="56" /><em><span>,</span></em><br />
<img src="http://content.snauka.ru/technology/8287_files/4.gif" alt="" width="119" height="73" /><br />
<img src="http://content.snauka.ru/technology/8287_files/6.gif" alt="" width="315" height="89" /></div>
<p><span>Возьмем х=1 м, остальные параметры оставим неизменными. Тогда </span><span>ΔD </span><span>будет равняться 0,97 м.</span><br />
<img src="http://content.snauka.ru/technology/8287_files/8.gif" alt="" width="249" height="67" /><br />
<span>Другими словами, восприятие глубины при наличии третьего источника информации, находящегося над плоскостью на расстоянии 1 м значительно повысится.</span></p>
<div align="center"><a href="https://technology.snauka.ru/wp-content/uploads/2015/11/ris3.png"><img class="aligncenter size-full wp-image-8297" title="ris3" src="https://technology.snauka.ru/wp-content/uploads/2015/11/ris3.png" alt="" width="494" height="291" /></a><br />
<span>Рисунок 3. Оценка глубины при тринокулярном зрении</span></div>
<p><span>Теоретические расчеты не учитывают специфику матриц системы зрения, точнее их разрешающую способность и угол обзора. Рассмотрим проекцию изображения на плоскую матрицу, состоящую из n дискретных элементов зрения шириной a и углом обзора </span><span>β</span><span>. Некоторый объект шириной A, расположенный в параллельной относительно матрицы плоскости, проецируется на элемент матрицы с расстояния D целиком (рис. 4).</span></p>
<div align="center"><a href="https://technology.snauka.ru/wp-content/uploads/2015/11/ris4.png"><img class="aligncenter size-full wp-image-8298" title="ris4" src="https://technology.snauka.ru/wp-content/uploads/2015/11/ris4.png" alt="" width="338" height="432" /></a><span>Рисунок 4. Предельное расстояние распознавания объекта.</span></div>
<p><span>С уменьшением D проецируемый объект будет проецироваться не только на исходный элемент матрицы, но и на соседние элементы, т.е. его можно будет рассмотреть более точно. При увеличении D тот же объект будет проецироваться только на часть элемента матрицы, совместно с объектами, прилегающими к нему в проекции. Так можно определить предельное расстояние, которое зависит от разрешения матрицы и ее угла обзора, на котором объект еще различим матрицей:</span></p>
<div align="center"><img src="http://content.snauka.ru/technology/8287_files/9.gif" alt="" width="74" height="44" /><em><span> </span></em><span>(5)</span></div>
<p><span>Для бинарной системы смещение объекта на a в проекции объекта одного окуляра по отношении проекции другого окуляра гарантирует распознавание глубины объекта шириной A с расстояния D (рис. 5). Если смещение происходит на меньшую величину, то определение глубины становится затруднительным.</span></p>
<div align="center"><a href="https://technology.snauka.ru/wp-content/uploads/2015/11/ris5.png"><img class="aligncenter size-full wp-image-8299" title="ris5" src="https://technology.snauka.ru/wp-content/uploads/2015/11/ris5.png" alt="" width="461" height="297" /></a><br />
<span>Рисунок 5. Определение глубины объекта.</span></div>
<p><span>Учитывая разрешение матриц зрения и базис b системы получим зависимость расстояния, на котором возможно определить глубину объекта, если он сместился на k элементов матрицы (начальное положение от начала матрицы m):</span></p>
<div align="center"><img src="http://content.snauka.ru/technology/8287_files/9(2).gif" alt="" width="180" height="54" /><span> (6)</span></div>
<p><span>В тринокулярной системе качество восприятия глубины очевидным образом зависит от взаимного размещения окуляров: на одной горизонтальной оси (с равными или неравными промежутками), в углах равностороннего, равнобедренного, прямоугольного или произвольного треугольника. Очевидно, что несимметричные конструкции дают преимущество одному полю зрения (справа или слева), что нецелесообразно. Размещение трех окуляров на горизонтальной прямой не решает проблем с оценкой расстояний до протяженных объектов параллельных горизонту. Наилучшей способностью к оценке глубины и разрешению проблем бинокулярного зрения будет иметь система в форме равнобедренного треугольника. В такой конфигурации оба поля зрения не имеют преимущества друг перед другом. </span><br />
<span>Очевидно, что перемещение третьего окуляра вдоль высоты треугольника увеличивает (при движении вверх) способность системы к оценке большей глубины или снижает (при движении вниз), рис. 6.</span><br />
<span>С другой стороны область наилучшего видения находится в обратной зависимости от увеличения способности оценки глубины. Учитывая краевые эффекты проекций получим, что области наилучшего видения будет смещаться вверх, сжимаясь и вниз растягиваясь.</span></p>
<p style="text-align: center;"><a href="https://technology.snauka.ru/wp-content/uploads/2015/11/ris6.png"><img class="aligncenter size-full wp-image-8300" title="ris6" src="https://technology.snauka.ru/wp-content/uploads/2015/11/ris6.png" alt="" width="416" height="236" /></a></p>
<div align="center"><span>Рисунок 6. Область наилучшего видения.</span></div>
<p><span>Дополнительно при оценке глубины возникает еще одна проблема – проблема переднего плана. Объекты переднего плана не могут распознаваться n-окулярными (n&gt;1) системами по полученным с матриц окуляров изображений, т. к. изображения объектов переднего плана достаточно сильно разнятся. На одном из окуляров изображение вообще может отсутствовать. Поэтому фактически невозможно вычислить расстояние до таких объектов. Такая же проблема возникает с объектами, находящимися на краях поля зрения системы. Решить эту проблему убедительно можно только при помощи параллакса одного из окуляров.</span></p>
]]></content:encoded>
			<wfw:commentRss>https://technology.snauka.ru/2015/11/8287/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Обзор методов распознавания образов, используемых в медицинских диагностических системах</title>
		<link>https://technology.snauka.ru/2017/03/12914</link>
		<comments>https://technology.snauka.ru/2017/03/12914#comments</comments>
		<pubDate>Fri, 31 Mar 2017 10:32:26 +0000</pubDate>
		<dc:creator>Шеломенцева Инга Георгиевна</dc:creator>
				<category><![CDATA[Общая рубрика]]></category>
		<category><![CDATA[медицинские диагностические системы]]></category>
		<category><![CDATA[методы распознавания образов]]></category>
		<category><![CDATA[распознавание образов]]></category>

		<guid isPermaLink="false">https://technology.snauka.ru/?p=12914</guid>
		<description><![CDATA[Введение В качестве основных проблем, встающих перед исследователями в области распознавания образов в медицине, можно выделить следующие: цветное или бинарное изображение используется для распознавания и каковы способы его получения, какой классификатор ИНС будет оптимальным, какова структура автоматизированной информационной системы распознавания и принципы ее функционирования, какие методы используются для фильтрации и сегментации изображения. Для решения вышеперечисленных [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Введение</strong></p>
<p>В качестве основных проблем, встающих перед исследователями в области распознавания образов в медицине, можно выделить следующие: цветное или бинарное изображение используется для распознавания и каковы способы его получения, какой классификатор ИНС будет оптимальным, какова структура автоматизированной информационной системы распознавания и принципы ее функционирования, какие методы используются для фильтрации и сегментации изображения. Для решения вышеперечисленных вопросов был проанализирован опыт ряда ведущих исследователей в этой области.</p>
<p><strong>Материалы и методы</strong></p>
<p>В процессе исследования использовались такие общие методы научного познания, как метод анализа и метод сравнения. Для обзора методов, представленного в рассмотренных статьях, использовался табличный метод. В процессе анализа было рассмотрено порядка 59 источников, включающих в себя научные статьи, диссертации и авторефераты диссертаций, книги и научно-популярные статьи.</p>
<p>Рассмотрим наиболее характерные с точки зрения поставленных целей научные статьи. Источник [1] описывает алгоритмические решения, позволяющие обнаружить границу сегмента интересующей области при минимальной априорной информации о структуре изображения и высоком уровне помех, и описанию программного продукта, созданного на базе пакета Matlab и искусственных нейронных сетей. В качестве тестовых изображений авторы используют цветные медицинские изображения форменных элементов крови.</p>
<p>В источнике [3] описывается метод обработки цветных медицинских изображений на базе мультифрактального анализа. В статьях [2] и [4] приводятся методологические основы создания автоматизированных компьютерных технологий на примере анализа сложных биомедицинских изображений на базе методов компьютерного анализа яркостной, градиентной и текстурной информации изображения с использованием алгоритмов бинаризация по порогу, морфологической фильтрации, наращивания областей, создания активных контуров и деформированных шаблонов.</p>
<p>Выбор для анализа именно этих научных трудов обусловлен тем, что они отражают основные задачи, методы и материалы будущей медицинской диагностической системы – обработка цветных изображений, принципы функционирования нейронных сетей, CAD системы.</p>
<p>В процессе анализа используемых методов были сформулированы критерии для их сравнения. Первый и основной критерий обработки изображений – результат. Методы, используемые в данном процессе можно разделить на две большие категории: методы, в которых как входными данными, так и результатом являются изображения; методы, где входные данные – изображения, а в результате работы выходными данными выступают признаки и атрибуты, выявленные на базе входных данных.</p>
<p>Вторым критерием сравнения методов определим точку приложения анализа – какой из параметров исходного изображения или его части (например, яркостная, цветовая, градиентная или текстурная информация) берется для последующей обработки.</p>
<p>Третий критерий сравнения – это применяемый алгоритм для обработки. Это может быть обученная нейронная сеть, опорный вектор, дискриминантный анализ, пороговая обработка и т.д.</p>
<p>Таблица 1. Обзор методов, используемых для распознавания медицинских изображений</p>
<table width="631" border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top" width="104">Метод</td>
<td valign="top" width="107">Результат</td>
<td valign="top" width="145">Точка приложения анализа</td>
<td valign="top" width="161">Алгоритм</td>
<td valign="top" width="113">Ограничения входных параметров</td>
</tr>
<tr>
<td valign="top" width="104">Алгоритм Канни</td>
<td valign="top" width="107">Изображение</td>
<td valign="top" width="145">Разрывность яркости, интенсивность</td>
<td valign="top" width="161">Пороговая обработка</td>
<td valign="top" width="113"></td>
</tr>
<tr>
<td valign="top" width="104">Алгоритм Собеля</td>
<td valign="top" width="107">Изображение</td>
<td valign="top" width="145">Разрывность яркости</td>
<td valign="top" width="161">Вычисление градиентов от функций яркости</td>
<td valign="top" width="113">Полутоновое изображение</td>
</tr>
<tr>
<td valign="top" width="104">Размерность Ренье</td>
<td valign="top" width="107">Число</td>
<td valign="top" width="145">Фрактальная размерность</td>
<td valign="top" width="161">Обученная нейросеть</td>
<td valign="top" width="113"></td>
</tr>
<tr>
<td valign="top" width="104">Метод локальной бинарной</p>
<p>текстуры</td>
<td valign="top" width="107">Число</td>
<td valign="top" width="145">Локальный бинарный шаблон</td>
<td valign="top" width="161">Геометрическая интерпретация, евклидово расстояние</td>
<td valign="top" width="113">Полутоновое изображение</td>
</tr>
<tr>
<td valign="top" width="104">Метод Харалика</td>
<td valign="top" width="107">Число</td>
<td valign="top" width="145">Текстурные признаки статистики разностей серого тона в двух соседних точках Харалика по квадратному окну</td>
<td valign="top" width="161">Обученная нейросеть</td>
<td valign="top" width="113">Полутоновое изображение</td>
</tr>
</tbody>
</table>
<p>Четвертый критерий сравнения рассматриваемых методов – исходный материал для обработки. В качестве такового определим критерий бинарности – является ли изображение цветным или полутоновым.</p>
<p><strong>Результаты</strong></p>
<p>Результат сравнения выбранных методов приведен в таблице 1. Среди выбранных методов два (алгоритм Собеля и алгоритм Канни) получают в качестве входных данных изображение и выдают в качестве выходных данных измененное изображение [5]. Три оставшихся метода в качестве результатов работы выдают набор вещественных чисел. Точка приложения анализа у всех методов разная &#8211; разрывность и интенсивность яркости, фрактальная размерность изображения, бинарный шаблон в виде массива точек и статистические данные. Также разные и алгоритмы обработки областей интересов. Три из пяти методов могут работать только с полутоновыми изображениями, что требует предварительной обработки изображения.</p>
<p><strong>Дискуссия</strong></p>
<p>Построение медицинских диагностических систем опирается на обработку медицинских изображений (цветных или черно-белых, распространенных графических форматов или стандарта dicom, обычных или микроскопических), базовые принципы функционирования CAD систем, выделение классификатора нейронных сетей с предварительной обработкой изображения с применением фильтрации и сегментации.</p>
<p>Анализируя таблицу 1, можно сделать вывод, что набор методов распознавания образов в медицине обширен и разнообразен. Чаще всего, на практике, исследователи строят систему CAD, опираясь не на один метод, а на их совокупность. Значительная часть задач требует для своего решения нетривиальной методологии, оригинальных моделей и алгоритмов: средств анализа сложных и гибридных изображений, распознавания образов и пр.</p>
<p>Поэтому зачастую перед исследователем стоит достаточное сложная задача провести выбор не одного метода из теории распознавания образов, а найти такую их совокупность, которая была бы оптимальна для решения задачи медицинской диагностики.</p>
]]></content:encoded>
			<wfw:commentRss>https://technology.snauka.ru/2017/03/12914/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
