Директор иси со ран д ф. м н. А. Г. Марчук
Утверждаю
Директор ИСИ СО РАН
д.ф.-м.н. А.Г. Марчук
_______________
7 октября 2003 г.
ВЫПИСКА
из протокола заседания № 581 семинара
“Конструирование и оптимизация программ”
Института систем информатики СО РАН от 7-го октября 2003г.
Заключение о кандидатской диссертации
Лобива Игоря Васильевича
«Программные системы для локализации и идентификации объектов
в изображениях»
ПРИСУТСТВОВАЛИ: 30 человек, в том числе:
д.ф.-м.н. Касьянов В.Н., д.ф.-м.н. Евстигнеев В.А., к.т.н. Поляков В.Г.,
д.ф.-м.н. Рябко Б.Я. , д.ф.-м.н. Замулин А.В., к.ф.-м.н. Бульонков М.А.,
к.ф.-м.н. Емельянов П.Г., к.т.н. Загорулько Ю.А., к.ф.-м.н. Городняя Л.В.,
к.ф.-м.н. Калинина Н.А., к.т.н. Шелехов В.И., к.ф.-м.н. Степанов Г.Г.,
к.ф.-м.н. Мурзин Ф.А., к.ф.-м.н. Пестунов И.А., д.т.н. Бандман О.Л.,
д.ф.-м.н. Марчук А.Г., Половинко О.Н., Черемушкин Е.С., Дунаев А.А. и др.
СЛУШАЛИ: Диссертационную работу Лобива И.В. «Программные системы для локализации и идентификации объектов в изображениях» на соискание ученой степени к.ф.-м.н. по специальности 05.13.11. – «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»
ПОСТАНОВИЛИ: Принять следующее заключение по диссертации:
Актуальность. Задачи из области машинного зрения на сегодняшний день появляются не только в таких традиционных сферах как обработка аэрокосмических снимков или военные области, но и в нетрадиционных. Например для обработки снимков бактерий в микробиологии, для автоматической сортировки корреспонденции и промышленных грузов, для автоматического контроля автомобильного движения , для сборки сложной продукции с помощью роботов на промышленном конвейере и т.д.
Задачи, возникающие в данной области, пытаются решить многие научные школы. Нельзя не отметить вклад американских ученных в лице корпорации Datacube. Корпорация получила известность еще в 80-е, когда представила несколько конвейерных суперкомпьютеров для военных и гражданских нужд США. Одна из основных областей, разрабатываемых данной корпорации – область машинного зрения. В 1990 году был выпущен программно - аппаратный продукт ImageFlow предназначенный для быстрой обработки изображений.
На данный момент корпорация является лидером в производстве систем распознавания изображений. Продукт MaxVision Toolkit используется во многих гражданских областях народного хозяйства, а так же военными США.
Метод, предложенный корпорацией Datacube обладает рядом недостатков.
1. Большое время обучения системы по образцу –


2. Ограниченный набор преобразований – дискретная шкала углов и масштабов.
3. При построении последовательности изображений по методу пирамид возможна потеря данных, а значит и ухудшается вероятность локализации.
4. Работа только с серыми (gray-scale) изображениями. Тогда как в области машинного зрения существует острый недостаток приложений, работающих с цветными изображениями.
В диссертационной работе описывается метод, конкурентоспособный с разработкой компании Datacube, основанный на применении системы опорных точек и использовании лексикографического рекурсивного поиска.
В результате проведенных исследований был реализован ряд программных систем для локализации и идентификации объектов в изображениях.
Первая рассмотренная задача – локализация образца в фотографическом изображении.
Задача осложнена тем, что искомый фрагмент может отличаться от образца расположением (параллельным переносом и поворотом), масштабом и цветовыми характеристиками, такими как яркость, контрастность, насыщенность цвета и др.
Другое важное требование состоит в том, что поиск должен осуществляться максимально быстро. Это требование является типичным в робототехнике, системах безопасности, военных системах наведения и целеуказания
Степень новизны полученных автором результатов. Все полученные автором результаты, вошедшие в диссертацию, являются новыми и своевременно опубликованными. В диссертации поставлены и решены следующие задачи:
Проведены комплексные теоретические исследования и созданы программные системы, выполняющие следующие функции:
Быстрый поиск (локализация) фрагмента фотографического изображения в другом изображении для случая, когда фрагмент может быть повернут и/или изменен его масштаб.
Распознавание и локализация движущегося объекта в видео-потоке.
Локализация на фотографическом изображении шаблона и распознавания содержащегося в нём текста.
Восстановление положения движущегося тела по информации, получаемой с множества одномерных видеокамер.
Степень достоверности полученных результатов. Все основные положения и выводы, сформулированные в диссертации, теоретически и экспериментально обоснованы.
Основные результаты диссертационной работы докладывались в Институте систем информатики СО РАН, Институте физики полупроводников СО РАН, Институте теоретической и прикладной механики СО РАН.
Результаты работы докладывались на следующих научных конференциях: “Современные проблемы прикладной математики и механики: теория, эксперимент и практика”, Международная конференция, посвященная 80-летию академика Н.Н. Яненко в 2001 г.; Пятая международная конференция, посвященная памяти академика А.П. Ершова «Перспективы систем информатики» - 2003; Международная конференция “Вычислительные технологии 98” и Международная конференция “ИНПРИМ 98” в Новосибирске, а также в Институте физики полупроводников СО РАН на конференции “Distributed Data Processing – 98”.
Публикации. Автор имеет 17 печатных работ, из них по теме диссертации опубликовано 11 работ. Научные результаты, включенные в диссертацию, в полной мере опубликованы в следующих работах:
1. Лобив И.В., Мехонцев Д.Ю., Селезнев К.С. Методы обнаружения движущихся объектов в видео потоке // Современные проблемы прикладной математики и механики: теория, эксперимент и практика, Международная конференция, посвященная 80-летию академика Н.Н.Яненко, Новосибирск, Академгородок, 24 - 29 июня 2001 года, С. 60-61.
2. Дунаев А.А., Лобив И.В., Мехонцев Д.Ю., Мурзин Ф.А., Половинко О.Н., Семич Д.Ф., Чепель А.В., Ярков К.А. Алгоритмы быстрого поиска фрагментов фотографических изображений // Современные проблемы конструирования программ. – Новосибирск, 2002. – С. 88 – 109.
3. Мехонцев Д.Ю., Лобив И.В., Селезнев К.С. Слежение и определение скорости движущихся на плоскости объектов в реальном времени. // Современные проблемы конструирования программ. – Новосибирск, 2002. – С. 243 – 246.
4. Лобив И.В., Мехонцев Д.Ю., Селезнев К.С. Слежение и определение скорости движущихся на плоскости объектов в реальном времени. // Международная конференция молодых ученых по математическому моделированию и информатике – 2001, Новосибирск, Академгородок, ИСИ СО РАН, С. 24 – 25.
5. Мехонцев Д.Ю., Лобив И.В. Решение задачи нахождения оптимального положения тела в пространстве по данным поступающим с одномерных камер для трехмерной оптической системы анализа движения объектов // Международная конференция молодых ученых по математическому моделированию и информатике – 2002, Новосибирск, Академгородок, ИСИ СО РАН С. 45 – 46 (http://www-sbras.nsc.ru/HBC/2002/n44/f12.html)
6. Дунаев А.А., Кель А.Э., Лобив И.В., Мурзин Ф.А, Половинко О.Н., Черемушкин Е.С. Алгоритмы визуализации генетической информации. // Пятая международная конференция «Перспективы систем информатики» - 2003, Новосибирск, Академгородок, Доклады и тезисы С.43 - 47
7. Винокуров А.А., Ильин И.В., Лобив И.В., Мурзин Ф.А, Половинко О.Н., Семич Д.Ф. Программное обеспечения для поддержки процесса ядерного каротажа нефтяных скважин. // Пятая международная конференция «Перспективы систем информатики» - 2003, Новосибирск, Академгородок, Доклады и тезисы С.40 - 43
8. Дунаев А.А., Лобив И.В., Мехонцев Д.Ю., Мурзин Ф.А., Половинко О.Н., Семич Д.Ф., Ярков К.А. Алгоритмы быстрого поиска повернутых и масштабированных образов внутри данного изображения. // Пятая международная конференция «Перспективы систем информатики» - 2003, Новосибирск, Академгородок, С.50 – 53
Научная и практическая ценность. Научные исследования и реализация программных систем выполнялись по заказам зарубежных фирм и переданы заказчикам. Разработанные методы позволили решить несколько важных хорошо известных проблем области исследования. Также было предложено несколько оригинальных модификаций классических алгоритмов (например, модификация алгоритма Брезенхейма в подзадаче быстрого поворота фрагмента изображения и др.).
Личный вклад автора.
Наибольший вклад в первой задаче автор внес в разработку и реализацию алгоритмов: быстрый поворот фрагмента изображения, метод адаптивных порогов, оптимизация древовидной поисковой структуры, контрольное сравнение, метод обратной связи между алгоритмом поиска и контрольного сравнения. Во второй задаче автору полностью принадлежит программная реализация всех методов. Совместно с Мехонцевым Д.Ю. автор проводил отработку алгоритмических деталей: фильтры, адаптивный фон. При разработке третьей задачи был ответственным за локализацию маркера, текст распознавали другие соавторы. В четвертой задаче участвовал в разработке алгоритмов. В данной задаче также проводил проектирование и вывод наиболее сложных формул в системе символьных преобразований Maple_V_R4 и частично реализовывал программу на C++ (часть фильтров, интерполяция некоторых данных и др.).
Заключение. Семинар считает, что диссертация Лобива И.В. является законченной научно-исследовательской работой, содержащей новые подходы к решению задач поиска и локализации объектов в изображениях. Разработанный программный комплекс быстрого поиска фрагмента в изображении является одним из лучших для данного класса задач.
Диссертация Лобива И.В. «Программные системы для локализации и идентификации объектов в изображениях» удовлетворяет требованиям, предъявляемым к кандидатским диссертациям, и ее содержание соответствует специальности 05.13.11 – «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей».
Диссертация рекомендуется к защите на соискание ученой степени кандидата физико-математических наук по специальности 05.13.11 – «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей».
Председатель семинара
д.ф.-м.н., профессор Касьянов В.Н.
Секретарь семинара Волянская Т.А.
страница 1
скачать
Другие похожие работы: