Ученые Пермского Политеха улучшили обнаружение объектов нейронными сетями
06.03.2023
Пожалуй, самая популярная и перспективная задача нейросетей – технологии распознавания образов. Они либо по отдельности, либо в интегрированном виде используются в таких сферах, как безопасность и наблюдение, сканирование и создание изображений, маркетинг и реклама, дополненная реальность и поиск изображений. Обучение - очень важная часть создания данной технологии. Слишком маленькое или наоборот большое количество данных в нейросети приводит к некорректной работе. Порой даже оптимальный размер данных может привести к плохим результатам, если объекты, по которым обучалась программа, будут захвачены с одного ракурса или находятся на одном фоне. Сегодня специалистам приходится определять границы изучаемых объектов вручную в специальных программах. Этот процесс очень длительный и трудоемкий. Ученые Пермского Политеха создали программу с генератором случайных синтетических изображений, которая позволит обучать нейросеть быстрее. Разработка является уникальным способом улучшения качества обнаружения необходимых объектов, что позволяет обеспечить технологический суверенитет России.
Исследование опубликовано в сборнике «International Conference on Applied Innovations in IT (ICAIIT)».
Чтобы облегчить работу айти-специалистам, которые обычно вручную создают фотографии для обучения нейросети, политехники разработали программу, которая генерирует синтетические картинки, комбинируя между собой изображения реального объекта с использованием 3D-камеры, натуралистичный фон и некоторые шумовые эффекты - помехи или предметы окружающей среды. Например, для создания набора картинок с уличным фонарем программа дополнительно использовала ветви деревьев, которые частично закрывают светильник, а также дождь, слабую освещенность, дефекты камеры. Эти шумовые эффекты делают результирующее изображение более реалистичным. Качество обучения зависит от того, насколько равномерно перемешиваются данные и насколько разнообразные картинки получаются.
— Тестируя программу, мы постарались провести как можно больше экспериментов, чтобы получить максимально широкий обзор влияния синтетических данных на производительность нейронной сети. В испытании использовались наборы данных по 1000 и 2000 искусственных картинок. После чего мы заметили, что такое обучение дает низкое качество распознавания. По этой причине мы решили обучать нейросеть, смешивая синтетические данные с настоящими фотографиям, — сообщил доцент кафедры микропроцессорных средств автоматизации Леонид Мыльников.
— Наборы изображений по тематике на основе синтетических данных с небольшим количеством реальных фотографий улучшило качество обнаружения объекта нейросетью. Это решает проблему создания больших баз данных, необходимых для обучения сетей и значительно упрощает работу специалистов из ИТ сферы. Технология может применима и к движущимся изображениям, — рассказал аспирант кафедры «Информационные технологии и автоматизированные системы» Павел Сливницин.
В настоящее время политехники занимаются получением еще более реалистичных изображений, например, содержащих такие элементы, как эффекты коррозии и деформации изучаемого нейросетью объекта. Это будет способствовать дальнейшему улучшению качества обнаружения.
Исследование опубликовано в сборнике «International Conference on Applied Innovations in IT (ICAIIT)».
Чтобы облегчить работу айти-специалистам, которые обычно вручную создают фотографии для обучения нейросети, политехники разработали программу, которая генерирует синтетические картинки, комбинируя между собой изображения реального объекта с использованием 3D-камеры, натуралистичный фон и некоторые шумовые эффекты - помехи или предметы окружающей среды. Например, для создания набора картинок с уличным фонарем программа дополнительно использовала ветви деревьев, которые частично закрывают светильник, а также дождь, слабую освещенность, дефекты камеры. Эти шумовые эффекты делают результирующее изображение более реалистичным. Качество обучения зависит от того, насколько равномерно перемешиваются данные и насколько разнообразные картинки получаются.
— Тестируя программу, мы постарались провести как можно больше экспериментов, чтобы получить максимально широкий обзор влияния синтетических данных на производительность нейронной сети. В испытании использовались наборы данных по 1000 и 2000 искусственных картинок. После чего мы заметили, что такое обучение дает низкое качество распознавания. По этой причине мы решили обучать нейросеть, смешивая синтетические данные с настоящими фотографиям, — сообщил доцент кафедры микропроцессорных средств автоматизации Леонид Мыльников.
— Наборы изображений по тематике на основе синтетических данных с небольшим количеством реальных фотографий улучшило качество обнаружения объекта нейросетью. Это решает проблему создания больших баз данных, необходимых для обучения сетей и значительно упрощает работу специалистов из ИТ сферы. Технология может применима и к движущимся изображениям, — рассказал аспирант кафедры «Информационные технологии и автоматизированные системы» Павел Сливницин.
В настоящее время политехники занимаются получением еще более реалистичных изображений, например, содержащих такие элементы, как эффекты коррозии и деформации изучаемого нейросетью объекта. Это будет способствовать дальнейшему улучшению качества обнаружения.
Марина Осипова © Вечерние ведомости
Читать этот материал в источнике
Читать этот материал в источнике
Автомобилистов предупреждают о возможном перекрытии на проспекте Ленина в Екатеринбурге 2 декабря
Вторник, 26 ноября, 15.10
Росреестр разъясняет жителям Прикамья, как оформить хозяйственные постройки по новым правилам
Вторник, 26 ноября, 15.05
Ученые Пермского политеха разработали новый метод расчета несущей способности строительных свай
Вторник, 26 ноября, 15.03