Новый подход повысил точность детектирования и распознавания 3D-объектов.
Ученые Института AIRI и НИУ ВШЭ предложили новый подход обучения ИИ, используемого для компьютерного зрения. Эксперимент показал, что малые нейросети, обученные на качественном наборе данных, повышают эффективность работы больших моделей. Подход будут использовать для развития беспилотного транспорта.
Исследователи обучали небольшую генеративную модель на доступных записях облаков точек, снятых во время проезда автомобиля по улицам города. Данные собирали в разных условиях: когда объект был полностью в поле зрения, была видна лишь его часть и когда он оставался позади, скрытый, например, деревом или другим движущимся объектом.
На следующем этапе при помощи метода Point Cloud Registration (PCR) облака точек соотносились с конкретными автомобилями и другими предметами даже на основе небольшого видимого фрагмента. Затем небольшую, но точную модель-учитель применили для обучения большой нейросети, работающей на шумных облаках точек с множеством сложных параметров.
Распознавание объемных объектов — одна из ключевых задач для управления движением беспилотного автомобиля. Для ее решения система по разрозненному набору данных определяет область, внутри которой находится объект. Однако лидары и другие сенсоры не всегда позволяют получить полную информацию о глубине и, как следствие, позиции предмета.
Анализ показал, что при обучении модели другой нейросетью точность распознавания реальных объектов выросла. Технология стала корректно описывать форму окружающих предметов, с которыми машина может столкнуться в будущем.
Исследователи отмечают, что похожий подход — обучение малой нейросетью большой модели — использовала OpenAI для обучения GPT работе с текстами. И в обоих случаях метод показал свою эффективность.
Видна возможность масштабировать подход в компьютерном зрении: например, увеличивать количество задач и сложность каждой модели. Так, можно обучать несколько маленьких моделей-учителей на хороших данных, каждую — для своих целей, которые после обучат большую модель-студента.