Repo for the AIRI Summer School research project on "Application of differentiable object representation of 3D scene recognition"
В рамках данного проекта был проведен обзор подходов применения обчуаемых векторных представлений трёхмерного пространства, выделена одна из наиболее перспективных задача в данной области - "Сегментация трёхмерной сцены по произвольному текстовому запросу" и рассмотрены и экспериментально изучены две актуальные работы в этой области - OpenScene, CVPR 2023 и VLMap, ICRA2023.
Исследование проводилось параллельно по обеим работам, в различных репозиториях:
- OpenScene - VitalyyBezuglyj/openscene_experiments
- VLMap - Ladanovasv/vlmaps_experiments
Для экспериментов использовались данные собранные на робототехнической платформе Husky внутри учебного корпуса университета, оснащенной 16-лучевым лидаром VLP-16, а также стереокамерой ZED (1280x720).
Для экспериментов использовались такие данные как:
- RGB-D Изображения
- 3D облака точек (LiDAR)
- Внутренние параметры камеры (intrinsics)
- 6DoF позы камеры, полученные при помощи алгоритма Cartographer
[to be added]
[to be added]