Визначення масштабу та кута повороту для довгострокового відстеження об’єкта у відео

Автор(и)

DOI:

https://doi.org/10.15407/intechsys.2025.05.022

Ключові слова:

object tracking in video, BRISK key points, KCF tracking algorithm, HOG features, scale and rotation angle of an object in an image, object detection and recognition

Анотація

Надійність відстеження у відео значною мірою залежить від ефективності (точності та порівняно малої обчислювальної складності) задіяних алгоритмів визначення масштабу та кута повороту об’єкта відстеження на зображеннях. Пропонується алгоритм для оцінки цих параметрів на основі пошуку відповідних ключових точок (КТ) на кожному кадрі до КТ у моделі об’єкта M, що складається із КТ об’єкта та навколишнього фону. Алгоритм переважно може бути задіяний в умовах, коли зміни масштабу та кута повороту головним чином є наслідком змін руху камери або дій оператора і в значній мірі корелюють зі змінами на фоні, що зазвичай відповідає відеоспостереженню з літального апарата, зокрема БПЛА. Переваги алгоритму полягають у тому, що є порівняно більш стійким до наявності помилок в визначенні відповідних пар КТ, а також може бути використаний під час тривалої відсутності об’єкта у відео для оцінки масштабу та кута повороту шляхом пошуку КТ на зображенні, що відповідають до КТ фону у M. Це виконується з метою оновлення моделі об’єкта і його детектування після появи у відео зі значно зміненими параметрами.

Наведено приклади використання алгоритму для довгострокового відстеження із застосуванням пропонованого критерію наявності об’єкта в полі зору камери, а також двох способів оновлення M за його присутності або відсутності на зображеннях.

Посилання

Bolme D.S., Beveridge J.R., Draper B.A., Lui Y.M.. Visual object tracking using adaptive correlation filters. The IEEE conference on Computer Vision and Pattern, 2010, 1–10. https://doi.org/10.1109/CVPR.2010.5539960

Henriques J.F., Caseiro R., Martins P., Batista J. High-speed tracking with kernelized correlation filters. IEEE transactions on pattern analysis and machine intelligence, 2015, Vol. 37 (3), 583–596. https://doi.org/10.1109/TPAMI.2014.2345390

Danelljan M., Häger G., Khan F.S., Felsberg M. Discriminative scale space tracking. IEEE transactions on pattern analysis and machine intelligence, 2016, Vol. 39 (8), 1561–1575. https://doi.org/10.1109/TPAMI.2016.2609928

Tao R., Gavves E., Smeulders A.W. Siamese Instance Search for Tracking. The IEEE conference on Computer Vision and Pattern Recognition (CVPR), 2016, 1420–1429. https://doi.org/10.1109/CVPR.2016.158

Bertinetto L., Valmadre J., Henriques J.F., Vedaldi A., Torr P.H. Fully-convolutional siamese networks for object tracking. Computer vision–ECCV 2016 workshops, Amsterdam, the Netherlands, 2016, 850–865. https://doi.org/10.1109/CVPR.2016.158

Nebehay G., Pflugfelder R.P. Clustering of static-adaptive correspondences for deformable object tracking. The IEEE conference on Computer Vision and Pattern Recognition (CVPR), 2015, 2784–2791. https://doi.org/10.1109/CVPR.2015.7298895

Wu B., Xie Y., Luo W. Robust and adaptive object tracking via correspondence clustering. IEICE Trans. Information & Systems, 2016, Vol. E99-D (10), 2664–2667. https://doi.org/10.1587/transinf. 2016EDL8065

Hong Z., Chen Z., Wang C., Mei X., Prokhorov D., Tao D. Multi-store tracker (muster): A cognitive psychology inspired approach to object tracking. The IEEE conference on computer vision and pattern recognition, 2015, 749–758. https://doi.org/10.1109/CVPR.2015.7298675

Kalal Z., Mikolajczyk K., Matas J. Tracking-learning detection. TPAMI, 2012, Vol. 34 (7), 1409–1422. https://doi.org/10.1109/TPAMI.2011.239

Ma C., Yang X., Zhang C., Yang M.H. Long-term correlation tracking. The IEEE conference on computer vision and pattern recognition, 2015, 5388–5396. https://doi.org/10.1109/CVPR.2015.7299177

Ma C., Huang J.B., Yang X., Yang M.H. Adaptive correlation filters with long-term and short-term memory for object tracking. International Journal of Computer Vision, 2018, Vol. 126, 771–796. https://doi.org/10.1007/s11263-018-1076-4

Lukežič A., Zajc L.Č., Vojíř T., Matas J., Kristan M. FuCoLot–a fully-correlational long-term tracker. Computer Vision–ACCV 2018: 14th Asian Conference on Computer Vision, Perth, Australia, 2018, Revised Selected Papers, Part II 14, 2019, 595–611. https://doi.org/10.1007/978-3-030-20890-5_38

Lukeˇziˇc A., Voj´ıˇr, T., Cˇehovin Zajc, L., Matas, J., Kristan, M. Discriminative correlation filter with channel and spatial reliability. Comp. Vis. Patt. Recognition, 2017, 6309–6318. https://doi.org/10.1109/CVPR.2017.515

Yan B., Zhao H., Wang D., Lu H., Yang X. ‘Skimming-Perusal’ Tracking: a framework for Real-Time and robust Long-Term tracking. IEEE/CVF International Conference on Computer Vision (ICCV), 2019. https://doi.org/10.1109/iccv.2019.00247

Huang L., Zhao X., Huang K. GlobalTrack: a simple and strong baseline for Long-Term tracking. AAAI Conference on Artificial Intelligence, 2020, Vol. 34 (07), 11037–11044. https://doi.org/10.1609/aaai.v34i07.6758

Dai K., Zhang Y., Wang D., Li J., Lu H., Yang X. High-Performance Long-Term tracking with Meta-Updater. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020, 6297–6306. https://doi.org/10.1109/cvpr42600.2020.00633

Dunnhofer M., Micheloni C. CoCoLoT: Combining Complementary Trackers in Long-Term Visual Tracking. 26th International Conference on Pattern Recognition (ICPR), 2022, 5132–5139. https://doi.org/10.1109/ICPR56361.2022.9956082

Chen X., Yan B., Zhu J., Wang D., Yang X., Lu H. Transformer Tracking. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021, 8122–8131. https://doi.org/10.1109/CVPR46437.2021.00803

Swati, Kumar V.N., Dinesh Kawa S., Engineer P.J. An Efficient Object Tracking on Edge Devices with Quantized Siamese Networks. Devices for Integrated Circuit (DevIC), 2025, 604–609. https://doi.org/10.1109/DevIC63749.2025.11012629

Kristan M., Matas J., Leonardis A., Vojír T., Pflugfelder R.P., Fernandez G.J., Nebeha, G., Porikli F.M., Cehovin L. A Novel Performance Evaluation Methodology for Single-Target Trackers. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, Vol. 38, 2137–2155. https://doi.org/10.1109/TPAMI.2016.2516982

Dalal N., Triggs B. Histograms of oriented gradients for human detection. Comp. Vis. Patt. Recognition, 2005, Vol. 1, 886–893. https://doi.org/10.1109/CVPR.2005.177

Lowe D.G. Distinctive image features from scale-invariant keypoints. IJCV, 2004, Vol. 60 (2), 91–110. https://doi.org/10.1023/B:VISI.0000029664.99615.94

Danelljan M., Hager G., Khan F.S., Felsberg M. Accurate Scale Estimation for Robust Visual Tracking. BMVC, 2014, 1–11. http://doi.org/10.5244/C.28.65

Li Y., Zhu J. A scale adaptive kernel correlation filter tracker with feature integration. Proc. European Conf. Computer Vision. 2014, 254–265. https://doi.org/10.1007/978-3-319-16181-5_18

Dolla´r P., Appel R., Belongie S., Perona P. Fast feature pyramids for object detection. TPAMI, 2014. https://doi.org/10.1109/TPAMI.2014.2300479

Krizhevsky A., Sutskever I., Hinton G.. ImageNet classification with deep convolutional neural networks. NIPS, 2012, 84–90. https://doi.org/10.1145/3065386

Shrivastava A., Gupta A., Girshick R. Training region- based object detectors with online hard example mining. IEEE conference on Computer Vision and Pattern Recognition, 2016, 761–769. https://doi.org/10.1109/CVPR.2016.89

Ren S., He K., Girshick R., Sun J. Faster R-CNN: Towards real-time object detection with region proposal networks. In NIPS, 2015, 91–99.

Lin T.-Y. et al. Feature pyramid networks for object detection. IEEE conference on Computer Vision and Pattern Recognition, 2017, 2117–2125. https://doi.org/10.1109/CVPR.2017.106

Zhou S., Zhou H., Qian L. A multi-scale small object detection algorithm SMA-YOLO for UAV remote sensing images. Sci Rep, 2025, Vol. 15, Article 9255. https://doi.org/10.1038/s41598-025-92344-7

Leutenegger S., Chli M., Siegwart R.Y. BRISK: Binary robust invariant scalable keypoints. In ICCV, 2011. https://doi.org/10.1109/ICCV.2011.6126542

Mikolajczyk K., Schmid C. A performance evaluation of local descriptors. IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), 2005, Vol. 27, 1115–1125 1615–1630. https://doi.org/10.1109/TPAMI.2005.188

Lucas B.D., Kanade T. An iterative image registration technique with an application to stereo vision. In IJCAI, 1981, 674–679. URL: https://www.ijcai.org/Proceedings/81-2/Papers/017.pdf [Accessed 03 Oct. 2025]

Downloads

Опубліковано

2025-12-08

Як цитувати

Кийко, В. (2025). Визначення масштабу та кута повороту для довгострокового відстеження об’єкта у відео. Information Technologies and Systems (Інформаційні технології та системи), 5(5), 22–38. https://doi.org/10.15407/intechsys.2025.05.022

Номер

Розділ

Комп'ютерний зір та розпізнавання образів