Learned Spatio-Temporal Texture Descriptors for RGB-D Human Action Recognition

Zhengyuan Zhai; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing; Chunxiao Fan; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing; Yue Ming; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing

Zhengyuan Zhai; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing ; Chunxiao Fan; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing ; Yue Ming; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing

Computing and Informatics, Tome 37 (2019) no. 6, / Harvested from Computing and Informatics

Text on Computing and Informatics

Résumé

Due to the recent arrival of Kinect, action recognition with depth images has attracted researchers' wide attentions and various descriptors have been proposed, where Local Binary Patterns (LBP) texture descriptors possess the properties of appearance invariance. However, the LBP and its variants are most artificially-designed, demanding engineers' strong prior knowledge and not discriminative enough for recognition tasks. To this end, this paper develops compact spatio-temporal texture descriptors, i.e. 3D-compact LBP (3D-CLBP) and local depth patterns (3D-CLDP), for color and depth videos in the light of compact binary face descriptor learning in face recognition. Extensive experiments performed on three standard datasets, 3D Online Action, MSR Action Pairs and MSR Daily Activity 3D, demonstrate that our method is superior to most comparative methods in respects of performance and can capture spatial-temporal texture cues in videos.

Publié le : 2019-02-05
Classification: Computer Vision, 3D pixel differences vectors, compact binary face descriptor, feature fusion, human action recognition, RGB-depth videos, 68Txx

@article{cai2018_6_1339,
     author = {Zhengyuan Zhai; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing and Chunxiao Fan; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing and Yue Ming; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing},
     title = {Learned Spatio-Temporal Texture Descriptors for RGB-D Human Action Recognition},
     journal = {Computing and Informatics},
     volume = {37},
     number = {6},
     year = {2019},
     language = {en},
     url = {http://dml.mathdoc.fr/item/cai2018_6_1339}
}

Zhengyuan Zhai; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing; Chunxiao Fan; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing; Yue Ming; Beijing University of Posts and Telecommunications, Beijing University of Posts and Telecommunications, 100 876 Beijing. Learned Spatio-Temporal Texture Descriptors for RGB-D Human Action Recognition. Computing and Informatics, Tome 37 (2019) no. 6, . http://gdmltest.u-ga.fr/item/cai2018_6_1339/