使用深度学习对视频进行分类

此示例说明如何通过将预训练图像分类模型和 LSTM 网络相结合来创建视频分类网络。

要为视频分类创建深度学习网络，请执行以下操作：

下图说明网络架构。

使用深度学习对视频进行分类-LMLPHP

要将视频帧转换为特征向量，请使用预训练网络的激活值。

使用 googlenet 函数加载预训练的 GoogLeNet 模型。此函数需要 Deep Learning Toolbox™ Model for GoogLeNet Network 支持包。如果未安装此支持包，则函数会提供下载链接。

netCNN = googlenet;

从 HMDB：大型人体运动数据库下载 HMBD51 数据集，并将 RAR 文件提取到名为 "hmdb51_org" 的文件夹中。该数据集包含 51 个类的 7000 个片段、大约 2 GB 的视频数据，例如 "drink"、"run" 和 "shake_hands"。

提取 RAR 文件后，使用支持函数 hmdb51Files 获取视频的文件名和标签。

dataFolder = "