,团队认为他们需要一种能够学习更抽象的人脸概念的技术。
团队选择用 PyTorch 训练模型。团队介绍道, 通过 PyTorch,他们可以访问最先进的预训练模型,满足其训练需求,并使归档过程更高效。
训练过程中,团队发现,他们的数据集中,正样本是足够的,却没有充足的负样本来训练模型。他们决定使用不包含动画面孔、但具有动画特征的其他图像,来增加初始数据集。
在技术上为了做到这一点, 他们扩展了 Torchvision 的 Faster-RCNN 实现,以允许在训练过程中加载负样本而无需注释。
这也是团队在 Torchvision 核心开发人员的引导下,为 Torchvision 0.6 做出的一项新功能。 在数据集中添加负样本示例,可以在推理时大大减少误报,从而得到出色的结果。
用 PyTorch 处理视频,效率提升 10 倍
实现动画形象的面部识别之后,团队的下一个目标是加快视频分析流程,而应用 PyTorch 能够有效并行化并加速其他任务。
团队介绍道, 读取和解码视频也很耗时,因此团队使用自定义的 PyTorch IterableDataset,与 PyTorch 的 DataLoader 结合使用,允许使用并行 CPU 读取视频的不同部分。

(编辑:鞍山站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|