论文笔记《Learning Multi-Domain Convolutional Neural Networks for Visual Tracking》 0. 摘要 基于CNN的一个跟踪算法,达到了state-of-art水平,意味着深度学习又占领了一个山头。本文中使用的网络由共享层(shared layers)和许多特定目标分支层组成。每一个分支层对应一个二分类的任务:确定输入样本是不是该分支对应的跟踪目标。当在一个新的图像序列中跟踪一个目标时,用一个新的二分类层连接共享层,作为新的跟踪网络,并实时在线微调。这个网络取名MDNet,具体细节看下文。 1. Multi-Domain Network (MDNet) 1.1 网络结构 相比于AlexNet和VGG-Nets,作者使用了一个相对较小的网络来做跟踪,并解释了理由: 跟踪问题本质上只是个二分类的任务,对模型复杂度要求相对更低。 随着网络越来越深,空间信息越来越稀释,所以:对于图像中精准的目标定位,CNN并不是那么有效。 在跟踪任务中通常目标较小,所以输入大小(input size)也就小,网络结构自然也就更浅。 跟踪通常是一个实时任务,小网络显然更有效率。 下图即MDNet网络结构,由共享层和K个特定目标分支层组成,黄色和蓝色的bounding boxes分别对应每个特定分支层的正样本和负样本。 1.2 Learning Algorithm ... read more
深度学习之训练一个人脸性别分类器 0. Whatever 深度学习越来越火,人人都能玩! 在本文中我将通过深度学习方法训练一个性别分类器,即给定一张人脸图像,判断其性别。 本文使用的深度学习框架:基于Theano的Keras(github:keras) 1. Data Preprocess 数据来源:互联网明星图片。男性照片25个类,共3690张;女性照片15个类,共4309张。所有图片经过人脸检测对齐归一化到141*165尺寸大小。样例如下: 生成图片路径和label文件格式如下: ... E:\face data\gender_pic\female\163\38243_big.jpg,0 E:\face data\gender_pic\female\163\38244_big.jpg,0 E ... read more