发布时间:2025-05-03 11:40:14 点击量:
HASH GAME - Online Skill Game GET 300
【专利摘要】本发明公开了一种基于感知哈希特征的视频目标跟踪方法,其特征在于,包括以下步骤:(1)读取待跟踪视频序列的第一帧;(2)在图像中画一恰好将目标包围的矩形框,作为目标框;(3)对视频帧图像进行灰度化处理;(4)提取目标框的局部哈希特征,并对特征进行为运算化处理;(5)读取视频下一帧,并采用同步骤(3)同样的方式对图像进行灰度化处理;(6)在当前帧中,采用倒金字塔候选框搜索方法在上一帧目标相同位置附近获取候选框;(7)采用同步骤(4)相同的方式,提取所有候选框的局部哈希特征;(8)计算所有候选框同上一帧目标框的相似度,选取相似度最大的候选框作为新的目标框,并重复步骤(5)~(7),直至视频结束。
[0021] 感知哈希是从多媒体数据集到感知摘要集的一种单向映射,通过感知哈希函数将 庞大的多媒体对象映射为数据量较小、长度较短的比特序列,将内容相同或相近的多媒体 对象映射为数学相同或相近的哈希值。感知阈值理论告诉我们,人类要想能够感知到不同 的事物,那么该事物所带来的刺激就必须要超过人类的感知阈值,那些未能超过阈值的,则 均被认为是相同数据,由此可知,感知哈希是允许一定感知误差的,它由传统哈希发展而 来,不但具有传统哈希简洁性、安全性的特点,还极大地提高了哈希的鲁棒性。
[0028] 传统的基于感知哈希原理的跟踪是一种模板匹配的方法,即将目标框、候选框缩 小到8*8个像素大小,再比较候选框与上一帧目标框的相似度,选出相似度最高的候选框作 为新的目标框。这种方法虽然简单易实现,但是跟踪的效果较差,尤其是在跟踪目标出现形 变、部分遮挡时,跟踪效果极为不好。产生这种现象的原因是这种8*8的模板删减了太多的 目标特征信息,从而导致不同的候选框图像却可能产生相同的哈希序列。因此,这种方法虽 然有相当好的简洁性,但却不满足跟踪问题中所需求的鲁棒性。
[0038]在机器运算中,其对数据存储的方式也是由0、1组成的二进制序列。本发明利用局 部哈希特征矩阵元素只有〇、1的特点,将每个局部哈希特征矩阵按行序排列成一个长度为 64的向量。且在机器运算中存在一种长整型变量也是64位长度,因此每个局部哈希特征都 可以用一个长整型的变量来表示,原本需要64个变量存储的特征,只需一个长整型即可,这 在内存储存方面能够有效的减少成本,也是局部子图像块的大小定为8*8的一个重要原因。 [0039 ]优选地,对于步骤(6)具体包含以下内容:
[0040] 在搜索候选框时,传统的候选框搜索策略是一种全遍历方式,即在目标周围一定 范围内逐点遍历图像。这样做的好处是,目标周围所有的候选框均可以被涵盖,且不会被遗 漏。但是,在目标跟踪中,目标框的位置发生微小变化,如果并不影响跟踪结果,则目标框附 近的数个候选框均可以作为新的目标框。因此传统的全遍历搜索策略搜索出的许多候选框 其实是冗余的,这会导致算法的计算负担极大加重,运行时间增加,从而无法实现实时跟
[0063] =00001101 11101101 00000000 00000000 00000000 00000000 00000000 00000000在统计异或结果序列中Γ的个数时,本发明采用移位和按位相与的方式进行加 速计算。为方便解释,假设结果序列为S(S = 00110011),序列中Γ的个数为num(l),并设其 初始值为0,让序列S与序列B(B = 00000001)按位相与,这样做的目的是判断序列S中最后一 位是否为Γ。相与的结果z = 00000001,其在计算机中的值为1,即Z = I,故在num(l)上加Z; 然后,为了判断序列S中倒数第二位是否为1,将S右移一位,得到S=00011001,再让S与 00000001按位相与,得到结果为z = 00000001,同样在num(l)上再加Z。依次类推,直至整个 序列中所有位都经过判断。最终的ruim(l)即序列中Γ的个数,也即是两个序列的汉明距 离。
[0100]因为候选框和目标框的局部哈希特征hashValUe[270]中包含了两百多子子图 像块的哈希特征,因此比较候选框与目标框的相似度可转换为比较每个对应位置子图像块 的相似度,然后对所有子图像块的相似度求均值,从而得到候选框与目标框整体的相似度。 [0101 ] -般的,当相似度大于0.5,便认为两个序列存在相关性,当相似度大于0.75便认 为两个序列有较高的相似度,当相似度大于〇. 95便认为两个序列几乎是相同序列。
1. 一种基于感知哈希特征的视频目标跟踪方法,其特征在于,包括W下步骤: (1) 读取待跟踪视频序列的第一帖; (2) 在图像中画一恰好将目标包围的矩形框,作为目标框; (3) 对视频帖图像进行灰度化处理; (4) 提取目标框的局部哈希特征,并对特征进行为运算化处理; (5) 读取视频下一帖,并采用同步骤(3)同样的方式对图像进行灰度化处理; (6) 在当前帖中,采用倒金字塔候选框捜索方法在上一帖目标相同位置附近获取候选 框; (7) 采用同步骤(4)相同的方式,提取所有候选框的局部哈希特征; (8) 计算所有候选框同上一帖目标框的相似度,选取相似度最大的候选框作为新的目 标框,并重复步骤(5)~(7 ),直至视频结束。2. 如权利要求1所述的方法,其特征在于,所述步骤(4)中提取目标框的局部哈希特征 具体为:在原目标图像中提取出多个大小为8*8的局部子图像块,分别对每个子图像块提取 感知哈希特征,得到局部哈希特征。3. 如权利要求1或2所述的方法,其特征在于,所述步骤(4)中对特征进行为运算化处理 具体为:将每个局部哈希特征矩阵按行序排列成一个长度为64的向量。4. 如权利要求1或2所述的方法,其特征在于,所述步骤(6)中倒金字塔候选框捜索方法 具体为目标的左上角为中屯、,由内向外构造不同面积、互不重叠的矩形或矩形环区域, 作为待捜索区域,且在不同捜索区域捜索时,其捜索步长也因区域离中屯、点的距离大小而 变化。5. 如权利要求4所述的方法,其特征在于,在捜索区域中: 沿X方向的捜索迭代公式:上式中,i代表所在区,i = 1,2,3。致巧(瑞;,斯和汾巧(0,诚^,)分别表示沿X和y方向的迭代 步长。6. 如权利要求1或2所述的方法,其特征在于,在所述步骤(8)中采用汉明距离作为局部 哈希特征的度量方式。7. 如权利要求6所述的方法,其特征在于,候选框与目标框整体的相似度S为:其中m为子图像块的个数,Si为候选框与目标框的子图像块的相似度。8. 如权利要求2所述的方法,其特征在于,对于大小为W · h的图像,一共可获取子图像 块的个数为:其中,a为每次平移的步长,[·]为取整符号。9. 如权利要求5所述的方法,其特征在于,10. 如权利要求2所述的方法,其特征在于,感知哈希特征的提取方法如下:其中,式中P(x,y)表示原图在点(x,y)处的像素值,S(x,y)表示哈 希特征在点(x,y)处的结果值,W表示图像的宽度,h表示图像的高度。