IIIT 5K-Word数据集 - 资源下载

3 有用

22 下载

IIIT 5K-Word数据集

文件列表（压缩包大小 107.85M)

免费

概述

IIIT 5K-Word数据集

介绍

IIIT 5K-word数据集是从Google图像搜索中通过使用广告词，广告牌，门牌号，门牌号，电影海报等查询词来收集图像获得的。
数据集包含来自“场景文本”的5000个裁剪的单词图像和原始数字图像。
数据集分为训练部分和测试部分。
该数据集可用于大型词典裁剪单词识别。我们还为该数据集提供了超过50万个词典单词的词典。

内容

裁剪的单词图像分为训练集和测试集
有效数据注释，中小型词典
带有50万个单词的词汇（摘自Weinman等，2009）
字符边界框级别的注释
用于计算语言优先级的词典在lexicon.txt文件中，与基于大型词典的识别结果进行比较时，请使用此词典。

用法

（1）如何加载测试数据信息

（用法：不区分大小写的小/中/大词典的裁剪单词识别）

打开Matlab
加载测试数据
将加载结构测试数据。此结构有四个字段：（a）ImgName:裁剪的单词图像名称。（b）GroundTruth:指定的与裁剪单词相对应的GroundTruth文本（c）smallLexi：包含每个图像50个单词的词典列表（小型词典）。（d）mediumLexi：包含每个图像1000个单词的词典列表（中等大小的词典）

（2）如何加载字符边框信息

（用法：区分大小写的字符检测/识别）

打开Matlab
加载testCharBound（或trainCharBound）
将加载结构testCharBound（或trainCharBound）。它包含三个方面：（a）ImgName单词图像名称（b）字符字符串。（c）charBB与char相同的字符边界框。边界框存储为[x y width height]。

例：

>> load testCharBound
 
>> testCharBound(1).ImgName

ans =

test/1002_1.png


>> testCharBound(1).chars

ans =

PRIVATE


>> testCharBound(1).charBB(1,:) %% Loads bounding box for character "P" (i.e. first character of testCharBound(1).chars)

ans =

     4     7    32    45

>> testCharBound(1).charBB(5,:) %% Loads bounding box for character "A" (i.e. fifth character of testCharBound(1).chars)

ans =

   115     7    37    43