dataset module

class dataset.ImageDataset(data_txt: str, data_shape: tuple, img_channel: int, num_label: int, alphabet: str, phase: str = 'train')[源代码]

基类:mxnet.gluon.data.dataset.Dataset

__init__(data_txt: str, data_shape: tuple, img_channel: int, num_label: int, alphabet: str, phase: str = 'train')[源代码]

数据集初始化

参数:
  • data_txt – 存储着图片路径和对于label的文件
  • data_shape – 图片的大小(h,w)
  • img_channel – 图片通道数
  • num_label – 最大字符个数,应该和网络最终输出的序列宽度一样
  • alphabet – 字母表
label_enocder(label)[源代码]

对label进行处理,将输入的label字符串转换成在字母表中的索引

参数:label – label字符串
返回:索引列表
pre_processing(img_path)[源代码]

对图片进行处理,先按照高度进行resize,resize之后如果宽度不足指定宽度,就补黑色像素,否则就强行缩放到指定宽度

参数:img_path – 图片地址
返回:
class dataset.RecordDataset(filename, data_shape: tuple, img_channel: int, num_label: int)[源代码]

基类:mxnet.gluon.data.dataset.RecordFileDataset

A dataset wrapping over a RecordIO file contraining images Each sample is an image and its corresponding label

__init__(filename, data_shape: tuple, img_channel: int, num_label: int)[源代码]

Initialize self. See help(type(self)) for accurate signature.

label_enocder(label)[源代码]

对label进行处理,将输入的label字符串转换成在字母表中的索引

参数:label – label字符串
返回:索引列表
pre_processing(img)[源代码]

对图片进行处理 :param img_path: 图片 :return: