You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.

mindspore.dataset.rst 3.1 kB

4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
4 years ago
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110
  1. mindspore.dataset
  2. =================
  3. 该模块提供了加载和处理各种通用数据集的API,如MNIST、CIFAR-10、CIFAR-100、VOC、COCO、ImageNet、CelebA、CLUE等,
  4. 也支持加载业界标准格式的数据集,包括MindRecord、TFRecord、Manifest等。此外,用户还可以使用此模块定义和加载自己的数据集。
  5. 该模块还提供了在加载时进行数据采样的API,如SequentialSample、RandomSampler、DistributedSampler等。
  6. 大多数数据集可以通过指定参数 `cache` 启用缓存服务,以提升整体数据处理效率。
  7. 请注意Windows平台上还不支持缓存服务,因此在Windows上加载和处理数据时,请勿使用。更多介绍和限制,
  8. 请参考 `Single-Node Tensor Cache <https://www.mindspore.cn/docs/programming_guide/zh-CN/master/cache.html>`_。
  9. 在API示例中,常用的模块导入方法如下:
  10. .. code-block::
  11. import mindspore.dataset as ds
  12. from mindspore.dataset.transforms import c_transforms
  13. 常用数据集术语说明如下:
  14. - Dataset,所有数据集的基类,提供了数据处理方法来帮助预处理数据。
  15. - SourceDataset,一个抽象类,表示数据集管道的来源,从文件和数据库等数据源生成数据。
  16. - MappableDataset,一个抽象类,表示支持随机访问的源数据集。
  17. - Iterator,用于枚举元素的数据集迭代器的基类。
  18. 视觉
  19. -----
  20. .. cnmsautosummary::
  21. :toctree: dataset
  22. mindspore.dataset.CelebADataset
  23. mindspore.dataset.Cifar10Dataset
  24. mindspore.dataset.Cifar100Dataset
  25. mindspore.dataset.CocoDataset
  26. mindspore.dataset.ImageFolderDataset
  27. mindspore.dataset.ManifestDataset
  28. mindspore.dataset.MnistDataset
  29. mindspore.dataset.VOCDataset
  30. 文本
  31. ----
  32. .. cnmsautosummary::
  33. :toctree: dataset
  34. mindspore.dataset.CLUEDataset
  35. mindspore.dataset.TextFileDataset
  36. 标准格式
  37. --------
  38. .. cnmsautosummary::
  39. :toctree: dataset
  40. mindspore.dataset.CSVDataset
  41. mindspore.dataset.MindDataset
  42. mindspore.dataset.TFRecordDataset
  43. 用户自定义
  44. ----------
  45. .. cnmsautosummary::
  46. :toctree: dataset
  47. mindspore.dataset.GeneratorDataset
  48. mindspore.dataset.NumpySlicesDataset
  49. mindspore.dataset.PaddedDataset
  50. ---
  51. .. cnmsautosummary::
  52. :toctree: dataset
  53. mindspore.dataset.GraphData
  54. 采样器
  55. -------
  56. .. cnmsautosummary::
  57. :toctree: dataset
  58. mindspore.dataset.DistributedSampler
  59. mindspore.dataset.PKSampler
  60. mindspore.dataset.RandomSampler
  61. mindspore.dataset.SequentialSampler
  62. mindspore.dataset.SubsetRandomSampler
  63. mindspore.dataset.SubsetSampler
  64. mindspore.dataset.WeightedRandomSampler
  65. 其他
  66. -----
  67. .. cnmsautosummary::
  68. :toctree: dataset
  69. mindspore.dataset.DatasetCache
  70. mindspore.dataset.DSCallback
  71. mindspore.dataset.Schema
  72. mindspore.dataset.WaitedDSCallback
  73. mindspore.dataset.compare
  74. mindspore.dataset.deserialize
  75. mindspore.dataset.serialize
  76. mindspore.dataset.show
  77. mindspore.dataset.utils.imshow_det_bbox
  78. mindspore.dataset.zip