You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.

mindspore.dataset.serialize.rst 1.2 kB

123456789101112131415161718192021222324252627282930313233
  1. mindspore.dataset.serialize
  2. ============================
  3. .. py:method:: mindspore.dataset.serialize(dataset, json_filepath='')
  4. 将数据处理管道序列化成JSON文件。
  5. .. note::
  6. 目前不支持某些Python对象序列化。对于map算子的自定义Python函数序列化, `mindspore.dataset.serialize` 仅返回其函数名称。
  7. **参数:**
  8. - **dataset** (Dataset): 数据处理管道对象。
  9. - **json_filepath** (str): 生成序列化JSON文件的路径。
  10. **返回:**
  11. Dict,包含序列化数据集图的字典。
  12. **异常:**
  13. **OSError:** 无法打开文件。
  14. **样例:**
  15. >>> dataset = ds.MnistDataset(mnist_dataset_dir, 100)
  16. >>> one_hot_encode = c_transforms.OneHot(10) # num_classes是输入参数
  17. >>> dataset = dataset.map(operation=one_hot_encode, input_column_names="label")
  18. >>> dataset = dataset.batch(batch_size=10, drop_remainder=True)
  19. >>> # 将其序列化为JSON文件
  20. >>> ds.engine.serialize(dataset, json_filepath="/path/to/mnist_dataset_pipeline.json")
  21. >>> serialized_data = ds.engine.serialize(dataset) # 将其序列化为Python字典