You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.

README.md 2.5 kB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394
  1. # 之江天枢-数据集导入脚本
  2. **之江天枢一站式人工智能开源平台**(简称:**之江天枢**),为了实现其他平台已标注完成的数据集在「一站式开发平台」上进行开发,我们增加了数据集导入的功能,实现对数据集的全流程功能操作。
  3. ## 源码部署
  4. 安装如下软件环境。
  5. - OpenJDK:1.8+
  6. ## 下载脚本
  7. - 数据集模板:http://tianshu.org.cn/static/upload/file/dubhe-dataset-template.zip
  8. - 上传数据集脚本:http://tianshu.org.cn/static/upload/file/upload_dataset.zip
  9. ## 脚本使用说明:
  10. - 登录天枢系统深度学习平台,在数据管理菜单下的数据集管理中创建数据集。获取数据集ID
  11. - 需要自行准备图片文件、标注文件、标签文件
  12. ## 运行脚本:
  13. 1.解压下载的zip文件,需要自行配置数据源、MinIO相关配置
  14. 2.运行脚本Windows 运行 run.bat; macOS/Linux 系统运行 run.sh
  15. 注:可自行配置'application-{env}.xml'文件,执行命令后面添加 'run.bat {env}'即可执行对应的application-{env}.xml;然后按提示进行操作
  16. 3.输入数据集ID
  17. 4.输入待导入数据集绝对路径
  18. ## 目录结构:
  19. ```
  20. 标签文件: label_{name}.json ({name} 代表标签组名,可自行定义; 只读标签组文件夹下的第一个标签组文件,标签文件仅支持:.json 支持大小写;文件内容为JSON字符串)
  21. 图片文件目录: origin (图片文件需要有后缀名,支持四种格式:.jpg,.png,.bmp,.jpeg 支持大小写)
  22. 标注文件目录: annotation (标注文件需要有后缀名,仅支持格式:.json 支持大小写; 文件内容为JSON字符串)
  23. ```
  24. ## 文件格式
  25. - 标签文件内容样例:
  26. ```
  27. name: 名称
  28. color: 颜色(16进制编码)
  29. ```
  30. 详细示例:
  31. ```
  32. [{
  33. "name": "行人",
  34. "color": "#ffbb96"
  35. },
  36. {
  37. "name": "自行车",
  38. "color": "#fcffe6"
  39. },
  40. {
  41. "name": "汽车",
  42. "color": "#f4ffb8"
  43. }]
  44. ```
  45. - 标注文件内容样例:
  46. ```
  47. name: 名称
  48. bbox: 标注位置
  49. score:分数
  50. ```
  51. 详细示例:
  52. ```
  53. [{
  54. "name": "行人",
  55. "bbox": [321.6755762696266, 171.32076993584633, 185.67924201488495, 145.02639323472977],
  56. "score": 0.6922634840011597
  57. },
  58. {
  59. "name": "自行车",
  60. "bbox": [40.88740050792694, 22.707078605890274, 451.21362805366516, 326.0102793574333],
  61. "score": 0.6069411635398865
  62. }]
  63. ```
  64. ## 了解更多
  65. http://docs.dubhe.ai/docs/module/dataset/import-dataset

一站式算法开发平台、高性能分布式深度学习框架、先进算法模型库、视觉模型炼知平台、数据可视化分析平台等一系列平台及工具,在模型高效分布式训练、数据处理和可视分析、模型炼知和轻量化等技术上形成独特优势,目前已在产学研等各领域近千家单位及个人提供AI应用赋能

Contributors (1)