You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.

serve_desc.yaml 2.6 kB

2 years ago
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354
  1. #必填: 模型开发商,目前为平台枚举值
  2. vendor: apulis.infer
  3. #选填: 应用名称,即标签名称
  4. app: det
  5. #选填: 名称
  6. name: 目标检测
  7. #选填:
  8. description: "单模型目标检测"
  9. # 由 device(type+series) + kernel + model_path 唯一决定一个推理服务启动所需要的的全部信息
  10. #可用的推理框架列表
  11. serves:
  12. #选填,可选值参考selector.yaml中 infer_framework 字段
  13. - framework: ACL
  14. #必填,以infer文件夹为根目录,此列表中应该唯一
  15. model_path: model.onnx
  16. #必填,如果为air那么平台会自动进行转换为om,可选值参考selector.yaml中 model_format 字段
  17. format: onnx
  18. #选填,对应serve.yaml中的值, 模型推理精度 ,可选值参考selector.yaml中 precision 字段
  19. precision: int8
  20. #选填, 相对于infer根目录,存放该推理服务相关所有信息
  21. plugin: transformer
  22. #必填,是否支持单独推理
  23. standalone: true
  24. #选填: 推理相关描述,同 serve.yaml中的 inference描述
  25. inference:
  26. #[可选]对接推理核心 支持 apuisv,mindx
  27. kernel: apuisv
  28. #[可选]对接用户协议 空表示默认使用 apulis_infer.proto协议
  29. agent: ""
  30. #允许透传
  31. passthrough: true
  32. #[可选] 如果需要额外协议 默认加载transformer目录下 *.proto协议文件
  33. proto: "ext.proto"
  34. #[可选] 需要的推理镜像地址
  35. engine: "#/algorithm/apulistech/apulis-inference-serving:1.0.0-rc0_cuda-11.5_mindx-2.0.3_triton-22.03"
  36. #[可选] 应用镜像启动入口,为空则由平台额外启动器插入工具启动(必须是平台内置支持的kernel)
  37. entrypoint: "/apulis_infer/script/start.sh"
  38. #正常最大请求延时,单位毫秒 ms
  39. healthy_delay: 500
  40. #[必选] 硬件资源描述
  41. devices:
  42. #必填,可选值参考selector.yaml中 device_type 字段
  43. - type: nvidia_gpu
  44. #选填,设备型号,gpu与cpu不需要填写该字段 ,填写该字段则进行型号筛选。多个型号使用逗号分割 目前参考值 | a310 | a910 | 910b | 910pro | 910prob
  45. series:
  46. #选填,最少使用的设备卡数
  47. device_num: 1
  48. #选填,最少使用的CPU核心数,单位 个
  49. cpu: 2
  50. #选填,最少使用的内存大小,单位 GB
  51. memory: 8

No Description

Contributors (3)