You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.

mindspore.ops.LayerNorm.rst 2.0 kB

123456789101112131415161718192021222324252627282930313233343536373839
  1. mindspore.ops.LayerNorm
  2. =======================
  3. .. py:class:: mindspore.ops.LayerNorm(begin_norm_axis=1, begin_params_axis=1, epsilon=1e-7)
  4. 在输入Tensor上应用层归一化(Layer Normalization)。
  5. 此算子将在给定的轴上对输入进行层归一化。`Layer Normalization <https://arxiv.org/abs/1607.06450>`_ 描述了LayerNorm。
  6. .. math::
  7. y = \frac{x - mean}{\sqrt{variance + \epsilon}} * \gamma + \beta
  8. 其中 :math:`\gamma` 是Scalar, :math:`\beta` 是偏置项, :math:`\epsilon` 是精度值。
  9. **参数:**
  10. - **begin_norm_axis** (int) - 指定 `input_x` 需进行层归一化的起始维度,其值必须在[-1, rank(input)范围内。默认值:1。
  11. - **begin_params_axis** (int) - 指定输入参数(`gamma`, `beta`) 需进行层归一化的开始轴,其值必须在[-1, rank(input))范围内。默认值:1。
  12. - **epsilon** (float) - 添加到分母中的值,以确保数据稳定性。默认值:1e-7。
  13. **输入:**
  14. - **input_x** (Tensor) - LayerNorm的输入,shape为 :math:`(N, \ldots)` 的Tensor。
  15. - **gamma** (Tensor) - 可学习参数 :math:`\gamma` ,shape为 :math:`(P_0, \ldots, P_\text{begin_params_axis})` 的Tensor。
  16. - **beta** (Tensor) - 可学习参数 :math:`\beta` 。shape为 :math:`(P_0, \ldots, P_\text{begin_params_axis})` 的Tensor。
  17. **输出:**
  18. tuple[Tensor],3个Tensor组成的tuple,层归一化输入和更新后的参数。
  19. - **output_x** (Tensor) - 层归一化输入,shape为是 :math:`(N, C)` 。数据类型和shape与 `input_x` 相同。
  20. - **mean** (Tensor) - 输入的均值,shape为 :math:`(C,)` 的Tensor。
  21. - **variance** (Tensor) - 输入的方差,shape为 :math:`(C,)` 的Tensor。
  22. **异常:**
  23. - **TypeError** - `begin_norm_axis` 或 `begin_params_axis` 不是int。
  24. - **TypeError** - `epsilon` 不是float。
  25. - **TypeError** - `input_x`、`gamma` 或 `beta` 不是Tensor。