zzy34407230
/
mindspore2022

mindspore.nn.Optimizer
======================

.. py:class:: mindspore.nn.Optimizer(learning_rate, parameters, weight_decay=0.0, loss_scale=1.0)

    ���ڲ������µ��Ż������ࡣ��Ҫֱ��ʹ������࣬��ʵ��������һ�����ࡣ

    �Ż���֧�ֲ������顣����������ʱ��ÿ������������ò�ͬ��ѧϰ�ʣ�`lr` ����Ȩ��˥����`weight_decay`�����ݶ����Ļ���`grad_centralization`�����ԡ�

    .. note::
        �ڲ���δ����ʱ���Ż������õ� `weight_decay` Ӧ�������ƺ���"beta"��"gamma"�����������ͨ�������������ɵ���Ȩ��˥�����ԡ�����ʱ��ÿ����������������� `weight_decay` ����δ���ã�������������ʹ���Ż��������õ� `weight_decay`��

    **������**

    - **learning_rate (Union[float, int, Tensor, Iterable, LearningRateSchedule]):

      - **float** - �̶���ѧϰ�ʡ�������ڵ����㡣
      - **int** - �̶���ѧϰ�ʡ�������ڵ����㡣�������ͻᱻת��Ϊ��������
      - **Tensor** - �����Ǳ�����һά�����������ǹ̶���ѧϰ�ʡ�һά�����Ƕ�̬��ѧϰ�ʣ���i����ȡ�����е�i��ֵ��Ϊѧϰ�ʡ�
      - **Iterable** - ��̬��ѧϰ�ʡ���i����ȡ��������i��ֵ��Ϊѧϰ�ʡ�
      - **LearningRateSchedule** - ��̬��ѧϰ�ʡ���ѵ�������У��Ż�����ʹ�ò�����step����Ϊ���룬���� `LearningRateSchedule` ʵ�������㵱ǰѧϰ�ʡ�
    
    - **parameters (Union[list[Parameter], list[dict]])** - ������ `Parameter` ��ɵ��б����ֵ���ɵ��б������б�Ԫ�����ֵ�ʱ���ֵ�ļ�������"params"��"lr"��"weight_decay"��"grad_centralization"��"order_params"��

      - **params** - �����ǰ����Ȩ�أ���ֵ������ `Parameter` �б���
      - **lr** - ��ѡ��������д���"lr"����ʹ�ö�Ӧ��ֵ��Ϊѧϰ�ʡ����û�У���ʹ���Ż��������õ� `learning_rate` ��Ϊѧϰ�ʡ�
      - **weight_decay** - ��ѡ��������д���"weight_decay������ʹ�ö�Ӧ��ֵ��ΪȨ��˥��ֵ�����û�У���ʹ���Ż��������õ� `weight_decay` ��ΪȨ��˥��ֵ��
      - **grad_centralization** - ��ѡ��������д���"grad_centralization"����ʹ�ö�Ӧ��ֵ����ֵ����Ϊ�������͡����û�У�����Ϊ `grad_centralization` ΪFalse���ò����������ھ����㡣
      - **order_params** - ��ѡ����Ӧֵ��Ԥ�ڵĲ�������˳�򡣵�ʹ�ò������鹦��ʱ��ͨ��ʹ�ø�������� `parameters` ��˳�����������ܡ�������д���"order_params"�������Ը��������е���������"order_params"�еĲ���������ĳһ�� `params` �����С�

    - **weight_decay** (Union[float, int]) - Ȩ��˥���������򸡵�ֵ��������ڻ����0����� `weight_decay` ��������������ת��Ϊ��������Ĭ��ֵ��0.0��
    - **loss_scale** (float) - �ݶ�����ϵ�����������0����� `loss_scale` ��������������ת��Ϊ��������ͨ��ʹ��Ĭ��ֵ������ѵ��ʱʹ���� `FixedLossScaleManager`���� `FixedLossScaleManager `�� `drop_overflow_update` ��������ΪFalseʱ����ֵ��Ҫ�� `FixedLossScaleManager` �е� `loss_scale` ��ͬ���йظ�����ϸ��Ϣ�������class��`mindspore.FixedLossScaleManager`��Ĭ��ֵ��1.0��

    **�쳣��**

    - **TypeError** - `learning_rate` ����int��float��Tensor��Iterable��LearningRateSchedule��
    - **TypeError** - `parameters` ��Ԫ�ز���Parameter���ֵ䡣
    - **TypeError** - `loss_scale` ����float��
    - **TypeError** - `weight_decay` ����float��int��
    - **ValueError** - `loss_scale` С�ڻ����0��
    - **ValueError** - `weight_decay` С��0��
    - **ValueError** - `learning_rate` ��һ��Tensor������Tensor��ά�ȴ���1��

    **֧��ƽ̨��**

    ``Ascend``  ``GPU``  ``CPU``

    .. py:method:: broadcast_params(optim_result)

        ���������˳����в����㲥��

        **������**

        **optim_result** (bool) - �������½����������������֤����������ɺ��ִ�в����㲥��

        **���أ�**

        bool��״̬��־��

    .. py:method:: decay_weight(gradients)

        ˥��Ȩ�ء�

        һ�ּ������ѧϰ������ģ�͹���ϵķ������̳�  :class:`mindspore.nn.Optimizer` �Զ����Ż���ʱ���ɵ��øýӿڽ���Ȩ��˥����

        **������**

        **gradients** (tuple[Tensor]) - ����������ݶȣ���״��shape�������������ͬ��

        **���أ�**

        tuple[Tensor]��˥��Ȩ�غ���ݶȡ�

    .. py:method:: get_lr()

        �Ż������øýӿڻ�ȡ��ǰ���裨step����ѧϰ�ʡ��̳� :class:`mindspore.nn.Optimizer` �Զ����Ż���ʱ�����ڲ�������ǰ���øýӿڻ�ȡѧϰ�ʡ�

        **���أ�**

        float����ǰ�����ѧϰ�ʡ�

    .. py:method:: get_lr_parameter(param)

        ������ʹ������������鹦�ܣ���Ϊ��ͬ������ò�ͬ��ѧϰ��ʱ����ȡָ��������ѧϰ�ʡ�

        **������**

        **param** (Union[Parameter, list[Parameter]]) - `Parameter` �� `Parameter` �б���

        **���أ�**

        Parameter������ `Parameter` �� `Parameter` �б������ʹ���˶�̬ѧϰ�ʣ��������ڼ���ѧϰ�ʵ� `LearningRateSchedule` �� `LearningRateSchedule` �б���

        **������**

        >>> from mindspore import nn
        >>> net = Net()
        >>> conv_params = list(filter(lambda x: 'conv' in x.name, net.trainable_params()))
        >>> no_conv_params = list(filter(lambda x: 'conv' not in x.name, net.trainable_params()))
        >>> group_params = [{'params': conv_params, 'lr': 0.05},
        ...                 {'params': no_conv_params, 'lr': 0.01}]
        >>> optim = nn.Momentum(group_params, learning_rate=0.1, momentum=0.9, weight_decay=0.0)
        >>> conv_lr = optim.get_lr_parameter(conv_params)
        >>> print(conv_lr[0].asnumpy())
        0.05

    .. py:method:: gradients_centralization(gradients)

        �ݶ����Ļ���

        һ���Ż������������������ѧϰ������ģ��ѵ���ٶȵķ������̳� :class:`mindspore.nn.Optimizer` �Զ����Ż���ʱ���ɵ��øýӿڽ����ݶ����Ļ���

        **������**
        
        **gradients** (tuple[Tensor]) - ����������ݶȣ���״��shape�������������ͬ��

        **���أ�**

        tuple[Tensor]���ݶ����Ļ�����ݶȡ�

    .. py:method:: scale_grad(gradients)

        �����ڻ�Ͼ��ȳ�����ԭ�ݶȡ�

        �̳� :class:`mindspore.nn.Optimizer` �Զ����Ż���ʱ���ɵ��øýӿڻ�ԭ�ݶȡ�

        **������**
        
        **gradients** (tuple[Tensor]) - ����������ݶȣ���״��shape�������������ͬ��

        **���أ�**

        tuple[Tensor]����ԭ����ݶȡ�

    .. py:method:: target
        :property:

        ����������ָ����������host���ϻ����豸��device���ϸ��²�������������Ϊstr��ֻ����'CPU'��'Ascend'��'GPU'��

    .. py:method:: unique
        :property:

        �����Ա�ʾ�Ƿ����Ż����н����ݶ�ȥ�أ�ͨ������ϡ�����硣����ݶ���ϡ���������ΪTrue�����ǰ��ϡ�������Ѷ�Ȩ��ȥ�أ����ݶ��ǳ��ܵģ�������ΪFalse��δ����ʱĬ��ֵΪTrue��