zzy34407230
/
mindspore2022

Class mindspore.nn.Optimizer(learning_rate, parameters, weight_decay=0.0, loss_scale=1.0)

    ���ڲ������µ��Ż������ࡣ��Ҫֱ��ʹ������࣬��ʵ��������һ�����ࡣ

    �Ż���֧�ֲ������顣����������ʱ��ÿ������������ò�ͬ��ѧϰ�ʣ�`lr`����Ȩ��˥����`weight_decay`�����ݶ����Ļ���`grad_centralization`�����ԡ�

    ע��
        �ڲ���δ����ʱ���Ż������õ�`weight_decay`Ӧ�������ƺ���"beta"��"gamma"�����������ͨ�������������ɵ���Ȩ��˥�����ԡ�����ʱ��ÿ�����������������`weight_decay`����δ���ã�������������ʹ���Ż��������õ�`weight_decay`��

    ������
        learning_rate (Union[float, int, Tensor, Iterable, LearningRateSchedule]):

            - float: �̶���ѧϰ�ʡ�������ڵ����㡣

            - int: �̶���ѧϰ�ʡ�������ڵ����㡣�������ͻᱻת��Ϊ��������

            - Tensor: �����Ǳ�����һά�����������ǹ̶���ѧϰ�ʡ�һά�����Ƕ�̬��ѧϰ�ʣ���i����ȡ�����е�i��ֵ��Ϊѧϰ�ʡ�

            - Iterable: ��̬��ѧϰ�ʡ���i����ȡ��������i��ֵ��Ϊѧϰ�ʡ�

            - LearningRateSchedule: ��̬��ѧϰ�ʡ���ѵ�������У��Ż�����ʹ�ò�����step����Ϊ���룬����`LearningRateSchedule`ʵ�������㵱ǰѧϰ�ʡ�

        parameters (Union[list[Parameter], list[dict]]): ������`Parameter`��ɵ��б����ֵ���ɵ��б������б�Ԫ�����ֵ�ʱ���ֵ�ļ�������"params"��"lr"��"weight_decay"��"grad_centralization"��"order_params"��

            - params: �����ǰ����Ȩ�أ���ֵ������`Parameter`�б���

            - lr: ��ѡ��������д���"lr"����ʹ�ö�Ӧ��ֵ��Ϊѧϰ�ʡ�
              ���û�У���ʹ���Ż��������õ�`learning_rate`��Ϊѧϰ�ʡ�

            - weight_decay: ��ѡ��������д���"weight_decay������ʹ�ö�Ӧ��ֵ��ΪȨ��˥��ֵ�����û�У���ʹ���Ż��������õ�`weight_decay`��ΪȨ��˥��ֵ��

            - grad_centralization: ��ѡ��������д���"grad_centralization"����ʹ�ö�Ӧ��ֵ����ֵ����Ϊ�������͡����û�У�����Ϊ`grad_centralization`ΪFalse��
              �ò����������ھ����㡣

            - order_params: ��ѡ����Ӧֵ��Ԥ�ڵĲ�������˳�򡣵�ʹ�ò������鹦��ʱ��ͨ��ʹ�ø��������`parameters`��˳�����������ܡ�
              ������д���"order_params"�������Ը��������е���������"order_params"�еĲ���������ĳһ��`params`�����С�

        weight_decay (Union[float, int]): Ȩ��˥���������򸡵�ֵ��
            ������ڻ����0��
            ���`weight_decay`��������������ת��Ϊ��������Ĭ��ֵ��0.0��

        loss_scale (float): �ݶ�����ϵ�����������0�����`loss_scale`��������������ת��Ϊ��������ͨ��ʹ��Ĭ��ֵ������ѵ��ʱʹ����`FixedLossScaleManager`����`FixedLossScaleManager`��`drop_overflow_update`��������ΪFalseʱ����ֵ��Ҫ��`FixedLossScaleManager`�е�`loss_scale`��ͬ���йظ�����ϸ��Ϣ�������class��`mindspore.FixedLossScaleManager`��
            Ĭ��ֵ��1.0��

    �쳣��
        TypeError: `learning_rate`����int��float��Tensor��Iterable��LearningRateSchedule��
        TypeError: `parameters`��Ԫ�ز���Parameter���ֵ䡣
        TypeError: `loss_scale`����float��
        TypeError: `weight_decay`����float��int��
        ValueError: `loss_scale`С�ڻ����0��
        ValueError: `weight_decay`С��0��
        ValueError: `learning_rate`��һ��Tensor������Tensor��ά�ȴ���1��

    ֧�ֵ�ƽ̨��
        ``Ascend`` ``GPU`` ``CPU``


broadcast_params(optim_result)

        ���������˳����в����㲥��

        ������
            optim_result (bool): �������½����������������֤����������ɺ��ִ�в����㲥��

        ���أ�
             bool��״̬��־��


decay_weight(gradients)

        ˥��Ȩ�ء�

        һ�ּ������ѧϰ������ģ�͹���ϵķ������̳� :class:`mindspore.nn.Optimizer`�Զ����Ż���ʱ���ɵ��øýӿڽ���Ȩ��˥����

        ������
            gradients (tuple[Tensor]): ����������ݶȣ���״��shape�������������ͬ��

        ���أ�
            tuple[Tensor]��˥��Ȩ�غ���ݶȡ�


get_lr()

        �Ż������øýӿڻ�ȡ��ǰ���裨step����ѧϰ�ʡ��̳� :class:`mindspore.nn.Optimizer`�Զ����Ż���ʱ�����ڲ�������ǰ���øýӿڻ�ȡѧϰ�ʡ�

        ���أ�
            float����ǰ�����ѧϰ�ʡ�


get_lr_parameter(param)

        ������ʹ������������鹦�ܣ���Ϊ��ͬ������ò�ͬ��ѧϰ��ʱ����ȡָ��������ѧϰ�ʡ�

        ������
            param (Union[Parameter, list[Parameter]]): `Parameter`��`Parameter`�б���

        ���أ�
            Parameter������`Parameter`��`Parameter`�б������ʹ���˶�̬ѧϰ�ʣ��������ڼ���ѧϰ�ʵ�`LearningRateSchedule`��`LearningRateSchedule`�б���

        ʾ����
            >>> from mindspore import nn
            >>> net = Net()
            >>> conv_params = list(filter(lambda x: 'conv' in x.name, net.trainable_params()))
            >>> no_conv_params = list(filter(lambda x: 'conv' not in x.name, net.trainable_params()))
            >>> group_params = [{'params': conv_params, 'lr': 0.05},
            ...                 {'params': no_conv_params, 'lr': 0.01}]
            >>> optim = nn.Momentum(group_params, learning_rate=0.1, momentum=0.9, weight_decay=0.0)
            >>> conv_lr = optim.get_lr_parameter(conv_params)
            >>> print(conv_lr[0].asnumpy())
            0.05


gradients_centralization(gradients)

        �ݶ����Ļ���

        һ���Ż������������������ѧϰ������ģ��ѵ���ٶȵķ������̳� :class:`mindspore.nn.Optimizer`�Զ����Ż���ʱ���ɵ��øýӿڽ����ݶ����Ļ���

        ������
            gradients (tuple[Tensor]): ����������ݶȣ���״��shape�������������ͬ��

        ���أ�
            tuple[Tensor]���ݶ����Ļ�����ݶȡ�


scale_grad(gradients)

        �����ڻ�Ͼ��ȳ�����ԭ�ݶȡ�

        �̳�:class:`mindspore.nn.Optimizer`�Զ����Ż���ʱ���ɵ��øýӿڻ�ԭ�ݶȡ�

        ������
            gradients (tuple[Tensor]): ����������ݶȣ���״��shape�������������ͬ��

        ���أ�
            tuple[Tensor]����ԭ����ݶȡ�


target

        ����������ָ����������host���ϻ����豸��device���ϸ��²�������������Ϊstr��ֻ����'CPU'��'Ascend'��'GPU'��


unique
        �����Ա�ʾ�Ƿ����Ż����н����ݶ�ȥ�أ�ͨ������ϡ�����硣����ݶ���ϡ���������ΪTrue�����ǰ��ϡ�������Ѷ�Ȩ��ȥ�أ����ݶ��ǳ��ܵģ�������ΪFalse��δ����ʱĬ��ֵΪTrue��