Fix pylint warnings in mindspore st test module

5 years ago · ba43dbc148
--- a/tests/st/auto_parallel/onehot_model_parallel.py
+++ b/tests/st/auto_parallel/onehot_model_parallel.py
@@ -11,6 +11,7 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================

 import os
 import pytest
@@ -26,6 +27,7 @@ device_num = 2
 device_id = int(os.getenv('DEVICE_ID'))
 rank_id = 0


 def setup_module():
    global device_num
    global rank_id
@@ -42,9 +44,11 @@ def setup_module():
    context.set_auto_parallel_context(device_num=device_num,
                                      global_rank=rank_id)


 def teardown_module():
    distributedTool.release()


 class Onehot(Cell):
    def __init__(self, axis=-1, depth=1, on_value=1.0, off_value=0.0, strategy=None):
        super(Onehot, self).__init__()
@@ -56,25 +60,26 @@ class Onehot(Cell):
        self.on_value = Tensor(on_value, ms.float32)
        self.off_value = Tensor(off_value, ms.float32)
        self.transpose = P.Transpose().set_strategy(strategy=trans_stra)
        self.sub = P.Sub().set_strategy(strategy=((1,1),(1,1)))
        self.sub = P.Sub().set_strategy(strategy=((1, 1), (1, 1)))

    def construct(self, input, indices):
        x = self.onehot(indices, self.depth, self.on_value, self.off_value)
        x = self.transpose(x, (1,0))
        x = self.transpose(x, (1, 0))
        x = self.sub(input, x)
        return x


 class DataGenerator():
    def get_parallel_blocks(self, input_, strategy):
        blocks = [input_]
        i = 0
        for stra in strategy:
            temp = []
            while len(blocks)>0:
            while len(blocks) > 0:
                block = blocks.pop(0)
                temp.extend(np.split(block, stra, axis=i))
            blocks.extend(temp)
            i+=1
            i += 1
        return blocks

    def generate_data(self, shape):
@@ -93,32 +98,33 @@ class DataGenerator():
        stra = [1]*len(shape)
        stra[0] = device_num
        datas = self.get_parallel_blocks(data, stra)
        return Tensor(data),Tensor(datas[rank_id])
        return Tensor(data), Tensor(datas[rank_id])


 class OneHotFactory:
    def __init__(self, batch_size, classes, on_value=1.0, off_value=0.0, axis=None, strategy=None):
        dataGen = DataGenerator()
        self.input_full, self.input_part = dataGen.input_data((classes, batch_size))
        self.label_full, self.label_part = dataGen.label_data((batch_size,),classes)
        self.label_full, self.label_part = dataGen.label_data((batch_size,), classes)
        self.depth = classes
        self.on_value = on_value
        self.off_value = off_value
        self.axis = axis
        self.strategy = strategy
    

    def forward_mindspore_single_impl(self):
        net = Onehot(axis=self.axis, 
                     depth=self.depth, 
                     on_value=self.on_value, 
        net = Onehot(axis=self.axis,
                     depth=self.depth,
                     on_value=self.on_value,
                     off_value=self.off_value)
        out = net(self.input_full, self.label_full)
        return out
        

    def forward_mindspore_parallel_impl(self):
        context.set_auto_parallel_context(parallel_mode="semi_auto_parallel")
        net = Onehot(axis=self.axis, 
                     depth=self.depth, 
                     on_value=self.on_value, 
        net = Onehot(axis=self.axis,
                     depth=self.depth,
                     on_value=self.on_value,
                     off_value=self.off_value, strategy=self.strategy)
        out = net.compile_and_run(self.input_full, self.label_full)
        return out
@@ -137,7 +143,7 @@ def test_reid_onehot_forward_int32_128_depth1024_model_parallel():
                         on_value=1.000000,
                         off_value=0.000000,
                         axis=-1,
                         strategy=((1,device_num),(),()))
                         strategy=((1, device_num), (), ()))
    fact.forward_cmp()


@@ -147,5 +153,5 @@ def test_reid_onehot_forward_int32_1024_depth128_model_parallel():
                         on_value=1.000000,
                         off_value=0.000000,
                         axis=-1,
                         strategy=((1,device_num),(),()))
                         strategy=((1, device_num), (), ()))
    fact.forward_cmp()
--- a/tests/st/auto_parallel/soft_entropy_loss_expand_parallel.py
+++ b/tests/st/auto_parallel/soft_entropy_loss_expand_parallel.py
@@ -11,6 +11,7 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================

 import os
 import pytest
@@ -31,7 +32,7 @@ from mindspore.nn.optim.momentum import Momentum
 from mindspore.train.callback import Callback

 np.set_printoptions(threshold=np.inf)
 device_num=2
 device_num = 2
 device_id = int(os.getenv('DEVICE_ID'))
 rank_id = 0
 embed = 128
@@ -39,6 +40,7 @@ classes = 32
 batch_size = 32*2
 MatmulParamShape = (classes, embed)


 def setup_module():
    global device_num
    global rank_id
@@ -55,26 +57,28 @@ def setup_module():
    context.set_auto_parallel_context(device_num=device_num,
                                      global_rank=device_id)


 def teardown_module():
    distributedTool.release()


 class DataGenerator():
    def get_parallel_blocks(self, input_, strategy):
        blocks = [input_]
        i = 0
        for stra in strategy:
            temp = []
            while len(blocks)>0:
            while len(blocks) > 0:
                block = blocks.pop(0)
                temp.extend(np.split(block, stra, axis=i))
            blocks.extend(temp)
            i+=1
            i += 1
        return blocks

    def generate_data(self, shape):
        size = np.cumprod(shape)[-1]
        num_range = min(size, 1000)
        data = (np.arange(0, size)%num_range)/num_range
        data = (np.arange(0, size) % num_range)/num_range
        data = np.reshape(data, shape)
        return data

@@ -83,14 +87,15 @@ class DataGenerator():
        stra = [1]*len(shape)
        stra[0] = device_num
        datas = self.get_parallel_blocks(data, stra)
        return Tensor(data), Tensor(datas[rank_id]) 
        return Tensor(data), Tensor(datas[rank_id])

    def label_data(self, shape, embed):
        data = (self.generate_data(shape)*(embed-1)).astype(np.int32)
        stra = [1]*len(shape)
        stra[0] = device_num
        datas = self.get_parallel_blocks(data, stra)
        return Tensor(data),Tensor(datas[rank_id])
        return Tensor(data), Tensor(datas[rank_id])


 class Dataset():
    def __init__(self, predict, label, length=1, input_num=2):
@@ -121,15 +126,18 @@ class Dataset():
    def get_repeat_count(self):
        return self.length


 class ModelCallback(Callback):
    def __init__(self):
        super(ModelCallback, self).__init__()
        self.loss_list = []

    def epoch_end(self, run_context, *args):
        cb_params = run_context.original_args()
        result = cb_params.net_outputs
        self.loss_list.append(result.asnumpy().mean())


 class SoftmaxCrossEntropyExpand(Cell):
    def __init__(self, sparse=False, stra_list=[]):
        super(SoftmaxCrossEntropyExpand, self).__init__()
@@ -164,22 +172,25 @@ class SoftmaxCrossEntropyExpand(Cell):
        loss = self.reduce_mean(loss, -1)
        return loss


 class MatmulNet(Cell):
    def __init__(self, matmul_stra = None, loss_stra_list=[]):
    def __init__(self, matmul_stra=None, loss_stra_list=[]):
        super(MatmulNet, self).__init__()
        self.matmul = P.MatMul(transpose_b=True).set_strategy(strategy=matmul_stra)
        self.loss = SoftmaxCrossEntropyExpand(sparse=True, stra_list=loss_stra_list)
        self.weight = Parameter(Tensor(np.ones(MatmulParamShape), dtype=ms.float32), name="weight") 
        self.weight = Parameter(Tensor(np.ones(MatmulParamShape), dtype=ms.float32), name="weight")

    def construct(self, x, label):
        loss_input = self.matmul(x, self.weight)
        out = self.loss(loss_input, label)
        return out


 class LossFactory():
    def __init__(self):
        dataGen = DataGenerator()
        self.input_full, self.input_part = dataGen.input_data((batch_size, embed))
        self.label_full, self.label_part = dataGen.label_data((batch_size,),embed)
        self.label_full, self.label_part = dataGen.label_data((batch_size,), embed)

    def single_matmul_trains(self):
        single_callback = ModelCallback()
@@ -196,32 +207,33 @@ class LossFactory():
        parallel_callback = ModelCallback()
        context.set_auto_parallel_context(parallel_mode="semi_auto_parallel")
        net = MatmulNet()
        optimizer = Momentum(net.trainable_params(), learning_rate=0.1, momentum=0.9) 
        optimizer = Momentum(net.trainable_params(), learning_rate=0.1, momentum=0.9)
        model = Model(net, optimizer=optimizer)
        epoch_size = 6
        dataset = Dataset(self.input_part, self.label_part)
        model.train(epoch_size, dataset, callbacks=parallel_callback, dataset_sink_mode=False)
        loss_value = np.array(parallel_callback.loss_list)
        return loss_value
    

    def model_parallel_matmul_trains(self):
        parallel_callback = ModelCallback()
        matmul_stra = ((1,1),(device_num,1))
        reduce_max_stra = ((1,device_num),)
        sub_stra = ((1,device_num),(1,1))
        exp_stra = ((1,device_num),)
        reduce_sum_stra = ((1,device_num),)
        div_stra = ((1,device_num),(1,1))
        log_stra = ((1,device_num),)
        mul_stra = ((1,device_num),(1,device_num))
        sum_cross_entropy_stra = ((1,device_num),)
        mul2_stra = ((),(device_num,))
        matmul_stra = ((1, 1), (device_num, 1))
        reduce_max_stra = ((1, device_num),)
        sub_stra = ((1, device_num), (1, 1))
        exp_stra = ((1, device_num),)
        reduce_sum_stra = ((1, device_num),)
        div_stra = ((1, device_num), (1, 1))
        log_stra = ((1, device_num),)
        mul_stra = ((1, device_num), (1, device_num))
        sum_cross_entropy_stra = ((1, device_num),)
        mul2_stra = ((), (device_num,))
        reduce_mean_stra = ((device_num,),)
        onehot_stra = ((1,device_num),(),())
        loss_stra_list = [exp_stra, reduce_sum_stra, onehot_stra, div_stra, log_stra, sum_cross_entropy_stra, mul_stra, mul2_stra, reduce_mean_stra, reduce_max_stra, sub_stra]
        onehot_stra = ((1, device_num), (), ())
        loss_stra_list = [exp_stra, reduce_sum_stra, onehot_stra, div_stra, log_stra,
                          sum_cross_entropy_stra, mul_stra, mul2_stra, reduce_mean_stra, reduce_max_stra, sub_stra]
        context.set_auto_parallel_context(parallel_mode="auto_parallel")
        net = MatmulNet(matmul_stra = matmul_stra, loss_stra_list = loss_stra_list)
        optimizer = Momentum(net.trainable_params(), learning_rate=0.1, momentum=0.9) 
        net = MatmulNet(matmul_stra=matmul_stra, loss_stra_list=loss_stra_list)
        optimizer = Momentum(net.trainable_params(), learning_rate=0.1, momentum=0.9)
        model = Model(net, optimizer=optimizer)
        epoch_size = 6
        dataset = Dataset(self.input_part, self.label_part)
@@ -231,21 +243,22 @@ class LossFactory():

    def mix_parallel_matmul_trains(self):
        parallel_callback = ModelCallback()
        matmul_stra = ((device_num,1),(1,1))
        reduce_max_stra = ((1,device_num),)
        sub_stra = ((device_num,1),(device_num,1))
        exp_stra = ((1,device_num),)
        reduce_sum_stra = ((1,device_num),)
        div_stra = ((1,device_num),(1,1))
        log_stra = ((1,device_num),)
        mul_stra = ((1,device_num),(1,device_num))
        sum_cross_entropy_stra = ((1,device_num),)
        mul2_stra = ((),(device_num,))
        matmul_stra = ((device_num, 1), (1, 1))
        reduce_max_stra = ((1, device_num),)
        sub_stra = ((device_num, 1), (device_num, 1))
        exp_stra = ((1, device_num),)
        reduce_sum_stra = ((1, device_num),)
        div_stra = ((1, device_num), (1, 1))
        log_stra = ((1, device_num),)
        mul_stra = ((1, device_num), (1, device_num))
        sum_cross_entropy_stra = ((1, device_num),)
        mul2_stra = ((), (device_num,))
        reduce_mean_stra = ((device_num,),)
        onehot_stra = ((1,device_num),(),())
        loss_stra_list = [exp_stra, reduce_sum_stra, onehot_stra, div_stra, log_stra, sum_cross_entropy_stra, mul_stra, mul2_stra, reduce_mean_stra, reduce_max_stra, sub_stra]
        onehot_stra = ((1, device_num), (), ())
        loss_stra_list = [exp_stra, reduce_sum_stra, onehot_stra, div_stra, log_stra,
                          sum_cross_entropy_stra, mul_stra, mul2_stra, reduce_mean_stra, reduce_max_stra, sub_stra]
        context.set_auto_parallel_context(parallel_mode="auto_parallel")
        net = MatmulNet(matmul_stra = matmul_stra, loss_stra_list = loss_stra_list)
        net = MatmulNet(matmul_stra=matmul_stra, loss_stra_list=loss_stra_list)
        optimizer = Momentum(net.trainable_params(), learning_rate=0.1, momentum=0.9)
        model = Model(net, optimizer=optimizer)
        epoch_size = 6
@@ -254,6 +267,7 @@ class LossFactory():
        loss_value = np.array(parallel_callback.loss_list)
        return loss_value


 def test_all_trains():
    loss_factory = LossFactory()
    context.reset_auto_parallel_context()
--- a/tests/st/auto_parallel/test_expand_loss.py
+++ b/tests/st/auto_parallel/test_expand_loss.py
@@ -12,10 +12,10 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================

 import os
 import pytest


@pytest.mark.level0
@pytest.mark.platform_x86_ascend_training
@pytest.mark.platform_arm_ascend_training
@@ -23,4 +23,4 @@ import pytest
 def test_expand_loss():
    sh_path = os.path.split(os.path.realpath(__file__))[0]
    ret = os.system(f"sh {sh_path}/run_auto_parallel_loss_expand.sh")
    assert(ret==0)
    assert(ret == 0)
--- a/tests/st/auto_parallel/test_model_parallel_onehot.py
+++ b/tests/st/auto_parallel/test_model_parallel_onehot.py
@@ -16,6 +16,7 @@
 import os
 import pytest


 def test_expand_loss():
    ret = os.system("sh run_onehot_model_parallel.sh")
    assert(ret==0)
    assert(ret == 0)
--- a/tests/st/auto_parallel/test_resnet50_expand_loss_2p.py
+++ b/tests/st/auto_parallel/test_resnet50_expand_loss_2p.py
@@ -11,10 +11,12 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================

 import os
 import numpy as np
 import pytest
 from numpy import allclose
 import mindspore.context as context
 import mindspore.nn as nn
 import mindspore.common.dtype as mstype
 from mindspore import Tensor
@@ -22,21 +24,21 @@ from mindspore.ops import operations as P
 from mindspore.nn.optim.momentum import Momentum
 from mindspore.common.initializer import One
 from mindspore.train.model import Model, ParallelMode
 from mindspore import context
 import os
 from mindspore.communication.management import init
 import mindspore.ops.functional as F
 from mindspore.nn.loss.loss import _Loss
 from mindspore.train.callback import Callback
 from mindspore.parallel import set_algo_parameters

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")
 context.set_context(enable_hccl=True)
 context.set_context(enable_task_sink=True,device_id=int(os.getenv('DEVICE_ID')))
 context.set_context(enable_task_sink=True, device_id=int(os.getenv('DEVICE_ID')))
 context.set_context(enable_ir_fusion=True)
 context.set_context(enable_loop_sink=False)
 init()
 context.set_auto_parallel_context(mirror_mean=True, parallel_mode=ParallelMode.AUTO_PARALLEL)


 def weight_variable(shape, factor=0.1):
    return One()

@@ -52,6 +54,7 @@ def _conv1x1(in_channels, out_channels, stride=1, padding=0, pad_mode='same'):
    return nn.Conv2d(in_channels, out_channels,
                     kernel_size=1, stride=stride, padding=padding, pad_mode=pad_mode, weight_init=init_value)


 def _conv7x7(in_channels, out_channels, stride=1, padding=0, pad_mode='same'):
    init_value = weight_variable((out_channels, in_channels, 7, 7))
    return nn.Conv2d(in_channels, out_channels,
@@ -63,6 +66,7 @@ def _fused_bn(channels, momentum=0.9):
    init_bias = weight_variable((channels,))
    return nn.BatchNorm2d(channels, momentum=momentum)


 class BasicBlock(nn.Cell):
    expansion = 1

@@ -172,7 +176,7 @@ class ResNet(nn.Cell):
                 layer_nums,
                 in_channels,
                 out_channels,
                 strides=[1,2,2,2],
                 strides=[1, 2, 2, 2],
                 num_classes=100):
        super(ResNet, self).__init__()

@@ -292,17 +296,19 @@ class SoftmaxCrossEntropyExpand(_Loss):

 rank_id = int(os.environ["RANK_ID"])
 device_num = int(os.environ["RANK_SIZE"])


 class DataGenerator():
    def get_parallel_blocks(self, input_, strategy):
        blocks = [input_]
        i = 0
        for stra in strategy:
            temp = []
            while len(blocks)>0:
            while len(blocks) > 0:
                block = blocks.pop(0)
                temp.extend(np.split(block, stra, axis=i))
            blocks.extend(temp)
            i+=1
            i += 1
        return blocks

    def generate_data(self, shape):
@@ -321,7 +327,7 @@ class DataGenerator():
        stra = [1]*len(shape)
        stra[0] = device_num
        datas = self.get_parallel_blocks(data, stra)
        return Tensor(data),Tensor(datas[rank_id])
        return Tensor(data), Tensor(datas[rank_id])


 class Dataset():
@@ -359,6 +365,7 @@ class ModelCallback(Callback):
    def __init__(self):
        super(ModelCallback, self).__init__()
        self.loss_list = []

    def epoch_end(self, run_context, *args):
        cb_params = run_context.original_args()
        result = cb_params.net_outputs
@@ -382,7 +389,7 @@ def test_train_feed(num_classes=8192):
    model.train(5, dataset, dataset_sink_mode=False, callbacks=parallel_callback)
    loss_value = np.array(parallel_callback.loss_list)
    expect_out = [9.010913, 8.855984, 8.56246, 8.146317, 7.624489]
    assert allclose(loss_value, expect_out, 0.0001, 0.0001)
    assert np.allclose(loss_value, expect_out, 0.0001, 0.0001)


@pytest.mark.level0
@@ -402,4 +409,4 @@ def test_train_feed2(num_classes=1001):
    model.train(5, dataset, dataset_sink_mode=False, callbacks=parallel_callback)
    loss_value = np.array(parallel_callback.loss_list)
    expect_out = [6.908755, 6.8358116, 6.6986914, 6.506859, 6.2708097]
    assert allclose(loss_value, expect_out, 0.0001, 0.0001)
    assert np.allclose(loss_value, expect_out, 0.0001, 0.0001)
--- a/tests/st/control/test_while.py
+++ b/tests/st/control/test_while.py
@@ -13,12 +13,12 @@
 # limitations under the License.
 # ============================================================================
 import numpy as np
 from mindspore.common.tensor import Tensor
 from mindspore.common import dtype as mstype
 import mindspore.context as context
 from mindspore.ops import operations as P
 import mindspore.nn as nn
 from mindspore.common import ms_function
 from mindspore import Tensor, ms_function
 from mindspore.common import dtype as mstype
 from mindspore.ops import operations as P


@ms_function
 def t1_while(x, y, z):
@@ -28,8 +28,9 @@ def t1_while(x, y, z):
    x = x + 3
    return x


 def test_net():
    context.set_context(mode=context.GRAPH_MODE,device_target="Ascend")
    context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")
    context.set_context(enable_task_sink=True)
    c1 = Tensor([2], mstype.int32)
    c2 = Tensor([14], mstype.int32)
@@ -38,5 +39,6 @@ def test_net():
    ret = t1_while(c1, c2, c3)
    assert (ret == expect)


 if __name__ == "__main__":
    test_net()
    test_net()
--- a/tests/st/fusion/test_add_relu_buffer_fusion.py
+++ b/tests/st/fusion/test_add_relu_buffer_fusion.py
@@ -12,17 +12,16 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 from mindspore import Tensor
 from mindspore.ops import operations as P
 import mindspore.nn as nn
 from mindspore.common.api import ms_function
 import mindspore.common.dtype as mstype
 import numpy as np
 import mindspore.context as context
 from mindspore.common.initializer import initializer
 from mindspore.common.parameter import Parameter
 import mindspore.nn as nn
 import mindspore.common.dtype as mstype
 from mindspore import Tensor, ms_function
 from mindspore.ops import operations as P

 context.set_context(mode=context.GRAPH_MODE, device_id=5, device_target="Ascend")
 #context.set_context(enable_task_sink=True)


 class Net(nn.Cell):
    def __init__(self):
        super(Net, self).__init__()
@@ -35,17 +34,14 @@ class Net(nn.Cell):
    def construct(self, x, y):
        x = self.cast(x, mstype.float16)
        y = self.cast(y, mstype.float16)
        #x = self.softmax(x)
        x = self.add(x, y)
        #x = self.relu(x)
        x = self.relu(x)
        #x = self.softmax(x)
        x = self.reduce_mean(x)
        return x


 def test_net():
    x = np.random.randn(32, 10).astype(np.float32)
    relu = Net()
    output = relu(Tensor(x), Tensor(x))
    print(x)
    print(output.asnumpy())
--- a/tests/st/fusion/test_conv_bn1_fusion.py
+++ b/tests/st/fusion/test_conv_bn1_fusion.py
@@ -13,15 +13,13 @@
 # limitations under the License.
 # ============================================================================
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore import Tensor, Parameter, Model, ms_function
 from mindspore.ops import operations as P
 from mindspore.common.initializer import initializer
 from mindspore import Tensor, Parameter, Model
 from mindspore.nn.loss import SoftmaxCrossEntropyWithLogits
 from mindspore.nn.optim import Momentum
 from mindspore.common.api import ms_function
 import mindspore.nn as wrap
 import mindspore.context as context

 context.set_context(device_target="Ascend", enable_task_sink=True)

@@ -35,6 +33,7 @@ class MsWrapper(nn.Cell):
    def __init__(self, network):
        super(MsWrapper, self).__init__(auto_prefix=False)
        self._network = network

    @ms_function
    def construct(self, *args):
        return self._network(*args)
@@ -42,16 +41,16 @@ class MsWrapper(nn.Cell):

 def me_train_tensor(net, input_np, label_np, epoch_size=2):
    loss = SoftmaxCrossEntropyWithLogits(is_grad=False, sparse=True)
    opt = nn.Momentum(Tensor(np.array([0.1])), Tensor(np.array([0.9])), filter(lambda x: x.requires_grad, net.get_parameters()))
    opt = nn.Momentum(Tensor(np.array([0.1])), Tensor(np.array([0.9])),
                      filter(lambda x: x.requires_grad, net.get_parameters()))
    context.set_context(mode=context.GRAPH_MODE)
    Model(net, loss, opt)
    _network = wrap.WithLossCell(net, loss)
    _train_net = MsWrapper(wrap.TrainOneStepCell(_network, opt))
    _network = nn.WithLossCell(net, loss)
    _train_net = MsWrapper(nn.TrainOneStepCell(_network, opt))
    _train_net.set_train()
    for epoch in range(0, epoch_size):
        print(f"epoch %d"%(epoch))
        print(f"epoch %d" % (epoch))
        output = _train_net(Tensor(input_np), Tensor(label_np))
        print("********output***********")
        print(output.asnumpy())


@@ -60,9 +59,9 @@ def test_conv_bn_add_relu_fusion():
        def __init__(self):
            super(Net, self).__init__()
            self.conv = nn.Conv2d(input_channel, output_channel,
                  kernel_size=1, stride=1, padding=0, has_bias=False, pad_mode="same")
                                  kernel_size=1, stride=1, padding=0, has_bias=False, pad_mode="same")
            self.conv1 = nn.Conv2d(input_channel, output_channel,
                  kernel_size=1, stride=1, padding=0, has_bias=False, pad_mode="same")
                                   kernel_size=1, stride=1, padding=0, has_bias=False, pad_mode="same")
            self.bn = nn.BatchNorm2d(output_channel, momentum=0.1, eps=0.0001)
            self.add = P.TensorAdd()
            self.relu = P.ReLU()
@@ -91,7 +90,7 @@ def test_conv_bn_relu_fusion():
        def __init__(self):
            super(Net, self).__init__()
            self.conv = nn.Conv2d(input_channel, output_channel,
                  kernel_size=1, stride=1, padding=0, has_bias=False, pad_mode="same")
                                  kernel_size=1, stride=1, padding=0, has_bias=False, pad_mode="same")
            self.bn = nn.BatchNorm2d(output_channel, momentum=0.1, eps=0.0001)
            self.relu = P.ReLU()
            self.mean = P.ReduceMean(keep_dims=True)
@@ -118,7 +117,7 @@ def test_conv_bn_fusion():
        def __init__(self):
            super(Net, self).__init__()
            self.conv = nn.Conv2d(input_channel, output_channel,
                  kernel_size=1, stride=1, padding=0, has_bias=False, pad_mode="same")
                                  kernel_size=1, stride=1, padding=0, has_bias=False, pad_mode="same")
            self.bn = nn.BatchNorm2d(output_channel, momentum=0.1, eps=0.0001)
            self.mean = P.ReduceMean(keep_dims=True)
            self.reshape = P.Reshape()
--- a/tests/st/fusion/test_tbe_eltwise_fusion_1.py
+++ b/tests/st/fusion/test_tbe_eltwise_fusion_1.py
@@ -13,16 +13,15 @@
 # limitations under the License.
 # ============================================================================
 import pytest
 from mindspore import Tensor
 from mindspore.ops import operations as P
 import mindspore.nn as nn
 from mindspore.common.api import ms_function
 import mindspore.common.dtype as mstype
 import numpy as np
 import mindspore.context as context
 from mindspore.common.initializer import initializer
 from mindspore.common.parameter import Parameter
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")


 class Net(nn.Cell):
    def __init__(self):
        super(Net, self).__init__()
@@ -35,6 +34,7 @@ class Net(nn.Cell):
        x = self.relu(x)
        return x


@pytest.mark.level0
@pytest.mark.platform_arm_ascend_training
@pytest.mark.platform_x86_ascend_training
@@ -43,5 +43,4 @@ def test_net():
    x = np.random.randn(32, 10).astype(np.float32)
    relu_relu = Net()
    output = relu_relu(Tensor(x))
    print(x)
    print(output.asnumpy())
--- a/tests/st/fusion/test_tbe_eltwise_fusion_2.py
+++ b/tests/st/fusion/test_tbe_eltwise_fusion_2.py
@@ -13,16 +13,15 @@
 # limitations under the License.
 # ============================================================================
 import pytest
 from mindspore import Tensor
 from mindspore.ops import operations as P
 import mindspore.nn as nn
 from mindspore.common.api import ms_function
 import mindspore.common.dtype as mstype
 import numpy as np
 import mindspore.context as context
 from mindspore.common.initializer import initializer
 from mindspore.common.parameter import Parameter
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")


 class Net(nn.Cell):
    def __init__(self):
        super(Net, self).__init__()
@@ -41,6 +40,7 @@ class Net(nn.Cell):
        x = self.relu(x)
        return x


@pytest.mark.level0
@pytest.mark.platform_arm_ascend_training
@pytest.mark.platform_x86_ascend_training
@@ -50,5 +50,4 @@ def test_net():
    y = np.random.randn(10).astype(np.float32)
    net = Net()
    output = net(Tensor(x), Tensor(y))
    print(x)
    print(output.asnumpy())
    print(output.asnumpy())
--- a/tests/st/fusion/test_tbe_multi_inout_eltwise_fusion.py
+++ b/tests/st/fusion/test_tbe_multi_inout_eltwise_fusion.py
@@ -12,15 +12,14 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 from mindspore import Tensor
 from mindspore.ops import operations as P
 import mindspore.nn as nn
 import mindspore.common.dtype as mstype
 import numpy as np
 import mindspore.context as context
 from mindspore.common.parameter import Parameter
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P

 context.set_context(mode=context.GRAPH_MODE, device_id=4, device_target="Ascend")
 #context.set_context(enable_task_sink=True)


 class Net(nn.Cell):
    def __init__(self):
@@ -39,6 +38,7 @@ class Net(nn.Cell):
        z = self.add(z1, z2)
        return z


 def test_net():
    x = np.random.randn(32, 10).astype(np.float32)
    y = np.random.randn(32, 10).astype(np.float32)
@@ -46,6 +46,4 @@ def test_net():
    h = np.random.randn(10).astype(np.float32)
    relu_relu = Net()
    output = relu_relu(Tensor(x), Tensor(y), Tensor(k), Tensor(h))
    print(x)
    print(output.asnumpy())

--- a/tests/st/fusion/test_tbe_reduce_eltwise_fusion.py
+++ b/tests/st/fusion/test_tbe_reduce_eltwise_fusion.py
@@ -13,17 +13,16 @@
 # limitations under the License.
 # ============================================================================
 import pytest
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P
 from mindspore.ops.operations import _grad_ops as G
 import mindspore.nn as nn
 from mindspore.common.api import ms_function
 import mindspore.common.dtype as mstype
 import numpy as np
 import mindspore.context as context
 from mindspore.common.initializer import initializer
 from mindspore.common.parameter import Parameter

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")


 class Net(nn.Cell):
    def __init__(self):
        super(Net, self).__init__()
@@ -41,6 +40,7 @@ class Net(nn.Cell):
        x = self.relu(x)
        return x


@pytest.mark.level0
@pytest.mark.platform_arm_ascend_training
@pytest.mark.platform_x86_ascend_training
@@ -49,5 +49,4 @@ def test_net():
    x = np.random.randn(32, 10).astype(np.float32)
    net = Net()
    output = net(Tensor(x))
    print(x)
    print(output.asnumpy())
    print(output.asnumpy())
--- a/tests/st/mem_reuse/check_file.py
+++ b/tests/st/mem_reuse/check_file.py
@@ -14,6 +14,7 @@
 # ============================================================================
 import os
 import filecmp

 curr_path = os.path.abspath(os.curdir)
 file_memreuse = curr_path + "/mem_reuse_check/memreuse.ir"
 file_normal = curr_path + "/mem_reuse_check/normal_mem.ir"
@@ -23,5 +24,3 @@ checker = os.path.exists(file_normal)
 assert (checker, True)
 checker = filecmp.cmp(file_memreuse, file_normal)
 assert (checker, True)


--- a/tests/st/mem_reuse/resnet.py
+++ b/tests/st/mem_reuse/resnet.py
@@ -19,6 +19,7 @@ from mindspore.ops import operations as P
 from mindspore.common.initializer import initializer
 from mindspore.common import dtype as mstype


 def weight_variable(shape):
    return initializer('XavierUniform', shape=shape, dtype=mstype.float32)

@@ -297,4 +298,3 @@ class ResNet(nn.Cell):

 def resnet50(batch_size, num_classes):
    return ResNet(ResidualBlock, [3, 4, 6, 3], num_classes, batch_size)

--- a/tests/st/mem_reuse/resnet_cifar_memreuse.py
+++ b/tests/st/mem_reuse/resnet_cifar_memreuse.py
@@ -12,16 +12,17 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 import argparse
 import os
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 import mindspore.common.dtype as mstype
 from mindspore import Tensor
 from mindspore.ops import operations as P
 from mindspore.ops import functional as F
 from mindspore.nn.optim.momentum import Momentum
 from mindspore.train.model import Model, ParallelMode
 from mindspore import context
 import mindspore.common.dtype as mstype
 import os
 import numpy as np
 import mindspore.ops.functional as F
 from mindspore.train.callback import ModelCheckpoint, CheckpointConfig, LossMonitor
 from mindspore.train.serialization import load_checkpoint, load_param_into_net
 import mindspore.dataset as de
@@ -30,11 +31,11 @@ import mindspore.dataset.transforms.vision.c_transforms as vision
 from mindspore.communication.management import init
 from resnet import resnet50
 import random

 random.seed(1)
 np.random.seed(1)
 de.config.set_seed(1)

 import argparse
 parser = argparse.ArgumentParser(description='Image classification')
 parser.add_argument('--run_distribute', type=bool, default=False, help='Run distribute')
 parser.add_argument('--device_num', type=int, default=1, help='Device num.')
@@ -47,9 +48,9 @@ parser.add_argument('--checkpoint_path', type=str, default=None, help='Checkpoin
 parser.add_argument('--dataset_path', type=str, default="/var/log/npu/datasets/cifar", help='Dataset path')
 args_opt = parser.parse_args()

 device_id=int(os.getenv('DEVICE_ID'))
 device_id = int(os.getenv('DEVICE_ID'))

 data_home=args_opt.dataset_path
 data_home = args_opt.dataset_path

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")
 context.set_context(enable_task_sink=True, device_id=device_id)
@@ -64,8 +65,8 @@ def create_dataset(repeat_num=1, training=True):
    ds = de.Cifar10Dataset(data_dir)

    if args_opt.run_distribute:
        rank_id=int(os.getenv('RANK_ID'))
        rank_size=int(os.getenv('RANK_SIZE'))
        rank_id = int(os.getenv('RANK_ID'))
        rank_size = int(os.getenv('RANK_SIZE'))
        ds = de.Cifar10Dataset(data_dir, num_shards=rank_size, shard_id=rank_id)

    resize_height = 224
@@ -74,9 +75,9 @@ def create_dataset(repeat_num=1, training=True):
    shift = 0.0

    # define map operations
    random_crop_op = vision.RandomCrop((32, 32), (4, 4, 4, 4)) # padding_mode default CONSTANT
    random_crop_op = vision.RandomCrop((32, 32), (4, 4, 4, 4))  # padding_mode default CONSTANT
    random_horizontal_op = vision.RandomHorizontalFlip()
    resize_op = vision.Resize((resize_height, resize_width)) # interpolation default BILINEAR
    resize_op = vision.Resize((resize_height, resize_width))  # interpolation default BILINEAR
    rescale_op = vision.Rescale(rescale, shift)
    normalize_op = vision.Normalize((0.4465, 0.4822, 0.4914), (0.2010, 0.1994, 0.2023))
    changeswap_op = vision.HWC2CHW()
--- a/tests/st/mem_reuse/resnet_cifar_normal.py
+++ b/tests/st/mem_reuse/resnet_cifar_normal.py
@@ -12,16 +12,17 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 import argparse
 import os
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 import mindspore.common.dtype as mstype
 from mindspore import Tensor
 from mindspore.ops import operations as P
 from mindspore.ops import functional as F
 from mindspore.nn.optim.momentum import Momentum
 from mindspore.train.model import Model, ParallelMode
 from mindspore import context
 import mindspore.common.dtype as mstype
 import os
 import numpy as np
 import mindspore.ops.functional as F
 from mindspore.train.callback import ModelCheckpoint, CheckpointConfig, LossMonitor
 from mindspore.train.serialization import load_checkpoint, load_param_into_net
 import mindspore.dataset as de
@@ -35,7 +36,6 @@ random.seed(1)
 np.random.seed(1)
 de.config.set_seed(1)

 import argparse

 parser = argparse.ArgumentParser(description='Image classification')
 parser.add_argument('--run_distribute', type=bool, default=False, help='Run distribute')
--- a/tests/st/nccl/test_nccl_all.py
+++ b/tests/st/nccl/test_nccl_all.py
@@ -15,6 +15,7 @@
 import os
 import pytest


@pytest.mark.level0
@pytest.mark.platform_x86_gpu_training
@pytest.mark.env_single
@@ -22,6 +23,7 @@ def test_nccl_lenet():
    return_code = os.system("mpirun -n 8 pytest -s test_nccl_lenet.py")
    assert(return_code == 0)


@pytest.mark.level0
@pytest.mark.platform_x86_gpu_training
@pytest.mark.env_single
@@ -29,6 +31,7 @@ def test_nccl_all_reduce_op():
    return_code = os.system("mpirun -n 8 pytest -s test_nccl_all_reduce_op.py")
    assert(return_code == 0)


@pytest.mark.level0
@pytest.mark.platform_x86_gpu_training
@pytest.mark.env_single
@@ -36,6 +39,7 @@ def test_nccl_all_gather_op():
    return_code = os.system("mpirun -n 8 pytest -s test_nccl_all_gather_op.py")
    assert(return_code == 0)


@pytest.mark.level0
@pytest.mark.platform_x86_gpu_training
@pytest.mark.env_single
--- a/tests/st/nccl/test_nccl_all_gather_op.py
+++ b/tests/st/nccl/test_nccl_all_gather_op.py
@@ -12,23 +12,25 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 from mindspore import Tensor
 from mindspore.ops import operations as P
 import mindspore.nn as nn
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P
 from mindspore.common.initializer import initializer
 from mindspore.common.parameter import Parameter
 from mindspore.communication.management import init, NCCL_WORLD_COMM_GROUP, get_rank, get_group_size

 context.set_context(mode=context.GRAPH_MODE, device_target='GPU')

 init('nccl')
 rank = get_rank()
 size = get_group_size()
 x = np.ones([1,1,3,3]).astype(np.float32) * 0.01 * (rank + 1)
 x = np.ones([1, 1, 3, 3]).astype(np.float32) * 0.01 * (rank + 1)


 class Net(nn.Cell):
    def __init__( self):
    def __init__(self):
        super(Net, self).__init__()
        self.all_gather = P.AllGather(group=NCCL_WORLD_COMM_GROUP)
        self.x = Parameter(initializer(Tensor(x), x.shape), name='x')
@@ -36,6 +38,7 @@ class Net(nn.Cell):
    def construct(self):
        return self.all_gather(self.x)


 def test_AllGather():
    all_gather = Net()
    output = all_gather()
--- a/tests/st/nccl/test_nccl_all_reduce_op.py
+++ b/tests/st/nccl/test_nccl_all_reduce_op.py
@@ -12,23 +12,25 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 from mindspore import Tensor
 from mindspore.ops import operations as P
 import mindspore.nn as nn
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P
 from mindspore.common.initializer import initializer
 from mindspore.common.parameter import Parameter
 from mindspore.communication.management import init, NCCL_WORLD_COMM_GROUP, get_rank, get_group_size

 context.set_context(mode=context.GRAPH_MODE, device_target='GPU')

 init('nccl')
 rank = get_rank()
 size = get_group_size()
 x = np.ones([3,1,3,3]).astype(np.float32) * 0.01 * (rank + 1)
 x = np.ones([3, 1, 3, 3]).astype(np.float32) * 0.01 * (rank + 1)


 class Net(nn.Cell):
    def __init__( self):
    def __init__(self):
        super(Net, self).__init__()
        self.x1 = Parameter(initializer(Tensor(x), x.shape), name='x1')
        self.x2 = Parameter(initializer(Tensor(x), x.shape), name='x2')
@@ -47,6 +49,7 @@ class Net(nn.Cell):
                self.all_reduce2(self.x2),
                self.all_reduce3(self.x3))


 def test_AllReduce():
    all_reduce = Net()
    output = all_reduce()
@@ -58,16 +61,16 @@ def test_AllReduce():
    diff0 = output[0].asnumpy() - expect0
    error0 = np.ones(shape=expect0.shape) * 1.0e-5
    assert np.all(diff0 < error0)
    assert (output[0].shape() == expect0.shape)
    assert output[0].shape() == expect0.shape

    expect1 = expect0
    diff1 = output[1].asnumpy() - expect1
    error1 = np.ones(shape=expect1.shape) * 1.0e-5
    assert np.all(diff1 < error1)
    assert (output[1].shape() == expect1.shape)
    assert output[1].shape() == expect1.shape

    expect2 = expect1
    diff2 = output[2].asnumpy() - expect2
    error2 = np.ones(shape=expect2.shape) * 1.0e-5
    assert np.all(diff2 < error2)
    assert (output[2].shape() == expect2.shape)
    assert output[2].shape() == expect2.shape
--- a/tests/st/nccl/test_nccl_lenet.py
+++ b/tests/st/nccl/test_nccl_lenet.py
@@ -12,16 +12,15 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 import numpy as np
 from mindspore.nn import Dense
 import mindspore.nn as nn
 import datetime
 import numpy as np
 import mindspore.context as context
 from mindspore.communication.management import init, NCCL_WORLD_COMM_GROUP, get_rank, get_group_size
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.nn.optim import Momentum
 from mindspore.nn import TrainOneStepCell, WithLossCell
 from mindspore.ops import operations as P
 from mindspore.common.tensor import Tensor
 from mindspore.communication.management import init, get_rank, get_group_size

 context.set_context(mode=context.GRAPH_MODE, device_target="GPU")
 init('nccl')
@@ -31,6 +30,7 @@ total = 5000
 batch_size = 32
 mini_batch = total // batch_size


 class LeNet(nn.Cell):
    def __init__(self):
        super(LeNet, self).__init__()
@@ -43,15 +43,15 @@ class LeNet(nn.Cell):
        self.conv2 = nn.Conv2d(6, 16, (5, 5), weight_init=weight2, pad_mode='valid', stride=1, padding=0)
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2, pad_mode="valid")
        self.reshape = P.Reshape()
        

        weight1 = Tensor(np.ones([120, 400]).astype(np.float32) * 0.01)
        self.fc1 = Dense(400, 120, weight_init=weight1)
        
        self.fc1 = nn.Dense(400, 120, weight_init=weight1)

        weight2 = Tensor(np.ones([84, 120]).astype(np.float32) * 0.01)
        self.fc2 = Dense(120, 84, weight_init=weight2)
        
        self.fc2 = nn.Dense(120, 84, weight_init=weight2)

        weight3 = Tensor(np.ones([10, 84]).astype(np.float32) * 0.01)
        self.fc3 = Dense(84, 10, weight_init=weight3)
        self.fc3 = nn.Dense(84, 10, weight_init=weight3)

    def construct(self, input_x):
        output = self.conv1(input_x)
@@ -66,6 +66,7 @@ class LeNet(nn.Cell):
        output = self.fc3(output)
        return output


 def test_lenet_nccl():
    net = LeNet()
    net.set_train()
--- a/tests/st/nccl/test_nccl_reduce_scatter_op.py
+++ b/tests/st/nccl/test_nccl_reduce_scatter_op.py
@@ -12,11 +12,11 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 from mindspore import Tensor
 from mindspore.ops import operations as P
 import mindspore.nn as nn
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P
 from mindspore.common.initializer import initializer
 from mindspore.common.parameter import Parameter
 from mindspore.communication.management import init, NCCL_WORLD_COMM_GROUP, get_rank, get_group_size
@@ -27,8 +27,9 @@ rank = get_rank()
 size = get_group_size()
 x = np.ones([size, 1, 3, 3]).astype(np.float32) * 0.01 * (rank + 1)


 class Net(nn.Cell):
    def __init__( self):
    def __init__(self):
        super(Net, self).__init__()
        self.x = Parameter(initializer(Tensor(x), x.shape), name='x')

@@ -46,6 +47,7 @@ class Net(nn.Cell):
                self.reduce_scatter2(self.x),
                self.reduce_scatter3(self.x))


 def test_ReduceScatter():
    reduce_scatter = Net()
    output = reduce_scatter()
@@ -53,7 +55,7 @@ def test_ReduceScatter():
    sum = np.ones([size, 1, 3, 3]).astype(np.float32) * 0
    for i in range(size):
        sum += np.ones([size, 1, 3, 3]).astype(np.float32) * 0.01 * (i + 1)
    expect0 = sum[rank : rank + 1]
    expect0 = sum[rank: rank + 1]
    diff0 = output[0].asnumpy() - expect0
    error0 = np.ones(shape=expect0.shape) * 1.0e-5
    assert np.all(diff0 < error0)
--- a/tests/st/networks/models/alexnet.py
+++ b/tests/st/networks/models/alexnet.py
@@ -16,6 +16,7 @@ import mindspore.nn as nn
 from mindspore.ops import operations as P
 from mindspore.nn import Dense


 class AlexNet(nn.Cell):
    def __init__(self, num_classes=10):
        super(AlexNet, self).__init__()
--- a/tests/st/networks/models/bert/bert_tdt_no_lossscale.py
+++ b/tests/st/networks/models/bert/bert_tdt_no_lossscale.py
@@ -18,21 +18,22 @@
 import os
 import pytest
 import numpy as np
 from numpy import allclose
 import mindspore.context as context
 import mindspore.common.dtype as mstype
 import mindspore.dataset.engine.datasets as de
 import mindspore.dataset.transforms.c_transforms as C
 from mindspore import context
 from mindspore.common.tensor import Tensor
 from mindspore import Tensor
 from mindspore.train.model import Model
 from mindspore.train.callback import Callback
 from mindspore.model_zoo.Bert_NEZHA import BertConfig, BertNetworkWithLoss, BertTrainOneStepCell
 from mindspore.nn.optim import Momentum
 from mindspore import log as logger

 _current_dir = os.path.dirname(os.path.realpath(__file__))
 DATA_DIR = ["/home/workspace/mindspore_dataset/bert/example/examples.tfrecord"]
 SCHEMA_DIR = "/home/workspace/mindspore_dataset/bert/example/datasetSchema.json"


 def get_config(version='base', batch_size=1):
    """get config"""
    if version == 'base':
@@ -99,13 +100,14 @@ def get_config(version='base', batch_size=1):
        bert_config = BertConfig(batch_size=batch_size)
    return bert_config


 def me_de_train_dataset():
    """test me de train dataset"""
    # apply repeat operations
    repeat_count = 1
    ds = de.TFRecordDataset(DATA_DIR, SCHEMA_DIR, columns_list=["input_ids", "input_mask", "segment_ids",
                                                               "next_sentence_labels", "masked_lm_positions",
                                                               "masked_lm_ids", "masked_lm_weights"], shuffle=False)
                                                                "next_sentence_labels", "masked_lm_positions",
                                                                "masked_lm_ids", "masked_lm_weights"], shuffle=False)
    type_cast_op = C.TypeCast(mstype.int32)
    ds = ds.map(input_columns="masked_lm_ids", operations=type_cast_op)
    ds = ds.map(input_columns="masked_lm_positions", operations=type_cast_op)
@@ -137,6 +139,7 @@ class ModelCallback(Callback):
        self.loss_list.append(cb_params.net_outputs.asnumpy()[0])
        logger.info("epoch: {}, outputs are {}".format(cb_params.cur_epoch_num, str(cb_params.net_outputs)))


@pytest.mark.level0
@pytest.mark.platform_arm_ascend_training
@pytest.mark.platform_x86_ascend_training
@@ -180,7 +183,8 @@ def test_bert_tdt():
    expect_out = [12.19179, 11.965041, 11.969687, 11.97815, 11.969171, 12.603289, 12.165594,
                  12.824818, 12.38842, 12.604046]
    logger.info("expected loss value output: {}".format(expect_out))
    assert allclose(loss_value, expect_out, 0.00001, 0.00001)
    assert np.allclose(loss_value, expect_out, 0.00001, 0.00001)


 if __name__ == '__main__':
    test_bert_tdt()
--- a/tests/st/networks/models/lenet.py
+++ b/tests/st/networks/models/lenet.py
@@ -14,9 +14,10 @@
 # ============================================================================
 import numpy as np
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P
 from mindspore.nn import Dense
 from mindspore import Tensor


 class LeNet(nn.Cell):
    def __init__(self):
--- a/tests/st/networks/models/resnetv1_5.py
+++ b/tests/st/networks/models/resnetv1_5.py
@@ -13,9 +13,10 @@
 # limitations under the License.
 # ============================================================================
 import numpy as np
 from mindspore.common.tensor import Tensor
 import mindspore.nn as nn
 import mindspore.ops.operations as P
 from mindspore import Tensor
 from mindspore.ops import operations as P


 def weight_variable(shape):
    ones = np.ones(shape).astype(np.float32)
@@ -37,7 +38,7 @@ def conv3x3(in_channels, out_channels, stride=1, padding=0):
    weight_shape = (out_channels, in_channels, 3, 3)
    weight = weight_variable(weight_shape)
    return nn.Conv2d(in_channels, out_channels,
                  kernel_size=3, stride=stride, padding=padding, weight_init=weight, has_bias=False, pad_mode="same")
                     kernel_size=3, stride=stride, padding=padding, weight_init=weight, has_bias=False, pad_mode="same")


 def conv1x1(in_channels, out_channels, stride=1, padding=0):
@@ -45,7 +46,7 @@ def conv1x1(in_channels, out_channels, stride=1, padding=0):
    weight_shape = (out_channels, in_channels, 1, 1)
    weight = weight_variable(weight_shape)
    return nn.Conv2d(in_channels, out_channels,
                  kernel_size=1, stride=stride, padding=padding, weight_init=weight, has_bias=False, pad_mode="same")
                     kernel_size=1, stride=stride, padding=padding, weight_init=weight, has_bias=False, pad_mode="same")


 def conv7x7(in_channels, out_channels, stride=1, padding=0):
@@ -53,7 +54,7 @@ def conv7x7(in_channels, out_channels, stride=1, padding=0):
    weight_shape = (out_channels, in_channels, 7, 7)
    weight = weight_variable(weight_shape)
    return nn.Conv2d(in_channels, out_channels,
                  kernel_size=7, stride=stride, padding=padding, weight_init=weight, has_bias=False, pad_mode="same")
                     kernel_size=7, stride=stride, padding=padding, weight_init=weight, has_bias=False, pad_mode="same")


 def bn_with_initialize(out_channels):
@@ -63,7 +64,7 @@ def bn_with_initialize(out_channels):
    beta = weight_variable_0(shape)
    gamma = weight_variable_1(shape)
    bn = nn.BatchNorm2d(out_channels, momentum=0.1, eps=0.0001, gamma_init=gamma,
                     beta_init=beta, moving_mean_init=mean, moving_var_init=var)
                        beta_init=beta, moving_mean_init=mean, moving_var_init=var)
    return bn


@@ -74,7 +75,7 @@ def bn_with_initialize_last(out_channels):
    beta = weight_variable_0(shape)
    gamma = weight_variable_0(shape)
    bn = nn.BatchNorm2d(out_channels, momentum=0.1, eps=0.0001, gamma_init=gamma,
                     beta_init=beta, moving_mean_init=mean, moving_var_init=var)
                        beta_init=beta, moving_mean_init=mean, moving_var_init=var)
    return bn


@@ -294,6 +295,6 @@ class ResNet(nn.Cell):
        x = self.fc(x)
        return x


 def resnet50(batch_size, num_classes):
    return ResNet(ResidualBlock, [3, 4, 6, 3], num_classes, batch_size)

--- a/tests/st/networks/test_cpu_lenet.py
+++ b/tests/st/networks/test_cpu_lenet.py
@@ -13,13 +13,15 @@
 # limitations under the License.
 # ============================================================================
 import pytest
 from mindspore.nn import TrainOneStepCell, WithLossCell
 import mindspore.context as context
 from mindspore.nn.optim import Momentum
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore.ops import operations as P
 from mindspore import Tensor
 from mindspore.nn import TrainOneStepCell, WithLossCell
 from mindspore.nn.optim import Momentum
 from mindspore.ops import operations as P

 context.set_context(mode=context.GRAPH_MODE, device_target="CPU")


 class LeNet(nn.Cell):
@@ -52,9 +54,6 @@ class LeNet(nn.Cell):
        return output


 context.set_context(mode=context.GRAPH_MODE, device_target="CPU")


 def train(net, data, label):
    learning_rate = 0.01
    momentum = 0.9
--- a/tests/st/networks/test_gpu_alexnet.py
+++ b/tests/st/networks/test_gpu_alexnet.py
@@ -19,15 +19,17 @@ from __future__ import print_function

 import pytest
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.nn.optim import Momentum
 from mindspore.ops import operations as P
 from mindspore.nn import TrainOneStepCell, WithLossCell
 from mindspore import Tensor
 from mindspore.common.initializer import initializer
 import mindspore.context as context

 context.set_context(mode=context.GRAPH_MODE, device_target="GPU")


 class AlexNet(nn.Cell):
    def __init__(self, num_classes=10):
        super(AlexNet, self).__init__()
@@ -66,6 +68,7 @@ class AlexNet(nn.Cell):
        x = self.fc3(x)
        return x


@pytest.mark.level0
@pytest.mark.platform_x86_gpu_training
@pytest.mark.env_onecard
@@ -73,14 +76,14 @@ def test_trainTensor(num_classes=10, epoch=15, batch_size=32):
    net = AlexNet(num_classes)
    lr = 0.1
    momentum = 0.9
    optimizer = Momentum(filter(lambda x: x.requires_grad, net.get_parameters()), lr, momentum, weight_decay = 0.0001)
    optimizer = Momentum(filter(lambda x: x.requires_grad, net.get_parameters()), lr, momentum, weight_decay=0.0001)
    criterion = nn.SoftmaxCrossEntropyWithLogits(is_grad=False, sparse=True)
    net_with_criterion = WithLossCell(net, criterion)
    train_network = TrainOneStepCell(net_with_criterion, optimizer)
    train_network.set_train()
    losses=[]
    losses = []
    for i in range(0, epoch):
        data = Tensor(np.ones([batch_size, 3 ,227, 227]).astype(np.float32) * 0.01)
        data = Tensor(np.ones([batch_size, 3, 227, 227]).astype(np.float32) * 0.01)
        label = Tensor(np.ones([batch_size]).astype(np.int32))
        loss = train_network(data, label)
        losses.append(loss)
--- a/tests/st/networks/test_gpu_lenet.py
+++ b/tests/st/networks/test_gpu_lenet.py
@@ -16,16 +16,19 @@
 import pytest
 import numpy as np
 import mindspore.nn as nn
 import mindspore.context as context
 from mindspore import Tensor
 from mindspore.nn.optim import Momentum
 from mindspore.ops import operations as P
 from mindspore.nn import TrainOneStepCell, WithLossCell
 from mindspore.nn import Dense
 from mindspore import Tensor
 from mindspore.common.initializer import initializer
 from mindspore.common import dtype as mstype
 import mindspore.context as context


 context.set_context(mode=context.GRAPH_MODE, device_target="GPU")


 class LeNet(nn.Cell):
    def __init__(self):
        super(LeNet, self).__init__()
@@ -65,6 +68,7 @@ def multisteplr(total_steps, gap, base_lr=0.9, gamma=0.1, dtype=mstype.float32):
        lr.append(lr_)
    return Tensor(np.array(lr), dtype)


@pytest.mark.level0
@pytest.mark.platform_x86_gpu_training
@pytest.mark.env_onecard
@@ -81,7 +85,7 @@ def test_train_lenet():
    train_network.set_train()
    losses = []
    for i in range(epoch):
        data = Tensor(np.ones([net.batch_size, 3 ,32, 32]).astype(np.float32) * 0.01)
        data = Tensor(np.ones([net.batch_size, 3, 32, 32]).astype(np.float32) * 0.01)
        label = Tensor(np.ones([net.batch_size]).astype(np.int32))
        loss = train_network(data, label)
        losses.append(loss)
--- a/tests/st/networks/test_gpu_lstm.py
+++ b/tests/st/networks/test_gpu_lstm.py
@@ -15,18 +15,20 @@

 import pytest
 import numpy as np
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.nn.optim import Momentum
 from mindspore.ops import operations as P
 from mindspore.nn import TrainOneStepCell, WithLossCell
 from mindspore.nn import Dense
 from mindspore import Tensor
 from mindspore.common.initializer import initializer
 from mindspore.common.parameter import Parameter
 import mindspore.context as context
 import mindspore.nn as nn


 context.set_context(mode=context.GRAPH_MODE, device_target="GPU")


 def InitialLstmWeight(input_size, hidden_size, num_layers, bidirectional, has_bias=False):
    num_directions = 1
    if bidirectional:
@@ -56,6 +58,7 @@ def InitialLstmWeight(input_size, hidden_size, num_layers, bidirectional, has_bi

    return h, c, w


 class SentimentNet(nn.Cell):
    def __init__(self, vocab_size, embed_size, num_hiddens, num_layers,
                 bidirectional, weight, labels, batch_size):
@@ -99,6 +102,7 @@ class SentimentNet(nn.Cell):
        outputs = self.decoder(encoding)
        return outputs


 batch_size = 64
@pytest.mark.level0
@pytest.mark.platform_x86_gpu_training
@@ -130,7 +134,7 @@ def test_LSTM():
    train_network.set_train()

    train_features = Tensor(np.ones([64, max_len]).astype(np.int32))
    train_labels = Tensor(np.ones([64,]).astype(np.int32)[0:64])
    train_labels = Tensor(np.ones([64, ]).astype(np.int32)[0:64])
    losses = []
    for epoch in range(num_epochs):
        loss = train_network(train_features, train_labels)
--- a/tests/st/networks/test_gpu_resnet.py
+++ b/tests/st/networks/test_gpu_resnet.py
@@ -19,36 +19,34 @@ from __future__ import print_function

 import pytest
 import numpy as np

 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.nn.cell import Cell
 from mindspore.nn.layer.conv import Conv2d
 from mindspore.nn.layer.basic import Flatten
 from mindspore.nn.layer.normalization import BatchNorm2d
 from mindspore.nn.layer.pooling import MaxPool2d
 from mindspore.ops.operations import TensorAdd
 import mindspore.nn as nn

 from mindspore.nn.optim import Momentum
 from mindspore.ops import operations as P
 from mindspore.nn import TrainOneStepCell, WithLossCell
 from mindspore.nn import Dense
 from mindspore import Tensor
 from mindspore.common.initializer import initializer

 import mindspore.context as context

 context.set_context(mode=context.GRAPH_MODE, device_target="GPU")


 def random_normal_init(shape, mean=0.0, stddev=0.01, seed=None):
    init_value = np.ones(shape).astype(np.float32) * 0.01
    return Tensor(init_value)


 def variance_scaling_raw(shape):
    variance_scaling_value = np.ones(shape).astype(np.float32) * 0.01
    return Tensor(variance_scaling_value)



 def weight_variable_0(shape):
    zeros = np.zeros(shape).astype(np.float32)
    return Tensor(zeros)
@@ -323,6 +321,7 @@ class ResNet(Cell):
 def resnet50(num_classes):
    return ResNet(ResidualBlock, [3, 4, 6, 3], num_classes)


@pytest.mark.level0
@pytest.mark.platform_x86_gpu_training
@pytest.mark.env_onecard
@@ -335,9 +334,9 @@ def test_trainTensor(num_classes=10, epoch=8, batch_size=1):
    net_with_criterion = WithLossCell(net, criterion)
    train_network = TrainOneStepCell(net_with_criterion, optimizer)  # optimizer
    train_network.set_train()
    losses=[]
    losses = []
    for i in range(0, epoch):
        data = Tensor(np.ones([batch_size, 3 ,224, 224]).astype(np.float32) * 0.01)
        data = Tensor(np.ones([batch_size, 3, 224, 224]).astype(np.float32) * 0.01)
        label = Tensor(np.ones([batch_size]).astype(np.int32))
        loss = train_network(data, label)
        losses.append(loss)
--- a/tests/st/networks/test_network_main.py
+++ b/tests/st/networks/test_network_main.py
@@ -13,25 +13,27 @@
 # limitations under the License.
 # ============================================================================
 """
 Function: 
 Function:
    test network
 Usage: 
 Usage:
    python test_network_main.py --net lenet --target Ascend
 """
 import os
 import time
 import numpy as np
 import argparse
 import mindspore.context as context
 import mindspore.nn as nn
 from mindspore.common.tensor import Tensor
 from mindspore import Tensor
 from mindspore.nn import TrainOneStepCell, WithLossCell
 import mindspore.context as context
 from mindspore.nn.optim import Momentum
 from models.lenet import LeNet
 from models.resnetv1_5 import resnet50
 from models.alexnet import AlexNet

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")


 def train(net, data, label):
    learning_rate = 0.01
    momentum = 0.9
@@ -42,29 +44,31 @@ def train(net, data, label):
    train_network = TrainOneStepCell(net_with_criterion, optimizer)  # optimizer
    train_network.set_train()
    res = train_network(data, label)
    print("+++++++++Loss+++++++++++++")
    print(res)
    print("+++++++++++++++++++++++++++")
    assert res


 def test_resnet50():
    data = Tensor(np.ones([32, 3 ,224, 224]).astype(np.float32) * 0.01)
    data = Tensor(np.ones([32, 3, 224, 224]).astype(np.float32) * 0.01)
    label = Tensor(np.ones([32]).astype(np.int32))
    net = resnet50(32, 10)
    train(net, data, label)


 def test_lenet():
    data = Tensor(np.ones([32, 1 ,32, 32]).astype(np.float32) * 0.01)
    data = Tensor(np.ones([32, 1, 32, 32]).astype(np.float32) * 0.01)
    label = Tensor(np.ones([32]).astype(np.int32))
    net = LeNet()
    train(net, data, label)


 def test_alexnet():
    data = Tensor(np.ones([32, 3 ,227, 227]).astype(np.float32) * 0.01)
    data = Tensor(np.ones([32, 3, 227, 227]).astype(np.float32) * 0.01)
    label = Tensor(np.ones([32]).astype(np.int32))
    net = AlexNet()
    train(net, data, label)


 parser = argparse.ArgumentParser(description='MindSpore Testing Network')
 parser.add_argument('--net', default='resnet50', type=str, help='net name')
 parser.add_argument('--device', default='Ascend', type=str, help='device target')
--- a/tests/st/pynative/test_ascend_lenet.py
+++ b/tests/st/pynative/test_ascend_lenet.py
@@ -14,7 +14,8 @@
 # ============================================================================
 import pytest
 import numpy as np
 import time, math
 import time
 import math
 import mindspore.nn as nn
 from mindspore import context, Tensor, ParameterTuple
 from mindspore.ops import operations as P
@@ -28,6 +29,7 @@ from mindspore.nn.optim import Momentum

 np.random.seed(1)


 def weight_variable():
    """weight initial"""
    return TruncatedNormal(0.02)
@@ -58,6 +60,7 @@ class LeNet(nn.Cell):
    Examples:
        >>> LeNet(num_class=10)
    """

    def __init__(self, num_class=10):
        super(LeNet, self).__init__()
        self.num_class = num_class
@@ -91,6 +94,7 @@ class CrossEntropyLoss(nn.Cell):
    """
    Define loss for network
    """

    def __init__(self):
        super(CrossEntropyLoss, self).__init__()
        self.cross_entropy = P.SoftmaxCrossEntropyWithLogits()
@@ -111,6 +115,7 @@ class GradWrap(nn.Cell):
    """
    GradWrap definition
    """

    def __init__(self, network):
        super(GradWrap, self).__init__()
        self.network = network
@@ -154,4 +159,3 @@ def test_ascend_pynative_lenet():

        print("======epoch: ", epoch, " loss: ", loss_output.asnumpy(), " cost time: ", cost_time)
    assert(loss_output.asnumpy() < 0.1)
    
--- a/tests/st/summary/test_davinci_summary.py
+++ b/tests/st/summary/test_davinci_summary.py
@@ -33,10 +33,12 @@ SUMMARY_DIR = CUR_DIR + "/test_temp_summary_event_file/"

 context.set_context(device_target="Ascend")


 class MsWrapper(nn.Cell):
    def __init__(self, network):
        super(MsWrapper, self).__init__(auto_prefix=False)
        self._network = network

    @ms_function
    def construct(self, *args):
        return self._network(*args)
@@ -45,14 +47,15 @@ class MsWrapper(nn.Cell):
 def me_train_tensor(net, input_np, label_np, epoch_size=2):
    context.set_context(mode=context.GRAPH_MODE)
    loss = SoftmaxCrossEntropyWithLogits(is_grad=False, sparse=True)
    opt = ApplyMomentum(Tensor(np.array([0.1])), Tensor(np.array([0.9])), filter(lambda x: x.requires_grad, net.get_parameters()))
    opt = ApplyMomentum(Tensor(np.array([0.1])), Tensor(np.array([0.9])),
                        filter(lambda x: x.requires_grad, net.get_parameters()))
    Model(net, loss, opt)
    _network = wrap.WithLossCell(net, loss)
    _train_net = MsWrapper(wrap.TrainOneStepCell(_network, opt))
    _train_net.set_train()
    summary_writer = SummaryRecord(SUMMARY_DIR, file_suffix="_MS_GRAPH", network=_train_net)
    for epoch in range(0, epoch_size):
        print(f"epoch %d"%(epoch))
        print(f"epoch %d" % (epoch))
        output = _train_net(Tensor(input_np), Tensor(label_np))
        summary_writer.record(i)
        print("********output***********")
--- a/tests/st/summary/test_gpu_summary.py
+++ b/tests/st/summary/test_gpu_summary.py
@@ -108,6 +108,6 @@ def me_scalar_summary(steps, tag=None, value=None):
 def test_scalarsummary_scalar1_step10_summaryrecord1():
    clean_environment_file(SUMMARY_DIR_ME_TEMP)
    output_dict = me_scalar_summary(10)
    print("test_scalarsummary_scalar1_step10_summaryrecord1 \n",output_dict)
    print("test_scalarsummary_scalar1_step10_summaryrecord1 \n", output_dict)
    save_summary_events_file(SUMMARY_DIR_ME_TEMP, SUMMARY_DIR_ME)
    clean_environment_file(SUMMARY_DIR_ME)
--- a/tests/st/tbe_networks/export_geir.py
+++ b/tests/st/tbe_networks/export_geir.py
@@ -24,12 +24,13 @@ import mindspore.nn as nn
 from mindspore import context

 from mindspore.train.serialization import save, load, save_checkpoint, load_checkpoint,\
                                          load_param_into_net, _exec_save_checkpoint,\
                                          _check_filedir_or_create, _chg_model_file_name_if_same_exist, \
                                          _read_file_last_line, context, export
    load_param_into_net, _exec_save_checkpoint,\
    _check_filedir_or_create, _chg_model_file_name_if_same_exist, \
    _read_file_last_line, context, export

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend",
                    enable_task_sink=True, enable_loop_sink=True, enable_ir_fusion=True)

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend", 
 enable_task_sink=True,enable_loop_sink=True,enable_ir_fusion=True)

 def test_resnet50_export(batch_size=1, num_classes=5):
    context.set_context(enable_ir_fusion=False)
--- a/tests/st/tbe_networks/resnet.py
+++ b/tests/st/tbe_networks/resnet.py
@@ -19,6 +19,7 @@ from mindspore.ops import operations as P
 from mindspore.common.initializer import initializer
 from mindspore.common import dtype as mstype


 def weight_variable(shape):
    return initializer('XavierUniform', shape=shape, dtype=mstype.float32)

@@ -297,4 +298,3 @@ class ResNet(nn.Cell):

 def resnet50(batch_size, num_classes):
    return ResNet(ResidualBlock, [3, 4, 6, 3], num_classes, batch_size)

--- a/tests/st/tbe_networks/resnet_cifar.py
+++ b/tests/st/tbe_networks/resnet_cifar.py
@@ -12,6 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # ============================================================================
 import argparse
 import mindspore.nn as nn
 from mindspore import Tensor
 from mindspore.ops import operations as P
@@ -35,7 +36,6 @@ random.seed(1)
 np.random.seed(1)
 ds.config.set_seed(1)

 import argparse
 parser = argparse.ArgumentParser(description='Image classification')
 parser.add_argument('--run_distribute', type=bool, default=False, help='Run distribute')
 parser.add_argument('--device_num', type=int, default=1, help='Device num.')
@@ -48,15 +48,16 @@ parser.add_argument('--checkpoint_path', type=str, default=None, help='Checkpoin
 parser.add_argument('--dataset_path', type=str, default="/var/log/npu/datasets/cifar", help='Dataset path')
 args_opt = parser.parse_args()

 device_id=int(os.getenv('DEVICE_ID'))
 device_id = int(os.getenv('DEVICE_ID'))

 data_home=args_opt.dataset_path
 data_home = args_opt.dataset_path

 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")
 context.set_context(enable_task_sink=True, device_id=device_id)
 context.set_context(enable_loop_sink=True)
 context.set_context(enable_mem_reuse=True)


 def create_dataset(repeat_num=1, training=True):
    data_dir = data_home + "/cifar-10-batches-bin"
    if not training:
@@ -64,8 +65,8 @@ def create_dataset(repeat_num=1, training=True):
    data_set = ds.Cifar10Dataset(data_dir)

    if args_opt.run_distribute:
        rank_id=int(os.getenv('RANK_ID'))
        rank_size=int(os.getenv('RANK_SIZE'))
        rank_id = int(os.getenv('RANK_ID'))
        rank_size = int(os.getenv('RANK_SIZE'))
        data_set = ds.Cifar10Dataset(data_dir, num_shards=rank_size, shard_id=rank_id)

    resize_height = 224
@@ -74,9 +75,9 @@ def create_dataset(repeat_num=1, training=True):
    shift = 0.0

    # define map operations
    random_crop_op = vision.RandomCrop((32, 32), (4, 4, 4, 4)) # padding_mode default CONSTANT
    random_crop_op = vision.RandomCrop((32, 32), (4, 4, 4, 4))  # padding_mode default CONSTANT
    random_horizontal_op = vision.RandomHorizontalFlip()
    resize_op = vision.Resize((resize_height, resize_width)) # interpolation default BILINEAR
    resize_op = vision.Resize((resize_height, resize_width))  # interpolation default BILINEAR
    rescale_op = vision.Rescale(rescale, shift)
    normalize_op = vision.Normalize((0.4465, 0.4822, 0.4914), (0.2010, 0.1994, 0.2023))
    changeswap_op = vision.HWC2CHW()
@@ -103,6 +104,7 @@ def create_dataset(repeat_num=1, training=True):

    return data_set


 class CrossEntropyLoss(nn.Cell):
    def __init__(self):
        super(CrossEntropyLoss, self).__init__()
--- a/tests/st/tbe_networks/test_resnet_cifar_8p.py
+++ b/tests/st/tbe_networks/test_resnet_cifar_8p.py
@@ -112,6 +112,7 @@ class CrossEntropyLoss(nn.Cell):
        loss = self.mean(loss, (-1,))
        return loss


 class LossGet(Callback):
    def __init__(self, per_print_times=1):
        super(LossGet, self).__init__()
@@ -143,6 +144,7 @@ class LossGet(Callback):
    def get_loss(self):
        return self._loss


 def train_process(q, device_id, epoch_size, num_classes, device_num, batch_size, enable_hccl):
    os.system("mkdir " + str(device_id))
    os.chdir(str(device_id))