From 03406c598d099eae90bd45554fc07d8f26f95e96 Mon Sep 17 00:00:00 2001
From: bxdd <bxddream@gmail.com>
Date: Wed, 25 Oct 2023 13:55:33 +0800
Subject: [PATCH] [MNT] del old reuse file

---
 learnware/learnware/reuse.py | 725 -----------------------------------
 1 file changed, 725 deletions(-)
 delete mode 100644 learnware/learnware/reuse.py

diff --git a/learnware/learnware/reuse.py b/learnware/learnware/reuse.py
deleted file mode 100644
index 565ba89..0000000
--- a/learnware/learnware/reuse.py
+++ /dev/null
@@ -1,725 +0,0 @@
-import torch
-import random
-import numpy as np
-import geatpy as ea
-
-from typing import List
-from cvxopt import matrix, solvers
-from lightgbm import LGBMClassifier, early_stopping
-from scipy.special import softmax
-from sklearn.metrics import accuracy_score
-
-from learnware.learnware import Learnware
-import learnware.specification as specification
-from .base import BaseReuser
-from ..specification import RKMEStatSpecification
-from ..logger import get_module_logger
-
-logger = get_module_logger("Reuser")
-
-
-class JobSelectorReuser(BaseReuser):
-    """Baseline Multiple Learnware Reuser using Job Selector Method"""
-
-    def __init__(self, learnware_list: List[Learnware] = None, herding_num: int = 1000, use_herding: bool = True):
-        """The initialization method for job selector reuser
-
-        Parameters
-        ----------
-        learnware_list : List[Learnware]
-            The learnware list, which should have RKME Specification for each learnweare
-        herding_num : int, optional
-            The herding number, by default 1000
-        """
-        super(JobSelectorReuser, self).__init__(learnware_list)
-        self.herding_num = herding_num
-        self.use_herding = use_herding
-
-    def predict(self, user_data: np.ndarray) -> np.ndarray:
-        """Give prediction for user data using baseline job-selector method
-
-        Parameters
-        ----------
-        user_data : np.ndarray
-            User's labeled raw data.
-
-        Returns
-        -------
-        np.ndarray
-            Prediction given by job-selector method
-        """
-        select_result = self.job_selector(user_data)
-        pred_y_list = []
-        data_idxs_list = []
-
-        for idx in range(len(self.learnware_list)):
-            data_idx_list = np.where(select_result == idx)[0]
-            if len(data_idx_list) > 0:
-                pred_y = self.learnware_list[idx].predict(user_data[data_idx_list])
-                if isinstance(pred_y, torch.Tensor):
-                    pred_y = pred_y.detach().cpu().numpy()
-                # elif isinstance(pred_y, tf.Tensor):
-                #     pred_y = pred_y.numpy()
-
-                if not isinstance(pred_y, np.ndarray):
-                    raise TypeError(f"Model output must be np.ndarray or torch.Tensor")
-
-                pred_y_list.append(pred_y)
-                data_idxs_list.append(data_idx_list)
-
-        if pred_y_list[0].ndim == 1:
-            selector_pred_y = np.zeros(user_data.shape[0])
-        else:
-            selector_pred_y = np.zeros((user_data.shape[0], pred_y_list[0].shape[1]))
-        for pred_y, data_idx_list in zip(pred_y_list, data_idxs_list):
-            selector_pred_y[data_idx_list] = pred_y
-
-        return selector_pred_y
-
-    def job_selector(self, user_data: np.ndarray):
-        """Train job selector based on user's data, which predicts which learnware in the pool should be selected
-
-        Parameters
-        ----------
-        user_data : np.ndarray
-            User's labeled raw data.
-        """
-        if len(self.learnware_list) == 1:
-            user_data_num = user_data.shape[0]
-            return np.array([0] * user_data_num)
-        else:
-            learnware_rkme_spec_list = [
-                learnware.specification.get_stat_spec_by_name("RKMEStatSpecification")
-                for learnware in self.learnware_list
-            ]
-
-            if self.use_herding:
-                task_matrix = np.zeros((len(learnware_rkme_spec_list), len(learnware_rkme_spec_list)))
-                for i in range(len(self.learnware_list)):
-                    task_rkme1 = learnware_rkme_spec_list[i]
-                    task_matrix[i][i] = task_rkme1.inner_prod(task_rkme1)
-                    for j in range(i + 1, len(self.learnware_list)):
-                        task_rkme2 = learnware_rkme_spec_list[j]
-                        task_matrix[i][j] = task_matrix[j][i] = task_rkme1.inner_prod(task_rkme2)
-
-                task_mixture_weight = self._calculate_rkme_spec_mixture_weight(
-                    user_data, learnware_rkme_spec_list, task_matrix
-                )
-
-            herding_X, train_herding_X, val_herding_X = None, None, None
-            herding_y, train_herding_y, val_herding_y = [], [], []
-            for i in range(len(self.learnware_list)):
-                task_spec = learnware_rkme_spec_list[i]
-                if self.use_herding:
-                    task_herding_num = max(5, int(self.herding_num * task_mixture_weight[i]))
-                    herding_X_i = task_spec.herding(task_herding_num).detach().cpu().numpy()
-                else:
-                    herding_X_i = task_spec.z.detach().cpu().numpy()
-                    task_herding_num = herding_X_i.shape[0]
-                task_val_num = task_herding_num // 5
-
-                train_X_i = herding_X_i[:-task_val_num]
-                val_X_i = herding_X_i[-task_val_num:]
-
-                herding_X = herding_X_i if herding_X is None else np.concatenate((herding_X, herding_X_i), axis=0)
-                train_herding_X = (
-                    train_X_i if train_herding_X is None else np.concatenate((train_herding_X, train_X_i), axis=0)
-                )
-                val_herding_X = val_X_i if val_herding_X is None else np.concatenate((val_herding_X, val_X_i), axis=0)
-
-                herding_y += [i] * task_herding_num
-                train_herding_y += [i] * (task_herding_num - task_val_num)
-                val_herding_y += [i] * task_val_num
-
-            herding_y = np.array(herding_y)
-            train_herding_y = np.array(train_herding_y)
-            val_herding_y = np.array(val_herding_y)
-
-            # use herding samples to train a job selector
-            herding_X = herding_X.reshape(herding_X.shape[0], -1)
-            train_herding_X = train_herding_X.reshape(train_herding_X.shape[0], -1)
-            val_herding_X = val_herding_X.reshape(val_herding_X.shape[0], -1)
-            herding_y = herding_y.astype(int)
-            train_herding_y = train_herding_y.astype(int)
-            val_herding_y = val_herding_y.astype(int)
-
-            job_selector = self._selector_grid_search(
-                herding_X,
-                herding_y,
-                train_herding_X,
-                train_herding_y,
-                val_herding_X,
-                val_herding_y,
-                len(self.learnware_list),
-            )
-            job_select_result = np.array(job_selector.predict(user_data.reshape(user_data.shape[0], -1)))
-
-            return job_select_result
-
-    def _calculate_rkme_spec_mixture_weight(
-        self, user_data: np.ndarray, task_rkme_list: List[RKMEStatSpecification], task_rkme_matrix: np.ndarray
-    ) -> List[float]:
-        """_summary_
-
-        Parameters
-        ----------
-        user_data : np.ndarray
-            Raw user data.
-        task_rkme_list : List[RKMEStatSpecification]
-            The list of learwares' rkmes whose mixture approximates the user's rkme
-        task_rkme_matrix : np.ndarray
-            Inner product matrix calculated from task_rkme_list.
-        """
-        task_num = len(task_rkme_list)
-        user_rkme_spec = specification.utils.generate_rkme_spec(X=user_data, reduce=False)
-        K = task_rkme_matrix
-        v = np.array([user_rkme_spec.inner_prod(task_rkme) for task_rkme in task_rkme_list])
-
-        P = matrix(K)
-        q = matrix(-v)
-        G = matrix(-np.eye(task_num))
-        h = matrix(np.zeros((task_num, 1)))
-        A = matrix(np.ones((1, task_num)))
-        b = matrix(np.ones((1, 1)))
-        solvers.options["show_progress"] = False
-
-        sol = solvers.qp(P, q, G, h, A, b, kktsolver="ldl")
-        task_mixture_weight = np.array(sol["x"]).reshape(-1)
-
-        return task_mixture_weight
-
-    def _selector_grid_search(
-        self,
-        org_train_x: np.ndarray,
-        org_train_y: np.ndarray,
-        train_x: np.ndarray,
-        train_y: np.ndarray,
-        val_x: np.ndarray,
-        val_y: np.ndarray,
-        num_class: int,
-    ) -> LGBMClassifier:
-        """Train a LGBMClassifier as job selector using the herding data as training instances.
-
-        Parameters
-        ----------
-        org_train_x : np.ndarray
-            The original herding features.
-        org_train_y : np.ndarray
-            The original hearding labels(which are learnware indexes).
-        train_x : np.ndarray
-            Herding features used for training.
-        train_y : np.ndarray
-            Herding labels used for training.
-        val_x : np.ndarray
-            Herding features used for validation.
-        val_y : np.ndarray
-            Herding labels used for validation.
-        num_class : int
-            Total number of classes for the job selector(which is exactly the total number of learnwares to be reused).
-
-        Returns
-        -------
-        LGBMClassifier
-            The job selector model.
-        """
-        score_best = -1
-        learning_rate = [0.01]
-        max_depth = [66]
-        params = (0, 0)
-
-        lgb_params = {
-            "boosting_type": "gbdt",
-            "n_estimators": 2000,
-            "boost_from_average": False,
-        }
-
-        if num_class == 2:
-            lgb_params["objective"] = "binary"
-            lgb_params["metric"] = "binary_logloss"
-        else:
-            lgb_params["objective"] = "multiclass"
-            lgb_params["metric"] = "multi_logloss"
-
-        for lr in learning_rate:
-            for md in max_depth:
-                lgb_params["learning_rate"] = lr
-                lgb_params["max_depth"] = md
-                model = LGBMClassifier(**lgb_params)
-                train_y = train_y.astype(int)
-                model.fit(train_x, train_y, eval_set=[(val_x, val_y)], callbacks=[early_stopping(300, verbose=False)])
-                pred_y = model.predict(org_train_x)
-                score = accuracy_score(pred_y, org_train_y)
-
-                if score > score_best:
-                    score_best = score
-                    params = (lr, md)
-
-        lgb_params["learning_rate"] = params[0]
-        lgb_params["max_depth"] = params[1]
-        model = LGBMClassifier(**lgb_params)
-        model.fit(org_train_x, org_train_y)
-
-        return model
-
-
-class AveragingReuser(BaseReuser):
-    """Baseline Multiple Learnware Reuser using Ensemble Method"""
-
-    def __init__(self, learnware_list: List[Learnware] = None, mode: str = "mean"):
-        """The initialization method for averaging ensemble reuser
-
-        Parameters
-        ----------
-        learnware_list : List[Learnware]
-            The learnware list
-        mode : str
-            - "mean": average the output of all learnwares for regression task (learnware output is a real number)
-            - "vote_by_label": vote by labels for classification task, learnware output belongs to the set {0, 1, ..., class_num}
-            - "vote_by_prob": vote by probabilities for classification task, learnware output is a logits vector, denoting the probability of each class
-        """
-        super(AveragingReuser, self).__init__(learnware_list)
-        if mode not in ["mean", "vote_by_label", "vote_by_prob"]:
-            raise ValueError(f"Mode must be one of ['mean', 'vote_by_label', 'vote_by_prob'], but got {mode}")
-        self.mode = mode
-
-    def predict(self, user_data: np.ndarray) -> np.ndarray:
-        """Prediction for user data using baseline ensemble method
-
-        Parameters
-        ----------
-        user_data : np.ndarray
-            Raw user data.
-
-        Returns
-        -------
-        np.ndarray
-            Prediction given by ensemble method
-        """
-        preds = []
-        for learnware in self.learnware_list:
-            pred_y = learnware.predict(user_data)
-            if isinstance(pred_y, torch.Tensor):
-                pred_y = pred_y.detach().cpu().numpy()
-            if not isinstance(pred_y, np.ndarray):
-                raise TypeError(f"Model output must be np.ndarray or torch.Tensor")
-
-            if len(pred_y.shape) == 1:
-                pred_y = pred_y.reshape(-1, 1)
-            else:
-                if self.mode == "vote_by_label":
-                    if pred_y.shape[1] > 1:
-                        pred_y = pred_y.argmax(axis=1).reshape(-1, 1)
-                elif self.mode == "vote_by_prob":
-                    pred_y = softmax(pred_y, axis=-1)
-            preds.append(pred_y)
-
-        if self.mode == "vote_by_prob":
-            return np.mean(preds, axis=0)
-        else:
-            preds = np.concatenate(preds, axis=1)
-            if self.mode == "mean":
-                return preds.mean(axis=1)
-            elif self.mode == "vote_by_label":
-                return np.apply_along_axis(lambda x: np.bincount(x).argmax(), axis=1, arr=preds)
-
-
-class EnsemblePruningReuser(BaseReuser):
-    """
-    Baseline Multiple Learnware Reuser uing Marign Distribution guided multi-objective evolutionary Ensemble Pruning (MDEP) Method.
-
-    References: [1] Yu-Chang Wu, Yi-Xiao He, Chao Qian, and Zhi-Hua Zhou. Multi-objective Evolutionary Ensemble Pruning Guided by Margin Distribution. In: Proceedings of the 17th International Conference on Parallel Problem Solving from Nature (PPSN'22), Dortmund, Germany, 2022.
-    """
-
-    def __init__(self, learnware_list: List[Learnware] = None, mode: str = "classification"):
-        """The initialization method for ensemble pruning reuser
-
-        Parameters
-        ----------
-        learnware_list : List[Learnware]
-            The learnware list
-        mode : str
-            - "regression" for regression task (learnware output is a real number)
-            - "classification" for classification task (learnware output is a logitis vector or belongs to the set {0, 1, ..., class_num})
-        """
-        super(EnsemblePruningReuser, self).__init__(learnware_list)
-        if mode not in ["regression", "classification"]:
-            raise ValueError(f"Mode must be one of ['regression', 'classification'], but got {mode}")
-        self.mode = mode
-        self.selected_idxes = list(range(len(learnware_list)))
-
-    def _MEDP_regression(self, v_predict: np.ndarray, v_true: np.ndarray, maxgen: int):
-        """Selective ensemble for regression model
-
-        Parameters
-        ----------
-        v_predict : np.ndarray
-            - The output of models on validation set.
-            - The dimension is (number of instances, number of models).
-        v_true : np.ndarray
-            - The ground truth of validation set.
-            - The dimension is (number of instances, 1).
-        maxgen : int
-            - The maximum number of iteration rounds.
-
-        Returns
-        -------
-        np.ndarray
-            Binary one-dimensional vector, 1 indicates that the corresponding model is selected.
-        """
-        model_num = v_predict.shape[1]
-
-        @ea.Problem.single
-        def evalVars(Vars):
-            while Vars.sum() <= 1:
-                for i in range(0, model_num):
-                    if random.random() < 1 / model_num:
-                        Vars[i] = 1 if Vars[i] == 0 else 0
-
-            vars_idxs = np.where(Vars == 1)[0].tolist()
-            squared_diff = (v_predict[:, vars_idxs].mean(axis=1).reshape(-1, 1) - v_true) ** 2
-            mse_loss = squared_diff.mean()
-
-            f2 = [[mse_loss]]
-            f3 = [[Vars.sum()]]
-            ObjV = np.hstack([f2, f3])
-            return ObjV
-
-        npop = model_num
-        Prophet = np.zeros((npop, model_num), dtype=np.int32)
-        minf1, minf2, minf1forf2 = 1000, 1000, 1000
-        minf1index, minf2index = 0, 0
-        problem = ea.Problem(
-            name="moea quick start",
-            M=2,
-            maxormins=[1, 1],
-            Dim=model_num,
-            varTypes=[1] * model_num,
-            lb=[0] * model_num,
-            ub=[1] * model_num,
-            evalVars=evalVars,
-        )
-
-        for indi in range(0, model_num):
-            Prophet[indi, indi] = 1
-            objv = evalVars(Prophet[indi])
-            if objv[0][0] < minf1 and objv[0][1] < minf1forf2:
-                minf1 = objv[0][0]
-                minf1index = indi
-                minf1forf2 = objv[0][1]
-            if objv[0][1] < minf2:
-                minf2 = objv[0][1]
-                minf2index = indi
-
-        truePro = np.zeros((10, model_num), dtype=np.int32)
-        truePro[0] = Prophet[minf1index]
-        truePro[1] = Prophet[minf2index]
-        for i in range(2, len(truePro)):
-            truePro[i, random.randint(0, model_num - 1)] = 1
-
-        # Choose MOEA such as: moea_NSGA3_templet  moea_MOEAD_templet to optimize.
-        algorithm = ea.moea_NSGA2_templet(problem, ea.Population(Encoding="BG", NIND=npop), MAXGEN=maxgen, logTras=0)
-
-        # Solve
-        min_error_v = 100000
-        res = ea.optimize(
-            algorithm, verbose=True, drawing=0, outputMsg=False, drawLog=False, saveFlag=False, prophet=truePro
-        )
-        for pop in range(0, int(res["Vars"].size / model_num)):
-            if min_error_v > res["ObjV"][pop][0]:
-                min_error_v = res["ObjV"][pop][0]
-                bst_pop = pop
-
-        return res["Vars"][bst_pop]
-
-    def _MEDP_multiclass(self, v_predict: np.ndarray, v_true: np.ndarray, maxgen: int):
-        """Selective ensemble for multi-classification model
-
-        Parameters
-        ----------
-        v_predict : np.ndarray
-            - The output of models on validation set.
-            - The dimension is (number of instances, number of models).
-        v_true : np.ndarray
-            - The ground truth of validation set.
-            - The dimension is (number of instances, 1).
-        maxgen : int
-            - The maximum number of iteration rounds.
-
-        Returns
-        -------
-        np.ndarray
-            Binary one-dimensional vector, 1 indicates that the corresponding model is selected.
-        """
-        model_num = v_predict.shape[1]
-
-        def find_top_two_freq(row):
-            total = len(row)
-            bincount = np.bincount(row)
-            top1 = bincount.argmax()
-            freq1 = bincount[top1]
-
-            bincount[top1] = 0
-            top2 = -1 if freq1 == total else bincount.argmax()
-            freq2 = 0 if freq1 == total else bincount[top2]
-
-            return top1, freq1, top2, freq2
-
-        @ea.Problem.single
-        def evalVars(Vars):
-            while Vars.sum() <= 1:
-                for i in range(0, model_num):
-                    if random.random() < 1 / model_num:
-                        Vars[i] = 1 if Vars[i] == 0 else 0
-
-            # Extract the subscript whose vars value is 1
-            idx = np.where(Vars == 1)[0]
-            select = v_predict[:, idx]
-            result = np.apply_along_axis(lambda x: find_top_two_freq(x), axis=1, arr=select)
-
-            v_true_count = (select == v_true.reshape(-1, 1)).sum(axis=1)
-            error_v = (result[:, 0] != v_true.reshape(-1)).sum()
-            margin = result[:, 1] - result[:, 3]
-            margin[result[:, 0] != v_true.reshape(-1)] = (v_true_count - result[:, 1])[
-                result[:, 0] != v_true.reshape(-1)
-            ]
-
-            margin = margin / Vars.sum()
-            mean_margin = np.mean(margin)
-            f1 = [[100000]] if mean_margin <= 0 else [[np.std(margin) / (mean_margin)]]
-            f2 = [[error_v]]
-            f3 = [[Vars.sum()]]
-            ObjV = np.hstack([f1, f2, f3])
-
-            return ObjV
-
-        npop = model_num
-        Prophet = np.zeros((npop, model_num), dtype=np.int32)
-        minf1, minf2, minf1forf2 = 1000, 1000, 1000
-        minf1index, minf2index = 0, 0
-        problem = ea.Problem(
-            name="moea quick start",
-            M=3,
-            maxormins=[1, 1, 1],
-            Dim=model_num,
-            varTypes=[1] * model_num,
-            lb=[0] * model_num,
-            ub=[1] * model_num,
-            evalVars=evalVars,
-        )
-
-        for indi in range(0, model_num):
-            Prophet[indi, indi] = 1
-            objv = evalVars(Prophet[indi])
-            if objv[0][0] < minf1 and objv[0][1] < minf1forf2:
-                minf1 = objv[0][0]
-                minf1index = indi
-                minf1forf2 = objv[0][1]
-            if objv[0][1] < minf2:
-                minf2 = objv[0][1]
-                minf2index = indi
-
-        truePro = np.zeros((10, model_num), dtype=np.int32)
-        truePro[0] = Prophet[minf1index]
-        truePro[1] = Prophet[minf2index]
-        for i in range(2, len(truePro)):
-            truePro[i, random.randint(0, model_num - 1)] = 1
-
-        # Choose MOEA such as: moea_NSGA3_templet  moea_MOEAD_templet to optimize.
-        algorithm = ea.moea_NSGA2_templet(problem, ea.Population(Encoding="BG", NIND=npop), MAXGEN=maxgen, logTras=0)
-
-        # Solve
-        min_erroe_v, choose_size, min_md = 100000, 100000, 100000
-        res = ea.optimize(
-            algorithm, verbose=True, drawing=0, outputMsg=False, drawLog=False, saveFlag=False, prophet=truePro
-        )
-        for pop in range(0, int(res["Vars"].size / model_num)):
-            if min_erroe_v > res["ObjV"][pop][1]:
-                min_erroe_v = res["ObjV"][pop][1]
-                bst_pop = pop
-                choose_size = res["ObjV"][pop][2]
-                min_md = res["ObjV"][pop][0]
-
-            if min_erroe_v == res["ObjV"][pop][1] and choose_size > res["ObjV"][pop][2]:
-                choose_size = res["ObjV"][pop][2]
-                bst_pop = pop
-
-        return res["Vars"][bst_pop]
-
-    def _MEDP_binaryclass(self, v_predict: np.ndarray, v_true: np.ndarray, maxgen: int):
-        """Selective ensemble for binary classification model
-
-        Parameters
-        ----------
-        v_predict : np.ndarray
-            - The output of models on validation set.
-            - The dimension is (number of instances, number of models).
-        v_true : np.ndarray
-            - The ground truth of validation set.
-            - The dimension is (number of instances, 1).
-        maxgen : int
-            - The maximum number of iteration rounds.
-
-        Returns
-        -------
-        np.ndarray
-            Binary one-dimensional vector, 1 indicates that the corresponding model is selected.
-        """
-        model_num = v_predict.shape[1]
-        v_predict[v_predict == 0.0] = -1
-        v_true[v_true == 0.0] = -1
-
-        @ea.Problem.single
-        def evalVars(Vars):
-            while Vars.sum() <= 1:
-                for i in range(0, model_num):
-                    if random.random() < 1 / model_num:
-                        Vars[i] = 1 if Vars[i] == 0 else 0
-
-            vars_idxs = np.where(Vars == 1)[0].tolist()
-            margin = v_predict[:, vars_idxs].mean(axis=1).reshape(-1, 1) * v_true
-            mean_margin = np.mean(margin)
-            f1 = [[100000]] if mean_margin <= 0 else [[np.std(margin) / (mean_margin)]]
-            error_v = (margin < 0).sum() + (margin == 0).sum() * 0.5
-
-            f2 = [[error_v]]
-            f3 = [[Vars.sum()]]
-            ObjV = np.hstack([f1, f2, f3])
-
-            return ObjV
-
-        npop = model_num
-        Prophet = np.zeros((npop, model_num), dtype=np.int32)
-        minf1, minf2, minf1forf2 = 1000, 1000, 1000
-        minf1index, minf2index = 0, 0
-        problem = ea.Problem(
-            name="moea quick start",
-            M=3,
-            maxormins=[1, 1, 1],
-            Dim=model_num,
-            varTypes=[1] * model_num,
-            lb=[0] * model_num,
-            ub=[1] * model_num,
-            evalVars=evalVars,
-        )
-
-        for indi in range(0, model_num):
-            Prophet[indi, indi] = 1
-            objv = evalVars(Prophet[indi])
-            if objv[0][0] < minf1 and objv[0][1] < minf1forf2:
-                minf1 = objv[0][0]
-                minf1index = indi
-                minf1forf2 = objv[0][1]
-            if objv[0][1] < minf2:
-                minf2 = objv[0][1]
-                minf2index = indi
-
-        truePro = np.zeros((10, model_num), dtype=np.int32)
-        truePro[0] = Prophet[minf1index]
-        truePro[1] = Prophet[minf2index]
-        for i in range(2, len(truePro)):
-            truePro[i, random.randint(0, model_num - 1)] = 1
-
-        # Choose MOEA such as: moea_NSGA3_templet  moea_MOEAD_templet to optimize.
-        algorithm = ea.moea_NSGA3_templet(problem, ea.Population(Encoding="BG", NIND=npop), MAXGEN=maxgen, logTras=0)
-
-        # Solve
-        min_erroe_v, choose_size, min_md = 100000, 100000, 100000
-        res = ea.optimize(
-            algorithm, verbose=True, drawing=0, outputMsg=False, drawLog=False, saveFlag=False, prophet=truePro
-        )
-        for pop in range(0, int(res["Vars"].size / model_num)):
-            if min_erroe_v > res["ObjV"][pop][1]:
-                min_erroe_v = res["ObjV"][pop][1]
-                bst_pop = pop
-                choose_size = res["ObjV"][pop][2]
-                min_md = res["ObjV"][pop][0]
-
-            if min_erroe_v == res["ObjV"][pop][1] and choose_size > res["ObjV"][pop][2]:
-                choose_size = res["ObjV"][pop][2]
-                bst_pop = pop
-
-        v_predict[v_predict == -1.0] = 0
-        v_true[v_true == -1.0] = 0
-
-        return res["Vars"][bst_pop]
-
-    def _get_predict(self, X: np.ndarray, selected_idxes: List[int]):
-        """Concatenate the output of learnwares corresponding to selected_idxes
-
-        Parameters
-        ----------
-        X : np.ndarray
-            Data that needs to be predicted
-        selected_idxes : List[int]
-            Learnware index list
-
-        Returns
-        -------
-        np.ndarray
-            Prediction given by each selected learnware
-        """
-        preds = []
-        for idx in selected_idxes:
-            pred_y = self.learnware_list[idx].predict(X)
-            if isinstance(pred_y, torch.Tensor):
-                pred_y = pred_y.detach().cpu().numpy()
-            if not isinstance(pred_y, np.ndarray):
-                raise TypeError(f"Model output must be np.ndarray or torch.Tensor")
-
-            if len(pred_y.shape) == 1:
-                pred_y = pred_y.reshape(-1, 1)
-            elif len(pred_y.shape) == 2:
-                if pred_y.shape[1] > 1:
-                    pred_y = pred_y.argmax(axis=1).reshape(-1, 1)
-            else:
-                raise ValueError("Model output must be a 1D or 2D vector")
-            preds.append(pred_y)
-
-        return np.concatenate(preds, axis=1)
-
-    def fit(self, val_X: np.ndarray, val_y: np.ndarray, maxgen: int = 500):
-        """Ensemble pruning based on the validation set
-
-        Parameters
-        ----------
-        val_X : np.ndarray
-            Features of validation data.
-        val_y : np.ndarray
-            Labels of validation data.
-        maxgen : int
-            The maximum number of iteration rounds in ensemble pruning algorithms.
-        """
-        # Get the prediction of each learnware on the validation set
-        v_predict = self._get_predict(val_X, list(range(len(self.learnware_list))))
-        v_true = val_y.reshape(-1, 1)
-
-        # Run ensemble pruning algorithm
-        if self.mode == "regression":
-            res = self._MEDP_regression(v_predict, v_true, maxgen)
-        elif self.mode == "classification":
-            if np.all((v_predict == 0) | (v_predict == 1)) and np.all((v_true == 0) | (v_true == 1)):
-                res = self._MEDP_binaryclass(v_predict, v_true, maxgen)
-            else:
-                res = self._MEDP_multiclass(v_predict, v_true, maxgen)
-
-        self.selected_idxes = np.where(res == 1)[0].tolist()
-
-    def predict(self, user_data: np.ndarray) -> np.ndarray:
-        """Prediction for user data using the final pruned ensemble
-
-        Parameters
-        ----------
-        user_data : np.ndarray
-            Raw user data.
-
-        Returns
-        -------
-        np.ndarray
-            Prediction given by ensemble method
-        """
-        preds = self._get_predict(user_data, self.selected_idxes)
-
-        if self.mode == "regression":
-            return preds.mean(axis=1)
-        elif self.mode == "classification":
-            return np.apply_along_axis(lambda x: np.bincount(x).argmax(), axis=1, arr=preds)