From 10ea94474c29d47f39c2853c7a4de026eea58a71 Mon Sep 17 00:00:00 2001
From: frozenmad <frozenmad2015@outlook.com>
Date: Fri, 13 Aug 2021 13:35:38 +0800
Subject: [PATCH 01/75] add dgl architecture

---
 autogl/solver/__init__.py                     | 21 +++++++++----------
 autogl/solver/pyg/__init__.py                 | 13 ++++++++++++
 autogl/solver/{ => pyg}/base.py               | 18 ++++++++--------
 .../solver/{ => pyg}/classifier/__init__.py   |  0
 autogl/solver/{ => pyg}/classifier/base.py    |  4 ++--
 .../{ => pyg}/classifier/graph_classifier.py  | 10 ++++-----
 .../{ => pyg}/classifier/link_predictor.py    | 12 +++++------
 .../{ => pyg}/classifier/node_classifier.py   | 20 +++++++++---------
 8 files changed, 55 insertions(+), 43 deletions(-)
 create mode 100644 autogl/solver/pyg/__init__.py
 rename autogl/solver/{ => pyg}/base.py (97%)
 rename autogl/solver/{ => pyg}/classifier/__init__.py (100%)
 rename autogl/solver/{ => pyg}/classifier/base.py (95%)
 rename autogl/solver/{ => pyg}/classifier/graph_classifier.py (99%)
 rename autogl/solver/{ => pyg}/classifier/link_predictor.py (99%)
 rename autogl/solver/{ => pyg}/classifier/node_classifier.py (98%)

diff --git a/autogl/solver/__init__.py b/autogl/solver/__init__.py
index 1cba0b1..83bf0c1 100644
--- a/autogl/solver/__init__.py
+++ b/autogl/solver/__init__.py
@@ -1,13 +1,12 @@
-"""
-Auto solver for various graph tasks
-"""
+import importlib
+import sys
+from ..backend import DependentBackend
 
-from .classifier import AutoGraphClassifier, AutoNodeClassifier, AutoLinkPredictor
-from .utils import LeaderBoard
+# load corresponding backend of subclass
+def _load_subclass_backend(backend):
+    sub_module = importlib.import_module(f'.{backend.get_backend_name()}', __name__)
+    this = sys.modules[__name__]
+    for api, obj in sub_module.__dict__.items():
+        setattr(this, api, obj)
 
-__all__ = [
-    "AutoNodeClassifier",
-    "AutoGraphClassifier",
-    "AutoLinkPredictor",
-    "LeaderBoard",
-]
+_load_subclass_backend(DependentBackend)
diff --git a/autogl/solver/pyg/__init__.py b/autogl/solver/pyg/__init__.py
new file mode 100644
index 0000000..9fef37a
--- /dev/null
+++ b/autogl/solver/pyg/__init__.py
@@ -0,0 +1,13 @@
+"""
+Auto solver for various graph tasks
+"""
+
+from .classifier import AutoGraphClassifier, AutoNodeClassifier, AutoLinkPredictor
+from ..utils import LeaderBoard
+
+__all__ = [
+    "AutoNodeClassifier",
+    "AutoGraphClassifier",
+    "AutoLinkPredictor",
+    "LeaderBoard",
+]
diff --git a/autogl/solver/base.py b/autogl/solver/pyg/base.py
similarity index 97%
rename from autogl/solver/base.py
rename to autogl/solver/pyg/base.py
index f25f4bc..b0d69ca 100644
--- a/autogl/solver/base.py
+++ b/autogl/solver/pyg/base.py
@@ -9,15 +9,15 @@ from copy import deepcopy
 
 import torch
 
-from ..module.feature import FEATURE_DICT
-from ..module.hpo import HPO_DICT
-from ..module.model import MODEL_DICT
-from ..module.nas.algorithm import NAS_ALGO_DICT
-from ..module.nas.estimator import NAS_ESTIMATOR_DICT
-from ..module.nas.space import NAS_SPACE_DICT
-from ..module import BaseFeature, BaseHPOptimizer, BaseTrainer
-from .utils import LeaderBoard
-from ..utils import get_logger
+from ...module.feature import FEATURE_DICT
+from ...module.hpo import HPO_DICT
+from ...module.model import MODEL_DICT
+from ...module.nas.algorithm import NAS_ALGO_DICT
+from ...module.nas.estimator import NAS_ESTIMATOR_DICT
+from ...module.nas.space import NAS_SPACE_DICT
+from ...module import BaseFeature, BaseHPOptimizer, BaseTrainer
+from ..utils import LeaderBoard
+from ...utils import get_logger
 
 LOGGER = get_logger("BaseSolver")
 
diff --git a/autogl/solver/classifier/__init__.py b/autogl/solver/pyg/classifier/__init__.py
similarity index 100%
rename from autogl/solver/classifier/__init__.py
rename to autogl/solver/pyg/classifier/__init__.py
diff --git a/autogl/solver/classifier/base.py b/autogl/solver/pyg/classifier/base.py
similarity index 95%
rename from autogl/solver/classifier/base.py
rename to autogl/solver/pyg/classifier/base.py
index 96f84a3..86df76c 100644
--- a/autogl/solver/classifier/base.py
+++ b/autogl/solver/pyg/classifier/base.py
@@ -4,8 +4,8 @@ Base solver for classification problems
 
 from typing import Any
 from ..base import BaseSolver
-from ...module.ensemble import ENSEMBLE_DICT
-from ...module import BaseEnsembler
+from ....module.ensemble import ENSEMBLE_DICT
+from ....module import BaseEnsembler
 
 
 class BaseClassifier(BaseSolver):
diff --git a/autogl/solver/classifier/graph_classifier.py b/autogl/solver/pyg/classifier/graph_classifier.py
similarity index 99%
rename from autogl/solver/classifier/graph_classifier.py
rename to autogl/solver/pyg/classifier/graph_classifier.py
index f7751a5..fdcb581 100644
--- a/autogl/solver/classifier/graph_classifier.py
+++ b/autogl/solver/pyg/classifier/graph_classifier.py
@@ -11,12 +11,12 @@ import numpy as np
 import yaml
 
 from .base import BaseClassifier
-from ...module.feature import FEATURE_DICT
-from ...module.model import BaseModel, MODEL_DICT
-from ...module.train import TRAINER_DICT, get_feval, BaseGraphClassificationTrainer
+from ....module.feature import FEATURE_DICT
+from ....module.model import BaseModel, MODEL_DICT
+from ....module.train import TRAINER_DICT, get_feval, BaseGraphClassificationTrainer
 from ..base import _initialize_single_model, _parse_hp_space
-from ..utils import LeaderBoard, set_seed
-from ...datasets import utils
+from ...utils import LeaderBoard, set_seed
+from ....datasets import utils
 from ...utils import get_logger
 
 LOGGER = get_logger("GraphClassifier")
diff --git a/autogl/solver/classifier/link_predictor.py b/autogl/solver/pyg/classifier/link_predictor.py
similarity index 99%
rename from autogl/solver/classifier/link_predictor.py
rename to autogl/solver/pyg/classifier/link_predictor.py
index daa769d..9376bdd 100644
--- a/autogl/solver/classifier/link_predictor.py
+++ b/autogl/solver/pyg/classifier/link_predictor.py
@@ -12,12 +12,12 @@ import yaml
 
 from .base import BaseClassifier
 from ..base import _parse_hp_space, _initialize_single_model
-from ...module.feature import FEATURE_DICT
-from ...module.model import MODEL_DICT, BaseModel
-from ...module.train import TRAINER_DICT, BaseLinkPredictionTrainer
-from ...module.train import get_feval
-from ..utils import LeaderBoard, set_seed
-from ...datasets import utils
+from ....module.feature import FEATURE_DICT
+from ....module.model import MODEL_DICT, BaseModel
+from ....module.train import TRAINER_DICT, BaseLinkPredictionTrainer
+from ....module.train import get_feval
+from ...utils import LeaderBoard, set_seed
+from ....datasets import utils
 from ...utils import get_logger
 
 LOGGER = get_logger("LinkPredictor")
diff --git a/autogl/solver/classifier/node_classifier.py b/autogl/solver/pyg/classifier/node_classifier.py
similarity index 98%
rename from autogl/solver/classifier/node_classifier.py
rename to autogl/solver/pyg/classifier/node_classifier.py
index cc8c2c1..9f5c085 100644
--- a/autogl/solver/classifier/node_classifier.py
+++ b/autogl/solver/pyg/classifier/node_classifier.py
@@ -13,16 +13,16 @@ import yaml
 
 from .base import BaseClassifier
 from ..base import _parse_hp_space, _initialize_single_model
-from ...module.feature import FEATURE_DICT
-from ...module.model import MODEL_DICT, BaseModel
-from ...module.train import TRAINER_DICT, BaseNodeClassificationTrainer
-from ...module.train import get_feval
-from ...module.nas.space import NAS_SPACE_DICT
-from ...module.nas.algorithm import NAS_ALGO_DICT
-from ...module.nas.estimator import NAS_ESTIMATOR_DICT, BaseEstimator
-from ..utils import LeaderBoard, set_seed
-from ...datasets import utils
-from ...utils import get_logger
+from ....module.feature import FEATURE_DICT
+from ....module.model import MODEL_DICT, BaseModel
+from ....module.train import TRAINER_DICT, BaseNodeClassificationTrainer
+from ....module.train import get_feval
+from ....module.nas.space import NAS_SPACE_DICT
+from ....module.nas.algorithm import NAS_ALGO_DICT
+from ....module.nas.estimator import NAS_ESTIMATOR_DICT, BaseEstimator
+from ...utils import LeaderBoard, set_seed
+from ....datasets import utils
+from ....utils import get_logger
 
 from torch_geometric.nn import GATConv, GCNConv
 

From f058f198dd71d60cd9035efa67f979c3991dacfc Mon Sep 17 00:00:00 2001
From: frozenmad <frozenmad2015@outlook.com>
Date: Fri, 13 Aug 2021 13:36:38 +0800
Subject: [PATCH 02/75] add dgl init

---
 autogl/solver/dgl/__init__.py | 0
 1 file changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 autogl/solver/dgl/__init__.py

diff --git a/autogl/solver/dgl/__init__.py b/autogl/solver/dgl/__init__.py
new file mode 100644
index 0000000..e69de29

From 50f923666477a87f19121ae71e163effb64b8349 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Sun, 15 Aug 2021 10:45:48 +0800
Subject: [PATCH 03/75] add mask to predict_only

---
 autogl/module/train/node_classification_full.py | 12 ++++++++++--
 1 file changed, 10 insertions(+), 2 deletions(-)

diff --git a/autogl/module/train/node_classification_full.py b/autogl/module/train/node_classification_full.py
index e9ec45d..0a56131 100644
--- a/autogl/module/train/node_classification_full.py
+++ b/autogl/module/train/node_classification_full.py
@@ -255,7 +255,11 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         res: The result of predicting on the given dataset.
 
         """
-        # mask = data.test_mask if test_mask is None else test_mask
+        try:
+            mask = data.test_mask if test_mask is None else test_mask
+        except:
+            mask = None
+
         data = data.to(self.device)
         self.model.model.eval()
         with torch.no_grad():
@@ -263,7 +267,11 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
                 res = self.model.model.cls_forward(data)
             else:
                 res = self.model.model.forward(data)
-        return res
+
+        if mask is None:
+            return res
+        else:
+            return res[mask]
 
     def train(self, dataset, keep_valid_result=True):
         """

From d0396c8bd250e9e5f2ceb10c43df40177375fa79 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 24 Aug 2021 18:54:39 +0800
Subject: [PATCH 04/75] change basic order

---
 autogl/solver/__init__.py                     | 21 +++--
 autogl/solver/{pyg => }/base.py               | 28 +++---
 .../{pyg/classifier => classfier}/__init__.py |  2 +-
 .../{pyg/classifier => classfier}/base.py     |  4 +-
 .../graph_classifier.py                       | 67 ++++++++-----
 .../link_predictor.py                         |  0
 .../node_classifier.py                        | 93 ++++++++++++-------
 autogl/solver/dgl/__init__.py                 |  0
 autogl/solver/pyg/__init__.py                 | 13 ---
 9 files changed, 133 insertions(+), 95 deletions(-)
 rename autogl/solver/{pyg => }/base.py (95%)
 rename autogl/solver/{pyg/classifier => classfier}/__init__.py (90%)
 rename autogl/solver/{pyg/classifier => classfier}/base.py (95%)
 rename autogl/solver/{pyg/classifier => classfier}/graph_classifier.py (92%)
 rename autogl/solver/{pyg/classifier => classfier}/link_predictor.py (100%)
 rename autogl/solver/{pyg/classifier => classfier}/node_classifier.py (91%)
 delete mode 100644 autogl/solver/dgl/__init__.py
 delete mode 100644 autogl/solver/pyg/__init__.py

diff --git a/autogl/solver/__init__.py b/autogl/solver/__init__.py
index 83bf0c1..9fef37a 100644
--- a/autogl/solver/__init__.py
+++ b/autogl/solver/__init__.py
@@ -1,12 +1,13 @@
-import importlib
-import sys
-from ..backend import DependentBackend
+"""
+Auto solver for various graph tasks
+"""
 
-# load corresponding backend of subclass
-def _load_subclass_backend(backend):
-    sub_module = importlib.import_module(f'.{backend.get_backend_name()}', __name__)
-    this = sys.modules[__name__]
-    for api, obj in sub_module.__dict__.items():
-        setattr(this, api, obj)
+from .classifier import AutoGraphClassifier, AutoNodeClassifier, AutoLinkPredictor
+from ..utils import LeaderBoard
 
-_load_subclass_backend(DependentBackend)
+__all__ = [
+    "AutoNodeClassifier",
+    "AutoGraphClassifier",
+    "AutoLinkPredictor",
+    "LeaderBoard",
+]
diff --git a/autogl/solver/pyg/base.py b/autogl/solver/base.py
similarity index 95%
rename from autogl/solver/pyg/base.py
rename to autogl/solver/base.py
index b0d69ca..4c88b21 100644
--- a/autogl/solver/pyg/base.py
+++ b/autogl/solver/base.py
@@ -4,20 +4,20 @@ Solver base class
 Provide some standard solver interface.
 """
 
-from typing import Any, Tuple
+from typing import Any, Iterable, Tuple
 from copy import deepcopy
 
 import torch
 
-from ...module.feature import FEATURE_DICT
-from ...module.hpo import HPO_DICT
-from ...module.model import MODEL_DICT
-from ...module.nas.algorithm import NAS_ALGO_DICT
-from ...module.nas.estimator import NAS_ESTIMATOR_DICT
-from ...module.nas.space import NAS_SPACE_DICT
-from ...module import BaseFeature, BaseHPOptimizer, BaseTrainer
-from ..utils import LeaderBoard
-from ...utils import get_logger
+from ..module.feature import FEATURE_DICT
+from ..module.hpo import HPO_DICT
+from ..module.model import MODEL_DICT
+from ..module.nas.algorithm import NAS_ALGO_DICT
+from ..module.nas.estimator import NAS_ESTIMATOR_DICT
+from ..module.nas.space import NAS_SPACE_DICT
+from ..module import BaseFeature, BaseHPOptimizer, BaseTrainer
+from .utils import LeaderBoard
+from ..utils import get_logger
 
 LOGGER = get_logger("BaseSolver")
 
@@ -175,7 +175,7 @@ class BaseSolver:
             self.feature_module = None
         elif isinstance(feature_module, (BaseFeature, str)):
             self.feature_module = get_feature(feature_module)
-        elif isinstance(feature_module, list):
+        elif isinstance(feature_module, Iterable):
             self.feature_module = get_feature(feature_module[0])
             for feature_engineer in feature_module[1:]:
                 self.feature_module &= get_feature(feature_engineer)
@@ -306,15 +306,15 @@ class BaseSolver:
 
         nas_algorithms = (
             nas_algorithms
-            if isinstance(nas_algorithms, (list, tuple))
+            if isinstance(nas_algorithms, Iterable)
             else [nas_algorithms]
         )
         nas_spaces = (
-            nas_spaces if isinstance(nas_spaces, (list, tuple)) else [nas_spaces]
+            nas_spaces if isinstance(nas_spaces, Iterable) else [nas_spaces]
         )
         nas_estimators = (
             nas_estimators
-            if isinstance(nas_estimators, (list, tuple))
+            if isinstance(nas_estimators, Iterable)
             else [nas_estimators]
         )
 
diff --git a/autogl/solver/pyg/classifier/__init__.py b/autogl/solver/classfier/__init__.py
similarity index 90%
rename from autogl/solver/pyg/classifier/__init__.py
rename to autogl/solver/classfier/__init__.py
index e30c582..7cc0b07 100644
--- a/autogl/solver/pyg/classifier/__init__.py
+++ b/autogl/solver/classfier/__init__.py
@@ -2,7 +2,7 @@
 Auto classifier for classification problems.
 """
 
-from .base import BaseClassifier
+from ..base import BaseClassifier
 from .graph_classifier import AutoGraphClassifier
 from .node_classifier import AutoNodeClassifier
 from .link_predictor import AutoLinkPredictor
diff --git a/autogl/solver/pyg/classifier/base.py b/autogl/solver/classfier/base.py
similarity index 95%
rename from autogl/solver/pyg/classifier/base.py
rename to autogl/solver/classfier/base.py
index 86df76c..96f84a3 100644
--- a/autogl/solver/pyg/classifier/base.py
+++ b/autogl/solver/classfier/base.py
@@ -4,8 +4,8 @@ Base solver for classification problems
 
 from typing import Any
 from ..base import BaseSolver
-from ....module.ensemble import ENSEMBLE_DICT
-from ....module import BaseEnsembler
+from ...module.ensemble import ENSEMBLE_DICT
+from ...module import BaseEnsembler
 
 
 class BaseClassifier(BaseSolver):
diff --git a/autogl/solver/pyg/classifier/graph_classifier.py b/autogl/solver/classfier/graph_classifier.py
similarity index 92%
rename from autogl/solver/pyg/classifier/graph_classifier.py
rename to autogl/solver/classfier/graph_classifier.py
index fdcb581..adc318b 100644
--- a/autogl/solver/pyg/classifier/graph_classifier.py
+++ b/autogl/solver/classfier/graph_classifier.py
@@ -11,16 +11,17 @@ import numpy as np
 import yaml
 
 from .base import BaseClassifier
-from ....module.feature import FEATURE_DICT
-from ....module.model import BaseModel, MODEL_DICT
-from ....module.train import TRAINER_DICT, get_feval, BaseGraphClassificationTrainer
+from ...module.feature import FEATURE_DICT
+from ...module.model import BaseModel, MODEL_DICT
+from ...module.train import TRAINER_DICT, get_feval, BaseGraphClassificationTrainer
 from ..base import _initialize_single_model, _parse_hp_space
-from ...utils import LeaderBoard, set_seed
-from ....datasets import utils
-from ...utils import get_logger
+from ..utils import LeaderBoard, set_seed
+from ...datasets import utils
+from ..utils import get_logger
+from ...backend import DependentBackend
 
 LOGGER = get_logger("GraphClassifier")
-
+__backend = DependentBackend.get_backend_name()
 
 class AutoGraphClassifier(BaseClassifier):
     """
@@ -239,7 +240,7 @@ class AutoGraphClassifier(BaseClassifier):
 
         Parameters
         ----------
-        dataset: torch_geometric.data.dataset.Dataset
+        dataset: autogl.data.dataset
             The multi-graph dataset needed to fit on.
 
         time_limit: int
@@ -300,10 +301,17 @@ class AutoGraphClassifier(BaseClassifier):
 
         # set up the dataset
         if train_split is None and val_split is None:
-            assert hasattr(dataset, "train_split") and hasattr(dataset, "val_split"), (
-                "The dataset has no default train/val split! "
-                "Please manually pass train and val ratio."
-            )
+            # Currently, there are no much implementation difference between pyg and dgl on solver
+            # We can use way of hotfix to judge
+            if __backend == 'pyg':
+                assert hasattr(dataset, "train_split") and hasattr(dataset, "val_split"), (
+                    "The dataset has no default train/val split! "
+                    "Please manually pass train and val ratio."
+                )
+            elif __backend == 'dgl':
+                # no available solutions here.
+                # TODO: we cannot judge whether the graph dataset has train/val/test split on dgl.
+                pass
             LOGGER.info("Use the default train/val/test ratio in given dataset")
             # if hasattr(dataset.train_split, "n_splits"):
             #    cross_validation = True
@@ -327,17 +335,29 @@ class AutoGraphClassifier(BaseClassifier):
             dataset = self.feature_module.transform(dataset, inplace=inplace)
 
         self.dataset = dataset
-        assert dataset[0].x is not None, (
-            "Does not support fit on non node-feature dataset!"
-            " Please add node features to dataset or specify feature engineers that generate"
-            " node features."
-        )
+        
+        # check whether the dataset has features.
+        # currently we only support graph classification with features.
+        
+        if __backend == 'pyg':
+            assert dataset[0].x is not None, (
+                "Does not support fit on non node-feature dataset!"
+                " Please add node features to dataset or specify feature engineers that generate"
+                " node features."
+            )
+        elif __backend == 'dgl':
+            assert 'feat' in dataset[0].ndata['feat'], (
+                "Does not support fit on non node-feature dataset!"
+                " Please add node features to dataset or specify feature engineers that generate"
+                " node features."
+            )
 
         # initialize graph networks
         self._init_graph_module(
             self.gml,
-            num_features=dataset.num_node_features,
-            num_classes=dataset.num_classes,
+            # TODO: what should we use to get feature dimension?
+            num_features=dataset.num_node_features if __backend == 'pyg' else dataset[0].ndata['feat'].size(-1),
+            num_classes=dataset.num_classes if __backend == 'pyg' else dataset.nclasses,
             feval=evaluator_list,
             device=self.runtime_device,
             loss="cross_entropy" if not hasattr(dataset, "loss") else dataset.loss,
@@ -410,7 +430,10 @@ class AutoGraphClassifier(BaseClassifier):
         if self.ensemble_module is not None:
             performance = self.ensemble_module.fit(
                 result_valid,
-                dataset.data.y[dataset.val_index].cpu().detach().numpy(),
+                # TODO: get validation set of graphs
+                dataset.data.y[dataset.val_index].cpu().detach().numpy()
+                if __backend == 'pyg' else
+                dataset.labels[dataset.val_index].cpu().detach().numpy(),
                 names,
                 evaluator_list,
                 n_classes=dataset.num_classes,
@@ -519,7 +542,7 @@ class AutoGraphClassifier(BaseClassifier):
 
         Parameters
         ----------
-        dataset: torch_geometric.data.dataset.Dataset or None
+        dataset: autogl.data.Dataset or None
             The dataset needed to predict. If ``None``, will use the processed dataset
             passed to ``fit()`` instead. Default ``None``.
 
@@ -629,7 +652,7 @@ class AutoGraphClassifier(BaseClassifier):
 
         Parameters
         ----------
-        dataset: torch_geometric.data.dataset.Dataset or None
+        dataset: autogl.data.Dataset or None
             The dataset needed to predict. If ``None``, will use the processed dataset passed
             to ``fit()`` instead. Default ``None``.
 
diff --git a/autogl/solver/pyg/classifier/link_predictor.py b/autogl/solver/classfier/link_predictor.py
similarity index 100%
rename from autogl/solver/pyg/classifier/link_predictor.py
rename to autogl/solver/classfier/link_predictor.py
diff --git a/autogl/solver/pyg/classifier/node_classifier.py b/autogl/solver/classfier/node_classifier.py
similarity index 91%
rename from autogl/solver/pyg/classifier/node_classifier.py
rename to autogl/solver/classfier/node_classifier.py
index 9f5c085..5c8eb81 100644
--- a/autogl/solver/pyg/classifier/node_classifier.py
+++ b/autogl/solver/classfier/node_classifier.py
@@ -13,21 +13,20 @@ import yaml
 
 from .base import BaseClassifier
 from ..base import _parse_hp_space, _initialize_single_model
-from ....module.feature import FEATURE_DICT
-from ....module.model import MODEL_DICT, BaseModel
-from ....module.train import TRAINER_DICT, BaseNodeClassificationTrainer
-from ....module.train import get_feval
-from ....module.nas.space import NAS_SPACE_DICT
-from ....module.nas.algorithm import NAS_ALGO_DICT
-from ....module.nas.estimator import NAS_ESTIMATOR_DICT, BaseEstimator
-from ...utils import LeaderBoard, set_seed
-from ....datasets import utils
-from ....utils import get_logger
-
-from torch_geometric.nn import GATConv, GCNConv
+from ...module.feature import FEATURE_DICT
+from ...module.model import MODEL_DICT, BaseModel
+from ...module.train import TRAINER_DICT, BaseNodeClassificationTrainer
+from ...module.train import get_feval
+from ...module.nas.space import NAS_SPACE_DICT
+from ...module.nas.algorithm import NAS_ALGO_DICT
+from ...module.nas.estimator import NAS_ESTIMATOR_DICT, BaseEstimator
+from ..utils import LeaderBoard, set_seed
+from ...datasets import utils
+from ...utils import get_logger
+from ...backend import DependentBackend
 
 LOGGER = get_logger("NodeClassifier")
-
+__backend = DependentBackend.get_backend_name()
 
 class AutoNodeClassifier(BaseClassifier):
     """
@@ -241,7 +240,7 @@ class AutoNodeClassifier(BaseClassifier):
 
         Parameters
         ----------
-        dataset: torch_geometric.data.dataset.Dataset
+        dataset: autogl.data.Dataset
             The dataset needed to fit on. This dataset must have only one graph.
 
         time_limit: int
@@ -306,7 +305,10 @@ class AutoNodeClassifier(BaseClassifier):
 
         # set up the dataset
         if train_split is not None and val_split is not None:
-            size = dataset.data.x.shape[0]
+            if __backend == 'pyg':
+                size = dataset.data.x.shape[0]
+            else:
+                size = dataset.graphs[0].num_nodes()
             if balanced:
                 train_split = (
                     train_split if train_split > 1 else int(train_split * size)
@@ -325,12 +327,18 @@ class AutoNodeClassifier(BaseClassifier):
                     dataset, train_ratio=train_split, val_ratio=val_split
                 )
         else:
-            assert hasattr(dataset.data, "train_mask") and hasattr(
-                dataset.data, "val_mask"
-            ), (
-                "The dataset has no default train/val split! Please manually pass "
-                "train and val ratio."
-            )
+            if __backend == 'pyg':
+                assert hasattr(dataset.data, "train_mask") and hasattr(
+                    dataset.data, "val_mask"
+                ), (
+                    "The dataset has no default train/val split! Please manually pass "
+                    "train and val ratio."
+                )
+            elif __backend == 'dgl':
+                assert "train_mask" in dataset[0].ndata and "val_mask" in dataset[0].ndata, (
+                    "The dataset has no default train/val split! Please manually pass "
+                    "train and val ratio."
+                )
             LOGGER.info("Use the default train/val/test ratio in given dataset")
 
         # feature engineering
@@ -338,26 +346,40 @@ class AutoNodeClassifier(BaseClassifier):
             dataset = self.feature_module.fit_transform(dataset, inplace=inplace)
 
         self.dataset = dataset
-        assert self.dataset[0].x is not None, (
-            "Does not support fit on non node-feature dataset!"
-            " Please add node features to dataset or specify feature engineers that generate"
-            " node features."
-        )
+
+        # check whether the dataset has features.
+        # currently we only support graph classification with features.
+        
+        if __backend == 'pyg':
+            assert dataset[0].x is not None, (
+                "Does not support fit on non node-feature dataset!"
+                " Please add node features to dataset or specify feature engineers that generate"
+                " node features."
+            )
+        elif __backend == 'dgl':
+            # TODO: how can we get features?
+            assert 'feat' in dataset[0].ndata['feat'], (
+                "Does not support fit on non node-feature dataset!"
+                " Please add node features to dataset or specify feature engineers that generate"
+                " node features."
+            )
 
         # initialize graph networks
         self._init_graph_module(
             self.gml,
-            num_features=self.dataset[0].x.shape[1],
-            num_classes=dataset.num_classes,
+            # TODO: how can we get num_features?
+            num_features=self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1),
+            num_classes=self.dataset.num_classes,
             feval=evaluator_list,
             device=self.runtime_device,
-            loss="nll_loss" if not hasattr(dataset, "loss") else dataset.loss,
+            loss="nll_loss" if not hasattr(dataset, "loss") else self.dataset.loss,
         )
 
         if self.nas_algorithms is not None:
             # perform neural architecture search
             self._init_nas_module(
-                num_features=self.dataset[0].x.shape[1],
+                # TODO: how can we get num_features?
+                num_features=self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1),
                 num_classes=self.dataset.num_classes,
                 feval=evaluator_list,
                 device=self.runtime_device,
@@ -385,7 +407,8 @@ class AutoNodeClassifier(BaseClassifier):
                 if isinstance(train_name, str):
                     trainer = TRAINER_DICT[train_name](
                         model=model,
-                        num_features=self.dataset[0].x.shape[1],
+                        # TODO: how can we get num_features?
+                        num_features=self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1),
                         num_classes=self.dataset.num_classes,
                         loss="nll_loss"
                         if not hasattr(dataset, "loss")
@@ -398,8 +421,9 @@ class AutoNodeClassifier(BaseClassifier):
                     trainer = train_name
                     trainer.model = model
                     trainer.update_parameters(
+                        # TODO: how can we get num_features?
+                        num_features=self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1),
                         num_classes=self.dataset.num_classes,
-                        num_features=self.dataset[0].x.shape[1],
                         loss="nll_loss"
                         if not hasattr(dataset, "loss")
                         else dataset.loss,
@@ -444,7 +468,10 @@ class AutoNodeClassifier(BaseClassifier):
         if self.ensemble_module is not None:
             performance = self.ensemble_module.fit(
                 result_valid,
-                self.dataset[0].y[self.dataset[0].val_mask].cpu().numpy(),
+                # 
+                self.dataset[0].y[self.dataset[0].val_mask].cpu().numpy()
+                if __backend == 'pyg' else 
+                self.dataset[0].ndata['label'][self.dataset[0].ndata['val_mask']].cpu().numpy(),
                 names,
                 evaluator_list,
                 n_classes=dataset.num_classes,
diff --git a/autogl/solver/dgl/__init__.py b/autogl/solver/dgl/__init__.py
deleted file mode 100644
index e69de29..0000000
diff --git a/autogl/solver/pyg/__init__.py b/autogl/solver/pyg/__init__.py
deleted file mode 100644
index 9fef37a..0000000
--- a/autogl/solver/pyg/__init__.py
+++ /dev/null
@@ -1,13 +0,0 @@
-"""
-Auto solver for various graph tasks
-"""
-
-from .classifier import AutoGraphClassifier, AutoNodeClassifier, AutoLinkPredictor
-from ..utils import LeaderBoard
-
-__all__ = [
-    "AutoNodeClassifier",
-    "AutoGraphClassifier",
-    "AutoLinkPredictor",
-    "LeaderBoard",
-]

From 36a45ae68ec34c12cd5bbb9f7d811d4912cae065 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 24 Aug 2021 19:10:18 +0800
Subject: [PATCH 05/75] change link predictor

---
 autogl/solver/classfier/link_predictor.py | 102 ++++++++++++++--------
 1 file changed, 65 insertions(+), 37 deletions(-)

diff --git a/autogl/solver/classfier/link_predictor.py b/autogl/solver/classfier/link_predictor.py
index 9376bdd..0b06223 100644
--- a/autogl/solver/classfier/link_predictor.py
+++ b/autogl/solver/classfier/link_predictor.py
@@ -12,16 +12,17 @@ import yaml
 
 from .base import BaseClassifier
 from ..base import _parse_hp_space, _initialize_single_model
-from ....module.feature import FEATURE_DICT
-from ....module.model import MODEL_DICT, BaseModel
-from ....module.train import TRAINER_DICT, BaseLinkPredictionTrainer
-from ....module.train import get_feval
-from ...utils import LeaderBoard, set_seed
-from ....datasets import utils
-from ...utils import get_logger
+from ...module.feature import FEATURE_DICT
+from ...module.model import MODEL_DICT, BaseModel
+from ...module.train import TRAINER_DICT, BaseLinkPredictionTrainer
+from ...module.train import get_feval
+from ..utils import LeaderBoard, set_seed
+from ...datasets import utils
+from ..utils import get_logger
+from ...backend import DependentBackend
 
 LOGGER = get_logger("LinkPredictor")
-
+__backend = DependentBackend.get_backend_name()
 
 class AutoLinkPredictor(BaseClassifier):
     """
@@ -280,22 +281,29 @@ class AutoLinkPredictor(BaseClassifier):
         if train_split is not None and val_split is not None:
             utils.split_edges(dataset, train_split, val_split)
         else:
-            assert all(
-                [
-                    hasattr(dataset.data, f"{name}")
-                    for name in [
-                        "train_pos_edge_index",
-                        "train_neg_adj_mask",
-                        "val_pos_edge_index",
-                        "val_neg_edge_index",
-                        "test_pos_edge_index",
-                        "test_neg_edge_index",
+            if __backend == 'pyg':
+                assert all(
+                    [
+                        hasattr(dataset.data, f"{name}")
+                        for name in [
+                            "train_pos_edge_index",
+                            "train_neg_adj_mask",
+                            "val_pos_edge_index",
+                            "val_neg_edge_index",
+                            "test_pos_edge_index",
+                            "test_neg_edge_index",
+                        ]
                     ]
-                ]
-            ), (
-                "The dataset has no default train/val split! Please manually pass "
-                "train and val ratio."
-            )
+                ), (
+                    "The dataset has no default train/val split! Please manually pass "
+                    "train and val ratio."
+                )
+            elif __backend == 'dgl':
+                assert hasattr(dataset[0], 'edata') and "train_mask" in dataset[0].edata and "val_mask" in dataset[0].edata, (
+                    "The dataset has no default train/val split! Please manually pass "
+                    "train and val ratio."
+                )
+
             LOGGER.info("Use the default train/val/test ratio in given dataset")
 
         # feature engineering
@@ -303,16 +311,31 @@ class AutoLinkPredictor(BaseClassifier):
             dataset = self.feature_module.fit_transform(dataset, inplace=inplace)
 
         self.dataset = dataset
-        assert self.dataset[0].x is not None, (
-            "Does not support fit on non node-feature dataset!"
-            " Please add node features to dataset or specify feature engineers that generate"
-            " node features."
-        )
+
+        # check whether the dataset has features.
+        # currently we only support graph classification with features.
+        
+        if __backend == 'pyg':
+            assert dataset[0].x is not None, (
+                "Does not support fit on non node-feature dataset!"
+                " Please add node features to dataset or specify feature engineers that generate"
+                " node features."
+            )
+        elif __backend == 'dgl':
+            # TODO: how can we get features?
+            assert 'feat' in dataset[0].ndata['feat'], (
+                "Does not support fit on non node-feature dataset!"
+                " Please add node features to dataset or specify feature engineers that generate"
+                " node features."
+            )
+        
+        # TODO: how can we get num_features?
+        num_features = self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1)
 
         # initialize graph networks
         self._init_graph_module(
             self.gml,
-            num_features=self.dataset[0].x.shape[1],
+            num_features=num_features,
             feval=evaluator_list,
             device=self.runtime_device,
             loss="binary_cross_entropy_with_logits"
@@ -356,20 +379,25 @@ class AutoLinkPredictor(BaseClassifier):
 
         # fit the ensemble model
         if self.ensemble_module is not None:
-            pos_edge_index, neg_edge_index = (
-                self.dataset[0].val_pos_edge_index,
-                self.dataset[0].val_neg_edge_index,
-            )
-            E = pos_edge_index.size(1) + neg_edge_index.size(1)
-            link_labels = torch.zeros(E, dtype=torch.float)
-            link_labels[: pos_edge_index.size(1)] = 1.0
+            if __backend == 'pyg':
+                pos_edge_index, neg_edge_index = (
+                    self.dataset[0].val_pos_edge_index,
+                    self.dataset[0].val_neg_edge_index,
+                )
+                E = pos_edge_index.size(1) + neg_edge_index.size(1)
+                link_labels = torch.zeros(E, dtype=torch.float)
+                link_labels[: pos_edge_index.size(1)] = 1.0
+            elif __backend == 'dgl':
+                val_mask = self.dataset[0].edata["val_mask"]
+                val_index = torch.nonzero(val_mask, as_tuple=False).squeeze()
+                link_labels = self.dataset[0].edata['etype'][val_index]
 
             performance = self.ensemble_module.fit(
                 result_valid,
                 link_labels.detach().cpu().numpy(),
                 names,
                 evaluator_list,
-                n_classes=dataset.num_classes,
+                n_classes=2
             )
             self.leaderboard.insert_model_performance(
                 "ensemble",

From a42e8c3d92056383d9277eebeae5c763eeb7c7bf Mon Sep 17 00:00:00 2001
From: CoreLeader <Core-Leader@outlook.com>
Date: Sat, 9 Oct 2021 15:04:00 +0800
Subject: [PATCH 06/75] Refactor of Dataset and Feature Engineer

Refactor of Dataset and Feature Engineer to provide a unified API for multi-backend.
In particular, this refactor introduces a unified dataset abstraction with novel feature engineer implementation.
---
 autogl/data/__init__.py                       |    4 +-
 autogl/data/_dataset/__init__.py              |    2 +
 autogl/data/_dataset/_dataset.py              |  240 ++++
 .../_dataset/_in_memory_static_graph_set.py   |   24 +
 autogl/data/dataset.py                        |  134 ---
 autogl/data/graph/__init__.py                 |    4 +
 .../graph/_general_static_graph/__init__.py   |    2 +
 .../_general_static_graph/_abstract_views.py  |  162 +++
 .../_canonical_edge_type.py                   |   56 +
 .../_general_static_graph.py                  |   15 +
 ...ral_static_graph_default_implementation.py |  940 +++++++++++++++
 ...general_static_graph_dgl_implementation.py |  651 +++++++++++
 .../_general_static_graph_generator.py        |   80 ++
 .../_general_static_graph/utils/__init__.py   |    0
 .../utils/conversion/__init__.py              |   19 +
 .../utils/conversion/_dgl.py                  |  136 +++
 .../utils/conversion/_nx.py                   |   74 ++
 .../utils/conversion/_pyg.py                  |   68 ++
 autogl/data/graph/_general_static_graph_.py   | 1018 +++++++++++++++++
 autogl/data/graph/utils/__init__.py           |    0
 autogl/data/graph/utils/conversion.py         |    1 +
 autogl/datasets/README.md                     |   65 --
 autogl/datasets/__init__.py                   |  265 ++---
 autogl/datasets/_data_source.py               |   80 ++
 autogl/datasets/_dataset_registry.py          |   45 +
 autogl/datasets/_dgl.py                       |  491 ++++++++
 autogl/datasets/_gtn_data.py                  |  244 ++++
 autogl/datasets/_matlab_matrix.py             |  112 ++
 autogl/datasets/_ogb.py                       |  456 ++++++++
 autogl/datasets/_pyg.py                       |  567 +++++++++
 autogl/datasets/gatne.py                      |  113 --
 autogl/datasets/gtn_data.py                   |  188 ---
 autogl/datasets/han_data.py                   |  187 ---
 autogl/datasets/matlab_matrix.py              |   96 --
 autogl/datasets/modelnet.py                   |   70 --
 autogl/datasets/ogb.py                        |  358 ------
 autogl/datasets/pyg.py                        |  407 -------
 autogl/datasets/utils.py                      |  453 --------
 autogl/datasets/utils/__init__.py             |    9 +
 autogl/datasets/utils/_general.py             |  402 +++++++
 autogl/datasets/utils/_pyg.py                 |  116 ++
 autogl/datasets/utils/conversion/__init__.py  |   12 +
 .../utils/conversion/_to_dgl_dataset.py       |   36 +
 .../utils/conversion/_to_pyg_dataset.py       |   18 +
 autogl/module/_feature/__init__.py            |  103 ++
 .../{feature => _feature}/auto_feature.py     |    0
 autogl/module/{feature => _feature}/base.py   |    0
 .../generators/__init__.py                    |    0
 .../{feature => _feature}/generators/base.py  |    0
 .../{feature => _feature}/generators/eigen.py |    0
 .../generators/graphlet.py                    |    0
 .../generators/page_rank.py                   |    0
 .../{feature => _feature}/generators/pyg.py   |    0
 .../{feature => _feature}/graph/__init__.py   |    0
 .../{feature => _feature}/graph/base.py       |    0
 .../{feature => _feature}/graph/netlsd.py     |    0
 .../module/{feature => _feature}/graph/nx.py  |    0
 .../selectors/__init__.py                     |    0
 .../{feature => _feature}/selectors/base.py   |    0
 .../selectors/se_filter_constant.py           |    0
 .../selectors/se_gbdt.py                      |    0
 autogl/module/{feature => _feature}/utils.py  |    0
 autogl/module/feature/__init__.py             |  134 +--
 .../module/feature/_base_feature_engineer.py  |  114 ++
 .../feature/_composed_feature_engineer.py     |   37 +
 .../feature/_feature_engineer_registry.py     |   62 +
 autogl/module/feature/_generators/__init__.py |   19 +
 autogl/module/feature/_generators/_basic.py   |  110 ++
 autogl/module/feature/_generators/_eigen.py   |   92 ++
 .../module/feature/_generators/_graphlet.py   |  247 ++++
 .../module/feature/_generators/_page_rank.py  |   29 +
 autogl/module/feature/_generators/_pyg.py     |   78 ++
 .../module/feature/_generators/_pyg_impl.py   |  234 ++++
 autogl/module/feature/_graph/__init__.py      |   17 +
 autogl/module/feature/_graph/_netlsd.py       |   41 +
 autogl/module/feature/_graph/_networkx.py     |  131 +++
 autogl/module/feature/_selectors/__init__.py  |    2 +
 autogl/module/feature/_selectors/_basic.py    |   58 +
 autogl/module/feature/_selectors/_gbdt.py     |  139 +++
 79 files changed, 7695 insertions(+), 2372 deletions(-)
 create mode 100644 autogl/data/_dataset/__init__.py
 create mode 100644 autogl/data/_dataset/_dataset.py
 create mode 100644 autogl/data/_dataset/_in_memory_static_graph_set.py
 delete mode 100644 autogl/data/dataset.py
 create mode 100644 autogl/data/graph/__init__.py
 create mode 100644 autogl/data/graph/_general_static_graph/__init__.py
 create mode 100644 autogl/data/graph/_general_static_graph/_abstract_views.py
 create mode 100644 autogl/data/graph/_general_static_graph/_canonical_edge_type.py
 create mode 100644 autogl/data/graph/_general_static_graph/_general_static_graph.py
 create mode 100644 autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py
 create mode 100644 autogl/data/graph/_general_static_graph/_general_static_graph_dgl_implementation.py
 create mode 100644 autogl/data/graph/_general_static_graph/_general_static_graph_generator.py
 create mode 100644 autogl/data/graph/_general_static_graph/utils/__init__.py
 create mode 100644 autogl/data/graph/_general_static_graph/utils/conversion/__init__.py
 create mode 100644 autogl/data/graph/_general_static_graph/utils/conversion/_dgl.py
 create mode 100644 autogl/data/graph/_general_static_graph/utils/conversion/_nx.py
 create mode 100644 autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
 create mode 100644 autogl/data/graph/_general_static_graph_.py
 create mode 100644 autogl/data/graph/utils/__init__.py
 create mode 100644 autogl/data/graph/utils/conversion.py
 delete mode 100644 autogl/datasets/README.md
 create mode 100644 autogl/datasets/_data_source.py
 create mode 100644 autogl/datasets/_dataset_registry.py
 create mode 100644 autogl/datasets/_dgl.py
 create mode 100644 autogl/datasets/_gtn_data.py
 create mode 100644 autogl/datasets/_matlab_matrix.py
 create mode 100644 autogl/datasets/_ogb.py
 create mode 100644 autogl/datasets/_pyg.py
 delete mode 100644 autogl/datasets/gatne.py
 delete mode 100644 autogl/datasets/gtn_data.py
 delete mode 100644 autogl/datasets/han_data.py
 delete mode 100644 autogl/datasets/matlab_matrix.py
 delete mode 100644 autogl/datasets/modelnet.py
 delete mode 100644 autogl/datasets/ogb.py
 delete mode 100644 autogl/datasets/pyg.py
 delete mode 100644 autogl/datasets/utils.py
 create mode 100644 autogl/datasets/utils/__init__.py
 create mode 100644 autogl/datasets/utils/_general.py
 create mode 100644 autogl/datasets/utils/_pyg.py
 create mode 100644 autogl/datasets/utils/conversion/__init__.py
 create mode 100644 autogl/datasets/utils/conversion/_to_dgl_dataset.py
 create mode 100644 autogl/datasets/utils/conversion/_to_pyg_dataset.py
 create mode 100644 autogl/module/_feature/__init__.py
 rename autogl/module/{feature => _feature}/auto_feature.py (100%)
 rename autogl/module/{feature => _feature}/base.py (100%)
 rename autogl/module/{feature => _feature}/generators/__init__.py (100%)
 rename autogl/module/{feature => _feature}/generators/base.py (100%)
 rename autogl/module/{feature => _feature}/generators/eigen.py (100%)
 rename autogl/module/{feature => _feature}/generators/graphlet.py (100%)
 rename autogl/module/{feature => _feature}/generators/page_rank.py (100%)
 rename autogl/module/{feature => _feature}/generators/pyg.py (100%)
 rename autogl/module/{feature => _feature}/graph/__init__.py (100%)
 rename autogl/module/{feature => _feature}/graph/base.py (100%)
 rename autogl/module/{feature => _feature}/graph/netlsd.py (100%)
 rename autogl/module/{feature => _feature}/graph/nx.py (100%)
 rename autogl/module/{feature => _feature}/selectors/__init__.py (100%)
 rename autogl/module/{feature => _feature}/selectors/base.py (100%)
 rename autogl/module/{feature => _feature}/selectors/se_filter_constant.py (100%)
 rename autogl/module/{feature => _feature}/selectors/se_gbdt.py (100%)
 rename autogl/module/{feature => _feature}/utils.py (100%)
 create mode 100644 autogl/module/feature/_base_feature_engineer.py
 create mode 100644 autogl/module/feature/_composed_feature_engineer.py
 create mode 100644 autogl/module/feature/_feature_engineer_registry.py
 create mode 100644 autogl/module/feature/_generators/__init__.py
 create mode 100644 autogl/module/feature/_generators/_basic.py
 create mode 100644 autogl/module/feature/_generators/_eigen.py
 create mode 100644 autogl/module/feature/_generators/_graphlet.py
 create mode 100644 autogl/module/feature/_generators/_page_rank.py
 create mode 100644 autogl/module/feature/_generators/_pyg.py
 create mode 100644 autogl/module/feature/_generators/_pyg_impl.py
 create mode 100644 autogl/module/feature/_graph/__init__.py
 create mode 100644 autogl/module/feature/_graph/_netlsd.py
 create mode 100644 autogl/module/feature/_graph/_networkx.py
 create mode 100644 autogl/module/feature/_selectors/__init__.py
 create mode 100644 autogl/module/feature/_selectors/_basic.py
 create mode 100644 autogl/module/feature/_selectors/_gbdt.py

diff --git a/autogl/data/__init__.py b/autogl/data/__init__.py
index 07f5943..a95281a 100644
--- a/autogl/data/__init__.py
+++ b/autogl/data/__init__.py
@@ -1,6 +1,6 @@
 from .data import Data
 from .batch import Batch
-from .dataset import Dataset
+from ._dataset import Dataset, InMemoryDataset, InMemoryStaticGraphSet
 from .dataloader import DataLoader, DataListLoader, DenseDataLoader
 from .download import download_url
 from .extract import extract_tar, extract_zip, extract_bz2, extract_gz
@@ -9,6 +9,8 @@ __all__ = [
     "Data",
     "Batch",
     "Dataset",
+    "InMemoryDataset",
+    "InMemoryStaticGraphSet",
     "DataLoader",
     "DataListLoader",
     "DenseDataLoader",
diff --git a/autogl/data/_dataset/__init__.py b/autogl/data/_dataset/__init__.py
new file mode 100644
index 0000000..37199ed
--- /dev/null
+++ b/autogl/data/_dataset/__init__.py
@@ -0,0 +1,2 @@
+from ._dataset import Dataset, InMemoryDataset
+from ._in_memory_static_graph_set import InMemoryStaticGraphSet
diff --git a/autogl/data/_dataset/_dataset.py b/autogl/data/_dataset/_dataset.py
new file mode 100644
index 0000000..0735486
--- /dev/null
+++ b/autogl/data/_dataset/_dataset.py
@@ -0,0 +1,240 @@
+import typing as _typing
+
+_D = _typing.TypeVar('_D')
+
+
+class Dataset(_typing.Iterable[_D], _typing.Sized):
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[_D]:
+        raise NotImplementedError
+
+    def __getitem__(self, index: int) -> _D:
+        raise NotImplementedError
+
+    def __setitem__(self, index: int, data: _D):
+        raise NotImplementedError
+
+    @property
+    def train_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
+        raise NotImplementedError
+
+    @property
+    def val_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
+        raise NotImplementedError
+
+    @property
+    def test_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
+        raise NotImplementedError
+
+    @property
+    def train_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
+        raise NotImplementedError
+
+    @property
+    def val_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
+        raise NotImplementedError
+
+    @property
+    def test_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
+        raise NotImplementedError
+
+    @train_index.setter
+    def train_index(self, train_index: _typing.Optional[_typing.Iterable[int]]):
+        raise NotImplementedError
+
+    @val_index.setter
+    def val_index(self, val_index: _typing.Optional[_typing.Iterable[int]]):
+        raise NotImplementedError
+
+    @test_index.setter
+    def test_index(self, test_index: _typing.Optional[_typing.Iterable[int]]):
+        raise NotImplementedError
+
+
+class _FoldsContainer:
+    def __init__(
+            self,
+            folds: _typing.Optional[_typing.Iterable[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]] = ...
+    ):
+        self._folds: _typing.Optional[_typing.List[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]] = (
+            list(folds) if isinstance(folds, _typing.Iterable) else None
+        )
+        if self._folds is not None and len(self._folds) == 0:
+            self._folds = None
+
+    @property
+    def folds(self) -> _typing.Optional[_typing.Sequence[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]]:
+        if self._folds is not None and len(self._folds) == 0:
+            self._folds = None
+        return self._folds
+
+    @folds.setter
+    def folds(self, folds: _typing.Optional[_typing.Iterable[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]]):
+        self._folds: _typing.Optional[_typing.List[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]] = (
+            list(folds) if isinstance(folds, _typing.Iterable) else None
+        )
+        if self._folds is not None and len(self._folds) == 0:
+            self._folds = None
+
+
+class _FoldView:
+    def __init__(self, folds_container: _FoldsContainer, fold_index: int):
+        self._folds_container: _FoldsContainer = folds_container
+        self._fold_index: int = fold_index
+
+    @property
+    def train_index(self) -> _typing.Sequence[int]:
+        return self._folds_container.folds[self._fold_index][0]
+
+    @property
+    def val_index(self) -> _typing.Sequence[int]:
+        return self._folds_container.folds[self._fold_index][1]
+
+
+class _FoldsView(_typing.Sequence[_FoldView]):
+    def __init__(self, folds_container: _FoldsContainer):
+        self._folds_container = folds_container
+
+    def __len__(self) -> int:
+        return (
+            len(self._folds_container.folds)
+            if self._folds_container.folds is not None
+            else 0
+        )
+
+    def __getitem__(self, fold_index: int) -> _FoldView:
+        return _FoldView(self._folds_container, fold_index)
+
+
+class InMemoryDataset(Dataset[_D]):
+    def __init__(
+            self, data: _typing.Iterable[_D],
+            train_index: _typing.Optional[_typing.Iterable[int]] = ...,
+            val_index: _typing.Optional[_typing.Iterable[int]] = ...,
+            test_index: _typing.Optional[_typing.Iterable[int]] = ...
+    ):
+        self.__data: _typing.MutableSequence[_D] = list(data)
+        self.__train_index: _typing.Optional[_typing.Set[int]] = (
+            set(train_index) if isinstance(train_index, _typing.Iterable) else None
+        )
+        self.__val_index: _typing.Optional[_typing.Set[int]] = (
+            set(val_index) if isinstance(val_index, _typing.Iterable) else None
+        )
+        self.__test_index: _typing.Optional[_typing.Set[int]] = (
+            set(test_index) if isinstance(test_index, _typing.Iterable) else None
+        )
+        self.__folds_container: _FoldsContainer = _FoldsContainer()
+
+    @property
+    def folds(self) -> _typing.Optional[_FoldsView]:
+        return (
+            _FoldsView(self.__folds_container)
+            if (
+                    self.__folds_container.folds is not None and
+                    len(self.__folds_container.folds) > 0
+            )
+            else None
+        )
+
+    @folds.setter
+    def folds(
+            self,
+            folds: _typing.Optional[
+                _typing.Iterable[
+                    _typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]
+                ]
+            ] = ...
+    ):
+        self.__folds_container.folds = folds
+
+    def __len__(self) -> int:
+        return len(self.__data)
+
+    def __iter__(self) -> _typing.Iterator[_D]:
+        return iter(self.__data)
+
+    def __getitem__(self, index: int) -> _D:
+        return self.__data[index]
+
+    def __setitem__(self, index: int, data: _D):
+        self.__data[index] = data
+
+    def reset_dataset(self, data: _typing.Iterable[_D]):
+        if not isinstance(data, _typing.Iterable):
+            raise TypeError
+        __data: _typing.MutableSequence[_D] = list(data)
+        __preserve_info: bool = __data == len(self)
+        self.__data: _typing.MutableSequence[_D] = __data
+        if not __preserve_info:
+            self.train_index = self.val_index = self.test_index = None
+
+    @property
+    def train_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
+        return (
+            [self.__data[i] for i in sorted(self.__train_index)]
+            if isinstance(self.__train_index, _typing.Iterable) else None
+        )
+
+    @property
+    def val_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
+        return (
+            [self.__data[i] for i in sorted(self.__val_index)]
+            if isinstance(self.__val_index, _typing.Iterable) else None
+        )
+
+    @property
+    def test_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
+        return (
+            [self.__data[i] for i in sorted(self.__test_index)]
+            if isinstance(self.__test_index, _typing.Iterable) else None
+        )
+
+    @property
+    def train_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
+        return self.__train_index
+
+    @property
+    def val_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
+        return self.__val_index
+
+    @property
+    def test_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
+        return self.__test_index
+
+    @train_index.setter
+    def train_index(self, train_index: _typing.Optional[_typing.Iterable[int]]):
+        if not (train_index is None or isinstance(train_index, _typing.Iterable)):
+            raise TypeError
+        elif train_index is None:
+            self.__train_index: _typing.Optional[_typing.Set[int]] = None
+        elif isinstance(train_index, _typing.Iterable):
+            _train_index: _typing.Set[int] = set(train_index)
+            if not (0 <= min(_train_index) <= max(_train_index) < len(self)):
+                raise ValueError
+            self.__train_index: _typing.Optional[_typing.Set[int]] = _train_index
+
+    @val_index.setter
+    def val_index(self, val_index: _typing.Optional[_typing.Iterable[int]]):
+        if not (val_index is None or isinstance(val_index, _typing.Iterable)):
+            raise TypeError
+        elif val_index is None:
+            self.__val_index: _typing.Optional[_typing.Set[int]] = None
+        elif isinstance(val_index, _typing.Iterable):
+            _val_index: _typing.Set[int] = set(val_index)
+            if not (0 <= min(_val_index) <= max(_val_index) < len(self)):
+                raise ValueError
+            self.__val_index: _typing.Optional[_typing.Set[int]] = _val_index
+
+    @test_index.setter
+    def test_index(self, test_index: _typing.Optional[_typing.Iterable[int]]):
+        if not (test_index is None or isinstance(test_index, _typing.Iterable)):
+            raise TypeError
+        elif test_index is None:
+            self.__test_index: _typing.Optional[_typing.Set[int]] = None
+        elif isinstance(test_index, _typing.Iterable):
+            _test_index: _typing.Set[int] = set(test_index)
+            if not (0 <= min(_test_index) <= max(_test_index) < len(self)):
+                raise ValueError
+            self.__test_index: _typing.Optional[_typing.Set[int]] = _test_index
diff --git a/autogl/data/_dataset/_in_memory_static_graph_set.py b/autogl/data/_dataset/_in_memory_static_graph_set.py
new file mode 100644
index 0000000..303132b
--- /dev/null
+++ b/autogl/data/_dataset/_in_memory_static_graph_set.py
@@ -0,0 +1,24 @@
+import typing as _typing
+from ._dataset import InMemoryDataset
+from ..graph import GeneralStaticGraph
+
+
+class InMemoryStaticGraphSet(InMemoryDataset[GeneralStaticGraph]):
+    def __init__(
+            self, graphs: _typing.Iterable[GeneralStaticGraph],
+            train_index: _typing.Optional[_typing.Iterable[int]] = ...,
+            val_index: _typing.Optional[_typing.Iterable[int]] = ...,
+            test_index: _typing.Optional[_typing.Iterable[int]] = ...
+    ):
+        super(InMemoryStaticGraphSet, self).__init__(
+            graphs, train_index, val_index, test_index
+        )
+
+    def __iter__(self) -> _typing.Iterator[GeneralStaticGraph]:
+        return super(InMemoryStaticGraphSet, self).__iter__()
+
+    def __getitem__(self, index: int) -> GeneralStaticGraph:
+        return super(InMemoryStaticGraphSet, self).__getitem__(index)
+
+    def __setitem__(self, index: int, data: GeneralStaticGraph):
+        super(InMemoryStaticGraphSet, self).__setitem__(index, data)
diff --git a/autogl/data/dataset.py b/autogl/data/dataset.py
deleted file mode 100644
index 5516447..0000000
--- a/autogl/data/dataset.py
+++ /dev/null
@@ -1,134 +0,0 @@
-import collections
-import os.path as osp
-
-import torch.utils.data
-
-from .makedirs import makedirs
-
-
-def to_list(x):
-    if not isinstance(x, collections.Iterable) or isinstance(x, str):
-        x = [x]
-    return x
-
-
-def files_exist(files):
-    return all([osp.exists(f) for f in files])
-
-
-class Dataset(torch.utils.data.Dataset):
-    r"""Dataset base class for creating graph datasets.
-    See `here <https://rusty1s.github.io/pycogdl/build/html/notes/
-    create_dataset.html>`__ for the accompanying tutorial.
-
-    Args:
-        root (string): Root directory where the dataset should be saved.
-        transform (callable, optional): A function/transform that takes in an
-            :obj:`cogdl.data.Data` object and returns a transformed
-            version. The data object will be transformed before every access.
-            (default: :obj:`None`)
-        pre_transform (callable, optional): A function/transform that takes in
-            an :obj:`cogdl.data.Data` object and returns a
-            transformed version. The data object will be transformed before
-            being saved to disk. (default: :obj:`None`)
-        pre_filter (callable, optional): A function that takes in an
-            :obj:`cogdl.data.Data` object and returns a boolean
-            value, indicating whether the data object should be included in the
-            final dataset. (default: :obj:`None`)
-    """
-
-    @property
-    def raw_file_names(self):
-        r"""The name of the files to find in the :obj:`self.raw_dir` folder in
-        order to skip the download."""
-        raise NotImplementedError
-
-    @property
-    def processed_file_names(self):
-        r"""The name of the files to find in the :obj:`self.processed_dir`
-        folder in order to skip the processing."""
-        raise NotImplementedError
-
-    def download(self):
-        r"""Downloads the dataset to the :obj:`self.raw_dir` folder."""
-        raise NotImplementedError
-
-    def process(self):
-        r"""Processes the dataset to the :obj:`self.processed_dir` folder."""
-        raise NotImplementedError
-
-    def __len__(self):
-        r"""The number of examples in the dataset."""
-        raise NotImplementedError
-
-    def get(self, idx):
-        r"""Gets the data object at index :obj:`idx`."""
-        raise NotImplementedError
-
-    def __init__(self, root, transform=None, pre_transform=None, pre_filter=None):
-        super(Dataset, self).__init__()
-
-        self.root = osp.expanduser(osp.normpath(root))
-        self.raw_dir = osp.join(self.root, "raw")
-        self.processed_dir = osp.join(self.root, "processed")
-        self.transform = transform
-        self.pre_transform = pre_transform
-        self.pre_filter = pre_filter
-
-        self._download()
-        self._process()
-
-    @property
-    def get_label_number(self):
-        r"""Get the number of labels in this dataset as dict."""
-        label_num = {}
-        labels = self[0].y.unique().cpu().detach().numpy().tolist()
-        for label in labels:
-            label_num[label] = (self[0].y == label).sum().item()
-        return label_num
-
-    @property
-    def num_features(self):
-        r"""Returns the number of features per node in the graph."""
-        return self[0].num_features
-
-    @property
-    def raw_paths(self):
-        r"""The filepaths to find in order to skip the download."""
-        files = to_list(self.raw_file_names)
-        return [osp.join(self.raw_dir, f) for f in files]
-
-    @property
-    def processed_paths(self):
-        r"""The filepaths to find in the :obj:`self.processed_dir`
-        folder in order to skip the processing."""
-        files = to_list(self.processed_file_names)
-        return [osp.join(self.processed_dir, f) for f in files]
-
-    def _download(self):
-        if files_exist(self.raw_paths):  # pragma: no cover
-            return
-
-        makedirs(self.raw_dir)
-        self.download()
-
-    def _process(self):
-        if files_exist(self.processed_paths):  # pragma: no cover
-            return
-
-        print("Processing...")
-
-        makedirs(self.processed_dir)
-        self.process()
-
-        print("Done!")
-
-    def __getitem__(self, idx):  # pragma: no cover
-        r"""Gets the data object at index :obj:`idx` and transforms it (in case
-        a :obj:`self.transform` is given)."""
-        data = self.get(idx)
-        data = data if self.transform is None else self.transform(data)
-        return data
-
-    def __repr__(self):  # pragma: no cover
-        return "{}({})".format(self.__class__.__name__, len(self))
diff --git a/autogl/data/graph/__init__.py b/autogl/data/graph/__init__.py
new file mode 100644
index 0000000..8ad4f65
--- /dev/null
+++ b/autogl/data/graph/__init__.py
@@ -0,0 +1,4 @@
+from ._general_static_graph import (
+   GeneralStaticGraph, GeneralStaticGraphGenerator
+)
+from . import utils
diff --git a/autogl/data/graph/_general_static_graph/__init__.py b/autogl/data/graph/_general_static_graph/__init__.py
new file mode 100644
index 0000000..5d68a6b
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/__init__.py
@@ -0,0 +1,2 @@
+from ._general_static_graph import GeneralStaticGraph
+from ._general_static_graph_generator import GeneralStaticGraphGenerator
diff --git a/autogl/data/graph/_general_static_graph/_abstract_views.py b/autogl/data/graph/_general_static_graph/_abstract_views.py
new file mode 100644
index 0000000..39cd463
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/_abstract_views.py
@@ -0,0 +1,162 @@
+import torch
+import typing as _typing
+from . import _canonical_edge_type
+
+
+class SpecificTypedNodeDataView(_typing.MutableMapping[str, torch.Tensor]):
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        raise NotImplementedError
+
+    def __setitem__(self, data_key: str, value: torch.Tensor):
+        raise NotImplementedError
+
+    def __delitem__(self, data_key: str) -> None:
+        raise NotImplementedError
+
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        raise NotImplementedError
+
+
+class SpecificTypedNodeView:
+    @property
+    def data(self) -> SpecificTypedNodeDataView:
+        raise NotImplementedError
+
+    @data.setter
+    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
+        raise NotImplementedError
+
+
+class HeterogeneousNodeView(_typing.Iterable[str]):
+    @property
+    def data(self) -> SpecificTypedNodeDataView:
+        raise NotImplementedError
+
+    @data.setter
+    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
+        raise NotImplementedError
+
+    def __getitem__(self, node_type: _typing.Optional[str]) -> SpecificTypedNodeView:
+        raise NotImplementedError
+
+    def __setitem__(
+            self, node_t: _typing.Optional[str],
+            nodes_data: _typing.Mapping[str, torch.Tensor]
+    ):
+        raise NotImplementedError
+
+    def __delitem__(self, node_t: _typing.Optional[str]):
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        raise NotImplementedError
+
+    @property
+    def is_homogeneous(self) -> bool:
+        raise NotImplementedError
+
+
+class HomogeneousEdgesDataView(_typing.MutableMapping[str, torch.Tensor]):
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        raise NotImplementedError
+
+    def __setitem__(self, data_key: str, value: torch.Tensor):
+        raise NotImplementedError
+
+    def __delitem__(self, data_key: str):
+        raise NotImplementedError
+
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        raise NotImplementedError
+
+
+class HomogeneousEdgesView:
+    @property
+    def connections(self) -> torch.LongTensor:
+        raise NotImplementedError
+
+    @property
+    def data(self) -> HomogeneousEdgesDataView:
+        raise NotImplementedError
+
+
+class HeterogeneousEdgesView(_typing.Collection[_canonical_edge_type.CanonicalEdgeType]):
+    @property
+    def connections(self) -> torch.LongTensor:
+        raise NotImplementedError
+
+    @property
+    def data(self) -> HomogeneousEdgesDataView:
+        raise NotImplementedError
+
+    @property
+    def is_homogeneous(self) -> bool:
+        raise NotImplementedError
+
+    def set(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str]],
+            connections: torch.LongTensor, data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        raise NotImplementedError
+
+    def __getitem__(
+            self,
+            edge_t: _typing.Union[
+                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
+            ]
+    ) -> HomogeneousEdgesView:
+        raise NotImplementedError
+
+    def __setitem__(
+            self,
+            edge_t: _typing.Union[
+                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
+            ],
+            edges: _typing.Union[torch.LongTensor]
+    ):
+        raise NotImplementedError
+
+    def __delitem__(
+            self,
+            edge_t: _typing.Union[
+                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
+            ]
+    ):
+        raise NotImplementedError
+
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[_canonical_edge_type.CanonicalEdgeType]:
+        raise NotImplementedError
+
+    def __contains__(
+            self,
+            edge_type: _typing.Union[
+                str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
+            ]
+    ) -> bool:
+        raise NotImplementedError
+
+
+class GraphDataView(_typing.MutableMapping[str, torch.Tensor]):
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        raise NotImplementedError
+
+    def __delitem__(self, data_key: str) -> None:
+        raise NotImplementedError
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        raise NotImplementedError
+
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        raise NotImplementedError
diff --git a/autogl/data/graph/_general_static_graph/_canonical_edge_type.py b/autogl/data/graph/_general_static_graph/_canonical_edge_type.py
new file mode 100644
index 0000000..0c98126
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/_canonical_edge_type.py
@@ -0,0 +1,56 @@
+import typing as _typing
+
+
+class CanonicalEdgeType(_typing.Sequence[str]):
+    def __init__(self, source_node_type: str, relation_type: str, target_node_type: str):
+        if not isinstance(source_node_type, str):
+            raise TypeError
+        elif ' ' in source_node_type:
+            raise ValueError
+        if not isinstance(relation_type, str):
+            raise TypeError
+        elif ' ' in relation_type:
+            raise ValueError
+        if not isinstance(target_node_type, str):
+            raise TypeError
+        elif ' ' in target_node_type:
+            raise ValueError
+        self.__source_node_type: str = source_node_type
+        self.__relation_type: str = relation_type
+        self.__destination_node_type: str = target_node_type
+
+    @property
+    def source_node_type(self) -> str:
+        return self.__source_node_type
+
+    @property
+    def relation_type(self) -> str:
+        return self.__relation_type
+
+    @property
+    def target_node_type(self) -> str:
+        return self.__destination_node_type
+
+    def __eq__(self, other):
+        if not (isinstance(other, CanonicalEdgeType) or isinstance(other, _typing.Sequence)):
+            return False
+        elif isinstance(other, _typing.Sequence):
+            if not (len(other) == 3 and all([(isinstance(t, str) and ' ' not in t) for t in other])):
+                raise TypeError
+            return (
+                    other[0] == self.source_node_type and
+                    other[1] == self.relation_type and
+                    other[2] == self.target_node_type
+            )
+        elif isinstance(other, CanonicalEdgeType):
+            return (
+                    other.source_node_type == self.source_node_type and
+                    other.relation_type == self.relation_type and
+                    other.target_node_type == self.target_node_type
+            )
+
+    def __getitem__(self, index: int):
+        return (self.source_node_type, self.relation_type, self.target_node_type)[index]
+
+    def __len__(self) -> int:
+        return 3
diff --git a/autogl/data/graph/_general_static_graph/_general_static_graph.py b/autogl/data/graph/_general_static_graph/_general_static_graph.py
new file mode 100644
index 0000000..aee5d57
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph.py
@@ -0,0 +1,15 @@
+from . import _abstract_views
+
+
+class GeneralStaticGraph:
+    @property
+    def nodes(self) -> _abstract_views.HeterogeneousNodeView:
+        raise NotImplementedError
+
+    @property
+    def edges(self) -> _abstract_views.HeterogeneousEdgesView:
+        raise NotImplementedError
+
+    @property
+    def data(self) -> _abstract_views.GraphDataView:
+        raise NotImplementedError
diff --git a/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py b/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py
new file mode 100644
index 0000000..469fa9b
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py
@@ -0,0 +1,940 @@
+import pandas as pd
+import torch
+import typing as _typing
+from . import (
+    _abstract_views,
+    _canonical_edge_type,
+    _general_static_graph
+)
+
+
+class HeterogeneousNodesContainer:
+    @property
+    def node_types(self) -> _typing.AbstractSet[str]:
+        raise NotImplementedError
+
+    def remove_nodes(self, node_t: _typing.Optional[str]) -> 'HeterogeneousNodesContainer':
+        raise NotImplementedError
+
+    def reset_nodes(
+            self, node_t: _typing.Optional[str],
+            nodes_data: _typing.Mapping[str, torch.Tensor]
+    ) -> 'HeterogeneousNodesContainer':
+        raise NotImplementedError
+
+    def set_data(
+            self, node_t: _typing.Optional[str], data_key: str, data: torch.Tensor
+    ) -> 'HeterogeneousNodesContainer':
+        raise NotImplementedError
+
+    def get_data(
+            self, node_t: _typing.Optional[str] = ...,
+            data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        raise NotImplementedError
+
+    def delete_data(
+            self, node_t: _typing.Optional[str], data_key: str
+    ) -> 'HeterogeneousNodesContainer':
+        raise TypeError
+
+    def remove_data(
+            self, node_t: _typing.Optional[str], data_key: str
+    ) -> 'HeterogeneousNodesContainer':
+        return self.delete_data(node_t, data_key)
+
+
+class HeterogeneousNodesContainerImplementation(HeterogeneousNodesContainer):
+    def __init__(self, data: _typing.Optional[_typing.Mapping[str, _typing.Mapping[str, torch.Tensor]]] = ...):
+        self.__nodes_data: _typing.MutableMapping[str, _typing.MutableMapping[str, torch.Tensor]] = {}
+        if data not in (None, Ellipsis) and isinstance(data, _typing.Mapping):
+            for node_t, nodes_data in data.items():
+                self.reset_nodes(node_t, nodes_data)
+
+    @property
+    def node_types(self) -> _typing.AbstractSet[str]:
+        return self.__nodes_data.keys()
+
+    def remove_nodes(self, node_t: _typing.Optional[str]) -> HeterogeneousNodesContainer:
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif node_t in (Ellipsis, None):
+            if len(self.node_types) == 0:
+                return self
+            elif len(self.node_types) == 1:
+                del self.__nodes_data[tuple(self.node_types)[0]]
+            else:
+                _error_message: str = ' '.join((
+                    "Unable to determine node type automatically,",
+                    "possible cause is that the graph contains heterogeneous nodes,",
+                    "node type must be specified for graph containing heterogeneous nodes."
+                ))
+                raise TypeError(_error_message)
+        elif isinstance(node_t, str):
+            try:
+                del self.__nodes_data[node_t]
+            except Exception:
+                raise ValueError(f"nodes with type [{node_t}] NOT exists")
+        return self
+
+    def reset_nodes(
+            self, node_t: _typing.Optional[str],
+            nodes_data: _typing.Mapping[str, torch.Tensor]
+    ) -> HeterogeneousNodesContainer:
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif node_t in (Ellipsis, None) and len(self.node_types) > 1:
+            _error_message: str = ' '.join((
+                "Unable to determine node type automatically,",
+                "possible cause is that the graph contains heterogeneous nodes,",
+                "node type must be specified for graph containing heterogeneous nodes."
+            ))
+            raise TypeError(_error_message)
+        elif isinstance(node_t, str) and ' ' in node_t:
+            raise ValueError("node type must NOT contain space character (\' \').")
+        __node_t: str = "" if node_t is Ellipsis else node_t
+
+        num_nodes: int = ...
+        for data_key, data_item in nodes_data.items():
+            if not isinstance(data_key, str):
+                raise TypeError
+            if ' ' in data_key:
+                raise ValueError("data key must NOT contain space character (\' \').")
+            if not isinstance(data_item, torch.Tensor):
+                raise TypeError
+            if not data_item.dim() > 0:
+                raise ValueError(
+                    "data item MUST have at least one dimension, "
+                    "and the first dimension corresponds to data for diverse nodes."
+                )
+            if not isinstance(num_nodes, int):
+                num_nodes: int = data_item.size(0)
+            if data_item.size(0) != num_nodes:
+                raise ValueError
+            self.__nodes_data[__node_t] = dict(nodes_data)
+        return self
+
+    def set_data(
+            self, node_t: _typing.Optional[str], data_key: str, data: torch.Tensor
+    ) -> HeterogeneousNodesContainer:
+        if node_t in (Ellipsis, None):
+            if len(self.node_types) == 0:
+                __node_t: str = ""  # Default node type for homogeneous graph
+            elif len(self.node_types) == 1:
+                __node_t: str = list(self.node_types)[0]
+            else:
+                _error_message: str = ' '.join((
+                    "Unable to determine node type automatically,",
+                    "possible cause is that the graph contains heterogeneous nodes,",
+                    "node type must be specified for graph containing heterogeneous nodes."
+                ))
+                raise TypeError(_error_message)
+        elif isinstance(node_t, str):
+            __node_t: str = node_t
+        else:
+            raise TypeError
+        if not isinstance(data_key, str):
+            raise TypeError
+        if not isinstance(data, torch.Tensor):
+            raise TypeError
+        if ' ' in __node_t:
+            raise ValueError
+        if ' ' in data_key:
+            raise ValueError
+        if not data.dim() > 0:
+            raise ValueError(
+                "data item MUST have at least one dimension, "
+                "and the first dimension corresponds to data for diverse nodes."
+            )
+        if __node_t not in self.node_types:
+            self.__nodes_data[__node_t] = dict([(data_key, data)])
+        else:
+            obsolete_data: _typing.Optional[torch.Tensor] = self.__nodes_data[__node_t].get(data_key)
+            if obsolete_data is not None and isinstance(obsolete_data, torch.Tensor):
+                if data.size(0) != obsolete_data.size(0):
+                    raise ValueError
+            elif len(self.__nodes_data.get(__node_t)) > 0:
+                num_nodes: int = self.__nodes_data.get(__node_t).get(list(self.node_types)[0]).size(0)
+                if data.size(0) != num_nodes:
+                    raise ValueError
+            self.__nodes_data[__node_t][data_key] = data
+        return self
+
+    def __get_data_for_specific_node_type(
+            self, node_t: str, data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        if not isinstance(node_t, str):
+            raise TypeError
+        elif ' ' in node_t:
+            raise ValueError
+        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
+            raise TypeError
+        elif isinstance(data_key, str) and ' ' in data_key:
+            raise ValueError
+        if node_t not in self.node_types:
+            raise ValueError("Node type NOT exists")
+        elif isinstance(data_key, str):
+            data: _typing.Optional[torch.Tensor] = self.__nodes_data[node_t].get(data_key)
+            if data is not None:
+                return data
+            else:
+                raise KeyError(
+                    f"Data with key [{data_key}] NOT exists "
+                    f"for nodes with specific type [{node_t}]"
+                )
+        else:
+            return self.__nodes_data[node_t]
+
+    def __get_data_for_specific_data_key(
+            self, data_key: str, node_t: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif isinstance(node_t, str) and ' ' in node_t:
+            raise ValueError
+        if isinstance(node_t, str):
+            if node_t not in self.node_types:
+                raise ValueError("Node type NOT exists")
+            else:
+                data: _typing.Optional[torch.Tensor] = (
+                    self.__nodes_data[node_t].get(data_key)
+                )
+                if data is not None:
+                    return data
+                else:
+                    raise KeyError(
+                        f"Data with key [{data_key}] NOT exists "
+                        f"for nodes with specific type [{node_t}]"
+                    )
+        else:
+            if len(self.node_types) == 0:
+                raise RuntimeError("Unable to get data from empty graph")
+            elif len(self.node_types) == 1:
+                __node_t: str = tuple(self.node_types)[0]
+                __optional_data: _typing.Optional[torch.Tensor] = (
+                    self.__nodes_data[__node_t].get(data_key)
+                )
+                if __optional_data is not None:
+                    return __optional_data
+                else:
+                    raise KeyError(f"Data with key [{data_key}] NOT exists")
+            else:
+                __result: _typing.Dict[str, torch.Tensor] = {}
+                for __node_t, __nodes_data in self.__nodes_data.items():
+                    __optional_data: _typing.Optional[torch.Tensor] = (
+                        __nodes_data.get(data_key)
+                    )
+                    if (
+                            __optional_data is not None and
+                            isinstance(__optional_data, torch.Tensor)
+                    ):
+                        __result[__node_t] = __optional_data
+                if len(__result):
+                    return __result
+                else:
+                    raise KeyError(f"Data with key [{data_key}] NOT exists")
+
+    def get_data(
+            self, node_t: _typing.Optional[str] = ...,
+            data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif isinstance(node_t, str) and ' ' in node_t:
+            raise ValueError
+        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
+            raise TypeError
+        elif isinstance(data_key, str) and ' ' in data_key:
+            raise ValueError
+        if isinstance(node_t, str):
+            return self.__get_data_for_specific_node_type(node_t, data_key)
+        elif node_t in (Ellipsis, None) and isinstance(data_key, str):
+            return self.__get_data_for_specific_data_key(data_key)
+        elif node_t in (Ellipsis, None) and data_key in (Ellipsis, None):
+            if len(self.node_types) == 1:
+                __node_t: str = tuple(self.node_types)[0]
+                return self.__get_data_for_specific_node_type(__node_t)
+            else:
+                raise TypeError(
+                    "Unable to determine node type automatically, "
+                    "possible cause is that the graph contains heterogeneous nodes or is empty, "
+                    "node type must be specified for graph containing heterogeneous nodes."
+                )
+
+    def delete_data(
+            self, node_t: _typing.Optional[str], data_key: str
+    ) -> HeterogeneousNodesContainer:
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif node_t in (Ellipsis, None):
+            if len(self.node_types) == 1:
+                __node_t: str = tuple(self.node_types)[0]
+            else:
+                raise TypeError(
+                    "Unable to determine node type automatically, "
+                    "possible cause is that the graph contains heterogeneous nodes or is empty, "
+                    "node type must be specified for graph containing heterogeneous nodes."
+                )
+        elif isinstance(node_t, str):
+            if node_t in self.node_types:
+                __node_t: str = node_t
+            else:
+                raise ValueError("node type NOT exists")
+        else:
+            raise TypeError
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif data_key not in self.__nodes_data.get(__node_t):
+            raise KeyError(
+                f"Data with key [{data_key}] NOT exists for nodes with type [{__node_t}]"
+            )
+        else:
+            self.__nodes_data[__node_t].__delitem__(data_key)
+            if len(self.__nodes_data.get(__node_t)) == 0:
+                del self.__nodes_data[__node_t]
+        return self
+
+
+class _SpecificTypedNodeDataView(_abstract_views.SpecificTypedNodeDataView):
+    def __init__(
+            self, heterogeneous_nodes_container: HeterogeneousNodesContainer,
+            node_type: _typing.Optional[str]
+    ):
+        if not isinstance(heterogeneous_nodes_container, HeterogeneousNodesContainer):
+            raise TypeError
+        else:
+            self._heterogeneous_nodes_container: HeterogeneousNodesContainer = (
+                heterogeneous_nodes_container
+            )
+        if not (isinstance(node_type, str) or node_type in (Ellipsis, None)):
+            raise TypeError
+        elif isinstance(node_type, str):
+            if node_type not in self._heterogeneous_nodes_container.node_types:
+                raise ValueError("Invalid node type")
+        self.__node_t: _typing.Optional[str] = node_type
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        return self._heterogeneous_nodes_container.get_data(self.__node_t, data_key)
+
+    def __setitem__(self, data_key: str, value: torch.Tensor):
+        self._heterogeneous_nodes_container.set_data(self.__node_t, data_key, value)
+
+    def __delitem__(self, data_key: str) -> None:
+        self._heterogeneous_nodes_container.delete_data(self.__node_t, data_key)
+
+    def __len__(self) -> int:
+        return len(self._heterogeneous_nodes_container.get_data(self.__node_t))
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self._heterogeneous_nodes_container.get_data(self.__node_t))
+
+
+class _SpecificTypedNodeView(_abstract_views.SpecificTypedNodeView):
+    def __init__(
+            self, nodes_container: HeterogeneousNodesContainer,
+            node_t: _typing.Optional[str]
+    ):
+        self._heterogeneous_nodes_container: HeterogeneousNodesContainer = nodes_container
+        self.__node_t: _typing.Optional[str] = node_t
+
+    @property
+    def data(self) -> _SpecificTypedNodeDataView:
+        return _SpecificTypedNodeDataView(self._heterogeneous_nodes_container, self.__node_t)
+
+    @data.setter
+    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
+        self._heterogeneous_nodes_container.reset_nodes(self.__node_t, nodes_data)
+
+
+class _HeterogeneousNodeView(_abstract_views.HeterogeneousNodeView):
+    def __init__(self, nodes_container: HeterogeneousNodesContainer):
+        self._heterogeneous_nodes_container: HeterogeneousNodesContainer = nodes_container
+
+    def __getitem__(self, node_type: _typing.Optional[str]) -> _SpecificTypedNodeView:
+        return _SpecificTypedNodeView(self._heterogeneous_nodes_container, node_type)
+
+    def __setitem__(
+            self, node_t: _typing.Optional[str],
+            nodes_data: _typing.Mapping[str, torch.Tensor]
+    ) -> None:
+        self._heterogeneous_nodes_container.reset_nodes(node_t, nodes_data)
+
+    def __delitem__(self, node_t: _typing.Optional[str]):
+        self._heterogeneous_nodes_container.remove_nodes(node_t)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self._heterogeneous_nodes_container.node_types)
+
+    @property
+    def data(self) -> _SpecificTypedNodeDataView:
+        return _SpecificTypedNodeDataView(self._heterogeneous_nodes_container, ...)
+
+    @data.setter
+    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
+        self._heterogeneous_nodes_container.reset_nodes(..., nodes_data)
+
+    @property
+    def is_homogeneous(self) -> bool:
+        return len(self._heterogeneous_nodes_container.node_types) <= 1
+
+
+class HomogeneousEdgesContainer:
+    @property
+    def connections(self) -> torch.Tensor:
+        raise NotImplementedError
+
+    @property
+    def data_keys(self) -> _typing.Iterable[str]:
+        raise NotImplementedError
+
+    def get_data(
+            self, data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        raise NotImplementedError
+
+    def set_data(self, data_key: str, data: torch.Tensor):
+        raise NotImplementedError
+
+    def delete_data(self, data_key: str):
+        raise NotImplementedError
+
+
+class HomogeneousEdgesContainerImplementation(HomogeneousEdgesContainer):
+    def __init__(
+            self, edge_connections: torch.Tensor,
+            data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        if not isinstance(edge_connections, torch.Tensor):
+            raise TypeError
+        if not (data in (Ellipsis, None) or isinstance(data, _typing.Mapping)):
+            raise TypeError
+        if not (
+                edge_connections.dtype == torch.int64 and
+                edge_connections.dim() == edge_connections.size(0) == 2
+        ):
+            raise ValueError
+        self.__connections: torch.Tensor = edge_connections
+        if not isinstance(data, _typing.Mapping):
+            self.__data: _typing.MutableMapping[str, torch.Tensor] = {}
+        else:
+            for data_key, data_item in data.items():
+                if not isinstance(data_key, str):
+                    raise TypeError
+                if not isinstance(data_item, torch.Tensor):
+                    raise TypeError
+                if ' ' in data_key:
+                    raise ValueError
+                if not data_item.dim() > 0:
+                    raise ValueError
+                if data_item.size(0) != self.__connections.size(1):
+                    raise ValueError
+            self.__data: _typing.MutableMapping[str, torch.Tensor] = dict(data)
+
+    @property
+    def connections(self) -> torch.Tensor:
+        return self.__connections
+
+    @property
+    def data_keys(self) -> _typing.Iterable[str]:
+        return self.__data.keys()
+
+    def set_data(self, data_key: str, data: torch.Tensor) -> HomogeneousEdgesContainer:
+        if not isinstance(data_key, str):
+            raise TypeError
+        if not isinstance(data, torch.Tensor):
+            raise TypeError
+        if ' ' in data_key:
+            raise ValueError
+        if data.dim() == 0 or data.size(0) != self.__connections.size(1):
+            raise ValueError
+        self.__data[data_key] = data
+        return self
+
+    def get_data(
+            self, data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
+            raise TypeError
+        if isinstance(data_key, str):
+            if ' ' in data_key:
+                raise ValueError
+            temp: _typing.Optional[torch.Tensor] = self.__data.get(data_key)
+            if temp is None:
+                raise KeyError(f"Data with key [{data_key}] NOT exists")
+            else:
+                return temp
+        else:
+            return dict(self.__data)
+
+    def delete_data(self, data_key: str) -> HomogeneousEdgesContainer:
+        if not isinstance(data_key, str):
+            raise TypeError
+        if ' ' in data_key:
+            raise ValueError
+        try:
+            del self.__data[data_key]
+        finally:
+            return self
+
+
+class HeterogeneousEdgesAggregation(
+    _typing.MutableMapping[
+        _typing.Union[str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
+        HomogeneousEdgesContainer
+    ]
+):
+    def __setitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
+            edges: _typing.Union[HomogeneousEdgesContainer, torch.LongTensor]
+    ) -> None:
+        self._set_edges(edge_t, edges)
+
+    def __delitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]
+    ) -> None:
+        self._delete_edges(edge_t)
+
+    def __getitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType] = ...
+    ) -> HomogeneousEdgesContainer:
+        return self._get_edges(edge_t)
+
+    def __len__(self) -> int:
+        return len(list(self._edge_types))
+
+    def __iter__(self) -> _typing.Iterator[_canonical_edge_type.CanonicalEdgeType]:
+        return iter(self._edge_types)
+
+    @property
+    def _edge_types(self) -> _typing.Iterable[_canonical_edge_type.CanonicalEdgeType]:
+        raise NotImplementedError
+
+    def _get_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType] = ...
+    ) -> HomogeneousEdgesContainer:
+        raise NotImplementedError
+
+    def _set_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
+            edges: _typing.Union[HomogeneousEdgesContainer, torch.LongTensor]
+    ):
+        raise NotImplementedError
+
+    def _delete_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]
+    ) -> None:
+        raise NotImplementedError
+
+
+class HeterogeneousEdgesAggregationImplementation(HeterogeneousEdgesAggregation):
+    def __init__(self):
+        self.__heterogeneous_edges_data_frame: pd.DataFrame = pd.DataFrame(
+            columns=('s', 'r', 't', 'edges'),
+        )
+
+    @property
+    def _edge_types(self) -> _typing.Iterable[_canonical_edge_type.CanonicalEdgeType]:
+        return [
+            _canonical_edge_type.CanonicalEdgeType(getattr(row_tuple, 's'), getattr(row_tuple, 'r'), getattr(row_tuple, 't'))
+            for row_tuple in self.__heterogeneous_edges_data_frame.itertuples(False, name="Edge")
+        ]
+
+    def _get_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType] = ...
+    ) -> HomogeneousEdgesContainer:
+        if edge_t in (Ellipsis, None):
+            if len(self.__heterogeneous_edges_data_frame) == 1:
+                return self.__heterogeneous_edges_data_frame.iloc[0]['edges']
+            else:
+                raise RuntimeError  # Undetermined
+        elif isinstance(edge_t, str):
+            if ' ' in edge_t:
+                raise ValueError
+            if len(
+                    self.__heterogeneous_edges_data_frame.loc[
+                        self.__heterogeneous_edges_data_frame['r'] == edge_t
+                    ]
+            ) != 1:
+                raise ValueError  # todo: Unable to determine
+            else:
+                temp: HomogeneousEdgesContainer = self.__heterogeneous_edges_data_frame.loc[
+                    self.__heterogeneous_edges_data_frame['r'] == edge_t, 'edges'
+                ]
+                if not isinstance(temp, HomogeneousEdgesContainer):
+                    raise RuntimeError
+                else:
+                    return temp
+        elif isinstance(edge_t, _typing.Tuple) or isinstance(edge_t, _canonical_edge_type.CanonicalEdgeType):
+            if isinstance(edge_t, _typing.Tuple) and not (
+                    len(edge_t) == 3 and
+                    isinstance(edge_t[0], str) and
+                    isinstance(edge_t[1], str) and
+                    isinstance(edge_t[2], str) and
+                    ' ' not in edge_t[0] and ' ' not in edge_t[1] and ' ' not in edge_t[2]
+            ):
+                raise TypeError("Illegal canonical edge type")
+            __edge_t: _typing.Tuple[str, str, str] = (
+                (edge_t.source_node_type, edge_t.relation_type, edge_t.target_node_type)
+                if isinstance(edge_t, _canonical_edge_type.CanonicalEdgeType) else edge_t
+            )
+            partial_data_frame: pd.DataFrame = self.__heterogeneous_edges_data_frame.loc[
+                (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
+                (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
+                (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
+                ]
+            if len(partial_data_frame) == 0:
+                raise ValueError
+            elif len(partial_data_frame) == 1:
+                temp: HomogeneousEdgesContainer = partial_data_frame.iloc[0]['edges']
+                if not isinstance(temp, HomogeneousEdgesContainer):
+                    raise RuntimeError
+                else:
+                    return temp
+            else:
+                raise RuntimeError
+
+    def _set_edges(
+            self,
+            edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
+            edges: _typing.Union[HomogeneousEdgesContainer, torch.LongTensor]
+    ):
+        if not (isinstance(edges, HomogeneousEdgesContainer) or isinstance(edges, torch.Tensor)):
+            raise TypeError
+        if edge_t in (Ellipsis, None):
+            if len(self.__heterogeneous_edges_data_frame) == 0:
+                self.__heterogeneous_edges_data_frame: pd.DataFrame = (
+                    self.__heterogeneous_edges_data_frame.append(
+                        pd.DataFrame(
+                            {
+                                's': [''], 'r': [''], 't': [''],
+                                'edges': [
+                                    edges if isinstance(edges, HomogeneousEdgesContainer)
+                                    else HomogeneousEdgesContainerImplementation(edges)
+                                ]
+                            }
+                        )
+                    )
+                )
+            elif len(self.__heterogeneous_edges_data_frame) == 1:
+                self.__heterogeneous_edges_data_frame.iloc[0]['edges'] = (
+                    edges if isinstance(edges, HomogeneousEdgesContainer)
+                    else HomogeneousEdgesContainerImplementation(edges)
+                )
+            else:
+                raise RuntimeError  # todo: Unable to determine error
+        elif isinstance(edge_t, str):
+            if ' ' in edge_t:
+                raise ValueError
+            if len(
+                    self.__heterogeneous_edges_data_frame.loc[
+                        self.__heterogeneous_edges_data_frame['r'] == edge_t
+                    ]
+            ) == 1:
+                self.__heterogeneous_edges_data_frame.loc[
+                    self.__heterogeneous_edges_data_frame['r'] == edge_t, 'edges'
+                ] = (
+                    edges if isinstance(edges, HomogeneousEdgesContainer)
+                    else HomogeneousEdgesContainerImplementation(edges)
+                )
+            else:
+                raise RuntimeError
+        elif isinstance(edge_t, _typing.Tuple) or isinstance(edge_t, _canonical_edge_type.CanonicalEdgeType):
+            if isinstance(edge_t, _typing.Tuple) and not (
+                    len(edge_t) == 3 and
+                    isinstance(edge_t[0], str) and
+                    isinstance(edge_t[1], str) and
+                    isinstance(edge_t[2], str) and
+                    ' ' not in edge_t[0] and ' ' not in edge_t[1] and ' ' not in edge_t[2]
+            ):
+                raise TypeError("Illegal canonical edge type")
+            __edge_t: _typing.Tuple[str, str, str] = (
+                (edge_t.source_node_type, edge_t.relation_type, edge_t.target_node_type)
+                if isinstance(edge_t, _canonical_edge_type.CanonicalEdgeType) else edge_t
+            )
+            if len(
+                    self.__heterogeneous_edges_data_frame.loc[
+                        (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
+                        (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
+                        (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
+                    ]
+            ) == 0:
+                self.__heterogeneous_edges_data_frame: pd.DataFrame = (
+                    self.__heterogeneous_edges_data_frame.append(
+                        pd.DataFrame(
+                            {
+                                's': [__edge_t[0]],
+                                'r': [__edge_t[1]],
+                                't': [__edge_t[2]],
+                                'edges': [
+                                    edges if isinstance(edges, HomogeneousEdgesContainer)
+                                    else HomogeneousEdgesContainerImplementation(edges)
+                                ]
+                            }
+                        )
+                    )
+                )
+            elif len(
+                    self.__heterogeneous_edges_data_frame.loc[
+                        (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
+                        (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
+                        (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
+                    ]
+            ) == 1:
+                self.__heterogeneous_edges_data_frame.loc[
+                    (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
+                    (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
+                    (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2]),
+                    'edges'
+                ] = (
+                    edges if isinstance(edges, HomogeneousEdgesContainer)
+                    else HomogeneousEdgesContainerImplementation(edges)
+                )
+            else:
+                raise RuntimeError  # todo: Unable to determine error
+        else:
+            raise RuntimeError
+
+    def _delete_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType] = ...
+    ) -> None:
+        if edge_t in (Ellipsis, None):
+            if len(self.__heterogeneous_edges_data_frame) == 1:
+                self.__heterogeneous_edges_data_frame.drop(
+                    self.__heterogeneous_edges_data_frame.index[0], inplace=True
+                )
+            elif len(self.__heterogeneous_edges_data_frame) > 1:
+                raise ValueError("Edge Type must be specified for graph containing heterogeneous edges")
+        raise NotImplementedError  # todo: Complete this function
+
+
+class _HomogeneousEdgesDataView(_abstract_views.HomogeneousEdgesDataView):
+    def __init__(self, homogeneous_edges_container: HomogeneousEdgesContainer):
+        if not isinstance(homogeneous_edges_container, HomogeneousEdgesContainer):
+            raise TypeError
+        self._homogeneous_edges_container: HomogeneousEdgesContainer = homogeneous_edges_container
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        if not isinstance(data_key, str):
+            raise TypeError
+        if ' ' in data_key:
+            raise ValueError
+        return self._homogeneous_edges_container.get_data(data_key)
+
+    def __setitem__(self, data_key: str, data: torch.Tensor):
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError
+        if not isinstance(data, torch.Tensor):
+            raise TypeError
+        elif not data.dim() > 0:
+            raise ValueError
+        self._homogeneous_edges_container.set_data(data_key, data)
+
+    def __delitem__(self, data_key: str):
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError
+        self._homogeneous_edges_container.delete_data(data_key)
+
+    def __len__(self):
+        return len(list(self._homogeneous_edges_container.data_keys))
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self._homogeneous_edges_container.data_keys)
+
+
+class _SpecificTypedHomogeneousEdgesView(_abstract_views.HomogeneousEdgesView):
+    def __init__(self, homogeneous_edges_container: HomogeneousEdgesContainer):
+        if not isinstance(homogeneous_edges_container, HomogeneousEdgesContainer):
+            raise TypeError
+        self._homogeneous_edges_container: HomogeneousEdgesContainer = homogeneous_edges_container
+
+    @property
+    def connections(self) -> torch.Tensor:
+        return self._homogeneous_edges_container.connections
+
+    @property
+    def data(self) -> _HomogeneousEdgesDataView:
+        return _HomogeneousEdgesDataView(self._homogeneous_edges_container)
+
+
+class _HeterogeneousEdgesView(_abstract_views.HeterogeneousEdgesView):
+    def __init__(self, _heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation):
+        if not isinstance(_heterogeneous_edges_aggregation, HeterogeneousEdgesAggregation):
+            raise TypeError
+        self._heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation = (
+            _heterogeneous_edges_aggregation
+        )
+
+    def __getitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]
+    ) -> _SpecificTypedHomogeneousEdgesView:
+        return _SpecificTypedHomogeneousEdgesView(self._heterogeneous_edges_aggregation[edge_t])
+
+    def __setitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
+            edges: _typing.Union[HomogeneousEdgesContainer, torch.LongTensor]
+    ):
+        self._heterogeneous_edges_aggregation[edge_t] = edges
+
+    def __delitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]
+    ):
+        del self._heterogeneous_edges_aggregation[edge_t]
+
+    def __len__(self) -> int:
+        return len(self._heterogeneous_edges_aggregation)
+
+    def __iter__(self) -> _typing.Iterator[_canonical_edge_type.CanonicalEdgeType]:
+        return iter(self._heterogeneous_edges_aggregation)
+
+    def __contains__(self, edge_type: _typing.Union[str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]) -> bool:
+        if isinstance(edge_type, str):
+            if ' ' in edge_type:
+                raise ValueError
+            else:
+                for existing_edge_type in self:
+                    if existing_edge_type.relation_type == edge_type:
+                        return True
+                return False
+        elif isinstance(edge_type, _typing.Tuple):
+            if not (
+                    len(edge_type) == 3 and
+                    all([(isinstance(t, str) and ' ' not in t) for t in edge_type])
+            ):
+                raise TypeError
+            else:
+                for existing_edge_type in self:
+                    if existing_edge_type.__eq__(edge_type):
+                        return True
+                return False
+        elif isinstance(edge_type, _canonical_edge_type.CanonicalEdgeType):
+            for existing_edge_type in self:
+                if existing_edge_type == edge_type:
+                    return True
+            return False
+        else:
+            raise TypeError
+
+    @property
+    def connections(self) -> torch.Tensor:
+        return self[...].connections
+
+    @property
+    def data(self) -> _HomogeneousEdgesDataView:
+        return self[...].data
+
+    @property
+    def is_homogeneous(self) -> bool:
+        return len(self) <= 1
+
+    def set(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str]],
+            connections: torch.LongTensor, data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        self[edge_t] = HomogeneousEdgesContainerImplementation(connections, data)
+
+
+class _StaticGraphDataContainer(_typing.MutableMapping[str, torch.Tensor]):
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        raise NotImplementedError
+
+    def __delitem__(self, data_key: str) -> None:
+        raise NotImplementedError
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        raise NotImplementedError
+
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        raise NotImplementedError
+
+
+class StaticGraphDataAggregation(_StaticGraphDataContainer):
+    def __init__(
+            self, graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        self.__data: _typing.MutableMapping[str, torch.Tensor] = (
+            dict(graph_data) if isinstance(graph_data, _typing.Mapping)
+            else {}
+        )
+
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        self.__data[data_key] = data
+
+    def __delitem__(self, data_key: str) -> None:
+        del self.__data[data_key]
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        return self.__data[data_key]
+
+    def __len__(self) -> int:
+        return len(self.__data)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self.__data)
+
+
+class _StaticGraphDataView(_abstract_views.GraphDataView):
+    def __init__(self, graph_data_container: _StaticGraphDataContainer):
+        self.__graph_data_container: _StaticGraphDataContainer = (
+            graph_data_container
+        )
+
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        self.__graph_data_container[data_key] = data
+
+    def __delitem__(self, data_key: str) -> None:
+        del self.__graph_data_container[data_key]
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        return self.__graph_data_container[data_key]
+
+    def __len__(self) -> int:
+        return len(self.__graph_data_container)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self.__graph_data_container)
+
+
+class GeneralStaticGraphImplementation(_general_static_graph.GeneralStaticGraph):
+    def __init__(
+            self, _heterogeneous_nodes_container: _typing.Optional[HeterogeneousNodesContainer] = ...,
+            _heterogeneous_edges_aggregation: _typing.Optional[HeterogeneousEdgesAggregation] = ...,
+            graph_data_container: _typing.Optional[_StaticGraphDataContainer] = ...
+    ):
+        self._static_graph_data_container: _StaticGraphDataContainer = (
+            graph_data_container
+            if isinstance(graph_data_container, _StaticGraphDataContainer)
+            else StaticGraphDataAggregation()
+        )
+        self._heterogeneous_nodes_container: HeterogeneousNodesContainer = (
+            _heterogeneous_nodes_container
+            if isinstance(_heterogeneous_nodes_container, HeterogeneousNodesContainer)
+            else HeterogeneousNodesContainerImplementation()
+        )
+        self._heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation = (
+            _heterogeneous_edges_aggregation
+            if isinstance(_heterogeneous_edges_aggregation, HeterogeneousEdgesAggregation)
+            else HeterogeneousEdgesAggregationImplementation()
+        )
+
+    @property
+    def nodes(self) -> _HeterogeneousNodeView:
+        return _HeterogeneousNodeView(self._heterogeneous_nodes_container)
+
+    @property
+    def edges(self) -> _HeterogeneousEdgesView:
+        return _HeterogeneousEdgesView(self._heterogeneous_edges_aggregation)
+
+    @property
+    def data(self) -> _StaticGraphDataView:
+        return _StaticGraphDataView(self._static_graph_data_container)
diff --git a/autogl/data/graph/_general_static_graph/_general_static_graph_dgl_implementation.py b/autogl/data/graph/_general_static_graph/_general_static_graph_dgl_implementation.py
new file mode 100644
index 0000000..b9bf413
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph_dgl_implementation.py
@@ -0,0 +1,651 @@
+import dgl
+import torch
+import typing as _typing
+from . import (
+    _abstract_views,
+    _canonical_edge_type,
+    _general_static_graph
+)
+
+
+class _DGLGraphHolder:
+    def __init__(self, dgl_graph: dgl.DGLGraph):
+        if not isinstance(dgl_graph, dgl.DGLGraph):
+            raise TypeError
+        self.__graph: dgl.DGLGraph = dgl_graph
+
+    @property
+    def graph(self) -> dgl.DGLGraph:
+        return self.__graph
+
+    @graph.setter
+    def graph(self, dgl_graph: dgl.DGLGraph):
+        if not isinstance(dgl_graph, dgl.DGLGraph):
+            raise TypeError
+        else:
+            self.__graph = dgl_graph
+
+
+class _SpecificTypedNodeDataView(_abstract_views.SpecificTypedNodeDataView):
+    def __init__(
+            self, dgl_graph_holder: _DGLGraphHolder,
+            node_type: _typing.Optional[str] = ...
+    ):
+        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
+            raise TypeError
+        if not (node_type in (Ellipsis, None) or isinstance(node_type, str)):
+            raise TypeError
+        elif isinstance(node_type, str) and ' ' in node_type:
+            raise ValueError("Illegal node type")
+        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
+        self.__optional_node_type: _typing.Optional[str] = (
+            node_type if isinstance(node_type, str) else None
+        )
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError("Illegal data key")
+        if isinstance(self.__optional_node_type, str):
+            node_type: str = self.__optional_node_type
+        else:
+            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
+                raise ValueError("the graph is empty")
+            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
+                raise ValueError(
+                    "Unable to automatically determine node type, "
+                    "the graph consists of heterogeneous node types"
+                )
+            else:
+                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
+        if data_key in self.__dgl_graph_holder.graph.nodes[node_type].data:
+            return self.__dgl_graph_holder.graph.nodes[node_type].data[data_key]
+        else:
+            raise KeyError  # todo: Complete message
+
+    def __setitem__(self, data_key: str, value: torch.Tensor):
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError("Illegal data key")
+        if not isinstance(value, torch.Tensor):
+            raise TypeError
+        elif value.dim() == 0:
+            raise ValueError
+        if isinstance(self.__optional_node_type, str):
+            node_type: str = self.__optional_node_type
+        else:
+            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
+                raise ValueError("the graph is empty")
+            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
+                raise ValueError(
+                    "Unable to automatically determine node type, "
+                    "the graph consists of heterogeneous node types"
+                )
+            else:
+                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
+        if value.size(0) != self.__dgl_graph_holder.graph.num_nodes(node_type):
+            raise ValueError  # todo: Complete error message
+        else:
+            # todo: 现在这个方法没有处理node_type不存在的情况
+            self.__dgl_graph_holder.graph.nodes[node_type].data[data_key] = value
+
+    def __delitem__(self, data_key: str) -> None:
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError("Illegal data key")
+        if isinstance(self.__optional_node_type, str):
+            node_type: str = self.__optional_node_type
+        else:
+            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
+                raise ValueError("the graph is empty")
+            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
+                raise ValueError(
+                    "Unable to automatically determine node type, "
+                    "the graph consists of heterogeneous node types"
+                )
+            else:
+                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
+        if data_key in self.__dgl_graph_holder.graph.nodes[node_type].data:
+            try:
+                del self.__dgl_graph_holder.graph.nodes[node_type].data[data_key]
+            except KeyError:
+                pass  # todo: Use logger to warn
+
+    def __len__(self) -> int:
+        if isinstance(self.__optional_node_type, str):
+            node_type: str = self.__optional_node_type
+        else:
+            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
+                raise ValueError("the graph is empty")
+            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
+                raise ValueError(
+                    "Unable to automatically determine node type, "
+                    "the graph consists of heterogeneous node types"
+                )
+            else:
+                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
+        return len(self.__dgl_graph_holder.graph.nodes[node_type].data)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        if isinstance(self.__optional_node_type, str):
+            node_type: str = self.__optional_node_type
+        else:
+            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
+                raise ValueError("the graph is empty")
+            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
+                raise ValueError(
+                    "Unable to automatically determine node type, "
+                    "the graph consists of heterogeneous node types"
+                )
+            else:
+                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
+        return iter(self.__dgl_graph_holder.graph.nodes[node_type].data)
+
+
+class _SpecificTypedNodeView(_abstract_views.SpecificTypedNodeView):
+    def __init__(
+            self, dgl_graph_holder: _DGLGraphHolder,
+            node_type: _typing.Optional[str] = ...
+    ):
+        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
+            raise TypeError
+        if not (node_type in (Ellipsis, None) or isinstance(node_type, str)):
+            raise TypeError
+        elif isinstance(node_type, str) and ' ' in node_type:
+            raise ValueError("Illegal node type")
+        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
+        self.__optional_node_type: _typing.Optional[str] = (
+            node_type if isinstance(node_type, str) else None
+        )
+
+    @property
+    def data(self) -> _SpecificTypedNodeDataView:
+        return _SpecificTypedNodeDataView(
+            self.__dgl_graph_holder, self.__optional_node_type
+        )
+
+    @data.setter
+    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
+        raise NotImplementedError  # todo: Currently, DGL not support this operation
+
+
+class _HeterogeneousNodeView(_abstract_views.HeterogeneousNodeView):
+    def __init__(self, dgl_graph_holder: _DGLGraphHolder):
+        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
+            raise TypeError
+        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
+
+    @property
+    def data(self) -> _SpecificTypedNodeDataView:
+        return _SpecificTypedNodeDataView(self.__dgl_graph_holder, ...)
+
+    @data.setter
+    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
+        if not isinstance(nodes_data, _typing.Mapping):
+            raise TypeError
+        _SpecificTypedNodeView(self.__dgl_graph_holder, ...).data = nodes_data
+
+    def __getitem__(self, node_type: _typing.Optional[str]) -> _SpecificTypedNodeView:
+        if not (node_type in (Ellipsis, None) or isinstance(node_type, str)):
+            raise TypeError
+        elif isinstance(node_type, str) and ' ' in node_type:
+            raise ValueError("Illegal edge type")
+        return _SpecificTypedNodeView(self.__dgl_graph_holder, node_type)
+
+    def __setitem__(
+            self, node_type: _typing.Optional[str],
+            nodes_data: _typing.Mapping[str, torch.Tensor]
+    ):
+        if not (node_type in (Ellipsis, None) or isinstance(node_type, str)):
+            raise TypeError
+        elif isinstance(node_type, str) and ' ' in node_type:
+            raise ValueError("Illegal edge type")
+        if not isinstance(nodes_data, _typing.Mapping):
+            raise TypeError
+        _SpecificTypedNodeView(
+            self.__dgl_graph_holder, node_type if isinstance(node_type, str) else None
+        ).data = nodes_data
+
+    def __delitem__(self, node_t: _typing.Optional[str]):
+        raise NotImplementedError  # todo: Currently, DGL not support this operation
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self.__dgl_graph_holder.graph.ntypes)
+
+    @property
+    def is_homogeneous(self) -> bool:
+        return len(self.__dgl_graph_holder.graph.ntypes) <= 1
+
+
+class _HomogeneousEdgesDataView(_abstract_views.HomogeneousEdgesDataView):
+    def __init__(
+            self, dgl_graph_holder: _DGLGraphHolder,
+            edge_type: _typing.Union[
+                None, str, _typing.Tuple[str, str, str],
+                _canonical_edge_type.CanonicalEdgeType
+            ] = ...
+    ):
+        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
+            raise TypeError
+        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
+        if edge_type in (Ellipsis, None):
+            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = None
+        elif isinstance(edge_type, str):
+            if ' ' in edge_type:
+                raise ValueError("Illegal edge type")
+            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = edge_type
+        elif isinstance(edge_type, _typing.Sequence) and not isinstance(edge_type, str):
+            if not (
+                    len(edge_type) == 3 and
+                    isinstance(edge_type[0], str) and ' ' not in edge_type[0] and
+                    isinstance(edge_type[1], str) and ' ' not in edge_type[1] and
+                    isinstance(edge_type[2], str) and ' ' not in edge_type[2]
+            ):
+                raise ValueError("Illegal edge type")
+            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = tuple(edge_type)
+        elif isinstance(edge_type, _canonical_edge_type.CanonicalEdgeType):
+            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = (
+                edge_type.source_node_type, edge_type.relation_type, edge_type.target_node_type
+            )
+        else:
+            raise TypeError
+
+    def __get_canonical_edge_type(self) -> _typing.Tuple[str, str, str]:
+        if self.__optional_edge_type in (Ellipsis, None):
+            if len(self.__dgl_graph_holder.graph.canonical_etypes) == 0:
+                raise ValueError("The graph is empty")
+            elif len(self.__dgl_graph_holder.graph.canonical_etypes) > 1:
+                raise ValueError(
+                    "Unable to automatically determine edge type, "
+                    "the graph consists of heterogeneous edge types."
+                )
+            else:
+                return self.__dgl_graph_holder.graph.canonical_etypes[0]
+        elif isinstance(self.__optional_edge_type, str):
+            try:
+                canonical_edge_type = self.__dgl_graph_holder.graph.to_canonical_etype(
+                    self.__optional_edge_type
+                )
+            except dgl.DGLError as e:
+                raise e
+            else:
+                return canonical_edge_type
+        else:
+            return self.__optional_edge_type
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError("Illegal data key")
+        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()
+
+        found = False
+        for et in self.__dgl_graph_holder.graph.canonical_etypes:
+            if all([a == b for a, b in zip(et, edge_type)]):
+                found = True
+                break
+        if not found:
+            raise ValueError("edge type not exist")
+
+        if data_key in self.__dgl_graph_holder.graph.edges[edge_type].data:
+            return self.__dgl_graph_holder.graph.edges[edge_type].data[data_key]
+        else:
+            raise KeyError  # todo: Complete error message
+
+    def __setitem__(self, data_key: str, value: torch.Tensor):
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError("Illegal data key")
+        if not isinstance(value, torch.Tensor):
+            raise TypeError
+        if value.dim() == 0:
+            raise ValueError
+        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()
+
+        found = False
+        for et in self.__dgl_graph_holder.graph.canonical_etypes:
+            if all([a == b for a, b in zip(et, edge_type)]):
+                found = True
+                break
+        if not found:
+            raise ValueError("edge type not exist")
+
+        self.__dgl_graph_holder.graph.edges[edge_type].data[data_key] = value
+
+    def __delitem__(self, data_key: str):
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError("Illegal data key")
+        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()
+
+        found = False
+        for et in self.__dgl_graph_holder.graph.canonical_etypes:
+            if all([a == b for a, b in zip(et, edge_type)]):
+                found = True
+                break
+        if not found:
+            raise ValueError("edge type not exist")
+
+        if data_key in self.__dgl_graph_holder.graph.edges[edge_type].data:
+            del self.__dgl_graph_holder.graph.edges[edge_type].data[data_key]
+        else:
+            raise KeyError  # todo: Complete error message
+
+    def __len__(self) -> int:
+        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()
+
+        found = False
+        for et in self.__dgl_graph_holder.graph.canonical_etypes:
+            if all([a == b for a, b in zip(et, edge_type)]):
+                found = True
+                break
+        if not found:
+            raise ValueError("edge type not exist")
+
+        return len(self.__dgl_graph_holder.graph.edges[edge_type].data)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()
+
+        found = False
+        for et in self.__dgl_graph_holder.graph.canonical_etypes:
+            if all([a == b for a, b in zip(et, edge_type)]):
+                found = True
+                break
+        if not found:
+            raise ValueError("edge type not exist")
+
+        return iter(self.__dgl_graph_holder.graph.edges[edge_type].data)
+
+
+class _HomogeneousEdgesView(_abstract_views.HomogeneousEdgesView):
+    def __init__(
+            self, dgl_graph_holder: _DGLGraphHolder,
+            edge_type: _typing.Union[
+                None, str, _typing.Tuple[str, str, str],
+                _canonical_edge_type.CanonicalEdgeType
+            ] = ...
+    ):
+        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
+            raise TypeError
+        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
+        if edge_type in (Ellipsis, None):
+            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = None
+        elif isinstance(edge_type, str):
+            if ' ' in edge_type:
+                raise ValueError("Illegal edge type")
+            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = edge_type
+        elif isinstance(edge_type, _typing.Sequence) and not isinstance(edge_type, str):
+            if not (
+                    len(edge_type) == 3 and
+                    isinstance(edge_type[0], str) and ' ' not in edge_type[0] and
+                    isinstance(edge_type[1], str) and ' ' not in edge_type[1] and
+                    isinstance(edge_type[2], str) and ' ' not in edge_type[2]
+            ):
+                raise ValueError("Illegal edge type")
+            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = tuple(edge_type)
+        elif isinstance(edge_type, _canonical_edge_type.CanonicalEdgeType):
+            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = (
+                edge_type.source_node_type, edge_type.relation_type, edge_type.target_node_type
+            )
+        else:
+            raise TypeError
+
+    def __get_canonical_edge_type(self) -> _typing.Tuple[str, str, str]:
+        if self.__optional_edge_type in (Ellipsis, None):
+            if len(self.__dgl_graph_holder.graph.canonical_etypes) == 0:
+                raise ValueError("The graph is empty")
+            elif len(self.__dgl_graph_holder.graph.canonical_etypes) > 1:
+                raise ValueError(
+                    "Unable to automatically determine edge type, "
+                    "the graph consists of heterogeneous edge types."
+                )
+            else:
+                return self.__dgl_graph_holder.graph.canonical_etypes[0]
+        elif isinstance(self.__optional_edge_type, str):
+            try:
+                canonical_edge_type = self.__dgl_graph_holder.graph.to_canonical_etype(
+                    self.__optional_edge_type
+                )
+            except dgl.DGLError as e:
+                raise e
+            else:
+                return canonical_edge_type
+        else:
+            return self.__optional_edge_type
+
+    @property
+    def connections(self) -> torch.Tensor:
+        return torch.vstack(
+            self.__dgl_graph_holder.graph.edges(etype=self.__get_canonical_edge_type())
+        )
+
+    @property
+    def data(self) -> _HomogeneousEdgesDataView:
+        return _HomogeneousEdgesDataView(self.__dgl_graph_holder, self.__optional_edge_type)
+
+
+class _HeterogeneousEdgesView(_abstract_views.HeterogeneousEdgesView):
+    def __init__(self, dgl_graph_holder: _DGLGraphHolder):
+        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
+            raise TypeError
+        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
+        self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = None
+
+    def __get_canonical_edge_type(self) -> _typing.Tuple[str, str, str]:
+        if self.__optional_edge_type in (Ellipsis, None):
+            if len(self.__dgl_graph_holder.graph.canonical_etypes) == 0:
+                raise ValueError("The graph is empty")
+            elif len(self.__dgl_graph_holder.graph.canonical_etypes) > 1:
+                raise ValueError(
+                    "Unable to automatically determine edge type, "
+                    "the graph consists of heterogeneous edge types."
+                )
+            else:
+                return self.__dgl_graph_holder.graph.canonical_etypes[0]
+        elif isinstance(self.__optional_edge_type, str):
+            try:
+                canonical_edge_type = self.__dgl_graph_holder.graph.to_canonical_etype(
+                    self.__optional_edge_type
+                )
+            except dgl.DGLError as e:
+                raise e
+            else:
+                return canonical_edge_type
+        else:
+            return self.__optional_edge_type
+
+    @property
+    def connections(self) -> torch.Tensor:
+        return _HomogeneousEdgesView(self.__dgl_graph_holder, ...).connections
+
+    @property
+    def data(self) -> _HomogeneousEdgesDataView:
+        return _HomogeneousEdgesView(self.__dgl_graph_holder, ...).data
+
+    @property
+    def is_homogeneous(self) -> bool:
+        return len(self.__dgl_graph_holder.graph.canonical_etypes) <= 1
+
+    def set(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str]],
+            connections: torch.LongTensor,
+            data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        raise NotImplementedError  # todo: Complete this function or this error message
+
+    def __getitem__(
+            self,
+            edge_t: _typing.Union[
+                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
+            ]
+    ) -> _HomogeneousEdgesView:
+        return _HomogeneousEdgesView(self.__dgl_graph_holder, edge_t)
+
+    def __setitem__(
+            self,
+            edge_t: _typing.Union[
+                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
+            ],
+            edges: _typing.Union[torch.LongTensor]
+    ):
+        raise NotImplementedError  # todo: Complete this function or this error message
+
+    def __delitem__(
+            self,
+            edge_t: _typing.Union[
+                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
+            ]
+    ):
+        raise NotImplementedError  # todo: Complete this function or this error message
+
+    def __len__(self) -> int:
+        return len(self.__dgl_graph_holder.graph.canonical_etypes)
+
+    def __iter__(self) -> _typing.Iterator[_canonical_edge_type.CanonicalEdgeType]:
+        return iter([
+            _canonical_edge_type.CanonicalEdgeType(et[0], et[1], et[2])
+            for et in self.__dgl_graph_holder.graph.canonical_etypes
+        ])
+
+    def __contains__(
+            self,
+            edge_type: _typing.Union[
+                str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
+            ]
+    ) -> bool:
+        # raise NotImplementedError
+        if isinstance(edge_type, str):
+            if ' ' in edge_type:
+                raise ValueError("Illegal edge type")
+            else:
+                return edge_type in self.__dgl_graph_holder.graph.etypes
+        elif isinstance(edge_type, _typing.Sequence) and not isinstance(edge_type, str):
+            if not (
+                    len(edge_type) == 3 and
+                    isinstance(edge_type[0], str) and ' ' not in edge_type[0] and
+                    isinstance(edge_type[1], str) and ' ' not in edge_type[1] and
+                    isinstance(edge_type[2], str) and ' ' not in edge_type[2]
+            ):
+                raise ValueError("Illegal edge type")
+            found = False
+            for et in self.__dgl_graph_holder.graph.canonical_etypes:
+                if all([a == b for a, b in zip(et, edge_type)]):
+                    found = True
+                    break
+            return found
+        elif isinstance(edge_type, _canonical_edge_type.CanonicalEdgeType):
+            found = False
+            for et in self.__dgl_graph_holder.graph.canonical_etypes:
+                if (
+                        et[0] == edge_type.source_node_type and
+                        et[1] == edge_type.relation_type and
+                        et[2] == edge_type.target_node_type
+                ):
+                    found = True
+                    break
+            return found
+        else:
+            raise TypeError
+
+
+class _StaticGraphDataContainer(_typing.MutableMapping[str, torch.Tensor]):
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        raise NotImplementedError
+
+    def __delitem__(self, data_key: str) -> None:
+        raise NotImplementedError
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        raise NotImplementedError
+
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        raise NotImplementedError
+
+
+class StaticGraphDataAggregation(_StaticGraphDataContainer):
+    def __init__(
+            self, graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        self.__data: _typing.MutableMapping[str, torch.Tensor] = (
+            dict(graph_data) if isinstance(graph_data, _typing.Mapping)
+            else {}
+        )
+
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        self.__data[data_key] = data
+
+    def __delitem__(self, data_key: str) -> None:
+        del self.__data[data_key]
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        return self.__data[data_key]
+
+    def __len__(self) -> int:
+        return len(self.__data)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self.__data)
+
+
+class _StaticGraphDataView(_abstract_views.GraphDataView):
+    def __init__(self, graph_data_container: _StaticGraphDataContainer):
+        self.__graph_data_container: _StaticGraphDataContainer = (
+            graph_data_container
+        )
+
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        self.__graph_data_container[data_key] = data
+
+    def __delitem__(self, data_key: str) -> None:
+        del self.__graph_data_container[data_key]
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        return self.__graph_data_container[data_key]
+
+    def __len__(self) -> int:
+        return len(self.__graph_data_container)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self.__graph_data_container)
+
+
+class GeneralStaticGraphDGLImplementation(
+    _general_static_graph.GeneralStaticGraph
+):
+    def __init__(
+            self, dgl_graph: dgl.DGLGraph,
+            graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        if not isinstance(dgl_graph, dgl.DGLGraph) and (
+                graph_data in (Ellipsis, None) or
+                isinstance(graph_data, _typing.Mapping)
+        ):
+            raise TypeError
+        self.__dgl_graph_holder: _DGLGraphHolder = _DGLGraphHolder(dgl_graph)
+        self.__graph_data_container: _StaticGraphDataContainer = (
+            StaticGraphDataAggregation(
+                graph_data if isinstance(graph_data, _typing.Mapping) else None
+            )
+        )
+
+    @property
+    def nodes(self) -> _abstract_views.HeterogeneousNodeView:
+        return _HeterogeneousNodeView(self.__dgl_graph_holder)
+
+    @property
+    def edges(self) -> _abstract_views.HeterogeneousEdgesView:
+        return _HeterogeneousEdgesView(self.__dgl_graph_holder)
+
+    @property
+    def data(self) -> _abstract_views.GraphDataView:
+        return _StaticGraphDataView(self.__graph_data_container)
diff --git a/autogl/data/graph/_general_static_graph/_general_static_graph_generator.py b/autogl/data/graph/_general_static_graph/_general_static_graph_generator.py
new file mode 100644
index 0000000..267b23b
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph_generator.py
@@ -0,0 +1,80 @@
+import torch
+import typing as _typing
+from . import _general_static_graph
+from ._general_static_graph_default_implementation import (
+    HeterogeneousNodesContainer, HeterogeneousNodesContainerImplementation,
+    HomogeneousEdgesContainerImplementation,
+    HeterogeneousEdgesAggregation, HeterogeneousEdgesAggregationImplementation,
+    StaticGraphDataAggregation, GeneralStaticGraphImplementation
+)
+
+
+class GeneralStaticGraphGenerator:
+    @classmethod
+    def create_heterogeneous_static_graph(
+            cls, heterogeneous_nodes_data: _typing.Mapping[str, _typing.Mapping[str, torch.Tensor]],
+            heterogeneous_edges: _typing.Mapping[
+                _typing.Tuple[str, str, str],
+                _typing.Union[
+                    torch.Tensor,
+                    _typing.Tuple[
+                        torch.Tensor,
+                        _typing.Optional[_typing.Mapping[str, torch.Tensor]]
+                    ]
+                ]
+            ],
+            graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ) -> _general_static_graph.GeneralStaticGraph:
+        _heterogeneous_nodes_container: HeterogeneousNodesContainer = (
+            HeterogeneousNodesContainerImplementation(heterogeneous_nodes_data)
+        )
+        _heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation = (
+            HeterogeneousEdgesAggregationImplementation()
+        )
+        for canonical_edge_type, specific_typed_edges in heterogeneous_edges.items():
+            if isinstance(specific_typed_edges, torch.Tensor):
+                connections = specific_typed_edges
+                data = None
+            elif (
+                    isinstance(specific_typed_edges, _typing.Sequence) and
+                    len(specific_typed_edges) == 2 and
+                    isinstance(specific_typed_edges[0], torch.Tensor) and
+                    (
+                            specific_typed_edges[1] is None or
+                            isinstance(specific_typed_edges[1], _typing.Mapping)
+                    )
+            ):
+                connections = specific_typed_edges[0]
+                data = specific_typed_edges[1]
+            else:
+                raise TypeError
+            _heterogeneous_edges_aggregation[canonical_edge_type] = (
+                HomogeneousEdgesContainerImplementation(connections, data)
+            )
+        return GeneralStaticGraphImplementation(
+            _heterogeneous_nodes_container,
+            _heterogeneous_edges_aggregation,
+            StaticGraphDataAggregation(graph_data)
+        )
+
+    @classmethod
+    def create_homogeneous_static_graph(
+            cls, nodes_data: _typing.Mapping[str, torch.Tensor],
+            edges_connections: torch.Tensor,
+            edges_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...,
+            graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ) -> _general_static_graph.GeneralStaticGraph:
+        _heterogeneous_nodes_container: HeterogeneousNodesContainer = (
+            HeterogeneousNodesContainerImplementation({'': nodes_data})
+        )
+        _heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation = (
+            HeterogeneousEdgesAggregationImplementation()
+        )
+        _heterogeneous_edges_aggregation[('', '', '')] = (
+            HomogeneousEdgesContainerImplementation(edges_connections, edges_data)
+        )
+        return GeneralStaticGraphImplementation(
+            _heterogeneous_nodes_container,
+            _heterogeneous_edges_aggregation,
+            StaticGraphDataAggregation(graph_data)
+        )
diff --git a/autogl/data/graph/_general_static_graph/utils/__init__.py b/autogl/data/graph/_general_static_graph/utils/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/autogl/data/graph/_general_static_graph/utils/conversion/__init__.py b/autogl/data/graph/_general_static_graph/utils/conversion/__init__.py
new file mode 100644
index 0000000..ec0f06e
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/__init__.py
@@ -0,0 +1,19 @@
+from ._nx import (
+    HomogeneousStaticGraphToNetworkX
+)
+
+try:
+    import dgl
+except ModuleNotFoundError:
+    dgl = None
+else:
+    from ._dgl import (
+        DGLGraphToGeneralStaticGraph, dgl_graph_to_general_static_graph,
+        GeneralStaticGraphToDGLGraph, general_static_graph_to_dgl_graph,
+    )
+try:
+    import torch_geometric
+except ModuleNotFoundError:
+    torch_geometric = None
+else:
+    from ._pyg import StaticGraphToPyGData, static_graph_to_pyg_data
diff --git a/autogl/data/graph/_general_static_graph/utils/conversion/_dgl.py b/autogl/data/graph/_general_static_graph/utils/conversion/_dgl.py
new file mode 100644
index 0000000..38cd46f
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_dgl.py
@@ -0,0 +1,136 @@
+import dgl
+import torch
+import typing as _typing
+from ..._general_static_graph import GeneralStaticGraph
+from ... import (
+    _general_static_graph_generator, _general_static_graph_dgl_implementation
+)
+
+
+class GeneralStaticGraphToDGLGraph:
+    def __init__(self, *__args, **__kwargs):
+        pass
+
+    def __call__(self, static_graph: GeneralStaticGraph) -> dgl.DGLGraph:
+        dgl_graph: dgl.DGLGraph = dgl.heterograph(
+            dict([
+                (
+                    (
+                        canonical_edge_type.source_node_type,
+                        canonical_edge_type.relation_type,
+                        canonical_edge_type.target_node_type
+                    ),
+                    (
+                        static_graph.edges[canonical_edge_type].connections[0],
+                        static_graph.edges[canonical_edge_type].connections[1]
+                    )
+                )
+                for canonical_edge_type in static_graph.edges
+            ])
+        )
+        for node_type in static_graph.nodes:
+            for data_key in static_graph.nodes[node_type].data:
+                dgl_graph.nodes[node_type].data[data_key] = (
+                    static_graph.nodes[node_type].data[data_key]
+                )
+        for canonical_edge_type in static_graph.edges:
+            for data_key in static_graph.edges[canonical_edge_type].data:
+                dgl_graph.edges[
+                    (
+                        canonical_edge_type.source_node_type,
+                        canonical_edge_type.relation_type,
+                        canonical_edge_type.target_node_type
+                    )
+                ].data[data_key] = (
+                    static_graph.edges[canonical_edge_type].data[data_key]
+                )
+        # Set graph level data by `setattr`
+        if len(static_graph.data) > 0:
+            setattr(dgl_graph, "graph_data", dict(static_graph.data))
+            if "gf" in static_graph.data:
+                setattr(dgl_graph, "gf", static_graph.data["gf"].detach().clone())
+        return dgl_graph
+
+
+class DGLGraphToGeneralStaticGraph:
+    def __init__(
+            self, as_universal_storage_format: bool = False,
+            *__args, **__kwargs
+    ):
+        if not isinstance(as_universal_storage_format, bool):
+            raise TypeError
+        else:
+            self._as_universal_storage_format: bool = as_universal_storage_format
+
+    def __call__(
+            self, dgl_graph: dgl.DGLGraph,
+            as_universal_storage_format: _typing.Optional[bool] = ...,
+            *__args, **__kwargs
+    ) -> GeneralStaticGraph:
+        if not (
+                as_universal_storage_format in (Ellipsis, None) or
+                isinstance(as_universal_storage_format, bool)
+        ):
+            raise TypeError
+        _as_universal_storage_format: bool = (
+            as_universal_storage_format
+            if isinstance(as_universal_storage_format, bool)
+            else self._as_universal_storage_format
+        )
+
+        if not _as_universal_storage_format:
+            general_static_graph: GeneralStaticGraph = (
+                _general_static_graph_dgl_implementation.GeneralStaticGraphDGLImplementation(dgl_graph)
+            )
+
+        else:
+            general_static_graph: GeneralStaticGraph = (
+                _general_static_graph_generator.GeneralStaticGraphGenerator.create_heterogeneous_static_graph(
+                    dict([(node_type, dgl_graph.nodes[node_type].data) for node_type in dgl_graph.ntypes]),
+                    dict([
+                        (
+                            canonical_edge_type,
+                            (
+                                torch.vstack(dgl_graph.edges(etype=canonical_edge_type)),
+                                dgl_graph.edges[canonical_edge_type].data
+                            )
+                        )
+                        for canonical_edge_type in dgl_graph.canonical_etypes]
+                    )
+                )
+            )
+        if (
+                hasattr(dgl_graph, "graph_data") and
+                isinstance(getattr(dgl_graph, "graph_data"), _typing.Mapping)
+        ):
+            graph_data: _typing.Mapping[str, torch.Tensor] = getattr(dgl_graph, "graph_data")
+            for k, v in graph_data.items():
+                if (
+                        isinstance(k, str) and ' ' not in k and
+                        isinstance(v, torch.Tensor)
+                ):
+                    general_static_graph.data[k] = v
+        for k in ("gf",):
+            if (
+                    hasattr(dgl_graph, k) and
+                    isinstance(getattr(dgl_graph, k), torch.Tensor)
+            ):
+                general_static_graph.data[k] = getattr(dgl_graph, k)
+        return general_static_graph
+
+
+def general_static_graph_to_dgl_graph(
+        general_static_graph: GeneralStaticGraph, *__args, **__kwargs
+) -> dgl.DGLGraph:
+    return GeneralStaticGraphToDGLGraph(*__args, **__kwargs).__call__(
+        general_static_graph
+    )
+
+
+def dgl_graph_to_general_static_graph(
+        dgl_graph: dgl.DGLGraph, as_universal_storage_format: bool = False,
+        *__args, **__kwargs
+) -> GeneralStaticGraph:
+    return DGLGraphToGeneralStaticGraph(as_universal_storage_format).__call__(
+        dgl_graph, as_universal_storage_format
+    )
diff --git a/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py b/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py
new file mode 100644
index 0000000..2fa440f
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py
@@ -0,0 +1,74 @@
+import typing as _typing
+import networkx as nx
+from autogl.data.graph._general_static_graph import GeneralStaticGraph
+
+
+class HomogeneousStaticGraphToNetworkX:
+    def __init__(
+            self, remove_self_loops: bool = False, to_undirected: bool = False,
+            *__args, **__kwargs
+    ):
+        if not isinstance(remove_self_loops, bool):
+            raise TypeError
+        if not isinstance(to_undirected, bool):
+            raise TypeError
+        self.__remove_self_loops: bool = remove_self_loops
+        self.__to_undirected: bool = to_undirected
+
+    def __call__(
+            self, homogeneous_static_graph: GeneralStaticGraph,
+            remove_self_loops: _typing.Optional[bool] = ...,
+            to_undirected: _typing.Optional[bool] = ...,
+            *args, **kwargs
+    ):
+        if not isinstance(homogeneous_static_graph, GeneralStaticGraph):
+            raise TypeError
+        elif not (
+                homogeneous_static_graph.nodes.is_homogeneous and
+                homogeneous_static_graph.edges.is_homogeneous
+        ):
+            raise ValueError("Only homogeneous static graph can be converted to NetworkX")
+
+        if not (remove_self_loops in (Ellipsis, None) or isinstance(remove_self_loops, bool)):
+            raise TypeError
+        else:
+            __remove_self_loops: bool = (
+                remove_self_loops if isinstance(remove_self_loops, bool)
+                else self.__remove_self_loops
+            )
+        if not (to_undirected in (Ellipsis, None) or isinstance(to_undirected, bool)):
+            raise TypeError
+        else:
+            __to_undirected: bool = (
+                to_undirected if isinstance(to_undirected, bool)
+                else self.__to_undirected
+            )
+
+        num_nodes: int = homogeneous_static_graph.edges.connections.max().item() + 1
+        # todo: Note that this is an assumption
+
+        g: nx.Graph = nx.Graph() if __to_undirected else nx.DiGraph()
+        g.add_nodes_from(range(num_nodes))
+
+        nodes_data: _typing.MutableMapping[str, list] = {}
+        for data_key in homogeneous_static_graph.nodes.data:
+            nodes_data[data_key] = (
+                homogeneous_static_graph.nodes.data[data_key].squeeze().tolist()
+            )
+        edges_data: _typing.MutableMapping[str, list] = {}
+        for data_key in homogeneous_static_graph.edges.data:
+            edges_data[data_key] = (
+                homogeneous_static_graph.edges.data[data_key].squeeze().tolist()
+            )
+        for i, (u, v) in enumerate(homogeneous_static_graph.edges.connections.t().tolist()):
+            if (__remove_self_loops and v == u) or (__to_undirected and v > u):
+                continue
+            g.add_edge(u, v)
+            for data_key in edges_data:
+                g[u][v][data_key] = edges_data[data_key][i]
+        for data_key in nodes_data:
+            for i, feature_dict in g.nodes(data=True):
+                feature_dict.update(
+                    {data_key: nodes_data[data_key][i]}
+                )
+        return g
diff --git a/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py b/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
new file mode 100644
index 0000000..ced55ba
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
@@ -0,0 +1,68 @@
+import typing as _typing
+import autogl
+from ... import GeneralStaticGraph
+
+
+class StaticGraphToPyGData:
+    def __init__(self, *__args, **__kwargs):
+        pass
+
+    def __call__(
+            self, static_graph: GeneralStaticGraph,
+            *__args, **__kwargs
+    ):
+        if not isinstance(static_graph, GeneralStaticGraph):
+            raise TypeError
+        elif not static_graph.nodes.is_homogeneous:
+            raise ValueError("Provided static graph MUST consist of homogeneous nodes")
+        pyg_data: autogl.data.Data = autogl.data.Data()
+        for data_key in static_graph.nodes.data:
+            setattr(pyg_data, data_key, static_graph.nodes.data[data_key].detach().clone())
+        homogeneous_node_type: _typing.Optional[str] = (
+            list(static_graph.nodes)[0]
+            if len(list(static_graph.nodes)) > 0 else None
+        )
+        if len(list(static_graph.edges)) == 1:
+            pyg_data.edge_index = static_graph.edges.connections
+            for data_key in static_graph.edges.data:
+                if hasattr(pyg_data, data_key):
+                    raise ValueError(
+                        "Provided static graph contains duplicate data with same key, "
+                        "please refer to doc for more details."
+                    )
+                else:
+                    setattr(pyg_data, data_key, static_graph.edges.data[data_key].detach().clone())
+        elif len(list(static_graph.edges)) > 1:
+            for canonical_edge_type in static_graph.edges:
+                if homogeneous_node_type is not None and isinstance(homogeneous_node_type, str) and (
+                        canonical_edge_type.source_node_type != homogeneous_node_type or
+                        canonical_edge_type.target_node_type != homogeneous_node_type
+                ):
+                    continue
+                if len(canonical_edge_type.relation_type) < 4 or canonical_edge_type[-4:] != 'edge':
+                    continue
+                edge_type_prefix: str = canonical_edge_type.relation_type[:-4]
+                for data_key in static_graph.edges[canonical_edge_type].data:
+                    if len(data_key) >= 4 and data_key[:4] == 'edge':
+                        setattr(
+                            pyg_data, edge_type_prefix + data_key,
+                            static_graph.edges[canonical_edge_type].data[data_key].detach().clone()
+                        )
+                    else:
+                        setattr(
+                            pyg_data, f"{canonical_edge_type.relation_type}_{data_key}",
+                            static_graph.edges[canonical_edge_type].data[data_key].detach().clone()
+                        )
+        for data_key in static_graph.data:
+            if hasattr(pyg_data, data_key):
+                raise ValueError(
+                    "Provided static graph contains duplicate data with same key, "
+                    "please refer to doc for more details."
+                )
+            else:
+                setattr(pyg_data, data_key, static_graph.data[data_key].detach().clone())
+        return pyg_data
+
+
+def static_graph_to_pyg_data(static_graph: autogl.data.graph.GeneralStaticGraph):
+    return StaticGraphToPyGData().__call__(static_graph)
diff --git a/autogl/data/graph/_general_static_graph_.py b/autogl/data/graph/_general_static_graph_.py
new file mode 100644
index 0000000..426166c
--- /dev/null
+++ b/autogl/data/graph/_general_static_graph_.py
@@ -0,0 +1,1018 @@
+import pandas as pd
+import torch
+import typing as _typing
+
+
+class _HeterogeneousNodesContainer:
+    @property
+    def node_types(self) -> _typing.AbstractSet[str]:
+        raise NotImplementedError
+
+    def remove_nodes(self, node_t: _typing.Optional[str]) -> '_HeterogeneousNodesContainer':
+        raise NotImplementedError
+
+    def reset_nodes(
+            self, node_t: _typing.Optional[str],
+            nodes_data: _typing.Mapping[str, torch.Tensor]
+    ) -> '_HeterogeneousNodesContainer':
+        raise NotImplementedError
+
+    def set_data(
+            self, node_t: _typing.Optional[str], data_key: str, data: torch.Tensor
+    ) -> '_HeterogeneousNodesContainer':
+        raise NotImplementedError
+
+    def get_data(
+            self, node_t: _typing.Optional[str] = ...,
+            data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        raise NotImplementedError
+
+    def delete_data(
+            self, node_t: _typing.Optional[str], data_key: str
+    ) -> '_HeterogeneousNodesContainer':
+        raise TypeError
+
+    def remove_data(
+            self, node_t: _typing.Optional[str], data_key: str
+    ) -> '_HeterogeneousNodesContainer':
+        return self.delete_data(node_t, data_key)
+
+
+class _HeterogeneousNodesContainerImplementation(_HeterogeneousNodesContainer):
+    def __init__(self, data: _typing.Optional[_typing.Mapping[str, _typing.Mapping[str, torch.Tensor]]] = ...):
+        self.__nodes_data: _typing.MutableMapping[str, _typing.MutableMapping[str, torch.Tensor]] = {}
+        if data not in (None, Ellipsis) and isinstance(data, _typing.Mapping):
+            for node_t, nodes_data in data.items():
+                self.reset_nodes(node_t, nodes_data)
+
+    @property
+    def node_types(self) -> _typing.AbstractSet[str]:
+        return self.__nodes_data.keys()
+
+    def remove_nodes(self, node_t: _typing.Optional[str]) -> _HeterogeneousNodesContainer:
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif node_t in (Ellipsis, None):
+            if len(self.node_types) == 0:
+                return self
+            elif len(self.node_types) == 1:
+                del self.__nodes_data[tuple(self.node_types)[0]]
+            else:
+                _error_message: str = ' '.join((
+                    "Unable to determine node type automatically,",
+                    "possible cause is that the graph contains heterogeneous nodes,",
+                    "node type must be specified for graph containing heterogeneous nodes."
+                ))
+                raise TypeError(_error_message)
+        elif isinstance(node_t, str):
+            try:
+                del self.__nodes_data[node_t]
+            except Exception:
+                raise ValueError(f"nodes with type [{node_t}] NOT exists")
+        return self
+
+    def reset_nodes(
+            self, node_t: _typing.Optional[str],
+            nodes_data: _typing.Mapping[str, torch.Tensor]
+    ) -> _HeterogeneousNodesContainer:
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif node_t in (Ellipsis, None) and len(self.node_types) > 1:
+            _error_message: str = ' '.join((
+                "Unable to determine node type automatically,",
+                "possible cause is that the graph contains heterogeneous nodes,",
+                "node type must be specified for graph containing heterogeneous nodes."
+            ))
+            raise TypeError(_error_message)
+        elif isinstance(node_t, str) and ' ' in node_t:
+            raise ValueError("node type must NOT contain space character (\' \').")
+        __node_t: str = "" if node_t is Ellipsis else node_t
+
+        num_nodes: int = ...
+        for data_key, data_item in nodes_data.items():
+            if not isinstance(data_key, str):
+                raise TypeError
+            if ' ' in data_key:
+                raise ValueError("data key must NOT contain space character (\' \').")
+            if not isinstance(data_item, torch.Tensor):
+                raise TypeError
+            if not data_item.dim() > 0:
+                raise ValueError(
+                    "data item MUST have at least one dimension, "
+                    "and the first dimension corresponds to data for diverse nodes."
+                )
+            if not isinstance(num_nodes, int):
+                num_nodes: int = data_item.size(0)
+            if data_item.size(0) != num_nodes:
+                raise ValueError
+            self.__nodes_data[__node_t] = dict(nodes_data)
+        return self
+
+    def set_data(
+            self, node_t: _typing.Optional[str], data_key: str, data: torch.Tensor
+    ) -> _HeterogeneousNodesContainer:
+        if node_t in (Ellipsis, None):
+            if len(self.node_types) == 0:
+                __node_t: str = ""  # Default node type for homogeneous graph
+            elif len(self.node_types) == 1:
+                __node_t: str = list(self.node_types)[0]
+            else:
+                _error_message: str = ' '.join((
+                    "Unable to determine node type automatically,",
+                    "possible cause is that the graph contains heterogeneous nodes,",
+                    "node type must be specified for graph containing heterogeneous nodes."
+                ))
+                raise TypeError(_error_message)
+        elif isinstance(node_t, str):
+            __node_t: str = node_t
+        else:
+            raise TypeError
+        if not isinstance(data_key, str):
+            raise TypeError
+        if not isinstance(data, torch.Tensor):
+            raise TypeError
+        if ' ' in __node_t:
+            raise ValueError
+        if ' ' in data_key:
+            raise ValueError
+        if not data.dim() > 0:
+            raise ValueError(
+                "data item MUST have at least one dimension, "
+                "and the first dimension corresponds to data for diverse nodes."
+            )
+        if __node_t not in self.node_types:
+            self.__nodes_data[__node_t] = dict([(data_key, data)])
+        else:
+            obsolete_data: _typing.Optional[torch.Tensor] = self.__nodes_data[__node_t].get(data_key)
+            if obsolete_data is not None and isinstance(obsolete_data, torch.Tensor):
+                if data.size(0) != obsolete_data.size(0):
+                    raise ValueError
+            elif len(self.__nodes_data.get(__node_t)) > 0:
+                num_nodes: int = self.__nodes_data.get(__node_t).get(list(self.node_types)[0]).size(0)
+                if data.size(0) != num_nodes:
+                    raise ValueError
+            self.__nodes_data[__node_t][data_key] = data
+        return self
+
+    def __get_data_for_specific_node_type(
+            self, node_t: str, data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        if not isinstance(node_t, str):
+            raise TypeError
+        elif ' ' in node_t:
+            raise ValueError
+        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
+            raise TypeError
+        elif isinstance(data_key, str) and ' ' in data_key:
+            raise ValueError
+        if node_t not in self.node_types:
+            raise ValueError("Node type NOT exists")
+        elif isinstance(data_key, str):
+            data: _typing.Optional[torch.Tensor] = self.__nodes_data[node_t].get(data_key)
+            if data is not None:
+                return data
+            else:
+                raise KeyError(
+                    f"Data with key [{data_key}] NOT exists "
+                    f"for nodes with specific type [{node_t}]"
+                )
+        else:
+            return self.__nodes_data[node_t]
+
+    def __get_data_for_specific_data_key(
+            self, data_key: str, node_t: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif isinstance(node_t, str) and ' ' in node_t:
+            raise ValueError
+        if isinstance(node_t, str):
+            if node_t not in self.node_types:
+                raise ValueError("Node type NOT exists")
+            else:
+                data: _typing.Optional[torch.Tensor] = (
+                    self.__nodes_data[node_t].get(data_key)
+                )
+                if data is not None:
+                    return data
+                else:
+                    raise KeyError(
+                        f"Data with key [{data_key}] NOT exists "
+                        f"for nodes with specific type [{node_t}]"
+                    )
+        else:
+            if len(self.node_types) == 0:
+                raise RuntimeError("Unable to get data from empty graph")
+            elif len(self.node_types) == 1:
+                __node_t: str = tuple(self.node_types)[0]
+                __optional_data: _typing.Optional[torch.Tensor] = (
+                    self.__nodes_data[__node_t].get(data_key)
+                )
+                if __optional_data is not None:
+                    return __optional_data
+                else:
+                    raise KeyError(f"Data with key [{data_key}] NOT exists")
+            else:
+                __result: _typing.Dict[str, torch.Tensor] = {}
+                for __node_t, __nodes_data in self.__nodes_data.items():
+                    __optional_data: _typing.Optional[torch.Tensor] = (
+                        __nodes_data.get(data_key)
+                    )
+                    if (
+                            __optional_data is not None and
+                            isinstance(__optional_data, torch.Tensor)
+                    ):
+                        __result[__node_t] = __optional_data
+                if len(__result):
+                    return __result
+                else:
+                    raise KeyError(f"Data with key [{data_key}] NOT exists")
+
+    def get_data(
+            self, node_t: _typing.Optional[str] = ...,
+            data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif isinstance(node_t, str) and ' ' in node_t:
+            raise ValueError
+        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
+            raise TypeError
+        elif isinstance(data_key, str) and ' ' in data_key:
+            raise ValueError
+        if isinstance(node_t, str):
+            return self.__get_data_for_specific_node_type(node_t, data_key)
+        elif node_t in (Ellipsis, None) and isinstance(data_key, str):
+            return self.__get_data_for_specific_data_key(data_key)
+        elif node_t in (Ellipsis, None) and data_key in (Ellipsis, None):
+            if len(self.node_types) == 1:
+                __node_t: str = tuple(self.node_types)[0]
+                return self.__get_data_for_specific_node_type(__node_t)
+            else:
+                raise TypeError(
+                    "Unable to determine node type automatically, "
+                    "possible cause is that the graph contains heterogeneous nodes or is empty, "
+                    "node type must be specified for graph containing heterogeneous nodes."
+                )
+
+    def delete_data(
+            self, node_t: _typing.Optional[str], data_key: str
+    ) -> _HeterogeneousNodesContainer:
+        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
+            raise TypeError
+        elif node_t in (Ellipsis, None):
+            if len(self.node_types) == 1:
+                __node_t: str = tuple(self.node_types)[0]
+            else:
+                raise TypeError(
+                    "Unable to determine node type automatically, "
+                    "possible cause is that the graph contains heterogeneous nodes or is empty, "
+                    "node type must be specified for graph containing heterogeneous nodes."
+                )
+        elif isinstance(node_t, str):
+            if node_t in self.node_types:
+                __node_t: str = node_t
+            else:
+                raise ValueError("node type NOT exists")
+        else:
+            raise TypeError
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif data_key not in self.__nodes_data.get(__node_t):
+            raise KeyError(
+                f"Data with key [{data_key}] NOT exists for nodes with type [{__node_t}]"
+            )
+        else:
+            self.__nodes_data[__node_t].__delitem__(data_key)
+            if len(self.__nodes_data.get(__node_t)) == 0:
+                del self.__nodes_data[__node_t]
+        return self
+
+
+class _TypedNodeDataView(_typing.MutableMapping[str, torch.Tensor]):
+    def __init__(
+            self, heterogeneous_nodes_container: _HeterogeneousNodesContainer,
+            node_type: _typing.Optional[str]
+    ):
+        if not isinstance(heterogeneous_nodes_container, _HeterogeneousNodesContainer):
+            raise TypeError
+        else:
+            self._heterogeneous_nodes_container: _HeterogeneousNodesContainer = (
+                heterogeneous_nodes_container
+            )
+        if not (isinstance(node_type, str) or node_type in (Ellipsis, None)):
+            raise TypeError
+        elif isinstance(node_type, str):
+            if node_type not in self._heterogeneous_nodes_container.node_types:
+                raise ValueError("Invalid node type")
+        self.__node_t: _typing.Optional[str] = node_type
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        return self._heterogeneous_nodes_container.get_data(self.__node_t, data_key)
+
+    def __setitem__(self, data_key: str, value: torch.Tensor):
+        self._heterogeneous_nodes_container.set_data(self.__node_t, data_key, value)
+
+    def __delitem__(self, data_key: str) -> None:
+        self._heterogeneous_nodes_container.delete_data(self.__node_t, data_key)
+
+    def __len__(self) -> int:
+        return len(self._heterogeneous_nodes_container.get_data(self.__node_t))
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self._heterogeneous_nodes_container.get_data(self.__node_t))
+
+
+class _TypedNodeView:
+    def __init__(
+            self, nodes_container: _HeterogeneousNodesContainer,
+            node_t: _typing.Optional[str]
+    ):
+        self._heterogeneous_nodes_container: _HeterogeneousNodesContainer = nodes_container
+        self.__node_t: _typing.Optional[str] = node_t
+
+    @property
+    def data(self) -> _TypedNodeDataView:
+        return _TypedNodeDataView(self._heterogeneous_nodes_container, self.__node_t)
+
+    @data.setter
+    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
+        self._heterogeneous_nodes_container.reset_nodes(self.__node_t, nodes_data)
+
+
+class _IntegralNodeView(_TypedNodeView, _typing.Iterable[str]):
+    def __init__(self, nodes_container: _HeterogeneousNodesContainer):
+        super(_IntegralNodeView, self).__init__(nodes_container, ...)
+
+    def __getitem__(self, node_type: _typing.Optional[str]) -> _TypedNodeView:
+        return _TypedNodeView(self._heterogeneous_nodes_container, node_type)
+
+    def __setitem__(
+            self, node_t: _typing.Optional[str],
+            nodes_data: _typing.Mapping[str, torch.Tensor]
+    ) -> None:
+        self._heterogeneous_nodes_container.reset_nodes(node_t, nodes_data)
+
+    def __delitem__(self, node_t: _typing.Optional[str]):
+        self._heterogeneous_nodes_container.remove_nodes(node_t)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self._heterogeneous_nodes_container.node_types)
+
+    @property
+    def is_homogeneous(self) -> bool:
+        return len(self._heterogeneous_nodes_container.node_types) <= 1
+
+
+class _HomogeneousEdgesContainer:
+    @property
+    def connections(self) -> torch.Tensor:
+        raise NotImplementedError
+
+    @property
+    def data_keys(self) -> _typing.Iterable[str]:
+        raise NotImplementedError
+
+    def get_data(
+            self, data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        raise NotImplementedError
+
+    def set_data(self, data_key: str, data: torch.Tensor):
+        raise NotImplementedError
+
+    def delete_data(self, data_key: str):
+        raise NotImplementedError
+
+
+class _HomogeneousEdgesContainerImplementation(_HomogeneousEdgesContainer):
+    def __init__(
+            self, edge_connections: torch.Tensor,
+            data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        if not isinstance(edge_connections, torch.Tensor):
+            raise TypeError
+        if not (data in (Ellipsis, None) or isinstance(data, _typing.Mapping)):
+            raise TypeError
+        if not (
+                edge_connections.dtype == torch.int64 and
+                edge_connections.dim() == edge_connections.size(0) == 2
+        ):
+            raise ValueError
+        self.__connections: torch.Tensor = edge_connections
+        if not isinstance(data, _typing.Mapping):
+            self.__data: _typing.MutableMapping[str, torch.Tensor] = {}
+        else:
+            for data_key, data_item in data.items():
+                if not isinstance(data_key, str):
+                    raise TypeError
+                if not isinstance(data_item, torch.Tensor):
+                    raise TypeError
+                if ' ' in data_key:
+                    raise ValueError
+                if not data_item.dim() > 0:
+                    raise ValueError
+                if data_item.size(0) != self.__connections.size(1):
+                    raise ValueError
+            self.__data: _typing.MutableMapping[str, torch.Tensor] = dict(data)
+
+    @property
+    def connections(self) -> torch.Tensor:
+        return self.__connections
+
+    @property
+    def data_keys(self) -> _typing.Iterable[str]:
+        return self.__data.keys()
+
+    def set_data(self, data_key: str, data: torch.Tensor) -> _HomogeneousEdgesContainer:
+        if not isinstance(data_key, str):
+            raise TypeError
+        if not isinstance(data, torch.Tensor):
+            raise TypeError
+        if ' ' in data_key:
+            raise ValueError
+        if data.dim() == 0 or data.size(0) != self.__connections.size(1):
+            raise ValueError
+        self.__data[data_key] = data
+        return self
+
+    def get_data(
+            self, data_key: _typing.Optional[str] = ...
+    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
+        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
+            raise TypeError
+        if isinstance(data_key, str):
+            if ' ' in data_key:
+                raise ValueError
+            temp: _typing.Optional[torch.Tensor] = self.__data.get(data_key)
+            if temp is None:
+                raise KeyError(f"Data with key [{data_key}] NOT exists")
+            else:
+                return temp
+        else:
+            return dict(self.__data)
+
+    def delete_data(self, data_key: str) -> _HomogeneousEdgesContainer:
+        if not isinstance(data_key, str):
+            raise TypeError
+        if ' ' in data_key:
+            raise ValueError
+        try:
+            del self.__data[data_key]
+        finally:
+            return self
+
+
+class _CanonicalEdgeType:
+    def __init__(self, source_node_type: str, relation_type: str, target_node_type: str):
+        if not isinstance(source_node_type, str):
+            raise TypeError
+        elif ' ' in source_node_type:
+            raise ValueError
+        if not isinstance(relation_type, str):
+            raise TypeError
+        elif ' ' in relation_type:
+            raise ValueError
+        if not isinstance(target_node_type, str):
+            raise TypeError
+        elif ' ' in target_node_type:
+            raise ValueError
+        self.__source_node_type: str = source_node_type
+        self.__relation_type: str = relation_type
+        self.__destination_node_type: str = target_node_type
+
+    @property
+    def source_node_type(self) -> str:
+        return self.__source_node_type
+
+    @property
+    def relation_type(self) -> str:
+        return self.__relation_type
+
+    @property
+    def target_node_type(self) -> str:
+        return self.__destination_node_type
+
+    def __eq__(self, other):
+        if not (isinstance(other, _CanonicalEdgeType) or isinstance(other, _typing.Tuple)):
+            return False
+        elif isinstance(other, _typing.Tuple):
+            if not (
+                    len(other) == 3 and all([(isinstance(t, str) and ' ' not in t) for t in other])
+            ):
+                raise TypeError
+            return (
+                    other[0] == self.source_node_type and
+                    other[1] == self.relation_type and
+                    other[2] == self.target_node_type
+            )
+        elif isinstance(other, _CanonicalEdgeType):
+            return (
+                    other.source_node_type == self.source_node_type and
+                    other.relation_type == self.relation_type and
+                    other.target_node_type == self.target_node_type
+            )
+
+
+class _HeterogeneousEdgesAggregation(
+    _typing.MutableMapping[
+        _typing.Union[str, _typing.Tuple[str, str, str], _CanonicalEdgeType],
+        _HomogeneousEdgesContainer
+    ]
+):
+    def __setitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType],
+            edges: _typing.Union[_HomogeneousEdgesContainer, torch.LongTensor]
+    ) -> None:
+        self._set_edges(edge_t, edges)
+
+    def __delitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType]
+    ) -> None:
+        self._delete_edges(edge_t)
+
+    def __getitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType] = ...
+    ) -> _HomogeneousEdgesContainer:
+        return self._get_edges(edge_t)
+
+    def __len__(self) -> int:
+        return len(list(self._edge_types))
+
+    def __iter__(self) -> _typing.Iterator[_CanonicalEdgeType]:
+        return iter(self._edge_types)
+
+    @property
+    def _edge_types(self) -> _typing.Iterable[_CanonicalEdgeType]:
+        raise NotImplementedError
+
+    def _get_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType] = ...
+    ) -> _HomogeneousEdgesContainer:
+        raise NotImplementedError
+
+    def _set_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType],
+            edges: _typing.Union[_HomogeneousEdgesContainer, torch.LongTensor]
+    ):
+        raise NotImplementedError
+
+    def _delete_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType]
+    ) -> None:
+        raise NotImplementedError
+
+
+class _HeterogeneousEdgesAggregationImplementation(_HeterogeneousEdgesAggregation):
+    def __init__(self):
+        self.__heterogeneous_edges_data_frame: pd.DataFrame = pd.DataFrame(
+            columns=('s', 'r', 't', 'edges'),
+        )
+
+    @property
+    def _edge_types(self) -> _typing.Iterable[_CanonicalEdgeType]:
+        return [
+            _CanonicalEdgeType(getattr(row_tuple, 's'), getattr(row_tuple, 'r'), getattr(row_tuple, 't'))
+            for row_tuple in self.__heterogeneous_edges_data_frame.itertuples(False, name="Edge")
+        ]
+
+    def _get_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType] = ...
+    ) -> _HomogeneousEdgesContainer:
+        if edge_t in (Ellipsis, None):
+            if len(self.__heterogeneous_edges_data_frame) == 1:
+                return self.__heterogeneous_edges_data_frame.iloc[0]['edges']
+            else:
+                raise RuntimeError  # Undetermined
+        elif isinstance(edge_t, str):
+            if ' ' in edge_t:
+                raise ValueError
+            if len(
+                    self.__heterogeneous_edges_data_frame.loc[
+                        self.__heterogeneous_edges_data_frame['r'] == edge_t
+                    ]
+            ) != 1:
+                raise ValueError  # Unable to determine
+            else:
+                temp: _HomogeneousEdgesContainer = self.__heterogeneous_edges_data_frame.loc[
+                    self.__heterogeneous_edges_data_frame['r'] == edge_t, 'edges'
+                ]
+                if not isinstance(temp, _HomogeneousEdgesContainer):
+                    raise RuntimeError
+                else:
+                    return temp
+        elif isinstance(edge_t, _typing.Tuple) or isinstance(edge_t, _CanonicalEdgeType):
+            if isinstance(edge_t, _typing.Tuple) and not (
+                    len(edge_t) == 3 and
+                    isinstance(edge_t[0], str) and
+                    isinstance(edge_t[1], str) and
+                    isinstance(edge_t[2], str) and
+                    ' ' not in edge_t[0] and ' ' not in edge_t[1] and ' ' not in edge_t[2]
+            ):
+                raise TypeError("Illegal canonical edge type")
+            __edge_t: _typing.Tuple[str, str, str] = (
+                (edge_t.source_node_type, edge_t.relation_type, edge_t.target_node_type)
+                if isinstance(edge_t, _CanonicalEdgeType) else edge_t
+            )
+            partial_data_frame: pd.DataFrame = self.__heterogeneous_edges_data_frame.loc[
+                (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
+                (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
+                (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
+                ]
+            if len(partial_data_frame) == 0:
+                raise ValueError
+            elif len(partial_data_frame) == 1:
+                temp: _HomogeneousEdgesContainer = partial_data_frame.iloc[0]['edges']
+                if not isinstance(temp, _HomogeneousEdgesContainer):
+                    raise RuntimeError
+                else:
+                    return temp
+            else:
+                raise RuntimeError
+
+    def _set_edges(
+            self,
+            edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType],
+            edges: _typing.Union[_HomogeneousEdgesContainer, torch.LongTensor]
+    ):
+        if not (isinstance(edges, _HomogeneousEdgesContainer) or isinstance(edges, torch.Tensor)):
+            raise TypeError
+        if edge_t in (Ellipsis, None):
+            if len(self.__heterogeneous_edges_data_frame) == 0:
+                self.__heterogeneous_edges_data_frame: pd.DataFrame = (
+                    self.__heterogeneous_edges_data_frame.append(
+                        pd.DataFrame(
+                            {
+                                's': [''], 'r': [''], 't': [''],
+                                'edges': [
+                                    edges if isinstance(edges, _HomogeneousEdgesContainer)
+                                    else _HomogeneousEdgesContainerImplementation(edges)
+                                ]
+                            }
+                        )
+                    )
+                )
+            elif len(self.__heterogeneous_edges_data_frame) == 1:
+                self.__heterogeneous_edges_data_frame.iloc[0]['edges'] = (
+                    edges if isinstance(edges, _HomogeneousEdgesContainer)
+                    else _HomogeneousEdgesContainerImplementation(edges)
+                )
+            else:
+                raise RuntimeError  # todo: Unable to determine error
+        elif isinstance(edge_t, str):
+            if ' ' in edge_t:
+                raise ValueError
+            if len(
+                    self.__heterogeneous_edges_data_frame.loc[
+                        self.__heterogeneous_edges_data_frame['r'] == edge_t
+                    ]
+            ) == 1:
+                self.__heterogeneous_edges_data_frame.loc[
+                    self.__heterogeneous_edges_data_frame['r'] == edge_t, 'edges'
+                ] = (
+                    edges if isinstance(edges, _HomogeneousEdgesContainer)
+                    else _HomogeneousEdgesContainerImplementation(edges)
+                )
+            else:
+                raise RuntimeError
+        elif isinstance(edge_t, _typing.Tuple) or isinstance(edge_t, _CanonicalEdgeType):
+            if isinstance(edge_t, _typing.Tuple) and not (
+                    len(edge_t) == 3 and
+                    isinstance(edge_t[0], str) and
+                    isinstance(edge_t[1], str) and
+                    isinstance(edge_t[2], str) and
+                    ' ' not in edge_t[0] and ' ' not in edge_t[1] and ' ' not in edge_t[2]
+            ):
+                raise TypeError("Illegal canonical edge type")
+            __edge_t: _typing.Tuple[str, str, str] = (
+                (edge_t.source_node_type, edge_t.relation_type, edge_t.target_node_type)
+                if isinstance(edge_t, _CanonicalEdgeType) else edge_t
+            )
+            if len(
+                    self.__heterogeneous_edges_data_frame.loc[
+                        (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
+                        (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
+                        (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
+                    ]
+            ) == 0:
+                self.__heterogeneous_edges_data_frame: pd.DataFrame = (
+                    self.__heterogeneous_edges_data_frame.append(
+                        pd.DataFrame(
+                            {
+                                's': [__edge_t[0]],
+                                'r': [__edge_t[1]],
+                                't': [__edge_t[2]],
+                                'edges': [
+                                    edges if isinstance(edges, _HomogeneousEdgesContainer)
+                                    else _HomogeneousEdgesContainerImplementation(edges)
+                                ]
+                            }
+                        )
+                    )
+                )
+            elif len(
+                    self.__heterogeneous_edges_data_frame.loc[
+                        (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
+                        (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
+                        (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
+                    ]
+            ) == 1:
+                self.__heterogeneous_edges_data_frame.loc[
+                    (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
+                    (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
+                    (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2]),
+                    'edges'
+                ] = (
+                    edges if isinstance(edges, _HomogeneousEdgesContainer)
+                    else _HomogeneousEdgesContainerImplementation(edges)
+                )
+            else:
+                raise RuntimeError  # todo: Unable to determine error
+        else:
+            raise RuntimeError
+
+    def _delete_edges(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType] = ...
+    ) -> None:
+        if edge_t in (Ellipsis, None):
+            if len(self.__heterogeneous_edges_data_frame) == 1:
+                self.__heterogeneous_edges_data_frame.drop(
+                    self.__heterogeneous_edges_data_frame.index[0], inplace=True
+                )
+            elif len(self.__heterogeneous_edges_data_frame) > 1:
+                raise ValueError("Edge Type must be specified for graph containing heterogeneous edges")
+        raise NotImplementedError  # todo: Complete this function
+
+
+class _HomogeneousEdgesDataView(_typing.MutableMapping[str, torch.Tensor]):
+    def __init__(self, homogeneous_edges_container: _HomogeneousEdgesContainer):
+        if not isinstance(homogeneous_edges_container, _HomogeneousEdgesContainer):
+            raise TypeError
+        self._homogeneous_edges_container: _HomogeneousEdgesContainer = homogeneous_edges_container
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        if not isinstance(data_key, str):
+            raise TypeError
+        if ' ' in data_key:
+            raise ValueError
+        return self._homogeneous_edges_container.get_data(data_key)
+
+    def __setitem__(self, data_key: str, data: torch.Tensor):
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError
+        if not isinstance(data, torch.Tensor):
+            raise TypeError
+        elif not data.dim() > 0:
+            raise ValueError
+        self._homogeneous_edges_container.set_data(data_key, data)
+
+    def __delitem__(self, data_key: str):
+        if not isinstance(data_key, str):
+            raise TypeError
+        elif ' ' in data_key:
+            raise ValueError
+        self._homogeneous_edges_container.delete_data(data_key)
+
+    def __len__(self):
+        return len(list(self._homogeneous_edges_container.data_keys))
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self._homogeneous_edges_container.data_keys)
+
+
+class _SpecificTypedHomogeneousEdgesView:
+    def __init__(self, homogeneous_edges_container: _HomogeneousEdgesContainer):
+        if not isinstance(homogeneous_edges_container, _HomogeneousEdgesContainer):
+            raise TypeError
+        self._homogeneous_edges_container: _HomogeneousEdgesContainer = homogeneous_edges_container
+
+    @property
+    def connections(self) -> torch.Tensor:
+        return self._homogeneous_edges_container.connections
+
+    @property
+    def data(self) -> _HomogeneousEdgesDataView:
+        return _HomogeneousEdgesDataView(self._homogeneous_edges_container)
+
+
+class _HeterogeneousEdgesView(_typing.Collection[_CanonicalEdgeType]):
+    def __init__(self, _heterogeneous_edges_aggregation: _HeterogeneousEdgesAggregation):
+        if not isinstance(_heterogeneous_edges_aggregation, _HeterogeneousEdgesAggregation):
+            raise TypeError
+        self._heterogeneous_edges_aggregation: _HeterogeneousEdgesAggregation = (
+            _heterogeneous_edges_aggregation
+        )
+
+    def __getitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType]
+    ) -> _SpecificTypedHomogeneousEdgesView:
+        return _SpecificTypedHomogeneousEdgesView(self._heterogeneous_edges_aggregation[edge_t])
+
+    def __setitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType],
+            edges: _typing.Union[_HomogeneousEdgesContainer, torch.LongTensor]
+    ):
+        self._heterogeneous_edges_aggregation[edge_t] = edges
+
+    def __delitem__(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _CanonicalEdgeType]
+    ):
+        del self._heterogeneous_edges_aggregation[edge_t]
+
+    def __len__(self) -> int:
+        return len(self._heterogeneous_edges_aggregation)
+
+    def __iter__(self) -> _typing.Iterator[_CanonicalEdgeType]:
+        return iter(self._heterogeneous_edges_aggregation)
+
+    def __contains__(self, edge_type: _typing.Union[str, _typing.Tuple[str, str, str], _CanonicalEdgeType]) -> bool:
+        if isinstance(edge_type, str):
+            if ' ' in edge_type:
+                raise ValueError
+            else:
+                for existing_edge_type in self:
+                    if existing_edge_type.relation_type == edge_type:
+                        return True
+                return False
+        elif isinstance(edge_type, _typing.Tuple):
+            if not (
+                    len(edge_type) == 3 and
+                    all([(isinstance(t, str) and ' ' not in t) for t in edge_type])
+            ):
+                raise TypeError
+            else:
+                for existing_edge_type in self:
+                    if existing_edge_type.__eq__(edge_type):
+                        return True
+                return False
+        elif isinstance(edge_type, _CanonicalEdgeType):
+            for existing_edge_type in self:
+                if existing_edge_type == edge_type:
+                    return True
+            return False
+        else:
+            raise TypeError
+
+    @property
+    def connections(self) -> torch.Tensor:
+        return self[...].connections
+
+    @property
+    def data(self) -> _HomogeneousEdgesDataView:
+        return self[...].data
+
+    @property
+    def is_homogeneous(self) -> bool:
+        return len(self) <= 1
+
+    def set(
+            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str]],
+            connections: torch.LongTensor, data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        self[edge_t] = _HomogeneousEdgesContainerImplementation(connections, data)
+
+
+class _StaticGraphDataContainer(_typing.MutableMapping[str, torch.Tensor]):
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        raise NotImplementedError
+
+    def __delitem__(self, data_key: str) -> None:
+        raise NotImplementedError
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        raise NotImplementedError
+
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        raise NotImplementedError
+
+
+class _StaticGraphDataAggregation(_StaticGraphDataContainer):
+    def __init__(
+            self, graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ):
+        self.__data: _typing.MutableMapping[str, torch.Tensor] = (
+            dict(graph_data) if isinstance(graph_data, _typing.Mapping)
+            else {}
+        )
+
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        self.__data[data_key] = data
+
+    def __delitem__(self, data_key: str) -> None:
+        del self.__data[data_key]
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        return self.__data[data_key]
+
+    def __len__(self) -> int:
+        return len(self.__data)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self.__data)
+
+
+class _StaticGraphDataView(_typing.MutableMapping[str, torch.Tensor]):
+    def __init__(self, graph_data_container: _StaticGraphDataContainer):
+        self.__graph_data_container: _StaticGraphDataContainer = (
+            graph_data_container
+        )
+
+    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
+        self.__graph_data_container[data_key] = data
+
+    def __delitem__(self, data_key: str) -> None:
+        del self.__graph_data_container[data_key]
+
+    def __getitem__(self, data_key: str) -> torch.Tensor:
+        return self.__graph_data_container[data_key]
+
+    def __len__(self) -> int:
+        return len(self.__graph_data_container)
+
+    def __iter__(self) -> _typing.Iterator[str]:
+        return iter(self.__graph_data_container)
+
+
+class GeneralStaticGraph:
+    @property
+    def nodes(self) -> _IntegralNodeView:
+        raise NotImplementedError
+
+    @property
+    def edges(self) -> _HeterogeneousEdgesView:
+        raise NotImplementedError
+
+    @property
+    def data(self) -> _StaticGraphDataView:
+        raise NotImplementedError
+
+
+class GeneralStaticGraphImplementation(GeneralStaticGraph):
+    def __init__(
+            self, _heterogeneous_nodes_container: _typing.Optional[_HeterogeneousNodesContainer] = ...,
+            _heterogeneous_edges_aggregation: _typing.Optional[_HeterogeneousEdgesAggregation] = ...,
+            graph_data_container: _typing.Optional[_StaticGraphDataContainer] = ...
+    ):
+        self._static_graph_data_container: _StaticGraphDataContainer = (
+            graph_data_container
+            if isinstance(graph_data_container, _StaticGraphDataContainer)
+            else _StaticGraphDataAggregation()
+        )
+        self._heterogeneous_nodes_container: _HeterogeneousNodesContainer = (
+            _heterogeneous_nodes_container
+            if isinstance(_heterogeneous_nodes_container, _HeterogeneousNodesContainer)
+            else _HeterogeneousNodesContainerImplementation()
+        )
+        self._heterogeneous_edges_aggregation: _HeterogeneousEdgesAggregation = (
+            _heterogeneous_edges_aggregation
+            if isinstance(_heterogeneous_edges_aggregation, _HeterogeneousEdgesAggregation)
+            else _HeterogeneousEdgesAggregationImplementation()
+        )
+
+    @property
+    def nodes(self) -> _IntegralNodeView:
+        return _IntegralNodeView(self._heterogeneous_nodes_container)
+
+    @property
+    def edges(self) -> _HeterogeneousEdgesView:
+        return _HeterogeneousEdgesView(self._heterogeneous_edges_aggregation)
+
+    @property
+    def data(self) -> _StaticGraphDataView:
+        return _StaticGraphDataView(self._static_graph_data_container)
+
+
+class GeneralStaticGraphGenerator:
+    @classmethod
+    def create_homogeneous_static_graph(
+            cls, nodes_data: _typing.Mapping[str, torch.Tensor],
+            edges_connections: torch.Tensor,
+            edges_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...,
+            graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
+    ) -> GeneralStaticGraph:
+        _heterogeneous_nodes_container: _HeterogeneousNodesContainer = (
+            _HeterogeneousNodesContainerImplementation({'': nodes_data})
+        )
+        _heterogeneous_edges_aggregation: _HeterogeneousEdgesAggregation = (
+            _HeterogeneousEdgesAggregationImplementation()
+        )
+        _heterogeneous_edges_aggregation[('', '', '')] = (
+            _HomogeneousEdgesContainerImplementation(
+                edges_connections, edges_data
+            )
+        )
+        return GeneralStaticGraphImplementation(
+            _heterogeneous_nodes_container,
+            _heterogeneous_edges_aggregation,
+            _StaticGraphDataAggregation(graph_data)
+        )
diff --git a/autogl/data/graph/utils/__init__.py b/autogl/data/graph/utils/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/autogl/data/graph/utils/conversion.py b/autogl/data/graph/utils/conversion.py
new file mode 100644
index 0000000..29898fa
--- /dev/null
+++ b/autogl/data/graph/utils/conversion.py
@@ -0,0 +1 @@
+from .._general_static_graph.utils.conversion import *
diff --git a/autogl/datasets/README.md b/autogl/datasets/README.md
deleted file mode 100644
index 416bcb5..0000000
--- a/autogl/datasets/README.md
+++ /dev/null
@@ -1,65 +0,0 @@
-
-Datasets are derived from PyG, OGB and CogDL.
-=================
-AutoGL now supports the following benchmarks for different tasks:
-- semi-supervised node classification: Cora, Citeseer, Pubmed, Amazon Computers\*, Amazon Photo\*, Coauthor CS\*, Coauthor Physics\*, Reddit （\*: using `utils.random_splits_mask_class` for splitting dataset is recommended.)
-
-
-|  Dataset  |  PyG  |  CogDL  | x | y | edge_index | edge_attr | train/val/test node | train/val/test mask |
-|  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |
-| Cora | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  | ✓ |
-| Citeseer | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  | ✓ |
-| Pubmed | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  | ✓ |
-| Amazon Computers | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |  |
-| Amazon Photo | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |  |
-| Coauthor CS | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |  |
-| Coauthor Physics | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |  |
-| Reddit | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  | ✓ |
-
-
-- supervised graph classification: MUTAG, IMDB-B, IMDB-M, PROTEINS, COLLAB
-
-|  Dataset  |  PyG  |  CogDL  | x | y | edge_index | edge_attr | train/val/test node | train/val/test mask | adj|
-|  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |
-| Mutag | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |    |    |
-| IMDB-B | ✓ |    |    | ✓ | ✓   |    |  |    |    |
-| IMDB-M | ✓ |    |    | ✓ | ✓   |    |  |    |    |
-| PROTEINS | ✓ |    |  ✓  | ✓ | ✓   |    |  |    |    |
-| COLLAB | ✓ |    |    | ✓ | ✓   |    |  |    |    |
-
-- node classification datasets from OGB: ogbn-products, ogbn-proteins, ogbn-arxiv, ogbn-papers100M and ogbn-mag.
-
-- graph classification datasets from OGB: ogbg-molhiv, ogbg-molpcba, ogbg-ppa and ogbg-code.
-
----
-
-TODO:
-In future version, AutoGL will support the following benchmarks for different tasks:
-- unsupervised node classification: PPI, Blogcatalog, Wikipedia
-- heterogeneous node classification: DBLP, ACM, IMDB
-- link prediction: PPI, Wikipedia, Blogcatalog
-- multiplex link prediction: Amazon, YouTube, Twitter
-- link prediction datasets from OGB: ogbl-ppa, ogbl-collab, ogbl-ddi, ogbl-citation, ogbl-wikikg and ogbl-biokg.
-
-<!--
-|  Dataset  |  PyG  |  CogDL  | x | y | edge_index | edge_attr | train/val/test node | train/val/test mask | adj|
-|  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |
-|  ACM  |  |  ✓  |  ✓  | ✓ |  ✓  |    | ✓ |    | ✓ list |
-|  DBLP |  |  ✓  |  ✓  | ✓ |  ✓  |    | ✓ |    | ✓ list |
-|  IMDB |  |  ✓  |  ✓  | ✓ |  ✓  |    | ✓ |    | ✓ list |
-| Flickr |  |  ✓  |    | ✓ |  ✓  |  ✓  |  |    |    |
-| Blogcatalog |  |  ✓  |    | ✓ |  ✓  |  ✓  |  |    |    |
-| PPI |  |  ✓  |    | ✓ |  ✓  |  ✓  |  |    |    |
-| Wikipedia |  |  ✓  |    | ✓ |  ✓  |  ✓  |  |    |    |
-| Amazon |  |  ✓  |    |  |    |    | ✓ data |    |    |
-| Twitter |  |  ✓  |    |  |    |    | ✓ data |    |    |
-| Youtube |  |  ✓  |    |  |    |    | ✓ data |    |    |
-| NCI1 | ✓ |    |  ✓  | ✓ |  ✓  |    |  |    |    |
-| NCI109 | ✓ |    |  ✓  | ✓ |  ✓  |    |  |    |    |
-| Enzyme | ✓ |    |  ✓  | ✓ |  ✓  |    |  |    |    |
-| Reddit-B | ✓ |    |    | ✓ | ✓   |    |  |    |    |
-| Reddit-Multi-5k | ✓ |    |    | ✓ | ✓   |    |  |    |    |
-| Reddit-Multi-12k | ✓ |    |    | ✓ | ✓   |    |  |    |    |
-| PTC-MR | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |    |    |
--->
-
diff --git a/autogl/datasets/__init__.py b/autogl/datasets/__init__.py
index df450d1..90b94af 100644
--- a/autogl/datasets/__init__.py
+++ b/autogl/datasets/__init__.py
@@ -1,203 +1,70 @@
-import os.path as osp
-import os
-import torch
-from ..data.dataset import Dataset
-
-
-try:
-    import torch_geometric
-except ImportError:
-    torch_geometric = None
-    pyg = False
-else:
-    pyg = True
-
-DATASET_DICT = {}
-
-
-def register_dataset(name):
-    """
-    New dataset types can be added to autogl with the :func:`register_dataset`
-    function decorator.
-
-    For example::
-
-        @register_dataset('my_dataset')
-        class MyDataset():
-            (...)
-
-    Args:
-        name (str): the name of the dataset
-    """
-
-    def register_dataset_cls(cls):
-        if name in DATASET_DICT:
-            raise ValueError("Cannot register duplicate dataset ({})".format(name))
-        if not issubclass(cls, Dataset) and (
-            pyg and not issubclass(cls, torch_geometric.data.Dataset)
-        ):
-            raise ValueError(
-                "Dataset ({}: {}) must extend autogl.data.Dataset".format(
-                    name, cls.__name__
-                )
-            )
-        DATASET_DICT[name] = cls
-        return cls
-
-    return register_dataset_cls
-
-
-from .pyg import (
-    AmazonComputersDataset,
-    AmazonPhotoDataset,
-    CoauthorPhysicsDataset,
-    CoauthorCSDataset,
-    CoraDataset,
-    CiteSeerDataset,
-    PubMedDataset,
-    RedditDataset,
-    MUTAGDataset,
-    IMDBBinaryDataset,
-    IMDBMultiDataset,
-    CollabDataset,
-    ProteinsDataset,
-    REDDITBinary,
-    REDDITMulti5K,
-    REDDITMulti12K,
-    PTCMRDataset,
-    NCI1Dataset,
-    ENZYMES,
-    QM9Dataset,
-)
-from .ogb import (
-    OGBNproductsDataset,
-    OGBNproteinsDataset,
-    OGBNarxivDataset,
-    OGBNpapers100MDataset,
-    OGBNmagDataset,
-    OGBGmolhivDataset,
-    OGBGmolpcbaDataset,
-    OGBGppaDataset,
-    OGBGcodeDataset,
-    OGBLppaDataset,
-    OGBLcollabDataset,
-    OGBLddiDataset,
-    OGBLcitationDataset,
-    OGBLwikikgDataset,
-    OGBLbiokgDataset,
-)
-from .gatne import GatneDataset, AmazonDataset, TwitterDataset, YouTubeDataset
-from .gtn_data import GTNDataset, ACM_GTNDataset, DBLP_GTNDataset, IMDB_GTNDataset
-from .han_data import HANDataset, ACM_HANDataset, DBLP_HANDataset, IMDB_HANDataset
-from .matlab_matrix import (
-    MatlabMatrix,
-    BlogcatalogDataset,
-    WikipediaDataset,
-    PPIDataset,
-)
-from .modelnet import (
-    ModelNet10,
-    ModelNet40,
-    ModelNet10Train,
-    ModelNet10Test,
-    ModelNet40Train,
-    ModelNet40Test,
-)
-from .utils import (
-    get_label_number,
-    random_splits_mask,
-    random_splits_mask_class,
-    graph_cross_validation,
-    graph_set_fold_id,
-    graph_random_splits,
-    graph_get_split,
+from autogl import backend as _backend
+from ._dataset_registry import (
+    DatasetUniversalRegistry,
+    build_dataset_from_name
 )
 
+from ._gtn_data import (
+    GTNACMDataset,
+    GTNDBLPDataset,
+    GTNIMDBDataset,
+)
 
-def build_dataset(args, path="~/.cache-autogl/"):
-    path = osp.join(path, "data", args.dataset)
-    path = os.path.expanduser(path)
-    return DATASET_DICT[args.dataset](path)
-
-
-def build_dataset_from_name(dataset_name, path="~/.cache-autogl/"):
-    path = osp.join(path, "data", dataset_name)
-    path = os.path.expanduser(path)
-    dataset = DATASET_DICT[dataset_name](path)
-    if "ogbn" in dataset_name:
-        # dataset.data, dataset.slices = dataset.collate([dataset.data])
-        # dataset.data.num_nodes = dataset.data.num_nodes[0]
-        if dataset.data.y.shape[-1] == 1:
-            dataset.data.y = torch.squeeze(dataset.data.y)
-    return dataset
-
+from ._matlab_matrix import BlogCatalogDataset, WIKIPEDIADataset
+from ._ogb import (
+    OGBNProductsDataset, OGBNProteinsDataset, OGBNArxivDataset, OGBNPapers100MDataset,
+    OGBLPPADataset, OGBLCOLLABDataset, OGBLDDIDataset, OGBLCitation2Dataset,
+    OGBGMOLHIVDataset, OGBGMOLPCBADataset, OGBGPPADataset, OGBGCode2Dataset
+)
 
-__all__ = [
-    "register_dataset",
-    "build_dataset",
-    "build_dataset_from_name",
-    "get_label_number",
-    "random_splits_mask",
-    "random_splits_mask_class",
-    "graph_cross_validation",
-    "graph_set_fold_id",
-    "graph_random_splits",
-    "graph_get_split",
-    "AmazonComputersDataset",
-    "AmazonPhotoDataset",
-    "CoauthorPhysicsDataset",
-    "CoauthorCSDataset",
-    "CoraDataset",
-    "CiteSeerDataset",
-    "PubMedDataset",
-    "RedditDataset",
-    "MUTAGDataset",
-    "IMDBBinaryDataset",
-    "IMDBMultiDataset",
-    "CollabDataset",
-    "ProteinsDataset",
-    "REDDITBinary",
-    "REDDITMulti5K",
-    "REDDITMulti12K",
-    "PTCMRDataset",
-    "NCI1Dataset",
-    "ENZYMES",
-    "QM9Dataset",
-    "OGBNproductsDataset",
-    "OGBNproteinsDataset",
-    "OGBNarxivDataset",
-    "OGBNpapers100MDataset",
-    "OGBNmagDataset",
-    "OGBGmolhivDataset",
-    "OGBGmolpcbaDataset",
-    "OGBGppaDataset",
-    "OGBGcodeDataset",
-    "OGBLppaDataset",
-    "OGBLcollabDataset",
-    "OGBLddiDataset",
-    "OGBLcitationDataset",
-    "OGBLwikikgDataset",
-    "OGBLbiokgDataset",
-    "GatneDataset",
-    "AmazonDataset",
-    "TwitterDataset",
-    "YouTubeDataset",
-    "GTNDataset",
-    "ACM_GTNDataset",
-    "DBLP_GTNDataset",
-    "IMDB_GTNDataset",
-    "HANDataset",
-    "ACM_HANDataset",
-    "DBLP_HANDataset",
-    "IMDB_HANDataset",
-    "MatlabMatrix",
-    "BlogcatalogDataset",
-    "WikipediaDataset",
-    "PPIDataset",
-    "ModelNet10",
-    "ModelNet40",
-    "ModelNet10Train",
-    "ModelNet10Test",
-    "ModelNet40Train",
-    "ModelNet40Test",
-]
+if _backend.DependentBackend.is_dgl():
+    from ._dgl import (
+        CoraDataset,
+        CiteSeerDataset,
+        PubMedDataset,
+        RedditDataset,
+        AmazonComputersDataset,
+        AmazonPhotoDataset,
+        CoauthorPhysicsDataset,
+        CoauthorCSDataset,
+        MUTAGDataset,
+        ENZYMESDataset,
+        IMDBBinaryDataset,
+        IMDBMultiDataset,
+        RedditBinaryDataset,
+        REDDITMulti5KDataset,
+        COLLABDataset,
+        ProteinsDataset,
+        PTCMRDataset,
+        NCI1Dataset
+    )
+elif _backend.DependentBackend.is_pyg():
+    from ._pyg import (
+        CoraDataset,
+        CiteSeerDataset,
+        PubMedDataset,
+        FlickrDataset,
+        RedditDataset,
+        AmazonComputersDataset,
+        AmazonPhotoDataset,
+        CoauthorPhysicsDataset,
+        CoauthorCSDataset,
+        PPIDataset,
+        QM9Dataset,
+        MUTAGDataset,
+        ENZYMESDataset,
+        IMDBBinaryDataset,
+        IMDBMultiDataset,
+        RedditBinaryDataset,
+        REDDITMulti5KDataset,
+        REDDITMulti12KDataset,
+        COLLABDataset,
+        ProteinsDataset,
+        PTCMRDataset,
+        NCI1Dataset,
+        NCI109Dataset,
+        ModelNet10TrainingDataset,
+        ModelNet10TestDataset,
+        ModelNet40TrainingDataset,
+        ModelNet40TestDataset
+    )
diff --git a/autogl/datasets/_data_source.py b/autogl/datasets/_data_source.py
new file mode 100644
index 0000000..e6c48da
--- /dev/null
+++ b/autogl/datasets/_data_source.py
@@ -0,0 +1,80 @@
+import os
+import typing as _typing
+
+
+class OnlineDataSource:
+    @property
+    def _raw_directory(self) -> str:
+        return os.path.join(self.__path, "raw")
+
+    @property
+    def _processed_directory(self) -> str:
+        return os.path.join(self.__path, "processed")
+
+    @property
+    def _raw_filenames(self) -> _typing.Iterable[str]:
+        raise NotImplementedError
+
+    @property
+    def _processed_filenames(self) -> _typing.Iterable[str]:
+        raise NotImplementedError
+
+    @property
+    def _raw_file_paths(self) -> _typing.Iterable[str]:
+        return [
+            os.path.join(self._raw_directory, raw_filename)
+            for raw_filename in self._raw_filenames
+        ]
+
+    @property
+    def _processed_file_paths(self) -> _typing.Iterable[str]:
+        return [
+            os.path.join(self._processed_directory, processed_filename)
+            for processed_filename in self._processed_filenames
+        ]
+
+    @classmethod
+    def __files_exist(cls, files: _typing.Iterable[str]) -> bool:
+        return all([os.path.exists(file) for file in files])
+
+    @classmethod
+    def __make_directory(cls, path):
+        import errno
+        try:
+            os.makedirs(os.path.expanduser(os.path.normpath(path)))
+        except OSError as e:
+            if e.errno != errno.EEXIST and os.path.isdir(path):
+                raise e
+
+    def _fetch(self):
+        raise NotImplementedError
+
+    def __fetch(self):
+        if not self.__files_exist(self._raw_file_paths):
+            self.__make_directory(self._raw_directory)
+            self._fetch()
+
+    def _process(self):
+        raise NotImplementedError
+
+    def __preprocess(self):
+        if not self.__files_exist(self._processed_file_paths):
+            self.__make_directory(self._processed_directory)
+            self._process()
+
+    def __getitem__(self, index: int) -> _typing.Any:
+        raise NotImplementedError
+
+    def __len__(self) -> int:
+        raise NotImplementedError
+
+    def __init__(
+            self, path: str,
+            # transform: _typing.Optional[_typing.Callable[[_typing.Any], _typing.Any]] = ...
+    ):
+        self.__path: str = os.path.expanduser(os.path.normpath(path))
+        # self.__transform: _typing.Optional[_typing.Callable[[_typing.Any], _typing.Any]] = (
+        #     transform if transform not in (Ellipsis, None) and callable(transform) else None
+        # )
+        self.__fetch()
+        self.__preprocess()
diff --git a/autogl/datasets/_dataset_registry.py b/autogl/datasets/_dataset_registry.py
new file mode 100644
index 0000000..683569a
--- /dev/null
+++ b/autogl/datasets/_dataset_registry.py
@@ -0,0 +1,45 @@
+import os
+import typing as _typing
+from autogl.data import Dataset
+
+
+class _DatasetUniversalRegistryMetaclass(type):
+    def __new__(
+            mcs, name: str, bases: _typing.Tuple[type, ...],
+            namespace: _typing.Dict[str, _typing.Any]
+    ):
+        return super(_DatasetUniversalRegistryMetaclass, mcs).__new__(
+            mcs, name, bases, namespace
+        )
+
+    def __init__(
+            cls, name: str, bases: _typing.Tuple[type, ...],
+            namespace: _typing.Dict[str, _typing.Any]
+    ):
+        super(_DatasetUniversalRegistryMetaclass, cls).__init__(name, bases, namespace)
+        cls._dataset_universal_registry: _typing.MutableMapping[str, _typing.Type[Dataset]] = {}
+
+
+class DatasetUniversalRegistry(metaclass=_DatasetUniversalRegistryMetaclass):
+    @classmethod
+    def register_dataset(cls, dataset_name: str):
+        def register_dataset_cls(dataset: _typing.Type[Dataset]):
+            if dataset_name in cls._dataset_universal_registry:
+                raise ValueError(f"Dataset with name \"{dataset_name}\" already exists!")
+            elif not issubclass(dataset, Dataset):
+                raise TypeError
+            else:
+                cls._dataset_universal_registry[dataset_name] = dataset
+                return dataset
+
+        return register_dataset_cls
+
+    @classmethod
+    def get_dataset(cls, dataset_name: str) -> _typing.Type[Dataset]:
+        return cls._dataset_universal_registry.get(dataset_name)
+
+
+def build_dataset_from_name(dataset_name: str, path: str = "~/.cache-autogl/"):
+    path = os.path.expanduser(os.path.join(path, "data", dataset_name))
+    _dataset = DatasetUniversalRegistry.get_dataset(dataset_name)
+    return _dataset(path)
diff --git a/autogl/datasets/_dgl.py b/autogl/datasets/_dgl.py
new file mode 100644
index 0000000..d7c9fb6
--- /dev/null
+++ b/autogl/datasets/_dgl.py
@@ -0,0 +1,491 @@
+import os
+import torch
+import dgl
+
+# from autogl.data.graph import GeneralStaticGraphGenerator
+from autogl.data.graph.utils import conversion as _conversion
+from autogl.data import InMemoryStaticGraphSet
+from ._dataset_registry import DatasetUniversalRegistry
+
+
+@DatasetUniversalRegistry.register_dataset("cora")
+class CoraDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.CoraGraphDataset(
+            os.path.join(path, '_dgl')
+        )
+        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
+        super(CoraDataset, self).__init__(
+            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
+        )
+        # super(CoraDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'feat': dgl_graph.ndata['feat'],
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'train_mask': dgl_graph.ndata['train_mask'],
+        #                 'val_mask': dgl_graph.ndata['val_mask'],
+        #                 'test_mask': dgl_graph.ndata['test_mask']
+        #             },
+        #             torch.vstack(dgl_graph.edges())
+        #         )
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("CiteSeer".lower())
+class CiteSeerDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.CiteseerGraphDataset(
+            os.path.join(path, '_dgl')
+        )
+        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
+        super(CiteSeerDataset, self).__init__(
+            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
+        )
+        # super(CiteSeerDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'feat': dgl_graph.ndata['feat'],
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'train_mask': dgl_graph.ndata['train_mask'],
+        #                 'val_mask': dgl_graph.ndata['val_mask'],
+        #                 'test_mask': dgl_graph.ndata['test_mask']
+        #             },
+        #             torch.vstack(dgl_graph.edges())
+        #         )
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("PubMed".lower())
+class PubMedDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.PubmedGraphDataset(
+            os.path.join(path, '_dgl')
+        )
+        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
+        super(PubMedDataset, self).__init__(
+            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
+        )
+        # super(PubMedDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'feat': dgl_graph.ndata['feat'],
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'train_mask': dgl_graph.ndata['train_mask'],
+        #                 'val_mask': dgl_graph.ndata['val_mask'],
+        #                 'test_mask': dgl_graph.ndata['test_mask']
+        #             },
+        #             torch.vstack(dgl_graph.edges())
+        #         )
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("reddit")
+class RedditDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.RedditDataset(
+            raw_dir=os.path.join(path, '_dgl')
+        )
+        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
+        super(RedditDataset, self).__init__(
+            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
+        )
+        # super(RedditDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'feat': dgl_graph.ndata['feat'],
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'train_mask': dgl_graph.ndata['train_mask'],
+        #                 'val_mask': dgl_graph.ndata['val_mask'],
+        #                 'test_mask': dgl_graph.ndata['test_mask']
+        #             },
+        #             torch.vstack(dgl_graph.edges())
+        #         )
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("amazon_computers")
+class AmazonComputersDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.AmazonCoBuyComputerDataset(
+            raw_dir=os.path.join(path, '_dgl')
+        )
+        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
+        super(AmazonComputersDataset, self).__init__(
+            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
+        )
+        # super(AmazonComputersDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'feat': dgl_graph.ndata['feat'],
+        #                 'label': dgl_graph.ndata['label']
+        #             },
+        #             torch.vstack(dgl_graph.edges())
+        #         )
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("amazon_photo")
+class AmazonPhotoDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.AmazonCoBuyPhotoDataset(
+            raw_dir=os.path.join(path, '_dgl')
+        )
+        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
+        super(AmazonPhotoDataset, self).__init__(
+            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
+        )
+        # super(AmazonPhotoDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'feat': dgl_graph.ndata['feat'],
+        #                 'label': dgl_graph.ndata['label']
+        #             },
+        #             torch.vstack(dgl_graph.edges())
+        #         )
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("coauthor_physics")
+class CoauthorPhysicsDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.CoauthorPhysicsDataset(
+            raw_dir=os.path.join(path, '_dgl')
+        )
+        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
+        super(CoauthorPhysicsDataset, self).__init__(
+            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
+        )
+        # super(CoauthorPhysicsDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'feat': dgl_graph.ndata['feat'],
+        #                 'label': dgl_graph.ndata['label']
+        #             },
+        #             torch.vstack(dgl_graph.edges())
+        #         )
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("coauthor_cs")
+class CoauthorCSDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.CoauthorCSDataset(
+            raw_dir=os.path.join(path, '_dgl')
+        )
+        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
+        super(CoauthorCSDataset, self).__init__(
+            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
+        )
+        # super(CoauthorCSDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'feat': dgl_graph.ndata['feat'],
+        #                 'label': dgl_graph.ndata['label']
+        #             },
+        #             torch.vstack(dgl_graph.edges())
+        #         )
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("mutag")
+class MUTAGDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.TUDataset(
+            "MUTAG", raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(MUTAGDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("enzymes")
+class ENZYMESDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.TUDataset(
+            "ENZYMES", raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(ENZYMESDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+        # super(ENZYMESDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'node_labels': dgl_graph.ndata['node_labels'],
+        #                 'node_attr': dgl_graph.ndata['node_attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': label}
+        #         ) for (dgl_graph, label) in dgl_dataset
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("imdb-b")
+class IMDBBinaryDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.GINDataset(
+            "IMDBBINARY", False, raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(IMDBBinaryDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+        # super(IMDBBinaryDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("imdb-m")
+class IMDBMultiDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.GINDataset(
+            "IMDBMULTI", False, raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(IMDBMultiDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+        # super(IMDBMultiDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("reddit-b")
+class RedditBinaryDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.GINDataset(
+            "REDDITBINARY", False, raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(RedditBinaryDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+        # super(RedditBinaryDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("reddit-multi-5k")
+class REDDITMulti5KDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.GINDataset(
+            "REDDITMULTI5K", False, raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(REDDITMulti5KDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+
+        # super(REDDITMulti5KDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("collab")
+class COLLABDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.GINDataset(
+            "COLLAB", False, raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(COLLABDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+        # super(COLLABDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("proteins")
+class ProteinsDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.GINDataset(
+            "PROTEINS", False, raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(ProteinsDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+        # super(ProteinsDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("ptc-mr")
+class PTCMRDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.GINDataset(
+            "PTC", False, raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(PTCMRDataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+        # super(PTCMRDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
+
+
+@DatasetUniversalRegistry.register_dataset("nci1")
+class NCI1Dataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        dgl_dataset = dgl.data.GINDataset(
+            "NCI1", False, raw_dir=os.path.join(path, "_dgl")
+        )
+
+        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
+            static_graph.data['label'] = label
+            return static_graph
+
+        super(NCI1Dataset, self).__init__(
+            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
+        )
+        # super(NCI1Dataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
diff --git a/autogl/datasets/_gtn_data.py b/autogl/datasets/_gtn_data.py
new file mode 100644
index 0000000..96f7acb
--- /dev/null
+++ b/autogl/datasets/_gtn_data.py
@@ -0,0 +1,244 @@
+import os
+import os.path as osp
+import shutil
+import pickle
+import numpy as np
+import torch
+import typing as _typing
+
+from autogl.data import Data, download_url, InMemoryStaticGraphSet
+from autogl.data.graph import GeneralStaticGraphGenerator
+from ._dataset_registry import DatasetUniversalRegistry
+from ._data_source import OnlineDataSource
+from .. import backend as _backend
+
+
+def _untar(path, fname, delete_tar=True):
+    """
+    Unpacks the given archive file to the same directory, then (by default)
+    deletes the archive file.
+    """
+    print("unpacking " + fname)
+    full_path = os.path.join(path, fname)
+    shutil.unpack_archive(full_path, path)
+    if delete_tar:
+        os.remove(full_path)
+
+
+class _GTNDataSource(OnlineDataSource):
+    def __init__(self, path: str, name: str):
+        self.__name: str = name
+        self.__url: str = (
+            f"https://github.com/cenyk1230/gtn-data/blob/master/{name}.zip?raw=true"
+        )
+        super(_GTNDataSource, self).__init__(path)
+        self.__data = torch.load(list(self._processed_file_paths)[0])
+
+    @property
+    def _raw_filenames(self) -> _typing.Iterable[str]:
+        return ["edges.pkl", "labels.pkl", "node_features.pkl"]
+
+    @property
+    def _processed_filenames(self) -> _typing.Iterable[str]:
+        return ["data.pt"]
+
+    def __read_gtn_data(self, directory):
+        edges = pickle.load(open(osp.join(directory, "edges.pkl"), "rb"))
+        labels = pickle.load(open(osp.join(directory, "labels.pkl"), "rb"))
+        node_features = pickle.load(open(osp.join(directory, "node_features.pkl"), "rb"))
+
+        data = Data()
+        data.x = torch.from_numpy(node_features).float()
+
+        num_nodes = edges[0].shape[0]
+
+        node_type = np.zeros(num_nodes, dtype=int)
+        assert len(edges) == 4
+        assert len(edges[0].nonzero()) == 2
+
+        node_type[edges[0].nonzero()[0]] = 0
+        node_type[edges[0].nonzero()[1]] = 1
+        node_type[edges[1].nonzero()[0]] = 1
+        node_type[edges[1].nonzero()[1]] = 0
+        node_type[edges[2].nonzero()[0]] = 0
+        node_type[edges[2].nonzero()[1]] = 2
+        node_type[edges[3].nonzero()[0]] = 2
+        node_type[edges[3].nonzero()[1]] = 0
+
+        print(node_type)
+        data.pos = torch.from_numpy(node_type)
+
+        edge_list = []
+        for i, edge in enumerate(edges):
+            edge_tmp = torch.from_numpy(
+                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
+            ).long()
+            edge_list.append(edge_tmp)
+        data.edge_index = torch.cat(edge_list, 1)
+
+        A = []
+        for i, edge in enumerate(edges):
+            edge_tmp = torch.from_numpy(
+                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
+            ).long()
+            value_tmp = torch.ones(edge_tmp.shape[1]).float()
+            A.append((edge_tmp, value_tmp))
+        edge_tmp = torch.stack(
+            (torch.arange(0, num_nodes), torch.arange(0, num_nodes))
+        ).long()
+        value_tmp = torch.ones(num_nodes).float()
+        A.append((edge_tmp, value_tmp))
+        data.adj = A
+
+        data.train_node = torch.from_numpy(np.array(labels[0])[:, 0]).long()
+        data.train_target = torch.from_numpy(np.array(labels[0])[:, 1]).long()
+        data.valid_node = torch.from_numpy(np.array(labels[1])[:, 0]).long()
+        data.valid_target = torch.from_numpy(np.array(labels[1])[:, 1]).long()
+        data.test_node = torch.from_numpy(np.array(labels[2])[:, 0]).long()
+        data.test_target = torch.from_numpy(np.array(labels[2])[:, 1]).long()
+
+        y = np.zeros(num_nodes, dtype=int)
+        x_index = torch.cat((data.train_node, data.valid_node, data.test_node))
+        y_index = torch.cat((data.train_target, data.valid_target, data.test_target))
+        y[x_index.numpy()] = y_index.numpy()
+        data.y = torch.from_numpy(y)
+        self.__data = data
+
+    def __transform_gtn_data(self):
+        self.__data.train_mask: torch.Tensor = torch.zeros(self.__data.x.size(0), dtype=torch.bool)
+        self.__data.val_mask: torch.Tensor = torch.zeros(self.__data.x.size(0), dtype=torch.bool)
+        self.__data.test_mask: torch.Tensor = torch.zeros(self.__data.x.size(0), dtype=torch.bool)
+        self.__data.train_mask[getattr(self.__data, "train_node")] = True
+        self.__data.val_mask[getattr(self.__data, "valid_node")] = True
+        self.__data.test_mask[getattr(self.__data, "test_node")] = True
+
+    def _fetch(self):
+        download_url(self.__url, self._raw_directory, name=f"{self.__name}.zip")
+        _untar(self._raw_directory, f"{self.__name}.zip")
+
+    def _process(self):
+        self.__read_gtn_data(self._raw_directory)
+        self.__transform_gtn_data()
+        torch.save(self.__data, list(self._processed_file_paths)[0])
+
+    def __len__(self) -> int:
+        return 1
+
+    def __getitem__(self, index):
+        if index != 0:
+            raise IndexError
+        return self.__data
+
+
+@DatasetUniversalRegistry.register_dataset("gtn-acm")
+class GTNACMDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        data = _GTNDataSource(path, "gtn-acm")[0]
+        if _backend.DependentBackend.is_dgl():
+            super(GTNACMDataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {
+                            'feat': getattr(data, 'x'),
+                            'label': getattr(data, 'y'),
+                            'pos': getattr(data, 'pos'),
+                            'train_mask': getattr(data, 'train_mask'),
+                            'val_mask': getattr(data, 'val_mask'),
+                            'test_mask': getattr(data, 'test_mask')
+                        },
+                        getattr(data, 'edge_index')
+                    )
+                ]
+            )
+        elif _backend.DependentBackend.is_pyg():
+            super(GTNACMDataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {
+                            'x': getattr(data, 'x'),
+                            'y': getattr(data, 'y'),
+                            'pos': getattr(data, 'pos'),
+                            'train_mask': getattr(data, 'train_mask'),
+                            'val_mask': getattr(data, 'val_mask'),
+                            'test_mask': getattr(data, 'test_mask')
+                        },
+                        getattr(data, 'edge_index')
+                    )
+                ]
+            )
+
+
+@DatasetUniversalRegistry.register_dataset("gtn-dblp")
+class GTNDBLPDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        data = _GTNDataSource(path, "gtn-dblp")[0]
+        if _backend.DependentBackend.is_dgl():
+            super(GTNDBLPDataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {
+                            'feat': getattr(data, 'x'),
+                            'label': getattr(data, 'y'),
+                            'pos': getattr(data, 'pos'),
+                            'train_mask': getattr(data, 'train_mask'),
+                            'val_mask': getattr(data, 'val_mask'),
+                            'test_mask': getattr(data, 'test_mask')
+                        },
+                        getattr(data, 'edge_index')
+                    )
+                ]
+            )
+        elif _backend.DependentBackend.is_pyg():
+            super(GTNDBLPDataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {
+                            'x': getattr(data, 'x'),
+                            'y': getattr(data, 'y'),
+                            'pos': getattr(data, 'pos'),
+                            'train_mask': getattr(data, 'train_mask'),
+                            'val_mask': getattr(data, 'val_mask'),
+                            'test_mask': getattr(data, 'test_mask')
+                        },
+                        getattr(data, 'edge_index')
+                    )
+                ]
+            )
+
+
+@DatasetUniversalRegistry.register_dataset("gtn-imdb")
+class GTNIMDBDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        data = _GTNDataSource(path, "gtn-imdb")[0]
+        if _backend.DependentBackend.is_dgl():
+            super(GTNIMDBDataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {
+                            'feat': getattr(data, 'x'),
+                            'label': getattr(data, 'y'),
+                            'pos': getattr(data, 'pos'),
+                            'train_mask': getattr(data, 'train_mask'),
+                            'val_mask': getattr(data, 'val_mask'),
+                            'test_mask': getattr(data, 'test_mask')
+                        },
+                        getattr(data, 'edge_index')
+                    )
+                ]
+            )
+        elif _backend.DependentBackend.is_pyg():
+            super(GTNIMDBDataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {
+                            'x': getattr(data, 'x'),
+                            'y': getattr(data, 'y'),
+                            'pos': getattr(data, 'pos'),
+                            'train_mask': getattr(data, 'train_mask'),
+                            'val_mask': getattr(data, 'val_mask'),
+                            'test_mask': getattr(data, 'test_mask')
+                        },
+                        getattr(data, 'edge_index')
+                    )
+                ]
+            )
diff --git a/autogl/datasets/_matlab_matrix.py b/autogl/datasets/_matlab_matrix.py
new file mode 100644
index 0000000..1b50e9d
--- /dev/null
+++ b/autogl/datasets/_matlab_matrix.py
@@ -0,0 +1,112 @@
+import itertools
+import os
+
+import scipy.io
+import torch
+import typing as _typing
+
+from autogl.data import Data, download_url, InMemoryStaticGraphSet
+from autogl.data.graph import GeneralStaticGraphGenerator
+from ._dataset_registry import DatasetUniversalRegistry
+from ._data_source import OnlineDataSource
+from .. import backend as _backend
+
+
+class _MATLABMatrix(OnlineDataSource):
+    @property
+    def _raw_filenames(self) -> _typing.Iterable[str]:
+        splits = [self.__name]
+        files = ["mat"]
+        return [
+            "{}.{}".format(s, f) for s, f
+            in itertools.product(splits, files)
+        ]
+
+    @property
+    def _processed_filenames(self) -> _typing.Iterable[str]:
+        return ["data.pt"]
+
+    def _fetch(self):
+        for name in self._raw_filenames:
+            download_url(self.__url + name, self._raw_directory)
+
+    def _process(self):
+        path = os.path.join(self._raw_directory, f"{self.__name}.mat")
+        mat = scipy.io.loadmat(path)
+        adj_matrix, group = mat["network"], mat["group"]
+
+        y = torch.from_numpy(group.todense()).to(torch.float)
+
+        row_ind, col_ind = adj_matrix.nonzero()
+        edge_index = torch.stack([torch.tensor(row_ind), torch.tensor(col_ind)], dim=0)
+        edge_attr = torch.tensor(adj_matrix[row_ind, col_ind])
+        data = Data(edge_index=edge_index, edge_attr=edge_attr, x=None, y=y)
+        torch.save(data, list(self._processed_file_paths)[0])
+
+    def __len__(self) -> int:
+        return 1
+
+    def __getitem__(self, index: int):
+        if index != 0:
+            raise IndexError
+        return self.__data
+
+    def __init__(self, path: str, name: str, url: str):
+        self.__name: str = name
+        self.__url: str = url
+        super(_MATLABMatrix, self).__init__(path)
+        self.__data = torch.load(
+            list(self._processed_file_paths)[0]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("BlogCatalog".lower())
+class BlogCatalogDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        filename: str = "BlogCatalog".lower()
+        url: str = "http://leitang.net/code/social-dimension/data/"
+        data = _MATLABMatrix(path, filename, url)[0]
+        if _backend.DependentBackend.is_dgl():
+            super(BlogCatalogDataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {'label': data.y}, data.edge_index,
+                        {'edge_attr': data.edge_attr}
+                    )
+                ]
+            )
+        elif _backend.DependentBackend.is_pyg():
+            super(BlogCatalogDataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {'y': data.y}, data.edge_index,
+                        {'edge_attr': data.edge_attr}
+                    )
+                ]
+            )
+
+
+@DatasetUniversalRegistry.register_dataset("WikiPEDIA".lower())
+class WIKIPEDIADataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        filename: str = "POS"
+        url = "http://snap.stanford.edu/node2vec/"
+        data = _MATLABMatrix(path, filename, url)[0]
+        if _backend.DependentBackend.is_dgl():
+            super(WIKIPEDIADataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {'label': data.y}, data.edge_index,
+                        {'attr': data.edge_attr}
+                    )
+                ]
+            )
+        elif _backend.DependentBackend.is_pyg():
+            super(WIKIPEDIADataset, self).__init__(
+                [
+                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                        {'y': data.y}, data.edge_index,
+                        {'attr': data.edge_attr}
+                    )
+                ]
+            )
diff --git a/autogl/datasets/_ogb.py b/autogl/datasets/_ogb.py
new file mode 100644
index 0000000..a4abb26
--- /dev/null
+++ b/autogl/datasets/_ogb.py
@@ -0,0 +1,456 @@
+import numpy as np
+import torch
+import typing as _typing
+from ogb.nodeproppred import NodePropPredDataset
+from ogb.linkproppred import LinkPropPredDataset
+from ogb.graphproppred import GraphPropPredDataset
+
+from autogl import backend as _backend
+from autogl.data import InMemoryStaticGraphSet
+from autogl.data.graph import (
+    GeneralStaticGraph, GeneralStaticGraphGenerator
+)
+from ._dataset_registry import DatasetUniversalRegistry
+from .utils import index_to_mask
+
+
+class _OGBDatasetUtil:
+    ...
+
+
+class _OGBNDatasetUtil(_OGBDatasetUtil):
+    @classmethod
+    def ogbn_data_to_general_static_graph(
+            cls, ogbn_data: _typing.Mapping[str, _typing.Union[np.ndarray, int]],
+            nodes_label: np.ndarray = ..., nodes_label_key: str = ...,
+            train_index: _typing.Optional[np.ndarray] = ...,
+            val_index: _typing.Optional[np.ndarray] = ...,
+            test_index: _typing.Optional[np.ndarray] = ...,
+            nodes_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
+            edges_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
+            graph_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...
+    ) -> GeneralStaticGraph:
+        homogeneous_static_graph: GeneralStaticGraph = (
+            GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                dict([
+                    (target_key, torch.from_numpy(ogbn_data[source_key]))
+                    for source_key, target_key in nodes_data_key_mapping.items()
+                ]),
+                torch.from_numpy(ogbn_data['edge_index']),
+                dict([
+                    (target_key, torch.from_numpy(ogbn_data[source_key]))
+                    for source_key, target_key in edges_data_key_mapping.items()
+                ]) if isinstance(edges_data_key_mapping, _typing.Mapping) else ...,
+                dict([
+                    (target_key, torch.from_numpy(ogbn_data[source_key]))
+                    for source_key, target_key in graph_data_key_mapping.items()
+                ]) if isinstance(graph_data_key_mapping, _typing.Mapping) else ...
+            )
+        )
+        if isinstance(nodes_label, np.ndarray) and isinstance(nodes_label_key, str):
+            if ' ' in nodes_label_key:
+                raise ValueError("Illegal nodes label key")
+            homogeneous_static_graph.nodes.data[nodes_label_key] = (
+                torch.from_numpy(nodes_label.squeeze()).squeeze()
+            )
+        if train_index not in (Ellipsis, None) and isinstance(train_index, np.ndarray):
+            homogeneous_static_graph.nodes.data['train_mask'] = index_to_mask(
+                torch.from_numpy(train_index), ogbn_data['num_nodes']
+            )
+        if val_index not in (Ellipsis, None) and isinstance(val_index, np.ndarray):
+            homogeneous_static_graph.nodes.data['val_mask'] = index_to_mask(
+                torch.from_numpy(val_index), ogbn_data['num_nodes']
+            )
+        if test_index not in (Ellipsis, None) and isinstance(test_index, np.ndarray):
+            homogeneous_static_graph.nodes.data['test_mask'] = index_to_mask(
+                torch.from_numpy(test_index), ogbn_data['num_nodes']
+            )
+        return homogeneous_static_graph
+
+    @classmethod
+    def ogbn_dataset_to_general_static_graph(
+            cls, ogbn_dataset: NodePropPredDataset,
+            nodes_label_key: str,
+            nodes_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
+            edges_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
+            graph_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...
+    ) -> GeneralStaticGraph:
+        split_idx = ogbn_dataset.get_idx_split()
+        return cls.ogbn_data_to_general_static_graph(
+            ogbn_dataset[0][0],
+            ogbn_dataset[0][1],
+            nodes_label_key,
+            split_idx["train"],
+            split_idx["valid"],
+            split_idx["test"],
+            nodes_data_key_mapping,
+            edges_data_key_mapping,
+            graph_data_key_mapping
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ogbn-products")
+class OGBNProductsDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbn_dataset = NodePropPredDataset("ogbn-products", path)
+        if _backend.DependentBackend.is_dgl():
+            super(OGBNProductsDataset, self).__init__([
+                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
+                    ogbn_dataset, "label",
+                    {"node_feat": "feat"},
+                    {"edge_feat": "edge_feat"}
+                )
+            ])
+        elif _backend.DependentBackend.is_pyg():
+            super(OGBNProductsDataset, self).__init__([
+                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
+                    ogbn_dataset, "y",
+                    {"node_feat": "x"},
+                    {"edge_feat": "edge_feat"}
+                )
+            ])
+
+
+@DatasetUniversalRegistry.register_dataset("ogbn-proteins")
+class OGBNProteinsDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbn_dataset = NodePropPredDataset("ogbn-proteins", path)
+        if _backend.DependentBackend.is_dgl():
+            super(OGBNProteinsDataset, self).__init__([
+                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
+                    ogbn_dataset, "label",
+                    {
+                        "node_feat": "feat",
+                        "node_species": "species"
+                    },
+                    {"edge_feat": "edge_feat"}
+                )
+            ])
+        elif _backend.DependentBackend.is_pyg():
+            super(OGBNProteinsDataset, self).__init__([
+                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
+                    ogbn_dataset, "y",
+                    {
+                        "node_feat": "x",
+                        "node_species": "species"
+                    },
+                    {"edge_feat": "edge_feat"}
+                )
+            ])
+
+
+@DatasetUniversalRegistry.register_dataset("ogbn-arxiv")
+class OGBNArxivDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbn_dataset = NodePropPredDataset("ogbn-arxiv", path)
+        if _backend.DependentBackend.is_dgl():
+            super(OGBNArxivDataset, self).__init__([
+                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
+                    ogbn_dataset, "label",
+                    {
+                        "node_feat": "feat",
+                        "node_year": "year"
+                    },
+                    {"edge_feat": "edge_feat"}
+                )
+            ])
+        elif _backend.DependentBackend.is_pyg():
+            super(OGBNArxivDataset, self).__init__([
+                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
+                    ogbn_dataset, "y",
+                    {
+                        "node_feat": "x",
+                        "node_year": "year"
+                    },
+                    {"edge_feat": "edge_feat"}
+                )
+            ])
+
+
+@DatasetUniversalRegistry.register_dataset("ogbn-papers100M")
+class OGBNPapers100MDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbn_dataset = NodePropPredDataset("ogbn-papers100M", path)
+        if _backend.DependentBackend.is_dgl():
+            super(OGBNPapers100MDataset, self).__init__([
+                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
+                    ogbn_dataset, "label",
+                    {
+                        "node_feat": "feat",
+                        "node_year": "year"
+                    },
+                    {"edge_feat": "edge_feat"}
+                )
+            ])
+        elif _backend.DependentBackend.is_pyg():
+            super(OGBNPapers100MDataset, self).__init__([
+                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
+                    ogbn_dataset, "y",
+                    {
+                        "node_feat": "x",
+                        "node_year": "year"
+                    },
+                    {"edge_feat": "edge_feat"}
+                )
+            ])
+
+
+# todo: currently homogeneous dataset `ogbn-mag` NOT supported
+
+
+class _OGBLDatasetUtil(_OGBDatasetUtil):
+    @classmethod
+    def ogbl_data_to_general_static_graph(
+            cls, ogbl_data: _typing.Mapping[str, _typing.Union[np.ndarray, int]],
+            heterogeneous_edges: _typing.Mapping[
+                _typing.Tuple[str, str, str],
+                _typing.Union[
+                    torch.Tensor,
+                    _typing.Tuple[torch.Tensor, _typing.Optional[_typing.Mapping[str, torch.Tensor]]]
+                ]
+            ] = ...,
+            nodes_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
+            graph_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...
+    ) -> GeneralStaticGraph:
+        return GeneralStaticGraphGenerator.create_heterogeneous_static_graph(
+            {
+                '': dict([
+                    (target_data_key, torch.from_numpy(ogbl_data[source_data_key]).squeeze())
+                    for source_data_key, target_data_key in nodes_data_key_mapping.items()
+                ])
+            },
+            heterogeneous_edges,
+            dict([
+                (target_data_key, torch.from_numpy(ogbl_data[source_data_key]).squeeze())
+                for source_data_key, target_data_key in graph_data_key_mapping.items()
+            ]) if isinstance(graph_data_key_mapping, _typing.Mapping) else ...
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ogbl-ppa")
+class OGBLPPADataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbl_dataset = LinkPropPredDataset("ogbl-ppa", path)
+        edge_split = ogbl_dataset.get_edge_split()
+        super(OGBLPPADataset, self).__init__([
+            _OGBLDatasetUtil.ogbl_data_to_general_static_graph(
+                ogbl_dataset[0], {
+                    ('', '', ''): torch.from_numpy(ogbl_dataset[0]['edge_index']),
+                    ('', 'train_pos_edge', ''): torch.from_numpy(edge_split['train']['edge']),
+                    ('', 'val_pos_edge', ''): torch.from_numpy(edge_split['valid']['edge']),
+                    ('', 'val_neg_edge', ''): torch.from_numpy(edge_split['valid']['edge_neg']),
+                    ('', 'test_pos_edge', ''): torch.from_numpy(edge_split['test']['edge']),
+                    ('', 'test_neg_edge', ''): torch.from_numpy(edge_split['test']['edge_neg'])
+                },
+                {'node_feat': 'feat'} if _backend.DependentBackend.is_dgl() else {'node_feat': 'x'}
+            )
+        ])
+
+
+@DatasetUniversalRegistry.register_dataset("ogbl-collab")
+class OGBLCOLLABDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbl_dataset = LinkPropPredDataset("ogbl-collab", path)
+        edge_split = ogbl_dataset.get_edge_split()
+        super(OGBLCOLLABDataset, self).__init__([
+            _OGBLDatasetUtil.ogbl_data_to_general_static_graph(
+                ogbl_dataset[0], {
+                    ('', '', ''): torch.from_numpy(ogbl_dataset[0]['edge_index']),
+                    ('', 'train_pos_edge', ''): (
+                        torch.from_numpy(edge_split['train']['edge']),
+                        {
+                            'weight': torch.from_numpy(edge_split['train']['weight']),
+                            'year': torch.from_numpy(edge_split['train']['year'])
+                        }
+                    ),
+                    ('', 'val_pos_edge', ''): (
+                        torch.from_numpy(edge_split['valid']['edge']),
+                        {
+                            'weight': torch.from_numpy(edge_split['valid']['weight']),
+                            'year': torch.from_numpy(edge_split['valid']['year'])
+                        }
+                    ),
+                    ('', 'val_neg_edge', ''): torch.from_numpy(edge_split['valid']['edge_neg']),
+                    ('', 'test_pos_edge', ''): (
+                        torch.from_numpy(edge_split['test']['edge']),
+                        {
+                            'weight': torch.from_numpy(edge_split['test']['weight']),
+                            'year': torch.from_numpy(edge_split['test']['year'])
+                        }
+                    ),
+                    ('', 'test_neg_edge', ''): torch.from_numpy(edge_split['test']['edge_neg'])
+                },
+                {'node_feat': 'feat'} if _backend.DependentBackend.is_dgl() else {'node_feat': 'x'}
+            )
+        ])
+
+
+@DatasetUniversalRegistry.register_dataset("ogbl-ddi")
+class OGBLDDIDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbl_dataset = LinkPropPredDataset("ogbl-ddi", path)
+        edge_split = ogbl_dataset.get_edge_split()
+        super(OGBLDDIDataset, self).__init__([
+            GeneralStaticGraphGenerator.create_heterogeneous_static_graph(
+                {'': {'_NID': torch.arange(ogbl_dataset[0]['num_nodes'])}},
+                {
+                    ('', '', ''): torch.from_numpy(ogbl_dataset[0]['edge_index']),
+                    ('', 'train_pos_edge', ''): torch.from_numpy(edge_split['train']['edge']),
+                    ('', 'val_pos_edge', ''): torch.from_numpy(edge_split['valid']['edge']),
+                    ('', 'val_neg_edge', ''): torch.from_numpy(edge_split['valid']['edge_neg']),
+                    ('', 'test_pos_edge', ''): torch.from_numpy(edge_split['test']['edge']),
+                    ('', 'test_neg_edge', ''): torch.from_numpy(edge_split['test']['edge_neg'])
+                }
+            )
+        ])
+
+
+@DatasetUniversalRegistry.register_dataset("ogbl-citation")
+@DatasetUniversalRegistry.register_dataset("ogbl-citation2")
+class OGBLCitation2Dataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbl_dataset = LinkPropPredDataset("ogbl-citation2", path)
+        edge_split = ogbl_dataset.get_edge_split()
+        super(OGBLCitation2Dataset, self).__init__([
+            _OGBLDatasetUtil.ogbl_data_to_general_static_graph(
+                ogbl_dataset[0],
+                {
+                    ('', '', ''): torch.from_numpy(ogbl_dataset[0]['edge_index']),
+                    ('', 'train_pos_edge', ''): torch.from_numpy(edge_split['train']['edge']),
+                    ('', 'val_pos_edge', ''): torch.from_numpy(edge_split['valid']['edge']),
+                    ('', 'val_neg_edge', ''): torch.from_numpy(edge_split['valid']['edge_neg']),
+                    ('', 'test_pos_edge', ''): torch.from_numpy(edge_split['test']['edge']),
+                    ('', 'test_neg_edge', ''): torch.from_numpy(edge_split['test']['edge_neg'])
+                },
+                (
+                    {'node_feat': 'feat', 'node_year': 'year'}
+                    if _backend.DependentBackend.is_dgl()
+                    else {'node_feat': 'x', 'node_year': 'year'}
+                )
+            )
+        ])
+
+
+# todo: currently homogeneous dataset `ogbl-wikikg2` and `ogbl-biokg` NOT supported
+
+
+class _OGBGDatasetUtil:
+    ...
+
+
+@DatasetUniversalRegistry.register_dataset("ogbg-molhiv")
+class OGBGMOLHIVDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbl_dataset = GraphPropPredDataset("ogbg-molhiv", path)
+        idx_split: _typing.Mapping[str, np.ndarray] = ogbl_dataset.get_idx_split()
+        train_index: _typing.Any = idx_split['train'].tolist()
+        test_index: _typing.Any = idx_split['test'].tolist()
+        val_index: _typing.Any = idx_split['valid'].tolist()
+        super(OGBGMOLHIVDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    (
+                        {"feat": torch.from_numpy(data['node_feat'])}
+                        if _backend.DependentBackend.is_dgl()
+                        else {"x": torch.from_numpy(data['node_feat'])}
+                    ),
+                    torch.from_numpy(data['edge_index']),
+                    {'edge_feat': torch.from_numpy(data['edge_feat'])},
+                    (
+                        {'label': torch.from_numpy(label)}
+                        if _backend.DependentBackend.is_dgl()
+                        else {'y': torch.from_numpy(label)}
+                    )
+                ) for data, label in ogbl_dataset
+            ],
+            train_index, val_index, test_index
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ogbg-molpcba")
+class OGBGMOLPCBADataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbl_dataset = GraphPropPredDataset("ogbg-molhiv", path)
+        idx_split: _typing.Mapping[str, np.ndarray] = ogbl_dataset.get_idx_split()
+        train_index: _typing.Any = idx_split['train'].tolist()
+        test_index: _typing.Any = idx_split['test'].tolist()
+        val_index: _typing.Any = idx_split['valid'].tolist()
+        super(OGBGMOLPCBADataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    (
+                        {"feat": torch.from_numpy(data['node_feat'])}
+                        if _backend.DependentBackend.is_dgl()
+                        else {"x": torch.from_numpy(data['node_feat'])}
+                    ),
+                    torch.from_numpy(data['edge_index']),
+                    {'edge_feat': torch.from_numpy(data['edge_feat'])},
+                    (
+                        {'label': torch.from_numpy(label)}
+                        if _backend.DependentBackend.is_dgl()
+                        else {'y': torch.from_numpy(label)}
+                    )
+                ) for data, label in ogbl_dataset
+            ],
+            train_index, val_index, test_index
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ogbg-ppa")
+class OGBGPPADataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbl_dataset = GraphPropPredDataset("ogbg-molhiv", path)
+        idx_split: _typing.Mapping[str, np.ndarray] = ogbl_dataset.get_idx_split()
+        train_index: _typing.Any = idx_split['train'].tolist()
+        test_index: _typing.Any = idx_split['test'].tolist()
+        val_index: _typing.Any = idx_split['valid'].tolist()
+        super(OGBGPPADataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'_NID': torch.arange(data['num_nodes'])},
+                    torch.from_numpy(data['edge_index']),
+                    {'edge_feat': torch.from_numpy(data['edge_feat'])},
+                    (
+                        {'label': torch.from_numpy(label)}
+                        if _backend.DependentBackend.is_dgl()
+                        else {'y': torch.from_numpy(label)}
+                    )
+                ) for data, label in ogbl_dataset
+            ],
+            train_index, val_index, test_index
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ogbg-code")
+@DatasetUniversalRegistry.register_dataset("ogbg-code2")
+class OGBGCode2Dataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        ogbl_dataset = GraphPropPredDataset("ogbg-molhiv", path)
+        idx_split: _typing.Mapping[str, np.ndarray] = ogbl_dataset.get_idx_split()
+        train_index: _typing.Any = idx_split['train'].tolist()
+        test_index: _typing.Any = idx_split['test'].tolist()
+        val_index: _typing.Any = idx_split['valid'].tolist()
+        super(OGBGCode2Dataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    (
+                        {
+                            "feat": torch.from_numpy(data['node_feat']),
+                            "node_is_attributed": torch.from_numpy(data["node_is_attributed"]),
+                            "node_dfs_order": torch.from_numpy(data["node_dfs_order"]),
+                            "node_depth": torch.from_numpy(data["node_depth"])
+                        }
+                        if _backend.DependentBackend.is_dgl()
+                        else
+                        {
+                            "x": torch.from_numpy(data['node_feat']),
+                            "node_is_attributed": torch.from_numpy(data["node_is_attributed"]),
+                            "node_dfs_order": torch.from_numpy(data["node_dfs_order"]),
+                            "node_depth": torch.from_numpy(data["node_depth"])
+                        }
+                    ),
+                    torch.from_numpy(data['edge_index'])
+                ) for data, label in ogbl_dataset
+            ],
+            train_index, val_index, test_index
+        )
diff --git a/autogl/datasets/_pyg.py b/autogl/datasets/_pyg.py
new file mode 100644
index 0000000..f636ace
--- /dev/null
+++ b/autogl/datasets/_pyg.py
@@ -0,0 +1,567 @@
+import os
+from autogl.data.graph import GeneralStaticGraphGenerator
+from autogl.data import InMemoryStaticGraphSet
+from ._dataset_registry import DatasetUniversalRegistry
+import torch_geometric
+from torch_geometric.datasets import (
+    Amazon, Coauthor, Flickr, ModelNet,
+    Planetoid, PPI, QM9, Reddit, TUDataset
+)
+
+
+@DatasetUniversalRegistry.register_dataset("cora")
+class CoraDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Planetoid(os.path.join(path, '_pyg'), "Cora")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {
+                'x': pyg_data.x,
+                'y': pyg_data.y,
+                'train_mask': getattr(pyg_data, 'train_mask'),
+                'val_mask': getattr(pyg_data, 'val_mask'),
+                'test_mask': getattr(pyg_data, 'test_mask')
+            },
+            pyg_data.edge_index
+        )
+        super(CoraDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("CiteSeer".lower())
+class CiteSeerDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Planetoid(os.path.join(path, '_pyg'), "CiteSeer")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {
+                'x': pyg_data.x,
+                'y': pyg_data.y,
+                'train_mask': getattr(pyg_data, 'train_mask'),
+                'val_mask': getattr(pyg_data, 'val_mask'),
+                'test_mask': getattr(pyg_data, 'test_mask')
+            },
+            pyg_data.edge_index
+        )
+        super(CiteSeerDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("PubMed".lower())
+class PubMedDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Planetoid(os.path.join(path, '_pyg'), "PubMed")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {
+                'x': pyg_data.x,
+                'y': pyg_data.y,
+                'train_mask': getattr(pyg_data, 'train_mask'),
+                'val_mask': getattr(pyg_data, 'val_mask'),
+                'test_mask': getattr(pyg_data, 'test_mask')
+            },
+            pyg_data.edge_index
+        )
+        super(PubMedDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("flickr")
+class FlickrDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Flickr(os.path.join(path, '_pyg'))
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {
+                'x': pyg_data.x,
+                'y': pyg_data.y,
+                'train_mask': getattr(pyg_data, 'train_mask'),
+                'val_mask': getattr(pyg_data, 'val_mask'),
+                'test_mask': getattr(pyg_data, 'test_mask')
+            },
+            pyg_data.edge_index
+        )
+        super(FlickrDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("reddit")
+class RedditDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Reddit(os.path.join(path, '_pyg'))
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {
+                'x': pyg_data.x,
+                'y': pyg_data.y,
+                'train_mask': getattr(pyg_data, 'train_mask'),
+                'val_mask': getattr(pyg_data, 'val_mask'),
+                'test_mask': getattr(pyg_data, 'test_mask')
+            },
+            pyg_data.edge_index
+        )
+        super(RedditDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("amazon_computers")
+class AmazonComputersDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Amazon(os.path.join(path, '_pyg'), "Computers")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {'x': pyg_data.x, 'y': pyg_data.y},
+            pyg_data.edge_index
+        )
+        super(AmazonComputersDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("amazon_photo")
+class AmazonPhotoDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Amazon(os.path.join(path, '_pyg'), "Photo")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {'x': pyg_data.x, 'y': pyg_data.y},
+            pyg_data.edge_index
+        )
+        super(AmazonPhotoDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("coauthor_physics")
+class CoauthorPhysicsDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Coauthor(os.path.join(path, '_pyg'), "Physics")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {'x': pyg_data.x, 'y': pyg_data.y},
+            pyg_data.edge_index
+        )
+        super(CoauthorPhysicsDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("coauthor_cs")
+class CoauthorCSDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = Coauthor(os.path.join(path, '_pyg'), "CS")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        pyg_data = pyg_dataset[0]
+        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+            {'x': pyg_data.x, 'y': pyg_data.y},
+            pyg_data.edge_index
+        )
+        super(CoauthorCSDataset, self).__init__([static_graph])
+
+
+@DatasetUniversalRegistry.register_dataset("ppi")
+class PPIDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        train_dataset = PPI(os.path.join(path, '_pyg'), 'train')
+        if hasattr(train_dataset, "__data_list__"):
+            delattr(train_dataset, "__data_list__")
+        if hasattr(train_dataset, "_data_list"):
+            delattr(train_dataset, "_data_list")
+        val_dataset = PPI(os.path.join(path, '_pyg'), 'val')
+        if hasattr(val_dataset, "__data_list__"):
+            delattr(val_dataset, "__data_list__")
+        if hasattr(val_dataset, "_data_list"):
+            delattr(val_dataset, "_data_list")
+        test_dataset = PPI(os.path.join(path, '_pyg'), 'test')
+        if hasattr(test_dataset, "__data_list__"):
+            delattr(test_dataset, "__data_list__")
+        if hasattr(test_dataset, "_data_list"):
+            delattr(test_dataset, "_data_list")
+        train_index = range(len(train_dataset))
+        val_index = range(len(train_dataset), len(train_dataset) + len(val_dataset))
+        test_index = range(
+            len(train_dataset) + len(val_dataset),
+            len(train_dataset) + len(val_dataset) + len(test_dataset)
+        )
+        super(PPIDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': data.x, 'y': data.y}, data.edge_index
+                ) for data in train_dataset
+            ] +
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': data.x, 'y': data.y}, data.edge_index
+                ) for data in val_dataset
+            ] +
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': data.x, 'y': data.y}, data.edge_index
+                ) for data in test_dataset
+            ],
+            train_index, val_index, test_index
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("qm9")
+class QM9Dataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = QM9(os.path.join(path, '_pyg'))
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(QM9Dataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': data.x, 'pos': data.pos, 'z': data.z},
+                    data.edge_index,
+                    edges_data={'edge_attr': data.edge_attr},
+                    graph_data={'idx': data.idx, 'y': data.y}
+                ) for data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("mutag")
+class MUTAGDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "MUTAG")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(MUTAGDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': pyg_data.x}, pyg_data.edge_index,
+                    edges_data={'edge_attr': pyg_data.edge_attr},
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("enzymes")
+class ENZYMESDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "ENZYMES")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(ENZYMESDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': pyg_data.x}, pyg_data.edge_index,
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("imdb-b")
+class IMDBBinaryDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "IMDB-BINARY")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(IMDBBinaryDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("imdb-m")
+class IMDBMultiDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "IMDB-MULTI")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(IMDBMultiDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("reddit-b")
+class RedditBinaryDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "REDDIT-BINARY")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(RedditBinaryDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("reddit-multi-5k")
+class REDDITMulti5KDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "REDDIT-MULTI-5K")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(REDDITMulti5KDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("reddit-multi-12k")
+class REDDITMulti12KDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "REDDIT-MULTI-12K")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(REDDITMulti12KDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("collab")
+class COLLABDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "COLLAB")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(COLLABDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("proteins")
+class ProteinsDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "PROTEINS")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(ProteinsDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': pyg_data.x}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ptc-mr")
+class PTCMRDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "PTC_MR")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(PTCMRDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': pyg_data.x}, pyg_data.edge_index,
+                    edges_data={'edge_attr': pyg_data.edge_attr},
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("nci1")
+class NCI1Dataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "NCI1")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(NCI1Dataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': pyg_data.x}, pyg_data.edge_index,
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("nci109")
+class NCI109Dataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "NCI109")
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(NCI109Dataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'x': pyg_data.x}, pyg_data.edge_index,
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ModelNet10Training")
+class ModelNet10TrainingDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = ModelNet(
+            os.path.join(path, '_pyg'), '10', True,
+            pre_transform=torch_geometric.transforms.FaceToEdge()
+        )
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(ModelNet10TrainingDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'pos': pyg_data.pos},
+                    pyg_data.edge_index,
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ModelNet10Test")
+class ModelNet10TestDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = ModelNet(
+            os.path.join(path, '_pyg'), '10', False,
+            pre_transform=torch_geometric.transforms.FaceToEdge()
+        )
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(ModelNet10TestDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'pos': pyg_data.pos},
+                    pyg_data.edge_index,
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ModelNet40Training")
+class ModelNet40TrainingDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = ModelNet(
+            os.path.join(path, '_pyg'), '40', True,
+            pre_transform=torch_geometric.transforms.FaceToEdge()
+        )
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(ModelNet40TrainingDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'pos': pyg_data.pos},
+                    pyg_data.edge_index,
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
+
+
+@DatasetUniversalRegistry.register_dataset("ModelNet40Test")
+class ModelNet40TestDataset(InMemoryStaticGraphSet):
+    def __init__(self, path: str):
+        pyg_dataset = ModelNet(
+            os.path.join(path, '_pyg'), '40', False,
+            pre_transform=torch_geometric.transforms.FaceToEdge()
+        )
+        if hasattr(pyg_dataset, "__data_list__"):
+            delattr(pyg_dataset, "__data_list__")
+        if hasattr(pyg_dataset, "_data_list"):
+            delattr(pyg_dataset, "_data_list")
+        super(ModelNet40TestDataset, self).__init__(
+            [
+                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+                    {'pos': pyg_data.pos},
+                    pyg_data.edge_index,
+                    graph_data={'y': pyg_data.y}
+                )
+                for pyg_data in pyg_dataset
+            ]
+        )
diff --git a/autogl/datasets/gatne.py b/autogl/datasets/gatne.py
deleted file mode 100644
index e222375..0000000
--- a/autogl/datasets/gatne.py
+++ /dev/null
@@ -1,113 +0,0 @@
-import os.path as osp
-import sys
-
-import torch
-
-from ..data import Data, Dataset, download_url
-
-from . import register_dataset
-
-
-def read_gatne_data(folder):
-    train_data = {}
-    with open(osp.join(folder, "{}".format("train.txt")), "r") as f:
-        for line in f:
-            items = line.strip().split()
-            if items[0] not in train_data:
-                train_data[items[0]] = []
-            train_data[items[0]].append([int(items[1]), int(items[2])])
-
-    valid_data = {}
-    with open(osp.join(folder, "{}".format("valid.txt")), "r") as f:
-        for line in f:
-            items = line.strip().split()
-            if items[0] not in valid_data:
-                valid_data[items[0]] = [[], []]
-            valid_data[items[0]][1 - int(items[3])].append(
-                [int(items[1]), int(items[2])]
-            )
-
-    test_data = {}
-    with open(osp.join(folder, "{}".format("test.txt")), "r") as f:
-        for line in f:
-            items = line.strip().split()
-            if items[0] not in test_data:
-                test_data[items[0]] = [[], []]
-            test_data[items[0]][1 - int(items[3])].append(
-                [int(items[1]), int(items[2])]
-            )
-
-    data = Data()
-    data.train_data = train_data
-    data.valid_data = valid_data
-    data.test_data = test_data
-    return data
-
-
-class GatneDataset(Dataset):
-    r"""The network datasets "Amazon", "Twitter" and "YouTube" from the
-    `"Representation Learning for Attributed Multiplex Heterogeneous Network"
-    <https://arxiv.org/abs/1905.01669>`_ paper.
-
-    Args:
-        root (string): Root directory where the dataset should be saved.
-        name (string): The name of the dataset (:obj:`"Amazon"`,
-            :obj:`"Twitter"`, :obj:`"YouTube"`).
-    """
-
-    url = "https://github.com/THUDM/GATNE/raw/master/data"
-
-    def __init__(self, root, name):
-        self.name = name
-        super(GatneDataset, self).__init__(root)
-        self.data = torch.load(self.processed_paths[0])
-
-    @property
-    def raw_file_names(self):
-        names = ["train.txt", "valid.txt", "test.txt"]
-        return names
-
-    @property
-    def processed_file_names(self):
-        return ["data.pt"]
-
-    def get(self, idx):
-        assert idx == 0
-        return self.data
-
-    def download(self):
-        for name in self.raw_file_names:
-            download_url(
-                "{}/{}/{}".format(self.url, self.name.lower(), name), self.raw_dir
-            )
-
-    def process(self):
-        data = read_gatne_data(self.raw_dir)
-        torch.save(data, self.processed_paths[0])
-
-    def __repr__(self):
-        return "{}()".format(self.name)
-
-
-@register_dataset("amazon")
-class AmazonDataset(GatneDataset):
-    def __init__(self, path):
-        dataset = "amazon"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(AmazonDataset, self).__init__(path, dataset)
-
-
-@register_dataset("twitter")
-class TwitterDataset(GatneDataset):
-    def __init__(self, path):
-        dataset = "twitter"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(TwitterDataset, self).__init__(path, dataset)
-
-
-@register_dataset("youtube")
-class YouTubeDataset(GatneDataset):
-    def __init__(self, path):
-        dataset = "youtube"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(YouTubeDataset, self).__init__(path, dataset)
diff --git a/autogl/datasets/gtn_data.py b/autogl/datasets/gtn_data.py
deleted file mode 100644
index dbd72b1..0000000
--- a/autogl/datasets/gtn_data.py
+++ /dev/null
@@ -1,188 +0,0 @@
-import sys
-import time
-import os
-import os.path as osp
-import requests
-import shutil
-import tqdm
-import pickle
-import numpy as np
-
-import torch
-
-from ..data import Data, Dataset, download_url
-
-from . import register_dataset
-
-
-def untar(path, fname, deleteTar=True):
-    """
-    Unpacks the given archive file to the same directory, then (by default)
-    deletes the archive file.
-    """
-    print("unpacking " + fname)
-    fullpath = os.path.join(path, fname)
-    shutil.unpack_archive(fullpath, path)
-    if deleteTar:
-        os.remove(fullpath)
-
-
-class GTNDataset(Dataset):
-    r"""The network datasets "ACM", "DBLP" and "IMDB" from the
-    `"Graph Transformer Networks"
-    <https://arxiv.org/abs/1911.06455>`_ paper.
-
-    Args:
-        root (string): Root directory where the dataset should be saved.
-        name (string): The name of the dataset (:obj:`"gtn-acm"`,
-            :obj:`"gtn-dblp"`, :obj:`"gtn-imdb"`).
-    """
-
-    def __init__(self, root, name):
-        self.name = name
-        self.url = (
-            f"https://github.com/cenyk1230/gtn-data/blob/master/{name}.zip?raw=true"
-        )
-        super(GTNDataset, self).__init__(root)
-        self.data = torch.load(self.processed_paths[0])
-        self.num_classes = torch.max(self.data.train_target).item() + 1
-        self.num_edge = len(self.data.adj)
-        self.num_nodes = self.data.x.shape[0]
-
-    @property
-    def raw_file_names(self):
-        names = ["edges.pkl", "labels.pkl", "node_features.pkl"]
-        return names
-
-    @property
-    def processed_file_names(self):
-        return ["data.pt"]
-
-    def read_gtn_data(self, folder):
-        edges = pickle.load(open(osp.join(folder, "edges.pkl"), "rb"))
-        labels = pickle.load(open(osp.join(folder, "labels.pkl"), "rb"))
-        node_features = pickle.load(open(osp.join(folder, "node_features.pkl"), "rb"))
-
-        data = Data()
-        data.x = torch.from_numpy(node_features).type(torch.FloatTensor)
-
-        num_nodes = edges[0].shape[0]
-
-        node_type = np.zeros((num_nodes), dtype=int)
-        assert len(edges) == 4
-        assert len(edges[0].nonzero()) == 2
-
-        node_type[edges[0].nonzero()[0]] = 0
-        node_type[edges[0].nonzero()[1]] = 1
-        node_type[edges[1].nonzero()[0]] = 1
-        node_type[edges[1].nonzero()[1]] = 0
-        node_type[edges[2].nonzero()[0]] = 0
-        node_type[edges[2].nonzero()[1]] = 2
-        node_type[edges[3].nonzero()[0]] = 2
-        node_type[edges[3].nonzero()[1]] = 0
-
-        print(node_type)
-        data.pos = torch.from_numpy(node_type)
-
-        edge_list = []
-        for i, edge in enumerate(edges):
-            edge_tmp = torch.from_numpy(
-                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
-            ).type(torch.LongTensor)
-            edge_list.append(edge_tmp)
-        data.edge_index = torch.cat(edge_list, 1)
-
-        A = []
-        for i, edge in enumerate(edges):
-            edge_tmp = torch.from_numpy(
-                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
-            ).type(torch.LongTensor)
-            value_tmp = torch.ones(edge_tmp.shape[1]).type(torch.FloatTensor)
-            A.append((edge_tmp, value_tmp))
-        edge_tmp = torch.stack(
-            (torch.arange(0, num_nodes), torch.arange(0, num_nodes))
-        ).type(torch.LongTensor)
-        value_tmp = torch.ones(num_nodes).type(torch.FloatTensor)
-        A.append((edge_tmp, value_tmp))
-        data.adj = A
-
-        data.train_node = torch.from_numpy(np.array(labels[0])[:, 0]).type(
-            torch.LongTensor
-        )
-        data.train_target = torch.from_numpy(np.array(labels[0])[:, 1]).type(
-            torch.LongTensor
-        )
-        data.valid_node = torch.from_numpy(np.array(labels[1])[:, 0]).type(
-            torch.LongTensor
-        )
-        data.valid_target = torch.from_numpy(np.array(labels[1])[:, 1]).type(
-            torch.LongTensor
-        )
-        data.test_node = torch.from_numpy(np.array(labels[2])[:, 0]).type(
-            torch.LongTensor
-        )
-        data.test_target = torch.from_numpy(np.array(labels[2])[:, 1]).type(
-            torch.LongTensor
-        )
-
-        y = np.zeros((num_nodes), dtype=int)
-        x_index = torch.cat((data.train_node, data.valid_node, data.test_node))
-        y_index = torch.cat((data.train_target, data.valid_target, data.test_target))
-        y[x_index.numpy()] = y_index.numpy()
-        data.y = torch.from_numpy(y)
-        self.data = data
-
-    def get(self, idx):
-        assert idx == 0
-        return self.data
-
-    def apply_to_device(self, device):
-        self.data.x = self.data.x.to(device)
-
-        self.data.train_node = self.data.train_node.to(device)
-        self.data.valid_node = self.data.valid_node.to(device)
-        self.data.test_node = self.data.test_node.to(device)
-
-        self.data.train_target = self.data.train_target.to(device)
-        self.data.valid_target = self.data.valid_target.to(device)
-        self.data.test_target = self.data.test_target.to(device)
-
-        new_adj = []
-        for (t1, t2) in self.data.adj:
-            new_adj.append((t1.to(device), t2.to(device)))
-        self.data.adj = new_adj
-
-    def download(self):
-        download_url(self.url, self.raw_dir, name=self.name + ".zip")
-        untar(self.raw_dir, self.name + ".zip")
-
-    def process(self):
-        self.read_gtn_data(self.raw_dir)
-        torch.save(self.data, self.processed_paths[0])
-
-    def __repr__(self):
-        return "{}()".format(self.name)
-
-
-@register_dataset("gtn-acm")
-class ACM_GTNDataset(GTNDataset):
-    def __init__(self, path):
-        dataset = "gtn-acm"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(ACM_GTNDataset, self).__init__(path, dataset)
-
-
-@register_dataset("gtn-dblp")
-class DBLP_GTNDataset(GTNDataset):
-    def __init__(self, path):
-        dataset = "gtn-dblp"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(DBLP_GTNDataset, self).__init__(path, dataset)
-
-
-@register_dataset("gtn-imdb")
-class IMDB_GTNDataset(GTNDataset):
-    def __init__(self, path):
-        dataset = "gtn-imdb"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(IMDB_GTNDataset, self).__init__(path, dataset)
diff --git a/autogl/datasets/han_data.py b/autogl/datasets/han_data.py
deleted file mode 100644
index 496ea75..0000000
--- a/autogl/datasets/han_data.py
+++ /dev/null
@@ -1,187 +0,0 @@
-import sys
-import time
-import os
-import os.path as osp
-import requests
-import shutil
-import tqdm
-import pickle
-import numpy as np
-import scipy.io as sio
-import scipy.sparse as sp
-
-import torch
-
-from ..data import Data, Dataset, download_url
-
-from . import register_dataset
-
-
-def untar(path, fname, deleteTar=True):
-    """
-    Unpacks the given archive file to the same directory, then (by default)
-    deletes the archive file.
-    """
-    print("unpacking " + fname)
-    fullpath = os.path.join(path, fname)
-    shutil.unpack_archive(fullpath, path)
-    if deleteTar:
-        os.remove(fullpath)
-
-
-def sample_mask(idx, l):
-    """Create mask."""
-    mask = np.zeros(l)
-    mask[idx] = 1
-    return np.array(mask, dtype=np.bool)
-
-
-class HANDataset(Dataset):
-    r"""The network datasets "ACM", "DBLP" and "IMDB" from the
-    `"Heterogeneous Graph Attention Network"
-    <https://arxiv.org/abs/1903.07293>`_ paper.
-
-    Args:
-        root (string): Root directory where the dataset should be saved.
-        name (string): The name of the dataset (:obj:`"han-acm"`,
-            :obj:`"han-dblp"`, :obj:`"han-imdb"`).
-    """
-
-    def __init__(self, root, name):
-        self.name = name
-        self.url = (
-            f"https://github.com/cenyk1230/han-data/blob/master/{name}.zip?raw=true"
-        )
-        super(HANDataset, self).__init__(root)
-        self.data = torch.load(self.processed_paths[0])
-        self.num_classes = torch.max(self.data.train_target).item() + 1
-        self.num_edge = len(self.data.adj)
-        self.num_nodes = self.data.x.shape[0]
-
-    @property
-    def raw_file_names(self):
-        names = ["data.mat"]
-        return names
-
-    @property
-    def processed_file_names(self):
-        return ["data.pt"]
-
-    def read_gtn_data(self, folder):
-        data = sio.loadmat(osp.join(folder, "data.mat"))
-        if self.name == "han-acm" or self.name == "han-imdb":
-            truelabels, truefeatures = data["label"], data["feature"].astype(float)
-        elif self.name == "han-dblp":
-            truelabels, truefeatures = data["label"], data["features"].astype(float)
-        num_nodes = truefeatures.shape[0]
-        if self.name == "han-acm":
-            rownetworks = [
-                data["PAP"] - np.eye(num_nodes),
-                data["PLP"] - np.eye(num_nodes),
-            ]
-        elif self.name == "han-dblp":
-            rownetworks = [
-                data["net_APA"] - np.eye(num_nodes),
-                data["net_APCPA"] - np.eye(num_nodes),
-                data["net_APTPA"] - np.eye(num_nodes),
-            ]
-        elif self.name == "han-imdb":
-            rownetworks = [
-                data["MAM"] - np.eye(num_nodes),
-                data["MDM"] - np.eye(num_nodes),
-                data["MYM"] - np.eye(num_nodes),
-            ]
-
-        y = truelabels
-        train_idx = data["train_idx"]
-        val_idx = data["val_idx"]
-        test_idx = data["test_idx"]
-
-        train_mask = sample_mask(train_idx, y.shape[0])
-        val_mask = sample_mask(val_idx, y.shape[0])
-        test_mask = sample_mask(test_idx, y.shape[0])
-
-        y_train = np.argmax(y[train_mask, :], axis=1)
-        y_val = np.argmax(y[val_mask, :], axis=1)
-        y_test = np.argmax(y[test_mask, :], axis=1)
-
-        data = Data()
-        A = []
-        for i, edge in enumerate(rownetworks):
-            edge_tmp = torch.from_numpy(
-                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
-            ).type(torch.LongTensor)
-            value_tmp = torch.ones(edge_tmp.shape[1]).type(torch.FloatTensor)
-            A.append((edge_tmp, value_tmp))
-        edge_tmp = torch.stack(
-            (torch.arange(0, num_nodes), torch.arange(0, num_nodes))
-        ).type(torch.LongTensor)
-        value_tmp = torch.ones(num_nodes).type(torch.FloatTensor)
-        A.append((edge_tmp, value_tmp))
-        data.adj = A
-
-        data.x = torch.from_numpy(truefeatures).type(torch.FloatTensor)
-
-        data.train_node = torch.from_numpy(train_idx[0]).type(torch.LongTensor)
-        data.train_target = torch.from_numpy(y_train).type(torch.LongTensor)
-        data.valid_node = torch.from_numpy(val_idx[0]).type(torch.LongTensor)
-        data.valid_target = torch.from_numpy(y_val).type(torch.LongTensor)
-        data.test_node = torch.from_numpy(test_idx[0]).type(torch.LongTensor)
-        data.test_target = torch.from_numpy(y_test).type(torch.LongTensor)
-
-        self.data = data
-
-    def get(self, idx):
-        assert idx == 0
-        return self.data
-
-    def apply_to_device(self, device):
-        self.data.x = self.data.x.to(device)
-
-        self.data.train_node = self.data.train_node.to(device)
-        self.data.valid_node = self.data.valid_node.to(device)
-        self.data.test_node = self.data.test_node.to(device)
-
-        self.data.train_target = self.data.train_target.to(device)
-        self.data.valid_target = self.data.valid_target.to(device)
-        self.data.test_target = self.data.test_target.to(device)
-
-        new_adj = []
-        for (t1, t2) in self.data.adj:
-            new_adj.append((t1.to(device), t2.to(device)))
-        self.data.adj = new_adj
-
-    def download(self):
-        download_url(self.url, self.raw_dir, name=self.name + ".zip")
-        untar(self.raw_dir, self.name + ".zip")
-
-    def process(self):
-        self.read_gtn_data(self.raw_dir)
-        torch.save(self.data, self.processed_paths[0])
-
-    def __repr__(self):
-        return "{}()".format(self.name)
-
-
-@register_dataset("han-acm")
-class ACM_HANDataset(HANDataset):
-    def __init__(self, path):
-        dataset = "han-acm"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(ACM_HANDataset, self).__init__(path, dataset)
-
-
-@register_dataset("han-dblp")
-class DBLP_HANDataset(HANDataset):
-    def __init__(self, path):
-        dataset = "han-dblp"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(DBLP_HANDataset, self).__init__(path, dataset)
-
-
-@register_dataset("han-imdb")
-class IMDB_HANDataset(HANDataset):
-    def __init__(self, path):
-        dataset = "han-imdb"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(IMDB_HANDataset, self).__init__(path, dataset)
diff --git a/autogl/datasets/matlab_matrix.py b/autogl/datasets/matlab_matrix.py
deleted file mode 100644
index a6ba4f1..0000000
--- a/autogl/datasets/matlab_matrix.py
+++ /dev/null
@@ -1,96 +0,0 @@
-import json
-import os
-import os.path as osp
-from itertools import product
-
-import numpy as np
-import scipy.io
-import torch
-
-from ..data import Data, Dataset, download_url
-
-from . import register_dataset
-
-
-class MatlabMatrix(Dataset):
-    r"""The networks datasets "Blogcatalog", "Flickr", "Wikipedia" and "PPI" from the http://leitang.net/code/social-dimension/data/ or http://snap.stanford.edu/node2vec/
-
-    Args:
-        root (string): Root directory where the dataset should be saved.
-        name (string): The name of the dataset (:obj:`"Blogcatalog"`).
-    """
-
-    def __init__(self, root, name, url):
-        self.name = name
-        self.url = url
-        super(MatlabMatrix, self).__init__(root)
-        self.data = torch.load(self.processed_paths[0])
-
-    @property
-    def raw_file_names(self):
-        splits = [self.name]
-        files = ["mat"]
-        return ["{}.{}".format(s, f) for s, f in product(splits, files)]
-
-    @property
-    def processed_file_names(self):
-        return ["data.pt"]
-
-    def download(self):
-        for name in self.raw_file_names:
-            download_url("{}{}".format(self.url, name), self.raw_dir)
-
-    def get(self, idx):
-        assert idx == 0
-        return self.data
-
-    def process(self):
-        path = osp.join(self.raw_dir, "{}.mat".format(self.name))
-        smat = scipy.io.loadmat(path)
-        adj_matrix, group = smat["network"], smat["group"]
-
-        y = torch.from_numpy(group.todense()).to(torch.float)
-
-        row_ind, col_ind = adj_matrix.nonzero()
-        edge_index = torch.stack([torch.tensor(row_ind), torch.tensor(col_ind)], dim=0)
-        edge_attr = torch.tensor(adj_matrix[row_ind, col_ind])
-
-        data = Data(edge_index=edge_index, edge_attr=edge_attr, x=None, y=y)
-
-        torch.save(data, self.processed_paths[0])
-
-
-@register_dataset("blogcatalog")
-class BlogcatalogDataset(MatlabMatrix):
-    def __init__(self, path):
-        dataset, filename = "blogcatalog", "blogcatalog"
-        url = "http://leitang.net/code/social-dimension/data/"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(BlogcatalogDataset, self).__init__(path, filename, url)
-
-
-# @register_dataset("flickr")
-# class FlickrDataset(MatlabMatrix):
-#     def __init__(self, path):
-#         dataset, filename = "flickr", "flickr"
-#         url = "http://leitang.net/code/social-dimension/data/"
-#         # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-#         super(FlickrDataset, self).__init__(path, filename, url)
-
-
-@register_dataset("wikipedia")
-class WikipediaDataset(MatlabMatrix):
-    def __init__(self, path):
-        dataset, filename = "wikipedia", "POS"
-        url = "http://snap.stanford.edu/node2vec/"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(WikipediaDataset, self).__init__(path, filename, url)
-
-
-@register_dataset("ppi")
-class PPIDataset(MatlabMatrix):
-    def __init__(self, path):
-        dataset, filename = "ppi", "Homo_sapiens"
-        url = "http://snap.stanford.edu/node2vec/"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(PPIDataset, self).__init__(path, filename, url)
diff --git a/autogl/datasets/modelnet.py b/autogl/datasets/modelnet.py
deleted file mode 100644
index 7348246..0000000
--- a/autogl/datasets/modelnet.py
+++ /dev/null
@@ -1,70 +0,0 @@
-# import os.path as osp
-# import torch_geometric.transforms as T
-from torch_geometric.datasets import ModelNet
-from . import register_dataset
-
-
-class ModelNet10(ModelNet):
-    def __init__(self, path: str, train: bool):
-        # pre_transform, transform = T.NormalizeScale(), T.SamplePoints(1024)
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(ModelNet10, self).__init__(path, name="10", train=train)
-
-
-class ModelNet40(ModelNet):
-    def __init__(self, path: str, train: bool):
-        # pre_transform, transform = T.NormalizeScale(), T.SamplePoints(1024)
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        super(ModelNet40, self).__init__(path, name="40", train=train)
-
-
-@register_dataset("ModelNet10Train")
-class ModelNet10Train(ModelNet):
-    def __init__(self, path: str):
-        super(ModelNet10Train, self).__init__(path, "10", train=True)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(ModelNet10Train, self).get(idx)
-
-
-@register_dataset("ModelNet10Test")
-class ModelNet10Test(ModelNet):
-    def __init__(self, path: str):
-        super(ModelNet10Test, self).__init__(path, "10", train=False)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(ModelNet10Test, self).get(idx)
-
-
-@register_dataset("ModelNet40Train")
-class ModelNet40Train(ModelNet):
-    def __init__(self, path: str):
-        super(ModelNet40Train, self).__init__(path, "40", train=True)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(ModelNet40Train, self).get(idx)
-
-
-@register_dataset("ModelNet40Test")
-class ModelNet40Test(ModelNet):
-    def __init__(self, path: str):
-        super(ModelNet40Test, self).__init__(path, "40", train=False)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(ModelNet40Test, self).get(idx)
diff --git a/autogl/datasets/ogb.py b/autogl/datasets/ogb.py
deleted file mode 100644
index b133b85..0000000
--- a/autogl/datasets/ogb.py
+++ /dev/null
@@ -1,358 +0,0 @@
-import torch_geometric.transforms as T
-from ogb.nodeproppred import PygNodePropPredDataset
-from ogb.graphproppred import PygGraphPropPredDataset
-from ogb.linkproppred import PygLinkPropPredDataset
-from . import register_dataset
-from .utils import index_to_mask
-from torch_geometric.data import Data
-
-
-# OGBN
-
-
-@register_dataset("ogbn-products")
-class OGBNproductsDataset(PygNodePropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbn-products"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygNodePropPredDataset(name=dataset, root=path)
-        super(OGBNproductsDataset, self).__init__(dataset, path)
-        # Pre-compute GCN normalization.
-        # adj_t = self.data.adj_t.set_diag()
-        # deg = adj_t.sum(dim=1).to(torch.float)
-        # deg_inv_sqrt = deg.pow(-0.5)
-        # deg_inv_sqrt[deg_inv_sqrt == float('inf')] = 0
-        # adj_t = deg_inv_sqrt.view(-1, 1) * adj_t * deg_inv_sqrt.view(1, -1)
-        # self.data.adj_t = adj_t
-
-        setattr(OGBNproductsDataset, "metric", "Accuracy")
-        setattr(OGBNproductsDataset, "loss", "nll_loss")
-        split_idx = self.get_idx_split()
-        datalist = []
-        for d in self:
-            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
-            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
-            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
-            datalist.append(d)
-        self.data, self.slices = self.collate(datalist)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBNproductsDataset, self).get(idx)
-
-
-@register_dataset("ogbn-proteins")
-class OGBNproteinsDataset(PygNodePropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbn-proteins"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygNodePropPredDataset(name=dataset, root=path)
-        super(OGBNproteinsDataset, self).__init__(dataset, path)
-        dataset_t = PygNodePropPredDataset(
-            name=dataset, root=path, transform=T.ToSparseTensor()
-        )
-
-        # Move edge features to node features.
-        self.data.x = dataset_t[0].adj_t.mean(dim=1)
-        # dataset_t[0].adj_t.set_value_(None)
-        del dataset_t
-
-        setattr(OGBNproteinsDataset, "metric", "ROC-AUC")
-        setattr(OGBNproteinsDataset, "loss", "binary_cross_entropy_with_logits")
-        split_idx = self.get_idx_split()
-        datalist = []
-        for d in self:
-            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
-            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
-            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
-            datalist.append(d)
-        self.data, self.slices = self.collate(datalist)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBNproteinsDataset, self).get(idx)
-
-
-@register_dataset("ogbn-arxiv")
-class OGBNarxivDataset(PygNodePropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbn-arxiv"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygNodePropPredDataset(name=dataset, root=path)
-        super(OGBNarxivDataset, self).__init__(dataset, path)
-        setattr(OGBNarxivDataset, "metric", "Accuracy")
-        setattr(OGBNarxivDataset, "loss", "nll_loss")
-        split_idx = self.get_idx_split()
-
-        datalist = []
-        for d in self:
-            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
-            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
-            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
-            datalist.append(d)
-        self.data, self.slices = self.collate(datalist)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBNarxivDataset, self).get(idx)
-
-
-@register_dataset("ogbn-papers100M")
-class OGBNpapers100MDataset(PygNodePropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbn-papers100M"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygNodePropPredDataset(name=dataset, root=path)
-        super(OGBNpapers100MDataset, self).__init__(dataset, path)
-        setattr(OGBNpapers100MDataset, "metric", "Accuracy")
-        setattr(OGBNpapers100MDataset, "loss", "nll_loss")
-        split_idx = self.get_idx_split()
-        datalist = []
-        for d in self:
-            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
-            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
-            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
-            datalist.append(d)
-        self.data, self.slices = self.collate(datalist)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBNpapers100MDataset, self).get(idx)
-
-
-@register_dataset("ogbn-mag")
-class OGBNmagDataset(PygNodePropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbn-mag"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygNodePropPredDataset(name=dataset, root=path)
-        super(OGBNmagDataset, self).__init__(dataset, path)
-
-        # Preprocess
-        rel_data = self[0]
-        # We are only interested in paper <-> paper relations.
-        self.data = Data(
-            x=rel_data.x_dict["paper"],
-            edge_index=rel_data.edge_index_dict[("paper", "cites", "paper")],
-            y=rel_data.y_dict["paper"],
-        )
-
-        # self.data = T.ToSparseTensor()(data)
-        # self[0].adj_t = self[0].adj_t.to_symmetric()
-
-        setattr(OGBNmagDataset, "metric", "Accuracy")
-        setattr(OGBNmagDataset, "loss", "nll_loss")
-        split_idx = self.get_idx_split()
-
-        datalist = []
-        for d in self:
-            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
-            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
-            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
-            datalist.append(d)
-        self.data, self.slices = self.collate(datalist)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBNmagDataset, self).get(idx)
-
-
-# OGBG
-
-
-@register_dataset("ogbg-molhiv")
-class OGBGmolhivDataset(PygGraphPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbg-molhiv"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygGraphPropPredDataset(name=dataset, root=path)
-        super(OGBGmolhivDataset, self).__init__(dataset, path)
-        setattr(OGBGmolhivDataset, "metric", "ROC-AUC")
-        setattr(OGBGmolhivDataset, "loss", "binary_cross_entropy_with_logits")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBGmolhivDataset, self).get(idx)
-
-
-@register_dataset("ogbg-molpcba")
-class OGBGmolpcbaDataset(PygGraphPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbg-molpcba"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygGraphPropPredDataset(name=dataset, root=path)
-        super(OGBGmolpcbaDataset, self).__init__(dataset, path)
-        setattr(OGBGmolpcbaDataset, "metric", "AP")
-        setattr(OGBGmolpcbaDataset, "loss", "binary_cross_entropy_with_logits")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBGmolpcbaDataset, self).get(idx)
-
-
-@register_dataset("ogbg-ppa")
-class OGBGppaDataset(PygGraphPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbg-ppa"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygGraphPropPredDataset(name=dataset, root=path)
-        super(OGBGppaDataset, self).__init__(dataset, path)
-        setattr(OGBGppaDataset, "metric", "Accuracy")
-        setattr(OGBGppaDataset, "loss", "cross_entropy")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBGppaDataset, self).get(idx)
-
-
-@register_dataset("ogbg-code")
-class OGBGcodeDataset(PygGraphPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbg-code"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygGraphPropPredDataset(name=dataset, root=path)
-        super(OGBGcodeDataset, self).__init__(dataset, path)
-        setattr(OGBGcodeDataset, "metric", "F1 score")
-        setattr(OGBGcodeDataset, "loss", "cross_entropy")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBGcodeDataset, self).get(idx)
-
-
-# OGBL
-
-
-@register_dataset("ogbl-ppa")
-class OGBLppaDataset(PygLinkPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbl-ppa"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygLinkPropPredDataset(name=dataset, root=path)
-        super(OGBLppaDataset, self).__init__(dataset, path)
-        setattr(OGBLppaDataset, "metric", "Hits@100")
-        setattr(OGBLppaDataset, "loss", "pos_neg_loss")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBLppaDataset, self).get(idx)
-
-
-@register_dataset("ogbl-collab")
-class OGBLcollabDataset(PygLinkPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbl-collab"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygLinkPropPredDataset(name=dataset, root=path)
-        super(OGBLcollabDataset, self).__init__(dataset, path)
-        setattr(OGBLcollabDataset, "metric", "Hits@50")
-        setattr(OGBLcollabDataset, "loss", "pos_neg_loss")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBLcollabDataset, self).get(idx)
-
-
-@register_dataset("ogbl-ddi")
-class OGBLddiDataset(PygLinkPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbl-ddi"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygLinkPropPredDataset(name=dataset, root=path)
-        super(OGBLddiDataset, self).__init__(dataset, path)
-        setattr(OGBLddiDataset, "metric", "Hits@20")
-        setattr(OGBLddiDataset, "loss", "pos_neg_loss")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBLddiDataset, self).get(idx)
-
-
-@register_dataset("ogbl-citation")
-class OGBLcitationDataset(PygLinkPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbl-citation"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygLinkPropPredDataset(name=dataset, root=path)
-        super(OGBLcitationDataset, self).__init__(dataset, path)
-        setattr(OGBLcitationDataset, "metric", "MRR")
-        setattr(OGBLcitationDataset, "loss", "pos_neg_loss")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBLcitationDataset, self).get(idx)
-
-
-@register_dataset("ogbl-wikikg")
-class OGBLwikikgDataset(PygLinkPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbl-wikikg"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygLinkPropPredDataset(name=dataset, root=path)
-        super(OGBLwikikgDataset, self).__init__(dataset, path)
-        setattr(OGBLwikikgDataset, "metric", "MRR")
-        setattr(OGBLwikikgDataset, "loss", "pos_neg_loss")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBLwikikgDataset, self).get(idx)
-
-
-@register_dataset("ogbl-biokg")
-class OGBLbiokgDataset(PygLinkPropPredDataset):
-    def __init__(self, path):
-        dataset = "ogbl-biokg"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        PygLinkPropPredDataset(name=dataset, root=path)
-        super(OGBLbiokgDataset, self).__init__(dataset, path)
-        setattr(OGBLbiokgDataset, "metric", "MRR")
-        setattr(OGBLbiokgDataset, "loss", "pos_neg_loss")
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(OGBLbiokgDataset, self).get(idx)
diff --git a/autogl/datasets/pyg.py b/autogl/datasets/pyg.py
deleted file mode 100644
index 7a39d3d..0000000
--- a/autogl/datasets/pyg.py
+++ /dev/null
@@ -1,407 +0,0 @@
-import os.path as osp
-
-import torch
-
-# import torch_geometric.transforms as T
-from torch_geometric.datasets import (
-    Planetoid,
-    Reddit,
-    TUDataset,
-    QM9,
-    Amazon,
-    Coauthor,
-    Flickr,
-)
-from torch_geometric.utils import remove_self_loops
-from . import register_dataset
-
-
-@register_dataset("amazon_computers")
-class AmazonComputersDataset(Amazon):
-    def __init__(self, path):
-        dataset = "Computers"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        Amazon(path, dataset)
-        super(AmazonComputersDataset, self).__init__(path, dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(AmazonComputersDataset, self).get(idx)
-
-
-@register_dataset("amazon_photo")
-class AmazonPhotoDataset(Amazon):
-    def __init__(self, path):
-        dataset = "Photo"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        Amazon(path, dataset)
-        super(AmazonPhotoDataset, self).__init__(path, dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(AmazonPhotoDataset, self).get(idx)
-
-
-@register_dataset("coauthor_physics")
-class CoauthorPhysicsDataset(Coauthor):
-    def __init__(self, path):
-        dataset = "Physics"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        Coauthor(path, dataset)
-        super(CoauthorPhysicsDataset, self).__init__(path, dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(CoauthorPhysicsDataset, self).get(idx)
-
-
-@register_dataset("coauthor_cs")
-class CoauthorCSDataset(Coauthor):
-    def __init__(self, path):
-        dataset = "CS"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        Coauthor(path, dataset)
-        super(CoauthorCSDataset, self).__init__(path, dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(CoauthorCSDataset, self).get(idx)
-
-
-@register_dataset("cora")
-class CoraDataset(Planetoid):
-    def __init__(self, path):
-        dataset = "Cora"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        Planetoid(path, dataset)
-        super(CoraDataset, self).__init__(path, dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(CoraDataset, self).get(idx)
-
-
-@register_dataset("citeseer")
-class CiteSeerDataset(Planetoid):
-    def __init__(self, path):
-        dataset = "CiteSeer"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        Planetoid(path, dataset)
-        super(CiteSeerDataset, self).__init__(path, dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(CiteSeerDataset, self).get(idx)
-
-
-@register_dataset("pubmed")
-class PubMedDataset(Planetoid):
-    def __init__(self, path):
-        dataset = "PubMed"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        Planetoid(path, dataset)
-        super(PubMedDataset, self).__init__(path, dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(PubMedDataset, self).get(idx)
-
-
-@register_dataset("reddit")
-class RedditDataset(Reddit):
-    def __init__(self, path):
-        dataset = "Reddit"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        Reddit(path)
-        super(RedditDataset, self).__init__(path)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(RedditDataset, self).get(idx)
-
-
-@register_dataset("flickr")
-class FlickrDataset(Flickr):
-    def __init__(self, path):
-        Flickr(path)
-        super(FlickrDataset, self).__init__(path)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(FlickrDataset, self).get(idx)
-
-
-@register_dataset("mutag")
-class MUTAGDataset(TUDataset):
-    def __init__(self, path):
-        dataset = "MUTAG"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(MUTAGDataset, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(MUTAGDataset, self).get(idx)
-
-
-@register_dataset("imdb-b")
-class IMDBBinaryDataset(TUDataset):
-    def __init__(self, path):
-        dataset = "IMDB-BINARY"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(IMDBBinaryDataset, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(IMDBBinaryDataset, self).get(idx)
-
-
-@register_dataset("imdb-m")
-class IMDBMultiDataset(TUDataset):
-    def __init__(self, path):
-        dataset = "IMDB-MULTI"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(IMDBMultiDataset, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(IMDBMultiDataset, self).get(idx)
-
-
-@register_dataset("collab")
-class CollabDataset(TUDataset):
-    def __init__(self, path):
-        dataset = "COLLAB"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(CollabDataset, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(CollabDataset, self).get(idx)
-
-
-@register_dataset("proteins")
-class ProteinsDataset(TUDataset):
-    def __init__(self, path):
-        dataset = "PROTEINS"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(ProteinsDataset, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(ProteinsDataset, self).get(idx)
-
-
-@register_dataset("reddit-b")
-class REDDITBinary(TUDataset):
-    def __init__(self, path):
-        dataset = "REDDIT-BINARY"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(REDDITBinary, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(REDDITBinary, self).get(idx)
-
-
-@register_dataset("reddit-multi-5k")
-class REDDITMulti5K(TUDataset):
-    def __init__(self, path):
-        dataset = "REDDIT-MULTI-5K"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(REDDITMulti5K, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(REDDITMulti5K, self).get(idx)
-
-
-@register_dataset("reddit-multi-12k")
-class REDDITMulti12K(TUDataset):
-    def __init__(self, path):
-        dataset = "REDDIT-MULTI-12K"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(REDDITMulti12K, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(REDDITMulti12K, self).get(idx)
-
-
-@register_dataset("ptc-mr")
-class PTCMRDataset(TUDataset):
-    def __init__(self, path):
-        dataset = "PTC_MR"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(PTCMRDataset, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(PTCMRDataset, self).get(idx)
-
-
-@register_dataset("nci1")
-class NCI1Dataset(TUDataset):
-    def __init__(self, path):
-        dataset = "NCI1"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(NCI1Dataset, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(NCI1Dataset, self).get(idx)
-
-
-@register_dataset("nci109")
-class NCI109Dataset(TUDataset):
-    def __init__(self, path):
-        dataset = "NCI109"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(NCI109Dataset, self).__init__(path, name=dataset)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(NCI109Dataset, self).get(idx)
-
-
-@register_dataset("enzymes")
-class ENZYMES(TUDataset):
-    def __init__(self, path):
-        dataset = "ENZYMES"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-        TUDataset(path, name=dataset)
-        super(ENZYMES, self).__init__(path, name=dataset)
-
-    def __getitem__(self, idx):
-        if isinstance(idx, int):
-            data = self.get(self.indices()[idx])
-            data = data
-            edge_nodes = data.edge_index.max() + 1
-            if edge_nodes < data.x.size(0):
-                data.x = data.x[:edge_nodes]
-            return data
-        else:
-            return self.index_select(idx)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(ENZYMES, self).get(idx)
-
-
-@register_dataset("qm9")
-class QM9Dataset(QM9):
-    def __init__(self, path):
-        dataset = "QM9"
-        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
-
-        target = 0
-
-        class MyTransform(object):
-            def __call__(self, data):
-                # Specify target.
-                data.y = data.y[:, target]
-                return data
-
-        class Complete(object):
-            def __call__(self, data):
-                device = data.edge_index.device
-                row = torch.arange(data.num_nodes, dtype=torch.long, device=device)
-                col = torch.arange(data.num_nodes, dtype=torch.long, device=device)
-                row = row.view(-1, 1).repeat(1, data.num_nodes).view(-1)
-                col = col.repeat(data.num_nodes)
-                edge_index = torch.stack([row, col], dim=0)
-                edge_attr = None
-                if data.edge_attr is not None:
-                    idx = data.edge_index[0] * data.num_nodes + data.edge_index[1]
-                    size = list(data.edge_attr.size())
-                    size[0] = data.num_nodes * data.num_nodes
-                    edge_attr = data.edge_attr.new_zeros(size)
-                    edge_attr[idx] = data.edge_attr
-                edge_index, edge_attr = remove_self_loops(edge_index, edge_attr)
-                data.edge_attr = edge_attr
-                data.edge_index = edge_index
-                return data
-
-        if not osp.exists(path):
-            QM9(path)
-        super(QM9Dataset, self).__init__(path)
-
-    def get(self, idx):
-        if hasattr(self, "__data_list__"):
-            delattr(self, "__data_list__")
-        if hasattr(self, "_data_list"):
-            delattr(self, "_data_list")
-        return super(QM9Dataset, self).get(idx)
diff --git a/autogl/datasets/utils.py b/autogl/datasets/utils.py
deleted file mode 100644
index d35f887..0000000
--- a/autogl/datasets/utils.py
+++ /dev/null
@@ -1,453 +0,0 @@
-from pdb import set_trace
-import torch
-import numpy as np
-from torch_geometric.data import DataLoader
-from torch_geometric.utils import train_test_split_edges
-from sklearn.model_selection import StratifiedKFold, KFold
-
-
-def split_edges(dataset, train_ratio, val_ratio):
-    datas = [data for data in dataset]
-    for i in range(len(datas)):
-        datas[i] = train_test_split_edges(
-            datas[i], val_ratio, 1 - train_ratio - val_ratio
-        )
-    dataset.data, dataset.slices = dataset.collate(datas)
-
-
-def get_label_number(dataset):
-    r"""Get the number of labels in this dataset as dict."""
-    label_num = {}
-    labels = dataset.data.y.unique().cpu().detach().numpy().tolist()
-    for label in labels:
-        label_num[label] = (dataset.data.y == label).sum().item()
-    return label_num
-
-
-def index_to_mask(index, size):
-    mask = torch.zeros(size, dtype=torch.bool, device=index.device)
-    mask[index] = 1
-    return mask
-
-
-def random_splits_mask(dataset, train_ratio=0.2, val_ratio=0.4, seed=None):
-    r"""If the data has masks for train/val/test, return the splits with specific ratio.
-
-    Parameters
-    ----------
-    train_ratio : float
-        the portion of data that used for training.
-
-    val_ratio : float
-        the portion of data that used for validation.
-
-    seed : int
-        random seed for splitting dataset.
-    """
-
-    assert (
-        train_ratio + val_ratio <= 1
-    ), "the sum of train_ratio and val_ratio is larger than 1"
-    _dataset = [d for d in dataset]
-    for data in _dataset:
-        r_s = torch.get_rng_state()
-        if torch.cuda.is_available():
-            r_s_cuda = torch.cuda.get_rng_state()
-        if seed is not None:
-            torch.manual_seed(seed)
-            if torch.cuda.is_available():
-                torch.cuda.manual_seed(seed)
-
-        perm = torch.randperm(data.num_nodes)
-        train_index = perm[: int(data.num_nodes * train_ratio)]
-        val_index = perm[
-            int(data.num_nodes * train_ratio) : int(
-                data.num_nodes * (train_ratio + val_ratio)
-            )
-        ]
-        test_index = perm[int(data.num_nodes * (train_ratio + val_ratio)) :]
-        data.train_mask = index_to_mask(train_index, size=data.num_nodes)
-        data.val_mask = index_to_mask(val_index, size=data.num_nodes)
-        data.test_mask = index_to_mask(test_index, size=data.num_nodes)
-
-        torch.set_rng_state(r_s)
-        if torch.cuda.is_available():
-            torch.cuda.set_rng_state(r_s_cuda)
-
-    dataset.data, dataset.slices = dataset.collate(_dataset)
-    if hasattr(dataset, "__data_list__"):
-        delattr(dataset, "__data_list__")
-    # while type(dataset.data.num_nodes) == list:
-    #    dataset.data.num_nodes = dataset.data.num_nodes[0]
-    # dataset.data.num_nodes = dataset.data.num_nodes[0]
-    return dataset
-
-
-def random_splits_mask_class(
-    dataset,
-    num_train_per_class=20,
-    num_val_per_class=30,
-    num_val=None,
-    num_test=None,
-    seed=None,
-):
-    r"""If the data has masks for train/val/test, return the splits with specific number of samples from every class for training as suggested in Pitfalls of graph neural network evaluation [#]_ for semi-supervised learning.
-
-    References
-    ----------
-    .. [#] Shchur, O., Mumme, M., Bojchevski, A., & Günnemann, S. (2018).
-        Pitfalls of graph neural network evaluation.
-        arXiv preprint arXiv:1811.05868.
-
-    Parameters
-    ----------
-    num_train_per_class : int
-        the number of samples from every class used for training.
-
-    num_val_per_class : int
-        the number of samples from every class used for validation.
-
-    num_val : int
-        the total number of nodes that used for validation as alternative.
-
-    num_test : int
-        the total number of nodes that used for testing as alternative. The rest of the data will be seleted as test set if num_test set to None.
-
-    seed : int
-        random seed for splitting dataset.
-    """
-    data = dataset[0]
-
-    r_s = torch.get_rng_state()
-    if torch.cuda.is_available():
-        r_s_cuda = torch.cuda.get_rng_state()
-    if seed is not None:
-        torch.manual_seed(seed)
-        if torch.cuda.is_available():
-            torch.cuda.manual_seed(seed)
-
-    num_classes = data.y.max().cpu().item() + 1
-    try:
-        data.train_mask.fill_(False)
-        data.val_mask.fill_(False)
-        data.test_mask.fill_(False)
-    except:
-        train_mask = torch.zeros(
-            data.num_nodes, dtype=torch.bool, device=data.edge_index.device
-        )
-        val_mask = torch.zeros(
-            data.num_nodes, dtype=torch.bool, device=data.edge_index.device
-        )
-        test_mask = torch.zeros(
-            data.num_nodes, dtype=torch.bool, device=data.edge_index.device
-        )
-        setattr(data, "train_mask", train_mask)
-        setattr(data, "val_mask", val_mask)
-        setattr(data, "test_mask", test_mask)
-    for c_i in range(num_classes):
-        idx = (data.y == c_i).nonzero().view(-1)
-        assert num_train_per_class + num_val_per_class < idx.size(0), (
-            "the total number of samples from every class used for training and validation is larger than the total samples in class "
-            + str(c_i)
-        )
-        idx_idx_rand = torch.randperm(idx.size(0))
-        idx_train = idx[idx_idx_rand[:num_train_per_class]]
-        idx_val = idx[
-            idx_idx_rand[num_train_per_class : num_train_per_class + num_val_per_class]
-        ]
-        data.train_mask[idx_train] = True
-        data.val_mask[idx_val] = True
-
-    if num_val is not None:
-        remaining = (~data.train_mask).nonzero().view(-1)
-        remaining = remaining[torch.randperm(remaining.size(0))]
-        data.val_mask[remaining[:num_val]] = True
-        if num_test is not None:
-            data.test_mask[remaining[num_val : num_val + num_test]] = True
-        else:
-            data.test_mask[remaining[num_val:]] = True
-    else:
-        remaining = (~(data.train_mask + data.val_mask)).nonzero().view(-1)
-        data.test_mask[remaining] = True
-
-    torch.set_rng_state(r_s)
-    if torch.cuda.is_available():
-        torch.cuda.set_rng_state(r_s_cuda)
-
-    datalist = []
-    for d in dataset:
-        setattr(d, "train_mask", data.train_mask)
-        setattr(d, "val_mask", data.val_mask)
-        setattr(d, "test_mask", data.test_mask)
-        datalist.append(d)
-    dataset.data, dataset.slices = dataset.collate(datalist)
-    if hasattr(dataset, "__data_list__"):
-        delattr(dataset, "__data_list__")
-    # while type(dataset.data.num_nodes) == list:
-    #     dataset.data.num_nodes = dataset.data.num_nodes[0]
-    # dataset.data.num_nodes = dataset.data.num_nodes[0]
-    return dataset
-
-
-def graph_cross_validation(
-    dataset, n_splits=10, shuffle=True, random_seed=42, stratify=False
-):
-    r"""Cross validation for graph classification data, returning one fold with specific idx in autogl.datasets or pyg.Dataloader(default)
-
-    Parameters
-    ----------
-    dataset : str
-        dataset with multiple graphs.
-
-    n_splits : int
-        the number of how many folds will be splitted.
-
-    shuffle : bool
-        shuffle or not for sklearn.model_selection.StratifiedKFold
-
-    random_seed : int
-        random_state for sklearn.model_selection.StratifiedKFold
-    """
-    if stratify:
-        skf = StratifiedKFold(
-            n_splits=n_splits, shuffle=shuffle, random_state=random_seed
-        )
-    else:
-        skf = KFold(n_splits=n_splits, shuffle=shuffle, random_state=random_seed)
-    idx_list = []
-
-    # BUG: from pytorch_geometric, not sure whether it is a bug. The dataset.data will return
-    # the data of original dataset even if the input dataset is subset of original. We hackfix
-    # this bug currently by iterating y.
-
-    dataset_y = [data.y[0].tolist() for data in dataset]
-
-    for idx in skf.split(np.zeros(len(dataset_y)), dataset_y):
-        idx_list.append(idx)
-    dataset.idx_list = idx_list
-    dataset.n_splits = n_splits
-    # BUG: only saving idx will result in different references when calling multiple times,
-    # we need to also save splits in advance.
-    dataset.cv_dict = [
-        {
-            "train": dataset[dataset.idx_list[idx][0].tolist()],
-            "val": dataset[dataset.idx_list[idx][1].tolist()],
-        }
-        for idx in range(n_splits)
-    ]
-    graph_set_fold_id(dataset, 0)
-
-    return dataset
-
-
-def graph_set_fold_id(dataset, fold_id):
-    r"""Set the current fold id of graph dataset.
-
-    Parameters
-    ----------
-    dataset: ``torch_geometric.data.dataset.Dataset``
-        dataset with multiple graphs.
-
-    fold_id: ``int``
-        The current fold id this dataset uses. Should be in [0, dataset.n_splits)
-
-    Returns
-    -------
-    ``torch_geometric.data.dataset.Dataset``
-        The reference original dataset.
-    """
-    if not hasattr(dataset, "n_splits"):
-        raise ValueError("Dataset set fold id before cross validated!")
-    assert (
-        0 <= fold_id < dataset.n_splits
-    ), "Fold id %d exceed total cross validation split number %d" % (
-        fold_id,
-        dataset.n_splits,
-    )
-    dataset.current_fold_id = fold_id
-    dataset.train_split = dataset.cv_dict[dataset.current_fold_id]["train"]
-    dataset.val_split = dataset.cv_dict[dataset.current_fold_id]["val"]
-    dataset.train_index = dataset.idx_list[dataset.current_fold_id][0]
-    dataset.val_index = dataset.idx_list[dataset.current_fold_id][1]
-    return dataset
-
-
-def graph_random_splits(dataset, train_ratio=0.2, val_ratio=0.4, seed=None):
-    r"""Splitting graph dataset with specific ratio for train/val/test.
-
-    Parameters
-    ----------
-    dataset: ``torch_geometric.data.dataset.Dataset``
-        dataset with multiple graphs.
-
-    train_ratio : float
-        the portion of data that used for training.
-
-    val_ratio : float
-        the portion of data that used for validation.
-
-    seed : int
-        random seed for splitting dataset.
-
-    Returns
-    -------
-    ``torch_geometric.data.dataset.Dataset``
-        The reference of original dataset
-    """
-
-    assert (
-        train_ratio + val_ratio <= 1
-    ), "the sum of train_ratio and val_ratio is larger than 1"
-    r_s = torch.get_rng_state()
-    if torch.cuda.is_available():
-        r_s_cuda = torch.cuda.get_rng_state()
-    if seed is not None:
-        torch.manual_seed(seed)
-        if torch.cuda.is_available():
-            torch.cuda.manual_seed(seed)
-
-    perm = torch.randperm(len(dataset))
-    train_index = perm[: int(len(dataset) * train_ratio)]
-    val_index = perm[
-        int(len(dataset) * train_ratio) : int(len(dataset) * (train_ratio + val_ratio))
-    ]
-    test_index = perm[int(len(dataset) * (train_ratio + val_ratio)) :]
-    train_dataset = dataset[train_index]
-    val_dataset = dataset[val_index]
-    test_dataset = dataset[test_index]
-
-    # set train_idx, val_idx and test_idx as dataset attribute
-    dataset.train_split = train_dataset
-    dataset.val_split = val_dataset
-    dataset.test_split = test_dataset
-
-    dataset.train_index = train_index
-    dataset.val_index = val_index
-    dataset.test_index = test_index
-
-    torch.set_rng_state(r_s)
-    if torch.cuda.is_available():
-        torch.cuda.set_rng_state(r_s_cuda)
-
-    return dataset
-
-
-def graph_get_split(
-    dataset, mask="train", is_loader=True, batch_size=128, num_workers=0
-):
-    r"""Get train/test dataset/dataloader after cross validation.
-
-    Parameters
-    ----------
-    dataset: ``torch_geometric.data.dataset.Dataset``
-        dataset with multiple graphs.
-
-    mask : str
-        return with which dataset/dataloader
-
-    is_loader : bool
-        return with autogl.datasets or pyg.Dataloader
-
-    batch_size : int
-        batch_size for generateing Dataloader
-
-    """
-    assert hasattr(
-        dataset, "%s_split" % (mask)
-    ), "Given dataset do not have %s split" % (mask)
-    if is_loader:
-        return DataLoader(
-            getattr(dataset, "%s_split" % (mask)),
-            batch_size=batch_size,
-            num_workers=num_workers,
-        )
-    else:
-        return getattr(dataset, "%s_split" % (mask))
-
-
-'''
-def graph_cross_validation(dataset, n_splits = 10, shuffle = True, random_seed = 42, fold_idx = 0, batch_size = 32, dataloader = True):
-    r"""Cross validation for graph classification data, returning one fold with specific idx in autogl.datasets or pyg.Dataloader(default)
-
-    Parameters
-    ----------
-    dataset : str
-        dataset with multiple graphs.
-
-    n_splits : int
-        the number of how many folds will be splitted.
-
-    shuffle : bool
-        shuffle or not for sklearn.model_selection.StratifiedKFold
-
-    random_seed : int
-        random_state for sklearn.model_selection.StratifiedKFold
-
-    fold_idx : int
-        specific fold id from 0 to n_splits-1
-
-    batch_size : int
-        batch_size for generateing Dataloader
-
-    dataloader : bool
-        return with autogl.datasets or pyg.Dataloader
-    """
-    skf = StratifiedKFold(n_splits=n_splits, shuffle = shuffle, random_state = random_seed)
-    idx_list = []
-    for idx in skf.split(np.zeros(len(dataset.data.y)), dataset.data.y):
-        idx_list.append(idx)
-    assert 0 <= fold_idx and fold_idx < n_splits, "fold_idx must be from 0 to " + str(n_splits-1)
-    train_idx, test_idx = idx_list[fold_idx]
-    test_dataset = dataset[test_idx.tolist()]
-    train_dataset = dataset[train_idx.tolist()]
-    if dataloader:
-        return DataLoader(train_dataset, batch_size=128), DataLoader(test_dataset, batch_size=128)
-    else:
-        return train_dataset, test_dataset
-'''
-
-
-def train_test_split(self, method="auto", ratio=None):
-    raise NotImplementedError()
-
-
-def train_valid_split(self, method="auto", ratio=None):
-    raise NotImplementedError()
-
-
-def cross_validation_split(self, method="auto", cv_fold_num=5):
-    return NotImplementedError()
-
-
-# below get_* can also be set as property
-def get_train_dataset(self):
-    raise NotImplementedError()
-
-
-def get_test_dataset(self):
-    raise NotImplementedError()
-
-
-def get_valid_dataset(self):
-    raise NotImplementedError()
-
-
-def get_train_generator(self, batch_size):
-    """
-    should return a torch.utils.data.Dataloader
-    """
-    raise NotImplementedError()
-
-
-def get_test_generator(self, batch_size):
-    """
-    should return a torch.utils.data.Dataloader
-    """
-    raise NotImplementedError()
-
-
-def get_valid_generator(self, batch_size):
-    """
-    should return a torch.utils.data.Dataloader
-    """
-    raise NotImplementedError()
diff --git a/autogl/datasets/utils/__init__.py b/autogl/datasets/utils/__init__.py
new file mode 100644
index 0000000..85b58ff
--- /dev/null
+++ b/autogl/datasets/utils/__init__.py
@@ -0,0 +1,9 @@
+from ._general import (
+    index_to_mask,
+    split_edges,
+    random_splits_mask,
+    random_splits_mask_class,
+    graph_cross_validation,
+    graph_random_splits,
+    graph_get_split
+)
diff --git a/autogl/datasets/utils/_general.py b/autogl/datasets/utils/_general.py
new file mode 100644
index 0000000..5480cbd
--- /dev/null
+++ b/autogl/datasets/utils/_general.py
@@ -0,0 +1,402 @@
+import numpy as np
+import random
+import torch
+import torch.utils.data
+import typing as _typing
+from sklearn.model_selection import StratifiedKFold, KFold
+from autogl.data import Data, InMemoryDataset, InMemoryStaticGraphSet
+from ...data.graph import GeneralStaticGraph, GeneralStaticGraphGenerator
+from . import _pyg
+
+
+def index_to_mask(index: torch.Tensor, size):
+    mask = torch.zeros(size, dtype=torch.bool, device=index.device)
+    mask[index] = True
+    return mask
+
+
+def split_edges(
+        dataset: InMemoryStaticGraphSet,
+        train_ratio: float, val_ratio: float
+) -> InMemoryStaticGraphSet:
+    test_ratio: float = 1 - train_ratio - val_ratio
+
+    def _split_edges_for_graph(homogeneous_static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        if not isinstance(homogeneous_static_graph, GeneralStaticGraph):
+            raise TypeError
+        elif not homogeneous_static_graph.edges.is_homogeneous:
+            raise ValueError("The provided graph MUST consist of homogeneous edges.")
+        else:
+            split_data = _pyg.train_test_split_edges(
+                Data(
+                    edge_index=homogeneous_static_graph.edges.connections.detach().clone(),
+                    edge_attr=(
+                        homogeneous_static_graph.edges.data['edge_attr'].detach().clone()
+                        if 'edge_attr' in homogeneous_static_graph.edges.data else None
+                    )
+                ),
+                val_ratio, test_ratio
+            )
+            original_edge_type = [et for et in homogeneous_static_graph.edges][0]
+
+            split_static_graph = GeneralStaticGraphGenerator.create_heterogeneous_static_graph(
+                dict([
+                    (node_type, homogeneous_static_graph.nodes[node_type].data)
+                    for node_type in homogeneous_static_graph.nodes
+                ]),
+                {
+                    (original_edge_type.source_node_type, "train_pos_edge", original_edge_type.target_node_type): (
+                        getattr(split_data, "train_pos_edge_index"),
+                        {"edge_attr": getattr(split_data, "train_pos_edge_attr")}
+                        if isinstance(getattr(split_data, "train_pos_edge_attr"), torch.Tensor)
+                        else None
+                    ),
+                    (original_edge_type.source_node_type, "val_pos_edge", original_edge_type.target_node_type): (
+                        getattr(split_data, "val_pos_edge_index"),
+                        {"edge_attr": getattr(split_data, "val_pos_edge_attr")}
+                        if isinstance(getattr(split_data, "val_pos_edge_attr"), torch.Tensor)
+                        else None
+                    ),
+                    (original_edge_type.source_node_type, "val_neg_edge", original_edge_type.target_node_type):
+                        getattr(split_data, "val_neg_edge_index"),
+                    (original_edge_type.source_node_type, "test_pos_edge", original_edge_type.target_node_type): (
+                        getattr(split_data, "test_pos_edge_index"),
+                        {"edge_attr": getattr(split_data, "test_pos_edge_attr")}
+                        if isinstance(getattr(split_data, "test_pos_edge_attr"), torch.Tensor)
+                        else None
+                    ),
+                    (original_edge_type.source_node_type, "test_neg_edge", original_edge_type.target_node_type):
+                        getattr(split_data, "test_neg_edge_index")
+                },
+                homogeneous_static_graph.data
+            )
+            return split_static_graph
+
+    if not isinstance(dataset, InMemoryStaticGraphSet):
+        raise TypeError
+    for index in range(len(dataset)):
+        dataset[index] = _split_edges_for_graph(dataset[index])
+    return dataset
+
+
+def random_splits_mask(
+        dataset: InMemoryStaticGraphSet,
+        train_ratio: float = 0.2, val_ratio: float = 0.4,
+        seed: _typing.Optional[int] = None
+) -> InMemoryStaticGraphSet:
+    r"""If the data has masks for train/val/test, return the splits with specific ratio.
+
+    Parameters
+    ----------
+    dataset : InMemoryStaticGraphSet
+        graph set
+    train_ratio : float
+        the portion of data that used for training.
+
+    val_ratio : float
+        the portion of data that used for validation.
+
+    seed : int
+        random seed for splitting dataset.
+    """
+    if not train_ratio + val_ratio <= 1:
+        raise ValueError("the sum of provided train_ratio and val_ratio is larger than 1")
+
+    def __random_split_masks(
+            num_nodes: int
+    ) -> _typing.Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
+        _rng_state: torch.Tensor = torch.get_rng_state()
+        if seed is not None and isinstance(seed, int):
+            torch.manual_seed(seed)
+        perm = torch.randperm(num_nodes)
+        train_index = perm[:int(num_nodes * train_ratio)]
+        val_index = perm[int(num_nodes * train_ratio): int(num_nodes * (train_ratio + val_ratio))]
+        test_index = perm[int(num_nodes * (train_ratio + val_ratio)):]
+        torch.set_rng_state(_rng_state)
+        return (
+            index_to_mask(train_index, num_nodes),
+            index_to_mask(val_index, num_nodes),
+            index_to_mask(test_index, num_nodes)
+        )
+
+    for index in range(len(dataset)):
+        for node_type in dataset[index].nodes:
+            data_keys = [data_key for data_key in dataset[index].nodes.data]
+            if len(data_keys) > 0:
+                _num_nodes: int = dataset[index].nodes[node_type].data[data_keys[0]].size(0)
+                _masks: _typing.Tuple[torch.Tensor, torch.Tensor, torch.Tensor] = (
+                    __random_split_masks(_num_nodes)
+                )
+                dataset[index].nodes[node_type].data["train_mask"] = _masks[0]
+                dataset[index].nodes[node_type].data["val_mask"] = _masks[1]
+                dataset[index].nodes[node_type].data["test_mask"] = _masks[2]
+    return dataset
+
+
+def random_splits_mask_class(
+        dataset: InMemoryStaticGraphSet,
+        num_train_per_class: int = 20,
+        num_val_per_class: int = 30,
+        total_num_val: _typing.Optional[int] = ...,
+        total_num_test: _typing.Optional[int] = ...,
+        seed: _typing.Optional[int] = ...
+):
+    r"""If the data has masks for train/val/test, return the splits with specific number of samples from every class for training as suggested in Pitfalls of graph neural network evaluation [#]_ for semi-supervised learning.
+
+    References
+    ----------
+    .. [#] Shchur, O., Mumme, M., Bojchevski, A., & Günnemann, S. (2018).
+        Pitfalls of graph neural network evaluation.
+        arXiv preprint arXiv:1811.05868.
+
+    Parameters
+    ----------
+    dataset: InMemoryStaticGraphSet
+        instance of InMemoryStaticGraphSet
+    num_train_per_class : int
+        the number of samples from every class used for training.
+
+    num_val_per_class : int
+        the number of samples from every class used for validation.
+
+    total_num_val : int
+        the total number of nodes that used for validation as alternative.
+
+    total_num_test : int
+        the total number of nodes that used for testing as alternative. The rest of the data will be seleted as test set if num_test set to None.
+
+    seed : int
+        random seed for splitting dataset.
+    """
+    for graph_index in range(len(dataset)):
+        for node_type in dataset[graph_index].nodes:
+            if (
+                    'y' in dataset[graph_index].nodes[node_type].data and
+                    'label' in dataset[graph_index].nodes[node_type].data
+            ):
+                raise ValueError(
+                    f"Both 'y' and 'label' data exist "
+                    f"for node type [{node_type}] in "
+                    f"graph with index [{graph_index}]."
+                )
+            elif (
+                    'y' not in dataset[graph_index].nodes[node_type].data and
+                    'label' not in dataset[graph_index].nodes[node_type].data
+            ):
+                continue
+            elif 'y' in dataset[graph_index].nodes[node_type].data:
+                label: torch.Tensor = dataset[graph_index].nodes[node_type].data['y']
+            elif 'label' in dataset[graph_index].nodes[node_type].data:
+                label: torch.Tensor = dataset[graph_index].nodes[node_type].data['label']
+            else:
+                raise RuntimeError
+            num_nodes: int = label.size(0)
+            num_classes: int = label.cpu().max().item() + 1
+
+            _rng_state: torch.Tensor = torch.get_rng_state()
+            if seed not in (Ellipsis, None) and isinstance(seed, int):
+                torch.manual_seed(seed)
+            train_mask = torch.zeros(num_nodes, dtype=torch.bool, device=label.device)
+            val_mask = torch.zeros(num_nodes, dtype=torch.bool, device=label.device)
+            test_mask = torch.zeros(num_nodes, dtype=torch.bool, device=label.device)
+            for class_index in range(num_classes):
+                idx = (label == class_index).nonzero().view(-1)
+                assert num_train_per_class + num_val_per_class < idx.size(0), (
+                    f"the total number of samples from every class "
+                    f"used for training and validation is larger than "
+                    f"the total samples in class [{class_index}] for node type [{node_type}] "
+                    f"in graph with index [{graph_index}]"
+                )
+                randomized_index: torch.Tensor = torch.randperm(idx.size(0))
+                train_idx = idx[randomized_index[:num_train_per_class]]
+                val_idx = idx[
+                    randomized_index[num_train_per_class: (num_train_per_class + num_val_per_class)]
+                ]
+                train_mask[train_idx] = True
+                val_mask[val_idx] = True
+
+            if isinstance(total_num_val, int) and total_num_val > 0:
+                remaining = (~train_mask).nonzero().view(-1)
+                remaining = remaining[torch.randperm(remaining.size(0))]
+                val_mask[remaining[:total_num_val]] = True
+                if isinstance(total_num_test, int) and total_num_test > 0:
+                    test_mask[remaining[total_num_val: (total_num_val + total_num_test)]] = True
+                else:
+                    test_mask[remaining[total_num_val:]] = True
+            else:
+                remaining = (~(train_mask + val_mask)).nonzero().view(-1)
+                test_mask[remaining] = True
+
+            torch.set_rng_state(_rng_state)
+            dataset[graph_index].nodes[node_type].data["train_mask"] = train_mask
+            dataset[graph_index].nodes[node_type].data["val_mask"] = val_mask
+            dataset[graph_index].nodes[node_type].data["test_mask"] = test_mask
+    return dataset
+
+
+def graph_cross_validation(
+        dataset: InMemoryStaticGraphSet,
+        n_splits: int = 10, shuffle: bool = True,
+        random_seed: _typing.Optional[int] = ...,
+        stratify: bool = False
+) -> InMemoryStaticGraphSet:
+    r"""Cross validation for graph classification data, returning one fold with specific idx in autogl.datasets or pyg.Dataloader(default)
+
+    Parameters
+    ----------
+    dataset : str
+        dataset with multiple graphs.
+
+    n_splits : int
+        the number of how many folds will be splitted.
+
+    shuffle : bool
+        shuffle or not for sklearn.model_selection.StratifiedKFold
+
+    random_seed : int
+        random_state for sklearn.model_selection.StratifiedKFold
+
+    stratify: bool
+    """
+    if not isinstance(dataset, InMemoryStaticGraphSet):
+        raise TypeError
+    if not isinstance(n_splits, int):
+        raise TypeError
+    elif not n_splits > 0:
+        raise ValueError
+    if not isinstance(shuffle, bool):
+        raise TypeError
+    if not (random_seed in (Ellipsis, None) or isinstance(random_seed, int)):
+        raise TypeError
+    elif isinstance(random_seed, int) and random_seed >= 0:
+        _random_seed: int = random_seed
+    else:
+        _random_seed: int = random.randrange(0, 65536)
+    if not isinstance(stratify, bool):
+        raise TypeError
+
+    if stratify:
+        kf = StratifiedKFold(
+            n_splits=n_splits, shuffle=shuffle, random_state=_random_seed
+        )
+    else:
+        kf = KFold(
+            n_splits=n_splits, shuffle=shuffle, random_state=_random_seed
+        )
+    dataset_y = [g.data['y'].item() for g in dataset]
+    idx_list = [
+        (train_index.tolist(), test_index.tolist())
+        for train_index, test_index
+        in kf.split(np.zeros(len(dataset)), np.array(dataset_y))
+    ]
+
+    dataset.folds = idx_list
+    dataset.train_index = idx_list[0][0]
+    dataset.val_index = idx_list[0][1]
+    return dataset
+
+
+def graph_random_splits(
+        dataset: InMemoryStaticGraphSet,
+        train_ratio: float = 0.2,
+        val_ratio: float = 0.4,
+        seed: _typing.Optional[int] = ...
+):
+    r"""Splitting graph dataset with specific ratio for train/val/test.
+
+    Parameters
+    ----------
+    dataset: ``InMemoryStaticGraphSet``
+
+    train_ratio : float
+        the portion of data that used for training.
+
+    val_ratio : float
+        the portion of data that used for validation.
+
+    seed : int
+        random seed for splitting dataset.
+    """
+    _rng_state = torch.get_rng_state()
+    if isinstance(seed, int):
+        torch.manual_seed(seed)
+    perm = torch.randperm(len(dataset))
+    train_index = perm[: int(len(dataset) * train_ratio)]
+    val_index = (
+        perm[int(len(dataset) * train_ratio): int(len(dataset) * (train_ratio + val_ratio))]
+    )
+    test_index = perm[int(len(dataset) * (train_ratio + val_ratio)):]
+    dataset.train_index = train_index
+    dataset.val_index = val_index
+    dataset.test_index = test_index
+    torch.set_rng_state(_rng_state)
+    return dataset
+
+
+def graph_get_split(
+        dataset: InMemoryDataset, mask: str = "train",
+        is_loader: bool = True, batch_size: int = 128,
+        num_workers: int = 0
+) -> _typing.Union[torch.utils.data.DataLoader, _typing.Iterable]:
+    r"""Get train/test dataset/dataloader after cross validation.
+
+    Parameters
+    ----------
+    dataset: ``torch_geometric.data.dataset.Dataset``
+        dataset with multiple graphs.
+
+    mask : str
+
+    is_loader : bool
+        return original dataset or data loader
+
+    batch_size : int
+        batch_size for generating Dataloader
+    num_workers : int
+        number of workers parameter for data loader
+    """
+    if not isinstance(dataset, InMemoryDataset):
+        raise TypeError
+    if not isinstance(mask, str):
+        raise TypeError
+    elif mask.lower() not in ("train", "val", "test"):
+        raise ValueError
+    if not isinstance(is_loader, bool):
+        raise TypeError
+    if not isinstance(batch_size, int):
+        raise TypeError
+    elif not batch_size > 0:
+        raise ValueError
+    if not isinstance(num_workers, int):
+        raise TypeError
+    elif not num_workers >= 0:
+        raise ValueError
+
+    if mask.lower() not in ("train", "val", "test"):
+        raise ValueError
+    elif mask.lower() == "train":
+        __possible_index = dataset.train_split
+    elif mask.lower() == "val":
+        __possible_index = dataset.val_split
+    elif mask.lower() == "test":
+        __possible_index = dataset.test_split
+    else:
+        raise ValueError
+
+    if (
+            __possible_index is None or
+            not isinstance(__possible_index, _typing.Iterable)
+    ):
+        raise ValueError(
+            f"Provided dataset do NOT have {mask} split"
+        )
+    if is_loader:
+        __possible_index: _typing.Any = list(__possible_index)
+        return torch.utils.data.DataLoader(
+            __possible_index,
+            batch_size=batch_size,
+            collate_fn=lambda x: x,
+            num_workers=num_workers
+        )
+    else:
+        return __possible_index
diff --git a/autogl/datasets/utils/_pyg.py b/autogl/datasets/utils/_pyg.py
new file mode 100644
index 0000000..be3d724
--- /dev/null
+++ b/autogl/datasets/utils/_pyg.py
@@ -0,0 +1,116 @@
+""" Migrated `train_test_split_edges` function from PyTorch-Geometric """
+import math
+import torch
+import typing as _typing
+
+
+def to_undirected(
+        edge_index: torch.Tensor, edge_attr: _typing.Optional[torch.Tensor] = None
+) -> _typing.Union[torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]]:
+    r"""Converts the graph given by :attr:`edge_index` to an undirected graph
+    such that :math:`(j,i) \in \mathcal{E}` for every edge :math:`(i,j) \in
+    \mathcal{E}`.
+
+    Args:
+        edge_index (LongTensor): The edge indices.
+        edge_attr (Tensor, optional): Edge weights or multi-dimensional
+            edge features. (default: :obj:`None`)
+        num_nodes (int, optional): The number of nodes, *i.e.*
+            :obj:`max_val + 1` of :attr:`edge_index`. (default: :obj:`None`)
+
+    :rtype: :class:`LongTensor` if :attr:`edge_attr` is :obj:`None`, else
+        (:class:`LongTensor`, :class:`Tensor`)
+    """
+
+    row, col = edge_index
+    row, col = torch.cat([row, col], dim=0), torch.cat([col, row], dim=0)
+    edge_index = torch.stack([row, col], dim=0)
+    if edge_attr is not None:
+        edge_attr = torch.cat([edge_attr, edge_attr], dim=0)
+
+    if edge_attr is None:
+        return edge_index
+    else:
+        return edge_index, edge_attr
+
+
+def train_test_split_edges(data, val_ratio: float = 0.05,
+                           test_ratio: float = 0.1):
+    r"""Splits the edges of a :class:`torch_geometric.data.Data` object
+    into positive and negative train/val/test edges.
+    As such, it will replace the :obj:`edge_index` attribute with
+    :obj:`train_pos_edge_index`, :obj:`train_pos_neg_adj_mask`,
+    :obj:`val_pos_edge_index`, :obj:`val_neg_edge_index` and
+    :obj:`test_pos_edge_index` attributes.
+    If :obj:`data` has edge features named :obj:`edge_attr`, then
+    :obj:`train_pos_edge_attr`, :obj:`val_pos_edge_attr` and
+    :obj:`test_pos_edge_attr` will be added as well.
+
+    Args:
+        data (Data): The data object.
+        val_ratio (float, optional): The ratio of positive validation edges.
+            (default: :obj:`0.05`)
+        test_ratio (float, optional): The ratio of positive test edges.
+            (default: :obj:`0.1`)
+
+    :rtype: :class:`torch_geometric.data.Data`
+    """
+
+    num_nodes = data.num_nodes
+    row, col = data.edge_index
+    edge_attr = data.edge_attr
+    data.edge_index = data.edge_attr = None
+
+    # Return upper triangular portion.
+    mask = row < col
+    row, col = row[mask], col[mask]
+
+    if edge_attr is not None:
+        edge_attr = edge_attr[mask]
+
+    n_v = int(math.floor(val_ratio * row.size(0)))
+    n_t = int(math.floor(test_ratio * row.size(0)))
+
+    # Positive edges.
+    perm = torch.randperm(row.size(0))
+    row, col = row[perm], col[perm]
+    if edge_attr is not None:
+        edge_attr = edge_attr[perm]
+
+    r, c = row[:n_v], col[:n_v]
+    data.val_pos_edge_index = torch.stack([r, c], dim=0)
+    if edge_attr is not None:
+        data.val_pos_edge_attr = edge_attr[:n_v]
+
+    r, c = row[n_v:n_v + n_t], col[n_v:n_v + n_t]
+    data.test_pos_edge_index = torch.stack([r, c], dim=0)
+    if edge_attr is not None:
+        data.test_pos_edge_attr = edge_attr[n_v:n_v + n_t]
+
+    r, c = row[n_v + n_t:], col[n_v + n_t:]
+    data.train_pos_edge_index = torch.stack([r, c], dim=0)
+    if edge_attr is not None:
+        out = to_undirected(data.train_pos_edge_index, edge_attr[n_v + n_t:])
+        data.train_pos_edge_index, data.train_pos_edge_attr = out
+    else:
+        data.train_pos_edge_index = to_undirected(data.train_pos_edge_index)
+
+    # Negative edges.
+    neg_adj_mask = torch.ones(num_nodes, num_nodes, dtype=torch.uint8)
+    neg_adj_mask = neg_adj_mask.triu(diagonal=1).to(torch.bool)
+    neg_adj_mask[row, col] = 0
+
+    neg_row, neg_col = neg_adj_mask.nonzero().t()
+    perm = torch.randperm(neg_row.size(0))[:n_v + n_t]
+    neg_row, neg_col = neg_row[perm], neg_col[perm]
+
+    neg_adj_mask[neg_row, neg_col] = 0
+    data.train_neg_adj_mask = neg_adj_mask
+
+    row, col = neg_row[:n_v], neg_col[:n_v]
+    data.val_neg_edge_index = torch.stack([row, col], dim=0)
+
+    row, col = neg_row[n_v:n_v + n_t], neg_col[n_v:n_v + n_t]
+    data.test_neg_edge_index = torch.stack([row, col], dim=0)
+
+    return data
diff --git a/autogl/datasets/utils/conversion/__init__.py b/autogl/datasets/utils/conversion/__init__.py
new file mode 100644
index 0000000..28b9e1f
--- /dev/null
+++ b/autogl/datasets/utils/conversion/__init__.py
@@ -0,0 +1,12 @@
+try:
+    import dgl
+except ModuleNotFoundError:
+    dgl = None
+else:
+    from ._to_dgl_dataset import general_static_graphs_to_dgl_dataset
+try:
+    import torch_geometric
+except ModuleNotFoundError:
+    torch_geometric = None
+else:
+    from ._to_pyg_dataset import general_static_graphs_to_pyg_dataset
diff --git a/autogl/datasets/utils/conversion/_to_dgl_dataset.py b/autogl/datasets/utils/conversion/_to_dgl_dataset.py
new file mode 100644
index 0000000..cac2b04
--- /dev/null
+++ b/autogl/datasets/utils/conversion/_to_dgl_dataset.py
@@ -0,0 +1,36 @@
+import dgl
+import torch
+import typing as _typing
+from autogl.data import Dataset, InMemoryDataset
+from autogl.data.graph import GeneralStaticGraph
+from autogl.data.graph.utils import conversion
+
+
+def general_static_graphs_to_dgl_dataset(
+        general_static_graphs: _typing.Iterable[GeneralStaticGraph]
+) -> Dataset[_typing.Union[dgl.DGLGraph, _typing.Tuple[dgl.DGLGraph, torch.Tensor]]]:
+    def _transform(
+            general_static_graph: GeneralStaticGraph
+    ) -> _typing.Union[dgl.DGLGraph, _typing.Tuple[dgl.DGLGraph, torch.Tensor]]:
+        if not isinstance(general_static_graph, GeneralStaticGraph):
+            raise TypeError
+        if 'label' in general_static_graph.data:
+            label: _typing.Optional[torch.Tensor] = general_static_graph.data['label']
+        elif 'y' in general_static_graph.data:
+            label: _typing.Optional[torch.Tensor] = general_static_graph.data['y']
+        else:
+            label: _typing.Optional[torch.Tensor] = None
+        if label is not None and isinstance(label, torch.Tensor) and torch.is_tensor(label):
+            return conversion.general_static_graph_to_dgl_graph(general_static_graph), label
+        else:
+            return conversion.general_static_graph_to_dgl_graph(general_static_graph)
+
+    if isinstance(general_static_graphs, Dataset):
+        return InMemoryDataset(
+            [_transform(g) for g in general_static_graphs],
+            general_static_graphs.train_index,
+            general_static_graphs.val_index,
+            general_static_graphs.test_index
+        )
+    else:
+        return InMemoryDataset([_transform(g) for g in general_static_graphs])
diff --git a/autogl/datasets/utils/conversion/_to_pyg_dataset.py b/autogl/datasets/utils/conversion/_to_pyg_dataset.py
new file mode 100644
index 0000000..3b4f129
--- /dev/null
+++ b/autogl/datasets/utils/conversion/_to_pyg_dataset.py
@@ -0,0 +1,18 @@
+import typing as _typing
+from autogl.data import Data, Dataset, InMemoryDataset
+from autogl.data.graph import GeneralStaticGraph
+from autogl.data.graph.utils import conversion
+
+
+def general_static_graphs_to_pyg_dataset(
+        graphs: _typing.Iterable[GeneralStaticGraph]
+) -> Dataset[Data]:
+    if isinstance(graphs, Dataset):
+        return InMemoryDataset(
+            [conversion.static_graph_to_pyg_data(g) for g in graphs],
+            graphs.train_index, graphs.val_index, graphs.test_index
+        )
+    else:
+        return InMemoryDataset(
+            [conversion.static_graph_to_pyg_data(g) for g in graphs]
+        )
diff --git a/autogl/module/_feature/__init__.py b/autogl/module/_feature/__init__.py
new file mode 100644
index 0000000..f2f9c2b
--- /dev/null
+++ b/autogl/module/_feature/__init__.py
@@ -0,0 +1,103 @@
+from .base import BaseFeature
+from .base import BaseFeatureEngineer
+
+FEATURE_DICT = {}
+
+
+def register_feature(name):
+    def register_feature_cls(cls):
+        if name in FEATURE_DICT:
+            raise ValueError(
+                "Cannot register duplicate feature engineer ({})".format(name)
+            )
+        # if not issubclass(cls, BaseFeatureEngineer):
+        if not issubclass(cls, BaseFeature):
+            raise ValueError(
+                "Trainer ({}: {}) must extend BaseFeatureEngineer".format(
+                    name, cls.__name__
+                )
+            )
+        FEATURE_DICT[name] = cls
+        return cls
+
+    return register_feature_cls
+
+
+from .auto_feature import AutoFeatureEngineer
+
+from .generators import (
+    BaseGenerator,
+    GeGraphlet,
+    GeEigen,
+    GePageRank,
+    register_pyg,
+    pygfunc,
+    PYGGenerator,
+    PYGLocalDegreeProfile,
+    PYGNormalizeFeatures,
+    PYGOneHotDegree,
+)
+
+from .selectors import BaseSelector, SeFilterConstant, SeGBDT
+
+from .graph import (
+    BaseGraph,
+    SgNetLSD,
+    register_nx,
+    NxGraph,
+    nxfunc,
+    NxLargeCliqueSize,
+    NxAverageClusteringApproximate,
+    NxDegreeAssortativityCoefficient,
+    NxDegreePearsonCorrelationCoefficient,
+    NxHasBridge,
+    NxGraphCliqueNumber,
+    NxGraphNumberOfCliques,
+    NxTransitivity,
+    NxAverageClustering,
+    NxIsConnected,
+    NxNumberConnectedComponents,
+    NxIsDistanceRegular,
+    NxLocalEfficiency,
+    NxGlobalEfficiency,
+    NxIsEulerian,
+)
+
+__all__ = [
+    "BaseFeatureEngineer",
+    "AutoFeatureEngineer",
+    "BaseFeature",
+    "BaseGenerator",
+    "GeGraphlet",
+    "GeEigen",
+    "GePageRank",
+    "register_pyg",
+    "pygfunc",
+    "PYGGenerator",
+    "PYGLocalDegreeProfile",
+    "PYGNormalizeFeatures",
+    "PYGOneHotDegree",
+    "BaseSelector",
+    "SeFilterConstant",
+    "SeGBDT",
+    "BaseGraph",
+    "SgNetLSD",
+    "register_nx",
+    "NxGraph",
+    "nxfunc",
+    "NxLargeCliqueSize",
+    "NxAverageClusteringApproximate",
+    "NxDegreeAssortativityCoefficient",
+    "NxDegreePearsonCorrelationCoefficient",
+    "NxHasBridge",
+    "NxGraphCliqueNumber",
+    "NxGraphNumberOfCliques",
+    "NxTransitivity",
+    "NxAverageClustering",
+    "NxIsConnected",
+    "NxNumberConnectedComponents",
+    "NxIsDistanceRegular",
+    "NxLocalEfficiency",
+    "NxGlobalEfficiency",
+    "NxIsEulerian",
+]
diff --git a/autogl/module/feature/auto_feature.py b/autogl/module/_feature/auto_feature.py
similarity index 100%
rename from autogl/module/feature/auto_feature.py
rename to autogl/module/_feature/auto_feature.py
diff --git a/autogl/module/feature/base.py b/autogl/module/_feature/base.py
similarity index 100%
rename from autogl/module/feature/base.py
rename to autogl/module/_feature/base.py
diff --git a/autogl/module/feature/generators/__init__.py b/autogl/module/_feature/generators/__init__.py
similarity index 100%
rename from autogl/module/feature/generators/__init__.py
rename to autogl/module/_feature/generators/__init__.py
diff --git a/autogl/module/feature/generators/base.py b/autogl/module/_feature/generators/base.py
similarity index 100%
rename from autogl/module/feature/generators/base.py
rename to autogl/module/_feature/generators/base.py
diff --git a/autogl/module/feature/generators/eigen.py b/autogl/module/_feature/generators/eigen.py
similarity index 100%
rename from autogl/module/feature/generators/eigen.py
rename to autogl/module/_feature/generators/eigen.py
diff --git a/autogl/module/feature/generators/graphlet.py b/autogl/module/_feature/generators/graphlet.py
similarity index 100%
rename from autogl/module/feature/generators/graphlet.py
rename to autogl/module/_feature/generators/graphlet.py
diff --git a/autogl/module/feature/generators/page_rank.py b/autogl/module/_feature/generators/page_rank.py
similarity index 100%
rename from autogl/module/feature/generators/page_rank.py
rename to autogl/module/_feature/generators/page_rank.py
diff --git a/autogl/module/feature/generators/pyg.py b/autogl/module/_feature/generators/pyg.py
similarity index 100%
rename from autogl/module/feature/generators/pyg.py
rename to autogl/module/_feature/generators/pyg.py
diff --git a/autogl/module/feature/graph/__init__.py b/autogl/module/_feature/graph/__init__.py
similarity index 100%
rename from autogl/module/feature/graph/__init__.py
rename to autogl/module/_feature/graph/__init__.py
diff --git a/autogl/module/feature/graph/base.py b/autogl/module/_feature/graph/base.py
similarity index 100%
rename from autogl/module/feature/graph/base.py
rename to autogl/module/_feature/graph/base.py
diff --git a/autogl/module/feature/graph/netlsd.py b/autogl/module/_feature/graph/netlsd.py
similarity index 100%
rename from autogl/module/feature/graph/netlsd.py
rename to autogl/module/_feature/graph/netlsd.py
diff --git a/autogl/module/feature/graph/nx.py b/autogl/module/_feature/graph/nx.py
similarity index 100%
rename from autogl/module/feature/graph/nx.py
rename to autogl/module/_feature/graph/nx.py
diff --git a/autogl/module/feature/selectors/__init__.py b/autogl/module/_feature/selectors/__init__.py
similarity index 100%
rename from autogl/module/feature/selectors/__init__.py
rename to autogl/module/_feature/selectors/__init__.py
diff --git a/autogl/module/feature/selectors/base.py b/autogl/module/_feature/selectors/base.py
similarity index 100%
rename from autogl/module/feature/selectors/base.py
rename to autogl/module/_feature/selectors/base.py
diff --git a/autogl/module/feature/selectors/se_filter_constant.py b/autogl/module/_feature/selectors/se_filter_constant.py
similarity index 100%
rename from autogl/module/feature/selectors/se_filter_constant.py
rename to autogl/module/_feature/selectors/se_filter_constant.py
diff --git a/autogl/module/feature/selectors/se_gbdt.py b/autogl/module/_feature/selectors/se_gbdt.py
similarity index 100%
rename from autogl/module/feature/selectors/se_gbdt.py
rename to autogl/module/_feature/selectors/se_gbdt.py
diff --git a/autogl/module/feature/utils.py b/autogl/module/_feature/utils.py
similarity index 100%
rename from autogl/module/feature/utils.py
rename to autogl/module/_feature/utils.py
diff --git a/autogl/module/feature/__init__.py b/autogl/module/feature/__init__.py
index f2f9c2b..35f9953 100644
--- a/autogl/module/feature/__init__.py
+++ b/autogl/module/feature/__init__.py
@@ -1,103 +1,35 @@
-from .base import BaseFeature
-from .base import BaseFeatureEngineer
-
-FEATURE_DICT = {}
-
-
-def register_feature(name):
-    def register_feature_cls(cls):
-        if name in FEATURE_DICT:
-            raise ValueError(
-                "Cannot register duplicate feature engineer ({})".format(name)
-            )
-        # if not issubclass(cls, BaseFeatureEngineer):
-        if not issubclass(cls, BaseFeature):
-            raise ValueError(
-                "Trainer ({}: {}) must extend BaseFeatureEngineer".format(
-                    name, cls.__name__
-                )
-            )
-        FEATURE_DICT[name] = cls
-        return cls
-
-    return register_feature_cls
-
-
-from .auto_feature import AutoFeatureEngineer
-
-from .generators import (
-    BaseGenerator,
-    GeGraphlet,
-    GeEigen,
-    GePageRank,
-    register_pyg,
-    pygfunc,
-    PYGGenerator,
-    PYGLocalDegreeProfile,
-    PYGNormalizeFeatures,
-    PYGOneHotDegree,
+from ._base_feature_engineer import (
+    BaseFeatureEngineer, BaseFeature
 )
-
-from .selectors import BaseSelector, SeFilterConstant, SeGBDT
-
-from .graph import (
-    BaseGraph,
-    SgNetLSD,
-    register_nx,
-    NxGraph,
-    nxfunc,
-    NxLargeCliqueSize,
-    NxAverageClusteringApproximate,
-    NxDegreeAssortativityCoefficient,
-    NxDegreePearsonCorrelationCoefficient,
-    NxHasBridge,
-    NxGraphCliqueNumber,
-    NxGraphNumberOfCliques,
-    NxTransitivity,
-    NxAverageClustering,
-    NxIsConnected,
-    NxNumberConnectedComponents,
-    NxIsDistanceRegular,
-    NxLocalEfficiency,
-    NxGlobalEfficiency,
-    NxIsEulerian,
+from ._feature_engineer_registry import (
+    FeatureEngineerUniversalRegistry, FEATURE_DICT
+)
+from ._generators import (
+    OneHotFeatureGenerator,
+    EigenFeatureGenerator,
+    GraphletGenerator,
+    PageRankFeatureGenerator,
+    LocalDegreeProfileGenerator,
+    NormalizeFeatures,
+    OneHotDegreeGenerator
+)
+from ._graph import (
+    NetLSD,
+    NXLargeCliqueSize,
+    NXDegreeAssortativityCoefficient,
+    NXDegreePearsonCorrelationCoefficient,
+    NXHasBridges,
+    NXGraphCliqueNumber,
+    NXGraphNumberOfCliques,
+    NXTransitivity,
+    NXAverageClustering,
+    NXIsConnected,
+    NXNumberConnectedComponents,
+    NXIsDistanceRegular,
+    NXLocalEfficiency,
+    NXGlobalEfficiency,
+    NXIsEulerian,
+)
+from ._selectors import (
+    FilterConstant, GBDTFeatureSelector
 )
-
-__all__ = [
-    "BaseFeatureEngineer",
-    "AutoFeatureEngineer",
-    "BaseFeature",
-    "BaseGenerator",
-    "GeGraphlet",
-    "GeEigen",
-    "GePageRank",
-    "register_pyg",
-    "pygfunc",
-    "PYGGenerator",
-    "PYGLocalDegreeProfile",
-    "PYGNormalizeFeatures",
-    "PYGOneHotDegree",
-    "BaseSelector",
-    "SeFilterConstant",
-    "SeGBDT",
-    "BaseGraph",
-    "SgNetLSD",
-    "register_nx",
-    "NxGraph",
-    "nxfunc",
-    "NxLargeCliqueSize",
-    "NxAverageClusteringApproximate",
-    "NxDegreeAssortativityCoefficient",
-    "NxDegreePearsonCorrelationCoefficient",
-    "NxHasBridge",
-    "NxGraphCliqueNumber",
-    "NxGraphNumberOfCliques",
-    "NxTransitivity",
-    "NxAverageClustering",
-    "NxIsConnected",
-    "NxNumberConnectedComponents",
-    "NxIsDistanceRegular",
-    "NxLocalEfficiency",
-    "NxGlobalEfficiency",
-    "NxIsEulerian",
-]
diff --git a/autogl/module/feature/_base_feature_engineer.py b/autogl/module/feature/_base_feature_engineer.py
new file mode 100644
index 0000000..87031dd
--- /dev/null
+++ b/autogl/module/feature/_base_feature_engineer.py
@@ -0,0 +1,114 @@
+import copy
+import torch
+import typing as _typing
+from autogl.data.graph import GeneralStaticGraph
+from autogl.data import InMemoryStaticGraphSet
+
+from ...utils import get_logger
+
+LOGGER = get_logger("FeatureEngineer")
+
+
+class _BaseFeatureEngineer:
+    def __and__(self, other):
+        raise NotImplementedError
+
+    def fit(
+            self, in_memory_static_graph_set: InMemoryStaticGraphSet,
+            inplace: bool = True
+    ):
+        raise NotImplementedError
+
+    def transform(
+            self, in_memory_static_graph_set: InMemoryStaticGraphSet,
+            inplace: bool = True
+    ) -> InMemoryStaticGraphSet:
+        raise NotImplementedError
+
+
+class _ComposedFeatureEngineer(_BaseFeatureEngineer):
+    @property
+    def fe_components(self) -> _typing.Iterable[_BaseFeatureEngineer]:
+        return self.__fe_components
+
+    def __init__(self, feature_engineers: _typing.Iterable[_BaseFeatureEngineer]):
+        self.__fe_components: _typing.List[_BaseFeatureEngineer] = []
+        for fe in feature_engineers:
+            if isinstance(fe, _ComposedFeatureEngineer):
+                self.__fe_components.extend(fe.fe_components)
+            else:
+                self.__fe_components.append(fe)
+
+    def __and__(self, other: _BaseFeatureEngineer):
+        return _ComposedFeatureEngineer((self, other))
+
+    def fit(self, in_memory_static_graph_set, inplace: bool = True):
+        for fe in self.fe_components:
+            fe.fit(in_memory_static_graph_set, inplace)
+
+    def transform(
+            self, in_memory_static_graph_set,
+            inplace: bool = True
+    ):
+        for fe in self.fe_components:
+            in_memory_static_graph_set = fe.transform(
+                in_memory_static_graph_set, inplace
+            )
+        return in_memory_static_graph_set
+
+
+class BaseFeatureEngineer:
+    def __init__(self, multi_graph: bool = True, subgraph=False):
+        self._multi_graph: bool = multi_graph
+
+    def __and__(self, other):
+        return _ComposedFeatureEngineer((self, other))
+
+    @classmethod
+    def __reset_graph_set(
+            cls, graphs: _typing.Sequence[GeneralStaticGraph],
+            in_memory_static_graph_set: InMemoryStaticGraphSet
+    ):
+        in_memory_static_graph_set.reset_dataset(graphs)
+
+    def _preprocess(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        return static_graph
+
+    def _fit(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        return static_graph
+
+    def _transform(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        return static_graph
+
+    def _postprocess(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        return static_graph
+
+    def fit(
+            self, in_memory_static_graph_set: InMemoryStaticGraphSet,
+            inplace: bool = True
+    ):
+        if not inplace:
+            in_memory_static_graph_set = copy.deepcopy(in_memory_static_graph_set)
+        with torch.no_grad():
+            __graphs: _typing.Sequence[GeneralStaticGraph] = [
+                self._postprocess(self._transform(self._fit(self._preprocess(g))))
+                for g in in_memory_static_graph_set
+            ]
+            self.__reset_graph_set(__graphs, in_memory_static_graph_set)
+
+    def transform(
+            self, in_memory_static_graph_set: InMemoryStaticGraphSet,
+            inplace: bool = True
+    ) -> InMemoryStaticGraphSet:
+        if not inplace:
+            in_memory_static_graph_set = copy.deepcopy(in_memory_static_graph_set)
+        with torch.no_grad():
+            __graphs: _typing.Sequence[GeneralStaticGraph] = [
+                self._postprocess(self._transform(self._preprocess(g)))
+                for g in in_memory_static_graph_set
+            ]
+        return in_memory_static_graph_set
+
+
+class BaseFeature(BaseFeatureEngineer):
+    ...
diff --git a/autogl/module/feature/_composed_feature_engineer.py b/autogl/module/feature/_composed_feature_engineer.py
new file mode 100644
index 0000000..1d99198
--- /dev/null
+++ b/autogl/module/feature/_composed_feature_engineer.py
@@ -0,0 +1,37 @@
+import typing as _typing
+from . import _base_feature_engineer
+
+
+class _ComposedFeatureEngineer(_base_feature_engineer.BaseFeatureEngineer):
+    ...
+
+
+class ComposedFeatureEngineer(_ComposedFeatureEngineer):
+    @property
+    def fe_components(self) -> _typing.Iterable[_base_feature_engineer.BaseFeatureEngineer]:
+        raise NotImplementedError  # todo
+
+    def __init__(self, feature_engineers: _typing.Iterable[_base_feature_engineer.BaseFeatureEngineer]):
+        super(ComposedFeatureEngineer, self).__init__()
+        self.__fe_components: _typing.List[_base_feature_engineer.BaseFeatureEngineer] = []
+        for fe in feature_engineers:
+            if isinstance(fe, ComposedFeatureEngineer):
+                self.__fe_components.extend(fe.fe_components)
+            elif isinstance(fe, _base_feature_engineer.BaseFeatureEngineer):
+                self.__fe_components.append(fe)
+            else:
+                raise TypeError
+
+    def fit(self, in_memory_static_graph_set, inplace: bool = True):
+        for fe in self.fe_components:
+            fe.fit(in_memory_static_graph_set, inplace)
+
+    def transform(
+            self, in_memory_static_graph_set,
+            inplace: bool = True
+    ):
+        for fe in self.fe_components:
+            in_memory_static_graph_set = fe.transform(
+                in_memory_static_graph_set, inplace
+            )
+        return in_memory_static_graph_set
diff --git a/autogl/module/feature/_feature_engineer_registry.py b/autogl/module/feature/_feature_engineer_registry.py
new file mode 100644
index 0000000..544b42f
--- /dev/null
+++ b/autogl/module/feature/_feature_engineer_registry.py
@@ -0,0 +1,62 @@
+import typing as _typing
+
+from ._base_feature_engineer import BaseFeatureEngineer
+
+
+class _FeatureEngineerUniversalRegistryMetaclass(type):
+    def __new__(
+            mcs, name: str, bases: _typing.Tuple[type, ...],
+            namespace: _typing.Dict[str, _typing.Any]
+    ):
+        return super(_FeatureEngineerUniversalRegistryMetaclass, mcs).__new__(
+            mcs, name, bases, namespace
+        )
+
+    def __init__(
+            cls, name: str, bases: _typing.Tuple[type, ...],
+            namespace: _typing.Dict[str, _typing.Any]
+    ):
+        super(_FeatureEngineerUniversalRegistryMetaclass, cls).__init__(
+            name, bases, namespace
+        )
+        cls._feature_engineer_universal_registry: _typing.MutableMapping[
+            str, _typing.Type[BaseFeatureEngineer]
+        ] = {}
+
+
+class FeatureEngineerUniversalRegistry(metaclass=_FeatureEngineerUniversalRegistryMetaclass):
+    @classmethod
+    def register_feature_engineer(cls, name: str) -> _typing.Callable[
+        [_typing.Type[BaseFeatureEngineer]], _typing.Type[BaseFeatureEngineer]
+    ]:
+        def register_fe(
+                fe: _typing.Type[BaseFeatureEngineer]
+        ) -> _typing.Type[BaseFeatureEngineer]:
+            if name in cls._feature_engineer_universal_registry:
+                raise ValueError(
+                    f"Feature Engineer with name \"{name}\" already exists!"
+                )
+            elif not issubclass(fe, BaseFeatureEngineer):
+                raise TypeError
+            else:
+                cls._feature_engineer_universal_registry[name] = fe
+                return fe
+        return register_fe
+
+    @classmethod
+    def get_feature_engineer(cls, name: str) -> _typing.Type[BaseFeatureEngineer]:
+        if name in cls._feature_engineer_universal_registry:
+            return cls._feature_engineer_universal_registry[name]
+        else:
+            raise ValueError(f"cannot find feature engineer {name}")
+
+
+class _DeprecatedFeatureDict:
+    def __contains__(self, name: str) -> bool:
+        return name in FeatureEngineerUniversalRegistry._feature_engineer_universal_registry
+
+    def __getitem__(self, name: str) -> _typing.Type[BaseFeatureEngineer]:
+        return FeatureEngineerUniversalRegistry.get_feature_engineer(name)
+
+
+FEATURE_DICT = _DeprecatedFeatureDict()
diff --git a/autogl/module/feature/_generators/__init__.py b/autogl/module/feature/_generators/__init__.py
new file mode 100644
index 0000000..1564c6f
--- /dev/null
+++ b/autogl/module/feature/_generators/__init__.py
@@ -0,0 +1,19 @@
+from ._basic import OneHotFeatureGenerator
+from ._eigen import EigenFeatureGenerator
+from ._graphlet import GraphletGenerator
+from ._page_rank import PageRankFeatureGenerator
+from ._pyg import (
+    LocalDegreeProfileGenerator,
+    NormalizeFeatures,
+    OneHotDegreeGenerator
+)
+
+__all__ = [
+    "OneHotFeatureGenerator",
+    "EigenFeatureGenerator",
+    "GraphletGenerator",
+    "PageRankFeatureGenerator",
+    "LocalDegreeProfileGenerator",
+    "NormalizeFeatures",
+    "OneHotDegreeGenerator"
+]
diff --git a/autogl/module/feature/_generators/_basic.py b/autogl/module/feature/_generators/_basic.py
new file mode 100644
index 0000000..674a851
--- /dev/null
+++ b/autogl/module/feature/_generators/_basic.py
@@ -0,0 +1,110 @@
+import torch
+import typing as _typing
+import autogl
+from autogl.data.graph import GeneralStaticGraph
+from .._base_feature_engineer import BaseFeatureEngineer
+from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
+
+
+class BaseFeatureGenerator(BaseFeatureEngineer):
+    def _preprocess(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        if not (
+                static_graph.nodes.is_homogeneous and
+                static_graph.edges.is_homogeneous
+        ):
+            raise ValueError("Provided static graph must be homogeneous")
+        else:
+            return static_graph
+
+    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
+        raise NotImplementedError
+
+    @classmethod
+    def __to_data(cls, homogeneous_static_graph: GeneralStaticGraph) -> autogl.data.Data:
+        if 'x' in homogeneous_static_graph.nodes.data:
+            features: _typing.Optional[torch.Tensor] = (
+                homogeneous_static_graph.nodes.data['x']
+            )
+        elif 'feat' in homogeneous_static_graph.nodes.data:
+            features: _typing.Optional[torch.Tensor] = (
+                homogeneous_static_graph.nodes.data['feat']
+            )
+        else:
+            features: _typing.Optional[torch.Tensor] = None
+        if 'y' in homogeneous_static_graph.nodes.data:
+            label: _typing.Optional[torch.Tensor] = (
+                homogeneous_static_graph.nodes.data['y']
+            )
+        elif 'label' in homogeneous_static_graph.nodes.data:
+            label: _typing.Optional[torch.Tensor] = (
+                homogeneous_static_graph.nodes.data['label']
+            )
+        else:
+            label: _typing.Optional[torch.Tensor] = None
+        if (
+                'edge_weight' in homogeneous_static_graph.edges.data and
+                homogeneous_static_graph.edges.data['edge_weight'].dim() == 1
+        ):
+            edge_weight: torch.Tensor = (
+                homogeneous_static_graph.edges.data['edge_weight']
+            )
+        else:
+            edge_weight: torch.Tensor = torch.ones(
+                homogeneous_static_graph.edges.connections.size(1)
+            )
+        data = autogl.data.Data(
+            edge_index=homogeneous_static_graph.edges.connections,
+            x=features, y=label
+        )
+        setattr(data, "edge_weight", edge_weight)
+        return data
+
+    def _transform(self, homogeneous_static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        nodes_features: torch.Tensor = self._extract_nodes_feature(
+            self.__to_data(homogeneous_static_graph)
+        )
+        if not isinstance(nodes_features, torch.Tensor):
+            raise TypeError
+        elif nodes_features.dim() == 0:
+            raise ValueError
+        elif nodes_features.dim() == 1:
+            nodes_features = nodes_features.view(-1, 1)
+        if 'x' in homogeneous_static_graph.nodes.data:
+            x: torch.Tensor = (
+                homogeneous_static_graph.nodes.data['x'].view(-1, 1)
+                if homogeneous_static_graph.nodes.data['x'].dim() == 1
+                else homogeneous_static_graph.nodes.data['x']
+            )
+            assert nodes_features.size(0) == x.size(0)
+            assert nodes_features.dim() == x.dim() == 2
+            homogeneous_static_graph.nodes.data['x'] = torch.cat(
+                [x, nodes_features.to(x.dtype)], dim=-1
+            )
+        elif 'feat' in homogeneous_static_graph.nodes.data:
+            x: torch.Tensor = (
+                homogeneous_static_graph.nodes.data['feat'].view(-1, 1)
+                if homogeneous_static_graph.nodes.data['feat'].dim() == 1
+                else homogeneous_static_graph.nodes.data['feat']
+            )
+            assert nodes_features.size(0) == x.size(0)
+            assert nodes_features.dim() == x.dim() == 2
+            homogeneous_static_graph.nodes.data['feat'] = torch.cat(
+                [x, nodes_features.to(x.dtype)], dim=-1
+            )
+        else:
+            if autogl.backend.DependentBackend.is_pyg():
+                homogeneous_static_graph.nodes.data['x'] = nodes_features
+            elif autogl.backend.DependentBackend.is_dgl():
+                homogeneous_static_graph.nodes.data['feat'] = nodes_features
+        return homogeneous_static_graph
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("OneHot".lower())
+class OneHotFeatureGenerator(BaseFeatureGenerator):
+    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
+        num_nodes: int = (
+            data.x.size(0)
+            if data.x is not None and isinstance(data.x, torch.Tensor)
+            else (data.edge_index.max().item() + 1)
+        )
+        return torch.eye(num_nodes)
diff --git a/autogl/module/feature/_generators/_eigen.py b/autogl/module/feature/_generators/_eigen.py
new file mode 100644
index 0000000..c6295d3
--- /dev/null
+++ b/autogl/module/feature/_generators/_eigen.py
@@ -0,0 +1,92 @@
+import autogl
+import numpy as np
+from scipy.sparse import csr_matrix
+import scipy.sparse as ssp
+import scipy.sparse.linalg
+import networkx as nx
+import torch
+from ._basic import BaseFeatureGenerator
+from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
+
+
+class _Eigen:
+    def __init__(self):
+        ...
+
+    @classmethod
+    def __normalize_adj(cls, adj):
+        row_sum = np.array(adj.sum(1))
+        d_inv_sqrt = np.power(row_sum, -0.5).flatten()
+        d_inv_sqrt[np.isinf(d_inv_sqrt)] = 0.0
+        d_inv_sqrt = ssp.diags(d_inv_sqrt)
+        return adj.dot(d_inv_sqrt).transpose().dot(d_inv_sqrt)
+
+    def __call__(self, adj, d, use_eigenvalues=0, adj_norm=1):
+        G = nx.from_scipy_sparse_matrix(adj)
+        comp = list(nx.connected_components(G))
+        results = np.zeros((adj.shape[0], d))
+        for i in range(len(comp)):
+            node_index = np.array(list(comp[i]))
+            d_temp = min(len(node_index) - 2, d)
+            if d_temp <= 0:
+                continue
+            temp_adj = adj[node_index, :][:, node_index].asfptype()
+            if adj_norm == 1:
+                temp_adj = self.__normalize_adj(temp_adj)
+            lamb, X = scipy.sparse.linalg.eigs(temp_adj, d_temp)
+            lamb, X = lamb.real, X.real
+            temp_order = np.argsort(lamb)
+            lamb, X = lamb[temp_order], X[:, temp_order]
+            for i in range(X.shape[1]):
+                if np.sum(X[:, i]) < 0:
+                    X[:, i] = -X[:, i]
+            if use_eigenvalues == 1:
+                X = X.dot(np.diag(np.sqrt(np.absolute(lamb))))
+            elif use_eigenvalues == 2:
+                X = X.dot(np.diag(lamb))
+            results[node_index, :d_temp] = X
+        return results
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("eigen")
+class EigenFeatureGenerator(BaseFeatureGenerator):
+    r"""
+    concat Eigen features
+
+    Notes
+    -----
+    An implementation of [#]_
+
+    References
+    ----------
+    .. [#] Ziwei Zhang, Peng Cui, Jian Pei, Xin Wang, Wenwu Zhu:
+        Eigen-GNN: A Graph Structure Preserving Plug-in for GNNs. CoRR abs/2006.04330 (2020)
+        https://arxiv.org/abs/2006.04330
+
+
+    Parameters
+    ----------
+    size : int
+        EigenGNN hidden size
+    """
+    def __init__(self, size: int = 32):
+        super(EigenFeatureGenerator, self).__init__()
+        self.__size: int = size
+
+    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
+        edge_index: np.ndarray = data.edge_index.numpy()
+        edge_weight: np.ndarray = getattr(data, "edge_weight").numpy()
+        num_nodes: int = (
+            data.x.size(0)
+            if data.x is not None and isinstance(data.x, torch.Tensor)
+            else (data.edge_index.max().item() + 1)
+        )
+        adj = csr_matrix(
+            (edge_weight, (edge_index[0, :], edge_index[1, :])),
+            shape=(num_nodes, num_nodes)
+        )
+        if np.max(adj - adj.T) > 1e-5:
+            adj = adj + adj.T
+        mf = _Eigen()
+        features: np.ndarray = mf(adj, self.__size)
+        return torch.from_numpy(features)
diff --git a/autogl/module/feature/_generators/_graphlet.py b/autogl/module/feature/_generators/_graphlet.py
new file mode 100644
index 0000000..510a97b
--- /dev/null
+++ b/autogl/module/feature/_generators/_graphlet.py
@@ -0,0 +1,247 @@
+import logging
+import numpy as np
+import torch
+from tqdm import tqdm
+import autogl
+from ._basic import BaseFeatureGenerator
+from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
+
+_LOGGER = logging.getLogger("FE")
+
+
+class _Graphlet:
+    def __init__(self, data, sample_error=0.1, sample_confidence=0.1):
+        self._data = data
+        self._init()
+
+        self._sample_error = sample_error
+        self._sample_confidence = sample_confidence
+        self._dw = int(
+            np.ceil(
+                0.5 * (self._sample_error ** -2) * np.log(2 / self._sample_confidence)
+            )
+        )
+        _LOGGER.info(
+            "sample error {} , confidence {},num {}".format(
+                self._sample_error, self._sample_confidence, self._dw
+            )
+        )
+
+    def _init(self):
+        self._edges = list(self._data.edge_index)
+        self._edges = [self._edges[0], self._edges[1]]
+        self._num_nodes = self._data.x.shape[0]
+        self._num_edges = len(self._edges[0])
+        self._neighbours = [[] for _ in range(self._num_nodes)]
+        for i in range(len(self._edges[0])):
+            u, v = self._edges[0][i], self._edges[1][i]
+            self._neighbours[u].append(v)
+
+        _LOGGER.info("nodes {} , edges {}".format(self._num_nodes, self._num_edges))
+
+        # sorting
+        self._node_degrees = np.array([len(x) for x in self._neighbours])
+        self._nodes = np.argsort(self._node_degrees)
+        for i in self._nodes:
+            self._neighbours[i] = [
+                x
+                for _, x in sorted(
+                    zip(self._node_degrees[self._neighbours[i]], self._neighbours[i]),
+                    reverse=True,
+                )
+            ]
+        self._neighbours = [np.array(x) for x in self._neighbours]
+
+    def _get_gdv(self, v, u):
+        if self._node_degrees[v] >= self._node_degrees[u]:
+            pass
+        else:
+            u, v = v, u
+        Sv, Su, Te = set(), set(), set()
+        sigma1, sigma2 = 0, 0
+        nb = self._neighbours
+        N = self._num_nodes
+        M = self._num_edges
+        phi = np.zeros(self._num_nodes, dtype=int)
+        c1, c2, c3, c4 = 1, 2, 3, 4
+        x = np.zeros(16, dtype=int)
+        # p1
+        for w in nb[v]:
+            if w != u:
+                Sv.add(w)
+                phi[w] = c1
+        # p2
+        for w in nb[u]:
+            if w != v:
+                if phi[w] == c1:
+                    Te.add(w)
+                    phi[w] = c3
+                    Sv.remove(w)
+                else:
+                    Su.add(w)
+                    phi[w] = c2
+        # p3
+        for w in Te:
+            for r in nb[w]:
+                if phi[r] == c3:
+                    x[5] += 1
+            phi[w] = c4
+            sigma2 = sigma2 + len(nb[w]) - 2
+        # p4
+        for w in Su:
+            for r in nb[w]:
+                if phi[r] == c1:
+                    x[8] += 1
+                if phi[r] == c2:
+                    x[7] += 1
+                if phi[r] == c4:
+                    sigma1 += 1
+            phi[w] = 0
+            sigma2 = sigma2 + len(nb[w]) - 1
+        # p5
+        for w in Sv:
+            for r in nb[w]:
+                if phi[r] == c1:
+                    x[7] += 1
+                if phi[r] == c4:
+                    sigma1 += 1
+            phi[w] = 0
+            sigma2 = sigma2 + len(nb[w]) - 1
+
+        lsv, lsu, lte, du, dv = len(Sv), len(Su), len(Te), len(nb[u]), len(nb[v])
+        # 3-graphlet
+        x[1] = lte
+        x[2] = du + dv - 2 - 2 * x[1]
+        x[3] = N - x[2] - x[1] - 2
+        x[4] = N * (N - 1) * (N - 2) / 6 - (x[1] + x[2] + x[3])
+        # 4 connected graphlets
+        x[6] = x[1] * (x[1] - 1) / 2 - x[5]
+        x[10] = lsv * lsu - x[8]
+        x[9] = lsv * (lsv - 1) / 2 + lsu * (lsu - 1) / 2 - x[7]
+        # 4 disconnected graphlets
+        t1 = N - (lte + lsu + lsv + 2)
+        x[11] = x[1] * t1
+        x[12] = M - (du + dv - 1) - (sigma2 - sigma1 - x[5] - x[8] - x[7])
+        x[13] = (lsu + lsv) * t1
+        x[14] = t1 * (t1 - 1) / 2 - x[12]
+        x[15] = N * (N - 1) * (N - 2) * (N - 3) / 24 - np.sum(x[5:15])
+
+        return x
+
+    def _get_gdv_sample(self, v, u):
+        if self._node_degrees[v] >= self._node_degrees[u]:
+            pass
+        else:
+            u, v = v, u
+        Sv = set()
+        sigma1, sigma2 = 0, 0
+        nb = self._neighbours
+        N = self._num_nodes
+        M = self._num_edges
+        phi = np.zeros(self._num_nodes, dtype=int)
+        c1, c2, c3, c4 = 1, 2, 3, 4
+        x = np.zeros(16)
+        dw = self._dw
+
+        # p1
+        Sv = set(nb[v][nb[v] != u])
+        phi[list(Sv)] = c1
+        # p2
+        p2w = nb[u][nb[u] != c1]
+        p2w1 = p2w[phi[p2w] == c1]
+        p2w2 = p2w[phi[p2w] != c1]
+        Te = p2w1
+        phi[p2w1] = c3
+        Sv -= set(list(p2w1))
+        Su = p2w2
+        phi[p2w2] = c2
+        # p3
+        for w in Te:
+            if dw >= len(nb[w]):
+                region = nb[w]
+                inc = 1
+            else:
+                region = np.random.choice(nb[w], dw, replace=False)
+                inc = self._node_degrees[w] / dw
+            phir = phi[region]
+            x[5] += inc * np.sum(phir == c3)
+            phi[w] = c4
+            sigma2 = sigma2 + len(nb[w]) - 2
+        # p4
+        for w in Su:
+            if dw >= len(nb[w]):
+                region = nb[w]
+                inc = 1
+            else:
+                region = np.random.choice(nb[w], dw, replace=False)
+                inc = self._node_degrees[w] / dw
+            phir = phi[region]
+            x[8] += inc * np.sum(phir == c1)
+            x[7] += inc * np.sum(phir == c2)
+            sigma1 += inc * np.sum(phir == c4)
+            phi[w] = 0
+            sigma2 = sigma2 + len(nb[w]) - 1
+        # p5
+        for w in Sv:
+            if dw >= len(nb[w]):
+                region = nb[w]
+                inc = 1
+            else:
+                region = np.random.choice(nb[w], dw, replace=False)
+                inc = self._node_degrees[w] / dw
+            phir = phi[region]
+            x[7] += inc * np.sum(phir == c1)
+            sigma1 += inc * np.sum(phir == c4)
+            phi[w] = 0
+            sigma2 = sigma2 + len(nb[w]) - 1
+
+        lsv, lsu, lte, du, dv = len(Sv), len(Su), len(Te), len(nb[u]), len(nb[v])
+        # 3-graphlet
+        x[1] = lte
+        x[2] = du + dv - 2 - 2 * x[1]
+        x[3] = N - x[2] - x[1] - 2
+        x[4] = N * (N - 1) * (N - 2) / 6 - (x[1] + x[2] + x[3])
+        # 4 connected graphlets
+        x[6] = x[1] * (x[1] - 1) / 2 - x[5]
+        x[10] = lsv * lsu - x[8]
+        x[9] = lsv * (lsv - 1) / 2 + lsu * (lsu - 1) / 2 - x[7]
+        # 4 disconnected graphlets
+        t1 = N - (lte + lsu + lsv + 2)
+        x[11] = x[1] * t1
+        x[12] = M - (du + dv - 1) - (sigma2 - sigma1 - x[5] - x[8] - x[7])
+        x[13] = (lsu + lsv) * t1
+        x[14] = t1 * (t1 - 1) / 2 - x[12]
+        x[15] = N * (N - 1) * (N - 2) * (N - 3) / 24 - np.sum(x[5:15])
+
+        return x
+
+    def get_gdvs(self, sample=True):
+        res = np.zeros((self._num_nodes, 15))
+        for u in tqdm(range(self._num_nodes)):
+            vs = self._neighbours[u]
+            if len(vs) != 0:
+                gdvs = []
+                for v in tqdm(vs, disable=len(vs) < 100):
+                    if sample:
+                        gdvs.append(self._get_gdv_sample(u, v))
+                    else:
+                        gdvs.append(self._get_gdv(u, v))
+                res[u, :] = np.mean(gdvs, axis=0)[1:]
+        return res
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("graph" + "let")
+class GraphletGenerator(BaseFeatureGenerator):
+    r"""generate local graphlet numbers as features. The implementation refers to [#]_ .
+
+    References
+    ----------
+    .. [#] Ahmed, N. K., Willke, T. L., & Rossi, R. A. (2016).
+        Estimation of local subgraph counts. Proceedings - 2016 IEEE International Conference on Big Data, Big Data 2016, 586–595.
+        https://doi.org/10.1109/BigData.2016.7840651
+
+    """
+
+    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
+        result: np.ndarray = _Graphlet(data).get_gdvs()
+        return torch.from_numpy(result)
diff --git a/autogl/module/feature/_generators/_page_rank.py b/autogl/module/feature/_generators/_page_rank.py
new file mode 100644
index 0000000..e4fd7fa
--- /dev/null
+++ b/autogl/module/feature/_generators/_page_rank.py
@@ -0,0 +1,29 @@
+import numpy as np
+import networkx as nx
+import torch
+import autogl
+from ._basic import BaseFeatureGenerator
+from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("PageRank".lower())
+class PageRankFeatureGenerator(BaseFeatureGenerator):
+    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
+        edge_weight = getattr(data, "edge_weight").tolist()
+        g = nx.DiGraph()
+        g.add_weighted_edges_from(
+            [
+                (u, v, edge_weight[i])
+                for i, (u, v) in enumerate(data.edge_index.t().tolist())
+            ]
+        )
+        page_rank = nx.pagerank(g)
+        num_nodes: int = (
+            data.x.size(0)
+            if data.x is not None and isinstance(data.x, torch.Tensor)
+            else (data.edge_index.max().item() + 1)
+        )
+        pr = np.zeros(num_nodes)
+        for i, v in page_rank.items():
+            pr[i] = v
+        return torch.from_numpy(pr)
diff --git a/autogl/module/feature/_generators/_pyg.py b/autogl/module/feature/_generators/_pyg.py
new file mode 100644
index 0000000..16042ea
--- /dev/null
+++ b/autogl/module/feature/_generators/_pyg.py
@@ -0,0 +1,78 @@
+import torch.nn.functional
+import autogl
+from ._basic import BaseFeatureGenerator
+from ._pyg_impl import degree, scatter_min, scatter_max, scatter_mean, scatter_std
+from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("LocalDegreeProfile")
+class LocalDegreeProfileGenerator(BaseFeatureGenerator):
+    r"""Appends the Local Degree Profile (LDP) from the `"A Simple yet
+    Effective Baseline for Non-attribute Graph Classification"
+    <https://arxiv.org/abs/1811.03508>`_ paper
+
+    .. math::
+        \mathbf{x}_i = \mathbf{x}_i \, \Vert \, (\deg(i), \min(DN(i)),
+        \max(DN(i)), \textrm{mean}(DN(i)), \textrm{std}(DN(i)))
+
+    to the node features, where :math:`DN(i) = \{ \deg(j) \mid j \in
+    \mathcal{N}(i) \}`.
+    """
+
+    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
+        row, col = data.edge_index
+        if data.x is not None and isinstance(data.x, torch.Tensor):
+            N = data.x.size(0)
+        else:
+            N = (torch.max(data.edge_index).item() + 1)
+
+        deg = degree(row, N, dtype=torch.float)
+        deg_col = deg[col]
+
+        min_deg, _ = scatter_min(deg_col, row, dim_size=N)
+        min_deg[min_deg > 10000] = 0
+        max_deg, _ = scatter_max(deg_col, row, dim_size=N)
+        max_deg[max_deg < -10000] = 0
+        mean_deg = scatter_mean(deg_col, row, dim_size=N)
+        std_deg = scatter_std(deg_col, row, dim_size=N)
+
+        x = torch.stack([deg, min_deg, max_deg, mean_deg, std_deg], dim=1)
+        return x
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NormalizeFeatures")
+class NormalizeFeatures(BaseFeatureGenerator):
+    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
+        if data.x is not None and isinstance(data.x, torch.Tensor):
+            data.x.div_(data.x.sum(dim=-1, keepdim=True).clamp_(min=1.))
+        return data.x
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("OneHotDegree")
+class OneHotDegreeGenerator(BaseFeatureGenerator):
+    r"""Adds the node degree as one hot encodings to the node features.
+
+    Args:
+        max_degree (int): Maximum degree.
+        in_degree (bool, optional): If set to :obj:`True`, will compute the
+            in-degree of nodes instead of the out-degree.
+            (default: :obj:`False`)
+        cat (bool, optional): Concat node degrees to node features instead
+            of replacing them. (default: :obj:`True`)
+    """
+    def __init__(
+            self, max_degree: int = 1000,
+            in_degree: bool = False, cat: bool = True
+    ):
+        self.__max_degree: int = max_degree
+        self.__in_degree: bool = in_degree
+        self.__cat: bool = cat
+        super(OneHotDegreeGenerator, self).__init__()
+
+    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
+        idx, x = data.edge_index[1 if self.__in_degree else 0], data.x
+        deg = degree(idx, data.num_nodes, dtype=torch.long)
+        deg = torch.nn.functional.one_hot(
+            deg, num_classes=self.__max_degree + 1
+        ).to(torch.float)
+        return deg
diff --git a/autogl/module/feature/_generators/_pyg_impl.py b/autogl/module/feature/_generators/_pyg_impl.py
new file mode 100644
index 0000000..eb80113
--- /dev/null
+++ b/autogl/module/feature/_generators/_pyg_impl.py
@@ -0,0 +1,234 @@
+import torch
+import typing as _typing
+from typing import Optional, Tuple
+
+
+def degree(index, num_nodes: _typing.Optional[int] = None,
+           dtype: _typing.Optional[torch.dtype] = None):
+    r"""Computes the (unweighted) degree of a given one-dimensional index
+    tensor.
+
+    Args:
+        index (LongTensor): Index tensor.
+        num_nodes (int, optional): The number of nodes, *i.e.*
+            :obj:`max_val + 1` of :attr:`index`. (default: :obj:`None`)
+        dtype (:obj:`torch.dtype`, optional): The desired data type of the
+            returned tensor.
+
+    :rtype: :class:`Tensor`
+    """
+
+    def maybe_num_nodes(edge_index, __num_nodes=None):
+        if __num_nodes is not None:
+            return __num_nodes
+        elif isinstance(edge_index, torch.Tensor):
+            return int(edge_index.max()) + 1 if edge_index.numel() > 0 else 0
+        else:
+            return max(edge_index.size(0), edge_index.size(1))
+
+    N = maybe_num_nodes(index, num_nodes)
+    out = torch.zeros((N,), dtype=dtype, device=index.device)
+    one = torch.ones((index.size(0),), dtype=out.dtype, device=out.device)
+    return out.scatter_add_(0, index, one)
+
+
+def broadcast(src: torch.Tensor, other: torch.Tensor, dim: int):
+    if dim < 0:
+        dim = other.dim() + dim
+    if src.dim() == 1:
+        for _ in range(0, dim):
+            src = src.unsqueeze(0)
+    for _ in range(src.dim(), other.dim()):
+        src = src.unsqueeze(-1)
+    src = src.expand_as(other)
+    return src
+
+
+def scatter_sum(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
+                out: Optional[torch.Tensor] = None,
+                dim_size: Optional[int] = None) -> torch.Tensor:
+    index = broadcast(index, src, dim)
+    if out is None:
+        size = list(src.size())
+        if dim_size is not None:
+            size[dim] = dim_size
+        elif index.numel() == 0:
+            size[dim] = 0
+        else:
+            size[dim] = int(index.max()) + 1
+        out = torch.zeros(size, dtype=src.dtype, device=src.device)
+        return out.scatter_add_(dim, index, src)
+    else:
+        return out.scatter_add_(dim, index, src)
+
+
+def scatter_add(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
+                out: Optional[torch.Tensor] = None,
+                dim_size: Optional[int] = None) -> torch.Tensor:
+    return scatter_sum(src, index, dim, out, dim_size)
+
+
+def scatter_mul(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
+                out: Optional[torch.Tensor] = None,
+                dim_size: Optional[int] = None) -> torch.Tensor:
+    return torch.ops.torch_scatter.scatter_mul(src, index, dim, out, dim_size)
+
+
+def scatter_mean(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
+                 out: Optional[torch.Tensor] = None,
+                 dim_size: Optional[int] = None) -> torch.Tensor:
+    out = scatter_sum(src, index, dim, out, dim_size)
+    dim_size = out.size(dim)
+
+    index_dim = dim
+    if index_dim < 0:
+        index_dim = index_dim + src.dim()
+    if index.dim() <= index_dim:
+        index_dim = index.dim() - 1
+
+    ones = torch.ones(index.size(), dtype=src.dtype, device=src.device)
+    count = scatter_sum(ones, index, index_dim, None, dim_size)
+    count[count < 1] = 1
+    count = broadcast(count, out, dim)
+    if out.is_floating_point():
+        out.true_divide_(count)
+    else:
+        out.floor_divide_(count)
+    return out
+
+
+def scatter_min(
+        src: torch.Tensor, index: torch.Tensor, dim: int = -1,
+        out: Optional[torch.Tensor] = None,
+        dim_size: Optional[int] = None) -> Tuple[torch.Tensor, torch.Tensor]:
+    return torch.ops.torch_scatter.scatter_min(src, index, dim, out, dim_size)
+
+
+def scatter_max(
+        src: torch.Tensor, index: torch.Tensor, dim: int = -1,
+        out: Optional[torch.Tensor] = None,
+        dim_size: Optional[int] = None) -> Tuple[torch.Tensor, torch.Tensor]:
+    return torch.ops.torch_scatter.scatter_max(src, index, dim, out, dim_size)
+
+
+def scatter_std(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
+                out: Optional[torch.Tensor] = None,
+                dim_size: Optional[int] = None,
+                unbiased: bool = True) -> torch.Tensor:
+    if out is not None:
+        dim_size = out.size(dim)
+
+    if dim < 0:
+        dim = src.dim() + dim
+
+    count_dim = dim
+    if index.dim() <= dim:
+        count_dim = index.dim() - 1
+
+    ones = torch.ones(index.size(), dtype=src.dtype, device=src.device)
+    count = scatter_sum(ones, index, count_dim, dim_size=dim_size)
+
+    index = broadcast(index, src, dim)
+    tmp = scatter_sum(src, index, dim, dim_size=dim_size)
+    count = broadcast(count, tmp, dim).clamp(1)
+    mean = tmp.div(count)
+
+    var = (src - mean.gather(dim, index))
+    var = var * var
+    out = scatter_sum(var, index, dim, out, dim_size)
+
+    if unbiased:
+        count = count.sub(1).clamp_(1)
+    out = out.div(count + 1e-6).sqrt()
+
+    return out
+
+
+def scatter(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
+            out: Optional[torch.Tensor] = None, dim_size: Optional[int] = None,
+            reduce: str = "sum") -> torch.Tensor:
+    r"""
+    |
+
+    .. image:: https://raw.githubusercontent.com/rusty1s/pytorch_scatter/
+            master/docs/source/_figures/add.svg?sanitize=true
+        :align: center
+        :width: 400px
+
+    |
+
+    Reduces all values from the :attr:`src` tensor into :attr:`out` at the
+    indices specified in the :attr:`index` tensor along a given axis
+    :attr:`dim`.
+    For each value in :attr:`src`, its output index is specified by its index
+    in :attr:`src` for dimensions outside of :attr:`dim` and by the
+    corresponding value in :attr:`index` for dimension :attr:`dim`.
+    The applied reduction is defined via the :attr:`reduce` argument.
+
+    Formally, if :attr:`src` and :attr:`index` are :math:`n`-dimensional
+    tensors with size :math:`(x_0, ..., x_{i-1}, x_i, x_{i+1}, ..., x_{n-1})`
+    and :attr:`dim` = `i`, then :attr:`out` must be an :math:`n`-dimensional
+    tensor with size :math:`(x_0, ..., x_{i-1}, y, x_{i+1}, ..., x_{n-1})`.
+    Moreover, the values of :attr:`index` must be between :math:`0` and
+    :math:`y - 1`, although no specific ordering of indices is required.
+    The :attr:`index` tensor supports broadcasting in case its dimensions do
+    not match with :attr:`src`.
+
+    For one-dimensional tensors with :obj:`reduce="sum"`, the operation
+    computes
+
+    .. math::
+        \mathrm{out}_i = \mathrm{out}_i + \sum_j~\mathrm{src}_j
+
+    where :math:`\sum_j` is over :math:`j` such that
+    :math:`\mathrm{index}_j = i`.
+
+    .. note::
+
+        This operation is implemented via atomic operations on the GPU and is
+        therefore **non-deterministic** since the order of parallel operations
+        to the same value is undetermined.
+        For floating-point variables, this results in a source of variance in
+        the result.
+
+    :param src: The source tensor.
+    :param index: The indices of elements to scatter.
+    :param dim: The axis along which to index. (default: :obj:`-1`)
+    :param out: The destination tensor.
+    :param dim_size: If :attr:`out` is not given, automatically create output
+        with size :attr:`dim_size` at dimension :attr:`dim`.
+        If :attr:`dim_size` is not given, a minimal sized output tensor
+        according to :obj:`index.max() + 1` is returned.
+    :param reduce: The reduce operation (:obj:`"sum"`, :obj:`"mul"`,
+        :obj:`"mean"`, :obj:`"min"` or :obj:`"max"`). (default: :obj:`"sum"`)
+
+    :rtype: :class:`Tensor`
+
+    .. code-block:: python
+
+        from torch_scatter import scatter
+
+        src = torch.randn(10, 6, 64)
+        index = torch.tensor([0, 1, 0, 1, 2, 1])
+
+        # Broadcasting in the first and last dim.
+        out = scatter(src, index, dim=1, reduce="sum")
+
+        print(out.size())
+
+    .. code-block::
+
+        torch.Size([10, 3, 64])
+    """
+    if reduce == 'sum' or reduce == 'add':
+        return scatter_sum(src, index, dim, out, dim_size)
+    if reduce == 'mul':
+        return scatter_mul(src, index, dim, out, dim_size)
+    elif reduce == 'mean':
+        return scatter_mean(src, index, dim, out, dim_size)
+    elif reduce == 'min':
+        return scatter_min(src, index, dim, out, dim_size)[0]
+    elif reduce == 'max':
+        return scatter_max(src, index, dim, out, dim_size)[0]
+    else:
+        raise ValueError
diff --git a/autogl/module/feature/_graph/__init__.py b/autogl/module/feature/_graph/__init__.py
new file mode 100644
index 0000000..c0b1e8c
--- /dev/null
+++ b/autogl/module/feature/_graph/__init__.py
@@ -0,0 +1,17 @@
+from ._netlsd import NetLSD
+from ._networkx import (
+    NXLargeCliqueSize,
+    NXDegreeAssortativityCoefficient,
+    NXDegreePearsonCorrelationCoefficient,
+    NXHasBridges,
+    NXGraphCliqueNumber,
+    NXGraphNumberOfCliques,
+    NXTransitivity,
+    NXAverageClustering,
+    NXIsConnected,
+    NXNumberConnectedComponents,
+    NXIsDistanceRegular,
+    NXLocalEfficiency,
+    NXGlobalEfficiency,
+    NXIsEulerian,
+)
diff --git a/autogl/module/feature/_graph/_netlsd.py b/autogl/module/feature/_graph/_netlsd.py
new file mode 100644
index 0000000..a5a6f80
--- /dev/null
+++ b/autogl/module/feature/_graph/_netlsd.py
@@ -0,0 +1,41 @@
+import netlsd
+import torch
+
+from autogl.data.graph import GeneralStaticGraph
+from autogl.data.graph.utils import conversion
+from .._base_feature_engineer import BaseFeatureEngineer
+from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NetLSD".lower())
+class NetLSD(BaseFeatureEngineer):
+    r"""
+    Notes
+    -----
+    a graph feature generation method. This is a simple wrapper of NetLSD [#]_.
+
+    References
+    ----------
+    ..  [#] A. Tsitsulin, D. Mottin, P. Karras, A. Bronstein, and E. Müller, “NetLSD: Hearing the shape of a graph,”
+        Proc. ACM SIGKDD Int. Conf. Knowl. Discov. Data Min., pp. 2347–2356, 2018.
+    """
+
+    def __init__(self, *args, **kwargs):
+        self.__args = args
+        self.__kwargs = kwargs
+        super(NetLSD, self).__init__()
+
+    def _transform(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        temp = netlsd.heat(
+            conversion.HomogeneousStaticGraphToNetworkX(to_undirected=True).__call__(
+                static_graph, to_undirected=True
+            ),
+            *self.__args, **self.__kwargs
+        )
+        dsc: torch.Tensor = torch.tensor([temp]).view(-1)
+        if 'gf' in static_graph.data:
+            gf = static_graph.data['gf'].view(-1)
+            static_graph.data['gf'] = torch.cat([gf, dsc])
+        else:
+            static_graph.data['gf'] = dsc
+        return static_graph
diff --git a/autogl/module/feature/_graph/_networkx.py b/autogl/module/feature/_graph/_networkx.py
new file mode 100644
index 0000000..88ea885
--- /dev/null
+++ b/autogl/module/feature/_graph/_networkx.py
@@ -0,0 +1,131 @@
+import torch
+import typing as _typing
+import networkx
+from networkx.algorithms.euler import is_eulerian
+from networkx.algorithms.efficiency_measures import global_efficiency
+from networkx.algorithms.efficiency_measures import local_efficiency
+from networkx.algorithms.distance_regular import is_distance_regular
+from networkx.algorithms.components import number_connected_components
+from networkx.algorithms.components import is_connected
+# from networkx.algorithms.cluster import average_clustering
+from networkx.algorithms.cluster import transitivity
+from networkx.algorithms.clique import graph_number_of_cliques
+from networkx.algorithms.clique import graph_clique_number
+from networkx.algorithms.bridges import has_bridges
+from networkx.algorithms.assortativity import degree_pearson_correlation_coefficient
+from networkx.algorithms.assortativity import degree_assortativity_coefficient
+from networkx.algorithms.approximation.clustering_coefficient import average_clustering
+from networkx.algorithms.approximation.clique import large_clique_size
+
+from autogl.data.graph import GeneralStaticGraph
+from autogl.data.graph.utils import conversion
+from .._base_feature_engineer import BaseFeatureEngineer
+from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
+
+
+class _NetworkXGraphFeatureEngineer(BaseFeatureEngineer):
+    def __init__(self, feature_extractor: _typing.Callable[[networkx.Graph], _typing.Any]):
+        self.__feature_extractor: _typing.Callable[[networkx.Graph], _typing.Any] = feature_extractor
+        super(_NetworkXGraphFeatureEngineer, self).__init__()
+
+    def _transform(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        dsc = self.__feature_extractor(
+            conversion.HomogeneousStaticGraphToNetworkX(to_undirected=True)(static_graph)
+        )
+        dsc: torch.Tensor = torch.tensor([dsc]).view(-1)
+        if 'gf' in static_graph.data:
+            gf = static_graph.data['gf'].view(-1)
+            static_graph.data['gf'] = torch.cat([gf, dsc])
+        else:
+            static_graph.data['gf'] = dsc
+        return static_graph
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXLargeCliqueSize")
+class NXLargeCliqueSize(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXLargeCliqueSize, self).__init__(large_clique_size)
+
+
+# @FeatureEngineerUniversalRegistry.register_feature_engineer("NXAverageClusteringApproximate")
+# class NXAverageClusteringApproximate(_NetworkXGraphFeatureEngineer):
+#     def __init__(self):
+#         super(NXAverageClusteringApproximate, self).__init__(average_clustering)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXDegreeAssortativityCoefficient")
+class NXDegreeAssortativityCoefficient(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXDegreeAssortativityCoefficient, self).__init__(degree_assortativity_coefficient)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXDegreePearsonCorrelationCoefficient")
+class NXDegreePearsonCorrelationCoefficient(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXDegreePearsonCorrelationCoefficient, self).__init__(degree_pearson_correlation_coefficient)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXHasBridges")
+class NXHasBridges(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXHasBridges, self).__init__(has_bridges)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXGraphCliqueNumber")
+class NXGraphCliqueNumber(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXGraphCliqueNumber, self).__init__(graph_clique_number)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXGraphNumberOfCliques")
+class NXGraphNumberOfCliques(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXGraphNumberOfCliques, self).__init__(graph_number_of_cliques)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXTransitivity")
+class NXTransitivity(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXTransitivity, self).__init__(transitivity)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXAverageClustering")
+class NXAverageClustering(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXAverageClustering, self).__init__(average_clustering)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXIsConnected")
+class NXIsConnected(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXIsConnected, self).__init__(is_connected)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXNumberConnectedComponents")
+class NXNumberConnectedComponents(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXNumberConnectedComponents, self).__init__(number_connected_components)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXIsDistanceRegular")
+class NXIsDistanceRegular(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXIsDistanceRegular, self).__init__(is_distance_regular)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXLocalEfficiency")
+class NXLocalEfficiency(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXLocalEfficiency, self).__init__(local_efficiency)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXGlobalEfficiency")
+class NXGlobalEfficiency(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXGlobalEfficiency, self).__init__(global_efficiency)
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("NXIsEulerian")
+class NXIsEulerian(_NetworkXGraphFeatureEngineer):
+    def __init__(self):
+        super(NXIsEulerian, self).__init__(is_eulerian)
diff --git a/autogl/module/feature/_selectors/__init__.py b/autogl/module/feature/_selectors/__init__.py
new file mode 100644
index 0000000..716128e
--- /dev/null
+++ b/autogl/module/feature/_selectors/__init__.py
@@ -0,0 +1,2 @@
+from ._basic import FilterConstant
+from ._gbdt import GBDTFeatureSelector
diff --git a/autogl/module/feature/_selectors/_basic.py b/autogl/module/feature/_selectors/_basic.py
new file mode 100644
index 0000000..9987a1b
--- /dev/null
+++ b/autogl/module/feature/_selectors/_basic.py
@@ -0,0 +1,58 @@
+import numpy as np
+import torch
+import typing as _typing
+from autogl.data.graph import GeneralStaticGraph
+from .._base_feature_engineer import BaseFeatureEngineer
+from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
+
+
+class BaseFeatureSelector(BaseFeatureEngineer):
+    def __init__(self):
+        self._selection = _typing.Optional[torch.Tensor] = None
+        super(BaseFeatureSelector, self).__init__()
+
+    def _transform(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        if (
+                'x' in static_graph.nodes.data and
+                self._selection not in (Ellipsis, None) and
+                isinstance(self._selection, torch.Tensor) and
+                torch.is_tensor(self._selection) and self._selection.dim() == 1
+        ):
+            static_graph.nodes.data['x'] = static_graph.nodes.data['x'][:, self._selection]
+        if (
+                'feat' in static_graph.nodes.data and
+                self._selection not in (Ellipsis, None) and
+                isinstance(self._selection, torch.Tensor) and
+                torch.is_tensor(self._selection) and self._selection.dim() == 1
+        ):
+            static_graph.nodes.data['feat'] = static_graph.nodes.data['feat'][:, self._selection]
+        return static_graph
+
+
+@FeatureEngineerUniversalRegistry.register_feature_engineer("FilterConstant")
+class FilterConstant(BaseFeatureSelector):
+    r"""drop constant features"""
+
+    def _fit(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        if (
+                'x' in static_graph.nodes.data and
+                self._selection not in (Ellipsis, None) and
+                isinstance(self._selection, torch.Tensor) and
+                torch.is_tensor(self._selection) and self._selection.dim() == 1
+        ):
+            feature: _typing.Optional[np.ndarray] = static_graph.nodes.data['x'].numpy()
+        elif (
+                'feat' in static_graph.nodes.data and
+                self._selection not in (Ellipsis, None) and
+                isinstance(self._selection, torch.Tensor) and
+                torch.is_tensor(self._selection) and self._selection.dim() == 1
+        ):
+            feature: _typing.Optional[np.ndarray] = static_graph.nodes.data['feat'].numpy()
+        else:
+            feature: _typing.Optional[np.ndarray] = None
+        self._selection: _typing.Optional[torch.Tensor] = torch.from_numpy(
+            np.where(np.all(feature == feature[0, :], axis=0) == np.array(False))[0]
+            if feature is not None and isinstance(feature, np.ndarray) and feature.ndim == 2
+            else None
+        )
+        return static_graph
diff --git a/autogl/module/feature/_selectors/_gbdt.py b/autogl/module/feature/_selectors/_gbdt.py
new file mode 100644
index 0000000..88cb9c6
--- /dev/null
+++ b/autogl/module/feature/_selectors/_gbdt.py
@@ -0,0 +1,139 @@
+import numpy as np
+import pandas as pd
+import torch
+import typing as _typing
+import autogl
+from autogl.data.graph import GeneralStaticGraph
+from .. import _feature_engineer_registry
+import lightgbm
+from sklearn.model_selection import train_test_split
+from ._basic import BaseFeatureSelector
+
+
+def _gbdt_generator(
+        data: autogl.data.Data, fixlen: int = 1000,
+        params: _typing.Mapping[str, _typing.Any] = ...,
+        is_val: bool = True, train_val_ratio: float = 0.2,
+        **optimizer_parameters
+) -> _typing.Optional[np.ndarray]:
+    parameters: _typing.Dict[str, _typing.Any] = (
+        dict(params)
+        if (
+                params not in (Ellipsis, None) and
+                isinstance(params, _typing.Mapping)
+        )
+        else {
+            "boosting_type": "gbdt",
+            "verbosity": -1,
+            "random_state": 47,
+            "objective": "multiclass",
+            "metric": ["multi_logloss"],
+            "max_bin": 63,
+            "save_binary": True,
+            "num_threads": 20,
+            "num_leaves": 16,
+            "subsample": 0.9,
+            "subsample_freq": 1,
+            "colsample_bytree": 0.8,
+            # 'is_training_metric': True,
+            # 'metric_freq': 1,
+        }
+    )
+
+    num_classes: int = torch.max(data.y).item() + 1
+    __optimizer_parameters = {
+        "num_boost_round": 100,
+        "early_stopping_rounds": 5,
+        "verbose_eval": False
+    }
+    __optimizer_parameters.update(optimizer_parameters)
+    if hasattr(data, "train_mask") and data.train_mask is not None and (
+            isinstance(data.train_mask, np.ndarray) or
+            isinstance(data.train_mask, torch.Tensor)
+    ):
+        x: np.ndarray = data.x[data.train_mask].numpy()
+        label: np.ndarray = data.y[data.train_mask].numpy()
+    else:
+        x: np.ndarray = data.x.numpy()
+        label: np.ndarray = data.y.numpy()
+        is_val: bool = False
+    _, num_features = x.shape
+    if num_features < fixlen:
+        return None
+
+    feature_index: np.ndarray = np.array(
+        [f"f{i}" for i in range(num_features)]
+    )
+    if is_val:
+        x_train, x_val, y_train, y_val = train_test_split(
+            x, label, test_size=train_val_ratio, stratify=label, random_state=47
+        )
+        dtrain = lightgbm.Dataset(x_train, label=y_train)
+        dval = lightgbm.Dataset(x_val, label=y_val)
+        clf = lightgbm.train(
+            train_set=dtrain, params=parameters, valid_sets=dval,
+            **__optimizer_parameters
+        )
+    else:
+        train_x = pd.DataFrame(x, columns=feature_index, index=None)
+        dtrain = lightgbm.Dataset(train_x, label=label)
+        clf = lightgbm.train(
+            train_set=dtrain, params=params,
+            **__optimizer_parameters
+        )
+
+    imp = np.array(list(clf.feature_importance()))
+    return np.argsort(imp)[-fixlen:]
+
+
+@_feature_engineer_registry.FeatureEngineerUniversalRegistry.register_feature_engineer("gbdt")
+class GBDTFeatureSelector(BaseFeatureSelector):
+    r"""simple wrapper of lightgbm , using importance ranking to select top-k features.
+
+    Parameters
+    ----------
+    fixlen : int
+        K for top-K important features.
+    """
+
+    def __init__(self, fixlen: int = 10, *args, **kwargs):
+        super(GBDTFeatureSelector, self).__init__()
+        self.__fixlen = fixlen
+        self.__args = args
+        self.__kwargs = kwargs
+
+    def _fit(self, homogeneous_static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
+        if not isinstance(homogeneous_static_graph, GeneralStaticGraph):
+            raise TypeError
+        elif not (
+            homogeneous_static_graph.nodes.is_homogeneous and
+            homogeneous_static_graph.edges.is_homogeneous
+        ):
+            raise ValueError
+        if 'x' in homogeneous_static_graph.nodes.data:
+            features: torch.Tensor = homogeneous_static_graph.nodes.data['x']
+        elif 'feat' in homogeneous_static_graph.nodes.data:
+            features: torch.Tensor = homogeneous_static_graph.nodes.data['feat']
+        else:
+            raise ValueError("Node features not exists")
+        if 'y' in homogeneous_static_graph.nodes.data:
+            label: torch.Tensor = homogeneous_static_graph.nodes.data['y']
+        elif 'label' in homogeneous_static_graph.nodes.data:
+            label: torch.Tensor = homogeneous_static_graph.nodes.data['label']
+        else:
+            raise ValueError("Node label not exists")
+        if 'train_mask' in homogeneous_static_graph.nodes.data:
+            train_mask: _typing.Optional[torch.Tensor] = (
+                homogeneous_static_graph.nodes.data['train_mask']
+            )
+        else:
+            train_mask: _typing.Optional[torch.Tensor] = None
+        data = autogl.data.Data(
+            edge_index=homogeneous_static_graph.edges.connections,
+            x=features, y=label
+        )
+        data.train_mask = train_mask
+        self._selection = _gbdt_generator(
+            data, self.__fixlen, *self.__args, **self.__kwargs
+        )
+        return homogeneous_static_graph

From eae736a11bcfdc4da2b82cc3f6b30531ddc2674b Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 11 Oct 2021 08:08:33 +0000
Subject: [PATCH 07/75] fix typo

---
 autogl/solver/__init__.py                                   | 2 +-
 autogl/solver/{classfier => classifier}/__init__.py         | 2 +-
 autogl/solver/{classfier => classifier}/base.py             | 0
 autogl/solver/{classfier => classifier}/graph_classifier.py | 0
 autogl/solver/{classfier => classifier}/link_predictor.py   | 0
 autogl/solver/{classfier => classifier}/node_classifier.py  | 0
 6 files changed, 2 insertions(+), 2 deletions(-)
 rename autogl/solver/{classfier => classifier}/__init__.py (90%)
 rename autogl/solver/{classfier => classifier}/base.py (100%)
 rename autogl/solver/{classfier => classifier}/graph_classifier.py (100%)
 rename autogl/solver/{classfier => classifier}/link_predictor.py (100%)
 rename autogl/solver/{classfier => classifier}/node_classifier.py (100%)

diff --git a/autogl/solver/__init__.py b/autogl/solver/__init__.py
index 9fef37a..1cba0b1 100644
--- a/autogl/solver/__init__.py
+++ b/autogl/solver/__init__.py
@@ -3,7 +3,7 @@ Auto solver for various graph tasks
 """
 
 from .classifier import AutoGraphClassifier, AutoNodeClassifier, AutoLinkPredictor
-from ..utils import LeaderBoard
+from .utils import LeaderBoard
 
 __all__ = [
     "AutoNodeClassifier",
diff --git a/autogl/solver/classfier/__init__.py b/autogl/solver/classifier/__init__.py
similarity index 90%
rename from autogl/solver/classfier/__init__.py
rename to autogl/solver/classifier/__init__.py
index 7cc0b07..e30c582 100644
--- a/autogl/solver/classfier/__init__.py
+++ b/autogl/solver/classifier/__init__.py
@@ -2,7 +2,7 @@
 Auto classifier for classification problems.
 """
 
-from ..base import BaseClassifier
+from .base import BaseClassifier
 from .graph_classifier import AutoGraphClassifier
 from .node_classifier import AutoNodeClassifier
 from .link_predictor import AutoLinkPredictor
diff --git a/autogl/solver/classfier/base.py b/autogl/solver/classifier/base.py
similarity index 100%
rename from autogl/solver/classfier/base.py
rename to autogl/solver/classifier/base.py
diff --git a/autogl/solver/classfier/graph_classifier.py b/autogl/solver/classifier/graph_classifier.py
similarity index 100%
rename from autogl/solver/classfier/graph_classifier.py
rename to autogl/solver/classifier/graph_classifier.py
diff --git a/autogl/solver/classfier/link_predictor.py b/autogl/solver/classifier/link_predictor.py
similarity index 100%
rename from autogl/solver/classfier/link_predictor.py
rename to autogl/solver/classifier/link_predictor.py
diff --git a/autogl/solver/classfier/node_classifier.py b/autogl/solver/classifier/node_classifier.py
similarity index 100%
rename from autogl/solver/classfier/node_classifier.py
rename to autogl/solver/classifier/node_classifier.py

From 6ccaba7758cf49f20c3c5e9f2a4b311819be0c95 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 11 Oct 2021 08:45:02 +0000
Subject: [PATCH 08/75] adapt for nodeclf solver

---
 autogl/solver/classifier/node_classifier.py | 68 +++++++--------------
 autogl/solver/utils.py                      | 30 +++++++++
 2 files changed, 52 insertions(+), 46 deletions(-)

diff --git a/autogl/solver/classifier/node_classifier.py b/autogl/solver/classifier/node_classifier.py
index 5c8eb81..24e4bcd 100644
--- a/autogl/solver/classifier/node_classifier.py
+++ b/autogl/solver/classifier/node_classifier.py
@@ -7,7 +7,6 @@ import json
 from copy import deepcopy
 
 import torch
-import torch.nn.functional as F
 import numpy as np
 import yaml
 
@@ -20,13 +19,11 @@ from ...module.train import get_feval
 from ...module.nas.space import NAS_SPACE_DICT
 from ...module.nas.algorithm import NAS_ALGO_DICT
 from ...module.nas.estimator import NAS_ESTIMATOR_DICT, BaseEstimator
-from ..utils import LeaderBoard, set_seed
+from ..utils import LeaderBoard, get_graph_from_dataset, get_graph_labels, get_graph_masks, get_graph_node_features, get_graph_node_number, set_seed
 from ...datasets import utils
 from ...utils import get_logger
-from ...backend import DependentBackend
 
 LOGGER = get_logger("NodeClassifier")
-__backend = DependentBackend.get_backend_name()
 
 class AutoNodeClassifier(BaseClassifier):
     """
@@ -303,12 +300,11 @@ class AutoNodeClassifier(BaseClassifier):
             {e.get_eval_name(): e.is_higher_better() for e in evaluator_list},
         )
 
+        graph_data = get_graph_from_dataset(dataset, 0)
+
         # set up the dataset
         if train_split is not None and val_split is not None:
-            if __backend == 'pyg':
-                size = dataset.data.x.shape[0]
-            else:
-                size = dataset.graphs[0].num_nodes()
+            size = get_graph_node_number(graph_data)
             if balanced:
                 train_split = (
                     train_split if train_split > 1 else int(train_split * size)
@@ -327,18 +323,10 @@ class AutoNodeClassifier(BaseClassifier):
                     dataset, train_ratio=train_split, val_ratio=val_split
                 )
         else:
-            if __backend == 'pyg':
-                assert hasattr(dataset.data, "train_mask") and hasattr(
-                    dataset.data, "val_mask"
-                ), (
-                    "The dataset has no default train/val split! Please manually pass "
-                    "train and val ratio."
-                )
-            elif __backend == 'dgl':
-                assert "train_mask" in dataset[0].ndata and "val_mask" in dataset[0].ndata, (
-                    "The dataset has no default train/val split! Please manually pass "
-                    "train and val ratio."
-                )
+            assert get_graph_masks(graph_data, 'train') is not None and get_graph_masks(graph_data, 'val') is not None, (
+                "The dataset has no default train/val split! Please manually pass "
+                "train and val ratio."
+            )
             LOGGER.info("Use the default train/val/test ratio in given dataset")
 
         # feature engineering
@@ -349,26 +337,20 @@ class AutoNodeClassifier(BaseClassifier):
 
         # check whether the dataset has features.
         # currently we only support graph classification with features.
-        
-        if __backend == 'pyg':
-            assert dataset[0].x is not None, (
-                "Does not support fit on non node-feature dataset!"
-                " Please add node features to dataset or specify feature engineers that generate"
-                " node features."
-            )
-        elif __backend == 'dgl':
-            # TODO: how can we get features?
-            assert 'feat' in dataset[0].ndata['feat'], (
-                "Does not support fit on non node-feature dataset!"
-                " Please add node features to dataset or specify feature engineers that generate"
-                " node features."
-            )
+
+        feat = get_graph_node_features(graph_data)
+        assert feat is not None, (
+            "Does not support fit on non node-feature dataset!"
+            " Please add node features to dataset or specify feature engineers that generate"
+            " node features."
+        )
+
+        num_features = feat.size(-1)
 
         # initialize graph networks
         self._init_graph_module(
             self.gml,
-            # TODO: how can we get num_features?
-            num_features=self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1),
+            num_features=num_features,
             num_classes=self.dataset.num_classes,
             feval=evaluator_list,
             device=self.runtime_device,
@@ -378,8 +360,7 @@ class AutoNodeClassifier(BaseClassifier):
         if self.nas_algorithms is not None:
             # perform neural architecture search
             self._init_nas_module(
-                # TODO: how can we get num_features?
-                num_features=self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1),
+                num_features=num_features,
                 num_classes=self.dataset.num_classes,
                 feval=evaluator_list,
                 device=self.runtime_device,
@@ -407,8 +388,7 @@ class AutoNodeClassifier(BaseClassifier):
                 if isinstance(train_name, str):
                     trainer = TRAINER_DICT[train_name](
                         model=model,
-                        # TODO: how can we get num_features?
-                        num_features=self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1),
+                        num_features=num_features,
                         num_classes=self.dataset.num_classes,
                         loss="nll_loss"
                         if not hasattr(dataset, "loss")
@@ -421,8 +401,7 @@ class AutoNodeClassifier(BaseClassifier):
                     trainer = train_name
                     trainer.model = model
                     trainer.update_parameters(
-                        # TODO: how can we get num_features?
-                        num_features=self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1),
+                        num_features=num_features,
                         num_classes=self.dataset.num_classes,
                         loss="nll_loss"
                         if not hasattr(dataset, "loss")
@@ -468,10 +447,7 @@ class AutoNodeClassifier(BaseClassifier):
         if self.ensemble_module is not None:
             performance = self.ensemble_module.fit(
                 result_valid,
-                # 
-                self.dataset[0].y[self.dataset[0].val_mask].cpu().numpy()
-                if __backend == 'pyg' else 
-                self.dataset[0].ndata['label'][self.dataset[0].ndata['val_mask']].cpu().numpy(),
+                get_graph_labels(graph_data)[get_graph_masks(graph_data, 'val')].cpu().numpy(),
                 names,
                 evaluator_list,
                 n_classes=dataset.num_classes,
diff --git a/autogl/solver/utils.py b/autogl/solver/utils.py
index 86843e5..0ed6fc7 100644
--- a/autogl/solver/utils.py
+++ b/autogl/solver/utils.py
@@ -9,11 +9,13 @@ import typing as _typing
 import torch.backends.cudnn
 import numpy as np
 import pandas as pd
+from ..backend import DependentBackend
 
 from ..utils import get_logger
 
 LOGGER = get_logger("LeaderBoard")
 
+__backend = DependentBackend.get_backend_name()
 
 class LeaderBoard:
     """
@@ -175,6 +177,34 @@ class LeaderBoard:
             )
         )
 
+def get_graph_from_dataset(dataset, graph_id=0):
+    if __backend == 'pyg': return dataset[graph_id]
+    return dataset.graph[graph_id]
+
+def get_graph_node_number(graph):
+    if __backend == 'pyg':
+        size = graph.x.shape[0]
+    else:
+        size = graph.num_nodes()
+    return size
+
+def get_graph_node_features(graph):
+    if __backend == 'pyg' and hasattr(graph, 'x'):
+        return graph.x
+    elif __backend == 'dgl' and 'feat' in graph.ndata:
+        return graph.ndata['feat']
+    return None
+
+def get_graph_masks(graph, mask='train'):
+    if __backend == 'pyg' and hasattr(graph, f'{mask}_mask'):
+        return getattr(graph, f'{mask}_mask')
+    if __backend == 'dgl' and f'{mask}_mask' in graph.ndata:
+        return graph.ndata[f'{mask}_mask']
+    return None
+
+def get_graph_labels(graph):
+    if __backend == 'pyg': return graph.y
+    return graph.ndata['label']
 
 def set_seed(seed=None):
     """

From ed6814c46d169130020ec896694a93956db68646 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 11 Oct 2021 09:10:44 +0000
Subject: [PATCH 09/75] adapt graphclf solver

---
 autogl/solver/classifier/graph_classifier.py | 46 +++++++-------------
 autogl/solver/utils.py                       |  7 +++
 2 files changed, 23 insertions(+), 30 deletions(-)

diff --git a/autogl/solver/classifier/graph_classifier.py b/autogl/solver/classifier/graph_classifier.py
index adc318b..8d17857 100644
--- a/autogl/solver/classifier/graph_classifier.py
+++ b/autogl/solver/classifier/graph_classifier.py
@@ -15,7 +15,7 @@ from ...module.feature import FEATURE_DICT
 from ...module.model import BaseModel, MODEL_DICT
 from ...module.train import TRAINER_DICT, get_feval, BaseGraphClassificationTrainer
 from ..base import _initialize_single_model, _parse_hp_space
-from ..utils import LeaderBoard, set_seed
+from ..utils import LeaderBoard, get_dataset_labels, set_seed, get_graph_from_dataset, get_graph_node_features
 from ...datasets import utils
 from ..utils import get_logger
 from ...backend import DependentBackend
@@ -301,17 +301,10 @@ class AutoGraphClassifier(BaseClassifier):
 
         # set up the dataset
         if train_split is None and val_split is None:
-            # Currently, there are no much implementation difference between pyg and dgl on solver
-            # We can use way of hotfix to judge
-            if __backend == 'pyg':
-                assert hasattr(dataset, "train_split") and hasattr(dataset, "val_split"), (
-                    "The dataset has no default train/val split! "
-                    "Please manually pass train and val ratio."
-                )
-            elif __backend == 'dgl':
-                # no available solutions here.
-                # TODO: we cannot judge whether the graph dataset has train/val/test split on dgl.
-                pass
+            assert hasattr(dataset, "train_split") and hasattr(dataset, "val_split"), (
+                "The dataset has no default train/val split! "
+                "Please manually pass train and val ratio."
+            )
             LOGGER.info("Use the default train/val/test ratio in given dataset")
             # if hasattr(dataset.train_split, "n_splits"):
             #    cross_validation = True
@@ -339,25 +332,21 @@ class AutoGraphClassifier(BaseClassifier):
         # check whether the dataset has features.
         # currently we only support graph classification with features.
         
-        if __backend == 'pyg':
-            assert dataset[0].x is not None, (
-                "Does not support fit on non node-feature dataset!"
-                " Please add node features to dataset or specify feature engineers that generate"
-                " node features."
-            )
-        elif __backend == 'dgl':
-            assert 'feat' in dataset[0].ndata['feat'], (
-                "Does not support fit on non node-feature dataset!"
-                " Please add node features to dataset or specify feature engineers that generate"
-                " node features."
-            )
+        feat = get_graph_node_features(get_graph_from_dataset(dataset))
+        assert feat is not None, (
+            "Does not support fit on non node-feature dataset!"
+            " Please add node features to dataset or specify feature engineers that generate"
+            " node features."
+        )
+        num_features = feat.size(-1)
+        num_classes = dataset.num_classes if __backend == 'pyg' else dataset.num_labels
 
         # initialize graph networks
         self._init_graph_module(
             self.gml,
             # TODO: what should we use to get feature dimension?
-            num_features=dataset.num_node_features if __backend == 'pyg' else dataset[0].ndata['feat'].size(-1),
-            num_classes=dataset.num_classes if __backend == 'pyg' else dataset.nclasses,
+            num_features=num_features,
+            num_classes=num_classes,
             feval=evaluator_list,
             device=self.runtime_device,
             loss="cross_entropy" if not hasattr(dataset, "loss") else dataset.loss,
@@ -430,10 +419,7 @@ class AutoGraphClassifier(BaseClassifier):
         if self.ensemble_module is not None:
             performance = self.ensemble_module.fit(
                 result_valid,
-                # TODO: get validation set of graphs
-                dataset.data.y[dataset.val_index].cpu().detach().numpy()
-                if __backend == 'pyg' else
-                dataset.labels[dataset.val_index].cpu().detach().numpy(),
+                get_dataset_labels(dataset)[dataset.val_index].cpu().numpy(),
                 names,
                 evaluator_list,
                 n_classes=dataset.num_classes,
diff --git a/autogl/solver/utils.py b/autogl/solver/utils.py
index 0ed6fc7..51a1555 100644
--- a/autogl/solver/utils.py
+++ b/autogl/solver/utils.py
@@ -6,6 +6,7 @@ Utilities used by the solver
 
 import random
 import typing as _typing
+import torch
 import torch.backends.cudnn
 import numpy as np
 import pandas as pd
@@ -206,6 +207,12 @@ def get_graph_labels(graph):
     if __backend == 'pyg': return graph.y
     return graph.ndata['label']
 
+def get_dataset_labels(dataset):
+    if __backend == 'pyg':
+        return dataset.data.y
+    else:
+        return torch.LongTensor([d[1] for d in dataset])
+
 def set_seed(seed=None):
     """
     Set seed of whole process

From 3a4e88110209db4a3ee3013b444ac974f0adabec Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 11 Oct 2021 10:08:59 +0000
Subject: [PATCH 10/75] add lp solver

---
 autogl/solver/classifier/link_predictor.py | 29 +++++++++-------------
 1 file changed, 12 insertions(+), 17 deletions(-)

diff --git a/autogl/solver/classifier/link_predictor.py b/autogl/solver/classifier/link_predictor.py
index 0b06223..4a4a2f1 100644
--- a/autogl/solver/classifier/link_predictor.py
+++ b/autogl/solver/classifier/link_predictor.py
@@ -16,7 +16,7 @@ from ...module.feature import FEATURE_DICT
 from ...module.model import MODEL_DICT, BaseModel
 from ...module.train import TRAINER_DICT, BaseLinkPredictionTrainer
 from ...module.train import get_feval
-from ..utils import LeaderBoard, set_seed
+from ..utils import LeaderBoard, get_graph_from_dataset, get_graph_node_features, set_seed
 from ...datasets import utils
 from ..utils import get_logger
 from ...backend import DependentBackend
@@ -277,6 +277,8 @@ class AutoLinkPredictor(BaseClassifier):
             {e.get_eval_name(): e.is_higher_better() for e in evaluator_list},
         )
 
+        graph_data = get_graph_from_dataset(dataset)
+
         # set up the dataset
         if train_split is not None and val_split is not None:
             utils.split_edges(dataset, train_split, val_split)
@@ -284,7 +286,7 @@ class AutoLinkPredictor(BaseClassifier):
             if __backend == 'pyg':
                 assert all(
                     [
-                        hasattr(dataset.data, f"{name}")
+                        hasattr(graph_data, f"{name}")
                         for name in [
                             "train_pos_edge_index",
                             "train_neg_adj_mask",
@@ -299,7 +301,7 @@ class AutoLinkPredictor(BaseClassifier):
                     "train and val ratio."
                 )
             elif __backend == 'dgl':
-                assert hasattr(dataset[0], 'edata') and "train_mask" in dataset[0].edata and "val_mask" in dataset[0].edata, (
+                assert hasattr(graph_data, 'edata') and "train_mask" in graph_data.edata and "val_mask" in graph_data.edata, (
                     "The dataset has no default train/val split! Please manually pass "
                     "train and val ratio."
                 )
@@ -315,22 +317,15 @@ class AutoLinkPredictor(BaseClassifier):
         # check whether the dataset has features.
         # currently we only support graph classification with features.
         
-        if __backend == 'pyg':
-            assert dataset[0].x is not None, (
-                "Does not support fit on non node-feature dataset!"
-                " Please add node features to dataset or specify feature engineers that generate"
-                " node features."
-            )
-        elif __backend == 'dgl':
-            # TODO: how can we get features?
-            assert 'feat' in dataset[0].ndata['feat'], (
-                "Does not support fit on non node-feature dataset!"
-                " Please add node features to dataset or specify feature engineers that generate"
-                " node features."
-            )
+        feat = get_graph_node_features(graph_data)
+        assert feat is not None, (
+            "Does not support fit on non node-feature dataset!"
+            " Please add node features to dataset or specify feature engineers that generate"
+            " node features."
+        )
         
         # TODO: how can we get num_features?
-        num_features = self.dataset[0].x.shape[1] if __backend == 'pyg' else self.dataset[0].ndata['feat'].size(-1)
+        num_features = feat.size(-1)
 
         # initialize graph networks
         self._init_graph_module(

From 2fd9237e375914def421a7d2d94fc7d1851f1bbd Mon Sep 17 00:00:00 2001
From: CoreLeader <Core-Leader@outlook.com>
Date: Sat, 16 Oct 2021 05:00:00 +0800
Subject: [PATCH 11/75] Revision for Refactor of Dataset and Feature Engineer

Debug for Default Implementation of GeneralStaticGraph
Debug for OGB nodes datasets
Improvement for feature generators and graph feature extractors to support any generic provided conventional data
---
 ...ral_static_graph_default_implementation.py |   2 +-
 .../utils/conversion/_nx.py                   |   2 +-
 autogl/datasets/_ogb.py                       |  29 ++---
 .../module/feature/_base_feature_engineer.py  | 100 +++++++-----------
 .../feature/_composed_feature_engineer.py     |  37 -------
 autogl/module/feature/_generators/_basic.py   |  80 ++++++--------
 autogl/module/feature/_graph/_netlsd.py       |  65 +++++++++---
 autogl/module/feature/_graph/_networkx.py     |  65 ++++++++++--
 autogl/module/hpo/autone.py                   |   2 +-
 9 files changed, 193 insertions(+), 189 deletions(-)
 delete mode 100644 autogl/module/feature/_composed_feature_engineer.py

diff --git a/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py b/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py
index 469fa9b..b47de07 100644
--- a/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py
@@ -154,7 +154,7 @@ class HeterogeneousNodesContainerImplementation(HeterogeneousNodesContainer):
                 if data.size(0) != obsolete_data.size(0):
                     raise ValueError
             elif len(self.__nodes_data.get(__node_t)) > 0:
-                num_nodes: int = self.__nodes_data.get(__node_t).get(list(self.node_types)[0]).size(0)
+                num_nodes: int = self.__nodes_data[__node_t][list(self.__nodes_data[__node_t].keys())[0]].size(0)
                 if data.size(0) != num_nodes:
                     raise ValueError
             self.__nodes_data[__node_t][data_key] = data
diff --git a/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py b/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py
index 2fa440f..d98cf09 100644
--- a/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py
@@ -61,7 +61,7 @@ class HomogeneousStaticGraphToNetworkX:
                 homogeneous_static_graph.edges.data[data_key].squeeze().tolist()
             )
         for i, (u, v) in enumerate(homogeneous_static_graph.edges.connections.t().tolist()):
-            if (__remove_self_loops and v == u) or (__to_undirected and v > u):
+            if __remove_self_loops and v == u:
                 continue
             g.add_edge(u, v)
             for data_key in edges_data:
diff --git a/autogl/datasets/_ogb.py b/autogl/datasets/_ogb.py
index a4abb26..016fe75 100644
--- a/autogl/datasets/_ogb.py
+++ b/autogl/datasets/_ogb.py
@@ -57,11 +57,11 @@ class _OGBNDatasetUtil(_OGBDatasetUtil):
             homogeneous_static_graph.nodes.data['train_mask'] = index_to_mask(
                 torch.from_numpy(train_index), ogbn_data['num_nodes']
             )
-        if val_index not in (Ellipsis, None) and isinstance(val_index, np.ndarray):
+        if isinstance(val_index, np.ndarray):
             homogeneous_static_graph.nodes.data['val_mask'] = index_to_mask(
                 torch.from_numpy(val_index), ogbn_data['num_nodes']
             )
-        if test_index not in (Ellipsis, None) and isinstance(test_index, np.ndarray):
+        if isinstance(test_index, np.ndarray):
             homogeneous_static_graph.nodes.data['test_mask'] = index_to_mask(
                 torch.from_numpy(test_index), ogbn_data['num_nodes']
             )
@@ -105,8 +105,7 @@ class OGBNProductsDataset(InMemoryStaticGraphSet):
             super(OGBNProductsDataset, self).__init__([
                 _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                     ogbn_dataset, "y",
-                    {"node_feat": "x"},
-                    {"edge_feat": "edge_feat"}
+                    {"node_feat": "x"}
                 )
             ])
 
@@ -119,10 +118,7 @@ class OGBNProteinsDataset(InMemoryStaticGraphSet):
             super(OGBNProteinsDataset, self).__init__([
                 _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                     ogbn_dataset, "label",
-                    {
-                        "node_feat": "feat",
-                        "node_species": "species"
-                    },
+                    {"node_species": "species"},
                     {"edge_feat": "edge_feat"}
                 )
             ])
@@ -130,10 +126,7 @@ class OGBNProteinsDataset(InMemoryStaticGraphSet):
             super(OGBNProteinsDataset, self).__init__([
                 _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                     ogbn_dataset, "y",
-                    {
-                        "node_feat": "x",
-                        "node_species": "species"
-                    },
+                    {"node_species": "species"},
                     {"edge_feat": "edge_feat"}
                 )
             ])
@@ -150,8 +143,7 @@ class OGBNArxivDataset(InMemoryStaticGraphSet):
                     {
                         "node_feat": "feat",
                         "node_year": "year"
-                    },
-                    {"edge_feat": "edge_feat"}
+                    }
                 )
             ])
         elif _backend.DependentBackend.is_pyg():
@@ -161,8 +153,7 @@ class OGBNArxivDataset(InMemoryStaticGraphSet):
                     {
                         "node_feat": "x",
                         "node_year": "year"
-                    },
-                    {"edge_feat": "edge_feat"}
+                    }
                 )
             ])
 
@@ -178,8 +169,7 @@ class OGBNPapers100MDataset(InMemoryStaticGraphSet):
                     {
                         "node_feat": "feat",
                         "node_year": "year"
-                    },
-                    {"edge_feat": "edge_feat"}
+                    }
                 )
             ])
         elif _backend.DependentBackend.is_pyg():
@@ -189,8 +179,7 @@ class OGBNPapers100MDataset(InMemoryStaticGraphSet):
                     {
                         "node_feat": "x",
                         "node_year": "year"
-                    },
-                    {"edge_feat": "edge_feat"}
+                    }
                 )
             ])
 
diff --git a/autogl/module/feature/_base_feature_engineer.py b/autogl/module/feature/_base_feature_engineer.py
index 87031dd..9f77f3e 100644
--- a/autogl/module/feature/_base_feature_engineer.py
+++ b/autogl/module/feature/_base_feature_engineer.py
@@ -1,28 +1,27 @@
 import copy
+import logging
 import torch
 import typing as _typing
-from autogl.data.graph import GeneralStaticGraph
-from autogl.data import InMemoryStaticGraphSet
+from autogl.data import Dataset
 
-from ...utils import get_logger
-
-LOGGER = get_logger("FeatureEngineer")
+LOGGER = logging.getLogger("FeatureEngineer")
 
 
 class _BaseFeatureEngineer:
     def __and__(self, other):
         raise NotImplementedError
 
-    def fit(
-            self, in_memory_static_graph_set: InMemoryStaticGraphSet,
-            inplace: bool = True
-    ):
+    def fit_transform(self, dataset: Dataset, inplace=True) -> Dataset:
+        """
+        Fit and transform dataset inplace or not w.r.t bool argument ``inplace``
+        """
+        dataset = self.fit(dataset)
+        return self.transform(dataset, inplace=inplace)
+
+    def fit(self, dataset: Dataset) -> Dataset:
         raise NotImplementedError
 
-    def transform(
-            self, in_memory_static_graph_set: InMemoryStaticGraphSet,
-            inplace: bool = True
-    ) -> InMemoryStaticGraphSet:
+    def transform(self, dataset: Dataset, inplace: bool = True) -> Dataset:
         raise NotImplementedError
 
 
@@ -42,73 +41,50 @@ class _ComposedFeatureEngineer(_BaseFeatureEngineer):
     def __and__(self, other: _BaseFeatureEngineer):
         return _ComposedFeatureEngineer((self, other))
 
-    def fit(self, in_memory_static_graph_set, inplace: bool = True):
+    def fit(self, dataset) -> Dataset:
         for fe in self.fe_components:
-            fe.fit(in_memory_static_graph_set, inplace)
+            dataset = fe.fit(dataset)
+        return dataset
 
-    def transform(
-            self, in_memory_static_graph_set,
-            inplace: bool = True
-    ):
+    def transform(self, dataset: Dataset, inplace: bool = True) -> Dataset:
         for fe in self.fe_components:
-            in_memory_static_graph_set = fe.transform(
-                in_memory_static_graph_set, inplace
-            )
-        return in_memory_static_graph_set
+            dataset = fe.transform(dataset, inplace)
+        return dataset
 
 
-class BaseFeatureEngineer:
+class BaseFeature(_BaseFeatureEngineer):
     def __init__(self, multi_graph: bool = True, subgraph=False):
         self._multi_graph: bool = multi_graph
 
     def __and__(self, other):
         return _ComposedFeatureEngineer((self, other))
 
-    @classmethod
-    def __reset_graph_set(
-            cls, graphs: _typing.Sequence[GeneralStaticGraph],
-            in_memory_static_graph_set: InMemoryStaticGraphSet
-    ):
-        in_memory_static_graph_set.reset_dataset(graphs)
-
-    def _preprocess(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
-        return static_graph
+    def _preprocess(self, data: _typing.Any) -> _typing.Any:
+        return data
 
-    def _fit(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
-        return static_graph
+    def _fit(self, data: _typing.Any) -> _typing.Any:
+        return data
 
-    def _transform(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
-        return static_graph
+    def _transform(self, data: _typing.Any) -> _typing.Any:
+        return data
 
-    def _postprocess(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
-        return static_graph
+    def _postprocess(self, data: _typing.Any) -> _typing.Any:
+        return data
 
-    def fit(
-            self, in_memory_static_graph_set: InMemoryStaticGraphSet,
-            inplace: bool = True
-    ):
-        if not inplace:
-            in_memory_static_graph_set = copy.deepcopy(in_memory_static_graph_set)
+    def fit(self, dataset: Dataset) -> Dataset:
         with torch.no_grad():
-            __graphs: _typing.Sequence[GeneralStaticGraph] = [
-                self._postprocess(self._transform(self._fit(self._preprocess(g))))
-                for g in in_memory_static_graph_set
-            ]
-            self.__reset_graph_set(__graphs, in_memory_static_graph_set)
-
-    def transform(
-            self, in_memory_static_graph_set: InMemoryStaticGraphSet,
-            inplace: bool = True
-    ) -> InMemoryStaticGraphSet:
+            for i, data in enumerate(dataset):
+                dataset[i] = self._postprocess(self._transform(self._fit(self._preprocess(data))))
+            return dataset
+
+    def transform(self, dataset: Dataset, inplace: bool = True) -> Dataset:
         if not inplace:
-            in_memory_static_graph_set = copy.deepcopy(in_memory_static_graph_set)
+            dataset = copy.deepcopy(dataset)
         with torch.no_grad():
-            __graphs: _typing.Sequence[GeneralStaticGraph] = [
-                self._postprocess(self._transform(self._preprocess(g)))
-                for g in in_memory_static_graph_set
-            ]
-        return in_memory_static_graph_set
+            for i, data in enumerate(dataset):
+                dataset[i] = self._postprocess(self._transform(self._preprocess(data)))
+            return dataset
 
 
-class BaseFeature(BaseFeatureEngineer):
+class BaseFeatureEngineer(BaseFeature):
     ...
diff --git a/autogl/module/feature/_composed_feature_engineer.py b/autogl/module/feature/_composed_feature_engineer.py
deleted file mode 100644
index 1d99198..0000000
--- a/autogl/module/feature/_composed_feature_engineer.py
+++ /dev/null
@@ -1,37 +0,0 @@
-import typing as _typing
-from . import _base_feature_engineer
-
-
-class _ComposedFeatureEngineer(_base_feature_engineer.BaseFeatureEngineer):
-    ...
-
-
-class ComposedFeatureEngineer(_ComposedFeatureEngineer):
-    @property
-    def fe_components(self) -> _typing.Iterable[_base_feature_engineer.BaseFeatureEngineer]:
-        raise NotImplementedError  # todo
-
-    def __init__(self, feature_engineers: _typing.Iterable[_base_feature_engineer.BaseFeatureEngineer]):
-        super(ComposedFeatureEngineer, self).__init__()
-        self.__fe_components: _typing.List[_base_feature_engineer.BaseFeatureEngineer] = []
-        for fe in feature_engineers:
-            if isinstance(fe, ComposedFeatureEngineer):
-                self.__fe_components.extend(fe.fe_components)
-            elif isinstance(fe, _base_feature_engineer.BaseFeatureEngineer):
-                self.__fe_components.append(fe)
-            else:
-                raise TypeError
-
-    def fit(self, in_memory_static_graph_set, inplace: bool = True):
-        for fe in self.fe_components:
-            fe.fit(in_memory_static_graph_set, inplace)
-
-    def transform(
-            self, in_memory_static_graph_set,
-            inplace: bool = True
-    ):
-        for fe in self.fe_components:
-            in_memory_static_graph_set = fe.transform(
-                in_memory_static_graph_set, inplace
-            )
-        return in_memory_static_graph_set
diff --git a/autogl/module/feature/_generators/_basic.py b/autogl/module/feature/_generators/_basic.py
index 674a851..b92866b 100644
--- a/autogl/module/feature/_generators/_basic.py
+++ b/autogl/module/feature/_generators/_basic.py
@@ -7,29 +7,29 @@ from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
 
 
 class BaseFeatureGenerator(BaseFeatureEngineer):
-    def _preprocess(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
-        if not (
-                static_graph.nodes.is_homogeneous and
-                static_graph.edges.is_homogeneous
-        ):
-            raise ValueError("Provided static graph must be homogeneous")
-        else:
-            return static_graph
-
     def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
         raise NotImplementedError
 
-    @classmethod
-    def __to_data(cls, homogeneous_static_graph: GeneralStaticGraph) -> autogl.data.Data:
+    def __transform_homogeneous_static_graph(
+            self, homogeneous_static_graph: GeneralStaticGraph
+    ) -> GeneralStaticGraph:
+        if not (
+                homogeneous_static_graph.nodes.is_homogeneous and
+                homogeneous_static_graph.edges.is_homogeneous
+        ):
+            raise ValueError("Provided static graph must be homogeneous")
         if 'x' in homogeneous_static_graph.nodes.data:
+            feature_key: _typing.Optional[str] = 'x'
             features: _typing.Optional[torch.Tensor] = (
                 homogeneous_static_graph.nodes.data['x']
             )
         elif 'feat' in homogeneous_static_graph.nodes.data:
+            feature_key: _typing.Optional[str] = 'feat'
             features: _typing.Optional[torch.Tensor] = (
                 homogeneous_static_graph.nodes.data['feat']
             )
         else:
+            feature_key: _typing.Optional[str] = None
             features: _typing.Optional[torch.Tensor] = None
         if 'y' in homogeneous_static_graph.nodes.data:
             label: _typing.Optional[torch.Tensor] = (
@@ -57,47 +57,37 @@ class BaseFeatureGenerator(BaseFeatureEngineer):
             x=features, y=label
         )
         setattr(data, "edge_weight", edge_weight)
-        return data
-
-    def _transform(self, homogeneous_static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
-        nodes_features: torch.Tensor = self._extract_nodes_feature(
-            self.__to_data(homogeneous_static_graph)
-        )
-        if not isinstance(nodes_features, torch.Tensor):
-            raise TypeError
-        elif nodes_features.dim() == 0:
-            raise ValueError
-        elif nodes_features.dim() == 1:
-            nodes_features = nodes_features.view(-1, 1)
-        if 'x' in homogeneous_static_graph.nodes.data:
-            x: torch.Tensor = (
-                homogeneous_static_graph.nodes.data['x'].view(-1, 1)
-                if homogeneous_static_graph.nodes.data['x'].dim() == 1
-                else homogeneous_static_graph.nodes.data['x']
-            )
-            assert nodes_features.size(0) == x.size(0)
-            assert nodes_features.dim() == x.dim() == 2
-            homogeneous_static_graph.nodes.data['x'] = torch.cat(
-                [x, nodes_features.to(x.dtype)], dim=-1
-            )
-        elif 'feat' in homogeneous_static_graph.nodes.data:
-            x: torch.Tensor = (
-                homogeneous_static_graph.nodes.data['feat'].view(-1, 1)
-                if homogeneous_static_graph.nodes.data['feat'].dim() == 1
-                else homogeneous_static_graph.nodes.data['feat']
+        extracted_features: torch.Tensor = self._extract_nodes_feature(data)
+        if isinstance(feature_key, str):
+            nodes_features: torch.Tensor = (
+                homogeneous_static_graph.nodes.data[feature_key].view(-1, 1)
+                if homogeneous_static_graph.nodes.data[feature_key].dim() == 1
+                else homogeneous_static_graph.nodes.data[feature_key]
             )
-            assert nodes_features.size(0) == x.size(0)
-            assert nodes_features.dim() == x.dim() == 2
-            homogeneous_static_graph.nodes.data['feat'] = torch.cat(
-                [x, nodes_features.to(x.dtype)], dim=-1
+            assert extracted_features.size(0) == nodes_features.size(0)
+            assert extracted_features.dim() == nodes_features.dim() == 2
+            homogeneous_static_graph.nodes.data[feature_key] = torch.cat(
+                [
+                    nodes_features,
+                    extracted_features.to(nodes_features.device)
+                ],
+                dim=-1
             )
         else:
             if autogl.backend.DependentBackend.is_pyg():
-                homogeneous_static_graph.nodes.data['x'] = nodes_features
+                homogeneous_static_graph.nodes.data['x'] = extracted_features
             elif autogl.backend.DependentBackend.is_dgl():
-                homogeneous_static_graph.nodes.data['feat'] = nodes_features
+                homogeneous_static_graph.nodes.data['feat'] = extracted_features
         return homogeneous_static_graph
 
+    def _transform(self, data: _typing.Any) -> _typing.Any:
+        if isinstance(data, GeneralStaticGraph):
+            return self.__transform_homogeneous_static_graph(data)
+        else:
+            raise NotImplementedError(
+                f"Feature Generator only support instance of {GeneralStaticGraph} as provided data"
+            )
+
 
 @FeatureEngineerUniversalRegistry.register_feature_engineer("OneHot".lower())
 class OneHotFeatureGenerator(BaseFeatureGenerator):
diff --git a/autogl/module/feature/_graph/_netlsd.py b/autogl/module/feature/_graph/_netlsd.py
index a5a6f80..0c94ea2 100644
--- a/autogl/module/feature/_graph/_netlsd.py
+++ b/autogl/module/feature/_graph/_netlsd.py
@@ -1,6 +1,6 @@
 import netlsd
+import networkx
 import torch
-
 from autogl.data.graph import GeneralStaticGraph
 from autogl.data.graph.utils import conversion
 from .._base_feature_engineer import BaseFeatureEngineer
@@ -25,17 +25,58 @@ class NetLSD(BaseFeatureEngineer):
         self.__kwargs = kwargs
         super(NetLSD, self).__init__()
 
-    def _transform(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
-        temp = netlsd.heat(
+    def __extract(self, nx_g: networkx.Graph) -> torch.Tensor:
+        return torch.tensor(netlsd.heat(nx_g, *self.__args, **self.__kwargs)).view(-1)
+
+    def __transform_homogeneous_static_graph(
+            self, homogeneous_static_graph: GeneralStaticGraph
+    ) -> GeneralStaticGraph:
+        if not (
+                homogeneous_static_graph.nodes.is_homogeneous and
+                homogeneous_static_graph.edges.is_homogeneous
+        ):
+            raise ValueError("Provided static graph must be homogeneous")
+        dsc: torch.Tensor = self.__extract(
             conversion.HomogeneousStaticGraphToNetworkX(to_undirected=True).__call__(
-                static_graph, to_undirected=True
-            ),
-            *self.__args, **self.__kwargs
+                homogeneous_static_graph, to_undirected=True
+            )
         )
-        dsc: torch.Tensor = torch.tensor([temp]).view(-1)
-        if 'gf' in static_graph.data:
-            gf = static_graph.data['gf'].view(-1)
-            static_graph.data['gf'] = torch.cat([gf, dsc])
+        if 'gf' in homogeneous_static_graph.data:
+            gf = homogeneous_static_graph.data['gf'].view(-1)
+            homogeneous_static_graph.data['gf'] = torch.cat([gf, dsc])
+        else:
+            homogeneous_static_graph.data['gf'] = dsc
+        return homogeneous_static_graph
+
+    @classmethod
+    def __edge_index_to_nx_graph(cls, edge_index: torch.Tensor) -> networkx.Graph:
+        g: networkx.Graph = networkx.Graph()
+        for u, v in edge_index.t().tolist():
+            if u == v:
+                continue
+            else:
+                g.add_edge(u, v)
+        return g
+
+    def __transform_data(self, data):
+        if not (
+                hasattr(data, "edge_index") and
+                torch.is_tensor(data.edge_index) and
+                isinstance(data.edge_index, torch.Tensor) and
+                data.edge_index.dim() == data.edge_index.size(0) == 2 and
+                data.edge_index.dtype == torch.long
+        ):
+            raise TypeError("Unsupported provided data")
+        dsc: torch.Tensor = self.__extract(self.__edge_index_to_nx_graph(data.edge_index))
+        if hasattr(data, 'gf') and isinstance(data.gf, torch.Tensor):
+            gf = data.gf.view(-1)
+            data.gf = torch.cat([gf, dsc])
+        else:
+            data.gf = dsc
+        return data
+
+    def _transform(self, data):
+        if isinstance(data, GeneralStaticGraph):
+            return self.__transform_homogeneous_static_graph(data)
         else:
-            static_graph.data['gf'] = dsc
-        return static_graph
+            return self.__transform_data(data)
diff --git a/autogl/module/feature/_graph/_networkx.py b/autogl/module/feature/_graph/_networkx.py
index 88ea885..92cb42e 100644
--- a/autogl/module/feature/_graph/_networkx.py
+++ b/autogl/module/feature/_graph/_networkx.py
@@ -28,17 +28,62 @@ class _NetworkXGraphFeatureEngineer(BaseFeatureEngineer):
         self.__feature_extractor: _typing.Callable[[networkx.Graph], _typing.Any] = feature_extractor
         super(_NetworkXGraphFeatureEngineer, self).__init__()
 
-    def _transform(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
-        dsc = self.__feature_extractor(
-            conversion.HomogeneousStaticGraphToNetworkX(to_undirected=True)(static_graph)
-        )
-        dsc: torch.Tensor = torch.tensor([dsc]).view(-1)
-        if 'gf' in static_graph.data:
-            gf = static_graph.data['gf'].view(-1)
-            static_graph.data['gf'] = torch.cat([gf, dsc])
+    def __transform_homogeneous_static_graph(
+            self, homogeneous_static_graph: GeneralStaticGraph
+    ) -> GeneralStaticGraph:
+        if not (
+                homogeneous_static_graph.nodes.is_homogeneous and
+                homogeneous_static_graph.edges.is_homogeneous
+        ):
+            raise ValueError("Provided static graph must be homogeneous")
+        dsc: torch.Tensor = torch.tensor(
+            [
+                self.__feature_extractor(
+                    conversion.HomogeneousStaticGraphToNetworkX(to_undirected=True)(homogeneous_static_graph)
+                )
+            ]
+        ).view(-1)
+        if 'gf' in homogeneous_static_graph.data:
+            gf = homogeneous_static_graph.data['gf'].view(-1)
+            homogeneous_static_graph.data['gf'] = torch.cat([gf, dsc])
         else:
-            static_graph.data['gf'] = dsc
-        return static_graph
+            homogeneous_static_graph.data['gf'] = dsc
+        return homogeneous_static_graph
+
+    @classmethod
+    def __edge_index_to_nx_graph(cls, edge_index: torch.Tensor) -> networkx.Graph:
+        g: networkx.Graph = networkx.Graph()
+        for u, v in edge_index.t().tolist():
+            if u == v:
+                continue
+            else:
+                g.add_edge(u, v)
+        return g
+
+    def __transform_data(self, data):
+        if not (
+                hasattr(data, "edge_index") and
+                torch.is_tensor(data.edge_index) and
+                isinstance(data.edge_index, torch.Tensor) and
+                data.edge_index.dim() == data.edge_index.size(0) == 2 and
+                data.edge_index.dtype == torch.long
+        ):
+            raise TypeError("Unsupported provided data")
+        dsc: torch.Tensor = torch.tensor(
+            [self.__feature_extractor(self.__edge_index_to_nx_graph(data.edge_index))]
+        ).view(-1)
+        if hasattr(data, 'gf') and isinstance(data.gf, torch.Tensor):
+            gf = data.gf.view(-1)
+            data.gf = torch.cat([gf, dsc])
+        else:
+            data.gf = dsc
+        return data
+
+    def _transform(self, data):
+        if isinstance(data, GeneralStaticGraph):
+            return self.__transform_homogeneous_static_graph(data)
+        else:
+            return self.__transform_data(data)
 
 
 @FeatureEngineerUniversalRegistry.register_feature_engineer("NXLargeCliqueSize")
diff --git a/autogl/module/hpo/autone.py b/autogl/module/hpo/autone.py
index bc6d6d8..3f9625c 100644
--- a/autogl/module/hpo/autone.py
+++ b/autogl/module/hpo/autone.py
@@ -12,7 +12,7 @@ from .autone_file import utils
 
 from torch_geometric.data import GraphSAINTRandomWalkSampler
 
-from ..feature.graph import SgNetLSD
+from ..feature import NetLSD as SgNetLSD
 
 from torch_geometric.data import InMemoryDataset
 

From b271df41c3f0e7e67eff5fb8e3601a7c97dfc0f9 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Fri, 15 Oct 2021 12:15:26 +0800
Subject: [PATCH 12/75] node

---
 autogl/module/train/node_classification_full.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/autogl/module/train/node_classification_full.py b/autogl/module/train/node_classification_full.py
index 0a56131..103b6d1 100644
--- a/autogl/module/train/node_classification_full.py
+++ b/autogl/module/train/node_classification_full.py
@@ -229,7 +229,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
             if hasattr(data, "val_mask") and data.val_mask is not None:
                 if type(self.feval) is list:
                     feval = self.feval[0]
-                else:
+                else:branch
                     feval = self.feval
                 val_loss = self.evaluate([data], mask=data.val_mask, feval=feval)
                 if feval.is_higher_better() is True:

From bcb258cbd6db2b1092bae9fb7c919ca15c8e42a2 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 25 Aug 2021 15:35:23 +0800
Subject: [PATCH 13/75] add mask to predict_only

---
 autogl/module/train/link_prediction.py | 12 ++++++++++--
 1 file changed, 10 insertions(+), 2 deletions(-)

diff --git a/autogl/module/train/link_prediction.py b/autogl/module/train/link_prediction.py
index 4020481..eb427a6 100644
--- a/autogl/module/train/link_prediction.py
+++ b/autogl/module/train/link_prediction.py
@@ -243,11 +243,19 @@ class LinkPredictionTrainer(BaseLinkPredictionTrainer):
         res: The result of predicting on the given dataset.
 
         """
+        try:
+            mask = data.test_mask if test_mask is None else test_mask
+        except:
+            mask = None
         data = data.to(self.device)
         self.model.model.eval()
         with torch.no_grad():
-            z = self.model.model.lp_encode(data)
-        return z
+            res = self.model.model.lp_encode(data)
+
+        if mask is None:
+            return res
+        else:
+            return res[mask]
 
     def train(self, dataset, keep_valid_result=True):
         """

From 378df619a0686f6807395e674b3a312c26a41d85 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Mon, 23 Aug 2021 07:34:58 +0000
Subject: [PATCH 14/75] add dgl init for model

---
 autogl/module/model/__init__.py               | 30 +++++++------------
 autogl/module/model/dgl/__init__.py           |  1 +
 autogl/module/model/pyg/__init__.py           | 22 ++++++++++++++
 .../module/model/{ => pyg}/_model_registry.py |  0
 autogl/module/model/{ => pyg}/base.py         |  0
 autogl/module/model/{ => pyg}/gat.py          |  0
 autogl/module/model/{ => pyg}/gcn.py          |  0
 autogl/module/model/{ => pyg}/gin.py          |  0
 autogl/module/model/{ => pyg}/graph_saint.py  |  0
 autogl/module/model/{ => pyg}/graphsage.py    |  0
 autogl/module/model/{ => pyg}/topkpool.py     |  0
 11 files changed, 33 insertions(+), 20 deletions(-)
 create mode 100644 autogl/module/model/dgl/__init__.py
 create mode 100644 autogl/module/model/pyg/__init__.py
 rename autogl/module/model/{ => pyg}/_model_registry.py (100%)
 rename autogl/module/model/{ => pyg}/base.py (100%)
 rename autogl/module/model/{ => pyg}/gat.py (100%)
 rename autogl/module/model/{ => pyg}/gcn.py (100%)
 rename autogl/module/model/{ => pyg}/gin.py (100%)
 rename autogl/module/model/{ => pyg}/graph_saint.py (100%)
 rename autogl/module/model/{ => pyg}/graphsage.py (100%)
 rename autogl/module/model/{ => pyg}/topkpool.py (100%)

diff --git a/autogl/module/model/__init__.py b/autogl/module/model/__init__.py
index 0a816a2..c995d9c 100644
--- a/autogl/module/model/__init__.py
+++ b/autogl/module/model/__init__.py
@@ -1,22 +1,12 @@
-from ._model_registry import MODEL_DICT, ModelUniversalRegistry, register_model
-from .base import BaseModel
-from .topkpool import AutoTopkpool
+import importlib
+import sys
+from ...backend import DependentBackend
 
-# from .graph_sage import AutoSAGE
-from .graphsage import AutoSAGE
-from .graph_saint import GraphSAINTAggregationModel
-from .gcn import AutoGCN
-from .gat import AutoGAT
-from .gin import AutoGIN
+# load corresponding backend of subclass
+def _load_subclass_backend(backend):
+    sub_module = importlib.import_module(f'.{backend.get_backend_name()}', __name__)
+    this = sys.modules[__name__]
+    for api, obj in sub_module.__dict__.items():
+        setattr(this, api, obj)
 
-__all__ = [
-    "ModelUniversalRegistry",
-    "register_model",
-    "BaseModel",
-    "AutoTopkpool",
-    "AutoSAGE",
-    "GraphSAINTAggregationModel",
-    "AutoGCN",
-    "AutoGAT",
-    "AutoGIN",
-]
+_load_subclass_backend(DependentBackend)
diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
new file mode 100644
index 0000000..8b13789
--- /dev/null
+++ b/autogl/module/model/dgl/__init__.py
@@ -0,0 +1 @@
+
diff --git a/autogl/module/model/pyg/__init__.py b/autogl/module/model/pyg/__init__.py
new file mode 100644
index 0000000..0a816a2
--- /dev/null
+++ b/autogl/module/model/pyg/__init__.py
@@ -0,0 +1,22 @@
+from ._model_registry import MODEL_DICT, ModelUniversalRegistry, register_model
+from .base import BaseModel
+from .topkpool import AutoTopkpool
+
+# from .graph_sage import AutoSAGE
+from .graphsage import AutoSAGE
+from .graph_saint import GraphSAINTAggregationModel
+from .gcn import AutoGCN
+from .gat import AutoGAT
+from .gin import AutoGIN
+
+__all__ = [
+    "ModelUniversalRegistry",
+    "register_model",
+    "BaseModel",
+    "AutoTopkpool",
+    "AutoSAGE",
+    "GraphSAINTAggregationModel",
+    "AutoGCN",
+    "AutoGAT",
+    "AutoGIN",
+]
diff --git a/autogl/module/model/_model_registry.py b/autogl/module/model/pyg/_model_registry.py
similarity index 100%
rename from autogl/module/model/_model_registry.py
rename to autogl/module/model/pyg/_model_registry.py
diff --git a/autogl/module/model/base.py b/autogl/module/model/pyg/base.py
similarity index 100%
rename from autogl/module/model/base.py
rename to autogl/module/model/pyg/base.py
diff --git a/autogl/module/model/gat.py b/autogl/module/model/pyg/gat.py
similarity index 100%
rename from autogl/module/model/gat.py
rename to autogl/module/model/pyg/gat.py
diff --git a/autogl/module/model/gcn.py b/autogl/module/model/pyg/gcn.py
similarity index 100%
rename from autogl/module/model/gcn.py
rename to autogl/module/model/pyg/gcn.py
diff --git a/autogl/module/model/gin.py b/autogl/module/model/pyg/gin.py
similarity index 100%
rename from autogl/module/model/gin.py
rename to autogl/module/model/pyg/gin.py
diff --git a/autogl/module/model/graph_saint.py b/autogl/module/model/pyg/graph_saint.py
similarity index 100%
rename from autogl/module/model/graph_saint.py
rename to autogl/module/model/pyg/graph_saint.py
diff --git a/autogl/module/model/graphsage.py b/autogl/module/model/pyg/graphsage.py
similarity index 100%
rename from autogl/module/model/graphsage.py
rename to autogl/module/model/pyg/graphsage.py
diff --git a/autogl/module/model/topkpool.py b/autogl/module/model/pyg/topkpool.py
similarity index 100%
rename from autogl/module/model/topkpool.py
rename to autogl/module/model/pyg/topkpool.py

From 0ede0c376a7c33e1906a26e20266d808ed486887 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Mon, 23 Aug 2021 07:57:34 +0000
Subject: [PATCH 15/75] fixed minor issue in model/pyg

---
 autogl/module/model/pyg/gat.py       | 2 +-
 autogl/module/model/pyg/gcn.py       | 2 +-
 autogl/module/model/pyg/gin.py       | 2 +-
 autogl/module/model/pyg/graphsage.py | 2 +-
 autogl/module/model/pyg/topkpool.py  | 2 +-
 5 files changed, 5 insertions(+), 5 deletions(-)

diff --git a/autogl/module/model/pyg/gat.py b/autogl/module/model/pyg/gat.py
index 07e7800..d153685 100644
--- a/autogl/module/model/pyg/gat.py
+++ b/autogl/module/model/pyg/gat.py
@@ -3,7 +3,7 @@ import torch.nn.functional as F
 from torch_geometric.nn import GATConv
 from . import register_model
 from .base import BaseModel, activate_func
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("GATModel")
 
diff --git a/autogl/module/model/pyg/gcn.py b/autogl/module/model/pyg/gcn.py
index af6671b..30bc1a7 100644
--- a/autogl/module/model/pyg/gcn.py
+++ b/autogl/module/model/pyg/gcn.py
@@ -6,7 +6,7 @@ from torch_geometric.nn.conv import GCNConv
 import autogl.data
 from . import register_model
 from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("GCNModel")
 
diff --git a/autogl/module/model/pyg/gin.py b/autogl/module/model/pyg/gin.py
index 6ea4390..52a495a 100644
--- a/autogl/module/model/pyg/gin.py
+++ b/autogl/module/model/pyg/gin.py
@@ -6,7 +6,7 @@ from torch.nn import BatchNorm1d
 from . import register_model
 from .base import BaseModel, activate_func
 from copy import deepcopy
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("GINModel")
 
diff --git a/autogl/module/model/pyg/graphsage.py b/autogl/module/model/pyg/graphsage.py
index 3b63baf..6cf5a17 100644
--- a/autogl/module/model/pyg/graphsage.py
+++ b/autogl/module/model/pyg/graphsage.py
@@ -6,7 +6,7 @@ import torch.nn.functional
 import autogl.data
 from . import register_model
 from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("SAGEModel")
 
diff --git a/autogl/module/model/pyg/topkpool.py b/autogl/module/model/pyg/topkpool.py
index 9fd64ef..c1872bd 100644
--- a/autogl/module/model/pyg/topkpool.py
+++ b/autogl/module/model/pyg/topkpool.py
@@ -4,7 +4,7 @@ from torch_geometric.nn import GraphConv, TopKPooling
 from torch_geometric.nn import global_mean_pool as gap, global_max_pool as gmp
 from . import register_model
 from .base import BaseModel, activate_func
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("TopkModel")
 

From 526e1edddb2ae3e6df758a4498d6bb3d3bf0daa0 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Mon, 23 Aug 2021 08:40:10 +0000
Subject: [PATCH 16/75] add glf example (dgl)

---
 autogl/module/model/dgl/__init__.py        |  23 ++
 autogl/module/model/dgl/_model_registry.py |  28 ++
 autogl/module/model/dgl/base.py            | 413 +++++++++++++++++++++
 autogl/module/model/dgl/dataloader_gin.py  |  85 +++++
 autogl/module/model/dgl/gat.py             | 223 +++++++++++
 autogl/module/model/dgl/gcn.py             | 408 ++++++++++++++++++++
 autogl/module/model/dgl/gin.py             | 232 ++++++++++++
 autogl/module/model/dgl/gin_dgl.py         | 171 +++++++++
 autogl/module/model/dgl/ginparser.py       |  81 ++++
 autogl/module/model/dgl/graph_saint.py     | 407 ++++++++++++++++++++
 autogl/module/model/dgl/graphsage.py       | 306 +++++++++++++++
 autogl/module/model/dgl/topkpool.py        | 169 +++++++++
 test/model_glf/gclf_dgl.py                 | 176 +++++++++
 13 files changed, 2722 insertions(+)
 create mode 100644 autogl/module/model/dgl/_model_registry.py
 create mode 100644 autogl/module/model/dgl/base.py
 create mode 100644 autogl/module/model/dgl/dataloader_gin.py
 create mode 100644 autogl/module/model/dgl/gat.py
 create mode 100644 autogl/module/model/dgl/gcn.py
 create mode 100644 autogl/module/model/dgl/gin.py
 create mode 100644 autogl/module/model/dgl/gin_dgl.py
 create mode 100644 autogl/module/model/dgl/ginparser.py
 create mode 100644 autogl/module/model/dgl/graph_saint.py
 create mode 100644 autogl/module/model/dgl/graphsage.py
 create mode 100644 autogl/module/model/dgl/topkpool.py
 create mode 100644 test/model_glf/gclf_dgl.py

diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index 8b13789..7a45f5e 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -1 +1,24 @@
+from ._model_registry import MODEL_DICT, ModelUniversalRegistry, register_model
+from .base import BaseModel
+from .topkpool import AutoTopkpool
 
+# from .graph_sage import AutoSAGE
+from .graphsage import AutoSAGE
+from .graph_saint import GraphSAINTAggregationModel
+from .gcn import AutoGCN
+from .gat import AutoGAT
+from .gin import AutoGIN
+from .gin_dgl import GIN
+
+__all__ = [
+    "ModelUniversalRegistry",
+    "register_model",
+    "BaseModel",
+    "AutoTopkpool",
+    "AutoSAGE",
+    "GraphSAINTAggregationModel",
+    "AutoGCN",
+    "AutoGAT",
+    "AutoGIN",
+    "GIN",
+]
diff --git a/autogl/module/model/dgl/_model_registry.py b/autogl/module/model/dgl/_model_registry.py
new file mode 100644
index 0000000..14aa2d9
--- /dev/null
+++ b/autogl/module/model/dgl/_model_registry.py
@@ -0,0 +1,28 @@
+import typing as _typing
+from .base import BaseModel
+
+MODEL_DICT: _typing.Dict[str, _typing.Type[BaseModel]] = {}
+
+
+def register_model(name):
+    def register_model_cls(cls):
+        if name in MODEL_DICT:
+            raise ValueError("Cannot register duplicate trainer ({})".format(name))
+        if not issubclass(cls, BaseModel):
+            raise ValueError(
+                "Trainer ({}: {}) must extend BaseModel".format(name, cls.__name__)
+            )
+        MODEL_DICT[name] = cls
+        return cls
+
+    return register_model_cls
+
+
+class ModelUniversalRegistry:
+    @classmethod
+    def get_model(cls, name: str) -> _typing.Type[BaseModel]:
+        if type(name) != str:
+            raise TypeError
+        if name not in MODEL_DICT:
+            raise KeyError
+        return MODEL_DICT.get(name)
diff --git a/autogl/module/model/dgl/base.py b/autogl/module/model/dgl/base.py
new file mode 100644
index 0000000..99f2c2c
--- /dev/null
+++ b/autogl/module/model/dgl/base.py
@@ -0,0 +1,413 @@
+"""
+auto graph model
+a list of models with their hyper parameters
+NOTE: neural architecture search (NAS) maybe included here
+"""
+import copy
+import logging
+import typing as _typing
+import torch
+import torch.nn.functional as F
+from copy import deepcopy
+
+base_approach_logger: logging.Logger = logging.getLogger("BaseModel")
+
+
+def activate_func(x, func):
+    if func == "tanh":
+        return torch.tanh(x)
+    elif hasattr(F, func):
+        return getattr(F, func)(x)
+    elif func == "":
+        pass
+    else:
+        raise TypeError("PyTorch does not support activation function {}".format(func))
+
+    return x
+
+
+class BaseModel:
+    def __init__(self, init=False, *args, **kwargs):
+        super(BaseModel, self).__init__()
+
+    def get_hyper_parameter(self):
+        return deepcopy(self.hyperparams)
+
+    @property
+    def hyper_parameter_space(self):
+        return self.space
+
+    @hyper_parameter_space.setter
+    def hyper_parameter_space(self, space):
+        self.space = space
+
+    def initialize(self):
+        pass
+
+    def forward(self):
+        pass
+
+    def to(self, device):
+        if isinstance(device, (str, torch.device)):
+            self.device = device
+        if (
+            hasattr(self, "model")
+            and self.model is not None
+            and isinstance(self.model, torch.nn.Module)
+        ):
+            self.model.to(self.device)
+        return self
+
+    def from_hyper_parameter(self, hp):
+        ret_self = self.__class__(
+            num_features=self.num_features,
+            num_classes=self.num_classes,
+            device=self.device,
+            init=False,
+        )
+        ret_self.hyperparams.update(hp)
+        ret_self.params.update(self.params)
+        ret_self.initialize()
+        return ret_self
+
+    def get_num_classes(self):
+        return self.num_classes
+
+    def set_num_classes(self, num_classes):
+        self.num_classes = num_classes
+        self.params["num_class"] = num_classes
+
+    def get_num_features(self):
+        return self.num_features
+
+    def set_num_features(self, num_features):
+        self.num_features = num_features
+        self.params["features_num"] = self.num_features
+
+    def set_num_graph_features(self, num_graph_features):
+        assert hasattr(
+            self, "num_graph_features"
+        ), "Cannot set graph features for tasks other than graph classification"
+        self.num_graph_features = num_graph_features
+        self.params["num_graph_features"] = num_graph_features
+
+
+class _BaseBaseModel:
+    # todo: after renaming the experimental base class _BaseModel to BaseModel,
+    #       rename this class to _BaseModel
+    """
+    The base class for class BaseModel,
+    designed to implement some basic functionality of BaseModel.
+    --  Designed by ZiXin Sun
+    """
+
+    @classmethod
+    def __formulate_device(
+        cls, device: _typing.Union[str, torch.device] = ...
+    ) -> torch.device:
+        if type(device) == torch.device or (
+            type(device) == str and device.strip().lower() != "auto"
+        ):
+            return torch.device(device)
+        elif torch.cuda.is_available() and torch.cuda.device_count() > 0:
+            return torch.device("cuda")
+        else:
+            return torch.device("cpu")
+
+    @property
+    def device(self) -> torch.device:
+        return self.__device
+
+    @device.setter
+    def device(self, __device: _typing.Union[str, torch.device, None]):
+        self.__device: torch.device = self.__formulate_device(__device)
+
+    @property
+    def model(self) -> _typing.Optional[torch.nn.Module]:
+        if self._model is None:
+            base_approach_logger.debug(
+                "property of model NOT initialized before accessing"
+            )
+        return self._model
+
+    @model.setter
+    def model(self, _model: torch.nn.Module) -> None:
+        if not isinstance(_model, torch.nn.Module):
+            raise TypeError(
+                "the property of model MUST be an instance of " "torch.nn.Module"
+            )
+        self._model = _model
+
+    def _initialize(self):
+        raise NotImplementedError
+
+    def initialize(self) -> bool:
+        """
+        Initialize the model in case that the model has NOT been initialized
+        :return: whether self._initialize() method called
+        """
+        if not self.__is_initialized:
+            self._initialize()
+            self.__is_initialized = True
+            return True
+        return False
+
+    # def to(self, *args, **kwargs):
+    #     """
+    #     Due to the signature of to() method in class BaseApproach
+    #     is inconsistent with the signature of the method
+    #     in the base class torch.nn.Module,
+    #     this intermediate overridden method is necessary to
+    #     walk around (bypass) the inspection for
+    #     signature of overriding method.
+    #     :param args: positional arguments list
+    #     :param kwargs: keyword arguments dict
+    #     :return: self
+    #     """
+    #     return super(_BaseBaseModel, self).to(*args, **kwargs)
+
+    def forward(self, *args, **kwargs):
+        if self.model is not None and isinstance(self.model, torch.nn.Module):
+            return self.model(*args, **kwargs)
+        else:
+            raise NotImplementedError
+
+    def __init__(
+        self,
+        model: _typing.Optional[torch.nn.Module] = None,
+        initialize: bool = False,
+        device: _typing.Union[str, torch.device] = ...,
+    ):
+        if type(initialize) != bool:
+            raise TypeError
+        super(_BaseBaseModel, self).__init__()
+        self.__device: torch.device = self.__formulate_device(device)
+        self._model: _typing.Optional[torch.nn.Module] = model
+        self.__is_initialized: bool = False
+        if initialize:
+            self.initialize()
+
+
+class _BaseModel(_BaseBaseModel, BaseModel):
+    """
+    The upcoming root base class for Model, i.e. BaseModel
+    --  Designed by ZiXin Sun
+    """
+
+    # todo: Deprecate and remove the legacy class "BaseModel",
+    #       then rename this class to "BaseModel",
+    #       correspondingly, this class will no longer extend
+    #       the legacy class "BaseModel" after the removal.
+    def _initialize(self):
+        raise NotImplementedError
+
+    def to(self, device: torch.device):
+        self.device = device
+        if self.model is not None and isinstance(self.model, torch.nn.Module):
+            self.model.to(self.device)
+        return super().to(device)
+
+    @property
+    def space(self) -> _typing.Sequence[_typing.Dict[str, _typing.Any]]:
+        # todo: deprecate and remove in future major version
+        return self.__hyper_parameter_space
+
+    @property
+    def hyper_parameter_space(self):
+        return self.__hyper_parameter_space
+
+    @hyper_parameter_space.setter
+    def hyper_parameter_space(
+        self, space: _typing.Sequence[_typing.Dict[str, _typing.Any]]
+    ):
+        self.__hyper_parameter_space = space
+
+    @property
+    def hyper_parameter(self) -> _typing.Dict[str, _typing.Any]:
+        return self.__hyper_parameter
+
+    @hyper_parameter.setter
+    def hyper_parameter(self, _hyper_parameter: _typing.Dict[str, _typing.Any]):
+        if not isinstance(_hyper_parameter, dict):
+            raise TypeError
+        self.__hyper_parameter = _hyper_parameter
+
+    def get_hyper_parameter(self) -> _typing.Dict[str, _typing.Any]:
+        """
+        todo: consider deprecating this trivial getter method in the future
+        :return: copied hyper parameter
+        """
+        return copy.deepcopy(self.__hyper_parameter)
+
+    def __init__(
+        self,
+        model: _typing.Optional[torch.nn.Module] = None,
+        initialize: bool = False,
+        hyper_parameter_space: _typing.Sequence[_typing.Any] = ...,
+        hyper_parameter: _typing.Dict[str, _typing.Any] = ...,
+        device: _typing.Union[str, torch.device] = ...,
+    ):
+        if type(initialize) != bool:
+            raise TypeError
+        super(_BaseModel, self).__init__(model, initialize, device)
+        if hyper_parameter_space != Ellipsis and isinstance(
+            hyper_parameter_space, _typing.Sequence
+        ):
+            self.__hyper_parameter_space: _typing.Sequence[
+                _typing.Dict[str, _typing.Any]
+            ] = hyper_parameter_space
+        else:
+            self.__hyper_parameter_space: _typing.Sequence[
+                _typing.Dict[str, _typing.Any]
+            ] = []
+        if hyper_parameter != Ellipsis and isinstance(hyper_parameter, dict):
+            self.__hyper_parameter: _typing.Dict[str, _typing.Any] = hyper_parameter
+        else:
+            self.__hyper_parameter: _typing.Dict[str, _typing.Any] = {}
+
+    def from_hyper_parameter(self, hyper_parameter: _typing.Dict[str, _typing.Any]):
+        raise NotImplementedError
+
+
+class ClassificationModel(_BaseModel):
+    def _initialize(self):
+        raise NotImplementedError
+
+    def from_hyper_parameter(
+        self, hyper_parameter: _typing.Dict[str, _typing.Any]
+    ) -> "ClassificationModel":
+        new_model: ClassificationModel = self.__class__(
+            num_features=self.num_features,
+            num_classes=self.num_classes,
+            device=self.device,
+            init=False,
+        )
+        _hyper_parameter = self.hyper_parameter
+        _hyper_parameter.update(hyper_parameter)
+        new_model.hyper_parameter = _hyper_parameter
+        new_model.initialize()
+        return new_model
+
+    def __init__(
+        self,
+        num_features: int = ...,
+        num_classes: int = ...,
+        num_graph_features: int = ...,
+        device: _typing.Union[str, torch.device] = ...,
+        hyper_parameter_space: _typing.Sequence[_typing.Any] = ...,
+        hyper_parameter: _typing.Dict[str, _typing.Any] = ...,
+        init: bool = False,
+        **kwargs
+    ):
+        if "initialize" in kwargs:
+            del kwargs["initialize"]
+        super(ClassificationModel, self).__init__(
+            initialize=init,
+            hyper_parameter_space=hyper_parameter_space,
+            hyper_parameter=hyper_parameter,
+            device=device,
+            **kwargs
+        )
+        if num_classes != Ellipsis and type(num_classes) == int:
+            self.__num_classes: int = num_classes if num_classes > 0 else 0
+        else:
+            self.__num_classes: int = 0
+        if num_features != Ellipsis and type(num_features) == int:
+            self.__num_features: int = num_features if num_features > 0 else 0
+        else:
+            self.__num_features: int = 0
+        if num_graph_features != Ellipsis and type(num_graph_features) == int:
+            if num_graph_features > 0:
+                self.__num_graph_features: int = num_graph_features
+            else:
+                self.__num_graph_features: int = 0
+        else:
+            self.__num_graph_features: int = 0
+
+    def __repr__(self) -> str:
+        import yaml
+
+        return yaml.dump(self.hyper_parameter)
+
+    @property
+    def num_classes(self) -> int:
+        return self.__num_classes
+
+    @num_classes.setter
+    def num_classes(self, __num_classes: int):
+        if type(__num_classes) != int:
+            raise TypeError
+        if not __num_classes > 0:
+            raise ValueError
+        self.__num_classes = __num_classes if __num_classes > 0 else 0
+
+    @property
+    def num_features(self) -> int:
+        return self.__num_features
+
+    @num_features.setter
+    def num_features(self, __num_features: int):
+        if type(__num_features) != int:
+            raise TypeError
+        if not __num_features > 0:
+            raise ValueError
+        self.__num_features = __num_features if __num_features > 0 else 0
+
+    def get_num_classes(self) -> int:
+        # todo: consider replacing with property with getter and setter
+        return self.__num_classes
+
+    def set_num_classes(self, num_classes: int) -> None:
+        # todo: consider replacing with property with getter and setter
+        if type(num_classes) != int:
+            raise TypeError
+        self.__num_classes = num_classes if num_classes > 0 else 0
+
+    def get_num_features(self) -> int:
+        # todo: consider replacing with property with getter and setter
+        return self.__num_features
+
+    def set_num_features(self, num_features: int):
+        # todo: consider replacing with property with getter and setter
+        if type(num_features) != int:
+            raise TypeError
+        self.__num_features = num_features if num_features > 0 else 0
+
+    def set_num_graph_features(self, num_graph_features: int):
+        # todo: consider replacing with property with getter and setter
+        if type(num_graph_features) != int:
+            raise TypeError
+        else:
+            if num_graph_features > 0:
+                self.__num_graph_features = num_graph_features
+            else:
+                self.__num_graph_features = 0
+
+
+class _ClassificationModel(torch.nn.Module):
+    def __init__(self):
+        super(_ClassificationModel, self).__init__()
+
+    def cls_encode(self, data) -> torch.Tensor:
+        raise NotImplementedError
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        raise NotImplementedError
+
+    def cls_forward(self, data) -> torch.Tensor:
+        return self.cls_decode(self.cls_encode(data))
+
+
+class ClassificationSupportedSequentialModel(_ClassificationModel):
+    def __init__(self):
+        super(ClassificationSupportedSequentialModel, self).__init__()
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        raise NotImplementedError
+
+    def cls_encode(self, data) -> torch.Tensor:
+        raise NotImplementedError
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        raise NotImplementedError
diff --git a/autogl/module/model/dgl/dataloader_gin.py b/autogl/module/model/dgl/dataloader_gin.py
new file mode 100644
index 0000000..0721b3a
--- /dev/null
+++ b/autogl/module/model/dgl/dataloader_gin.py
@@ -0,0 +1,85 @@
+"""
+PyTorch compatible dataloader
+"""
+
+
+import math
+import numpy as np
+import torch
+from torch.utils.data.sampler import SubsetRandomSampler
+from sklearn.model_selection import StratifiedKFold
+import dgl
+from dgl.dataloading import GraphDataLoader
+
+
+class GINDataLoader():
+    def __init__(self,
+                 dataset,
+                 batch_size,
+                 device,
+                 collate_fn=None,
+                 seed=0,
+                 shuffle=True,
+                 split_name='fold10',
+                 fold_idx=0,
+                 split_ratio=0.7):
+
+        self.shuffle = shuffle
+        self.seed = seed
+        self.kwargs = {'pin_memory': True} if 'cuda' in device.type else {}
+
+        labels = [l for _, l in dataset]
+
+        if split_name == 'fold10':
+            train_idx, valid_idx = self._split_fold10(
+                labels, fold_idx, seed, shuffle)
+        elif split_name == 'rand':
+            train_idx, valid_idx = self._split_rand(
+                labels, split_ratio, seed, shuffle)
+        else:
+            raise NotImplementedError()
+
+        train_sampler = SubsetRandomSampler(train_idx)
+        valid_sampler = SubsetRandomSampler(valid_idx)
+
+        self.train_loader = GraphDataLoader(
+            dataset, sampler=train_sampler,
+            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
+        self.valid_loader = GraphDataLoader(
+            dataset, sampler=valid_sampler,
+            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
+
+    def train_valid_loader(self):
+        return self.train_loader, self.valid_loader
+
+    def _split_fold10(self, labels, fold_idx=0, seed=0, shuffle=True):
+        ''' 10 flod '''
+        assert 0 <= fold_idx and fold_idx < 10, print(
+            "fold_idx must be from 0 to 9.")
+
+        skf = StratifiedKFold(n_splits=10, shuffle=shuffle, random_state=seed)
+        idx_list = []
+        for idx in skf.split(np.zeros(len(labels)), labels):    # split(x, y)
+            idx_list.append(idx)
+        train_idx, valid_idx = idx_list[fold_idx]
+
+        print(
+            "train_set : test_set = %d : %d",
+            len(train_idx), len(valid_idx))
+
+        return train_idx, valid_idx
+
+    def _split_rand(self, labels, split_ratio=0.7, seed=0, shuffle=True):
+        num_entries = len(labels)
+        indices = list(range(num_entries))
+        np.random.seed(seed)
+        np.random.shuffle(indices)
+        split = int(math.floor(split_ratio * num_entries))
+        train_idx, valid_idx = indices[:split], indices[split:]
+
+        print(
+            "train_set : test_set = %d : %d",
+            len(train_idx), len(valid_idx))
+
+        return train_idx, valid_idx
+
diff --git a/autogl/module/model/dgl/gat.py b/autogl/module/model/dgl/gat.py
new file mode 100644
index 0000000..d153685
--- /dev/null
+++ b/autogl/module/model/dgl/gat.py
@@ -0,0 +1,223 @@
+import torch
+import torch.nn.functional as F
+from torch_geometric.nn import GATConv
+from . import register_model
+from .base import BaseModel, activate_func
+from ....utils import get_logger
+
+LOGGER = get_logger("GATModel")
+
+
+def set_default(args, d):
+    for k, v in d.items():
+        if k not in args:
+            args[k] = v
+    return args
+
+
+class GAT(torch.nn.Module):
+    def __init__(self, args):
+        super(GAT, self).__init__()
+        self.args = args
+        self.num_layer = int(self.args["num_layers"])
+
+        missing_keys = list(
+            set(
+                [
+                    "features_num",
+                    "num_class",
+                    "num_layers",
+                    "hidden",
+                    "heads",
+                    "dropout",
+                    "act",
+                ]
+            )
+            - set(self.args.keys())
+        )
+        if len(missing_keys) > 0:
+            raise Exception("Missing keys: %s." % ",".join(missing_keys))
+
+        if not self.num_layer == len(self.args["hidden"]) + 1:
+            LOGGER.warn("Warning: layer size does not match the length of hidden units")
+        self.convs = torch.nn.ModuleList()
+        self.convs.append(
+            GATConv(
+                self.args["features_num"],
+                self.args["hidden"][0],
+                heads=self.args["heads"],
+                dropout=self.args["dropout"],
+            )
+        )
+        last_dim = self.args["hidden"][0] * self.args["heads"]
+        for i in range(self.num_layer - 2):
+            self.convs.append(
+                GATConv(
+                    last_dim,
+                    self.args["hidden"][i + 1],
+                    heads=self.args["heads"],
+                    dropout=self.args["dropout"],
+                )
+            )
+            last_dim = self.args["hidden"][i + 1] * self.args["heads"]
+        self.convs.append(
+            GATConv(
+                last_dim,
+                self.args["num_class"],
+                heads=1,
+                concat=False,
+                dropout=self.args["dropout"],
+            )
+        )
+
+    def forward(self, data):
+        try:
+            x = data.x
+        except:
+            print("no x")
+            pass
+        try:
+            edge_index = data.edge_index
+        except:
+            print("no index")
+            pass
+        try:
+            edge_weight = data.edge_weight
+        except:
+            edge_weight = None
+            pass
+
+        for i in range(self.num_layer):
+            x = F.dropout(x, p=self.args["dropout"], training=self.training)
+            x = self.convs[i](x, edge_index, edge_weight)
+            if i != self.num_layer - 1:
+                x = activate_func(x, self.args["act"])
+
+        return F.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x = data.x
+        for i in range(self.num_layer - 1):
+            x = self.convs[i](x, data.train_pos_edge_index)
+            if i != self.num_layer - 2:
+                x = activate_func(x, self.args["act"])
+                # x = F.dropout(x, p=self.args["dropout"], training=self.training)
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("gat")
+class AutoGAT(BaseModel):
+    r"""
+    AutoGAT. The model used in this automodel is GAT, i.e., the graph attentional network from the `"Graph Attention Networks"
+    <https://arxiv.org/abs/1710.10903>`_ paper. The layer is
+
+    .. math::
+        \mathbf{x}^{\prime}_i = \alpha_{i,i}\mathbf{\Theta}\mathbf{x}_{i} +
+        \sum_{j \in \mathcal{N}(i)} \alpha_{i,j}\mathbf{\Theta}\mathbf{x}_{j}
+
+    where the attention coefficients :math:`\alpha_{i,j}` are computed as
+
+    .. math::
+        \alpha_{i,j} =
+        \frac{
+        \exp\left(\mathrm{LeakyReLU}\left(\mathbf{a}^{\top}
+        [\mathbf{\Theta}\mathbf{x}_i \, \Vert \, \mathbf{\Theta}\mathbf{x}_j]
+        \right)\right)}
+        {\sum_{k \in \mathcal{N}(i) \cup \{ i \}}
+        \exp\left(\mathrm{LeakyReLU}\left(\mathbf{a}^{\top}
+        [\mathbf{\Theta}\mathbf{x}_i \, \Vert \, \mathbf{\Theta}\mathbf{x}_k]
+        \right)\right)}.
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+
+    args: Other parameters.
+    """
+
+    def __init__(
+        self, num_features=None, num_classes=None, device=None, init=False, **args
+    ):
+        super(AutoGAT, self).__init__()
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [64, 64, 64],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "heads",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,4,8,16",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+        ]
+
+        self.hyperparams = {
+            "num_layers": 2,
+            "hidden": [32],
+            "heads": 4,
+            "dropout": 0.2,
+            "act": "leaky_relu",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        # """Initialize model."""
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GAT({**self.params, **self.hyperparams}).to(self.device)
diff --git a/autogl/module/model/dgl/gcn.py b/autogl/module/model/dgl/gcn.py
new file mode 100644
index 0000000..30bc1a7
--- /dev/null
+++ b/autogl/module/model/dgl/gcn.py
@@ -0,0 +1,408 @@
+import torch
+import torch.nn.functional
+import typing as _typing
+
+from torch_geometric.nn.conv import GCNConv
+import autogl.data
+from . import register_model
+from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
+from ....utils import get_logger
+
+LOGGER = get_logger("GCNModel")
+
+
+class GCN(ClassificationSupportedSequentialModel):
+    class _GCNLayer(torch.nn.Module):
+        def __init__(
+            self,
+            input_channels: int,
+            output_channels: int,
+            add_self_loops: bool = True,
+            normalize: bool = True,
+            activation_name: _typing.Optional[str] = ...,
+            dropout_probability: _typing.Optional[float] = ...,
+        ):
+            super().__init__()
+            self._convolution: GCNConv = GCNConv(
+                input_channels,
+                output_channels,
+                add_self_loops=bool(add_self_loops),
+                normalize=bool(normalize),
+            )
+            if (
+                activation_name is not Ellipsis
+                and activation_name is not None
+                and type(activation_name) == str
+            ):
+                self._activation_name: _typing.Optional[str] = activation_name
+            else:
+                self._activation_name: _typing.Optional[str] = None
+            if (
+                dropout_probability is not Ellipsis
+                and dropout_probability is not None
+                and type(dropout_probability) == float
+            ):
+                if dropout_probability < 0:
+                    dropout_probability = 0
+                if dropout_probability > 1:
+                    dropout_probability = 1
+                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
+                    dropout_probability
+                )
+            else:
+                self._dropout: _typing.Optional[torch.nn.Dropout] = None
+
+        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
+            x: torch.Tensor = getattr(data, "x")
+            edge_index: torch.LongTensor = getattr(data, "edge_index")
+            edge_weight: _typing.Optional[torch.Tensor] = getattr(
+                data, "edge_weight", None
+            )
+            """ Validate the arguments """
+            if not type(x) == type(edge_index) == torch.Tensor:
+                raise TypeError
+            if edge_weight is not None and (
+                type(edge_weight) != torch.Tensor
+                or edge_index.size() != (2, edge_weight.size(0))
+            ):
+                edge_weight: _typing.Optional[torch.Tensor] = None
+
+            x: torch.Tensor = self._convolution.forward(x, edge_index, edge_weight)
+            if self._activation_name is not None and enable_activation:
+                x: torch.Tensor = activate_func(x, self._activation_name)
+            if self._dropout is not None:
+                x: torch.Tensor = self._dropout.forward(x)
+            return x
+
+    def __init__(
+        self,
+        num_features: int,
+        num_classes: int,
+        hidden_features: _typing.Sequence[int],
+        activation_name: str,
+        dropout: _typing.Union[
+            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
+        ] = None,
+        add_self_loops: bool = True,
+        normalize: bool = True,
+    ):
+        if isinstance(dropout, _typing.Sequence):
+            if len(dropout) != len(hidden_features) + 1:
+                raise TypeError(
+                    "When the dropout argument is a sequence, "
+                    "The sequence length must equal to the number of layers to construct."
+                )
+            for _dropout in dropout:
+                if _dropout is not None and type(_dropout) != float:
+                    raise TypeError(
+                        "When the dropout argument is a sequence, "
+                        "every item in the sequence must be float or None"
+                    )
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = dropout
+        elif type(dropout) == float:
+            if dropout < 0:
+                dropout = 0
+            if dropout > 1:
+                dropout = 1
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
+                dropout for _ in range(len(hidden_features))
+            ] + [None]
+        elif dropout in (None, Ellipsis, ...):
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
+                None for _ in range(len(hidden_features) + 1)
+            ]
+        else:
+            raise TypeError(
+                "The provided dropout argument must be a float number or None or "
+                "a sequence in which each item is either a float Number or None."
+            )
+        super().__init__()
+        if len(hidden_features) == 0:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    (
+                        self._GCNLayer(
+                            num_features,
+                            num_classes,
+                            add_self_loops,
+                            normalize,
+                            dropout_probability=dropout_list[0],
+                        ),
+                    )
+                )
+            )
+        else:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList()
+            )
+            self.__sequential_encoding_layers.append(
+                self._GCNLayer(
+                    num_features,
+                    hidden_features[0],
+                    add_self_loops,
+                    normalize,
+                    activation_name,
+                    dropout_list[0],
+                )
+            )
+            for hidden_feature_index in range(len(hidden_features)):
+                if hidden_feature_index + 1 < len(hidden_features):
+                    self.__sequential_encoding_layers.append(
+                        self._GCNLayer(
+                            hidden_features[hidden_feature_index],
+                            hidden_features[hidden_feature_index + 1],
+                            add_self_loops,
+                            normalize,
+                            activation_name,
+                            dropout_list[hidden_feature_index + 1],
+                        )
+                    )
+                else:
+                    self.__sequential_encoding_layers.append(
+                        self._GCNLayer(
+                            hidden_features[hidden_feature_index],
+                            num_classes,
+                            add_self_loops,
+                            normalize,
+                            dropout_list[-1],
+                        )
+                    )
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        return self.__sequential_encoding_layers
+
+    def __extract_edge_indexes_and_weights(
+        self, data
+    ) -> _typing.Union[
+        _typing.Sequence[
+            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
+        ],
+        _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
+    ]:
+        def __compose_edge_index_and_weight(
+            _edge_index: torch.LongTensor,
+            _edge_weight: _typing.Optional[torch.Tensor] = None,
+        ) -> _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]:
+            if type(_edge_index) != torch.Tensor or _edge_index.dtype != torch.int64:
+                raise TypeError
+            if _edge_weight is not None and (
+                type(_edge_weight) != torch.Tensor
+                or _edge_index.size() != (2, _edge_weight.size(0))
+            ):
+                _edge_weight: _typing.Optional[torch.Tensor] = None
+            return _edge_index, _edge_weight
+
+        if not (
+            hasattr(data, "edge_indexes")
+            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
+            and len(getattr(data, "edge_indexes"))
+            == len(self.__sequential_encoding_layers)
+        ):
+            return __compose_edge_index_and_weight(
+                getattr(data, "edge_index"), getattr(data, "edge_weight", None)
+            )
+        for __edge_index in getattr(data, "edge_indexes"):
+            if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
+                return __compose_edge_index_and_weight(
+                    getattr(data, "edge_index"), getattr(data, "edge_weight", None)
+                )
+
+        if (
+            hasattr(data, "edge_weights")
+            and isinstance(getattr(data, "edge_weights"), _typing.Sequence)
+            and len(getattr(data, "edge_weights"))
+            == len(self.__sequential_encoding_layers)
+        ):
+            return [
+                __compose_edge_index_and_weight(_edge_index, _edge_weight)
+                for _edge_index, _edge_weight in zip(
+                    getattr(data, "edge_indexes"), getattr(data, "edge_weights")
+                )
+            ]
+        else:
+            return [
+                __compose_edge_index_and_weight(__edge_index)
+                for __edge_index in getattr(data, "edge_indexes")
+            ]
+
+    def cls_encode(self, data) -> torch.Tensor:
+        edge_indexes_and_weights: _typing.Union[
+            _typing.Sequence[
+                _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
+            ],
+            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
+        ] = self.__extract_edge_indexes_and_weights(data)
+
+        if (not isinstance(edge_indexes_and_weights, tuple)) and isinstance(
+            edge_indexes_and_weights[0], tuple
+        ):
+            """ edge_indexes_and_weights is sequence of (edge_index, edge_weight) """
+            assert len(edge_indexes_and_weights) == len(
+                self.__sequential_encoding_layers
+            )
+            x: torch.Tensor = getattr(data, "x")
+            for _edge_index_and_weight, gcn in zip(
+                edge_indexes_and_weights, self.__sequential_encoding_layers
+            ):
+                _temp_data = autogl.data.Data(x=x, edge_index=_edge_index_and_weight[0])
+                _temp_data.edge_weight = _edge_index_and_weight[1]
+                x = gcn(_temp_data)
+            return x
+        else:
+            """ edge_indexes_and_weights is (edge_index, edge_weight) """
+            x = getattr(data, "x")
+            for gcn in self.__sequential_encoding_layers:
+                _temp_data = autogl.data.Data(
+                    x=x, edge_index=edge_indexes_and_weights[0]
+                )
+                _temp_data.edge_weight = edge_indexes_and_weights[1]
+                x = gcn(_temp_data)
+            return x
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        return torch.nn.functional.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x: torch.Tensor = getattr(data, "x")
+        for i in range(len(self.__sequential_encoding_layers) - 2):
+            x = self.__sequential_encoding_layers[i](
+                autogl.data.Data(x, getattr(data, "edge_index"))
+            )
+        x = self.__sequential_encoding_layers[-2](
+            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
+        )
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("gcn")
+class AutoGCN(BaseModel):
+    r"""
+    AutoGCN.
+    The model used in this automodel is GCN, i.e., the graph convolutional network from the
+    `"Semi-supervised Classification with Graph Convolutional
+    Networks" <https://arxiv.org/abs/1609.02907>`_ paper. The layer is
+
+    .. math::
+
+        \mathbf{X}^{\prime} = \mathbf{\hat{D}}^{-1/2} \mathbf{\hat{A}}
+        \mathbf{\hat{D}}^{-1/2} \mathbf{X} \mathbf{\Theta},
+
+    where :math:`\mathbf{\hat{A}} = \mathbf{A} + \mathbf{I}` denotes the
+    adjacency matrix with inserted self-loops and
+    :math:`\hat{D}_{ii} = \sum_{j=0} \hat{A}_{ij}` its diagonal degree matrix.
+
+    Parameters
+    ----------
+    num_features: ``int``
+        The dimension of features.
+
+    num_classes: ``int``
+        The number of classes.
+
+    device: ``torch.device`` or ``str``
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+    """
+
+    def __init__(
+        self,
+        num_features: int = ...,
+        num_classes: int = ...,
+        device: _typing.Union[str, torch.device] = ...,
+        init: bool = False,
+        **kwargs
+    ) -> None:
+        super().__init__()
+        self.num_features = num_features
+        self.num_classes = num_classes
+        self.device = device
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "add_self_loops",
+                "type": "CATEGORICAL",
+                "feasiblePoints": [1],
+            },
+            {
+                "parameterName": "normalize",
+                "type": "CATEGORICAL",
+                "feasiblePoints": [1],
+            },
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [128, 128, 128],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+        ]
+
+        # initial point of hp search
+        # self.hyperparams = {
+        #     "num_layers": 2,
+        #     "hidden": [16],
+        #     "dropout": 0.2,
+        #     "act": "leaky_relu",
+        # }
+
+        self.hyperparams = {
+            "num_layers": 3,
+            "hidden": [128, 64],
+            "dropout": 0,
+            "act": "relu",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GCN(
+            self.num_features,
+            self.num_classes,
+            self.hyperparams.get("hidden"),
+            self.hyperparams.get("act"),
+            self.hyperparams.get("dropout", None),
+            bool(self.hyperparams.get("add_self_loops", True)),
+            bool(self.hyperparams.get("normalize", True)),
+        ).to(self.device)
diff --git a/autogl/module/model/dgl/gin.py b/autogl/module/model/dgl/gin.py
new file mode 100644
index 0000000..52a495a
--- /dev/null
+++ b/autogl/module/model/dgl/gin.py
@@ -0,0 +1,232 @@
+import torch
+import torch.nn.functional as F
+from torch.nn import Linear, ReLU, Sequential, LeakyReLU, Tanh, ELU
+from torch_geometric.nn import GINConv, global_add_pool
+from torch.nn import BatchNorm1d
+from . import register_model
+from .base import BaseModel, activate_func
+from copy import deepcopy
+from ....utils import get_logger
+
+LOGGER = get_logger("GINModel")
+
+
+def set_default(args, d):
+    for k, v in d.items():
+        if k not in args:
+            args[k] = v
+    return args
+
+
+class GIN(torch.nn.Module):
+    def __init__(self, args):
+        super(GIN, self).__init__()
+        self.args = args
+        self.num_layer = int(self.args["num_layers"])
+        assert self.num_layer > 2, "Number of layers in GIN should not less than 3"
+
+        missing_keys = list(
+            set(
+                [
+                    "features_num",
+                    "num_class",
+                    "num_graph_features",
+                    "num_layers",
+                    "hidden",
+                    "dropout",
+                    "act",
+                    "mlp_layers",
+                    "eps",
+                ]
+            )
+            - set(self.args.keys())
+        )
+        if len(missing_keys) > 0:
+            raise Exception("Missing keys: %s." % ",".join(missing_keys))
+        if not self.num_layer == len(self.args["hidden"]) + 1:
+            LOGGER.warn("Warning: layer size does not match the length of hidden units")
+        self.num_graph_features = self.args["num_graph_features"]
+
+        if self.args["act"] == "leaky_relu":
+            act = LeakyReLU()
+        elif self.args["act"] == "relu":
+            act = ReLU()
+        elif self.args["act"] == "elu":
+            act = ELU()
+        elif self.args["act"] == "tanh":
+            act = Tanh()
+        else:
+            act = ReLU()
+
+        train_eps = True if self.args["eps"] == "True" else False
+
+        self.convs = torch.nn.ModuleList()
+        self.bns = torch.nn.ModuleList()
+
+        nn = [Linear(self.args["features_num"], self.args["hidden"][0])]
+        for _ in range(self.args["mlp_layers"] - 1):
+            nn.append(act)
+            nn.append(Linear(self.args["hidden"][0], self.args["hidden"][0]))
+        # nn.append(BatchNorm1d(self.args['hidden'][0]))
+        self.convs.append(GINConv(Sequential(*nn), train_eps=train_eps))
+        self.bns.append(BatchNorm1d(self.args["hidden"][0]))
+
+        for i in range(self.num_layer - 3):
+            nn = [Linear(self.args["hidden"][i], self.args["hidden"][i + 1])]
+            for _ in range(self.args["mlp_layers"] - 1):
+                nn.append(act)
+                nn.append(
+                    Linear(self.args["hidden"][i + 1], self.args["hidden"][i + 1])
+                )
+            # nn.append(BatchNorm1d(self.args['hidden'][i+1]))
+            self.convs.append(GINConv(Sequential(*nn), train_eps=train_eps))
+            self.bns.append(BatchNorm1d(self.args["hidden"][i + 1]))
+
+        self.fc1 = Linear(
+            self.args["hidden"][self.num_layer - 3] + self.num_graph_features,
+            self.args["hidden"][self.num_layer - 2],
+        )
+        self.fc2 = Linear(
+            self.args["hidden"][self.num_layer - 2], self.args["num_class"]
+        )
+
+    def forward(self, data):
+        x, edge_index, batch = data.x, data.edge_index, data.batch
+
+        if self.num_graph_features > 0:
+            graph_feature = data.gf
+
+        for i in range(self.num_layer - 2):
+            x = self.convs[i](x, edge_index)
+            x = activate_func(x, self.args["act"])
+            x = self.bns[i](x)
+
+        x = global_add_pool(x, batch)
+        if self.num_graph_features > 0:
+            x = torch.cat([x, graph_feature], dim=-1)
+        x = self.fc1(x)
+        x = activate_func(x, self.args["act"])
+        x = F.dropout(x, p=self.args["dropout"], training=self.training)
+
+        x = self.fc2(x)
+
+        return F.log_softmax(x, dim=1)
+
+
+@register_model("gin")
+class AutoGIN(BaseModel):
+    r"""
+    AutoGIN. The model used in this automodel is GIN, i.e., the graph isomorphism network from the `"How Powerful are
+    Graph Neural Networks?" <https://arxiv.org/abs/1810.00826>`_ paper. The layer is
+
+    .. math::
+        \mathbf{x}^{\prime}_i = h_{\mathbf{\Theta}} \left( (1 + \epsilon) \cdot
+        \mathbf{x}_i + \sum_{j \in \mathcal{N}(i)} \mathbf{x}_j \right)
+
+    or
+
+    .. math::
+        \mathbf{X}^{\prime} = h_{\mathbf{\Theta}} \left( \left( \mathbf{A} +
+        (1 + \epsilon) \cdot \mathbf{I} \right) \cdot \mathbf{X} \right),
+
+    here :math:`h_{\mathbf{\Theta}}` denotes a neural network, *.i.e.* an MLP.
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+    """
+
+    def __init__(
+        self,
+        num_features=None,
+        num_classes=None,
+        device=None,
+        init=False,
+        num_graph_features=None,
+        **args
+    ):
+
+        super(AutoGIN, self).__init__()
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.num_graph_features = (
+            int(num_graph_features) if num_graph_features is not None else 0
+        )
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+            "num_graph_features": self.num_graph_features,
+        }
+        self.space = [
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "4,5,6",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 5,
+                "minValue": [8, 8, 8, 8, 8],
+                "maxValue": [64, 64, 64, 64, 64],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.9,
+                "minValue": 0.1,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+            {
+                "parameterName": "eps",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["True", "False"],
+            },
+            {
+                "parameterName": "mlp_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+        ]
+
+        self.hyperparams = {
+            "num_layers": 3,
+            "hidden": [64, 32],
+            "dropout": 0.5,
+            "act": "relu",
+            "eps": "True",
+            "mlp_layers": 2,
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        # """Initialize model."""
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GIN({**self.params, **self.hyperparams}).to(self.device)
diff --git a/autogl/module/model/dgl/gin_dgl.py b/autogl/module/model/dgl/gin_dgl.py
new file mode 100644
index 0000000..8a5408e
--- /dev/null
+++ b/autogl/module/model/dgl/gin_dgl.py
@@ -0,0 +1,171 @@
+"""
+How Powerful are Graph Neural Networks
+https://arxiv.org/abs/1810.00826
+https://openreview.net/forum?id=ryGs6iA5Km
+Author's implementation: https://github.com/weihua916/powerful-gnns
+"""
+
+
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+from dgl.nn.pytorch.conv import GINConv
+from dgl.nn.pytorch.glob import SumPooling, AvgPooling, MaxPooling
+
+
+class ApplyNodeFunc(nn.Module):
+    """Update the node feature hv with MLP, BN and ReLU."""
+    def __init__(self, mlp):
+        super(ApplyNodeFunc, self).__init__()
+        self.mlp = mlp
+        self.bn = nn.BatchNorm1d(self.mlp.output_dim)
+
+    def forward(self, h):
+        h = self.mlp(h)
+        h = self.bn(h)
+        h = F.relu(h)
+        return h
+
+
+class MLP(nn.Module):
+    """MLP with linear output"""
+    def __init__(self, num_layers, input_dim, hidden_dim, output_dim):
+        """MLP layers construction
+
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+
+        """
+        super(MLP, self).__init__()
+        self.linear_or_not = True  # default is linear model
+        self.num_layers = num_layers
+        self.output_dim = output_dim
+
+        if num_layers < 1:
+            raise ValueError("number of layers should be positive!")
+        elif num_layers == 1:
+            # Linear model
+            self.linear = nn.Linear(input_dim, output_dim)
+        else:
+            # Multi-layer model
+            self.linear_or_not = False
+            self.linears = torch.nn.ModuleList()
+            self.batch_norms = torch.nn.ModuleList()
+
+            self.linears.append(nn.Linear(input_dim, hidden_dim))
+            for layer in range(num_layers - 2):
+                self.linears.append(nn.Linear(hidden_dim, hidden_dim))
+            self.linears.append(nn.Linear(hidden_dim, output_dim))
+
+            for layer in range(num_layers - 1):
+                self.batch_norms.append(nn.BatchNorm1d((hidden_dim)))
+
+    def forward(self, x):
+        if self.linear_or_not:
+            # If linear model
+            return self.linear(x)
+        else:
+            # If MLP
+            h = x
+            for i in range(self.num_layers - 1):
+                h = F.relu(self.batch_norms[i](self.linears[i](h)))
+            return self.linears[-1](h)
+
+
+class GIN(nn.Module):
+    """GIN model"""
+    def __init__(self, num_layers, num_mlp_layers, input_dim, hidden_dim,
+                 output_dim, final_dropout, learn_eps, graph_pooling_type,
+                 neighbor_pooling_type):
+        """model parameters setting
+
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers in the neural network
+        num_mlp_layers: int
+            The number of linear layers in mlps
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+        final_dropout: float
+            dropout ratio on the final linear layer
+        learn_eps: boolean
+            If True, learn epsilon to distinguish center nodes from neighbors
+            If False, aggregate neighbors and center nodes altogether.
+        neighbor_pooling_type: str
+            how to aggregate neighbors (sum, mean, or max)
+        graph_pooling_type: str
+            how to aggregate entire nodes in a graph (sum, mean or max)
+
+        """
+        super(GIN, self).__init__()
+        self.num_layers = num_layers
+        self.learn_eps = learn_eps
+
+        # List of MLPs
+        self.ginlayers = torch.nn.ModuleList()
+        self.batch_norms = torch.nn.ModuleList()
+
+        for layer in range(self.num_layers - 1):
+            if layer == 0:
+                mlp = MLP(num_mlp_layers, input_dim, hidden_dim, hidden_dim)
+            else:
+                mlp = MLP(num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)
+
+            self.ginlayers.append(
+                GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, self.learn_eps))
+            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))
+
+        # Linear function for graph poolings of output of each layer
+        # which maps the output of different layers into a prediction score
+        self.linears_prediction = torch.nn.ModuleList()
+
+        for layer in range(num_layers):
+            if layer == 0:
+                self.linears_prediction.append(
+                    nn.Linear(input_dim, output_dim))
+            else:
+                self.linears_prediction.append(
+                    nn.Linear(hidden_dim, output_dim))
+
+        self.drop = nn.Dropout(final_dropout)
+
+        if graph_pooling_type == 'sum':
+            self.pool = SumPooling()
+        elif graph_pooling_type == 'mean':
+            self.pool = AvgPooling()
+        elif graph_pooling_type == 'max':
+            self.pool = MaxPooling()
+        else:
+            raise NotImplementedError
+
+    def forward(self, g, h):
+        # list of hidden representation at each layer (including input)
+        hidden_rep = [h]
+
+        for i in range(self.num_layers - 1):
+            h = self.ginlayers[i](g, h)
+            h = self.batch_norms[i](h)
+            h = F.relu(h)
+            hidden_rep.append(h)
+
+        score_over_layer = 0
+
+        # perform pooling over all nodes in each graph in every layer
+        for i, h in enumerate(hidden_rep):
+            pooled_h = self.pool(g, h)
+            score_over_layer += self.drop(self.linears_prediction[i](pooled_h))
+
+        return score_over_layer
diff --git a/autogl/module/model/dgl/ginparser.py b/autogl/module/model/dgl/ginparser.py
new file mode 100644
index 0000000..280aa12
--- /dev/null
+++ b/autogl/module/model/dgl/ginparser.py
@@ -0,0 +1,81 @@
+"""Parser for arguments
+
+Put all arguments in one file and group similar arguments
+"""
+import argparse
+
+
+class Parser():
+
+    def __init__(self, description):
+        '''
+           arguments parser
+        '''
+        self.parser = argparse.ArgumentParser(description=description)
+        self.args = None
+        self._parse()
+
+    def _parse(self):
+        # dataset
+        self.parser.add_argument(
+            '--dataset', type=str, default="MUTAG",
+            choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI'],
+            help='name of dataset (default: MUTAG)')
+        self.parser.add_argument(
+            '--batch_size', type=int, default=32,
+            help='batch size for training and validation (default: 32)')
+        self.parser.add_argument(
+            '--fold_idx', type=int, default=0,
+            help='the index(<10) of fold in 10-fold validation.')
+        self.parser.add_argument(
+            '--filename', type=str, default="",
+            help='output file')
+
+        # device
+        self.parser.add_argument(
+            '--disable-cuda', action='store_true',
+            help='Disable CUDA')
+        self.parser.add_argument(
+            '--device', type=int, default=0,
+            help='which gpu device to use (default: 0)')
+
+        # net
+        self.parser.add_argument(
+            '--num_layers', type=int, default=5,
+            help='number of layers (default: 5)')
+        self.parser.add_argument(
+            '--num_mlp_layers', type=int, default=2,
+            help='number of MLP layers(default: 2). 1 means linear model.')
+        self.parser.add_argument(
+            '--hidden_dim', type=int, default=64,
+            help='number of hidden units (default: 64)')
+
+        # graph
+        self.parser.add_argument(
+            '--graph_pooling_type', type=str,
+            default="sum", choices=["sum", "mean", "max"],
+            help='type of graph pooling: sum, mean or max')
+        self.parser.add_argument(
+            '--neighbor_pooling_type', type=str,
+            default="sum", choices=["sum", "mean", "max"],
+            help='type of neighboring pooling: sum, mean or max')
+        self.parser.add_argument(
+            '--learn_eps', action="store_true",
+            help='learn the epsilon weighting')
+
+        # learning
+        self.parser.add_argument(
+            '--seed', type=int, default=0,
+            help='random seed (default: 0)')
+        self.parser.add_argument(
+            '--epochs', type=int, default=350,
+            help='number of epochs to train (default: 350)')
+        self.parser.add_argument(
+            '--lr', type=float, default=0.01,
+            help='learning rate (default: 0.01)')
+        self.parser.add_argument(
+            '--final_dropout', type=float, default=0.5,
+            help='final layer dropout (default: 0.5)')
+
+        # done
+        self.args = self.parser.parse_args()
diff --git a/autogl/module/model/dgl/graph_saint.py b/autogl/module/model/dgl/graph_saint.py
new file mode 100644
index 0000000..1b4bc7a
--- /dev/null
+++ b/autogl/module/model/dgl/graph_saint.py
@@ -0,0 +1,407 @@
+import typing as _typing
+import torch.nn.functional
+from torch_geometric.nn.conv import MessagePassing
+from torch_sparse import SparseTensor, matmul
+
+from . import register_model
+from .base import ClassificationModel, ClassificationSupportedSequentialModel
+
+
+class _GraphSAINTAggregationLayers:
+    class MultiOrderAggregationLayer(torch.nn.Module):
+        class Order0Aggregator(torch.nn.Module):
+            def __init__(
+                self,
+                input_dimension: int,
+                output_dimension: int,
+                bias: bool = True,
+                activation: _typing.Optional[str] = "ReLU",
+                batch_norm: bool = True,
+            ):
+                super().__init__()
+                if not type(input_dimension) == type(output_dimension) == int:
+                    raise TypeError
+                if not (input_dimension > 0 and output_dimension > 0):
+                    raise ValueError
+                if not type(bias) == bool:
+                    raise TypeError
+                self.__linear_transform = torch.nn.Linear(
+                    input_dimension, output_dimension, bias
+                )
+                self.__linear_transform.reset_parameters()
+                if type(activation) == str:
+                    if activation.lower() == "ReLU".lower():
+                        self.__activation = torch.nn.functional.relu
+                    elif activation.lower() == "elu":
+                        self.__activation = torch.nn.functional.elu
+                    elif hasattr(torch.nn.functional, activation) and callable(
+                        getattr(torch.nn.functional, activation)
+                    ):
+                        self.__activation = getattr(torch.nn.functional, activation)
+                    else:
+                        self.__activation = lambda x: x
+                else:
+                    self.__activation = lambda x: x
+                if type(batch_norm) != bool:
+                    raise TypeError
+                else:
+                    self.__optional_batch_normalization: _typing.Optional[
+                        torch.nn.BatchNorm1d
+                    ] = (
+                        torch.nn.BatchNorm1d(output_dimension, 1e-8)
+                        if batch_norm
+                        else None
+                    )
+
+            def forward(
+                self,
+                x: _typing.Union[
+                    torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]
+                ],
+                _edge_index: torch.Tensor,
+                _edge_weight: _typing.Optional[torch.Tensor] = None,
+                _size: _typing.Optional[_typing.Tuple[int, int]] = None,
+            ) -> torch.Tensor:
+                __output: torch.Tensor = self.__linear_transform(x)
+                if self.__activation is not None and callable(self.__activation):
+                    __output: torch.Tensor = self.__activation(__output)
+                if self.__optional_batch_normalization is not None and isinstance(
+                    self.__optional_batch_normalization, torch.nn.BatchNorm1d
+                ):
+                    __output: torch.Tensor = self.__optional_batch_normalization(
+                        __output
+                    )
+                return __output
+
+        class Order1Aggregator(MessagePassing):
+            def __init__(
+                self,
+                input_dimension: int,
+                output_dimension: int,
+                bias: bool = True,
+                activation: _typing.Optional[str] = "ReLU",
+                batch_norm: bool = True,
+            ):
+                super().__init__(aggr="add")
+                if not type(input_dimension) == type(output_dimension) == int:
+                    raise TypeError
+                if not (input_dimension > 0 and output_dimension > 0):
+                    raise ValueError
+                if not type(bias) == bool:
+                    raise TypeError
+                self.__linear_transform = torch.nn.Linear(
+                    input_dimension, output_dimension, bias
+                )
+                self.__linear_transform.reset_parameters()
+                if type(activation) == str:
+                    if activation.lower() == "ReLU".lower():
+                        self.__activation = torch.nn.functional.relu
+                    elif activation.lower() == "elu":
+                        self.__activation = torch.nn.functional.elu
+                    elif hasattr(torch.nn.functional, activation) and callable(
+                        getattr(torch.nn.functional, activation)
+                    ):
+                        self.__activation = getattr(torch.nn.functional, activation)
+                    else:
+                        self.__activation = lambda x: x
+                else:
+                    self.__activation = lambda x: x
+                if type(batch_norm) != bool:
+                    raise TypeError
+                else:
+                    self.__optional_batch_normalization: _typing.Optional[
+                        torch.nn.BatchNorm1d
+                    ] = (
+                        torch.nn.BatchNorm1d(output_dimension, 1e-8)
+                        if batch_norm
+                        else None
+                    )
+
+            def forward(
+                self,
+                x: _typing.Union[
+                    torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]
+                ],
+                _edge_index: torch.Tensor,
+                _edge_weight: _typing.Optional[torch.Tensor] = None,
+                _size: _typing.Optional[_typing.Tuple[int, int]] = None,
+            ) -> torch.Tensor:
+
+                if type(x) == torch.Tensor:
+                    x: _typing.Tuple[torch.Tensor, torch.Tensor] = (x, x)
+
+                __output = self.propagate(
+                    _edge_index, x=x, edge_weight=_edge_weight, size=_size
+                )
+                __output: torch.Tensor = self.__linear_transform(__output)
+                if self.__activation is not None and callable(self.__activation):
+                    __output: torch.Tensor = self.__activation(__output)
+                if self.__optional_batch_normalization is not None and isinstance(
+                    self.__optional_batch_normalization, torch.nn.BatchNorm1d
+                ):
+                    __output: torch.Tensor = self.__optional_batch_normalization(
+                        __output
+                    )
+                return __output
+
+            def message(
+                self, x_j: torch.Tensor, edge_weight: _typing.Optional[torch.Tensor]
+            ) -> torch.Tensor:
+                return x_j if edge_weight is None else edge_weight.view(-1, 1) * x_j
+
+            def message_and_aggregate(
+                self,
+                adj_t: SparseTensor,
+                x: _typing.Union[
+                    torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]
+                ],
+            ) -> torch.Tensor:
+                return matmul(adj_t, x[0], reduce=self.aggr)
+
+        @property
+        def integral_output_dimension(self) -> int:
+            return (self._order + 1) * self._each_order_output_dimension
+
+        def __init__(
+            self,
+            _input_dimension: int,
+            _each_order_output_dimension: int,
+            _order: int,
+            bias: bool = True,
+            activation: _typing.Optional[str] = "ReLU",
+            batch_norm: bool = True,
+            _dropout: _typing.Optional[float] = ...,
+        ):
+            super().__init__()
+            if not (
+                type(_input_dimension) == type(_order) == int
+                and type(_each_order_output_dimension) == int
+            ):
+                raise TypeError
+            if _input_dimension <= 0 or _each_order_output_dimension <= 0:
+                raise ValueError
+            if _order not in (0, 1):
+                raise ValueError("Unsupported order number")
+            self._input_dimension: int = _input_dimension
+            self._each_order_output_dimension: int = _each_order_output_dimension
+            self._order: int = _order
+            if type(bias) != bool:
+                raise TypeError
+            self.__order0_transform = self.Order0Aggregator(
+                self._input_dimension,
+                self._each_order_output_dimension,
+                bias,
+                activation,
+                batch_norm,
+            )
+            if _order == 1:
+                self.__order1_transform = self.Order1Aggregator(
+                    self._input_dimension,
+                    self._each_order_output_dimension,
+                    bias,
+                    activation,
+                    batch_norm,
+                )
+            else:
+                self.__order1_transform = None
+            if _dropout is not None and type(_dropout) == float:
+                if _dropout < 0:
+                    _dropout = 0
+                if _dropout > 1:
+                    _dropout = 1
+                self.__optional_dropout: _typing.Optional[
+                    torch.nn.Dropout
+                ] = torch.nn.Dropout(_dropout)
+            else:
+                self.__optional_dropout: _typing.Optional[torch.nn.Dropout] = None
+
+        def _forward(
+            self,
+            x: _typing.Union[torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]],
+            edge_index: torch.Tensor,
+            edge_weight: _typing.Optional[torch.Tensor] = None,
+            size: _typing.Optional[_typing.Tuple[int, int]] = None,
+        ) -> torch.Tensor:
+            if self.__order1_transform is not None and isinstance(
+                self.__order1_transform, self.Order1Aggregator
+            ):
+                __output: torch.Tensor = torch.cat(
+                    [
+                        self.__order0_transform(x, edge_index, edge_weight, size),
+                        self.__order1_transform(x, edge_index, edge_weight, size),
+                    ],
+                    dim=1,
+                )
+            else:
+                __output: torch.Tensor = self.__order0_transform(
+                    x, edge_index, edge_weight, size
+                )
+            if self.__optional_dropout is not None and isinstance(
+                self.__optional_dropout, torch.nn.Dropout
+            ):
+                __output: torch.Tensor = self.__optional_dropout(__output)
+            return __output
+
+        def forward(self, data) -> torch.Tensor:
+            x: torch.Tensor = getattr(data, "x")
+            if type(x) != torch.Tensor:
+                raise TypeError
+            edge_index: torch.LongTensor = getattr(data, "edge_index")
+            if type(edge_index) != torch.Tensor:
+                raise TypeError
+            edge_weight: _typing.Optional[torch.Tensor] = getattr(
+                data, "edge_weight", None
+            )
+            if edge_weight is not None and type(edge_weight) != torch.Tensor:
+                raise TypeError
+            return self._forward(x, edge_index, edge_weight)
+
+    class WrappedDropout(torch.nn.Module):
+        def __init__(self, dropout_module: torch.nn.Dropout):
+            super().__init__()
+            self.__dropout_module: torch.nn.Dropout = dropout_module
+
+        def forward(self, tenser_or_data) -> torch.Tensor:
+            if type(tenser_or_data) == torch.Tensor:
+                return self.__dropout_module(tenser_or_data)
+            elif (
+                hasattr(tenser_or_data, "x")
+                and type(getattr(tenser_or_data, "x")) == torch.Tensor
+            ):
+                return self.__dropout_module(getattr(tenser_or_data, "x"))
+            else:
+                raise TypeError
+
+
+class GraphSAINTMultiOrderAggregationModel(ClassificationSupportedSequentialModel):
+    def __init__(
+        self,
+        num_features: int,
+        num_classes: int,
+        _output_dimension_for_each_order: int,
+        _layers_order_list: _typing.Sequence[int],
+        _pre_dropout: float,
+        _layers_dropout: _typing.Union[float, _typing.Sequence[float]],
+        activation: _typing.Optional[str] = "ReLU",
+        bias: bool = True,
+        batch_norm: bool = True,
+        normalize: bool = True,
+    ):
+        super(GraphSAINTMultiOrderAggregationModel, self).__init__()
+        if type(_output_dimension_for_each_order) != int:
+            raise TypeError
+        if not _output_dimension_for_each_order > 0:
+            raise ValueError
+        self._layers_order_list: _typing.Sequence[int] = _layers_order_list
+
+        if isinstance(_layers_dropout, _typing.Sequence):
+            if len(_layers_dropout) != len(_layers_order_list):
+                raise ValueError
+            else:
+                self._layers_dropout: _typing.Sequence[float] = _layers_dropout
+        elif type(_layers_dropout) == float:
+            if _layers_dropout < 0:
+                _layers_dropout = 0
+            if _layers_dropout > 1:
+                _layers_dropout = 1
+            self._layers_dropout: _typing.Sequence[float] = [
+                _layers_dropout for _ in _layers_order_list
+            ]
+        else:
+            raise TypeError
+        if type(_pre_dropout) != float:
+            raise TypeError
+        else:
+            if _pre_dropout < 0:
+                _pre_dropout = 0
+            if _pre_dropout > 1:
+                _pre_dropout = 1
+        self.__sequential_encoding_layers: torch.nn.ModuleList = torch.nn.ModuleList(
+            (
+                _GraphSAINTAggregationLayers.WrappedDropout(
+                    torch.nn.Dropout(_pre_dropout)
+                ),
+                _GraphSAINTAggregationLayers.MultiOrderAggregationLayer(
+                    num_features,
+                    _output_dimension_for_each_order,
+                    _layers_order_list[0],
+                    bias,
+                    activation,
+                    batch_norm,
+                    _layers_dropout[0],
+                ),
+            )
+        )
+        for _layer_index in range(1, len(_layers_order_list)):
+            self.__sequential_encoding_layers.append(
+                _GraphSAINTAggregationLayers.MultiOrderAggregationLayer(
+                    self.__sequential_encoding_layers[-1].integral_output_dimension,
+                    _output_dimension_for_each_order,
+                    _layers_order_list[_layer_index],
+                    bias,
+                    activation,
+                    batch_norm,
+                    _layers_dropout[_layer_index],
+                )
+            )
+        self.__apply_normalize: bool = normalize
+        self.__linear_transform: torch.nn.Linear = torch.nn.Linear(
+            self.__sequential_encoding_layers[-1].integral_output_dimension,
+            num_classes,
+            bias,
+        )
+        self.__linear_transform.reset_parameters()
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        if self.__apply_normalize:
+            x: torch.Tensor = torch.nn.functional.normalize(x, p=2, dim=1)
+        return torch.nn.functional.log_softmax(self.__linear_transform(x), dim=1)
+
+    def cls_encode(self, data) -> torch.Tensor:
+        if type(getattr(data, "x")) != torch.Tensor:
+            raise TypeError
+        if type(getattr(data, "edge_index")) != torch.Tensor:
+            raise TypeError
+        if (
+            getattr(data, "edge_weight", None) is not None
+            and type(getattr(data, "edge_weight")) != torch.Tensor
+        ):
+            raise TypeError
+        for encoding_layer in self.__sequential_encoding_layers:
+            setattr(data, "x", encoding_layer(data))
+        return getattr(data, "x")
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        return self.__sequential_encoding_layers
+
+
+@register_model("GraphSAINTAggregationModel")
+class GraphSAINTAggregationModel(ClassificationModel):
+    def __init__(
+        self,
+        num_features: int = ...,
+        num_classes: int = ...,
+        device: _typing.Union[str, torch.device] = ...,
+        init: bool = False,
+        **kwargs
+    ):
+        super(GraphSAINTAggregationModel, self).__init__(
+            num_features, num_classes, device=device, init=init, **kwargs
+        )
+        # todo: Initialize with default hyper parameter space and hyper parameter
+
+    def _initialize(self):
+        """ Initialize model """
+        self.model = GraphSAINTMultiOrderAggregationModel(
+            self.num_features,
+            self.num_classes,
+            self.hyper_parameter.get("output_dimension_for_each_order"),
+            self.hyper_parameter.get("layers_order_list"),
+            self.hyper_parameter.get("pre_dropout"),
+            self.hyper_parameter.get("layers_dropout"),
+            self.hyper_parameter.get("activation", "ReLU"),
+            bool(self.hyper_parameter.get("bias", True)),
+            bool(self.hyper_parameter.get("batch_norm", True)),
+            bool(self.hyper_parameter.get("normalize", True)),
+        ).to(self.device)
diff --git a/autogl/module/model/dgl/graphsage.py b/autogl/module/model/dgl/graphsage.py
new file mode 100644
index 0000000..6cf5a17
--- /dev/null
+++ b/autogl/module/model/dgl/graphsage.py
@@ -0,0 +1,306 @@
+import torch
+import typing as _typing
+
+from torch_geometric.nn.conv import SAGEConv
+import torch.nn.functional
+import autogl.data
+from . import register_model
+from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
+from ....utils import get_logger
+
+LOGGER = get_logger("SAGEModel")
+
+
+class GraphSAGE(ClassificationSupportedSequentialModel):
+    class _SAGELayer(torch.nn.Module):
+        def __init__(
+            self,
+            input_channels: int,
+            output_channels: int,
+            aggr: str,
+            activation_name: _typing.Optional[str] = ...,
+            dropout_probability: _typing.Optional[float] = ...,
+        ):
+            super().__init__()
+            self._convolution: SAGEConv = SAGEConv(
+                input_channels, output_channels, aggr=aggr
+            )
+            if (
+                activation_name is not Ellipsis
+                and activation_name is not None
+                and type(activation_name) == str
+            ):
+                self._activation_name: _typing.Optional[str] = activation_name
+            else:
+                self._activation_name: _typing.Optional[str] = None
+            if (
+                dropout_probability is not Ellipsis
+                and dropout_probability is not None
+                and type(dropout_probability) == float
+            ):
+                if dropout_probability < 0:
+                    dropout_probability = 0
+                if dropout_probability > 1:
+                    dropout_probability = 1
+                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
+                    dropout_probability
+                )
+            else:
+                self._dropout: _typing.Optional[torch.nn.Dropout] = None
+
+        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
+            x: torch.Tensor = getattr(data, "x")
+            edge_index: torch.Tensor = getattr(data, "edge_index")
+            if type(x) != torch.Tensor or type(edge_index) != torch.Tensor:
+                raise TypeError
+
+            x: torch.Tensor = self._convolution.forward(x, edge_index)
+            if self._activation_name is not None and enable_activation:
+                x: torch.Tensor = activate_func(x, self._activation_name)
+            if self._dropout is not None:
+                x: torch.Tensor = self._dropout.forward(x)
+            return x
+
+    def __init__(
+        self,
+        num_features: int,
+        num_classes: int,
+        hidden_features: _typing.Sequence[int],
+        activation_name: str,
+        layers_dropout: _typing.Union[
+            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
+        ] = None,
+        aggr: str = "mean",
+    ):
+        super().__init__()
+        if not type(num_features) == type(num_classes) == int:
+            raise TypeError
+        if not isinstance(hidden_features, _typing.Sequence):
+            raise TypeError
+        for hidden_feature in hidden_features:
+            if type(hidden_feature) != int:
+                raise TypeError
+            elif hidden_feature <= 0:
+                raise ValueError
+        if isinstance(layers_dropout, _typing.Sequence):
+            if len(layers_dropout) != (len(hidden_features) + 1):
+                raise TypeError
+            for d in layers_dropout:
+                if d is not None and type(d) != float:
+                    raise TypeError
+            _layers_dropout: _typing.Sequence[_typing.Optional[float]] = layers_dropout
+        elif layers_dropout is None or type(layers_dropout) == float:
+            _layers_dropout: _typing.Sequence[_typing.Optional[float]] = [
+                layers_dropout for _ in range(len(hidden_features))
+            ] + [None]
+        else:
+            raise TypeError
+        if not type(activation_name) == type(aggr) == str:
+            raise TypeError
+        if aggr not in ("add", "max", "mean"):
+            aggr = "mean"
+
+        if len(hidden_features) == 0:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    [
+                        self._SAGELayer(
+                            num_features,
+                            num_classes,
+                            aggr,
+                            activation_name,
+                            _layers_dropout[0],
+                        )
+                    ]
+                )
+            )
+        else:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    [
+                        self._SAGELayer(
+                            num_features,
+                            hidden_features[0],
+                            aggr,
+                            activation_name,
+                            _layers_dropout[0],
+                        )
+                    ]
+                )
+            )
+            for i in range(len(hidden_features)):
+                if i + 1 < len(hidden_features):
+                    self.__sequential_encoding_layers.append(
+                        self._SAGELayer(
+                            hidden_features[i],
+                            hidden_features[i + 1],
+                            aggr,
+                            activation_name,
+                            _layers_dropout[i + 1],
+                        )
+                    )
+                else:
+                    self.__sequential_encoding_layers.append(
+                        self._SAGELayer(
+                            hidden_features[i],
+                            num_classes,
+                            aggr,
+                            _layers_dropout[i + 1],
+                        )
+                    )
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        return self.__sequential_encoding_layers
+
+    def cls_encode(self, data) -> torch.Tensor:
+        if (
+            hasattr(data, "edge_indexes")
+            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
+            and len(getattr(data, "edge_indexes"))
+            == len(self.__sequential_encoding_layers)
+        ):
+            for __edge_index in getattr(data, "edge_indexes"):
+                if type(__edge_index) != torch.Tensor:
+                    raise TypeError
+            """ Layer-wise encode """
+            x: torch.Tensor = getattr(data, "x")
+            for i, __edge_index in enumerate(getattr(data, "edge_indexes")):
+                x: torch.Tensor = self.__sequential_encoding_layers[i](
+                    autogl.data.Data(x=x, edge_index=__edge_index)
+                )
+            return x
+        else:
+            x: torch.Tensor = getattr(data, "x")
+            for i in range(len(self.__sequential_encoding_layers)):
+                x = self.__sequential_encoding_layers[i](
+                    autogl.data.Data(x, getattr(data, "edge_index"))
+                )
+            return x
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        return torch.nn.functional.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x: torch.Tensor = getattr(data, "x")
+        for i in range(len(self.__sequential_encoding_layers) - 2):
+            x = self.__sequential_encoding_layers[i](
+                autogl.data.Data(x, getattr(data, "edge_index"))
+            )
+        x = self.__sequential_encoding_layers[-2](
+            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
+        )
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("sage")
+class AutoSAGE(BaseModel):
+    r"""
+    AutoSAGE. The model used in this automodel is GraphSAGE, i.e., the GraphSAGE from the `"Inductive Representation Learning on
+    Large Graphs" <https://arxiv.org/abs/1706.02216>`_ paper. The layer is
+
+    .. math::
+
+        \mathbf{x}^{\prime}_i = \mathbf{W}_1 \mathbf{x}_i + \mathbf{W_2} \cdot
+        \mathrm{mean}_{j \in \mathcal{N(i)}} \mathbf{x}_j
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+
+    """
+
+    def __init__(
+        self, num_features=None, num_classes=None, device=None, init=False, **args
+    ):
+
+        super(AutoSAGE, self).__init__()
+
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [128, 128, 128],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+            {
+                "parameterName": "agg",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["mean", "add", "max"],
+            },
+        ]
+
+        self.hyperparams = {
+            "num_layers": 3,
+            "hidden": [64, 32],
+            "dropout": 0.5,
+            "act": "relu",
+            "agg": "mean",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GraphSAGE(
+            self.num_features,
+            self.num_classes,
+            self.hyperparams.get("hidden"),
+            self.hyperparams.get("act", "relu"),
+            self.hyperparams.get("dropout", None),
+            self.hyperparams.get("agg", "mean"),
+        ).to(self.device)
diff --git a/autogl/module/model/dgl/topkpool.py b/autogl/module/model/dgl/topkpool.py
new file mode 100644
index 0000000..c1872bd
--- /dev/null
+++ b/autogl/module/model/dgl/topkpool.py
@@ -0,0 +1,169 @@
+import torch
+import torch.nn.functional as F
+from torch_geometric.nn import GraphConv, TopKPooling
+from torch_geometric.nn import global_mean_pool as gap, global_max_pool as gmp
+from . import register_model
+from .base import BaseModel, activate_func
+from ....utils import get_logger
+
+LOGGER = get_logger("TopkModel")
+
+
+def set_default(args, d):
+    for k, v in d.items():
+        if k not in args:
+            args[k] = v
+    return args
+
+
+class Topkpool(torch.nn.Module):
+    def __init__(self, args):
+        super(Topkpool, self).__init__()
+        self.args = args
+
+        missing_keys = list(
+            set(
+                [
+                    "features_num",
+                    "num_class",
+                    "num_graph_features",
+                    "ratio",
+                    "dropout",
+                    "act",
+                ]
+            )
+            - set(self.args.keys())
+        )
+        if len(missing_keys) > 0:
+            raise Exception("Missing keys: %s." % ",".join(missing_keys))
+
+        self.num_features = self.args["features_num"]
+        self.num_classes = self.args["num_class"]
+        self.ratio = self.args["ratio"]
+        self.dropout = self.args["dropout"]
+        self.num_graph_features = self.args["num_graph_features"]
+
+        self.conv1 = GraphConv(self.num_features, 128)
+        self.pool1 = TopKPooling(128, ratio=self.ratio)
+        self.conv2 = GraphConv(128, 128)
+        self.pool2 = TopKPooling(128, ratio=self.ratio)
+        self.conv3 = GraphConv(128, 128)
+        self.pool3 = TopKPooling(128, ratio=self.ratio)
+
+        self.lin1 = torch.nn.Linear(256 + self.num_graph_features, 128)
+        self.lin2 = torch.nn.Linear(128, 64)
+        self.lin3 = torch.nn.Linear(64, self.num_classes)
+
+    def forward(self, data):
+        x, edge_index, batch = data.x, data.edge_index, data.batch
+        if self.num_graph_features > 0:
+            graph_feature = data.gf
+
+        x = F.relu(self.conv1(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool1(x, edge_index, None, batch)
+        x1 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = F.relu(self.conv2(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool2(x, edge_index, None, batch)
+        x2 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = F.relu(self.conv3(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool3(x, edge_index, None, batch)
+        x3 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = x1 + x2 + x3
+        if self.num_graph_features > 0:
+            x = torch.cat([x, graph_feature], dim=-1)
+        x = self.lin1(x)
+        x = activate_func(x, self.args["act"])
+        x = F.dropout(x, p=self.dropout, training=self.training)
+        x = self.lin2(x)
+        x = activate_func(x, self.args["act"])
+        x = F.log_softmax(self.lin3(x), dim=-1)
+
+        return x
+
+
+@register_model("topkpool")
+class AutoTopkpool(BaseModel):
+    r"""
+    AutoTopkpool. The model used in this automodel is from https://arxiv.org/abs/1905.05178, https://arxiv.org/abs/1905.02850
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+
+    """
+
+    def __init__(
+        self,
+        num_features=None,
+        num_classes=None,
+        device=None,
+        init=False,
+        num_graph_features=None,
+        **args
+    ):
+        super(AutoTopkpool, self).__init__()
+        LOGGER.debug(
+            "topkpool __init__ get params num_graph_features {}".format(
+                num_graph_features
+            )
+        )
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.num_graph_features = (
+            int(num_graph_features) if num_graph_features is not None else 0
+        )
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+            "num_graph_features": self.num_graph_features,
+        }
+        self.space = [
+            {
+                "parameterName": "ratio",
+                "type": "DOUBLE",
+                "maxValue": 0.9,
+                "minValue": 0.1,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.9,
+                "minValue": 0.1,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+        ]
+
+        self.hyperparams = {"ratio": 0.8, "dropout": 0.5, "act": "relu"}
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        if self.initialized:
+            return
+        self.initialized = True
+        LOGGER.debug("topkpool initialize with parameters {}".format(self.params))
+        self.model = Topkpool({**self.params, **self.hyperparams}).to(self.device)
diff --git a/test/model_glf/gclf_dgl.py b/test/model_glf/gclf_dgl.py
new file mode 100644
index 0000000..a3d16b6
--- /dev/null
+++ b/test/model_glf/gclf_dgl.py
@@ -0,0 +1,176 @@
+import os
+import sys
+import logging
+logging.basicConfig(level=logging.INFO)
+from tqdm import tqdm
+
+sys.path.append("../../")
+print(os.getcwd())
+os.environ["AUTOGL_BACKEND"] = "dgl"
+#os.environ["AUTOGL_BACKEND"] = "pyg"
+from autogl.backend import DependentBackend
+import dgl
+from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+
+from autogl.module.model.ginparser import Parser
+from autogl.module.model.dataloader_gin import GINDataLoader
+from autogl.module.model import GIN
+
+from pdb import set_trace
+import numpy as np
+from autogl.solver.utils import set_seed
+set_seed(202106)
+
+
+def train(args, net, trainloader, optimizer, criterion, epoch):
+    net.train()
+
+    running_loss = 0
+    total_iters = len(trainloader)
+    # setup the offset to avoid the overlap with mouse cursor
+    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
+
+    for pos, (graphs, labels) in zip(bar, trainloader):
+        # batch graphs will be shipped to device in forward part of model
+        labels = labels.to(args.device)
+        graphs = graphs.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        outputs = net(graphs, feat)
+
+        loss = criterion(outputs, labels)
+        running_loss += loss.item()
+
+        # backprop
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        # report
+        bar.set_description('epoch-{}'.format(epoch))
+    bar.close()
+    # the final batch will be aligned
+    running_loss = running_loss / total_iters
+
+    return running_loss
+
+
+def eval_net(args, net, dataloader, criterion):
+    net.eval()
+
+    total = 0
+    total_loss = 0
+    total_correct = 0
+
+    for data in dataloader:
+        graphs, labels = data
+        graphs = graphs.to(args.device)
+        labels = labels.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        total += len(labels)
+        outputs = net(graphs, feat)
+        _, predicted = torch.max(outputs.data, 1)
+
+        total_correct += (predicted == labels.data).sum().item()
+        loss = criterion(outputs, labels)
+        # crossentropy(reduce=True) for default
+        total_loss += loss.item() * len(labels)
+
+    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
+
+    net.train()
+
+    return loss, acc
+
+
+def main(args):
+
+    # set up seeds, args.seed supported
+    torch.manual_seed(seed=args.seed)
+    np.random.seed(seed=args.seed)
+
+    is_cuda = not args.disable_cuda and torch.cuda.is_available()
+
+    if is_cuda:
+        args.device = torch.device("cuda:" + str(args.device))
+        torch.cuda.manual_seed_all(seed=args.seed)
+    else:
+        args.device = torch.device("cpu")
+
+    dataset = GINDataset(args.dataset, not args.learn_eps)
+
+    trainloader, validloader = GINDataLoader(
+        dataset, batch_size=args.batch_size, device=args.device,
+        seed=args.seed, shuffle=True,
+        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
+    # or split_name='rand', split_ratio=0.7
+
+    model = GIN(
+        args.num_layers, args.num_mlp_layers,
+        dataset.dim_nfeats, args.hidden_dim, dataset.gclasses,
+        args.final_dropout, args.learn_eps,
+        args.graph_pooling_type, args.neighbor_pooling_type).to(args.device)
+
+    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
+
+    # it's not cost-effective to hanle the cursor and init 0
+    # https://stackoverflow.com/a/23121189
+    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
+    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
+    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
+
+    for epoch, _, _ in zip(tbar, vbar, lrbar):
+
+        train(args, model, trainloader, optimizer, criterion, epoch)
+        scheduler.step()
+
+        train_loss, train_acc = eval_net(
+            args, model, trainloader, criterion)
+        tbar.set_description(
+            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(train_loss, 100. * train_acc))
+
+        valid_loss, valid_acc = eval_net(
+            args, model, validloader, criterion)
+        vbar.set_description(
+            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(valid_loss, 100. * valid_acc))
+
+        if not args.filename == "":
+            with open(args.filename, 'a') as f:
+                f.write('%s %s %s %s' % (
+                    args.dataset,
+                    args.learn_eps,
+                    args.neighbor_pooling_type,
+                    args.graph_pooling_type
+                ))
+                f.write("\n")
+                f.write("%f %f %f %f" % (
+                    train_loss,
+                    train_acc,
+                    valid_loss,
+                    valid_acc
+                ))
+                f.write("\n")
+
+        lrbar.set_description(
+            "Learning eps with learn_eps={}: {}".format(
+                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
+
+    tbar.close()
+    vbar.close()
+    lrbar.close()
+
+
+if __name__ == '__main__':
+    args = Parser(description='GIN').args
+    print('show all arguments configuration...')
+    print(args)
+
+    main(args)
+

From 9fd4ca01c20e63ee1c0810c2786c761bdeaedd8b Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Tue, 31 Aug 2021 08:18:43 +0000
Subject: [PATCH 17/75] should use autogin for test

---
 autogl/module/model/dgl/.gin.py.swp     | Bin 0 -> 36864 bytes
 autogl/module/model/dgl/.gin_dgl.py.swp | Bin 0 -> 16384 bytes
 autogl/module/model/dgl/__init__.py     |   3 +-
 autogl/module/model/dgl/gin.py          | 201 +++++++++++++++++-------
 test/model_glf/gclf_dgl.py              |  28 +++-
 5 files changed, 166 insertions(+), 66 deletions(-)
 create mode 100644 autogl/module/model/dgl/.gin.py.swp
 create mode 100644 autogl/module/model/dgl/.gin_dgl.py.swp

diff --git a/autogl/module/model/dgl/.gin.py.swp b/autogl/module/model/dgl/.gin.py.swp
new file mode 100644
index 0000000000000000000000000000000000000000..ab414a2fd726e51212ac224ec5454f5c60d2fcbb
GIT binary patch
literal 36864
zcmeI53zTF<d4OA<>IxDiJluFv=?T)a+uJ*{yKt7l!F?~2%nq<GIGG)K?@ZsBzHCo-
z(~o^*9T9wRq6b7HiXIG0g2+KkqC7>EM<OVQ$Ob}kjvT}+VuCz^K|oOR{dM2BZ_i^{
z9?I>r-`?q4b?g51*I#vSRsB^x+_kZ9jar=RO7S@?m3r)vdB&6J?0(nXkV=gdjq+Gg
z0w({Al$!O1SzFjWd9>7r>;&g8Z8j>a`{x@R#!B<YD}`psl!IBCU*N=;RnAp+Op#U+
zoM<4?zzj6dY>duZd`N2Hf^J>aJJNrq-u<o(Ge{tbnrI-=K%#*}1BnI_4I~;!G>~W@
z(ZKJ!1{&3aQ|FM0{hW*(<Q(4;IUeAApWP;&d)>lFJU5-UI_H-;$Mw$94L{KNKF2v)
zk?@0^?^~SX$0FhTJKx{o93PH^J71GSqJcyMi3So4BpOIGkZ2&$K%#*}1BnI_4I~<P
zQ)<8{q*8khO{I={C)sEI-|ff$lJ5`0w_yh?0g3YzaUXzd;T!N7_%vJuTVW8ELMI#z
zN5PTs(jlY=--KOo790V83@^}We;gi!ufs(!3M=4!a4`I0Rw{Kj{1bc$J_TFAfDgcP
zZ%?IefFYO-?|~=ZmP*|RSHcBg!W#H<m<7LKP+|}K7hDdzpb7o(m#`n)%fQ1opa65>
zrzq&la0P6KIq<&>UhIY&p#W>)-Eb#^Cg;M3!Gt5=Q3fg=f?J>pqhP|xa3CB2KV~rI
zCb$tk31`Awcn8da#~3u(;|`om$7+@H*{*ukSgA5>l=4QQkgrxMrOfuM8a5gu#m-d9
zjV4ElS~p9hx#4ns&>G5Y?`#P+MjF;uqhaPpo8=KnN5?m6WA(u_Vd<gPOLUBpN_nfD
zW>%SnF*9$K3uYkw(MnBO$||cG?k8qOUsG<5=S#*8v!>>$1)V)%S;uNdwU{3@jYhL(
zB6q=P7`d@gPhe}*7EKZf#jUH8R97G|^56^P=*3NsFr98Nf<B?Or|(rTM-{?vGin7b
zwS7fU+OS3f`YKw5f>}-v4YuZXD5O})!$`@f*V98@{`57YBMT6<-zu9%E#n34-3`6V
z6`yHIxo}9$ZKvd{mz*PLcR)}t%)1o^moutWvs}n56T=*+)W*AQh30JI@|0z9)9#_p
zm`rLLbCX%!H?SO=%d9icZkpwWWt1{=%H__iYSav?oHwiWUhl6+VjZenc9V&h=2%;r
zV}}N<xh=9troz(68TmK`6{lP~SD{jm<~XI(2>j<uIY|(eGAxYLw0xwd*(x3{RqgtQ
zol)hwG2+18PzpsjI9VRTRvVSyx812K`@&%L(b}4UeRKtFLtnfv>|!Q15t2YO=oi!^
z+Ushgy-89FmF-@YYr8Ua+SPiVrYGHAupz%qc8ducX;f+>#T=PlqrLq4t$HKl+n`@0
zZKHZ-=haZ6uCFys<+kd!!BUB_)ZSi|mcX<!OLbGNGWg$@OZ1PPNMNnmzab!pL=GFc
z9c{f)E{39o?@1)*o(&?V<5E}|xlg+U%u+M<`W8XkB~WXZLceKj*%3*mT_Pokn|G4(
zG_Ol3=Gp1IAlUkE4G%n^MDhKntX{oxZH|XyIg>t}|E=;^kFuZXb?dK9Rj8PCRjxGD
zxU~AJQ8ZP_ERQvcsxqqV21GT>R->Nw4Ty}$6`q84a##UZ+Aj{_Cq}0{Fv8`;BLGWT
zxqZZ}HmnM=t+DELWK&zr9rYe{Og)!Y$Eb8Roja>yl{4dZXkJ1C&k6*QTZTgImkY_e
ze0-th+dO1$_!8zMxlACv)+^+U-)zb^_mdXe_aCzEX*s3??Rc9QV#IBN3bjhL(rg>-
zH0o_G7K6~m(N?w?lbIwf`=zH%gissR8fP#SRElWcI}t1~8itZIP=1TSdzM*iv9FWV
zf~-mpG{=W|AH_KBY|3+#Hw{%UR+^=Pw#$-PuVctYSuIR^cZ?b<*99zLFda}_;0;<|
zCB}@9a`2ODR?S+58{01oow+>k(^ey&cN#8vDfLcCDp`F!k5#Qv5jhiSrR9;U)32Gl
zQJ2H_Q+#x#+Cp=ywt8|<1GeZ)qXr4LYneQWwq(^-QBEOeHOz6$yeB0>Q4D#GMzhq&
z$OXJD>l@n*1!<2Fp;Q?gBYSD2<OyPysQanWT4h}2_%s_<sjjT?YK1cLW7`o%D%Bls
zSiv-_^4+;~*r3Kcmo4LOoib_(_Gk1>@J5$sS9OQ2AbELkuR|btr%ZL|h&nt!W>&_{
zM$H=GqDZ`KwBKcm;ws*aZNC#__46sK{P)$Y@|y9ilBZHu@nlIkd2mz7Nk>c?F{7l6
zx>^+tmy_jk=xj>*|I%;21El{?S6hF6MPL6pcmTcyUxG{FJlG7&p$iTJx%PIsKKUdX
zNHmaWAkjdgfkXp|1`-V<8b~ydXdux*qJdXU12P~XA3Z{%SCKPzAfp;P=giUPsz%Ki
zXL!N+THL{aiG6OOGuNotqi_Xtt2JW!gLL{z8AxHah|$RcY0AKIO5e))&mJD}PPwD1
zfvfzX#txNEr~AD0lom9{Ieoc|hxnIiiDWFqxsN_X1PTmGb6>euS#>R<f6vGzl84BM
z_=N8N@1fIQVjf=l|E_=kBhs&j&%*?4f<ZVDdf){3Q#b(rhra)AaK`~|<L_NifYl&=
z0Q<oYxW_&4b@&3D2Xfzo;6V5}ay$gzh0Ec?un`u)5%4_o{6B`9;WD@Y&VfNV4d%mR
z%==#nYhV_<9Uf+`|5o@MOuz={g~Q<`=J=n42jJh}({K@(@P0TEo@L(u+wk|W9%jRC
z=KU{*&q5L21CKK2e+PU8*26N`A8ugY|7@tj1~>@rXP*BqxCS=EM%Vz0;W_5`{||lu
zSHV|cCk()Bc$vBXm*By6J^-%WB=h~re1CM#TsI2d7_+!j421{Gbp$=aoA#z{TQ2(j
zobP9TtCr07hdpcTk`Bxhy$R?0C%21azJD~@h~S8j%=h~*TJpTLJqD8be)ruYneTTs
zA;)CCU+IbMu=`~@#{+pi`2(EqcMYN_9kHCa*<^}-k5kU-_pIS^>}ej+?s@4hGP53V
zG%W_Zi%u$}$K-X3*COfU@am{GnSQs%{rl^y2;?&UPr1U@wSU3VYPGaufEoBzOfgU2
z(}08!Op>CfyP=A|tf?J)%A}-Rhuz{<wavoKXHEa9S+#6H8RdeW0N1@^+esmG`;6yK
zru_vZ^*6Djg5%TRdJxpiF<e;8T3!z@#CsV8OhWhnze7LxJo?Gf|DWTG(>z4Keixh%
zr^6vI3!bGP{|tN&?t-gf82aF3Q1CK+dGYtZ555ZL!Z0j_C2%x6Lx298unTrT4xXU@
zz8mg`>)=`#hh;Du?m@=8;cEB@h|I@u{^uNj0*}DGa4TE^pMWM9umrkc4s^m>;Ck{s
z2Fu}B^z(lK{|FbuXW@ge2Ga02eg22xPPhsF22AJySr_nLc$P7M@4=;T4y*+Qzh(^J
zhj1BO1n0p<SOl_8;9154z7IFUHSkdwg2UlJc%CtV``{|5Ljh#G;8@rn{(~`r@58O|
z9k?7m3I#YB=E1w*Id{B3s*L*yx`_4Q*pzYu<fvWCdK{n1NRT*=5v08ZBSEg?SdZ$;
z9Ty36`jkCt@c2bpwJ_TI47xw{sD=K;x_JtW-O)_#^he0To^ccYWo~ZLv^I5XxMZG+
z7au-^NWLJuFuN$`5tME)LMRbd^sQUIcIEn&adGqjqDe&?FvfLcn!0#@x1A|h202bk
zv_ad66(=)2UWeChC=E%+6LR^|^($AOvbJye(*9}5+3GB~R{{oHMG@0B0?Y+BR=#R?
z*nKH<tCQl?Lf1zaxh;>acM7w=Z(!xpwQ(vMx5^uh5>CTnuH7-J9yhl85l)DS;2F#*
z8<zD?&s^Lp5>9RET#Ymv@(4!Ok}*D9Fx2)QwSBNlciO{gX)7W6sSJM;Jrk^1+0K}_
zQH7ndI#yf0GIR}=TI>^7=mGr>F3u|dUtDC{<rjG)?S{?`?}aArbw<f8)V=|Xe`Rc`
zx@9u3Va-ZiJM#T~>(<BRsHG~$I<`(-G_5VnqU>?m<Ku4W3OAz`#v8PYder)&=|-|%
zHAZ9^)L=@KCZCCvJ~;oyy@>bNuby&?@GE-QPV}Yrn|a_0eZs6qqK15O1F_xnesnFh
zJtGrt)pdZL+lb7*=m2}lhAW&um<MtHvK`3>DrM7N2#_ABHhm9V|D9JfBJQ`X`R<hU
z1+AxLl0`hu{iM56j#}Gk5CMI6V=cHO>*$O?_x{cq@5XM7>D<xPDalFV-d86N{`X0w
zx8L(+Yvx#AVx3LrWnOYTXO4^<>a+5-RaL#BBfpTP7<={O%s;1#%S*y}iC>k&={H}m
zj5cU@WmzG;l-_Q?%$#WTkxI?XSGMx1tNpM2cL5P68mi_xohxZ~?HNBF4h#p^^VOPJ
zu(aE(taFq#k!B%ZjQHZar%|wNt+I4-EUN<jH@%XHGZd&YQHNQhx0A8k64q3>9U+mf
zLoo$O{Bb4e%3=e_hcZefjH|#h2uZ?V5rnRb`WxXpY)5lHqb-^2Rb75)hqr{2rGdfq
zn>t`s&UpffhO51!7EZ%?=ajQB4!L@DX7$n=zWHU)5toLJYY!*8PdAnexfi!hO2iDg
zUW-JW$k!XSz#Rj*=?>*a6e@v^kG9ds43a>o6+;X$qIm%;>Y!?Pl`$0ASrjVC%17sP
znu})r!gkjT2JAx;^D;4mRkbau2qmN!w29%y7^4`@Yrclo*8ycRSoB}aJM`j;z+xWi
zM9r+TAkz?^b!9Yco442SWUMmV$`_<=SY^g4Y)fbz_|VyAs=PzABA+Q*kq$qmR~SzH
zhy+Dy$jq$U6Gv{+V%>qX2$O}<q4+v@bVQrE7a)0?zL|TMO=afd|9>d`Tj~Ew|KHue
z?`it_Pr+`u7DhnU|36Lt{vMFE|2yGy*dJtme-Hio-Eb>>5w^n`m;<xm3Htc=!8IUj
z{3oCceQ*-Yh9A+NzX*<pU(!dv4}J){;9NKzdf{+*iGKV2a3fp=7eW)xfYU+d_a$Es
zg3RxK5;lU&=|4$-{W`GVt#A+h^t<8j;8ZvgUZ8LOFnj{G!wK*J{qc{(Qdk1Vz`xT6
zzZ^afAA~M=9~=V*!@tn?z8x-sI-CtF;0X9BeeyftHn_y?pJUEm0Z!5W1dP_T5N$qw
z1LLLShR?(t-D`B3URy)^>Mw&27_WW=PSNT_1P(R5)D?H_z9;om1{_E)B-YH9@9W#O
zwk{$~aAehg9*JTC)!6AWB<uI}h7s=5FEG&PuXP;s-3nsY?|1mN=BDE;wrX9#Kl#M1
zS4P@!qltyblx3vaUKy7wo7PxyxKh*mWAFgVOK&Z!x&r$JMBWZ(GDDo~5)df=Hp|H!
zyYSx~rfOJTi(LZtk-c=-%|@(A`V0P?4JszL@0pn0BwGjAiw<Ke=pW8T1kx6?euA3{
zc)Cux@j8ORuWZi&>CEtSvj<AO8_11#8WRv%psycC@gd>83IY)$n-z4JCHK*3_sR5|
zrrseTvRgqQjj;Q|BuRvK8wjKj%}9GGoNWd?W&6tLkJ+-o>#s#KL$S?h&jNqE#(vPW
z4qQ+ifhT)wcwl1#o$*)2(?Rn4O13u8lI@$l4MdbFHaF<-UySsPr*e1Dks{Yf`TH%t
zj^WxyWQT)rSnR}0IEt9QKk5_?bB8M0g*$I{?SjQTTDCa|-yz0=CQD6^`?VF<9m><Y
zvBV_f5Bh2$LVF!_ya6^l@b#5)OV_W5cGuq?5{*<rN5}hOM+Eo2`WXAN7Z~RBBKs~A
zSrr*A^PU{;u#+>YXTLb6BnjzS#O%V5)#Iji-t519YtGsOAL69JsG{B<O#iLZ>u8f8
zl56{Ex2=Q7A|Gdzq^Rfr&!pce{Z;AzZ*k`Te@9>cx9~XJ3;zlO@FM;E7eIXezX)sL
zH24b;AAl3#Df;?Xz(2rxSO+WMIQSEIk$%4H`S%mJ9d3h5!Ga=)&;QZzM{pSYma%|m
z;6eBnTnV3nvtby-|NpOG0sM?{flHtP$HIHz5yk=Tgzv)F;6tzuj)FtsdBy|&8*YZr
z!4}vA1JD64GCm;t0RA(41Wp5)^Zy-V1V4h?;aWH!OjrROAoKoDfQ%tr4;R8pI36;P
zg8yXv;0m}H&WAH#5xfn4O_@9cPs47w9xjF*a3(AVU2aa9C5Kl_19qjc|4$qyg4&S3
zJzs<wO=tQoUEpCS$@$Zn@@>L@$jMjvwEA)+4ihYK3woo3-*`l6Q)@Lk|DQNa1m5iu
zhY2wv{YfVd6XHLnUr<}$?ZeGg;xI8C_l3|Tfb4LVI82CNN*jj>GvZkxHt0Bu#DusV
z#z>G@uWhQKo`mf_;4Vv+>fSf1R~2Wp>xS%^%f5{ED(h_){t6ieDLU0K`>A<rn+v&=
zTqq}c)aGG495&~Cw}kav@3`q~E1K-r97v30YR$6j45=z*I~6-B>Dbfz_SemdZRIvI
zq_#PnE}C$*<a6|4rx8#P3E^+kB9Aq0mg_PJ&2E0K!u)I9Gv39Ly?NdzC11tMPCtR`
zwn#c_J#1xJ?Act*@7yGR4Ug{JMD`oT#KdNFfaY-ZFjU!W*4VMFY&N!4YHXG_Cuil%
z+#LMi#U(zVx=gp4t2W`lX_YGFPPJ*IfG3iha^Hm7RAb_T(g+8f;RX0jlY7w_6KC$+
zRIQQy32I%8oN80a9BpL0gOiP=6Kbx`b}lE|bryS^#p;!sUm)&1wol|`JbzOiGu?TX
z+JsYr4#JIZ=fFh9>O?*#S)vlb&V^21H0uX?vXbDW(#9z&PTbY9akv_=^*><izy5)=
zdVjIesMdSt&o^q@t*yCAZEU_VT%X^)xVtOY)wOuR@h5H0tEzz$Pfm$F+v66N?G2@W
z-M(+Y4zZ29S!V+Q^4%!X8p_Y!+o$=WeXXRp?TV!vLVV1KP^%Jo+_eg2Z!^ffHm6Un
zY*VLJw&6k4WS_s9y(d9U>a5-McLZSfY-ejj1_hRc*9BzKV^&%AQq=wbuhG}MU;3l;
z|Cc#kDCz&p-hW?(t3mesTL{0QfBzud3|rthc$q%Etm)qXN5aqOvp)tmfz0zSg?EDV
z-@gnW2id#-NZ3RFd^h|pEQH7Ck6#97fd#T(zwFb07u*7}NB=rF8CJt8m<!TJe-s{q
zTi^@uDYy_WfIOTDOW<Yco5THZ4O|Tqa0<+Zm(azFpmpNtBRM1*NHmaW;I-9&H<1wM
z1r#3`f4244J_3F-@|5+Q;S$Fo`}a_I!_dA+I2Gxm@9^ZD7?y3yZO6T-9fx#hQKp(m
zmgS2p?47kUp^1b}Y)gtlKK|U8d<%^JD}Np$B|-AhiBISEKLY8b^p(zk{&`;1rtH@`
zw+sD>hnHM*CQwJV=WOk}?B#Eq*po!@ncUlZ`a+8yrX}h0_C0Zh4XH@(;ePbJ+We4(
zUl>s@qsgv{ll~3oUKKmp_PTmj`N|H?v4v}&TWB4VILg?nejR?ZMf$e>NILrrM1QKK
zLwu)R`H#G`QItPnFIwto_ZuQ!)wlN2<4dw>Pm_{G@%HixWuLi*`8f>KJG&;gsi|>w
zF63vWBgA@o#W|DBtaiL%{m6VhhN@J!PGKpoKjtL0Y9G6wg^VazPxh{kgp6G;Qi#sg
Vvq_F;r=i#Z%W(&nUZ<be`G1yE4&?v<

literal 0
HcmV?d00001

diff --git a/autogl/module/model/dgl/.gin_dgl.py.swp b/autogl/module/model/dgl/.gin_dgl.py.swp
new file mode 100644
index 0000000000000000000000000000000000000000..96e085a0fb9d99f3f17f490bf10f7469dcb345a2
GIT binary patch
literal 16384
zcmeI3TZkn`8OO^t7uPkbMhQX`D>Lf!BxlZ<*)_{%l1ZFsW-?}GSYvh(H_Nfl={lzy
z`$l#5TmrfqyaYioKB%A=^vxJSgpl|aQHU>z5ZFBEs}D-vyv1PhkpEZJ-PL_AGZRD*
z?S|i+bGqw%RrRm0tLppuOmFeR#uh)@USv4l!<cn(*8c0Qtz%C=!&u+7!=XzT4nF#R
zmZU<SUOKoK`?5CJS<TXDeY0cZW$1T;$jN*`FT(FQI5G6XE?(R5{vr07%Z&n!0!LIJ
zO9u;QZ(yfSEvZ|5cIFoTz8lXU@ykuIMuA3wMuA3wMuA3wMuA3wMuA3w{{;oo_!zs4
zjvUK76XdUN8+m<u{`v0wH5|E~e{5bF1sVk!1sVk!1sVk!1sVk!1sVk!1sVk!1sVnZ
z3l*>(#%@EqUZ;Q`&;N_~|BZJu_A+=Hd;{DER>3F0J>V4hAb8^>V^_hq!Q<dtAOfes
zP2kTrF!mDo0r)<+0$lJJa3{DG%mWMD2>$Xe#(oMO178Oz=z&jz8E^vp;RIv9244dK
zxC`6~I^YEO-8&h35_}bW1-M`qTnk<~&e+evkHMqh^I#tQ{T+<`4g3N;3YNh?uV?I4
z@I1HzE&~D9fCa7tuU*I3AHhrDN8n*_JNP&_4L$^pgXgYAU%&%k4txx}9~=X(T*KJU
zz~kTxU;}&rFz_2BUY-JvfJ<N=oCLo@!e$>_05<~~zkd};o1^&|&yS(BW49Yek?)1W
zZn__fWuByx71!z2jdpn&aeFwFVrZv=hr%1Wy+|h9O0uBE17U|P9!Vb9d-LU2i&BSJ
z-x%;U+fPJmVg+{S@V*G~3lkpVM<NNgef)4lq^^+dvL<RI%seDBSn-7|LoVXP^P`a3
z?RZIw&ShTW)=dp$6qvr0)|7!R3@q~=bV1+BOH`2~qd3Y^F74EdI91^aKJY@@=g<(9
zbKl+<MnQF{n}2JW5B$hZYX%>}_romcp^MRg_kBA_(9Z$njHPhAKB_S-K+SQMb{#KR
z=3Y2%2p2?{;2XB@rTb*i^&CfpJPW-P>ZN>jb5pl4DO;h7ycMHfh*t1{u+vNmV@REz
zZpZYps#JoG@W79a8I<edL{|xkVVKm>18mWNgd&p|kx-<&k^ExWQ?fkC>OygpCC}N?
z4&ZhPD^JbL%%~qK@tCd&y2ulel5>@1cyUbh{`uwcf@VZp+Kmcd$z7Q|vBk&l)0Q&j
zhym|*Jq&KQYbC-Tw8)q8KI->I$rhB%y{DD?1r3(Agx;-hY;)B^yl2W0IZjz&*xpjV
z(?au&8q`rKF#aJ#@CR)@q{+pFrAwA;W&tWjhs#&^T3ZS~Q_XDm?6mK8!$=0nMemY6
zSD3(OcYeNZgYE~9JVoMnX+oDbJ>?60X+&JAaF40F^FOmRNo;MND^ChcJM|G6?~qlQ
z(a4T6lDn_cs<h?}szP)liQc8!JdF}Muxm>vAEZ6flI&FvrDH{ywjIYJbZ7wXCAqet
z){<jc=6;=|lJak()R;(Ytjb*XN_CrRCaYA0>AjqJMn;CrRXyNfGu5`&T0#SSP}5J1
zjPJo!PIPoMyjJC?-td?-l6|*bdi*BV4y*2n)q3CR7jmbdTY;9mT4QGUR_3SPg4Uq!
zTH}sdX$7pIz4?e$`dt~Yk&1L#eXEz3gbxR<ILpckUmCeNY%dY~g6(JGJ}Dz<&7gR`
zZ0SjrCvKGa4(|ybM~RnuJK~lZBVWCOyU2c7z3Px@GCE~G)C*PHSZQ#*kalUKH|-7R
z=Ea?8LuT$J#cEwwI>}-oEld(E<<s-+a&k4@pxLpkjpO*gU%^W?%-Gad?P7UdC`(RW
zUm<+HIpO^%#6~nT+n+<0x{BwUIi@ykX>Z2pQ7yY(>J~1bJ<Tk7xISgk%hw0D>_%l-
zt1NnSR!=TrbuBDUV@WQ~k1q{wb!o`0=zF}n2&fCN(>Aw>@zCNTzJ?-YW3_Xy#<9P@
zjm`907WSvO`2?+DD4&5L)cM$<KtS!ZV5!&%a(71yt8Sosw>fR!9~7JC+eX}4^&>K?
z9Xb8{8xvZ*ujk^SAN9Bw#F0$-XS3j(4pmxwb!S+<-?I1e_iU00xYABx0vno7;v>r~
zmh=4pV$e<-n?^g~YopicWEj@YVlPC!!VlWrNX}sw8^pfA?mMNxAYA5dnj(hi;3w^=
zoAuiLDCq18&&}*Rmd<qIXjjNV<}VDxFkwZ}2+O?`JD%8WW9Qnzl9&bec+QI4Ur)|>
ztG7Q8ltpd1=k2s3IqcZIq_cE(X|cVyc=ps8c0Z!EbGdbHOTpJE#N*p~L%gjw#EEJ;
z#s59Tr#pycDgG~>@Bb39{j=aH@EGU;iu>;dbKo_^_P+(sgYSSxzyi1#yofmd1@I(z
z5KvtIUho29_bcFjuns;9t^rpOvp)g82_6O?1s?&gB3}OocoF;rd<lFGw83%kI^y=1
z!By}qh`<GK9$0{Z-y@EH4m<&V2(Ez3;0|yS{0aU39{4UG4KmOijRK7VjRK7VjROA}
z1$cfGxrTluMK{_JQfF=Ip+z!smEV@{EGeN_%bIjewvZAkl+qPW7kQL&`$zQ_r;80L
zeYS?k2AN_i(}FXULJ-){3uHP)kqVHa*aeccS&nE4<pX6Gc`#1>K#mrfH<hg=6L#O#
z=__Rr*Z1=bDI*hfjCFE_<NuV@rTkC6qetyUcA?T>Dl>T>UR=?;=z7L!f&o<w|ADB3
zSyFL=GA6U4ikpZh&p|P&ln&Eoh<(w$#MD{*nMK@@q?Oz(x`ixiv2&y(trAUV0xU1Y
z|5!RCt_pGVK#hkDs;QNLnrf3OV&9I^jbd*q92L4Vx=P2C%mTRuT5a~#mhlgjC>YO2
zawH7q@Bm=0o-|M*<>t(m{ix=Ud_TaR2?r|nkYt$BI6SL>F{b*BKdNPP8=<3!H$J8F
z`c^GpKW~Z`U!zx(Z<!Km8nueAsoHc_BB|V}g*&sN9KDVYN^#XxTnTq85#Ya9FQn5x
zhoM|F!+2n3ZY)?G?<4dr!z`Uh9!aas@?F=%ED_joqGC$jBf3KzZ!i!Nw?>f`z_S26
zimE&s(X$6D6q@CEcB=^J)RPqD5yd2xkYQ7Wx!3B0tw!wdY^?Esk*Stilt-IZJ?N!S
z8oBxWDO&CMSc@;}ki1<!h8i)enpI9xrT>%y6hfd9x`Qc|QG1+H%lsFU6g>r~ysx{_
zWOtlyzv7xkoayF|?scl`(<j`~0Xx+1>QWwBoLo!K+fcRgTu7NIhYM!P_vN6Bwj47~
s`IN>KQn^RC%#@@IjVxsx$}iA~v4^v`S3E@h<@#&qi?4Z9TRy3M6Izu!kN^Mx

literal 0
HcmV?d00001

diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index 7a45f5e..7e2af04 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -8,7 +8,8 @@ from .graph_saint import GraphSAINTAggregationModel
 from .gcn import AutoGCN
 from .gat import AutoGAT
 from .gin import AutoGIN
-from .gin_dgl import GIN
+#from .gin_dgl import GIN
+from .gin import GIN
 
 __all__ = [
     "ModelUniversalRegistry",
diff --git a/autogl/module/model/dgl/gin.py b/autogl/module/model/dgl/gin.py
index 52a495a..507c6b9 100644
--- a/autogl/module/model/dgl/gin.py
+++ b/autogl/module/model/dgl/gin.py
@@ -1,7 +1,9 @@
 import torch
+import torch.nn as nn
 import torch.nn.functional as F
 from torch.nn import Linear, ReLU, Sequential, LeakyReLU, Tanh, ELU
-from torch_geometric.nn import GINConv, global_add_pool
+#from torch_geometric.nn import GINConv, global_add_pool
+from dgl.nn.pytorch.conv import GINConv
 from torch.nn import BatchNorm1d
 from . import register_model
 from .base import BaseModel, activate_func
@@ -18,101 +20,178 @@ def set_default(args, d):
     return args
 
 
+class ApplyNodeFunc(nn.Module):
+    """Update the node feature hv with MLP, BN and ReLU."""
+    def __init__(self, mlp):
+        super(ApplyNodeFunc, self).__init__()
+        self.mlp = mlp
+        self.bn = nn.BatchNorm1d(self.mlp.output_dim)
+
+    def forward(self, h):
+        h = self.mlp(h)
+        h = self.bn(h)
+        h = F.relu(h)
+        return h
+
 class GIN(torch.nn.Module):
-    def __init__(self, args):
+    #def __init__(self, args):
+    def __init__(self, args, num_layers, num_mlp_layers, input_dim, hidden_dim,
+                 output_dim, final_dropout, learn_eps, graph_pooling_type,
+                 neighbor_pooling_type):
         super(GIN, self).__init__()
         self.args = args
-        self.num_layer = int(self.args["num_layers"])
+        #self.num_layer = int(self.args["num_layers"])
+        self.num_layer = num_layers
         assert self.num_layer > 2, "Number of layers in GIN should not less than 3"
 
-        missing_keys = list(
-            set(
-                [
-                    "features_num",
-                    "num_class",
-                    "num_graph_features",
-                    "num_layers",
-                    "hidden",
-                    "dropout",
-                    "act",
-                    "mlp_layers",
-                    "eps",
-                ]
-            )
-            - set(self.args.keys())
-        )
-        if len(missing_keys) > 0:
-            raise Exception("Missing keys: %s." % ",".join(missing_keys))
-        if not self.num_layer == len(self.args["hidden"]) + 1:
-            LOGGER.warn("Warning: layer size does not match the length of hidden units")
-        self.num_graph_features = self.args["num_graph_features"]
-
-        if self.args["act"] == "leaky_relu":
-            act = LeakyReLU()
-        elif self.args["act"] == "relu":
-            act = ReLU()
-        elif self.args["act"] == "elu":
-            act = ELU()
-        elif self.args["act"] == "tanh":
-            act = Tanh()
-        else:
+        #missing_keys = list(
+        #    set(
+        #        [
+        #            "features_num",
+        #            "num_class",
+        #            "num_graph_features",
+        #            "num_layers",
+        #            "hidden",
+        #            "dropout",
+        #            "act",
+        #            "mlp_layers",
+        #            "eps",
+        #        ]
+        #    )
+        #    - set(self.args.keys())
+        #)
+        #if len(missing_keys) > 0:
+        #    raise Exception("Missing keys: %s." % ",".join(missing_keys))
+        #if not self.num_layer == len(self.args["hidden"]) + 1:
+        #    LOGGER.warn("Warning: layer size does not match the length of hidden units")
+        #self.num_graph_features = self.args["num_graph_features"]
+        self.num_graph_features = 0
+
+        #if self.args["act"] == "leaky_relu":
+        #    act = LeakyReLU()
+        #elif self.args["act"] == "relu":
+        #    act = ReLU()
+        #elif self.args["act"] == "elu":
+        #    act = ELU()
+        #elif self.args["act"] == "tanh":
+        #    act = Tanh()
+        #else:
+        #    act = ReLU()
             act = ReLU()
+            act_str = "relu"
 
-        train_eps = True if self.args["eps"] == "True" else False
+        #train_eps = True if self.args["eps"] == "True" else False
+        train_eps = learn_eps
 
         self.convs = torch.nn.ModuleList()
         self.bns = torch.nn.ModuleList()
 
-        nn = [Linear(self.args["features_num"], self.args["hidden"][0])]
-        for _ in range(self.args["mlp_layers"] - 1):
+        #nn = [Linear(self.args["features_num"], self.args["hidden"][0])]
+        nn = [Linear(input_dim, hidden_dim)]
+        #for _ in range(self.args["mlp_layers"] - 1):
+        for _ in range(num_layers - 1):
             nn.append(act)
-            nn.append(Linear(self.args["hidden"][0], self.args["hidden"][0]))
+            #nn.append(Linear(self.args["hidden"][0], self.args["hidden"][0]))
+            nn.append(Linear(hidden_dim, hidden_dim))
         # nn.append(BatchNorm1d(self.args['hidden'][0]))
-        self.convs.append(GINConv(Sequential(*nn), train_eps=train_eps))
-        self.bns.append(BatchNorm1d(self.args["hidden"][0]))
-
-        for i in range(self.num_layer - 3):
-            nn = [Linear(self.args["hidden"][i], self.args["hidden"][i + 1])]
-            for _ in range(self.args["mlp_layers"] - 1):
+        # self.convs.append(GINConv(Sequential(*nn), learn_eps=train_eps))
+        self.convs.append(GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, train_eps))
+        #self.bns.append(BatchNorm1d(self.args["hidden"][0]))
+        self.bns.append(BatchNorm1d(hidden_dim))
+
+        #for i in range(self.num_layer - 3):
+        for i in range(num_layers - 3):
+            #nn = [Linear(self.args["hidden"][i], self.args["hidden"][i + 1])]
+            nn = [Linear(hidden_dim, hidden_dim)]
+            #for _ in range(self.args["mlp_layers"] - 1):
+            for _ in range(num_mlp_layers - 1):
                 nn.append(act)
                 nn.append(
-                    Linear(self.args["hidden"][i + 1], self.args["hidden"][i + 1])
+                    #Linear(self.args["hidden"][i + 1], self.args["hidden"][i + 1])
+                    Linear(hidden_dim, hidden_dim)
                 )
             # nn.append(BatchNorm1d(self.args['hidden'][i+1]))
-            self.convs.append(GINConv(Sequential(*nn), train_eps=train_eps))
-            self.bns.append(BatchNorm1d(self.args["hidden"][i + 1]))
+            self.convs.append(GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, train_eps))
+            #self.convs.append(GINConv(Sequential(*nn), learn_eps=train_eps))
+            #self.bns.append(BatchNorm1d(self.args["hidden"][i + 1]))
+            self.bns.append(BatchNorm1d(hidden_dim))
+
+        #self.fc1 = Linear(
+        #    self.args["hidden"][self.num_layer - 3] + self.num_graph_features,
+        #    self.args["hidden"][self.num_layer - 2],
+        #)
+        #self.fc2 = Linear(
+        #    self.args["hidden"][self.num_layer - 2], self.args["num_class"]
+        #)
+
 
         self.fc1 = Linear(
-            self.args["hidden"][self.num_layer - 3] + self.num_graph_features,
-            self.args["hidden"][self.num_layer - 2],
+            hidden_dim + self.num_graph_features,
+            hidden_dim,
         )
         self.fc2 = Linear(
-            self.args["hidden"][self.num_layer - 2], self.args["num_class"]
+            hidden_dim, output_dim
         )
 
-    def forward(self, data):
-        x, edge_index, batch = data.x, data.edge_index, data.batch
+
+        self.drop = nn.Dropout(final_dropout)
+
+#    def forward(self, data):
+#        x, edge_index, batch = data.x, data.edge_index, data.batch
+#
+#        if self.num_graph_features > 0:
+#            graph_feature = data.gf
+#
+#        for i in range(self.num_layer - 2):
+#            x = self.convs[i](x, edge_index)
+#            x = activate_func(x, self.args["act"])
+#            x = self.bns[i](x)
+#
+#        #x = global_add_pool(x, batch)
+#        if self.num_graph_features > 0:
+#            x = torch.cat([x, graph_feature], dim=-1)
+#        x = self.fc1(x)
+#        x = activate_func(x, self.args["act"])
+#        x = F.dropout(x, p=self.args["dropout"], training=self.training)
+#
+#        x = self.fc2(x)
+#
+#        return F.log_softmax(x, dim=1)
+
+    def forward(self, g, h):
+        # list of hidden representation at each layer (including input)
+        hidden_rep = [h]
 
         if self.num_graph_features > 0:
             graph_feature = data.gf
 
         for i in range(self.num_layer - 2):
-            x = self.convs[i](x, edge_index)
-            x = activate_func(x, self.args["act"])
+            x = self.convs[i](g, h)
+            x = activate_func(x, act_str)
             x = self.bns[i](x)
+            hidden_rep.append(h)
 
-        x = global_add_pool(x, batch)
-        if self.num_graph_features > 0:
-            x = torch.cat([x, graph_feature], dim=-1)
-        x = self.fc1(x)
-        x = activate_func(x, self.args["act"])
-        x = F.dropout(x, p=self.args["dropout"], training=self.training)
+        #x = global_add_pool(x, batch)
+        #if self.num_graph_features > 0:
+        #    x = torch.cat([x, graph_feature], dim=-1)
+        #x = self.fc1(x)
+        #x = activate_func(x, act_str)
+        ##x = F.dropout(x, p=self.args["dropout"], training=self.training)
+        #x = F.dropout(x, p=final_dropout, training=self.training)
+        #x = self.fc2(x)
 
-        x = self.fc2(x)
+        score_over_layer = 0
 
+        # perform pooling over all nodes in each graph in every layer
+        for i, h in enumerate(hidden_rep):
+            pooled_h = self.pool(g, h)
+            score_over_layer += self.drop(self.linears_prediction[i](pooled_h))
+
+        return score_over_layer
         return F.log_softmax(x, dim=1)
 
 
+
 @register_model("gin")
 class AutoGIN(BaseModel):
     r"""
diff --git a/test/model_glf/gclf_dgl.py b/test/model_glf/gclf_dgl.py
index a3d16b6..bb78e55 100644
--- a/test/model_glf/gclf_dgl.py
+++ b/test/model_glf/gclf_dgl.py
@@ -16,6 +16,7 @@ import torch.nn as nn
 import torch.nn.functional as F
 import torch.optim as optim
 
+from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
 from autogl.module.model.ginparser import Parser
 from autogl.module.model.dataloader_gin import GINDataLoader
 from autogl.module.model import GIN
@@ -39,6 +40,7 @@ def train(args, net, trainloader, optimizer, criterion, epoch):
         labels = labels.to(args.device)
         graphs = graphs.to(args.device)
         feat = graphs.ndata.pop('attr')
+        set_trace()
         outputs = net(graphs, feat)
 
         loss = criterion(outputs, labels)
@@ -86,7 +88,7 @@ def eval_net(args, net, dataloader, criterion):
     return loss, acc
 
 
-def main(args):
+def main(args, args_autogl):
 
     # set up seeds, args.seed supported
     torch.manual_seed(seed=args.seed)
@@ -107,8 +109,9 @@ def main(args):
         seed=args.seed, shuffle=True,
         split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
     # or split_name='rand', split_ratio=0.7
+    set_trace()
 
-    model = GIN(
+    model = GIN(args_autogl,
         args.num_layers, args.num_mlp_layers,
         dataset.dim_nfeats, args.hidden_dim, dataset.gclasses,
         args.final_dropout, args.learn_eps,
@@ -168,9 +171,26 @@ def main(args):
 
 
 if __name__ == '__main__':
+    parser = ArgumentParser(
+        "auto graph classification", formatter_class=ArgumentDefaultsHelpFormatter
+    )
+    parser.add_argument(
+        "--dataset",
+        default="mutag",
+        type=str,
+        help="graph classification dataset",
+        choices=["mutag", "imdb-b", "imdb-m", "proteins", "collab"],
+    )
+    parser.add_argument(
+        "--configs", default="../configs/graphclf_full.yml", help="config files"
+    )
+    parser.add_argument("--device", type=int, default=0, help="device to run on")
+    parser.add_argument("--seed", type=int, default=0, help="random seed")
+    args_autogl = parser.parse_args()
+
     args = Parser(description='GIN').args
     print('show all arguments configuration...')
     print(args)
-
-    main(args)
+    print(args_autogl)
+    main(args, args_autogl)
 

From b4445badc6254d51aa40040e49ae3d47a28f0cba Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Tue, 31 Aug 2021 08:21:51 +0000
Subject: [PATCH 18/75] add gitignore

---
 .gitignore | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.gitignore b/.gitignore
index fb86bb4..6d46998 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,5 +1,5 @@
 .DS_Store
-
+*.swq
 # Byte-compiled / optimized / DLL files
 __pycache__/
 *.py[cod]

From f59c8dce28ba08e7539005d34065cfe23836af9f Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Tue, 31 Aug 2021 08:23:20 +0000
Subject: [PATCH 19/75] add gitignore

---
 autogl/module/model/dgl/.gin.py.swp     | Bin 36864 -> 0 bytes
 autogl/module/model/dgl/.gin_dgl.py.swp | Bin 16384 -> 0 bytes
 2 files changed, 0 insertions(+), 0 deletions(-)
 delete mode 100644 autogl/module/model/dgl/.gin.py.swp
 delete mode 100644 autogl/module/model/dgl/.gin_dgl.py.swp

diff --git a/autogl/module/model/dgl/.gin.py.swp b/autogl/module/model/dgl/.gin.py.swp
deleted file mode 100644
index ab414a2fd726e51212ac224ec5454f5c60d2fcbb..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 36864
zcmeI53zTF<d4OA<>IxDiJluFv=?T)a+uJ*{yKt7l!F?~2%nq<GIGG)K?@ZsBzHCo-
z(~o^*9T9wRq6b7HiXIG0g2+KkqC7>EM<OVQ$Ob}kjvT}+VuCz^K|oOR{dM2BZ_i^{
z9?I>r-`?q4b?g51*I#vSRsB^x+_kZ9jar=RO7S@?m3r)vdB&6J?0(nXkV=gdjq+Gg
z0w({Al$!O1SzFjWd9>7r>;&g8Z8j>a`{x@R#!B<YD}`psl!IBCU*N=;RnAp+Op#U+
zoM<4?zzj6dY>duZd`N2Hf^J>aJJNrq-u<o(Ge{tbnrI-=K%#*}1BnI_4I~;!G>~W@
z(ZKJ!1{&3aQ|FM0{hW*(<Q(4;IUeAApWP;&d)>lFJU5-UI_H-;$Mw$94L{KNKF2v)
zk?@0^?^~SX$0FhTJKx{o93PH^J71GSqJcyMi3So4BpOIGkZ2&$K%#*}1BnI_4I~<P
zQ)<8{q*8khO{I={C)sEI-|ff$lJ5`0w_yh?0g3YzaUXzd;T!N7_%vJuTVW8ELMI#z
zN5PTs(jlY=--KOo790V83@^}We;gi!ufs(!3M=4!a4`I0Rw{Kj{1bc$J_TFAfDgcP
zZ%?IefFYO-?|~=ZmP*|RSHcBg!W#H<m<7LKP+|}K7hDdzpb7o(m#`n)%fQ1opa65>
zrzq&la0P6KIq<&>UhIY&p#W>)-Eb#^Cg;M3!Gt5=Q3fg=f?J>pqhP|xa3CB2KV~rI
zCb$tk31`Awcn8da#~3u(;|`om$7+@H*{*ukSgA5>l=4QQkgrxMrOfuM8a5gu#m-d9
zjV4ElS~p9hx#4ns&>G5Y?`#P+MjF;uqhaPpo8=KnN5?m6WA(u_Vd<gPOLUBpN_nfD
zW>%SnF*9$K3uYkw(MnBO$||cG?k8qOUsG<5=S#*8v!>>$1)V)%S;uNdwU{3@jYhL(
zB6q=P7`d@gPhe}*7EKZf#jUH8R97G|^56^P=*3NsFr98Nf<B?Or|(rTM-{?vGin7b
zwS7fU+OS3f`YKw5f>}-v4YuZXD5O})!$`@f*V98@{`57YBMT6<-zu9%E#n34-3`6V
z6`yHIxo}9$ZKvd{mz*PLcR)}t%)1o^moutWvs}n56T=*+)W*AQh30JI@|0z9)9#_p
zm`rLLbCX%!H?SO=%d9icZkpwWWt1{=%H__iYSav?oHwiWUhl6+VjZenc9V&h=2%;r
zV}}N<xh=9troz(68TmK`6{lP~SD{jm<~XI(2>j<uIY|(eGAxYLw0xwd*(x3{RqgtQ
zol)hwG2+18PzpsjI9VRTRvVSyx812K`@&%L(b}4UeRKtFLtnfv>|!Q15t2YO=oi!^
z+Ushgy-89FmF-@YYr8Ua+SPiVrYGHAupz%qc8ducX;f+>#T=PlqrLq4t$HKl+n`@0
zZKHZ-=haZ6uCFys<+kd!!BUB_)ZSi|mcX<!OLbGNGWg$@OZ1PPNMNnmzab!pL=GFc
z9c{f)E{39o?@1)*o(&?V<5E}|xlg+U%u+M<`W8XkB~WXZLceKj*%3*mT_Pokn|G4(
zG_Ol3=Gp1IAlUkE4G%n^MDhKntX{oxZH|XyIg>t}|E=;^kFuZXb?dK9Rj8PCRjxGD
zxU~AJQ8ZP_ERQvcsxqqV21GT>R->Nw4Ty}$6`q84a##UZ+Aj{_Cq}0{Fv8`;BLGWT
zxqZZ}HmnM=t+DELWK&zr9rYe{Og)!Y$Eb8Roja>yl{4dZXkJ1C&k6*QTZTgImkY_e
ze0-th+dO1$_!8zMxlACv)+^+U-)zb^_mdXe_aCzEX*s3??Rc9QV#IBN3bjhL(rg>-
zH0o_G7K6~m(N?w?lbIwf`=zH%gissR8fP#SRElWcI}t1~8itZIP=1TSdzM*iv9FWV
zf~-mpG{=W|AH_KBY|3+#Hw{%UR+^=Pw#$-PuVctYSuIR^cZ?b<*99zLFda}_;0;<|
zCB}@9a`2ODR?S+58{01oow+>k(^ey&cN#8vDfLcCDp`F!k5#Qv5jhiSrR9;U)32Gl
zQJ2H_Q+#x#+Cp=ywt8|<1GeZ)qXr4LYneQWwq(^-QBEOeHOz6$yeB0>Q4D#GMzhq&
z$OXJD>l@n*1!<2Fp;Q?gBYSD2<OyPysQanWT4h}2_%s_<sjjT?YK1cLW7`o%D%Bls
zSiv-_^4+;~*r3Kcmo4LOoib_(_Gk1>@J5$sS9OQ2AbELkuR|btr%ZL|h&nt!W>&_{
zM$H=GqDZ`KwBKcm;ws*aZNC#__46sK{P)$Y@|y9ilBZHu@nlIkd2mz7Nk>c?F{7l6
zx>^+tmy_jk=xj>*|I%;21El{?S6hF6MPL6pcmTcyUxG{FJlG7&p$iTJx%PIsKKUdX
zNHmaWAkjdgfkXp|1`-V<8b~ydXdux*qJdXU12P~XA3Z{%SCKPzAfp;P=giUPsz%Ki
zXL!N+THL{aiG6OOGuNotqi_Xtt2JW!gLL{z8AxHah|$RcY0AKIO5e))&mJD}PPwD1
zfvfzX#txNEr~AD0lom9{Ieoc|hxnIiiDWFqxsN_X1PTmGb6>euS#>R<f6vGzl84BM
z_=N8N@1fIQVjf=l|E_=kBhs&j&%*?4f<ZVDdf){3Q#b(rhra)AaK`~|<L_NifYl&=
z0Q<oYxW_&4b@&3D2Xfzo;6V5}ay$gzh0Ec?un`u)5%4_o{6B`9;WD@Y&VfNV4d%mR
z%==#nYhV_<9Uf+`|5o@MOuz={g~Q<`=J=n42jJh}({K@(@P0TEo@L(u+wk|W9%jRC
z=KU{*&q5L21CKK2e+PU8*26N`A8ugY|7@tj1~>@rXP*BqxCS=EM%Vz0;W_5`{||lu
zSHV|cCk()Bc$vBXm*By6J^-%WB=h~re1CM#TsI2d7_+!j421{Gbp$=aoA#z{TQ2(j
zobP9TtCr07hdpcTk`Bxhy$R?0C%21azJD~@h~S8j%=h~*TJpTLJqD8be)ruYneTTs
zA;)CCU+IbMu=`~@#{+pi`2(EqcMYN_9kHCa*<^}-k5kU-_pIS^>}ej+?s@4hGP53V
zG%W_Zi%u$}$K-X3*COfU@am{GnSQs%{rl^y2;?&UPr1U@wSU3VYPGaufEoBzOfgU2
z(}08!Op>CfyP=A|tf?J)%A}-Rhuz{<wavoKXHEa9S+#6H8RdeW0N1@^+esmG`;6yK
zru_vZ^*6Djg5%TRdJxpiF<e;8T3!z@#CsV8OhWhnze7LxJo?Gf|DWTG(>z4Keixh%
zr^6vI3!bGP{|tN&?t-gf82aF3Q1CK+dGYtZ555ZL!Z0j_C2%x6Lx298unTrT4xXU@
zz8mg`>)=`#hh;Du?m@=8;cEB@h|I@u{^uNj0*}DGa4TE^pMWM9umrkc4s^m>;Ck{s
z2Fu}B^z(lK{|FbuXW@ge2Ga02eg22xPPhsF22AJySr_nLc$P7M@4=;T4y*+Qzh(^J
zhj1BO1n0p<SOl_8;9154z7IFUHSkdwg2UlJc%CtV``{|5Ljh#G;8@rn{(~`r@58O|
z9k?7m3I#YB=E1w*Id{B3s*L*yx`_4Q*pzYu<fvWCdK{n1NRT*=5v08ZBSEg?SdZ$;
z9Ty36`jkCt@c2bpwJ_TI47xw{sD=K;x_JtW-O)_#^he0To^ccYWo~ZLv^I5XxMZG+
z7au-^NWLJuFuN$`5tME)LMRbd^sQUIcIEn&adGqjqDe&?FvfLcn!0#@x1A|h202bk
zv_ad66(=)2UWeChC=E%+6LR^|^($AOvbJye(*9}5+3GB~R{{oHMG@0B0?Y+BR=#R?
z*nKH<tCQl?Lf1zaxh;>acM7w=Z(!xpwQ(vMx5^uh5>CTnuH7-J9yhl85l)DS;2F#*
z8<zD?&s^Lp5>9RET#Ymv@(4!Ok}*D9Fx2)QwSBNlciO{gX)7W6sSJM;Jrk^1+0K}_
zQH7ndI#yf0GIR}=TI>^7=mGr>F3u|dUtDC{<rjG)?S{?`?}aArbw<f8)V=|Xe`Rc`
zx@9u3Va-ZiJM#T~>(<BRsHG~$I<`(-G_5VnqU>?m<Ku4W3OAz`#v8PYder)&=|-|%
zHAZ9^)L=@KCZCCvJ~;oyy@>bNuby&?@GE-QPV}Yrn|a_0eZs6qqK15O1F_xnesnFh
zJtGrt)pdZL+lb7*=m2}lhAW&um<MtHvK`3>DrM7N2#_ABHhm9V|D9JfBJQ`X`R<hU
z1+AxLl0`hu{iM56j#}Gk5CMI6V=cHO>*$O?_x{cq@5XM7>D<xPDalFV-d86N{`X0w
zx8L(+Yvx#AVx3LrWnOYTXO4^<>a+5-RaL#BBfpTP7<={O%s;1#%S*y}iC>k&={H}m
zj5cU@WmzG;l-_Q?%$#WTkxI?XSGMx1tNpM2cL5P68mi_xohxZ~?HNBF4h#p^^VOPJ
zu(aE(taFq#k!B%ZjQHZar%|wNt+I4-EUN<jH@%XHGZd&YQHNQhx0A8k64q3>9U+mf
zLoo$O{Bb4e%3=e_hcZefjH|#h2uZ?V5rnRb`WxXpY)5lHqb-^2Rb75)hqr{2rGdfq
zn>t`s&UpffhO51!7EZ%?=ajQB4!L@DX7$n=zWHU)5toLJYY!*8PdAnexfi!hO2iDg
zUW-JW$k!XSz#Rj*=?>*a6e@v^kG9ds43a>o6+;X$qIm%;>Y!?Pl`$0ASrjVC%17sP
znu})r!gkjT2JAx;^D;4mRkbau2qmN!w29%y7^4`@Yrclo*8ycRSoB}aJM`j;z+xWi
zM9r+TAkz?^b!9Yco442SWUMmV$`_<=SY^g4Y)fbz_|VyAs=PzABA+Q*kq$qmR~SzH
zhy+Dy$jq$U6Gv{+V%>qX2$O}<q4+v@bVQrE7a)0?zL|TMO=afd|9>d`Tj~Ew|KHue
z?`it_Pr+`u7DhnU|36Lt{vMFE|2yGy*dJtme-Hio-Eb>>5w^n`m;<xm3Htc=!8IUj
z{3oCceQ*-Yh9A+NzX*<pU(!dv4}J){;9NKzdf{+*iGKV2a3fp=7eW)xfYU+d_a$Es
zg3RxK5;lU&=|4$-{W`GVt#A+h^t<8j;8ZvgUZ8LOFnj{G!wK*J{qc{(Qdk1Vz`xT6
zzZ^afAA~M=9~=V*!@tn?z8x-sI-CtF;0X9BeeyftHn_y?pJUEm0Z!5W1dP_T5N$qw
z1LLLShR?(t-D`B3URy)^>Mw&27_WW=PSNT_1P(R5)D?H_z9;om1{_E)B-YH9@9W#O
zwk{$~aAehg9*JTC)!6AWB<uI}h7s=5FEG&PuXP;s-3nsY?|1mN=BDE;wrX9#Kl#M1
zS4P@!qltyblx3vaUKy7wo7PxyxKh*mWAFgVOK&Z!x&r$JMBWZ(GDDo~5)df=Hp|H!
zyYSx~rfOJTi(LZtk-c=-%|@(A`V0P?4JszL@0pn0BwGjAiw<Ke=pW8T1kx6?euA3{
zc)Cux@j8ORuWZi&>CEtSvj<AO8_11#8WRv%psycC@gd>83IY)$n-z4JCHK*3_sR5|
zrrseTvRgqQjj;Q|BuRvK8wjKj%}9GGoNWd?W&6tLkJ+-o>#s#KL$S?h&jNqE#(vPW
z4qQ+ifhT)wcwl1#o$*)2(?Rn4O13u8lI@$l4MdbFHaF<-UySsPr*e1Dks{Yf`TH%t
zj^WxyWQT)rSnR}0IEt9QKk5_?bB8M0g*$I{?SjQTTDCa|-yz0=CQD6^`?VF<9m><Y
zvBV_f5Bh2$LVF!_ya6^l@b#5)OV_W5cGuq?5{*<rN5}hOM+Eo2`WXAN7Z~RBBKs~A
zSrr*A^PU{;u#+>YXTLb6BnjzS#O%V5)#Iji-t519YtGsOAL69JsG{B<O#iLZ>u8f8
zl56{Ex2=Q7A|Gdzq^Rfr&!pce{Z;AzZ*k`Te@9>cx9~XJ3;zlO@FM;E7eIXezX)sL
zH24b;AAl3#Df;?Xz(2rxSO+WMIQSEIk$%4H`S%mJ9d3h5!Ga=)&;QZzM{pSYma%|m
z;6eBnTnV3nvtby-|NpOG0sM?{flHtP$HIHz5yk=Tgzv)F;6tzuj)FtsdBy|&8*YZr
z!4}vA1JD64GCm;t0RA(41Wp5)^Zy-V1V4h?;aWH!OjrROAoKoDfQ%tr4;R8pI36;P
zg8yXv;0m}H&WAH#5xfn4O_@9cPs47w9xjF*a3(AVU2aa9C5Kl_19qjc|4$qyg4&S3
zJzs<wO=tQoUEpCS$@$Zn@@>L@$jMjvwEA)+4ihYK3woo3-*`l6Q)@Lk|DQNa1m5iu
zhY2wv{YfVd6XHLnUr<}$?ZeGg;xI8C_l3|Tfb4LVI82CNN*jj>GvZkxHt0Bu#DusV
z#z>G@uWhQKo`mf_;4Vv+>fSf1R~2Wp>xS%^%f5{ED(h_){t6ieDLU0K`>A<rn+v&=
zTqq}c)aGG495&~Cw}kav@3`q~E1K-r97v30YR$6j45=z*I~6-B>Dbfz_SemdZRIvI
zq_#PnE}C$*<a6|4rx8#P3E^+kB9Aq0mg_PJ&2E0K!u)I9Gv39Ly?NdzC11tMPCtR`
zwn#c_J#1xJ?Act*@7yGR4Ug{JMD`oT#KdNFfaY-ZFjU!W*4VMFY&N!4YHXG_Cuil%
z+#LMi#U(zVx=gp4t2W`lX_YGFPPJ*IfG3iha^Hm7RAb_T(g+8f;RX0jlY7w_6KC$+
zRIQQy32I%8oN80a9BpL0gOiP=6Kbx`b}lE|bryS^#p;!sUm)&1wol|`JbzOiGu?TX
z+JsYr4#JIZ=fFh9>O?*#S)vlb&V^21H0uX?vXbDW(#9z&PTbY9akv_=^*><izy5)=
zdVjIesMdSt&o^q@t*yCAZEU_VT%X^)xVtOY)wOuR@h5H0tEzz$Pfm$F+v66N?G2@W
z-M(+Y4zZ29S!V+Q^4%!X8p_Y!+o$=WeXXRp?TV!vLVV1KP^%Jo+_eg2Z!^ffHm6Un
zY*VLJw&6k4WS_s9y(d9U>a5-McLZSfY-ejj1_hRc*9BzKV^&%AQq=wbuhG}MU;3l;
z|Cc#kDCz&p-hW?(t3mesTL{0QfBzud3|rthc$q%Etm)qXN5aqOvp)tmfz0zSg?EDV
z-@gnW2id#-NZ3RFd^h|pEQH7Ck6#97fd#T(zwFb07u*7}NB=rF8CJt8m<!TJe-s{q
zTi^@uDYy_WfIOTDOW<Yco5THZ4O|Tqa0<+Zm(azFpmpNtBRM1*NHmaW;I-9&H<1wM
z1r#3`f4244J_3F-@|5+Q;S$Fo`}a_I!_dA+I2Gxm@9^ZD7?y3yZO6T-9fx#hQKp(m
zmgS2p?47kUp^1b}Y)gtlKK|U8d<%^JD}Np$B|-AhiBISEKLY8b^p(zk{&`;1rtH@`
zw+sD>hnHM*CQwJV=WOk}?B#Eq*po!@ncUlZ`a+8yrX}h0_C0Zh4XH@(;ePbJ+We4(
zUl>s@qsgv{ll~3oUKKmp_PTmj`N|H?v4v}&TWB4VILg?nejR?ZMf$e>NILrrM1QKK
zLwu)R`H#G`QItPnFIwto_ZuQ!)wlN2<4dw>Pm_{G@%HixWuLi*`8f>KJG&;gsi|>w
zF63vWBgA@o#W|DBtaiL%{m6VhhN@J!PGKpoKjtL0Y9G6wg^VazPxh{kgp6G;Qi#sg
Vvq_F;r=i#Z%W(&nUZ<be`G1yE4&?v<

diff --git a/autogl/module/model/dgl/.gin_dgl.py.swp b/autogl/module/model/dgl/.gin_dgl.py.swp
deleted file mode 100644
index 96e085a0fb9d99f3f17f490bf10f7469dcb345a2..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 16384
zcmeI3TZkn`8OO^t7uPkbMhQX`D>Lf!BxlZ<*)_{%l1ZFsW-?}GSYvh(H_Nfl={lzy
z`$l#5TmrfqyaYioKB%A=^vxJSgpl|aQHU>z5ZFBEs}D-vyv1PhkpEZJ-PL_AGZRD*
z?S|i+bGqw%RrRm0tLppuOmFeR#uh)@USv4l!<cn(*8c0Qtz%C=!&u+7!=XzT4nF#R
zmZU<SUOKoK`?5CJS<TXDeY0cZW$1T;$jN*`FT(FQI5G6XE?(R5{vr07%Z&n!0!LIJ
zO9u;QZ(yfSEvZ|5cIFoTz8lXU@ykuIMuA3wMuA3wMuA3wMuA3wMuA3w{{;oo_!zs4
zjvUK76XdUN8+m<u{`v0wH5|E~e{5bF1sVk!1sVk!1sVk!1sVk!1sVk!1sVk!1sVnZ
z3l*>(#%@EqUZ;Q`&;N_~|BZJu_A+=Hd;{DER>3F0J>V4hAb8^>V^_hq!Q<dtAOfes
zP2kTrF!mDo0r)<+0$lJJa3{DG%mWMD2>$Xe#(oMO178Oz=z&jz8E^vp;RIv9244dK
zxC`6~I^YEO-8&h35_}bW1-M`qTnk<~&e+evkHMqh^I#tQ{T+<`4g3N;3YNh?uV?I4
z@I1HzE&~D9fCa7tuU*I3AHhrDN8n*_JNP&_4L$^pgXgYAU%&%k4txx}9~=X(T*KJU
zz~kTxU;}&rFz_2BUY-JvfJ<N=oCLo@!e$>_05<~~zkd};o1^&|&yS(BW49Yek?)1W
zZn__fWuByx71!z2jdpn&aeFwFVrZv=hr%1Wy+|h9O0uBE17U|P9!Vb9d-LU2i&BSJ
z-x%;U+fPJmVg+{S@V*G~3lkpVM<NNgef)4lq^^+dvL<RI%seDBSn-7|LoVXP^P`a3
z?RZIw&ShTW)=dp$6qvr0)|7!R3@q~=bV1+BOH`2~qd3Y^F74EdI91^aKJY@@=g<(9
zbKl+<MnQF{n}2JW5B$hZYX%>}_romcp^MRg_kBA_(9Z$njHPhAKB_S-K+SQMb{#KR
z=3Y2%2p2?{;2XB@rTb*i^&CfpJPW-P>ZN>jb5pl4DO;h7ycMHfh*t1{u+vNmV@REz
zZpZYps#JoG@W79a8I<edL{|xkVVKm>18mWNgd&p|kx-<&k^ExWQ?fkC>OygpCC}N?
z4&ZhPD^JbL%%~qK@tCd&y2ulel5>@1cyUbh{`uwcf@VZp+Kmcd$z7Q|vBk&l)0Q&j
zhym|*Jq&KQYbC-Tw8)q8KI->I$rhB%y{DD?1r3(Agx;-hY;)B^yl2W0IZjz&*xpjV
z(?au&8q`rKF#aJ#@CR)@q{+pFrAwA;W&tWjhs#&^T3ZS~Q_XDm?6mK8!$=0nMemY6
zSD3(OcYeNZgYE~9JVoMnX+oDbJ>?60X+&JAaF40F^FOmRNo;MND^ChcJM|G6?~qlQ
z(a4T6lDn_cs<h?}szP)liQc8!JdF}Muxm>vAEZ6flI&FvrDH{ywjIYJbZ7wXCAqet
z){<jc=6;=|lJak()R;(Ytjb*XN_CrRCaYA0>AjqJMn;CrRXyNfGu5`&T0#SSP}5J1
zjPJo!PIPoMyjJC?-td?-l6|*bdi*BV4y*2n)q3CR7jmbdTY;9mT4QGUR_3SPg4Uq!
zTH}sdX$7pIz4?e$`dt~Yk&1L#eXEz3gbxR<ILpckUmCeNY%dY~g6(JGJ}Dz<&7gR`
zZ0SjrCvKGa4(|ybM~RnuJK~lZBVWCOyU2c7z3Px@GCE~G)C*PHSZQ#*kalUKH|-7R
z=Ea?8LuT$J#cEwwI>}-oEld(E<<s-+a&k4@pxLpkjpO*gU%^W?%-Gad?P7UdC`(RW
zUm<+HIpO^%#6~nT+n+<0x{BwUIi@ykX>Z2pQ7yY(>J~1bJ<Tk7xISgk%hw0D>_%l-
zt1NnSR!=TrbuBDUV@WQ~k1q{wb!o`0=zF}n2&fCN(>Aw>@zCNTzJ?-YW3_Xy#<9P@
zjm`907WSvO`2?+DD4&5L)cM$<KtS!ZV5!&%a(71yt8Sosw>fR!9~7JC+eX}4^&>K?
z9Xb8{8xvZ*ujk^SAN9Bw#F0$-XS3j(4pmxwb!S+<-?I1e_iU00xYABx0vno7;v>r~
zmh=4pV$e<-n?^g~YopicWEj@YVlPC!!VlWrNX}sw8^pfA?mMNxAYA5dnj(hi;3w^=
zoAuiLDCq18&&}*Rmd<qIXjjNV<}VDxFkwZ}2+O?`JD%8WW9Qnzl9&bec+QI4Ur)|>
ztG7Q8ltpd1=k2s3IqcZIq_cE(X|cVyc=ps8c0Z!EbGdbHOTpJE#N*p~L%gjw#EEJ;
z#s59Tr#pycDgG~>@Bb39{j=aH@EGU;iu>;dbKo_^_P+(sgYSSxzyi1#yofmd1@I(z
z5KvtIUho29_bcFjuns;9t^rpOvp)g82_6O?1s?&gB3}OocoF;rd<lFGw83%kI^y=1
z!By}qh`<GK9$0{Z-y@EH4m<&V2(Ez3;0|yS{0aU39{4UG4KmOijRK7VjRK7VjROA}
z1$cfGxrTluMK{_JQfF=Ip+z!smEV@{EGeN_%bIjewvZAkl+qPW7kQL&`$zQ_r;80L
zeYS?k2AN_i(}FXULJ-){3uHP)kqVHa*aeccS&nE4<pX6Gc`#1>K#mrfH<hg=6L#O#
z=__Rr*Z1=bDI*hfjCFE_<NuV@rTkC6qetyUcA?T>Dl>T>UR=?;=z7L!f&o<w|ADB3
zSyFL=GA6U4ikpZh&p|P&ln&Eoh<(w$#MD{*nMK@@q?Oz(x`ixiv2&y(trAUV0xU1Y
z|5!RCt_pGVK#hkDs;QNLnrf3OV&9I^jbd*q92L4Vx=P2C%mTRuT5a~#mhlgjC>YO2
zawH7q@Bm=0o-|M*<>t(m{ix=Ud_TaR2?r|nkYt$BI6SL>F{b*BKdNPP8=<3!H$J8F
z`c^GpKW~Z`U!zx(Z<!Km8nueAsoHc_BB|V}g*&sN9KDVYN^#XxTnTq85#Ya9FQn5x
zhoM|F!+2n3ZY)?G?<4dr!z`Uh9!aas@?F=%ED_joqGC$jBf3KzZ!i!Nw?>f`z_S26
zimE&s(X$6D6q@CEcB=^J)RPqD5yd2xkYQ7Wx!3B0tw!wdY^?Esk*Stilt-IZJ?N!S
z8oBxWDO&CMSc@;}ki1<!h8i)enpI9xrT>%y6hfd9x`Qc|QG1+H%lsFU6g>r~ysx{_
zWOtlyzv7xkoayF|?scl`(<j`~0Xx+1>QWwBoLo!K+fcRgTu7NIhYM!P_vN6Bwj47~
s`IN>KQn^RC%#@@IjVxsx$}iA~v4^v`S3E@h<@#&qi?4Z9TRy3M6Izu!kN^Mx


From 38065a6b055814f742e1a6a91338d4b357871d98 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Tue, 31 Aug 2021 08:37:26 +0000
Subject: [PATCH 20/75] update gitignore

---
 .gitignore | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.gitignore b/.gitignore
index 6d46998..dfaa3e8 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,5 +1,5 @@
 .DS_Store
-*.swq
+/**/*.swq
 # Byte-compiled / optimized / DLL files
 __pycache__/
 *.py[cod]

From b4c91059e20e7a801691e114f62afedb2f6365fc Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Tue, 31 Aug 2021 08:40:51 +0000
Subject: [PATCH 21/75] update gitignore

---
 .gitignore | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.gitignore b/.gitignore
index dfaa3e8..befb347 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,5 +1,5 @@
 .DS_Store
-/**/*.swq
+/**/*.swp
 # Byte-compiled / optimized / DLL files
 __pycache__/
 *.py[cod]

From 17aba0e20921eec064467e1620fa1ef93ed2aaaa Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Fri, 3 Sep 2021 07:47:43 +0000
Subject: [PATCH 22/75] finish support to gin on glf with dgl backend

---
 autogl/module/model/dgl/__init__.py |   3 -
 autogl/module/model/dgl/gin.py      | 306 +++++++++++++++-------------
 autogl/module/model/dgl/gin_dgl.py  | 171 ----------------
 test/model_glf/gclf_dgl.py          |  39 +---
 4 files changed, 178 insertions(+), 341 deletions(-)
 delete mode 100644 autogl/module/model/dgl/gin_dgl.py

diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index 7e2af04..0a816a2 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -8,8 +8,6 @@ from .graph_saint import GraphSAINTAggregationModel
 from .gcn import AutoGCN
 from .gat import AutoGAT
 from .gin import AutoGIN
-#from .gin_dgl import GIN
-from .gin import GIN
 
 __all__ = [
     "ModelUniversalRegistry",
@@ -21,5 +19,4 @@ __all__ = [
     "AutoGCN",
     "AutoGAT",
     "AutoGIN",
-    "GIN",
 ]
diff --git a/autogl/module/model/dgl/gin.py b/autogl/module/model/dgl/gin.py
index 507c6b9..5dc9569 100644
--- a/autogl/module/model/dgl/gin.py
+++ b/autogl/module/model/dgl/gin.py
@@ -2,8 +2,8 @@ import torch
 import torch.nn as nn
 import torch.nn.functional as F
 from torch.nn import Linear, ReLU, Sequential, LeakyReLU, Tanh, ELU
-#from torch_geometric.nn import GINConv, global_add_pool
 from dgl.nn.pytorch.conv import GINConv
+from dgl.nn.pytorch.glob import SumPooling, AvgPooling, MaxPooling
 from torch.nn import BatchNorm1d
 from . import register_model
 from .base import BaseModel, activate_func
@@ -33,153 +33,185 @@ class ApplyNodeFunc(nn.Module):
         h = F.relu(h)
         return h
 
+
+class MLP(nn.Module):
+    """MLP with linear output"""
+    def __init__(self, num_layers, input_dim, hidden_dim, output_dim):
+        """MLP layers construction
+
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+
+        """
+        super(MLP, self).__init__()
+        self.linear_or_not = True  # default is linear model
+        self.num_layers = num_layers
+        self.output_dim = output_dim
+
+        if num_layers < 1:
+            raise ValueError("number of layers should be positive!")
+        elif num_layers == 1:
+            # Linear model
+            self.linear = nn.Linear(input_dim, output_dim)
+        else:
+            # Multi-layer model
+            self.linear_or_not = False
+            self.linears = torch.nn.ModuleList()
+            self.batch_norms = torch.nn.ModuleList()
+
+            self.linears.append(nn.Linear(input_dim, hidden_dim))
+            for layer in range(num_layers - 2):
+                self.linears.append(nn.Linear(hidden_dim, hidden_dim))
+            self.linears.append(nn.Linear(hidden_dim, output_dim))
+
+            for layer in range(num_layers - 1):
+                self.batch_norms.append(nn.BatchNorm1d((hidden_dim)))
+
+    def forward(self, x):
+        if self.linear_or_not:
+            # If linear model
+            return self.linear(x)
+        else:
+            # If MLP
+            h = x
+            for i in range(self.num_layers - 1):
+                h = F.relu(self.batch_norms[i](self.linears[i](h)))
+            return self.linears[-1](h)
+
+
+
 class GIN(torch.nn.Module):
-    #def __init__(self, args):
-    def __init__(self, args, num_layers, num_mlp_layers, input_dim, hidden_dim,
-                 output_dim, final_dropout, learn_eps, graph_pooling_type,
-                 neighbor_pooling_type):
+    """GIN model"""
+    def __init__(self, args):
+        """model parameters setting
+
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers in the neural network
+        num_mlp_layers: int
+            The number of linear layers in mlps
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+        final_dropout: float
+            dropout ratio on the final linear layer
+        learn_eps: boolean
+            If True, learn epsilon to distinguish center nodes from neighbors
+            If False, aggregate neighbors and center nodes altogether.
+        neighbor_pooling_type: str
+            how to aggregate neighbors (sum, mean, or max)
+        graph_pooling_type: str
+            how to aggregate entire nodes in a graph (sum, mean or max)
+
+        """
         super(GIN, self).__init__()
         self.args = args
-        #self.num_layer = int(self.args["num_layers"])
-        self.num_layer = num_layers
-        assert self.num_layer > 2, "Number of layers in GIN should not less than 3"
-
-        #missing_keys = list(
-        #    set(
-        #        [
-        #            "features_num",
-        #            "num_class",
-        #            "num_graph_features",
-        #            "num_layers",
-        #            "hidden",
-        #            "dropout",
-        #            "act",
-        #            "mlp_layers",
-        #            "eps",
-        #        ]
-        #    )
-        #    - set(self.args.keys())
-        #)
-        #if len(missing_keys) > 0:
-        #    raise Exception("Missing keys: %s." % ",".join(missing_keys))
+
+        missing_keys = list(
+            set(
+                [
+                    "features_num",
+                    "num_class",
+                    "num_graph_features",
+                    "num_layers",
+                    "hidden",
+                    "dropout",
+                    "act",
+                    "mlp_layers",
+                    "eps",
+                ]
+            )
+            - set(self.args.keys())
+        )
+        if len(missing_keys) > 0:
+            raise Exception("Missing keys: %s." % ",".join(missing_keys))
         #if not self.num_layer == len(self.args["hidden"]) + 1:
         #    LOGGER.warn("Warning: layer size does not match the length of hidden units")
-        #self.num_graph_features = self.args["num_graph_features"]
-        self.num_graph_features = 0
-
-        #if self.args["act"] == "leaky_relu":
-        #    act = LeakyReLU()
-        #elif self.args["act"] == "relu":
-        #    act = ReLU()
-        #elif self.args["act"] == "elu":
-        #    act = ELU()
-        #elif self.args["act"] == "tanh":
-        #    act = Tanh()
-        #else:
-        #    act = ReLU()
-            act = ReLU()
-            act_str = "relu"
-
-        #train_eps = True if self.args["eps"] == "True" else False
-        train_eps = learn_eps
-
-        self.convs = torch.nn.ModuleList()
-        self.bns = torch.nn.ModuleList()
-
-        #nn = [Linear(self.args["features_num"], self.args["hidden"][0])]
-        nn = [Linear(input_dim, hidden_dim)]
-        #for _ in range(self.args["mlp_layers"] - 1):
-        for _ in range(num_layers - 1):
-            nn.append(act)
-            #nn.append(Linear(self.args["hidden"][0], self.args["hidden"][0]))
-            nn.append(Linear(hidden_dim, hidden_dim))
-        # nn.append(BatchNorm1d(self.args['hidden'][0]))
-        # self.convs.append(GINConv(Sequential(*nn), learn_eps=train_eps))
-        self.convs.append(GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, train_eps))
-        #self.bns.append(BatchNorm1d(self.args["hidden"][0]))
-        self.bns.append(BatchNorm1d(hidden_dim))
-
-        #for i in range(self.num_layer - 3):
-        for i in range(num_layers - 3):
-            #nn = [Linear(self.args["hidden"][i], self.args["hidden"][i + 1])]
-            nn = [Linear(hidden_dim, hidden_dim)]
-            #for _ in range(self.args["mlp_layers"] - 1):
-            for _ in range(num_mlp_layers - 1):
-                nn.append(act)
-                nn.append(
-                    #Linear(self.args["hidden"][i + 1], self.args["hidden"][i + 1])
-                    Linear(hidden_dim, hidden_dim)
-                )
-            # nn.append(BatchNorm1d(self.args['hidden'][i+1]))
-            self.convs.append(GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, train_eps))
-            #self.convs.append(GINConv(Sequential(*nn), learn_eps=train_eps))
-            #self.bns.append(BatchNorm1d(self.args["hidden"][i + 1]))
-            self.bns.append(BatchNorm1d(hidden_dim))
-
-        #self.fc1 = Linear(
-        #    self.args["hidden"][self.num_layer - 3] + self.num_graph_features,
-        #    self.args["hidden"][self.num_layer - 2],
-        #)
-        #self.fc2 = Linear(
-        #    self.args["hidden"][self.num_layer - 2], self.args["num_class"]
-        #)
-
-
-        self.fc1 = Linear(
-            hidden_dim + self.num_graph_features,
-            hidden_dim,
-        )
-        self.fc2 = Linear(
-            hidden_dim, output_dim
-        )
 
 
+        self.num_graph_features = self.args["num_graph_features"]
+        self.num_layers = self.args["num_layers"]
+        assert self.num_layers > 2, "Number of layers in GIN should not less than 3"
+
+        self.learn_eps = self.args["eps"]
+        self.num_mlp_layers = self.args["mlp_layers"]
+        input_dim = self.args["features_num"]
+        hidden_dim = self.args["hidden"][0]
+        neighbor_pooling_type = self.args["neighbor_pooling_type"]
+        graph_pooling_type = self.args["graph_pooling_type"]
+        if self.args["act"] == "leaky_relu":
+            act = LeakyReLU()
+        elif self.args["act"] == "relu":
+            act = ReLU()
+        elif self.args["act"] == "elu":
+            act = ELU()
+        elif self.args["act"] == "tanh":
+            act = Tanh()
+        else:
+            act = ReLU()
+        learn_eps = True if self.args["eps"] == "True" else False
+        final_dropout = self.args["dropout"]
+        output_dim = self.args["num_class"]
+
+        # List of MLPs
+        self.ginlayers = torch.nn.ModuleList()
+        self.batch_norms = torch.nn.ModuleList()
+
+        for layer in range(self.num_layers - 1):
+            if layer == 0:
+                mlp = MLP(self.num_mlp_layers, input_dim, hidden_dim, hidden_dim)
+            else:
+                mlp = MLP(self.num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)
+
+            self.ginlayers.append(
+                GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, self.learn_eps))
+            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))
+
+        # Linear function for graph poolings of output of each layer
+        # which maps the output of different layers into a prediction score
+        self.linears_prediction = torch.nn.ModuleList()
+
+        for layer in range(self.num_layers):
+            if layer == 0:
+                self.linears_prediction.append(
+                    nn.Linear(input_dim, output_dim))
+            else:
+                self.linears_prediction.append(
+                    nn.Linear(hidden_dim, output_dim))
+
         self.drop = nn.Dropout(final_dropout)
 
-#    def forward(self, data):
-#        x, edge_index, batch = data.x, data.edge_index, data.batch
-#
-#        if self.num_graph_features > 0:
-#            graph_feature = data.gf
-#
-#        for i in range(self.num_layer - 2):
-#            x = self.convs[i](x, edge_index)
-#            x = activate_func(x, self.args["act"])
-#            x = self.bns[i](x)
-#
-#        #x = global_add_pool(x, batch)
-#        if self.num_graph_features > 0:
-#            x = torch.cat([x, graph_feature], dim=-1)
-#        x = self.fc1(x)
-#        x = activate_func(x, self.args["act"])
-#        x = F.dropout(x, p=self.args["dropout"], training=self.training)
-#
-#        x = self.fc2(x)
-#
-#        return F.log_softmax(x, dim=1)
+        if graph_pooling_type == 'sum':
+            self.pool = SumPooling()
+        elif graph_pooling_type == 'mean':
+            self.pool = AvgPooling()
+        elif graph_pooling_type == 'max':
+            self.pool = MaxPooling()
+        else:
+            raise NotImplementedError
 
     def forward(self, g, h):
         # list of hidden representation at each layer (including input)
         hidden_rep = [h]
 
-        if self.num_graph_features > 0:
-            graph_feature = data.gf
-
-        for i in range(self.num_layer - 2):
-            x = self.convs[i](g, h)
-            x = activate_func(x, act_str)
-            x = self.bns[i](x)
+        for i in range(self.num_layers - 1):
+            h = self.ginlayers[i](g, h)
+            h = self.batch_norms[i](h)
+            h = F.relu(h)
             hidden_rep.append(h)
 
-        #x = global_add_pool(x, batch)
-        #if self.num_graph_features > 0:
-        #    x = torch.cat([x, graph_feature], dim=-1)
-        #x = self.fc1(x)
-        #x = activate_func(x, act_str)
-        ##x = F.dropout(x, p=self.args["dropout"], training=self.training)
-        #x = F.dropout(x, p=final_dropout, training=self.training)
-        #x = self.fc2(x)
-
         score_over_layer = 0
 
         # perform pooling over all nodes in each graph in every layer
@@ -188,8 +220,6 @@ class GIN(torch.nn.Module):
             score_over_layer += self.drop(self.linears_prediction[i](pooled_h))
 
         return score_over_layer
-        return F.log_softmax(x, dim=1)
-
 
 
 @register_model("gin")
@@ -291,12 +321,14 @@ class AutoGIN(BaseModel):
         ]
 
         self.hyperparams = {
-            "num_layers": 3,
-            "hidden": [64, 32],
+            "num_layers": 5,
+            "hidden": [64],
             "dropout": 0.5,
             "act": "relu",
-            "eps": "True",
+            "eps": "False",
             "mlp_layers": 2,
+            "neighbor_pooling_type": "sum",
+            "graph_pooling_type": "sum"
         }
 
         self.initialized = False
diff --git a/autogl/module/model/dgl/gin_dgl.py b/autogl/module/model/dgl/gin_dgl.py
deleted file mode 100644
index 8a5408e..0000000
--- a/autogl/module/model/dgl/gin_dgl.py
+++ /dev/null
@@ -1,171 +0,0 @@
-"""
-How Powerful are Graph Neural Networks
-https://arxiv.org/abs/1810.00826
-https://openreview.net/forum?id=ryGs6iA5Km
-Author's implementation: https://github.com/weihua916/powerful-gnns
-"""
-
-
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-from dgl.nn.pytorch.conv import GINConv
-from dgl.nn.pytorch.glob import SumPooling, AvgPooling, MaxPooling
-
-
-class ApplyNodeFunc(nn.Module):
-    """Update the node feature hv with MLP, BN and ReLU."""
-    def __init__(self, mlp):
-        super(ApplyNodeFunc, self).__init__()
-        self.mlp = mlp
-        self.bn = nn.BatchNorm1d(self.mlp.output_dim)
-
-    def forward(self, h):
-        h = self.mlp(h)
-        h = self.bn(h)
-        h = F.relu(h)
-        return h
-
-
-class MLP(nn.Module):
-    """MLP with linear output"""
-    def __init__(self, num_layers, input_dim, hidden_dim, output_dim):
-        """MLP layers construction
-
-        Paramters
-        ---------
-        num_layers: int
-            The number of linear layers
-        input_dim: int
-            The dimensionality of input features
-        hidden_dim: int
-            The dimensionality of hidden units at ALL layers
-        output_dim: int
-            The number of classes for prediction
-
-        """
-        super(MLP, self).__init__()
-        self.linear_or_not = True  # default is linear model
-        self.num_layers = num_layers
-        self.output_dim = output_dim
-
-        if num_layers < 1:
-            raise ValueError("number of layers should be positive!")
-        elif num_layers == 1:
-            # Linear model
-            self.linear = nn.Linear(input_dim, output_dim)
-        else:
-            # Multi-layer model
-            self.linear_or_not = False
-            self.linears = torch.nn.ModuleList()
-            self.batch_norms = torch.nn.ModuleList()
-
-            self.linears.append(nn.Linear(input_dim, hidden_dim))
-            for layer in range(num_layers - 2):
-                self.linears.append(nn.Linear(hidden_dim, hidden_dim))
-            self.linears.append(nn.Linear(hidden_dim, output_dim))
-
-            for layer in range(num_layers - 1):
-                self.batch_norms.append(nn.BatchNorm1d((hidden_dim)))
-
-    def forward(self, x):
-        if self.linear_or_not:
-            # If linear model
-            return self.linear(x)
-        else:
-            # If MLP
-            h = x
-            for i in range(self.num_layers - 1):
-                h = F.relu(self.batch_norms[i](self.linears[i](h)))
-            return self.linears[-1](h)
-
-
-class GIN(nn.Module):
-    """GIN model"""
-    def __init__(self, num_layers, num_mlp_layers, input_dim, hidden_dim,
-                 output_dim, final_dropout, learn_eps, graph_pooling_type,
-                 neighbor_pooling_type):
-        """model parameters setting
-
-        Paramters
-        ---------
-        num_layers: int
-            The number of linear layers in the neural network
-        num_mlp_layers: int
-            The number of linear layers in mlps
-        input_dim: int
-            The dimensionality of input features
-        hidden_dim: int
-            The dimensionality of hidden units at ALL layers
-        output_dim: int
-            The number of classes for prediction
-        final_dropout: float
-            dropout ratio on the final linear layer
-        learn_eps: boolean
-            If True, learn epsilon to distinguish center nodes from neighbors
-            If False, aggregate neighbors and center nodes altogether.
-        neighbor_pooling_type: str
-            how to aggregate neighbors (sum, mean, or max)
-        graph_pooling_type: str
-            how to aggregate entire nodes in a graph (sum, mean or max)
-
-        """
-        super(GIN, self).__init__()
-        self.num_layers = num_layers
-        self.learn_eps = learn_eps
-
-        # List of MLPs
-        self.ginlayers = torch.nn.ModuleList()
-        self.batch_norms = torch.nn.ModuleList()
-
-        for layer in range(self.num_layers - 1):
-            if layer == 0:
-                mlp = MLP(num_mlp_layers, input_dim, hidden_dim, hidden_dim)
-            else:
-                mlp = MLP(num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)
-
-            self.ginlayers.append(
-                GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, self.learn_eps))
-            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))
-
-        # Linear function for graph poolings of output of each layer
-        # which maps the output of different layers into a prediction score
-        self.linears_prediction = torch.nn.ModuleList()
-
-        for layer in range(num_layers):
-            if layer == 0:
-                self.linears_prediction.append(
-                    nn.Linear(input_dim, output_dim))
-            else:
-                self.linears_prediction.append(
-                    nn.Linear(hidden_dim, output_dim))
-
-        self.drop = nn.Dropout(final_dropout)
-
-        if graph_pooling_type == 'sum':
-            self.pool = SumPooling()
-        elif graph_pooling_type == 'mean':
-            self.pool = AvgPooling()
-        elif graph_pooling_type == 'max':
-            self.pool = MaxPooling()
-        else:
-            raise NotImplementedError
-
-    def forward(self, g, h):
-        # list of hidden representation at each layer (including input)
-        hidden_rep = [h]
-
-        for i in range(self.num_layers - 1):
-            h = self.ginlayers[i](g, h)
-            h = self.batch_norms[i](h)
-            h = F.relu(h)
-            hidden_rep.append(h)
-
-        score_over_layer = 0
-
-        # perform pooling over all nodes in each graph in every layer
-        for i, h in enumerate(hidden_rep):
-            pooled_h = self.pool(g, h)
-            score_over_layer += self.drop(self.linears_prediction[i](pooled_h))
-
-        return score_over_layer
diff --git a/test/model_glf/gclf_dgl.py b/test/model_glf/gclf_dgl.py
index bb78e55..5f2ccff 100644
--- a/test/model_glf/gclf_dgl.py
+++ b/test/model_glf/gclf_dgl.py
@@ -19,7 +19,7 @@ import torch.optim as optim
 from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
 from autogl.module.model.ginparser import Parser
 from autogl.module.model.dataloader_gin import GINDataLoader
-from autogl.module.model import GIN
+from autogl.module.model import AutoGIN
 
 from pdb import set_trace
 import numpy as np
@@ -40,7 +40,6 @@ def train(args, net, trainloader, optimizer, criterion, epoch):
         labels = labels.to(args.device)
         graphs = graphs.to(args.device)
         feat = graphs.ndata.pop('attr')
-        set_trace()
         outputs = net(graphs, feat)
 
         loss = criterion(outputs, labels)
@@ -88,7 +87,7 @@ def eval_net(args, net, dataloader, criterion):
     return loss, acc
 
 
-def main(args, args_autogl):
+def main(args):
 
     # set up seeds, args.seed supported
     torch.manual_seed(seed=args.seed)
@@ -109,14 +108,12 @@ def main(args, args_autogl):
         seed=args.seed, shuffle=True,
         split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
     # or split_name='rand', split_ratio=0.7
-    set_trace()
-
-    model = GIN(args_autogl,
-        args.num_layers, args.num_mlp_layers,
-        dataset.dim_nfeats, args.hidden_dim, dataset.gclasses,
-        args.final_dropout, args.learn_eps,
-        args.graph_pooling_type, args.neighbor_pooling_type).to(args.device)
-
+    automodel =  AutoGIN(
+                num_classes=dataset.gclasses,
+                num_features=dataset.dim_nfeats,
+                device=args.device,
+                init=True)
+    model = automodel.model
     criterion = nn.CrossEntropyLoss()  # defaul reduce is true
     optimizer = optim.Adam(model.parameters(), lr=args.lr)
     scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
@@ -171,26 +168,8 @@ def main(args, args_autogl):
 
 
 if __name__ == '__main__':
-    parser = ArgumentParser(
-        "auto graph classification", formatter_class=ArgumentDefaultsHelpFormatter
-    )
-    parser.add_argument(
-        "--dataset",
-        default="mutag",
-        type=str,
-        help="graph classification dataset",
-        choices=["mutag", "imdb-b", "imdb-m", "proteins", "collab"],
-    )
-    parser.add_argument(
-        "--configs", default="../configs/graphclf_full.yml", help="config files"
-    )
-    parser.add_argument("--device", type=int, default=0, help="device to run on")
-    parser.add_argument("--seed", type=int, default=0, help="random seed")
-    args_autogl = parser.parse_args()
-
     args = Parser(description='GIN').args
     print('show all arguments configuration...')
     print(args)
-    print(args_autogl)
-    main(args, args_autogl)
+    main(args)
 

From bedd87aca4c2a83bb1721d797fa83db1230965ef Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Thu, 9 Sep 2021 16:46:46 +0800
Subject: [PATCH 23/75] merge dgl into trainer

---
 autogl/module/model/__init__.py               | 24 ++---
 autogl/module/train/__init__.py               | 66 ++++++-------
 autogl/module/train/base.py                   |  4 +-
 .../module/train/graph_classification_full.py | 92 ++++++++++++++-----
 4 files changed, 116 insertions(+), 70 deletions(-)

diff --git a/autogl/module/model/__init__.py b/autogl/module/model/__init__.py
index c995d9c..9763f83 100644
--- a/autogl/module/model/__init__.py
+++ b/autogl/module/model/__init__.py
@@ -1,12 +1,12 @@
-import importlib
-import sys
-from ...backend import DependentBackend
-
-# load corresponding backend of subclass
-def _load_subclass_backend(backend):
-    sub_module = importlib.import_module(f'.{backend.get_backend_name()}', __name__)
-    this = sys.modules[__name__]
-    for api, obj in sub_module.__dict__.items():
-        setattr(this, api, obj)
-
-_load_subclass_backend(DependentBackend)
+# import importlib
+# import sys
+# from ...backend import DependentBackend
+#
+# # load corresponding backend of subclass
+# def _load_subclass_backend(backend):
+#     sub_module = importlib.import_module(f'.{backend.get_backend_name()}', __name__)
+#     this = sys.modules[__name__]
+#     for api, obj in sub_module.__dict__.items():
+#         setattr(this, api, obj)
+#
+# _load_subclass_backend(DependentBackend)
diff --git a/autogl/module/train/__init__.py b/autogl/module/train/__init__.py
index cacdc8d..400d9bc 100644
--- a/autogl/module/train/__init__.py
+++ b/autogl/module/train/__init__.py
@@ -1,13 +1,13 @@
 TRAINER_DICT = {}
 from .base import (
     BaseTrainer,
-    Evaluation,
-    BaseNodeClassificationTrainer,
-    BaseGraphClassificationTrainer,
-    BaseLinkPredictionTrainer,
+#     Evaluation,
+#     BaseNodeClassificationTrainer,
+#     BaseGraphClassificationTrainer,
+#     BaseLinkPredictionTrainer,
 )
-
-
+#
+#
 def register_trainer(name):
     def register_trainer_cls(cls):
         if name in TRAINER_DICT:
@@ -20,30 +20,30 @@ def register_trainer(name):
         return cls
 
     return register_trainer_cls
-
-
-from .graph_classification_full import GraphClassificationFullTrainer
-from .node_classification_full import NodeClassificationFullTrainer
-from .link_prediction import LinkPredictionTrainer
-from .node_classification_trainer import *
-from .evaluation import get_feval, Acc, Auc, Logloss, Mrr, MicroF1
-
-__all__ = [
-    "BaseTrainer",
-    "Evaluation",
-    "BaseGraphClassificationTrainer",
-    "BaseNodeClassificationTrainer",
-    "BaseLinkPredictionTrainer",
-    "GraphClassificationFullTrainer",
-    "NodeClassificationFullTrainer",
-    "NodeClassificationGraphSAINTTrainer",
-    "NodeClassificationLayerDependentImportanceSamplingTrainer",
-    "NodeClassificationNeighborSamplingTrainer",
-    "LinkPredictionTrainer",
-    "Acc",
-    "Auc",
-    "Logloss",
-    "Mrr",
-    "MicroF1",
-    "get_feval",
-]
+#
+#
+# from .graph_classification_full import GraphClassificationFullTrainer
+# from .node_classification_full import NodeClassificationFullTrainer
+# from .link_prediction import LinkPredictionTrainer
+# from .node_classification_trainer import *
+# from .evaluation import get_feval, Acc, Auc, Logloss, Mrr, MicroF1
+#
+# __all__ = [
+#     "BaseTrainer",
+#     "Evaluation",
+#     "BaseGraphClassificationTrainer",
+#     "BaseNodeClassificationTrainer",
+#     "BaseLinkPredictionTrainer",
+#     "GraphClassificationFullTrainer",
+#     "NodeClassificationFullTrainer",
+#     "NodeClassificationGraphSAINTTrainer",
+#     "NodeClassificationLayerDependentImportanceSamplingTrainer",
+#     "NodeClassificationNeighborSamplingTrainer",
+#     "LinkPredictionTrainer",
+#     "Acc",
+#     "Auc",
+#     "Logloss",
+#     "Mrr",
+#     "MicroF1",
+#     "get_feval",
+# ]
diff --git a/autogl/module/train/base.py b/autogl/module/train/base.py
index 1797bb5..1e6b1fb 100644
--- a/autogl/module/train/base.py
+++ b/autogl/module/train/base.py
@@ -3,7 +3,9 @@ import typing as _typing
 
 import torch
 import pickle
-from ..model import BaseModel, ModelUniversalRegistry
+# from ..model import BaseModel, ModelUniversalRegistry
+from ..model.dgl.base import BaseModel
+from ..model.dgl._model_registry import ModelUniversalRegistry
 from .evaluation import Evaluation, get_feval, Acc
 from ...utils import get_logger
 
diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index 8b12a05..6ecb015 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -8,7 +8,8 @@ from torch.optim.lr_scheduler import (
     ReduceLROnPlateau,
 )
 import torch.nn.functional as F
-from ..model import BaseModel
+# from ..model import BaseModel
+from ..model.dgl.base import BaseModel
 from .evaluation import get_feval, Logloss
 from typing import Union
 from ...datasets import utils
@@ -71,6 +72,7 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         feval=[Logloss],
         loss="nll_loss",
         lr_scheduler_type=None,
+        criterion=None,
         *args,
         **kwargs
     ):
@@ -124,6 +126,9 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         self.initialized = False
         self.device = device
 
+        self.pyg_dgl = 'dgl'
+        self.criterion = criterion
+
         self.space = [
             {
                 "parameterName": "max_epoch",
@@ -233,18 +238,31 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
             self.model.model.train()
             loss_all = 0
             for data in train_loader:
-                data = data.to(self.device)
-                optimizer.zero_grad()
-                output = self.model.model(data)
-                # loss = F.nll_loss(output, data.y)
-                if hasattr(F, self.loss):
-                    loss = getattr(F, self.loss)(output, data.y)
-                else:
-                    raise TypeError(
-                        "PyTorch does not support loss type {}".format(self.loss)
-                    )
-                loss.backward()
-                loss_all += data.num_graphs * loss.item()
+                if self.pyg_dgl == 'pyg':
+                    data = data.to(self.device)
+                    optimizer.zero_grad()
+                    output = self.model.model(data)
+                    # loss = F.nll_loss(output, data.y)
+                    if hasattr(F, self.loss):
+                        loss = getattr(F, self.loss)(output, data.y)
+                    else:
+                        raise TypeError(
+                            "PyTorch does not support loss type {}".format(self.loss)
+                        )
+                    loss.backward()
+                    loss_all += data.num_graphs * loss.item()
+                elif self.pyg_dgl == 'dgl':
+                    graphs, labels = data
+                    graphs = graphs.to(self.device)
+                    labels = labels.to(self.device)
+                    feat = graphs.ndata.pop('attr')
+                    output = self.model.model(graphs, feat)
+                    loss = self.criterion(output, labels)
+
+                    loss.backward()
+
+                    loss_all += len(labels) * loss.item()
+
                 optimizer.step()
                 if self.lr_scheduler_type:
                     scheduler.step()
@@ -259,9 +277,13 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
                 if eval_func.is_higher_better():
                     val_loss = -val_loss
                 self.early_stopping(val_loss, self.model.model)
+
+                print('val_loss', val_loss)
+
                 if self.early_stopping.early_stop:
                     LOGGER.debug("Early stopping at", epoch)
                     break
+
         if valid_loader is not None:
             self.early_stopping.load_checkpoint(self.model.model)
 
@@ -282,8 +304,17 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         self.model.model.eval()
         pred = []
         for data in loader:
-            data = data.to(self.device)
-            pred.append(self.model.model(data))
+            if self.pyg_dgl == 'pyg':
+                data = data.to(self.device)
+                pred.append(self.model.model(data))
+            elif self.pyg_dgl == 'dgl':
+                graphs, labels = data
+                graphs = graphs.to(self.device)
+                labels = labels.to(self.device)
+                feat = graphs.ndata.pop('attr')
+                outputs = self.model.model(graphs, feat)
+                pred.append(outputs)
+
         ret = torch.cat(pred, 0)
         return ret
 
@@ -332,10 +363,15 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         -------
         The prediction result of ``predict_proba``.
         """
-        loader = utils.graph_get_split(
-            dataset, mask, batch_size=self.batch_size, num_workers=self.num_workers
-        )
-        return self._predict_proba(loader, in_log_format=True).max(1)[1]
+        if self.pyg_dgl == 'pyg':
+            loader = utils.graph_get_split(
+                dataset, mask, batch_size=self.batch_size, num_workers=self.num_workers
+            )
+            return self._predict_proba(loader, in_log_format=True).max(1)[1]
+
+        elif self.pyg_dgl == 'dgl':
+            loader = dataset
+            return self._predict_proba(loader, in_log_format=True).max(1)[1]
 
     def predict_proba(self, dataset, mask="test", in_log_format=False):
         """
@@ -430,10 +466,14 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         res: The evaluation result on the given dataset.
 
         """
-        loader = utils.graph_get_split(
-            dataset, mask, batch_size=self.batch_size, num_workers=self.num_workers
-        )
-        return self._evaluate(loader, feval)
+        if self.pyg_dgl == 'pyg':
+            loader = utils.graph_get_split(
+                dataset, mask, batch_size=self.batch_size, num_workers=self.num_workers
+            )
+            return self._evaluate(loader, feval)
+        elif self.pyg_dgl == 'dgl':
+            loader = dataset
+            return self._evaluate(loader, feval)
 
     def _evaluate(self, loader, feval=None):
         if feval is None:
@@ -445,7 +485,11 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
 
         y_true_tmp = []
         for data in loader:
-            y_true_tmp.append(data.y)
+            if self.pyg_dgl == 'pyg':
+                y_true_tmp.append(data.y)
+            elif self.pyg_dgl == 'dgl':
+                graphs, labels = data
+                y_true_tmp.append(labels)
         y_true = torch.cat(y_true_tmp, 0)
 
         if not isinstance(feval, list):

From 0d3550302430ac414ee94f7ca59ce68f6137103d Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Sat, 25 Sep 2021 10:45:30 +0800
Subject: [PATCH 24/75] trainner dgl

---
 autogl/__init__.py                            |  38 +++---
 autogl/module/__init__.py                     |  14 +-
 .../module/train/graph_classification_full.py |   2 +-
 test/model_glf/gclf_dgl.py                    | 124 +++++++++++++++---
 4 files changed, 135 insertions(+), 43 deletions(-)

diff --git a/autogl/__init__.py b/autogl/__init__.py
index 7f1b47a..59f1aab 100644
--- a/autogl/__init__.py
+++ b/autogl/__init__.py
@@ -1,19 +1,19 @@
-from . import (
-    backend,
-    data,
-    datasets,
-    module,
-    solver,
-    utils,
-)
-
-from .module import (
-    ensemble,
-    feature,
-    hpo,
-    model,
-    nas,
-    train,
-)
-
-__version__ = "0.2.0-pre"
+# from . import (
+#     backend,
+#     data,
+#     datasets,
+#     module,
+#     solver,
+#     utils,
+# )
+#
+# from .module import (
+#     ensemble,
+#     feature,
+#     hpo,
+#     model,
+#     nas,
+#     train,
+# )
+#
+# __version__ = "0.2.0-pre"
diff --git a/autogl/module/__init__.py b/autogl/module/__init__.py
index 02238e7..cbf0695 100644
--- a/autogl/module/__init__.py
+++ b/autogl/module/__init__.py
@@ -1,7 +1,7 @@
-from . import feature, model, train, hpo, nas, ensemble
-
-from .ensemble import *
-from .feature import *
-from .hpo import *
-from .model import *
-from .train import *
+# from . import feature, model, train
+#
+# from .ensemble import *
+# from .feature import *
+# from .hpo import *
+# from .model import *
+# from .train import *
diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index 6ecb015..7214fcb 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -278,7 +278,7 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
                     val_loss = -val_loss
                 self.early_stopping(val_loss, self.model.model)
 
-                print('val_loss', val_loss)
+                # print('val_loss', val_loss)
 
                 if self.early_stopping.early_stop:
                     LOGGER.debug("Early stopping at", epoch)
diff --git a/test/model_glf/gclf_dgl.py b/test/model_glf/gclf_dgl.py
index 5f2ccff..ce6a659 100644
--- a/test/model_glf/gclf_dgl.py
+++ b/test/model_glf/gclf_dgl.py
@@ -3,28 +3,32 @@ import sys
 import logging
 logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm
+import argparse
+
+sys.path.insert(0, "../../")
+sys.path.insert(0, "/DATA/DATANAS1/lhy/tmp/AutoGL")
+sys.path.insert(0, "/DATA/DATANAS1/lhy/tmp/AutoGL/autogl")
 
-sys.path.append("../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
 #os.environ["AUTOGL_BACKEND"] = "pyg"
-from autogl.backend import DependentBackend
+# from autogl.backend import DependentBackend
 import dgl
 from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
 import torch
 import torch.nn as nn
-import torch.nn.functional as F
 import torch.optim as optim
 
-from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
-from autogl.module.model.ginparser import Parser
-from autogl.module.model.dataloader_gin import GINDataLoader
-from autogl.module.model import AutoGIN
+# from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
+# from autogl.module.model.ginparser import Parser
+from autogl.module.model.dgl.dataloader_gin import GINDataLoader
+from autogl.module.model.dgl.gin import AutoGIN
+from autogl.module.train.graph_classification_full import GraphClassificationFullTrainer
 
-from pdb import set_trace
+# from pdb import set_tracefrom
 import numpy as np
-from autogl.solver.utils import set_seed
-set_seed(202106)
+# from autogl.solver.utils import set_seed
+# set_seed(202106)
 
 
 def train(args, net, trainloader, optimizer, criterion, epoch):
@@ -93,7 +97,8 @@ def main(args):
     torch.manual_seed(seed=args.seed)
     np.random.seed(seed=args.seed)
 
-    is_cuda = not args.disable_cuda and torch.cuda.is_available()
+    # is_cuda = not args.disable_cuda and torch.cuda.is_available()
+    is_cuda = torch.cuda.is_available()
 
     if is_cuda:
         args.device = torch.device("cuda:" + str(args.device))
@@ -101,6 +106,7 @@ def main(args):
     else:
         args.device = torch.device("cpu")
 
+
     dataset = GINDataset(args.dataset, not args.learn_eps)
 
     trainloader, validloader = GINDataLoader(
@@ -108,7 +114,7 @@ def main(args):
         seed=args.seed, shuffle=True,
         split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
     # or split_name='rand', split_ratio=0.7
-    automodel =  AutoGIN(
+    automodel = AutoGIN(
                 num_classes=dataset.gclasses,
                 num_features=dataset.dim_nfeats,
                 device=args.device,
@@ -118,6 +124,27 @@ def main(args):
     optimizer = optim.Adam(model.parameters(), lr=args.lr)
     scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
 
+    trainer = GraphClassificationFullTrainer(
+        model=automodel,
+        num_features=dataset.dim_nfeats,
+        num_classes=dataset.gclasses,
+        optimizer=optimizer,
+        lr=args.lr,
+        max_epoch=30,
+        # max_epoch=1,
+        batch_size=args.batch_size,
+        criterion=criterion,
+        feval="acc",
+    )
+
+    trainer.train_only(trainloader)
+    pred = trainer.predict(validloader)
+    print(pred)
+    print(trainer.evaluate(validloader, feval='acc'))
+
+    return 0
+
+
     # it's not cost-effective to hanle the cursor and init 0
     # https://stackoverflow.com/a/23121189
     tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
@@ -158,9 +185,9 @@ def main(args):
                 ))
                 f.write("\n")
 
-        lrbar.set_description(
-            "Learning eps with learn_eps={}: {}".format(
-                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
+        # lrbar.set_description(
+        #     "Learning eps with learn_eps={}: {}".format(
+        #         args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
 
     tbar.close()
     vbar.close()
@@ -168,8 +195,73 @@ def main(args):
 
 
 if __name__ == '__main__':
-    args = Parser(description='GIN').args
+    parser = argparse.ArgumentParser(
+        "auto graph classification", formatter_class=argparse.ArgumentDefaultsHelpFormatter
+    )
+    parser.add_argument(
+        '--dataset', type=str, default="MUTAG",
+        choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI'],
+        help='name of dataset (default: MUTAG)')
+    parser.add_argument(
+        '--batch_size', type=int, default=32,
+        help='batch size for training and validation (default: 32)')
+    parser.add_argument(
+        '--fold_idx', type=int, default=0,
+        help='the index(<10) of fold in 10-fold validation.')
+    parser.add_argument(
+        '--filename', type=str, default="",
+        help='output file')
+
+    # device
+    parser.add_argument(
+        '--disable-cuda', action='store_true',
+        help='Disable CUDA')
+    parser.add_argument(
+        '--device', type=int, default=0,
+        help='which gpu device to use (default: 0)')
+
+    # net
+    parser.add_argument(
+        '--num_layers', type=int, default=5,
+        help='number of layers (default: 5)')
+    parser.add_argument(
+        '--num_mlp_layers', type=int, default=2,
+        help='number of MLP layers(default: 2). 1 means linear model.')
+    parser.add_argument(
+        '--hidden_dim', type=int, default=64,
+        help='number of hidden units (default: 64)')
+
+    # graph
+    parser.add_argument(
+        '--graph_pooling_type', type=str,
+        default="sum", choices=["sum", "mean", "max"],
+        help='type of graph pooling: sum, mean or max')
+    parser.add_argument(
+        '--neighbor_pooling_type', type=str,
+        default="sum", choices=["sum", "mean", "max"],
+        help='type of neighboring pooling: sum, mean or max')
+    parser.add_argument(
+        '--learn_eps', action="store_true",
+        help='learn the epsilon weighting')
+
+    # learning
+    parser.add_argument(
+        '--seed', type=int, default=0,
+        help='random seed (default: 0)')
+    parser.add_argument(
+        '--epochs', type=int, default=100,
+        help='number of epochs to train (default: 350)')
+    parser.add_argument(
+        '--lr', type=float, default=0.01,
+        help='learning rate (default: 0.01)')
+    parser.add_argument(
+        '--final_dropout', type=float, default=0.5,
+        help='final layer dropout (default: 0.5)')
+
+    args = parser.parse_args()
     print('show all arguments configuration...')
     print(args)
     main(args)
 
+
+

From 42cae416402987ab65d39278e5fb08b07aee32cf Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Fri, 17 Sep 2021 07:31:31 +0000
Subject: [PATCH 25/75] finish support to topk on glf with dgl backend, topk is
 different from pyg

---
 autogl/module/model/dgl/topkpool.py | 217 ++++++++++++++++++++++------
 test/model_glf/gclf_dgl_gin.py      | 175 ++++++++++++++++++++++
 test/model_glf/gclf_dgl_topk.py     | 169 ++++++++++++++++++++++
 3 files changed, 516 insertions(+), 45 deletions(-)
 create mode 100644 test/model_glf/gclf_dgl_gin.py
 create mode 100644 test/model_glf/gclf_dgl_topk.py

diff --git a/autogl/module/model/dgl/topkpool.py b/autogl/module/model/dgl/topkpool.py
index c1872bd..235fbc4 100644
--- a/autogl/module/model/dgl/topkpool.py
+++ b/autogl/module/model/dgl/topkpool.py
@@ -1,9 +1,13 @@
 import torch
+import torch.nn as nn
 import torch.nn.functional as F
-from torch_geometric.nn import GraphConv, TopKPooling
-from torch_geometric.nn import global_mean_pool as gap, global_max_pool as gmp
+from torch.nn import Linear, ReLU, Sequential, LeakyReLU, Tanh, ELU
+from dgl.nn.pytorch.conv import GraphConv
+from dgl.nn.pytorch.glob import SortPooling
+from torch.nn import BatchNorm1d
 from . import register_model
 from .base import BaseModel, activate_func
+from copy import deepcopy
 from ....utils import get_logger
 
 LOGGER = get_logger("TopkModel")
@@ -16,8 +20,95 @@ def set_default(args, d):
     return args
 
 
+class ApplyNodeFunc(nn.Module):
+    """Update the node feature hv with MLP, BN and ReLU."""
+    def __init__(self, mlp):
+        super(ApplyNodeFunc, self).__init__()
+        self.mlp = mlp
+        self.bn = nn.BatchNorm1d(self.mlp.output_dim)
+
+    def forward(self, h):
+        h = self.mlp(h)
+        h = self.bn(h)
+        h = F.relu(h)
+        return h
+
+
+class MLP(nn.Module):
+    """MLP with linear output"""
+    def __init__(self, num_layers, input_dim, hidden_dim, output_dim):
+        """MLP layers construction
+
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+
+        """
+        super(MLP, self).__init__()
+        self.linear_or_not = True  # default is linear model
+        self.num_layers = num_layers
+        self.output_dim = output_dim
+
+        if num_layers < 1:
+            raise ValueError("number of layers should be positive!")
+        elif num_layers == 1:
+            # Linear model
+            self.linear = nn.Linear(input_dim, output_dim)
+        else:
+            # Multi-layer model
+            self.linear_or_not = False
+            self.linears = torch.nn.ModuleList()
+            self.batch_norms = torch.nn.ModuleList()
+
+            self.linears.append(nn.Linear(input_dim, hidden_dim))
+            for layer in range(num_layers - 2):
+                self.linears.append(nn.Linear(hidden_dim, hidden_dim))
+            self.linears.append(nn.Linear(hidden_dim, output_dim))
+
+            for layer in range(num_layers - 1):
+                self.batch_norms.append(nn.BatchNorm1d((hidden_dim)))
+
+    def forward(self, x):
+        if self.linear_or_not:
+            # If linear model
+            return self.linear(x)
+        else:
+            # If MLP
+            h = x
+            for i in range(self.num_layers - 1):
+                h = F.relu(self.batch_norms[i](self.linears[i](h)))
+            return self.linears[-1](h)
+
+
+
 class Topkpool(torch.nn.Module):
+    """Topkpool model"""
     def __init__(self, args):
+        """model parameters setting
+
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers in the neural network
+        num_mlp_layers: int
+            The number of linear layers in mlps
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+        final_dropout: float
+            dropout ratio on the final linear layer
+
+        """
         super(Topkpool, self).__init__()
         self.args = args
 
@@ -27,82 +118,110 @@ class Topkpool(torch.nn.Module):
                     "features_num",
                     "num_class",
                     "num_graph_features",
-                    "ratio",
+                    "num_layers",
+                    "hidden",
                     "dropout",
                     "act",
+                    "mlp_layers",
                 ]
             )
             - set(self.args.keys())
         )
         if len(missing_keys) > 0:
             raise Exception("Missing keys: %s." % ",".join(missing_keys))
+        #if not self.num_layer == len(self.args["hidden"]) + 1:
+        #    LOGGER.warn("Warning: layer size does not match the length of hidden units")
+
 
-        self.num_features = self.args["features_num"]
-        self.num_classes = self.args["num_class"]
-        self.ratio = self.args["ratio"]
-        self.dropout = self.args["dropout"]
         self.num_graph_features = self.args["num_graph_features"]
+        self.num_layers = self.args["num_layers"]
+        assert self.num_layers > 2, "Number of layers in GIN should not less than 3"
+
+        self.num_mlp_layers = self.args["mlp_layers"]
+        input_dim = self.args["features_num"]
+        hidden_dim = self.args["hidden"][0]
+        if self.args["act"] == "leaky_relu":
+            act = LeakyReLU()
+        elif self.args["act"] == "relu":
+            act = ReLU()
+        elif self.args["act"] == "elu":
+            act = ELU()
+        elif self.args["act"] == "tanh":
+            act = Tanh()
+        else:
+            act = ReLU()
+        final_dropout = self.args["dropout"]
+        output_dim = self.args["num_class"]
+
+        # List of MLPs
+        self.gcnlayers = torch.nn.ModuleList()
+        self.batch_norms = torch.nn.ModuleList()
+
+        for layer in range(self.num_layers - 1):
+            if layer == 0:
+                self.gcnlayers.append(GraphConv(input_dim, hidden_dim))
+            else:
+                self.gcnlayers.append(GraphConv(hidden_dim, hidden_dim))
 
-        self.conv1 = GraphConv(self.num_features, 128)
-        self.pool1 = TopKPooling(128, ratio=self.ratio)
-        self.conv2 = GraphConv(128, 128)
-        self.pool2 = TopKPooling(128, ratio=self.ratio)
-        self.conv3 = GraphConv(128, 128)
-        self.pool3 = TopKPooling(128, ratio=self.ratio)
+            if layer == 0:
+                mlp = MLP(self.num_mlp_layers, input_dim, hidden_dim, hidden_dim)
+            else:
+                mlp = MLP(self.num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)
 
-        self.lin1 = torch.nn.Linear(256 + self.num_graph_features, 128)
-        self.lin2 = torch.nn.Linear(128, 64)
-        self.lin3 = torch.nn.Linear(64, self.num_classes)
+            #self.gcnlayers.append(GraphConv(input_dim, hidden_dim))
+            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))
 
-    def forward(self, data):
-        x, edge_index, batch = data.x, data.edge_index, data.batch
-        if self.num_graph_features > 0:
-            graph_feature = data.gf
+        # Linear function for graph poolings of output of each layer
+        # which maps the output of different layers into a prediction score
+        self.linears_prediction = torch.nn.ModuleList()
 
-        x = F.relu(self.conv1(x, edge_index))
-        x, edge_index, _, batch, _, _ = self.pool1(x, edge_index, None, batch)
-        x1 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+        for layer in range(self.num_layers):
+            if layer == 0:
+                self.linears_prediction.append(
+                    nn.Linear(input_dim, output_dim))
+            else:
+                self.linears_prediction.append(
+                    nn.Linear(hidden_dim, output_dim))
 
-        x = F.relu(self.conv2(x, edge_index))
-        x, edge_index, _, batch, _, _ = self.pool2(x, edge_index, None, batch)
-        x2 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+        self.drop = nn.Dropout(final_dropout)
+        #TopKPool
+        self.pool = SortPooling(k=1)
 
-        x = F.relu(self.conv3(x, edge_index))
-        x, edge_index, _, batch, _, _ = self.pool3(x, edge_index, None, batch)
-        x3 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+    def forward(self, g, h):
+        # list of hidden representation at each layer (including input)
+        hidden_rep = [h]
 
-        x = x1 + x2 + x3
-        if self.num_graph_features > 0:
-            x = torch.cat([x, graph_feature], dim=-1)
-        x = self.lin1(x)
-        x = activate_func(x, self.args["act"])
-        x = F.dropout(x, p=self.dropout, training=self.training)
-        x = self.lin2(x)
-        x = activate_func(x, self.args["act"])
-        x = F.log_softmax(self.lin3(x), dim=-1)
+        for i in range(self.num_layers - 1):
+            h = self.gcnlayers[i](g, h)
+            h = self.batch_norms[i](h)
+            h = F.relu(h)
+            hidden_rep.append(h)
 
-        return x
+        score_over_layer = 0
+
+        # perform pooling over all nodes in each graph in every layer
+        for i, h in enumerate(hidden_rep):
+            pooled_h = self.pool(g, h)
+            #import pdb; pdb.set_trace()
+            score_over_layer += self.drop(self.linears_prediction[i](pooled_h))
+
+        return score_over_layer
 
 
 @register_model("topkpool")
 class AutoTopkpool(BaseModel):
     r"""
     AutoTopkpool. The model used in this automodel is from https://arxiv.org/abs/1905.05178, https://arxiv.org/abs/1905.02850
-
     Parameters
     ----------
     num_features: `int`.
         The dimension of features.
-
     num_classes: `int`.
         The number of classes.
-
     device: `torch.device` or `str`
         The device where model will be running on.
-
     init: `bool`.
         If True(False), the model will (not) be initialized.
-
     """
 
     def __init__(
@@ -155,7 +274,14 @@ class AutoTopkpool(BaseModel):
             },
         ]
 
-        self.hyperparams = {"ratio": 0.8, "dropout": 0.5, "act": "relu"}
+        #self.hyperparams = {"ratio": 0.8, "dropout": 0.5, "act": "relu"}
+        self.hyperparams = {
+            "num_layers": 5,
+            "hidden": [64],
+            "dropout": 0.5,
+            "act": "relu",
+            "mlp_layers": 2
+        }
 
         self.initialized = False
         if init is True:
@@ -167,3 +293,4 @@ class AutoTopkpool(BaseModel):
         self.initialized = True
         LOGGER.debug("topkpool initialize with parameters {}".format(self.params))
         self.model = Topkpool({**self.params, **self.hyperparams}).to(self.device)
+
diff --git a/test/model_glf/gclf_dgl_gin.py b/test/model_glf/gclf_dgl_gin.py
new file mode 100644
index 0000000..5f2ccff
--- /dev/null
+++ b/test/model_glf/gclf_dgl_gin.py
@@ -0,0 +1,175 @@
+import os
+import sys
+import logging
+logging.basicConfig(level=logging.INFO)
+from tqdm import tqdm
+
+sys.path.append("../../")
+print(os.getcwd())
+os.environ["AUTOGL_BACKEND"] = "dgl"
+#os.environ["AUTOGL_BACKEND"] = "pyg"
+from autogl.backend import DependentBackend
+import dgl
+from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+
+from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
+from autogl.module.model.ginparser import Parser
+from autogl.module.model.dataloader_gin import GINDataLoader
+from autogl.module.model import AutoGIN
+
+from pdb import set_trace
+import numpy as np
+from autogl.solver.utils import set_seed
+set_seed(202106)
+
+
+def train(args, net, trainloader, optimizer, criterion, epoch):
+    net.train()
+
+    running_loss = 0
+    total_iters = len(trainloader)
+    # setup the offset to avoid the overlap with mouse cursor
+    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
+
+    for pos, (graphs, labels) in zip(bar, trainloader):
+        # batch graphs will be shipped to device in forward part of model
+        labels = labels.to(args.device)
+        graphs = graphs.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        outputs = net(graphs, feat)
+
+        loss = criterion(outputs, labels)
+        running_loss += loss.item()
+
+        # backprop
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        # report
+        bar.set_description('epoch-{}'.format(epoch))
+    bar.close()
+    # the final batch will be aligned
+    running_loss = running_loss / total_iters
+
+    return running_loss
+
+
+def eval_net(args, net, dataloader, criterion):
+    net.eval()
+
+    total = 0
+    total_loss = 0
+    total_correct = 0
+
+    for data in dataloader:
+        graphs, labels = data
+        graphs = graphs.to(args.device)
+        labels = labels.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        total += len(labels)
+        outputs = net(graphs, feat)
+        _, predicted = torch.max(outputs.data, 1)
+
+        total_correct += (predicted == labels.data).sum().item()
+        loss = criterion(outputs, labels)
+        # crossentropy(reduce=True) for default
+        total_loss += loss.item() * len(labels)
+
+    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
+
+    net.train()
+
+    return loss, acc
+
+
+def main(args):
+
+    # set up seeds, args.seed supported
+    torch.manual_seed(seed=args.seed)
+    np.random.seed(seed=args.seed)
+
+    is_cuda = not args.disable_cuda and torch.cuda.is_available()
+
+    if is_cuda:
+        args.device = torch.device("cuda:" + str(args.device))
+        torch.cuda.manual_seed_all(seed=args.seed)
+    else:
+        args.device = torch.device("cpu")
+
+    dataset = GINDataset(args.dataset, not args.learn_eps)
+
+    trainloader, validloader = GINDataLoader(
+        dataset, batch_size=args.batch_size, device=args.device,
+        seed=args.seed, shuffle=True,
+        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
+    # or split_name='rand', split_ratio=0.7
+    automodel =  AutoGIN(
+                num_classes=dataset.gclasses,
+                num_features=dataset.dim_nfeats,
+                device=args.device,
+                init=True)
+    model = automodel.model
+    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
+
+    # it's not cost-effective to hanle the cursor and init 0
+    # https://stackoverflow.com/a/23121189
+    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
+    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
+    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
+
+    for epoch, _, _ in zip(tbar, vbar, lrbar):
+
+        train(args, model, trainloader, optimizer, criterion, epoch)
+        scheduler.step()
+
+        train_loss, train_acc = eval_net(
+            args, model, trainloader, criterion)
+        tbar.set_description(
+            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(train_loss, 100. * train_acc))
+
+        valid_loss, valid_acc = eval_net(
+            args, model, validloader, criterion)
+        vbar.set_description(
+            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(valid_loss, 100. * valid_acc))
+
+        if not args.filename == "":
+            with open(args.filename, 'a') as f:
+                f.write('%s %s %s %s' % (
+                    args.dataset,
+                    args.learn_eps,
+                    args.neighbor_pooling_type,
+                    args.graph_pooling_type
+                ))
+                f.write("\n")
+                f.write("%f %f %f %f" % (
+                    train_loss,
+                    train_acc,
+                    valid_loss,
+                    valid_acc
+                ))
+                f.write("\n")
+
+        lrbar.set_description(
+            "Learning eps with learn_eps={}: {}".format(
+                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
+
+    tbar.close()
+    vbar.close()
+    lrbar.close()
+
+
+if __name__ == '__main__':
+    args = Parser(description='GIN').args
+    print('show all arguments configuration...')
+    print(args)
+    main(args)
+
diff --git a/test/model_glf/gclf_dgl_topk.py b/test/model_glf/gclf_dgl_topk.py
new file mode 100644
index 0000000..10bc437
--- /dev/null
+++ b/test/model_glf/gclf_dgl_topk.py
@@ -0,0 +1,169 @@
+import os
+import sys
+import logging
+logging.basicConfig(level=logging.INFO)
+from tqdm import tqdm
+
+sys.path.append("../../")
+print(os.getcwd())
+os.environ["AUTOGL_BACKEND"] = "dgl"
+#os.environ["AUTOGL_BACKEND"] = "pyg"
+from autogl.backend import DependentBackend
+import dgl
+from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+
+from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
+from autogl.module.model.ginparser import Parser
+from autogl.module.model.dataloader_gin import GINDataLoader
+from autogl.module.model import AutoTopkpool
+
+from pdb import set_trace
+import numpy as np
+from autogl.solver.utils import set_seed
+set_seed(202106)
+
+
+def train(args, net, trainloader, optimizer, criterion, epoch):
+    net.train()
+
+    running_loss = 0
+    total_iters = len(trainloader)
+    # setup the offset to avoid the overlap with mouse cursor
+    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
+
+    for pos, (graphs, labels) in zip(bar, trainloader):
+        # batch graphs will be shipped to device in forward part of model
+        labels = labels.to(args.device)
+        graphs = graphs.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        outputs = net(graphs, feat)
+
+        loss = criterion(outputs, labels)
+        running_loss += loss.item()
+
+        # backprop
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        # report
+        bar.set_description('epoch-{}'.format(epoch))
+    bar.close()
+    # the final batch will be aligned
+    running_loss = running_loss / total_iters
+
+    return running_loss
+
+
+def eval_net(args, net, dataloader, criterion):
+    net.eval()
+
+    total = 0
+    total_loss = 0
+    total_correct = 0
+
+    for data in dataloader:
+        graphs, labels = data
+        graphs = graphs.to(args.device)
+        labels = labels.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        total += len(labels)
+        outputs = net(graphs, feat)
+        _, predicted = torch.max(outputs.data, 1)
+
+        total_correct += (predicted == labels.data).sum().item()
+        loss = criterion(outputs, labels)
+        # crossentropy(reduce=True) for default
+        total_loss += loss.item() * len(labels)
+
+    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
+
+    net.train()
+
+    return loss, acc
+
+
+def main(args):
+
+    # set up seeds, args.seed supported
+    torch.manual_seed(seed=args.seed)
+    np.random.seed(seed=args.seed)
+
+    is_cuda = not args.disable_cuda and torch.cuda.is_available()
+
+    if is_cuda:
+        args.device = torch.device("cuda:" + str(args.device))
+        torch.cuda.manual_seed_all(seed=args.seed)
+    else:
+        args.device = torch.device("cpu")
+
+    dataset = GINDataset(args.dataset, not args.learn_eps)
+
+    trainloader, validloader = GINDataLoader(
+        dataset, batch_size=args.batch_size, device=args.device,
+        seed=args.seed, shuffle=True,
+        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
+    # or split_name='rand', split_ratio=0.7
+    automodel =  AutoTopkpool(
+                num_classes=dataset.gclasses,
+                num_features=dataset.dim_nfeats,
+                device=args.device,
+                init=True)
+    model = automodel.model
+    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
+
+    # it's not cost-effective to hanle the cursor and init 0
+    # https://stackoverflow.com/a/23121189
+    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
+    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
+    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
+
+    for epoch, _, _ in zip(tbar, vbar, lrbar):
+
+        train(args, model, trainloader, optimizer, criterion, epoch)
+        scheduler.step()
+
+        train_loss, train_acc = eval_net(
+            args, model, trainloader, criterion)
+        tbar.set_description(
+            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(train_loss, 100. * train_acc))
+
+        valid_loss, valid_acc = eval_net(
+            args, model, validloader, criterion)
+        vbar.set_description(
+            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(valid_loss, 100. * valid_acc))
+
+        if not args.filename == "":
+            with open(args.filename, 'a') as f:
+                f.write('%s' % (
+                    args.dataset,
+                ))
+                f.write("\n")
+                f.write("%f %f %f %f" % (
+                    train_loss,
+                    train_acc,
+                    valid_loss,
+                    valid_acc
+                ))
+                f.write("\n")
+
+
+    tbar.close()
+    vbar.close()
+    lrbar.close()
+
+
+if __name__ == '__main__':
+    args = Parser(description='GIN').args
+    print('show all arguments configuration...')
+    print(args)
+    main(args)
+

From d430c5f139e7d11c552c8533990fefcf964217a6 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Fri, 17 Sep 2021 07:42:14 +0000
Subject: [PATCH 26/75] finish support to topk on glf with dgl backend, topk is
 different from pyg

---
 autogl/module/model/dgl/topkpool.py | 11 +++++++----
 1 file changed, 7 insertions(+), 4 deletions(-)

diff --git a/autogl/module/model/dgl/topkpool.py b/autogl/module/model/dgl/topkpool.py
index 235fbc4..e9328ff 100644
--- a/autogl/module/model/dgl/topkpool.py
+++ b/autogl/module/model/dgl/topkpool.py
@@ -175,17 +175,20 @@ class Topkpool(torch.nn.Module):
         # which maps the output of different layers into a prediction score
         self.linears_prediction = torch.nn.ModuleList()
 
+        #TopKPool
+        k = 3
+        self.pool = SortPooling(k)
+
         for layer in range(self.num_layers):
             if layer == 0:
                 self.linears_prediction.append(
-                    nn.Linear(input_dim, output_dim))
+                    nn.Linear(input_dim * k, output_dim))
             else:
                 self.linears_prediction.append(
-                    nn.Linear(hidden_dim, output_dim))
+                    nn.Linear(hidden_dim * k, output_dim))
 
         self.drop = nn.Dropout(final_dropout)
-        #TopKPool
-        self.pool = SortPooling(k=1)
+
 
     def forward(self, g, h):
         # list of hidden representation at each layer (including input)

From a663908ada829942f679c2971aeb7d329c986f47 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Thu, 23 Sep 2021 09:18:50 +0000
Subject: [PATCH 27/75] fixed interface to data

---
 autogl/module/model/dgl/gin.py      |  5 ++++-
 autogl/module/model/dgl/topkpool.py |  5 ++++-
 test/model_glf/gclf_dgl_gin.py      | 25 +++++++++++++++----------
 test/model_glf/gclf_dgl_topk.py     | 26 ++++++++++++++++----------
 4 files changed, 39 insertions(+), 22 deletions(-)

diff --git a/autogl/module/model/dgl/gin.py b/autogl/module/model/dgl/gin.py
index 5dc9569..8e160e9 100644
--- a/autogl/module/model/dgl/gin.py
+++ b/autogl/module/model/dgl/gin.py
@@ -202,7 +202,10 @@ class GIN(torch.nn.Module):
         else:
             raise NotImplementedError
 
-    def forward(self, g, h):
+    #def forward(self, g, h):
+    def forward(self, data):
+        g, _ = data
+        h = g.ndata.pop('attr')
         # list of hidden representation at each layer (including input)
         hidden_rep = [h]
 
diff --git a/autogl/module/model/dgl/topkpool.py b/autogl/module/model/dgl/topkpool.py
index e9328ff..68f5e83 100644
--- a/autogl/module/model/dgl/topkpool.py
+++ b/autogl/module/model/dgl/topkpool.py
@@ -190,7 +190,10 @@ class Topkpool(torch.nn.Module):
         self.drop = nn.Dropout(final_dropout)
 
 
-    def forward(self, g, h):
+    #def forward(self, g, h):
+    def forward(self, data):
+        g, _ = data
+        h = g.ndata.pop('attr')
         # list of hidden representation at each layer (including input)
         hidden_rep = [h]
 
diff --git a/test/model_glf/gclf_dgl_gin.py b/test/model_glf/gclf_dgl_gin.py
index 5f2ccff..82ab4f8 100644
--- a/test/model_glf/gclf_dgl_gin.py
+++ b/test/model_glf/gclf_dgl_gin.py
@@ -35,12 +35,15 @@ def train(args, net, trainloader, optimizer, criterion, epoch):
     # setup the offset to avoid the overlap with mouse cursor
     bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
 
-    for pos, (graphs, labels) in zip(bar, trainloader):
+    for pos, data in zip(bar, trainloader):
+        data = [data[i].to(args.device) for i in range(len(data))]
+        _, labels = data
         # batch graphs will be shipped to device in forward part of model
-        labels = labels.to(args.device)
-        graphs = graphs.to(args.device)
-        feat = graphs.ndata.pop('attr')
-        outputs = net(graphs, feat)
+        #labels = labels.to(args.device)
+        #graphs = graphs.to(args.device)
+        #feat = graphs.ndata.pop('attr')
+        #outputs = net(graphs, feat)
+        outputs = net(data)
 
         loss = criterion(outputs, labels)
         running_loss += loss.item()
@@ -67,12 +70,14 @@ def eval_net(args, net, dataloader, criterion):
     total_correct = 0
 
     for data in dataloader:
-        graphs, labels = data
-        graphs = graphs.to(args.device)
-        labels = labels.to(args.device)
-        feat = graphs.ndata.pop('attr')
+        data = [data[i].to(args.device) for i in range(len(data))]
+        _, labels = data
+        #graphs = graphs.to(args.device)
+        #labels = labels.to(args.device)
+        #feat = graphs.ndata.pop('attr')
         total += len(labels)
-        outputs = net(graphs, feat)
+        #outputs = net(graphs, feat)
+        outputs = net(data)
         _, predicted = torch.max(outputs.data, 1)
 
         total_correct += (predicted == labels.data).sum().item()
diff --git a/test/model_glf/gclf_dgl_topk.py b/test/model_glf/gclf_dgl_topk.py
index 10bc437..49a3fa5 100644
--- a/test/model_glf/gclf_dgl_topk.py
+++ b/test/model_glf/gclf_dgl_topk.py
@@ -35,12 +35,15 @@ def train(args, net, trainloader, optimizer, criterion, epoch):
     # setup the offset to avoid the overlap with mouse cursor
     bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
 
-    for pos, (graphs, labels) in zip(bar, trainloader):
+    for pos, data in zip(bar, trainloader):
+        data = [data[i].to(args.device) for i in range(len(data))]
+        _, labels = data
         # batch graphs will be shipped to device in forward part of model
-        labels = labels.to(args.device)
-        graphs = graphs.to(args.device)
-        feat = graphs.ndata.pop('attr')
-        outputs = net(graphs, feat)
+        #labels = labels.to(args.device)
+        #graphs = graphs.to(args.device)
+        #feat = graphs.ndata.pop('attr')
+        #outputs = net(graphs, feat)
+        outputs = net(data)
 
         loss = criterion(outputs, labels)
         running_loss += loss.item()
@@ -67,12 +70,15 @@ def eval_net(args, net, dataloader, criterion):
     total_correct = 0
 
     for data in dataloader:
-        graphs, labels = data
-        graphs = graphs.to(args.device)
-        labels = labels.to(args.device)
-        feat = graphs.ndata.pop('attr')
+        data = [data[i].to(args.device) for i in range(len(data))]
+        _, labels = data
+        #graphs, labels = data
+        #graphs = graphs.to(args.device)
+        #labels = labels.to(args.device)
+        #feat = graphs.ndata.pop('attr')
         total += len(labels)
-        outputs = net(graphs, feat)
+        #outputs = net(graphs, feat)
+        outputs = net(data)
         _, predicted = torch.max(outputs.data, 1)
 
         total_correct += (predicted == labels.data).sum().item()

From 6823aa63479a4a5a6c05893077165fb763520220 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Sat, 25 Sep 2021 18:53:28 +0800
Subject: [PATCH 28/75] dgl dataloader should set shuffle False for val loader

---
 autogl/__init__.py                            |   8 +-
 autogl/module/model/__init__.py               |  24 +-
 autogl/module/model/dgl/__init__.py           |   2 +
 autogl/module/model/dgl/ginparser.py          |   4 +-
 .../module/train/graph_classification_full.py |  76 ++++--
 test/model_glf/gclf_dgl_gin.py                |  21 +-
 test/model_glf/gclf_dgl_gin_trainer.py        | 217 ++++++++++++++++++
 test/model_glf/gclf_dgl_trainer.py            |   0
 8 files changed, 307 insertions(+), 45 deletions(-)
 create mode 100644 test/model_glf/gclf_dgl_gin_trainer.py
 create mode 100644 test/model_glf/gclf_dgl_trainer.py

diff --git a/autogl/__init__.py b/autogl/__init__.py
index 59f1aab..f20b8e4 100644
--- a/autogl/__init__.py
+++ b/autogl/__init__.py
@@ -8,11 +8,11 @@
 # )
 #
 # from .module import (
-#     ensemble,
-#     feature,
-#     hpo,
+#     # ensemble,
+#     # feature,
+#     # hpo,
 #     model,
-#     nas,
+#     # nas,
 #     train,
 # )
 #
diff --git a/autogl/module/model/__init__.py b/autogl/module/model/__init__.py
index 9763f83..c995d9c 100644
--- a/autogl/module/model/__init__.py
+++ b/autogl/module/model/__init__.py
@@ -1,12 +1,12 @@
-# import importlib
-# import sys
-# from ...backend import DependentBackend
-#
-# # load corresponding backend of subclass
-# def _load_subclass_backend(backend):
-#     sub_module = importlib.import_module(f'.{backend.get_backend_name()}', __name__)
-#     this = sys.modules[__name__]
-#     for api, obj in sub_module.__dict__.items():
-#         setattr(this, api, obj)
-#
-# _load_subclass_backend(DependentBackend)
+import importlib
+import sys
+from ...backend import DependentBackend
+
+# load corresponding backend of subclass
+def _load_subclass_backend(backend):
+    sub_module = importlib.import_module(f'.{backend.get_backend_name()}', __name__)
+    this = sys.modules[__name__]
+    for api, obj in sub_module.__dict__.items():
+        setattr(this, api, obj)
+
+_load_subclass_backend(DependentBackend)
diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index 0a816a2..78f05d2 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -8,6 +8,7 @@ from .graph_saint import GraphSAINTAggregationModel
 from .gcn import AutoGCN
 from .gat import AutoGAT
 from .gin import AutoGIN
+from .ginparser import Parser
 
 __all__ = [
     "ModelUniversalRegistry",
@@ -19,4 +20,5 @@ __all__ = [
     "AutoGCN",
     "AutoGAT",
     "AutoGIN",
+    "Parser",
 ]
diff --git a/autogl/module/model/dgl/ginparser.py b/autogl/module/model/dgl/ginparser.py
index 280aa12..e94ae03 100644
--- a/autogl/module/model/dgl/ginparser.py
+++ b/autogl/module/model/dgl/ginparser.py
@@ -68,8 +68,8 @@ class Parser():
             '--seed', type=int, default=0,
             help='random seed (default: 0)')
         self.parser.add_argument(
-            '--epochs', type=int, default=350,
-            help='number of epochs to train (default: 350)')
+            '--epochs', type=int, default=100,
+            help='number of epochs to train (default: 100)')
         self.parser.add_argument(
             '--lr', type=float, default=0.01,
             help='learning rate (default: 0.01)')
diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index 7214fcb..ffe795c 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -252,15 +252,20 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
                     loss.backward()
                     loss_all += data.num_graphs * loss.item()
                 elif self.pyg_dgl == 'dgl':
-                    graphs, labels = data
-                    graphs = graphs.to(self.device)
-                    labels = labels.to(self.device)
-                    feat = graphs.ndata.pop('attr')
-                    output = self.model.model(graphs, feat)
-                    loss = self.criterion(output, labels)
+                    data = [data[i].to(self.device) for i in range(len(data))]
+                    _, labels = data
+                    optimizer.zero_grad()
+                    output = self.model.model(data)
 
-                    loss.backward()
+                    if hasattr(F, self.loss):
+                        loss = getattr(F, self.loss)(output, labels)
+                    else:
+                        raise TypeError(
+                            "PyTorch does not support loss type {}".format(self.loss)
+                        )
 
+                    # print('loss', self.loss)
+                    loss.backward()
                     loss_all += len(labels) * loss.item()
 
                 optimizer.step()
@@ -268,17 +273,17 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
                     scheduler.step()
             # loss = loss_all / len(train_loader.dataset)
             # train_loss = self.evaluate(train_loader)
+
             if valid_loader is not None:
                 eval_func = (
                     self.feval if not isinstance(self.feval, list) else self.feval[0]
                 )
                 val_loss = self._evaluate(valid_loader, eval_func)
-
                 if eval_func.is_higher_better():
                     val_loss = -val_loss
                 self.early_stopping(val_loss, self.model.model)
 
-                # print('val_loss', val_loss)
+                print('val_loss', val_loss)
 
                 if self.early_stopping.early_stop:
                     LOGGER.debug("Early stopping at", epoch)
@@ -287,7 +292,7 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         if valid_loader is not None:
             self.early_stopping.load_checkpoint(self.model.model)
 
-    def predict_only(self, loader):
+    def predict_only(self, loader, return_label=False):
         """
         The function of predicting on the given dataset and mask.
 
@@ -303,20 +308,24 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         """
         self.model.model.eval()
         pred = []
+        label = []
         for data in loader:
             if self.pyg_dgl == 'pyg':
                 data = data.to(self.device)
                 pred.append(self.model.model(data))
             elif self.pyg_dgl == 'dgl':
-                graphs, labels = data
-                graphs = graphs.to(self.device)
-                labels = labels.to(self.device)
-                feat = graphs.ndata.pop('attr')
-                outputs = self.model.model(graphs, feat)
-                pred.append(outputs)
+                data = [data[i].to(self.device) for i in range(len(data))]
+                _, labels = data
+                output = self.model.model(data)
+                pred.append(output)
+                label.append(labels)
 
         ret = torch.cat(pred, 0)
-        return ret
+        label = torch.cat(label, 0)
+        if return_label:
+            return ret, label
+        else:
+            return ret
 
     def train(self, dataset, keep_valid_result=True):
         """
@@ -396,12 +405,23 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         )
         return self._predict_proba(loader, in_log_format)
 
-    def _predict_proba(self, loader, in_log_format=False):
-        ret = self.predict_only(loader)
-        if in_log_format is True:
-            return ret
+    def _predict_proba(self, loader, in_log_format=False, return_label=False):
+        if return_label:
+            ret, label = self.predict_only(loader, return_label=True)
         else:
-            return torch.exp(ret)
+            ret = self.predict_only(loader, return_label=False)
+
+        if self.pyg_dgl == 'dgl':
+            ret = F.log_softmax(ret, dim=1)
+        if in_log_format is False:
+            ret = torch.exp(ret)
+
+        if return_label:
+            return ret, label
+        else:
+            return ret
+
+
 
     def get_valid_predict(self):
         # """Get the valid result."""
@@ -480,8 +500,16 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
             feval = self.feval
         else:
             feval = get_feval(feval)
+
+        if self.pyg_dgl == 'dgl':
+            y_pred_prob, y_true = self._predict_proba(loader=loader, return_label=True)
+            y_pred = y_pred_prob.max(1)[1]
+            return torch.sum(y_pred == y_true).item() / y_true.shape[0]
+
+
         y_pred_prob = self._predict_proba(loader=loader)
         y_pred = y_pred_prob.max(1)[1]
+        # print(y_pred_prob, y_pred)
 
         y_true_tmp = []
         for data in loader:
@@ -492,6 +520,10 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
                 y_true_tmp.append(labels)
         y_true = torch.cat(y_true_tmp, 0)
 
+
+        print(y_pred, y_true)
+
+
         if not isinstance(feval, list):
             feval = [feval]
             return_signle = True
diff --git a/test/model_glf/gclf_dgl_gin.py b/test/model_glf/gclf_dgl_gin.py
index 82ab4f8..3a30332 100644
--- a/test/model_glf/gclf_dgl_gin.py
+++ b/test/model_glf/gclf_dgl_gin.py
@@ -4,7 +4,8 @@ import logging
 logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm
 
-sys.path.append("../../")
+sys.path.insert(0, "../../")
+# sys.path.append("../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
 #os.environ["AUTOGL_BACKEND"] = "pyg"
@@ -17,9 +18,9 @@ import torch.nn.functional as F
 import torch.optim as optim
 
 from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
-from autogl.module.model.ginparser import Parser
-from autogl.module.model.dataloader_gin import GINDataLoader
-from autogl.module.model import AutoGIN
+from autogl.module.model.dgl.ginparser import Parser
+from autogl.module.model.dgl.dataloader_gin import GINDataLoader
+from autogl.module.model.dgl.gin import AutoGIN
 
 from pdb import set_trace
 import numpy as np
@@ -108,6 +109,8 @@ def main(args):
 
     dataset = GINDataset(args.dataset, not args.learn_eps)
 
+    best_val_acc = -1.0
+
     trainloader, validloader = GINDataLoader(
         dataset, batch_size=args.batch_size, device=args.device,
         seed=args.seed, shuffle=True,
@@ -129,6 +132,10 @@ def main(args):
     vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
     lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
 
+    # tbar = range(args.epochs)
+    # vbar = range(args.epochs)
+    # lrbar = range(args.epochs)
+
     for epoch, _, _ in zip(tbar, vbar, lrbar):
 
         train(args, model, trainloader, optimizer, criterion, epoch)
@@ -146,6 +153,9 @@ def main(args):
             'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
             .format(valid_loss, 100. * valid_acc))
 
+        if valid_acc > best_val_acc:
+            best_val_acc = valid_acc
+
         if not args.filename == "":
             with open(args.filename, 'a') as f:
                 f.write('%s %s %s %s' % (
@@ -171,10 +181,11 @@ def main(args):
     vbar.close()
     lrbar.close()
 
+    print('\n\n\nBest val acc', best_val_acc)
+
 
 if __name__ == '__main__':
     args = Parser(description='GIN').args
     print('show all arguments configuration...')
     print(args)
     main(args)
-
diff --git a/test/model_glf/gclf_dgl_gin_trainer.py b/test/model_glf/gclf_dgl_gin_trainer.py
new file mode 100644
index 0000000..f00617c
--- /dev/null
+++ b/test/model_glf/gclf_dgl_gin_trainer.py
@@ -0,0 +1,217 @@
+import os
+import sys
+import logging
+logging.basicConfig(level=logging.INFO)
+from tqdm import tqdm
+
+sys.path.insert(0, "../../")
+# sys.path.append("../../")
+print(os.getcwd())
+os.environ["AUTOGL_BACKEND"] = "dgl"
+#os.environ["AUTOGL_BACKEND"] = "pyg"
+# from autogl.backend import DependentBackend
+import dgl
+from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+
+from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
+from autogl.module.model.dgl.ginparser import Parser
+from autogl.module.model.dgl.dataloader_gin import GINDataLoader
+from autogl.module.model.dgl.gin import AutoGIN
+
+from autogl.module.train.graph_classification_full import GraphClassificationFullTrainer
+
+
+from pdb import set_trace
+import numpy as np
+# from autogl.solver.utils import set_seed
+# set_seed(202106)
+
+
+def train(args, net, trainloader, optimizer, criterion, epoch):
+    net.train()
+
+    running_loss = 0
+    total_iters = len(trainloader)
+    # setup the offset to avoid the overlap with mouse cursor
+    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
+
+    for pos, data in zip(bar, trainloader):
+        data = [data[i].to(args.device) for i in range(len(data))]
+        _, labels = data
+        # batch graphs will be shipped to device in forward part of model
+        #labels = labels.to(args.device)
+        #graphs = graphs.to(args.device)
+        #feat = graphs.ndata.pop('attr')
+        #outputs = net(graphs, feat)
+        outputs = net(data)
+
+        loss = criterion(outputs, labels)
+        running_loss += loss.item()
+
+        # backprop
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        # report
+        bar.set_description('epoch-{}'.format(epoch))
+    bar.close()
+    # the final batch will be aligned
+    running_loss = running_loss / total_iters
+
+    return running_loss
+
+
+def eval_net(args, net, dataloader, criterion):
+    net.eval()
+
+    total = 0
+    total_loss = 0
+    total_correct = 0
+
+    for data in dataloader:
+        data = [data[i].to(args.device) for i in range(len(data))]
+        _, labels = data
+        #graphs = graphs.to(args.device)
+        #labels = labels.to(args.device)
+        #feat = graphs.ndata.pop('attr')
+        total += len(labels)
+        #outputs = net(graphs, feat)
+        outputs = net(data)
+        _, predicted = torch.max(outputs.data, 1)
+
+        total_correct += (predicted == labels.data).sum().item()
+        loss = criterion(outputs, labels)
+        # crossentropy(reduce=True) for default
+        total_loss += loss.item() * len(labels)
+
+    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
+
+    net.train()
+
+    return loss, acc
+
+
+def main(args):
+
+    # set up seeds, args.seed supported
+    torch.manual_seed(seed=args.seed)
+    np.random.seed(seed=args.seed)
+
+    is_cuda = not args.disable_cuda and torch.cuda.is_available()
+
+    if is_cuda:
+        args.device = torch.device("cuda:" + str(args.device))
+        torch.cuda.manual_seed_all(seed=args.seed)
+    else:
+        args.device = torch.device("cpu")
+
+    dataset = GINDataset(args.dataset, not args.learn_eps)
+
+    best_val_acc = -1.0
+
+    trainloader, validloader = GINDataLoader(
+        dataset, batch_size=args.batch_size, device=args.device,
+        seed=args.seed, shuffle=True,
+        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
+    # or split_name='rand', split_ratio=0.7
+    automodel =  AutoGIN(
+                num_classes=dataset.gclasses,
+                num_features=dataset.dim_nfeats,
+                device=args.device,
+                init=True)
+    model = automodel.model
+    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
+
+    trainer = GraphClassificationFullTrainer(
+        model=automodel,
+        num_features=dataset.dim_nfeats,
+        num_classes=dataset.gclasses,
+        optimizer="adam",
+        lr=args.lr,
+        max_epoch=100,
+        # max_epoch=1,
+        batch_size=args.batch_size,
+        loss="cross_entropy",
+        feval="acc",
+        early_stopping_round=100,
+        weight_decay=0.0,
+    )
+
+    trainer.train_only(trainloader, validloader)
+    pred = trainer.predict(validloader)
+    print(pred)
+    print(trainer.evaluate(validloader, feval='acc'))
+
+    return
+
+
+    # it's not cost-effective to hanle the cursor and init 0
+    # https://stackoverflow.com/a/23121189
+    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
+    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
+    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
+
+    # tbar = range(args.epochs)
+    # vbar = range(args.epochs)
+    # lrbar = range(args.epochs)
+
+    for epoch, _, _ in zip(tbar, vbar, lrbar):
+
+        train(args, model, trainloader, optimizer, criterion, epoch)
+        scheduler.step()
+
+        train_loss, train_acc = eval_net(
+            args, model, trainloader, criterion)
+        tbar.set_description(
+            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(train_loss, 100. * train_acc))
+
+        valid_loss, valid_acc = eval_net(
+            args, model, validloader, criterion)
+        vbar.set_description(
+            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(valid_loss, 100. * valid_acc))
+
+        if valid_acc > best_val_acc:
+            best_val_acc = valid_acc
+
+        if not args.filename == "":
+            with open(args.filename, 'a') as f:
+                f.write('%s %s %s %s' % (
+                    args.dataset,
+                    args.learn_eps,
+                    args.neighbor_pooling_type,
+                    args.graph_pooling_type
+                ))
+                f.write("\n")
+                f.write("%f %f %f %f" % (
+                    train_loss,
+                    train_acc,
+                    valid_loss,
+                    valid_acc
+                ))
+                f.write("\n")
+
+        lrbar.set_description(
+            "Learning eps with learn_eps={}: {}".format(
+                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
+
+    tbar.close()
+    vbar.close()
+    lrbar.close()
+
+    print('\n\n\nBest val acc', best_val_acc)
+
+
+if __name__ == '__main__':
+    args = Parser(description='GIN').args
+    print('show all arguments configuration...')
+    print(args)
+    main(args)
\ No newline at end of file
diff --git a/test/model_glf/gclf_dgl_trainer.py b/test/model_glf/gclf_dgl_trainer.py
new file mode 100644
index 0000000..e69de29

From 1b1ce725ad9c327fa650701d67c0af4cd84b2f03 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 13 Oct 2021 10:36:29 +0800
Subject: [PATCH 29/75] Update base.py

---
 autogl/module/train/base.py | 4 +---
 1 file changed, 1 insertion(+), 3 deletions(-)

diff --git a/autogl/module/train/base.py b/autogl/module/train/base.py
index 1e6b1fb..1797bb5 100644
--- a/autogl/module/train/base.py
+++ b/autogl/module/train/base.py
@@ -3,9 +3,7 @@ import typing as _typing
 
 import torch
 import pickle
-# from ..model import BaseModel, ModelUniversalRegistry
-from ..model.dgl.base import BaseModel
-from ..model.dgl._model_registry import ModelUniversalRegistry
+from ..model import BaseModel, ModelUniversalRegistry
 from .evaluation import Evaluation, get_feval, Acc
 from ...utils import get_logger
 

From ad22adfe81d3d91fe1c22834a1225271c673e369 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 13 Oct 2021 10:37:28 +0800
Subject: [PATCH 30/75] Update graph_classification_full.py

---
 autogl/module/train/graph_classification_full.py | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index ffe795c..3d1cc16 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -8,8 +8,7 @@ from torch.optim.lr_scheduler import (
     ReduceLROnPlateau,
 )
 import torch.nn.functional as F
-# from ..model import BaseModel
-from ..model.dgl.base import BaseModel
+from ..model import BaseModel
 from .evaluation import get_feval, Logloss
 from typing import Union
 from ...datasets import utils

From a307b1035a3c6e0d3a26980f2852450c67f495f5 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 13 Oct 2021 10:38:19 +0800
Subject: [PATCH 31/75] Update __init__.py

---
 autogl/__init__.py | 38 +++++++++++++++++++-------------------
 1 file changed, 19 insertions(+), 19 deletions(-)

diff --git a/autogl/__init__.py b/autogl/__init__.py
index f20b8e4..fe13c8e 100644
--- a/autogl/__init__.py
+++ b/autogl/__init__.py
@@ -1,19 +1,19 @@
-# from . import (
-#     backend,
-#     data,
-#     datasets,
-#     module,
-#     solver,
-#     utils,
-# )
-#
-# from .module import (
-#     # ensemble,
-#     # feature,
-#     # hpo,
-#     model,
-#     # nas,
-#     train,
-# )
-#
-# __version__ = "0.2.0-pre"
+from . import (
+    backend,
+    data,
+    datasets,
+    module,
+    solver,
+    utils,
+)
+
+from .module import (
+    # ensemble,
+    # feature,
+    # hpo,
+    model,
+    # nas,
+    train,
+)
+
+__version__ = "0.2.0-pre"

From 7f87ba05597e46eb4dcf70e32fc312d7cc6c0a48 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 13 Oct 2021 10:38:36 +0800
Subject: [PATCH 32/75] Update __init__.py

---
 autogl/module/__init__.py | 14 +++++++-------
 1 file changed, 7 insertions(+), 7 deletions(-)

diff --git a/autogl/module/__init__.py b/autogl/module/__init__.py
index cbf0695..1f5b786 100644
--- a/autogl/module/__init__.py
+++ b/autogl/module/__init__.py
@@ -1,7 +1,7 @@
-# from . import feature, model, train
-#
-# from .ensemble import *
-# from .feature import *
-# from .hpo import *
-# from .model import *
-# from .train import *
+from . import feature, model, train
+
+from .ensemble import *
+from .feature import *
+from .hpo import *
+from .model import *
+from .train import *

From e3f3cf7b0ff5d95332615f81a8805c215bc89b32 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 13 Oct 2021 10:39:42 +0800
Subject: [PATCH 33/75] Update __init__.py

---
 autogl/module/train/__init__.py | 66 ++++++++++++++++-----------------
 1 file changed, 33 insertions(+), 33 deletions(-)

diff --git a/autogl/module/train/__init__.py b/autogl/module/train/__init__.py
index 400d9bc..cacdc8d 100644
--- a/autogl/module/train/__init__.py
+++ b/autogl/module/train/__init__.py
@@ -1,13 +1,13 @@
 TRAINER_DICT = {}
 from .base import (
     BaseTrainer,
-#     Evaluation,
-#     BaseNodeClassificationTrainer,
-#     BaseGraphClassificationTrainer,
-#     BaseLinkPredictionTrainer,
+    Evaluation,
+    BaseNodeClassificationTrainer,
+    BaseGraphClassificationTrainer,
+    BaseLinkPredictionTrainer,
 )
-#
-#
+
+
 def register_trainer(name):
     def register_trainer_cls(cls):
         if name in TRAINER_DICT:
@@ -20,30 +20,30 @@ def register_trainer(name):
         return cls
 
     return register_trainer_cls
-#
-#
-# from .graph_classification_full import GraphClassificationFullTrainer
-# from .node_classification_full import NodeClassificationFullTrainer
-# from .link_prediction import LinkPredictionTrainer
-# from .node_classification_trainer import *
-# from .evaluation import get_feval, Acc, Auc, Logloss, Mrr, MicroF1
-#
-# __all__ = [
-#     "BaseTrainer",
-#     "Evaluation",
-#     "BaseGraphClassificationTrainer",
-#     "BaseNodeClassificationTrainer",
-#     "BaseLinkPredictionTrainer",
-#     "GraphClassificationFullTrainer",
-#     "NodeClassificationFullTrainer",
-#     "NodeClassificationGraphSAINTTrainer",
-#     "NodeClassificationLayerDependentImportanceSamplingTrainer",
-#     "NodeClassificationNeighborSamplingTrainer",
-#     "LinkPredictionTrainer",
-#     "Acc",
-#     "Auc",
-#     "Logloss",
-#     "Mrr",
-#     "MicroF1",
-#     "get_feval",
-# ]
+
+
+from .graph_classification_full import GraphClassificationFullTrainer
+from .node_classification_full import NodeClassificationFullTrainer
+from .link_prediction import LinkPredictionTrainer
+from .node_classification_trainer import *
+from .evaluation import get_feval, Acc, Auc, Logloss, Mrr, MicroF1
+
+__all__ = [
+    "BaseTrainer",
+    "Evaluation",
+    "BaseGraphClassificationTrainer",
+    "BaseNodeClassificationTrainer",
+    "BaseLinkPredictionTrainer",
+    "GraphClassificationFullTrainer",
+    "NodeClassificationFullTrainer",
+    "NodeClassificationGraphSAINTTrainer",
+    "NodeClassificationLayerDependentImportanceSamplingTrainer",
+    "NodeClassificationNeighborSamplingTrainer",
+    "LinkPredictionTrainer",
+    "Acc",
+    "Auc",
+    "Logloss",
+    "Mrr",
+    "MicroF1",
+    "get_feval",
+]

From 7e8f274b1d728b10174bd528ccea6f5e8caf2614 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 13 Oct 2021 10:44:56 +0800
Subject: [PATCH 34/75] Update graph_classification_full.py

---
 autogl/module/train/graph_classification_full.py | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index 3d1cc16..bba8c9a 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -17,6 +17,8 @@ import torch.multiprocessing as mp
 
 from ...utils import get_logger
 
+from ...backend import DependentBackend
+
 LOGGER = get_logger("graph classification solver")
 
 
@@ -125,7 +127,7 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         self.initialized = False
         self.device = device
 
-        self.pyg_dgl = 'dgl'
+        self.pyg_dgl = DependentBackend.get_backend_name()
         self.criterion = criterion
 
         self.space = [

From 6d7c3d8ca25c698f4d8ea27236e9ef5e00c8d2ac Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 13 Oct 2021 10:52:22 +0800
Subject: [PATCH 35/75] Update graph_classification_full.py

---
 autogl/module/train/graph_classification_full.py | 5 -----
 1 file changed, 5 deletions(-)

diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index bba8c9a..6cdf7f5 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -510,7 +510,6 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
 
         y_pred_prob = self._predict_proba(loader=loader)
         y_pred = y_pred_prob.max(1)[1]
-        # print(y_pred_prob, y_pred)
 
         y_true_tmp = []
         for data in loader:
@@ -521,10 +520,6 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
                 y_true_tmp.append(labels)
         y_true = torch.cat(y_true_tmp, 0)
 
-
-        print(y_pred, y_true)
-
-
         if not isinstance(feval, list):
             feval = [feval]
             return_signle = True

From 153e4df651a31804f43809b336037a2978199b98 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Fri, 15 Oct 2021 12:27:00 +0800
Subject: [PATCH 36/75] fix bugs

---
 .../module/train/graph_classification_full.py | 53 ++++++++-----------
 .../module/train/node_classification_full.py  |  2 +-
 2 files changed, 23 insertions(+), 32 deletions(-)

diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index 6cdf7f5..cd44e58 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -373,15 +373,11 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         -------
         The prediction result of ``predict_proba``.
         """
-        if self.pyg_dgl == 'pyg':
-            loader = utils.graph_get_split(
-                dataset, mask, batch_size=self.batch_size, num_workers=self.num_workers
-            )
-            return self._predict_proba(loader, in_log_format=True).max(1)[1]
 
-        elif self.pyg_dgl == 'dgl':
-            loader = dataset
-            return self._predict_proba(loader, in_log_format=True).max(1)[1]
+        loader = utils.graph_get_split(
+            dataset, mask, batch_size=self.batch_size, num_workers=self.num_workers
+        )
+        return self._predict_proba(loader, in_log_format=True).max(1)[1]
 
     def predict_proba(self, dataset, mask="test", in_log_format=False):
         """
@@ -487,14 +483,12 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         res: The evaluation result on the given dataset.
 
         """
-        if self.pyg_dgl == 'pyg':
-            loader = utils.graph_get_split(
-                dataset, mask, batch_size=self.batch_size, num_workers=self.num_workers
-            )
-            return self._evaluate(loader, feval)
-        elif self.pyg_dgl == 'dgl':
-            loader = dataset
-            return self._evaluate(loader, feval)
+
+        loader = utils.graph_get_split(
+            dataset, mask, batch_size=self.batch_size, num_workers=self.num_workers
+        )
+        return self._evaluate(loader, feval)
+
 
     def _evaluate(self, loader, feval=None):
         if feval is None:
@@ -502,23 +496,20 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
         else:
             feval = get_feval(feval)
 
-        if self.pyg_dgl == 'dgl':
-            y_pred_prob, y_true = self._predict_proba(loader=loader, return_label=True)
-            y_pred = y_pred_prob.max(1)[1]
-            return torch.sum(y_pred == y_true).item() / y_true.shape[0]
-
-
-        y_pred_prob = self._predict_proba(loader=loader)
+        y_pred_prob, y_true = self._predict_proba(loader=loader, return_label=True)
         y_pred = y_pred_prob.max(1)[1]
 
-        y_true_tmp = []
-        for data in loader:
-            if self.pyg_dgl == 'pyg':
-                y_true_tmp.append(data.y)
-            elif self.pyg_dgl == 'dgl':
-                graphs, labels = data
-                y_true_tmp.append(labels)
-        y_true = torch.cat(y_true_tmp, 0)
+        # y_pred_prob = self._predict_proba(loader=loader)
+        # y_pred = y_pred_prob.max(1)[1]
+        #
+        # y_true_tmp = []
+        # for data in loader:
+        #     if self.pyg_dgl == 'pyg':
+        #         y_true_tmp.append(data.y)
+        #     elif self.pyg_dgl == 'dgl':
+        #         graphs, labels = data
+        #         y_true_tmp.append(labels)
+        # y_true = torch.cat(y_true_tmp, 0)
 
         if not isinstance(feval, list):
             feval = [feval]
diff --git a/autogl/module/train/node_classification_full.py b/autogl/module/train/node_classification_full.py
index 103b6d1..0a56131 100644
--- a/autogl/module/train/node_classification_full.py
+++ b/autogl/module/train/node_classification_full.py
@@ -229,7 +229,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
             if hasattr(data, "val_mask") and data.val_mask is not None:
                 if type(self.feval) is list:
                     feval = self.feval[0]
-                else:branch
+                else:
                     feval = self.feval
                 val_loss = self.evaluate([data], mask=data.val_mask, feval=feval)
                 if feval.is_higher_better() is True:

From c47ce10d6644f2e23a98786107de1b48d605a879 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Mon, 18 Oct 2021 11:52:55 +0800
Subject: [PATCH 37/75] fix bugs

---
 .../module/train/graph_classification_full.py |  4 +-
 test/model_glf/gclf_dgl_gin_trainer.py        | 37 ++++++++++++++++---
 2 files changed, 34 insertions(+), 7 deletions(-)

diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index cd44e58..6ebcb8b 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -280,12 +280,12 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
                     self.feval if not isinstance(self.feval, list) else self.feval[0]
                 )
                 val_loss = self._evaluate(valid_loader, eval_func)
+                # print(val_loss)
+
                 if eval_func.is_higher_better():
                     val_loss = -val_loss
                 self.early_stopping(val_loss, self.model.model)
 
-                print('val_loss', val_loss)
-
                 if self.early_stopping.early_stop:
                     LOGGER.debug("Early stopping at", epoch)
                     break
diff --git a/test/model_glf/gclf_dgl_gin_trainer.py b/test/model_glf/gclf_dgl_gin_trainer.py
index f00617c..781e8ce 100644
--- a/test/model_glf/gclf_dgl_gin_trainer.py
+++ b/test/model_glf/gclf_dgl_gin_trainer.py
@@ -30,6 +30,28 @@ import numpy as np
 # from autogl.solver.utils import set_seed
 # set_seed(202106)
 
+from autogl.datasets import utils
+
+
+trainloader, validloader = None, None
+
+def test_graph_get_split(dataset, mask, is_loader=True, batch_size=128, num_workers=0):
+    global trainloader, validloader
+    if trainloader is None and validloader is None:
+        trainloader, validloader = GINDataLoader(
+            dataset, batch_size=args.batch_size, device=args.device,
+            seed=args.seed, shuffle=True,
+            split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
+
+    if mask == 'train':
+        return trainloader
+    elif mask == 'val':
+        return validloader
+    else:
+        assert False
+
+
+utils.graph_get_split = test_graph_get_split
 
 def train(args, net, trainloader, optimizer, criterion, epoch):
     net.train()
@@ -135,7 +157,7 @@ def main(args):
         num_classes=dataset.gclasses,
         optimizer="adam",
         lr=args.lr,
-        max_epoch=100,
+        max_epoch=50,
         # max_epoch=1,
         batch_size=args.batch_size,
         loss="cross_entropy",
@@ -144,10 +166,15 @@ def main(args):
         weight_decay=0.0,
     )
 
-    trainer.train_only(trainloader, validloader)
-    pred = trainer.predict(validloader)
-    print(pred)
-    print(trainer.evaluate(validloader, feval='acc'))
+    # trainer.train_only(trainloader, validloader)
+    # pred, label = trainer._predict_proba(validloader, in_log_format=True, return_label=True)
+    # pred = pred.max(1)[1]
+    # print(sum(pred == label) / label.size()[0])
+
+    trainer.train(dataset)
+    print(trainer.evaluate(dataset, 'val'))
+    print(trainer.predict(dataset, 'val'))
+
 
     return
 

From 63d510ebc25e92eb1d7a56986e4f09f09853f29c Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 18 Oct 2021 08:55:22 +0000
Subject: [PATCH 38/75] fix problems on trainerdgl

---
 .gitignore                                    |   1 -
 autogl/__init__.py                            |   8 +-
 autogl/module/__init__.py                     |   2 +-
 autogl/module/model/dgl/dataloader_gin.py     |  85 ---------------
 test/model_glf/gclf_dgl.py                    |  14 +--
 test/model_glf/gclf_dgl_gin.py                |  26 +----
 test/model_glf/gclf_dgl_gin_trainer.py        | 100 +-----------------
 test/model_glf/gclf_dgl_topk.py               |  10 +-
 test/model_glf/gclf_dgl_trainer.py            |   0
 .../model_glf/gin_helper.py                   |  81 +++++++++++++-
 10 files changed, 91 insertions(+), 236 deletions(-)
 delete mode 100644 autogl/module/model/dgl/dataloader_gin.py
 delete mode 100644 test/model_glf/gclf_dgl_trainer.py
 rename autogl/module/model/dgl/ginparser.py => test/model_glf/gin_helper.py (51%)

diff --git a/.gitignore b/.gitignore
index befb347..db96567 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,5 +1,4 @@
 .DS_Store
-/**/*.swp
 # Byte-compiled / optimized / DLL files
 __pycache__/
 *.py[cod]
diff --git a/autogl/__init__.py b/autogl/__init__.py
index fe13c8e..7f1b47a 100644
--- a/autogl/__init__.py
+++ b/autogl/__init__.py
@@ -8,11 +8,11 @@ from . import (
 )
 
 from .module import (
-    # ensemble,
-    # feature,
-    # hpo,
+    ensemble,
+    feature,
+    hpo,
     model,
-    # nas,
+    nas,
     train,
 )
 
diff --git a/autogl/module/__init__.py b/autogl/module/__init__.py
index 1f5b786..02238e7 100644
--- a/autogl/module/__init__.py
+++ b/autogl/module/__init__.py
@@ -1,4 +1,4 @@
-from . import feature, model, train
+from . import feature, model, train, hpo, nas, ensemble
 
 from .ensemble import *
 from .feature import *
diff --git a/autogl/module/model/dgl/dataloader_gin.py b/autogl/module/model/dgl/dataloader_gin.py
deleted file mode 100644
index 0721b3a..0000000
--- a/autogl/module/model/dgl/dataloader_gin.py
+++ /dev/null
@@ -1,85 +0,0 @@
-"""
-PyTorch compatible dataloader
-"""
-
-
-import math
-import numpy as np
-import torch
-from torch.utils.data.sampler import SubsetRandomSampler
-from sklearn.model_selection import StratifiedKFold
-import dgl
-from dgl.dataloading import GraphDataLoader
-
-
-class GINDataLoader():
-    def __init__(self,
-                 dataset,
-                 batch_size,
-                 device,
-                 collate_fn=None,
-                 seed=0,
-                 shuffle=True,
-                 split_name='fold10',
-                 fold_idx=0,
-                 split_ratio=0.7):
-
-        self.shuffle = shuffle
-        self.seed = seed
-        self.kwargs = {'pin_memory': True} if 'cuda' in device.type else {}
-
-        labels = [l for _, l in dataset]
-
-        if split_name == 'fold10':
-            train_idx, valid_idx = self._split_fold10(
-                labels, fold_idx, seed, shuffle)
-        elif split_name == 'rand':
-            train_idx, valid_idx = self._split_rand(
-                labels, split_ratio, seed, shuffle)
-        else:
-            raise NotImplementedError()
-
-        train_sampler = SubsetRandomSampler(train_idx)
-        valid_sampler = SubsetRandomSampler(valid_idx)
-
-        self.train_loader = GraphDataLoader(
-            dataset, sampler=train_sampler,
-            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
-        self.valid_loader = GraphDataLoader(
-            dataset, sampler=valid_sampler,
-            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
-
-    def train_valid_loader(self):
-        return self.train_loader, self.valid_loader
-
-    def _split_fold10(self, labels, fold_idx=0, seed=0, shuffle=True):
-        ''' 10 flod '''
-        assert 0 <= fold_idx and fold_idx < 10, print(
-            "fold_idx must be from 0 to 9.")
-
-        skf = StratifiedKFold(n_splits=10, shuffle=shuffle, random_state=seed)
-        idx_list = []
-        for idx in skf.split(np.zeros(len(labels)), labels):    # split(x, y)
-            idx_list.append(idx)
-        train_idx, valid_idx = idx_list[fold_idx]
-
-        print(
-            "train_set : test_set = %d : %d",
-            len(train_idx), len(valid_idx))
-
-        return train_idx, valid_idx
-
-    def _split_rand(self, labels, split_ratio=0.7, seed=0, shuffle=True):
-        num_entries = len(labels)
-        indices = list(range(num_entries))
-        np.random.seed(seed)
-        np.random.shuffle(indices)
-        split = int(math.floor(split_ratio * num_entries))
-        train_idx, valid_idx = indices[:split], indices[split:]
-
-        print(
-            "train_set : test_set = %d : %d",
-            len(train_idx), len(valid_idx))
-
-        return train_idx, valid_idx
-
diff --git a/test/model_glf/gclf_dgl.py b/test/model_glf/gclf_dgl.py
index ce6a659..86ea871 100644
--- a/test/model_glf/gclf_dgl.py
+++ b/test/model_glf/gclf_dgl.py
@@ -6,29 +6,19 @@ from tqdm import tqdm
 import argparse
 
 sys.path.insert(0, "../../")
-sys.path.insert(0, "/DATA/DATANAS1/lhy/tmp/AutoGL")
-sys.path.insert(0, "/DATA/DATANAS1/lhy/tmp/AutoGL/autogl")
 
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
-#os.environ["AUTOGL_BACKEND"] = "pyg"
-# from autogl.backend import DependentBackend
-import dgl
-from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+from dgl.data import GINDataset
 import torch
 import torch.nn as nn
 import torch.optim as optim
 
-# from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
-# from autogl.module.model.ginparser import Parser
-from autogl.module.model.dgl.dataloader_gin import GINDataLoader
+from gin_helper import GINDataLoader
 from autogl.module.model.dgl.gin import AutoGIN
 from autogl.module.train.graph_classification_full import GraphClassificationFullTrainer
 
-# from pdb import set_tracefrom
 import numpy as np
-# from autogl.solver.utils import set_seed
-# set_seed(202106)
 
 
 def train(args, net, trainloader, optimizer, criterion, epoch):
diff --git a/test/model_glf/gclf_dgl_gin.py b/test/model_glf/gclf_dgl_gin.py
index 3a30332..7546e79 100644
--- a/test/model_glf/gclf_dgl_gin.py
+++ b/test/model_glf/gclf_dgl_gin.py
@@ -5,24 +5,16 @@ logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm
 
 sys.path.insert(0, "../../")
-# sys.path.append("../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
-#os.environ["AUTOGL_BACKEND"] = "pyg"
-from autogl.backend import DependentBackend
-import dgl
-from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+from dgl.data import GINDataset
 import torch
 import torch.nn as nn
-import torch.nn.functional as F
 import torch.optim as optim
 
-from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
-from autogl.module.model.dgl.ginparser import Parser
-from autogl.module.model.dgl.dataloader_gin import GINDataLoader
+from gin_helper import Parser, GINDataLoader
 from autogl.module.model.dgl.gin import AutoGIN
 
-from pdb import set_trace
 import numpy as np
 from autogl.solver.utils import set_seed
 set_seed(202106)
@@ -39,11 +31,6 @@ def train(args, net, trainloader, optimizer, criterion, epoch):
     for pos, data in zip(bar, trainloader):
         data = [data[i].to(args.device) for i in range(len(data))]
         _, labels = data
-        # batch graphs will be shipped to device in forward part of model
-        #labels = labels.to(args.device)
-        #graphs = graphs.to(args.device)
-        #feat = graphs.ndata.pop('attr')
-        #outputs = net(graphs, feat)
         outputs = net(data)
 
         loss = criterion(outputs, labels)
@@ -73,17 +60,12 @@ def eval_net(args, net, dataloader, criterion):
     for data in dataloader:
         data = [data[i].to(args.device) for i in range(len(data))]
         _, labels = data
-        #graphs = graphs.to(args.device)
-        #labels = labels.to(args.device)
-        #feat = graphs.ndata.pop('attr')
         total += len(labels)
-        #outputs = net(graphs, feat)
         outputs = net(data)
         _, predicted = torch.max(outputs.data, 1)
 
         total_correct += (predicted == labels.data).sum().item()
         loss = criterion(outputs, labels)
-        # crossentropy(reduce=True) for default
         total_loss += loss.item() * len(labels)
 
     loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
@@ -132,10 +114,6 @@ def main(args):
     vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
     lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
 
-    # tbar = range(args.epochs)
-    # vbar = range(args.epochs)
-    # lrbar = range(args.epochs)
-
     for epoch, _, _ in zip(tbar, vbar, lrbar):
 
         train(args, model, trainloader, optimizer, criterion, epoch)
diff --git a/test/model_glf/gclf_dgl_gin_trainer.py b/test/model_glf/gclf_dgl_gin_trainer.py
index 781e8ce..5a79b19 100644
--- a/test/model_glf/gclf_dgl_gin_trainer.py
+++ b/test/model_glf/gclf_dgl_gin_trainer.py
@@ -5,30 +5,17 @@ logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm
 
 sys.path.insert(0, "../../")
-# sys.path.append("../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
-#os.environ["AUTOGL_BACKEND"] = "pyg"
-# from autogl.backend import DependentBackend
-import dgl
-from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+from dgl.data import GINDataset
 import torch
-import torch.nn as nn
-import torch.nn.functional as F
-import torch.optim as optim
-
-from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
-from autogl.module.model.dgl.ginparser import Parser
-from autogl.module.model.dgl.dataloader_gin import GINDataLoader
+from gin_helper import Parser, GINDataLoader
 from autogl.module.model.dgl.gin import AutoGIN
 
 from autogl.module.train.graph_classification_full import GraphClassificationFullTrainer
 
 
-from pdb import set_trace
 import numpy as np
-# from autogl.solver.utils import set_seed
-# set_seed(202106)
 
 from autogl.datasets import utils
 
@@ -64,11 +51,6 @@ def train(args, net, trainloader, optimizer, criterion, epoch):
     for pos, data in zip(bar, trainloader):
         data = [data[i].to(args.device) for i in range(len(data))]
         _, labels = data
-        # batch graphs will be shipped to device in forward part of model
-        #labels = labels.to(args.device)
-        #graphs = graphs.to(args.device)
-        #feat = graphs.ndata.pop('attr')
-        #outputs = net(graphs, feat)
         outputs = net(data)
 
         loss = criterion(outputs, labels)
@@ -98,17 +80,12 @@ def eval_net(args, net, dataloader, criterion):
     for data in dataloader:
         data = [data[i].to(args.device) for i in range(len(data))]
         _, labels = data
-        #graphs = graphs.to(args.device)
-        #labels = labels.to(args.device)
-        #feat = graphs.ndata.pop('attr')
         total += len(labels)
-        #outputs = net(graphs, feat)
         outputs = net(data)
         _, predicted = torch.max(outputs.data, 1)
 
         total_correct += (predicted == labels.data).sum().item()
         loss = criterion(outputs, labels)
-        # crossentropy(reduce=True) for default
         total_loss += loss.item() * len(labels)
 
     loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
@@ -134,12 +111,6 @@ def main(args):
 
     dataset = GINDataset(args.dataset, not args.learn_eps)
 
-    best_val_acc = -1.0
-
-    trainloader, validloader = GINDataLoader(
-        dataset, batch_size=args.batch_size, device=args.device,
-        seed=args.seed, shuffle=True,
-        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
     # or split_name='rand', split_ratio=0.7
     automodel =  AutoGIN(
                 num_classes=dataset.gclasses,
@@ -147,9 +118,6 @@ def main(args):
                 device=args.device,
                 init=True)
     model = automodel.model
-    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-    optimizer = optim.Adam(model.parameters(), lr=args.lr)
-    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
 
     trainer = GraphClassificationFullTrainer(
         model=automodel,
@@ -166,11 +134,6 @@ def main(args):
         weight_decay=0.0,
     )
 
-    # trainer.train_only(trainloader, validloader)
-    # pred, label = trainer._predict_proba(validloader, in_log_format=True, return_label=True)
-    # pred = pred.max(1)[1]
-    # print(sum(pred == label) / label.size()[0])
-
     trainer.train(dataset)
     print(trainer.evaluate(dataset, 'val'))
     print(trainer.predict(dataset, 'val'))
@@ -178,65 +141,6 @@ def main(args):
 
     return
 
-
-    # it's not cost-effective to hanle the cursor and init 0
-    # https://stackoverflow.com/a/23121189
-    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
-    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
-    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
-
-    # tbar = range(args.epochs)
-    # vbar = range(args.epochs)
-    # lrbar = range(args.epochs)
-
-    for epoch, _, _ in zip(tbar, vbar, lrbar):
-
-        train(args, model, trainloader, optimizer, criterion, epoch)
-        scheduler.step()
-
-        train_loss, train_acc = eval_net(
-            args, model, trainloader, criterion)
-        tbar.set_description(
-            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(train_loss, 100. * train_acc))
-
-        valid_loss, valid_acc = eval_net(
-            args, model, validloader, criterion)
-        vbar.set_description(
-            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(valid_loss, 100. * valid_acc))
-
-        if valid_acc > best_val_acc:
-            best_val_acc = valid_acc
-
-        if not args.filename == "":
-            with open(args.filename, 'a') as f:
-                f.write('%s %s %s %s' % (
-                    args.dataset,
-                    args.learn_eps,
-                    args.neighbor_pooling_type,
-                    args.graph_pooling_type
-                ))
-                f.write("\n")
-                f.write("%f %f %f %f" % (
-                    train_loss,
-                    train_acc,
-                    valid_loss,
-                    valid_acc
-                ))
-                f.write("\n")
-
-        lrbar.set_description(
-            "Learning eps with learn_eps={}: {}".format(
-                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
-
-    tbar.close()
-    vbar.close()
-    lrbar.close()
-
-    print('\n\n\nBest val acc', best_val_acc)
-
-
 if __name__ == '__main__':
     args = Parser(description='GIN').args
     print('show all arguments configuration...')
diff --git a/test/model_glf/gclf_dgl_topk.py b/test/model_glf/gclf_dgl_topk.py
index 49a3fa5..31f9adb 100644
--- a/test/model_glf/gclf_dgl_topk.py
+++ b/test/model_glf/gclf_dgl_topk.py
@@ -7,21 +7,15 @@ from tqdm import tqdm
 sys.path.append("../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
-#os.environ["AUTOGL_BACKEND"] = "pyg"
-from autogl.backend import DependentBackend
-import dgl
-from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+from dgl.data import GINDataset
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 import torch.optim as optim
 
-from argparse import ArgumentParser, ArgumentDefaultsHelpFormatter
-from autogl.module.model.ginparser import Parser
-from autogl.module.model.dataloader_gin import GINDataLoader
+from gin_helper import Parser, GINDataLoader
 from autogl.module.model import AutoTopkpool
 
-from pdb import set_trace
 import numpy as np
 from autogl.solver.utils import set_seed
 set_seed(202106)
diff --git a/test/model_glf/gclf_dgl_trainer.py b/test/model_glf/gclf_dgl_trainer.py
deleted file mode 100644
index e69de29..0000000
diff --git a/autogl/module/model/dgl/ginparser.py b/test/model_glf/gin_helper.py
similarity index 51%
rename from autogl/module/model/dgl/ginparser.py
rename to test/model_glf/gin_helper.py
index e94ae03..0637884 100644
--- a/autogl/module/model/dgl/ginparser.py
+++ b/test/model_glf/gin_helper.py
@@ -1,9 +1,84 @@
-"""Parser for arguments
-
-Put all arguments in one file and group similar arguments
 """
+Gin helper for testing
+"""
+
+import math
+import numpy as np
+from torch.utils.data.sampler import SubsetRandomSampler
+from sklearn.model_selection import StratifiedKFold
+from dgl.dataloading import GraphDataLoader
 import argparse
 
+class GINDataLoader():
+    def __init__(self,
+                 dataset,
+                 batch_size,
+                 device,
+                 collate_fn=None,
+                 seed=0,
+                 shuffle=True,
+                 split_name='fold10',
+                 fold_idx=0,
+                 split_ratio=0.7):
+
+        self.shuffle = shuffle
+        self.seed = seed
+        self.kwargs = {'pin_memory': True} if 'cuda' in device.type else {}
+
+        labels = [l for _, l in dataset]
+
+        if split_name == 'fold10':
+            train_idx, valid_idx = self._split_fold10(
+                labels, fold_idx, seed, shuffle)
+        elif split_name == 'rand':
+            train_idx, valid_idx = self._split_rand(
+                labels, split_ratio, seed, shuffle)
+        else:
+            raise NotImplementedError()
+
+        train_sampler = SubsetRandomSampler(train_idx)
+        valid_sampler = SubsetRandomSampler(valid_idx)
+
+        self.train_loader = GraphDataLoader(
+            dataset, sampler=train_sampler,
+            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
+        self.valid_loader = GraphDataLoader(
+            dataset, sampler=valid_sampler,
+            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
+
+    def train_valid_loader(self):
+        return self.train_loader, self.valid_loader
+
+    def _split_fold10(self, labels, fold_idx=0, seed=0, shuffle=True):
+        ''' 10 flod '''
+        assert 0 <= fold_idx and fold_idx < 10, print(
+            "fold_idx must be from 0 to 9.")
+
+        skf = StratifiedKFold(n_splits=10, shuffle=shuffle, random_state=seed)
+        idx_list = []
+        for idx in skf.split(np.zeros(len(labels)), labels):    # split(x, y)
+            idx_list.append(idx)
+        train_idx, valid_idx = idx_list[fold_idx]
+
+        print(
+            "train_set : test_set = %d : %d",
+            len(train_idx), len(valid_idx))
+
+        return train_idx, valid_idx
+
+    def _split_rand(self, labels, split_ratio=0.7, seed=0, shuffle=True):
+        num_entries = len(labels)
+        indices = list(range(num_entries))
+        np.random.seed(seed)
+        np.random.shuffle(indices)
+        split = int(math.floor(split_ratio * num_entries))
+        train_idx, valid_idx = indices[:split], indices[split:]
+
+        print(
+            "train_set : test_set = %d : %d",
+            len(train_idx), len(valid_idx))
+
+        return train_idx, valid_idx
 
 class Parser():
 

From f2c51abfbadcc2c9bbd3d1272409cd51c9d88026 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 18 Oct 2021 09:25:43 +0000
Subject: [PATCH 39/75] remove gin import

---
 .gitignore                          | 1 +
 autogl/module/model/dgl/__init__.py | 4 +---
 2 files changed, 2 insertions(+), 3 deletions(-)

diff --git a/.gitignore b/.gitignore
index db96567..fb86bb4 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,4 +1,5 @@
 .DS_Store
+
 # Byte-compiled / optimized / DLL files
 __pycache__/
 *.py[cod]
diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index 78f05d2..8f14089 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -8,7 +8,6 @@ from .graph_saint import GraphSAINTAggregationModel
 from .gcn import AutoGCN
 from .gat import AutoGAT
 from .gin import AutoGIN
-from .ginparser import Parser
 
 __all__ = [
     "ModelUniversalRegistry",
@@ -19,6 +18,5 @@ __all__ = [
     "GraphSAINTAggregationModel",
     "AutoGCN",
     "AutoGAT",
-    "AutoGIN",
-    "Parser",
+    "AutoGIN"
 ]

From 602bb3c653a59ff106c6b690125155dfa5e91844 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 19 Oct 2021 02:05:47 +0000
Subject: [PATCH 40/75] remove the unecessary self.init

---
 autogl/module/model/dgl/gat.py       | 1 -
 autogl/module/model/dgl/gin.py       | 1 -
 autogl/module/model/dgl/graphsage.py | 1 -
 autogl/module/model/dgl/topkpool.py  | 1 -
 autogl/module/model/pyg/gat.py       | 1 -
 autogl/module/model/pyg/gin.py       | 1 -
 autogl/module/model/pyg/graphsage.py | 1 -
 autogl/module/model/pyg/topkpool.py  | 1 -
 8 files changed, 8 deletions(-)

diff --git a/autogl/module/model/dgl/gat.py b/autogl/module/model/dgl/gat.py
index d153685..66b26f7 100644
--- a/autogl/module/model/dgl/gat.py
+++ b/autogl/module/model/dgl/gat.py
@@ -161,7 +161,6 @@ class AutoGAT(BaseModel):
         self.num_features = num_features if num_features is not None else 0
         self.num_classes = int(num_classes) if num_classes is not None else 0
         self.device = device if device is not None else "cpu"
-        self.init = True
 
         self.params = {
             "features_num": self.num_features,
diff --git a/autogl/module/model/dgl/gin.py b/autogl/module/model/dgl/gin.py
index 8e160e9..d5488d2 100644
--- a/autogl/module/model/dgl/gin.py
+++ b/autogl/module/model/dgl/gin.py
@@ -275,7 +275,6 @@ class AutoGIN(BaseModel):
             int(num_graph_features) if num_graph_features is not None else 0
         )
         self.device = device if device is not None else "cpu"
-        self.init = True
 
         self.params = {
             "features_num": self.num_features,
diff --git a/autogl/module/model/dgl/graphsage.py b/autogl/module/model/dgl/graphsage.py
index 6cf5a17..10554be 100644
--- a/autogl/module/model/dgl/graphsage.py
+++ b/autogl/module/model/dgl/graphsage.py
@@ -238,7 +238,6 @@ class AutoSAGE(BaseModel):
         self.num_features = num_features if num_features is not None else 0
         self.num_classes = int(num_classes) if num_classes is not None else 0
         self.device = device if device is not None else "cpu"
-        self.init = True
 
         self.params = {
             "features_num": self.num_features,
diff --git a/autogl/module/model/dgl/topkpool.py b/autogl/module/model/dgl/topkpool.py
index 68f5e83..dbff6e9 100644
--- a/autogl/module/model/dgl/topkpool.py
+++ b/autogl/module/model/dgl/topkpool.py
@@ -251,7 +251,6 @@ class AutoTopkpool(BaseModel):
             int(num_graph_features) if num_graph_features is not None else 0
         )
         self.device = device if device is not None else "cpu"
-        self.init = True
 
         self.params = {
             "features_num": self.num_features,
diff --git a/autogl/module/model/pyg/gat.py b/autogl/module/model/pyg/gat.py
index d153685..66b26f7 100644
--- a/autogl/module/model/pyg/gat.py
+++ b/autogl/module/model/pyg/gat.py
@@ -161,7 +161,6 @@ class AutoGAT(BaseModel):
         self.num_features = num_features if num_features is not None else 0
         self.num_classes = int(num_classes) if num_classes is not None else 0
         self.device = device if device is not None else "cpu"
-        self.init = True
 
         self.params = {
             "features_num": self.num_features,
diff --git a/autogl/module/model/pyg/gin.py b/autogl/module/model/pyg/gin.py
index 52a495a..88f6052 100644
--- a/autogl/module/model/pyg/gin.py
+++ b/autogl/module/model/pyg/gin.py
@@ -163,7 +163,6 @@ class AutoGIN(BaseModel):
             int(num_graph_features) if num_graph_features is not None else 0
         )
         self.device = device if device is not None else "cpu"
-        self.init = True
 
         self.params = {
             "features_num": self.num_features,
diff --git a/autogl/module/model/pyg/graphsage.py b/autogl/module/model/pyg/graphsage.py
index 6cf5a17..10554be 100644
--- a/autogl/module/model/pyg/graphsage.py
+++ b/autogl/module/model/pyg/graphsage.py
@@ -238,7 +238,6 @@ class AutoSAGE(BaseModel):
         self.num_features = num_features if num_features is not None else 0
         self.num_classes = int(num_classes) if num_classes is not None else 0
         self.device = device if device is not None else "cpu"
-        self.init = True
 
         self.params = {
             "features_num": self.num_features,
diff --git a/autogl/module/model/pyg/topkpool.py b/autogl/module/model/pyg/topkpool.py
index c1872bd..264d5ed 100644
--- a/autogl/module/model/pyg/topkpool.py
+++ b/autogl/module/model/pyg/topkpool.py
@@ -126,7 +126,6 @@ class AutoTopkpool(BaseModel):
             int(num_graph_features) if num_graph_features is not None else 0
         )
         self.device = device if device is not None else "cpu"
-        self.init = True
 
         self.params = {
             "features_num": self.num_features,

From bebccfa19e40295230cdc7dc09de65e19a44d5aa Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 19 Oct 2021 02:11:21 +0000
Subject: [PATCH 41/75] fix bugs of pyg backend

---
 autogl/module/train/graph_classification_full.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/autogl/module/train/graph_classification_full.py b/autogl/module/train/graph_classification_full.py
index 6ebcb8b..fa045a0 100644
--- a/autogl/module/train/graph_classification_full.py
+++ b/autogl/module/train/graph_classification_full.py
@@ -314,6 +314,7 @@ class GraphClassificationFullTrainer(BaseGraphClassificationTrainer):
             if self.pyg_dgl == 'pyg':
                 data = data.to(self.device)
                 pred.append(self.model.model(data))
+                label.append(data.y)
             elif self.pyg_dgl == 'dgl':
                 data = [data[i].to(self.device) for i in range(len(data))]
                 _, labels = data

From 646cb6a13da2c36d0d3f17c442fc89e5e1dfbea8 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 19 Oct 2021 02:19:02 +0000
Subject: [PATCH 42/75] revise logics of graph solver

---
 autogl/solver/classifier/graph_classifier.py | 12 ++++++------
 autogl/solver/classifier/link_predictor.py   | 10 +++++-----
 autogl/solver/utils.py                       | 18 +++++++++---------
 3 files changed, 20 insertions(+), 20 deletions(-)

diff --git a/autogl/solver/classifier/graph_classifier.py b/autogl/solver/classifier/graph_classifier.py
index 8d17857..b88b738 100644
--- a/autogl/solver/classifier/graph_classifier.py
+++ b/autogl/solver/classifier/graph_classifier.py
@@ -21,7 +21,7 @@ from ..utils import get_logger
 from ...backend import DependentBackend
 
 LOGGER = get_logger("GraphClassifier")
-__backend = DependentBackend.get_backend_name()
+BACKEND = DependentBackend.get_backend_name()
 
 class AutoGraphClassifier(BaseClassifier):
     """
@@ -277,6 +277,8 @@ class AutoGraphClassifier(BaseClassifier):
 
         set_seed(seed)
 
+        num_classes = dataset.num_classes if BACKEND == 'pyg' else dataset.gclasses
+
         if time_limit < 0:
             time_limit = 3600 * 24
         time_begin = time.time()
@@ -286,8 +288,7 @@ class AutoGraphClassifier(BaseClassifier):
             if hasattr(dataset, "metric"):
                 evaluation_method = [dataset.metric]
             else:
-                num_of_label = dataset.num_classes
-                if num_of_label == 2:
+                if num_classes == 2:
                     evaluation_method = ["auc"]
                 else:
                     evaluation_method = ["acc"]
@@ -339,7 +340,6 @@ class AutoGraphClassifier(BaseClassifier):
             " node features."
         )
         num_features = feat.size(-1)
-        num_classes = dataset.num_classes if __backend == 'pyg' else dataset.num_labels
 
         # initialize graph networks
         self._init_graph_module(
@@ -350,9 +350,9 @@ class AutoGraphClassifier(BaseClassifier):
             feval=evaluator_list,
             device=self.runtime_device,
             loss="cross_entropy" if not hasattr(dataset, "loss") else dataset.loss,
-            num_graph_features=0
+            num_graph_features=(0
             if not hasattr(dataset.data, "gf")
-            else dataset.data.gf.size(1),
+            else dataset.data.gf.size(1)) if BACKEND == 'pyg' else 0,
         )
 
         # currently disabled
diff --git a/autogl/solver/classifier/link_predictor.py b/autogl/solver/classifier/link_predictor.py
index 4a4a2f1..4b18680 100644
--- a/autogl/solver/classifier/link_predictor.py
+++ b/autogl/solver/classifier/link_predictor.py
@@ -22,7 +22,7 @@ from ..utils import get_logger
 from ...backend import DependentBackend
 
 LOGGER = get_logger("LinkPredictor")
-__backend = DependentBackend.get_backend_name()
+BACKEND = DependentBackend.get_backend_name()
 
 class AutoLinkPredictor(BaseClassifier):
     """
@@ -283,7 +283,7 @@ class AutoLinkPredictor(BaseClassifier):
         if train_split is not None and val_split is not None:
             utils.split_edges(dataset, train_split, val_split)
         else:
-            if __backend == 'pyg':
+            if BACKEND == 'pyg':
                 assert all(
                     [
                         hasattr(graph_data, f"{name}")
@@ -300,7 +300,7 @@ class AutoLinkPredictor(BaseClassifier):
                     "The dataset has no default train/val split! Please manually pass "
                     "train and val ratio."
                 )
-            elif __backend == 'dgl':
+            elif BACKEND == 'dgl':
                 assert hasattr(graph_data, 'edata') and "train_mask" in graph_data.edata and "val_mask" in graph_data.edata, (
                     "The dataset has no default train/val split! Please manually pass "
                     "train and val ratio."
@@ -374,7 +374,7 @@ class AutoLinkPredictor(BaseClassifier):
 
         # fit the ensemble model
         if self.ensemble_module is not None:
-            if __backend == 'pyg':
+            if BACKEND == 'pyg':
                 pos_edge_index, neg_edge_index = (
                     self.dataset[0].val_pos_edge_index,
                     self.dataset[0].val_neg_edge_index,
@@ -382,7 +382,7 @@ class AutoLinkPredictor(BaseClassifier):
                 E = pos_edge_index.size(1) + neg_edge_index.size(1)
                 link_labels = torch.zeros(E, dtype=torch.float)
                 link_labels[: pos_edge_index.size(1)] = 1.0
-            elif __backend == 'dgl':
+            elif BACKEND == 'dgl':
                 val_mask = self.dataset[0].edata["val_mask"]
                 val_index = torch.nonzero(val_mask, as_tuple=False).squeeze()
                 link_labels = self.dataset[0].edata['etype'][val_index]
diff --git a/autogl/solver/utils.py b/autogl/solver/utils.py
index 51a1555..dd019a5 100644
--- a/autogl/solver/utils.py
+++ b/autogl/solver/utils.py
@@ -16,7 +16,7 @@ from ..utils import get_logger
 
 LOGGER = get_logger("LeaderBoard")
 
-__backend = DependentBackend.get_backend_name()
+BACKEND = DependentBackend.get_backend_name()
 
 class LeaderBoard:
     """
@@ -179,36 +179,36 @@ class LeaderBoard:
         )
 
 def get_graph_from_dataset(dataset, graph_id=0):
-    if __backend == 'pyg': return dataset[graph_id]
+    if BACKEND == 'pyg': return dataset[graph_id]
     return dataset.graph[graph_id]
 
 def get_graph_node_number(graph):
-    if __backend == 'pyg':
+    if BACKEND == 'pyg':
         size = graph.x.shape[0]
     else:
         size = graph.num_nodes()
     return size
 
 def get_graph_node_features(graph):
-    if __backend == 'pyg' and hasattr(graph, 'x'):
+    if BACKEND == 'pyg' and hasattr(graph, 'x'):
         return graph.x
-    elif __backend == 'dgl' and 'feat' in graph.ndata:
+    elif BACKEND == 'dgl' and 'feat' in graph.ndata:
         return graph.ndata['feat']
     return None
 
 def get_graph_masks(graph, mask='train'):
-    if __backend == 'pyg' and hasattr(graph, f'{mask}_mask'):
+    if BACKEND == 'pyg' and hasattr(graph, f'{mask}_mask'):
         return getattr(graph, f'{mask}_mask')
-    if __backend == 'dgl' and f'{mask}_mask' in graph.ndata:
+    if BACKEND == 'dgl' and f'{mask}_mask' in graph.ndata:
         return graph.ndata[f'{mask}_mask']
     return None
 
 def get_graph_labels(graph):
-    if __backend == 'pyg': return graph.y
+    if BACKEND == 'pyg': return graph.y
     return graph.ndata['label']
 
 def get_dataset_labels(dataset):
-    if __backend == 'pyg':
+    if BACKEND == 'pyg':
         return dataset.data.y
     else:
         return torch.LongTensor([d[1] for d in dataset])

From a8e1d60152a3836615c8573e83b540c2798ff629 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 19 Oct 2021 08:38:51 +0000
Subject: [PATCH 43/75] add dgl solver & origin test

---
 test/model_glf/gclf_dgl_origin.py | 304 ++++++++++++++++++++++++++++++
 test/model_glf/gclf_dgl_solver.py | 141 ++++++++++++++
 2 files changed, 445 insertions(+)
 create mode 100644 test/model_glf/gclf_dgl_origin.py
 create mode 100644 test/model_glf/gclf_dgl_solver.py

diff --git a/test/model_glf/gclf_dgl_origin.py b/test/model_glf/gclf_dgl_origin.py
new file mode 100644
index 0000000..fbe56ea
--- /dev/null
+++ b/test/model_glf/gclf_dgl_origin.py
@@ -0,0 +1,304 @@
+import sys
+from dgl.dataloading.pytorch.dataloader import GraphDataLoader
+import numpy as np
+from tqdm import tqdm
+
+import random
+
+import torch
+import torch.nn as nn
+import torch.optim as optim
+
+from dgl.data import GINDataset
+from gin_helper import Parser, GINDataLoader
+
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+from dgl.nn.pytorch.conv import GINConv
+from dgl.nn.pytorch.glob import SumPooling, AvgPooling, MaxPooling
+
+
+class DatasetAbstraction():
+    def __init__(self, graphs, labels):
+        for g in graphs:
+            g.ndata['feat'] = g.ndata['attr']
+        self.graphs, self.labels = [], []
+        for g, l in zip(graphs, labels):
+            self.graphs.append(g)
+            self.labels.append(l)
+        self.gclasses = max(self.labels).item() + 1
+        self.graph = self.graphs
+    
+    def __len__(self):
+        return len(self.graphs)
+    
+    def __getitem__(self, idx):
+        if isinstance(idx, int):
+            return self.graphs[idx], self.labels[idx]
+        elif isinstance(idx, torch.BoolTensor):
+            idx = [i for i in range(len(idx)) if idx[i]]
+        elif isinstance(idx, torch.Tensor) and idx.unique()[0].sum().item() == 1:
+            idx = [i for i in range(len(idx)) if idx[i]]
+        return DatasetAbstraction([self.graphs[i] for i in idx], [self.labels[i] for i in idx])
+
+class ApplyNodeFunc(nn.Module):
+    """Update the node feature hv with MLP, BN and ReLU."""
+    def __init__(self, mlp):
+        super(ApplyNodeFunc, self).__init__()
+        self.mlp = mlp
+        self.bn = nn.BatchNorm1d(self.mlp.output_dim)
+
+    def forward(self, h):
+        h = self.mlp(h)
+        h = self.bn(h)
+        h = F.relu(h)
+        return h
+
+
+class MLP(nn.Module):
+    """MLP with linear output"""
+    def __init__(self, num_layers, input_dim, hidden_dim, output_dim):
+        """MLP layers construction
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+        """
+        super(MLP, self).__init__()
+        self.linear_or_not = True  # default is linear model
+        self.num_layers = num_layers
+        self.output_dim = output_dim
+
+        if num_layers < 1:
+            raise ValueError("number of layers should be positive!")
+        elif num_layers == 1:
+            # Linear model
+            self.linear = nn.Linear(input_dim, output_dim)
+        else:
+            # Multi-layer model
+            self.linear_or_not = False
+            self.linears = torch.nn.ModuleList()
+            self.batch_norms = torch.nn.ModuleList()
+
+            self.linears.append(nn.Linear(input_dim, hidden_dim))
+            for layer in range(num_layers - 2):
+                self.linears.append(nn.Linear(hidden_dim, hidden_dim))
+            self.linears.append(nn.Linear(hidden_dim, output_dim))
+
+            for layer in range(num_layers - 1):
+                self.batch_norms.append(nn.BatchNorm1d((hidden_dim)))
+
+    def forward(self, x):
+        if self.linear_or_not:
+            # If linear model
+            return self.linear(x)
+        else:
+            # If MLP
+            h = x
+            for i in range(self.num_layers - 1):
+                h = F.relu(self.batch_norms[i](self.linears[i](h)))
+            return self.linears[-1](h)
+
+
+class GIN(nn.Module):
+    """GIN model"""
+    def __init__(self, num_layers, num_mlp_layers, input_dim, hidden_dim,
+                 output_dim, final_dropout, learn_eps, graph_pooling_type,
+                 neighbor_pooling_type):
+        """model parameters setting
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers in the neural network
+        num_mlp_layers: int
+            The number of linear layers in mlps
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+        final_dropout: float
+            dropout ratio on the final linear layer
+        learn_eps: boolean
+            If True, learn epsilon to distinguish center nodes from neighbors
+            If False, aggregate neighbors and center nodes altogether.
+        neighbor_pooling_type: str
+            how to aggregate neighbors (sum, mean, or max)
+        graph_pooling_type: str
+            how to aggregate entire nodes in a graph (sum, mean or max)
+        """
+        super(GIN, self).__init__()
+        self.num_layers = num_layers
+        self.learn_eps = learn_eps
+
+        # List of MLPs
+        self.ginlayers = torch.nn.ModuleList()
+        self.batch_norms = torch.nn.ModuleList()
+
+        for layer in range(self.num_layers - 1):
+            if layer == 0:
+                mlp = MLP(num_mlp_layers, input_dim, hidden_dim, hidden_dim)
+            else:
+                mlp = MLP(num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)
+
+            self.ginlayers.append(
+                GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, self.learn_eps))
+            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))
+
+        # Linear function for graph poolings of output of each layer
+        # which maps the output of different layers into a prediction score
+        self.linears_prediction = torch.nn.ModuleList()
+
+        for layer in range(num_layers):
+            if layer == 0:
+                self.linears_prediction.append(
+                    nn.Linear(input_dim, output_dim))
+            else:
+                self.linears_prediction.append(
+                    nn.Linear(hidden_dim, output_dim))
+
+        self.drop = nn.Dropout(final_dropout)
+
+        if graph_pooling_type == 'sum':
+            self.pool = SumPooling()
+        elif graph_pooling_type == 'mean':
+            self.pool = AvgPooling()
+        elif graph_pooling_type == 'max':
+            self.pool = MaxPooling()
+        else:
+            raise NotImplementedError
+
+    def forward(self, g, h):
+        # list of hidden representation at each layer (including input)
+        hidden_rep = [h]
+
+        for i in range(self.num_layers - 1):
+            h = self.ginlayers[i](g, h)
+            h = self.batch_norms[i](h)
+            h = F.relu(h)
+            hidden_rep.append(h)
+
+        score_over_layer = 0
+
+        # perform pooling over all nodes in each graph in every layer
+        for i, h in enumerate(hidden_rep):
+            pooled_h = self.pool(g, h)
+            score_over_layer += self.drop(self.linears_prediction[i](pooled_h))
+
+        return score_over_layer
+
+
+def train(net, trainloader, validloader, optimizer, criterion, epoch, device):
+    best_model = net.state_dict()
+    
+    best_acc = 0.
+    for e in range(epoch):
+        for graphs, labels in trainloader:
+            net.train()
+
+            labels = labels.to(device)
+            graphs = graphs.to(device)
+            feat = graphs.ndata.pop('attr')
+            outputs = net(graphs, feat)
+
+            loss = criterion(outputs, labels)
+
+            # backprop
+            optimizer.zero_grad()
+            loss.backward()
+            optimizer.step()
+        
+        gt = []
+        pr = []
+        for graphs, labels in validloader:
+            labels = labels.to(device)
+            graphs = graphs.to(device)
+            gt.append(labels)
+            feat = graphs.ndata.pop('attr')
+            outputs = net(graphs, feat)
+            pr.append(outputs.argmax(1))
+        gt = torch.cat(gt, dim=0)
+        pr = torch.cat(pr, dim=0)
+        acc = (gt == pr).float().mean().item()
+        if acc > best_acc:
+            best_acc = acc
+            best_model = net.state_dict()
+    
+    net.load_state_dict(best_model)
+
+    return net
+
+def eval_net(net, dataloader, device):
+    net.eval()
+
+    total = 0
+    total_correct = 0
+
+    for data in dataloader:
+        graphs, labels = data
+        graphs = graphs.to(device)
+        labels = labels.to(device)
+        feat = graphs.ndata.pop('attr')
+        total += len(labels)
+        outputs = net(graphs, feat)
+        _, predicted = torch.max(outputs.data, 1)
+
+        total_correct += (predicted == labels.data).sum().item()
+
+    acc = 1.0 * total_correct / total
+
+    net.train()
+
+    return acc
+
+
+def main():
+
+    device = torch.device('cuda:1')
+    dataset_ = GINDataset('MUTAG', True)
+    dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(2021)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_dataset = dataset[dataids[:fold * 8]]
+    val_dataset = dataset[dataids[fold * 8: fold * 9]]
+    test_dataset = dataset[dataids[fold * 9: ]]
+
+    trainloader = GraphDataLoader(train_dataset, batch_size=32, shuffle=True)
+    valloader = GraphDataLoader(val_dataset, batch_size=32, shuffle=False)
+    testloader = GraphDataLoader(test_dataset, batch_size=32, shuffle=False)
+
+    accs = []
+    from tqdm import tqdm
+    for seed in tqdm(range(50)):
+        # set up seeds, args.seed supported
+        torch.manual_seed(seed=seed)
+        np.random.seed(seed=seed)
+
+        model = GIN(
+            5, 2, dataset_.dim_nfeats, 64, dataset_.gclasses, 0.5, False,
+            "sum", "sum").to(device)
+
+        criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+        optimizer = optim.Adam(model.parameters(), lr=0.0001)
+
+        model = train(model, trainloader, valloader, optimizer, criterion, 100, device)
+        acc = eval_net(model, testloader, device)
+        accs.append(acc)
+
+    print(np.mean(accs), np.std(accs))
+
+if __name__ == '__main__':
+    main()
diff --git a/test/model_glf/gclf_dgl_solver.py b/test/model_glf/gclf_dgl_solver.py
new file mode 100644
index 0000000..9e29594
--- /dev/null
+++ b/test/model_glf/gclf_dgl_solver.py
@@ -0,0 +1,141 @@
+import sys
+
+sys.path.append('../../')
+
+import torch
+import random
+import numpy as np
+from dgl.data import GINDataset
+from dgl.dataloading import GraphDataLoader
+from gin_helper import Parser, GINDataLoader
+
+from autogl.solver import AutoGraphClassifier
+from autogl.datasets import utils, build_dataset_from_name
+from autogl.module.train import GraphClassificationFullTrainer
+from autogl.module.model.dgl.gin import AutoGIN
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+class DatasetAbstraction():
+    def __init__(self, graphs, labels):
+        for g in graphs:
+            g.ndata['feat'] = g.ndata['attr']
+        self.graphs, self.labels = [], []
+        for g, l in zip(graphs, labels):
+            self.graphs.append(g)
+            self.labels.append(l)
+        self.gclasses = max(self.labels).item() + 1
+        self.graph = self.graphs
+    
+    def __len__(self):
+        return len(self.graphs)
+    
+    def __getitem__(self, idx):
+        if isinstance(idx, int):
+            return self.graphs[idx], self.labels[idx]
+        elif isinstance(idx, torch.BoolTensor):
+            idx = [i for i in range(len(idx)) if idx[i]]
+        elif isinstance(idx, torch.Tensor) and idx.unique()[0].sum().item() == 1:
+            idx = [i for i in range(len(idx)) if idx[i]]
+        return DatasetAbstraction([self.graphs[i] for i in idx], [self.labels[i] for i in idx])
+
+    @classmethod
+    def build_from_train_val(cls, train, val, test=None):
+        dataset = cls(train.graphs + val.graphs, train.labels + val.labels)
+        dataset.train_index = list(range(len(train)))
+        dataset.val_index = list(range(len(train), len(train) + len(val)))
+        if test is not None:
+            dataset.test_index = list(range(len(train) + len(val), len(train) + len(val) + len(test)))
+        dataset.train_split = train
+        dataset.val_split = val
+        if test is not None:
+            dataset.test_split = test
+        return dataset
+
+def graph_get_split(
+    dataset, mask="train", is_loader=True, batch_size=128, num_workers=0
+):
+    assert hasattr(
+        dataset, "%s_split" % (mask)
+    ), "Given dataset do not have %s split" % (mask)
+    if is_loader:
+        return GraphDataLoader(
+            getattr(dataset, "%s_split" % (mask)),
+            batch_size=batch_size,
+            num_workers=num_workers,
+        )
+    else:
+        return getattr(dataset, "%s_split" % (mask))
+
+
+utils.graph_get_split = graph_get_split
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    # seed = 100
+    # dataset = build_dataset_from_name('mutag')
+    dataset = GINDataset('MUTAG', True)
+    dataset = DatasetAbstraction([g[0] for g in dataset], [g[1] for g in dataset])
+
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(2021)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_dataset = dataset[dataids[:fold * 8]]
+    val_dataset = dataset[dataids[fold * 8: fold * 9]]
+    test_dataset = dataset[dataids[fold * 9: ]]
+
+    dataset = DatasetAbstraction.build_from_train_val(train_dataset, val_dataset, test_dataset)
+
+    labels = np.array([x.item() for x in test_dataset.labels])
+    # trainer = GraphClassificationFullTrainer(AutoGIN(), 'cuda:1', init=False)
+
+    accs = []
+    from tqdm import tqdm
+    for seed in tqdm(range(50)):
+        set_seed(seed)
+        solver = AutoGraphClassifier(
+            feature_module=None,
+            graph_models=["gin"],
+            hpo_module='random',
+            ensemble_module=None,
+            device="cuda:1", max_evals=1,
+            trainer_hp_space = fixed(
+                **{
+                    "max_epoch": 100,
+                    "batch_size": 32,
+                    "early_stopping_round": 101,
+                    "lr": 0.0001,
+                    "weight_decay": 1e-4,
+                }
+            ),
+            model_hp_spaces=[
+                fixed(
+                    num_layers = 5,
+                    hidden = [64],
+                    dropout = 0.5,
+                    act = "relu",
+                    eps = "False",
+                    mlp_layers = 2,
+                    neighbor_pooling_type = "sum",
+                    graph_pooling_type = "sum"
+                ),
+            ]
+        )
+        solver.fit(dataset, evaluation_method=['acc'])
+        solver.get_leaderboard().show()
+        out = solver.predict(dataset, mask='test')
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))

From c94a112c4ab81c769ede6c7df31290cf5f8c0e79 Mon Sep 17 00:00:00 2001
From: CoreLeader <Core-Leader@outlook.com>
Date: Tue, 19 Oct 2021 21:20:00 +0800
Subject: [PATCH 44/75] Revision for Refactor of Dataset and Feature Engineer

Revise MUTAG dataset for DGL backend
Debug for OGB nodes datasets
---
 autogl/datasets/_dgl.py | 4 ++--
 autogl/datasets/_ogb.py | 2 +-
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/autogl/datasets/_dgl.py b/autogl/datasets/_dgl.py
index d7c9fb6..3eb7ebe 100644
--- a/autogl/datasets/_dgl.py
+++ b/autogl/datasets/_dgl.py
@@ -207,8 +207,8 @@ class CoauthorCSDataset(InMemoryStaticGraphSet):
 @DatasetUniversalRegistry.register_dataset("mutag")
 class MUTAGDataset(InMemoryStaticGraphSet):
     def __init__(self, path: str):
-        dgl_dataset = dgl.data.TUDataset(
-            "MUTAG", raw_dir=os.path.join(path, "_dgl")
+        dgl_dataset = dgl.data.GINDataset(
+            "MUTAG", False, raw_dir=os.path.join(path, "_dgl")
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
diff --git a/autogl/datasets/_ogb.py b/autogl/datasets/_ogb.py
index 016fe75..b8ee15a 100644
--- a/autogl/datasets/_ogb.py
+++ b/autogl/datasets/_ogb.py
@@ -53,7 +53,7 @@ class _OGBNDatasetUtil(_OGBDatasetUtil):
             homogeneous_static_graph.nodes.data[nodes_label_key] = (
                 torch.from_numpy(nodes_label.squeeze()).squeeze()
             )
-        if train_index not in (Ellipsis, None) and isinstance(train_index, np.ndarray):
+        if isinstance(train_index, np.ndarray):
             homogeneous_static_graph.nodes.data['train_mask'] = index_to_mask(
                 torch.from_numpy(train_index), ogbn_data['num_nodes']
             )

From 914863a49d7d851c30dc9ee6fc5eeed2dd37cac1 Mon Sep 17 00:00:00 2001
From: CoreLeader <Core-Leader@outlook.com>
Date: Wed, 20 Oct 2021 12:20:00 +0800
Subject: [PATCH 45/75] Revision for Refactor of Dataset and Feature Engineer

Revise DGL dataset to unify names for data of graph
Debug for data conversion utility
Debug for autogl.datasets.utils.graph_get_split
---
 .../utils/conversion/_pyg.py                  | 23 +++++---
 autogl/datasets/_dgl.py                       | 53 +++++++++++++++++++
 autogl/datasets/utils/_general.py             | 48 ++++++++++-------
 3 files changed, 98 insertions(+), 26 deletions(-)

diff --git a/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py b/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
index ced55ba..0cd82af 100644
--- a/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
@@ -1,3 +1,4 @@
+import torch
 import typing as _typing
 import autogl
 from ... import GeneralStaticGraph
@@ -17,7 +18,7 @@ class StaticGraphToPyGData:
             raise ValueError("Provided static graph MUST consist of homogeneous nodes")
         pyg_data: autogl.data.Data = autogl.data.Data()
         for data_key in static_graph.nodes.data:
-            setattr(pyg_data, data_key, static_graph.nodes.data[data_key].detach().clone())
+            setattr(pyg_data, data_key, static_graph.nodes.data[data_key].detach())
         homogeneous_node_type: _typing.Optional[str] = (
             list(static_graph.nodes)[0]
             if len(list(static_graph.nodes)) > 0 else None
@@ -25,13 +26,17 @@ class StaticGraphToPyGData:
         if len(list(static_graph.edges)) == 1:
             pyg_data.edge_index = static_graph.edges.connections
             for data_key in static_graph.edges.data:
-                if hasattr(pyg_data, data_key):
+                if (
+                        hasattr(pyg_data, data_key) and
+                        getattr(pyg_data, data_key) is not None and
+                        isinstance(getattr(pyg_data, data_key), torch.Tensor)
+                ):
                     raise ValueError(
                         "Provided static graph contains duplicate data with same key, "
                         "please refer to doc for more details."
                     )
                 else:
-                    setattr(pyg_data, data_key, static_graph.edges.data[data_key].detach().clone())
+                    setattr(pyg_data, data_key, static_graph.edges.data[data_key].detach())
         elif len(list(static_graph.edges)) > 1:
             for canonical_edge_type in static_graph.edges:
                 if homogeneous_node_type is not None and isinstance(homogeneous_node_type, str) and (
@@ -46,21 +51,25 @@ class StaticGraphToPyGData:
                     if len(data_key) >= 4 and data_key[:4] == 'edge':
                         setattr(
                             pyg_data, edge_type_prefix + data_key,
-                            static_graph.edges[canonical_edge_type].data[data_key].detach().clone()
+                            static_graph.edges[canonical_edge_type].data[data_key].detach()
                         )
                     else:
                         setattr(
                             pyg_data, f"{canonical_edge_type.relation_type}_{data_key}",
-                            static_graph.edges[canonical_edge_type].data[data_key].detach().clone()
+                            static_graph.edges[canonical_edge_type].data[data_key].detach()
                         )
         for data_key in static_graph.data:
-            if hasattr(pyg_data, data_key):
+            if (
+                    hasattr(pyg_data, data_key) and
+                    getattr(pyg_data, data_key) is not None and
+                    isinstance(getattr(pyg_data, data_key), torch.Tensor)
+            ):
                 raise ValueError(
                     "Provided static graph contains duplicate data with same key, "
                     "please refer to doc for more details."
                 )
             else:
-                setattr(pyg_data, data_key, static_graph.data[data_key].detach().clone())
+                setattr(pyg_data, data_key, static_graph.data[data_key].detach())
         return pyg_data
 
 
diff --git a/autogl/datasets/_dgl.py b/autogl/datasets/_dgl.py
index 3eb7ebe..e02bd43 100644
--- a/autogl/datasets/_dgl.py
+++ b/autogl/datasets/_dgl.py
@@ -212,6 +212,10 @@ class MUTAGDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -219,6 +223,19 @@ class MUTAGDataset(InMemoryStaticGraphSet):
         super(MUTAGDataset, self).__init__(
             [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
         )
+        # super(MUTAGDataset, self).__init__(
+        #     [
+        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
+        #             {
+        #                 'label': dgl_graph.ndata['label'],
+        #                 'attr': dgl_graph.ndata['attr']
+        #             },
+        #             torch.vstack(dgl_graph.edges()),
+        #             graph_data={'label': graph_label}
+        #         )
+        #         for (dgl_graph, graph_label) in dgl_dataset
+        #     ]
+        # )
 
 
 @DatasetUniversalRegistry.register_dataset("enzymes")
@@ -229,6 +246,10 @@ class ENZYMESDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['node_attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['node_labels']
+            del dgl_graph.ndata['node_attr']
+            del dgl_graph.ndata['node_labels']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -258,6 +279,10 @@ class IMDBBinaryDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -288,6 +313,10 @@ class IMDBMultiDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -318,6 +347,10 @@ class RedditBinaryDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -348,6 +381,10 @@ class REDDITMulti5KDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -379,6 +416,10 @@ class COLLABDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -409,6 +450,10 @@ class ProteinsDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -439,6 +484,10 @@ class PTCMRDataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
@@ -469,6 +518,10 @@ class NCI1Dataset(InMemoryStaticGraphSet):
         )
 
         def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
+            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
+            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
+            del dgl_graph.ndata['attr']
+            del dgl_graph.ndata['label']
             static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
             static_graph.data['label'] = label
             return static_graph
diff --git a/autogl/datasets/utils/_general.py b/autogl/datasets/utils/_general.py
index 5480cbd..bee87bb 100644
--- a/autogl/datasets/utils/_general.py
+++ b/autogl/datasets/utils/_general.py
@@ -4,7 +4,9 @@ import torch
 import torch.utils.data
 import typing as _typing
 from sklearn.model_selection import StratifiedKFold, KFold
-from autogl.data import Data, InMemoryDataset, InMemoryStaticGraphSet
+from dgl.dataloading.pytorch import GraphDataLoader
+from autogl import backend as _backend
+from autogl.data import Data, Dataset, DataLoader, InMemoryStaticGraphSet
 from ...data.graph import GeneralStaticGraph, GeneralStaticGraphGenerator
 from . import _pyg
 
@@ -334,7 +336,7 @@ def graph_random_splits(
 
 
 def graph_get_split(
-        dataset: InMemoryDataset, mask: str = "train",
+        dataset: Dataset, mask: str = "train",
         is_loader: bool = True, batch_size: int = 128,
         num_workers: int = 0
 ) -> _typing.Union[torch.utils.data.DataLoader, _typing.Iterable]:
@@ -342,7 +344,7 @@ def graph_get_split(
 
     Parameters
     ----------
-    dataset: ``torch_geometric.data.dataset.Dataset``
+    dataset:
         dataset with multiple graphs.
 
     mask : str
@@ -355,7 +357,7 @@ def graph_get_split(
     num_workers : int
         number of workers parameter for data loader
     """
-    if not isinstance(dataset, InMemoryDataset):
+    if not isinstance(dataset, Dataset):
         raise TypeError
     if not isinstance(mask, str):
         raise TypeError
@@ -375,28 +377,36 @@ def graph_get_split(
     if mask.lower() not in ("train", "val", "test"):
         raise ValueError
     elif mask.lower() == "train":
-        __possible_index = dataset.train_split
+        optional_dataset_split = dataset.train_split
     elif mask.lower() == "val":
-        __possible_index = dataset.val_split
+        optional_dataset_split = dataset.val_split
     elif mask.lower() == "test":
-        __possible_index = dataset.test_split
+        optional_dataset_split = dataset.test_split
     else:
-        raise ValueError
-
+        raise ValueError(
+            f"The provided mask parameter must be a str in ['train', 'val', 'test'], "
+            f"illegal provided value is [{mask}]"
+        )
     if (
-            __possible_index is None or
-            not isinstance(__possible_index, _typing.Iterable)
+            optional_dataset_split is None or
+            not isinstance(optional_dataset_split, _typing.Iterable)
     ):
         raise ValueError(
             f"Provided dataset do NOT have {mask} split"
         )
     if is_loader:
-        __possible_index: _typing.Any = list(__possible_index)
-        return torch.utils.data.DataLoader(
-            __possible_index,
-            batch_size=batch_size,
-            collate_fn=lambda x: x,
-            num_workers=num_workers
-        )
+        if not (_backend.DependentBackend.is_dgl() or _backend.DependentBackend.is_pyg()):
+            raise RuntimeError("Unsupported backend")
+        elif _backend.DependentBackend.is_dgl():
+            return GraphDataLoader(
+                optional_dataset_split,
+                **{"batch_size": batch_size, "num_workers": num_workers}
+            )
+        elif _backend.DependentBackend.is_pyg():
+            return DataLoader(
+                optional_dataset_split,
+                batch_size=batch_size,
+                num_workers=num_workers
+            )
     else:
-        return __possible_index
+        return optional_dataset_split

From 378648a936084b451ff35c843fb215a9512ec652 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Wed, 20 Oct 2021 09:49:12 +0000
Subject: [PATCH 46/75] commit for perform comparison

---
 autogl/module/model/dgl/gin.py             |   2 +-
 test/model_glf/gclf_dgl_origin.py          |   4 +-
 test/model_glf/gclf_dgl_trainer.py         | 140 +++++++++++++++++++++
 test/model_glf/gclf_dgl_trainer_dataset.py |  81 ++++++++++++
 4 files changed, 224 insertions(+), 3 deletions(-)
 create mode 100644 test/model_glf/gclf_dgl_trainer.py
 create mode 100644 test/model_glf/gclf_dgl_trainer_dataset.py

diff --git a/autogl/module/model/dgl/gin.py b/autogl/module/model/dgl/gin.py
index d5488d2..18aa957 100644
--- a/autogl/module/model/dgl/gin.py
+++ b/autogl/module/model/dgl/gin.py
@@ -205,7 +205,7 @@ class GIN(torch.nn.Module):
     #def forward(self, g, h):
     def forward(self, data):
         g, _ = data
-        h = g.ndata.pop('attr')
+        h = g.ndata.pop('feat')
         # list of hidden representation at each layer (including input)
         hidden_rep = [h]
 
diff --git a/test/model_glf/gclf_dgl_origin.py b/test/model_glf/gclf_dgl_origin.py
index fbe56ea..a4f5688 100644
--- a/test/model_glf/gclf_dgl_origin.py
+++ b/test/model_glf/gclf_dgl_origin.py
@@ -263,7 +263,7 @@ def eval_net(net, dataloader, device):
 def main():
 
     device = torch.device('cuda:1')
-    dataset_ = GINDataset('MUTAG', True)
+    dataset_ = GINDataset('MUTAG', False)
     dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
     
     # 1. split dataset [fix split]
@@ -282,7 +282,7 @@ def main():
 
     accs = []
     from tqdm import tqdm
-    for seed in tqdm(range(50)):
+    for seed in tqdm(range(10)):
         # set up seeds, args.seed supported
         torch.manual_seed(seed=seed)
         np.random.seed(seed=seed)
diff --git a/test/model_glf/gclf_dgl_trainer.py b/test/model_glf/gclf_dgl_trainer.py
new file mode 100644
index 0000000..3cd7055
--- /dev/null
+++ b/test/model_glf/gclf_dgl_trainer.py
@@ -0,0 +1,140 @@
+import sys
+
+sys.path.append('../../')
+
+import torch
+import random
+import numpy as np
+from dgl.data import GINDataset
+from dgl.dataloading import GraphDataLoader
+from gin_helper import Parser, GINDataLoader
+
+from autogl.solver import AutoGraphClassifier
+from autogl.datasets import utils, build_dataset_from_name
+from autogl.module.train import GraphClassificationFullTrainer
+from autogl.module.model.dgl.gin import AutoGIN
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+class DatasetAbstraction():
+    def __init__(self, graphs, labels):
+        for g in graphs:
+            g.ndata['feat'] = g.ndata['attr']
+        self.graphs, self.labels = [], []
+        for g, l in zip(graphs, labels):
+            self.graphs.append(g)
+            self.labels.append(l)
+        self.gclasses = max(self.labels).item() + 1
+        self.graph = self.graphs
+    
+    def __len__(self):
+        return len(self.graphs)
+    
+    def __getitem__(self, idx):
+        if isinstance(idx, int):
+            return self.graphs[idx], self.labels[idx]
+        elif isinstance(idx, torch.BoolTensor):
+            idx = [i for i in range(len(idx)) if idx[i]]
+        elif isinstance(idx, torch.Tensor) and idx.unique()[0].sum().item() == 1:
+            idx = [i for i in range(len(idx)) if idx[i]]
+        return DatasetAbstraction([self.graphs[i] for i in idx], [self.labels[i] for i in idx])
+
+    @classmethod
+    def build_from_train_val(cls, train, val, test=None):
+        dataset = cls(train.graphs + val.graphs, train.labels + val.labels)
+        dataset.train_index = list(range(len(train)))
+        dataset.val_index = list(range(len(train), len(train) + len(val)))
+        if test is not None:
+            dataset.test_index = list(range(len(train) + len(val), len(train) + len(val) + len(test)))
+        dataset.train_split = train
+        dataset.val_split = val
+        if test is not None:
+            dataset.test_split = test
+        return dataset
+
+def graph_get_split(
+    dataset, mask="train", is_loader=True, batch_size=128, num_workers=0
+):
+    assert hasattr(
+        dataset, "%s_split" % (mask)
+    ), "Given dataset do not have %s split" % (mask)
+    if is_loader:
+        return GraphDataLoader(
+            getattr(dataset, "%s_split" % (mask)),
+            batch_size=batch_size,
+            num_workers=num_workers,
+        )
+    else:
+        return getattr(dataset, "%s_split" % (mask))
+
+
+utils.graph_get_split = graph_get_split
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    # seed = 100
+    # dataset = build_dataset_from_name('mutag')
+    dataset_ = GINDataset('MUTAG', False)
+    dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
+
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(2021)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_dataset = dataset[dataids[:fold * 8]]
+    val_dataset = dataset[dataids[fold * 8: fold * 9]]
+    test_dataset = dataset[dataids[fold * 9: ]]
+
+    dataset = DatasetAbstraction.build_from_train_val(train_dataset, val_dataset, test_dataset)
+
+    labels = np.array([x.item() for x in test_dataset.labels])
+
+    accs = []
+    from tqdm import tqdm
+    for seed in tqdm(range(10)):
+        set_seed(seed)
+
+        trainer = GraphClassificationFullTrainer(
+            model='gin',
+            device='cuda:1',
+            init=False,
+            num_features=dataset.graph[0].ndata['feat'].size(1),
+            num_classes=dataset.gclasses,
+            loss='cross_entropy'
+        ).duplicate_from_hyper_parameter(
+            {
+                # hp from trainer
+                "max_epoch": 100,
+                "batch_size": 32, 
+                "early_stopping_round": 101, 
+                "lr": 0.0001, 
+                "weight_decay": 0,
+
+                # hp from model
+                "num_layers": 5,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "eps": "False",
+                "mlp_layers": 2,
+                "neighbor_pooling_type": "sum",
+                "graph_pooling_type": "sum"
+            }
+        )
+
+        trainer.train(dataset, False)
+        out = trainer.predict(dataset, 'test').detach().cpu().numpy()
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/model_glf/gclf_dgl_trainer_dataset.py b/test/model_glf/gclf_dgl_trainer_dataset.py
new file mode 100644
index 0000000..f0a1ad3
--- /dev/null
+++ b/test/model_glf/gclf_dgl_trainer_dataset.py
@@ -0,0 +1,81 @@
+import sys
+
+sys.path.append('../../')
+
+import random
+import numpy as np
+
+from autogl.datasets import build_dataset_from_name, utils
+from autogl.module.train import GraphClassificationFullTrainer
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    # seed = 100
+    dataset = build_dataset_from_name('mutag')
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(2021)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_index = dataids[:fold * 8]
+    val_index = dataids[fold * 8: fold * 9]
+    test_index = dataids[fold * 9: ]
+    dataset.train_index = train_index
+    dataset.val_index = val_index
+    dataset.test_index = test_index
+
+    labels = np.array([data.data['label'].item() for data in dataset.test_split])
+
+    dataset = utils.conversion.general_static_graphs_to_dgl_dataset(dataset)
+
+    accs = []
+    from tqdm import tqdm
+    for seed in tqdm(range(10)):
+        set_seed(seed)
+
+        trainer = GraphClassificationFullTrainer(
+            model='gin',
+            device='cuda:1',
+            init=False,
+            num_features=dataset[0][0].ndata['feat'].size(1),
+            num_classes=max([graph[1].item() for graph in dataset]) + 1,
+            loss='cross_entropy'
+        ).duplicate_from_hyper_parameter(
+            {
+                # hp from trainer
+                "max_epoch": 100,
+                "batch_size": 32, 
+                "early_stopping_round": 101, 
+                "lr": 0.0001, 
+                "weight_decay": 0,
+
+                # hp from model
+                "num_layers": 5,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "eps": "False",
+                "mlp_layers": 2,
+                "neighbor_pooling_type": "sum",
+                "graph_pooling_type": "sum"
+            }
+        )
+
+        trainer.train(dataset, False)
+        out = trainer.predict(dataset, 'test').detach().cpu().numpy()
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))

From e6c7b389502b557011e03b7ea2788492d33b6ff0 Mon Sep 17 00:00:00 2001
From: CoreLeader <Core-Leader@outlook.com>
Date: Wed, 20 Oct 2021 18:47:00 +0000
Subject: [PATCH 47/75] Debug for Dataset

Stupid logical mistake
---
 autogl/data/_dataset/_dataset.py | 43 +++++++++++++++++---------------
 1 file changed, 23 insertions(+), 20 deletions(-)

diff --git a/autogl/data/_dataset/_dataset.py b/autogl/data/_dataset/_dataset.py
index 0735486..d9c6a87 100644
--- a/autogl/data/_dataset/_dataset.py
+++ b/autogl/data/_dataset/_dataset.py
@@ -116,14 +116,14 @@ class InMemoryDataset(Dataset[_D]):
             test_index: _typing.Optional[_typing.Iterable[int]] = ...
     ):
         self.__data: _typing.MutableSequence[_D] = list(data)
-        self.__train_index: _typing.Optional[_typing.Set[int]] = (
-            set(train_index) if isinstance(train_index, _typing.Iterable) else None
+        self.__train_index: _typing.Optional[_typing.Iterable[int]] = (
+            train_index if isinstance(train_index, _typing.Iterable) else None
         )
-        self.__val_index: _typing.Optional[_typing.Set[int]] = (
-            set(val_index) if isinstance(val_index, _typing.Iterable) else None
+        self.__val_index: _typing.Optional[_typing.Iterable[int]] = (
+            val_index if isinstance(val_index, _typing.Iterable) else None
         )
-        self.__test_index: _typing.Optional[_typing.Set[int]] = (
-            set(test_index) if isinstance(test_index, _typing.Iterable) else None
+        self.__test_index: _typing.Optional[_typing.Iterable[int]] = (
+            test_index if isinstance(test_index, _typing.Iterable) else None
         )
         self.__folds_container: _FoldsContainer = _FoldsContainer()
 
@@ -173,21 +173,21 @@ class InMemoryDataset(Dataset[_D]):
     @property
     def train_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
         return (
-            [self.__data[i] for i in sorted(self.__train_index)]
+            [self.__data[i] for i in self.__train_index]
             if isinstance(self.__train_index, _typing.Iterable) else None
         )
 
     @property
     def val_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
         return (
-            [self.__data[i] for i in sorted(self.__val_index)]
+            [self.__data[i] for i in self.__val_index]
             if isinstance(self.__val_index, _typing.Iterable) else None
         )
 
     @property
     def test_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
         return (
-            [self.__data[i] for i in sorted(self.__test_index)]
+            [self.__data[i] for i in self.__test_index]
             if isinstance(self.__test_index, _typing.Iterable) else None
         )
 
@@ -208,24 +208,26 @@ class InMemoryDataset(Dataset[_D]):
         if not (train_index is None or isinstance(train_index, _typing.Iterable)):
             raise TypeError
         elif train_index is None:
-            self.__train_index: _typing.Optional[_typing.Set[int]] = None
+            self.__train_index: _typing.Optional[_typing.Iterable[int]] = None
         elif isinstance(train_index, _typing.Iterable):
-            _train_index: _typing.Set[int] = set(train_index)
-            if not (0 <= min(_train_index) <= max(_train_index) < len(self)):
+            if not all([isinstance(i, int) for i in train_index]):
+                raise TypeError
+            if not (0 <= min(train_index) <= max(train_index) < len(self)):
                 raise ValueError
-            self.__train_index: _typing.Optional[_typing.Set[int]] = _train_index
+            self.__train_index: _typing.Optional[_typing.Iterable[int]] = train_index
 
     @val_index.setter
     def val_index(self, val_index: _typing.Optional[_typing.Iterable[int]]):
         if not (val_index is None or isinstance(val_index, _typing.Iterable)):
             raise TypeError
         elif val_index is None:
-            self.__val_index: _typing.Optional[_typing.Set[int]] = None
+            self.__val_index: _typing.Optional[_typing.Iterable[int]] = None
         elif isinstance(val_index, _typing.Iterable):
-            _val_index: _typing.Set[int] = set(val_index)
-            if not (0 <= min(_val_index) <= max(_val_index) < len(self)):
+            if not all([isinstance(i, int) for i in val_index]):
+                raise TypeError
+            if not (0 <= min(val_index) <= max(val_index) < len(self)):
                 raise ValueError
-            self.__val_index: _typing.Optional[_typing.Set[int]] = _val_index
+            self.__val_index: _typing.Optional[_typing.Iterable[int]] = val_index
 
     @test_index.setter
     def test_index(self, test_index: _typing.Optional[_typing.Iterable[int]]):
@@ -234,7 +236,8 @@ class InMemoryDataset(Dataset[_D]):
         elif test_index is None:
             self.__test_index: _typing.Optional[_typing.Set[int]] = None
         elif isinstance(test_index, _typing.Iterable):
-            _test_index: _typing.Set[int] = set(test_index)
-            if not (0 <= min(_test_index) <= max(_test_index) < len(self)):
+            if not all([isinstance(i, int) for i in test_index]):
+                raise TypeError
+            if not (0 <= min(test_index) <= max(test_index) < len(self)):
                 raise ValueError
-            self.__test_index: _typing.Optional[_typing.Set[int]] = _test_index
+            self.__test_index: _typing.Optional[_typing.Iterable[int]] = test_index

From 924d1be6c58bd7d19962ea38d6240614977c83e0 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Wed, 20 Oct 2021 13:53:34 +0000
Subject: [PATCH 48/75] add comparison to model/trainer

---
 test/model_glf/gclf_dgl_model.py   | 167 +++++++++++++++++++++++++++++
 test/model_glf/gclf_dgl_origin.py  |   2 +-
 test/model_glf/gclf_dgl_trainer.py |   2 -
 3 files changed, 168 insertions(+), 3 deletions(-)
 create mode 100644 test/model_glf/gclf_dgl_model.py

diff --git a/test/model_glf/gclf_dgl_model.py b/test/model_glf/gclf_dgl_model.py
new file mode 100644
index 0000000..ea41789
--- /dev/null
+++ b/test/model_glf/gclf_dgl_model.py
@@ -0,0 +1,167 @@
+import sys
+sys.path.append('../../')
+
+from dgl.dataloading.pytorch.dataloader import GraphDataLoader
+import numpy as np
+from tqdm import tqdm
+
+import random
+
+import torch
+import torch.nn as nn
+import torch.optim as optim
+
+from dgl.data import GINDataset
+
+import torch
+import torch.nn as nn
+from autogl.module.model.dgl.gin import AutoGIN
+
+
+class DatasetAbstraction():
+    def __init__(self, graphs, labels):
+        for g in graphs:
+            g.ndata['feat'] = g.ndata['attr']
+        self.graphs, self.labels = [], []
+        for g, l in zip(graphs, labels):
+            self.graphs.append(g)
+            self.labels.append(l)
+        self.gclasses = max(self.labels).item() + 1
+        self.graph = self.graphs
+    
+    def __len__(self):
+        return len(self.graphs)
+    
+    def __getitem__(self, idx):
+        if isinstance(idx, int):
+            return self.graphs[idx], self.labels[idx]
+        elif isinstance(idx, torch.BoolTensor):
+            idx = [i for i in range(len(idx)) if idx[i]]
+        elif isinstance(idx, torch.Tensor) and idx.unique()[0].sum().item() == 1:
+            idx = [i for i in range(len(idx)) if idx[i]]
+        return DatasetAbstraction([self.graphs[i] for i in idx], [self.labels[i] for i in idx])
+
+def train(net, trainloader, validloader, optimizer, criterion, epoch, device):
+    best_model = net.state_dict()
+    
+    best_acc = 0.
+    for e in range(epoch):
+        for graphs, labels in trainloader:
+            net.train()
+
+            labels = labels.to(device)
+            graphs = graphs.to(device)
+            outputs = net((graphs, labels))
+            # feat = graphs.ndata.pop('attr')
+            # outputs = net(graphs, feat)
+
+            loss = criterion(outputs, labels)
+
+            # backprop
+            optimizer.zero_grad()
+            loss.backward()
+            optimizer.step()
+        
+        gt = []
+        pr = []
+        for graphs, labels in validloader:
+            labels = labels.to(device)
+            graphs = graphs.to(device)
+            gt.append(labels)
+            # feat = graphs.ndata.pop('attr')
+            # outputs = net(graphs, feat)
+            outputs = net((graphs, labels))
+            pr.append(outputs.argmax(1))
+        gt = torch.cat(gt, dim=0)
+        pr = torch.cat(pr, dim=0)
+        acc = (gt == pr).float().mean().item()
+        if acc > best_acc:
+            best_acc = acc
+            best_model = net.state_dict()
+    
+    net.load_state_dict(best_model)
+
+    return net
+
+def eval_net(net, dataloader, device):
+    net.eval()
+
+    total = 0
+    total_correct = 0
+
+    for data in dataloader:
+        graphs, labels = data
+        graphs = graphs.to(device)
+        labels = labels.to(device)
+        # feat = graphs.ndata.pop('attr')
+        total += len(labels)
+        # outputs = net(graphs, feat)
+        outputs = net((graphs, labels))
+        _, predicted = torch.max(outputs.data, 1)
+
+        total_correct += (predicted == labels.data).sum().item()
+
+    acc = 1.0 * total_correct / total
+
+    net.train()
+
+    return acc
+
+
+def main():
+
+    device = torch.device('cuda:1')
+    dataset_ = GINDataset('MUTAG', False)
+    dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(2021)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_dataset = dataset[dataids[:fold * 8]]
+    val_dataset = dataset[dataids[fold * 8: fold * 9]]
+    test_dataset = dataset[dataids[fold * 9: ]]
+
+    trainloader = GraphDataLoader(train_dataset, batch_size=32, shuffle=True)
+    valloader = GraphDataLoader(val_dataset, batch_size=32, shuffle=False)
+    testloader = GraphDataLoader(test_dataset, batch_size=32, shuffle=False)
+
+    accs = []
+    for seed in tqdm(range(50)):
+        # set up seeds, args.seed supported
+        torch.manual_seed(seed=seed)
+        np.random.seed(seed=seed)
+
+        model = AutoGIN(
+            num_features=dataset_.dim_nfeats,
+            num_classes=dataset_.gclasses,
+            device=device,
+        ).from_hyper_parameter(
+            {
+                # hp from model
+                "num_layers": 5,
+                "hidden": [64,64,64,64],
+                "dropout": 0.5,
+                "act": "relu",
+                "eps": "False",
+                "mlp_layers": 2,
+                "neighbor_pooling_type": "sum",
+                "graph_pooling_type": "sum"
+            }
+        ).model
+
+        model = model.to(device)
+
+        criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+        optimizer = optim.Adam(model.parameters(), lr=0.0001)
+
+        model = train(model, trainloader, valloader, optimizer, criterion, 100, device)
+        acc = eval_net(model, testloader, device)
+        accs.append(acc)
+
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
+
+if __name__ == '__main__':
+    main()
diff --git a/test/model_glf/gclf_dgl_origin.py b/test/model_glf/gclf_dgl_origin.py
index a4f5688..ebc71c9 100644
--- a/test/model_glf/gclf_dgl_origin.py
+++ b/test/model_glf/gclf_dgl_origin.py
@@ -282,7 +282,7 @@ def main():
 
     accs = []
     from tqdm import tqdm
-    for seed in tqdm(range(10)):
+    for seed in tqdm(range(50)):
         # set up seeds, args.seed supported
         torch.manual_seed(seed=seed)
         np.random.seed(seed=seed)
diff --git a/test/model_glf/gclf_dgl_trainer.py b/test/model_glf/gclf_dgl_trainer.py
index 3cd7055..7b22e82 100644
--- a/test/model_glf/gclf_dgl_trainer.py
+++ b/test/model_glf/gclf_dgl_trainer.py
@@ -7,9 +7,7 @@ import random
 import numpy as np
 from dgl.data import GINDataset
 from dgl.dataloading import GraphDataLoader
-from gin_helper import Parser, GINDataLoader
 
-from autogl.solver import AutoGraphClassifier
 from autogl.datasets import utils, build_dataset_from_name
 from autogl.module.train import GraphClassificationFullTrainer
 from autogl.module.model.dgl.gin import AutoGIN

From 34fdc776b1d67516d3b7b3a7c37fe0d0869793c0 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Sun, 24 Oct 2021 02:24:52 +0000
Subject: [PATCH 49/75] add pyg performance check

---
 test/model_glf/gclf_pyg_trainer.py         | 96 ++++++++++++++++++++++
 test/model_glf/gclf_pyg_trainer_dataset.py | 82 ++++++++++++++++++
 2 files changed, 178 insertions(+)
 create mode 100644 test/model_glf/gclf_pyg_trainer.py
 create mode 100644 test/model_glf/gclf_pyg_trainer_dataset.py

diff --git a/test/model_glf/gclf_pyg_trainer.py b/test/model_glf/gclf_pyg_trainer.py
new file mode 100644
index 0000000..55c401c
--- /dev/null
+++ b/test/model_glf/gclf_pyg_trainer.py
@@ -0,0 +1,96 @@
+import sys
+import os
+
+os.environ["AUTOGL_BACKEND"] = "pyg"
+
+sys.path.append('../../')
+
+import random
+import numpy as np
+
+from torch_geometric.datasets import TUDataset
+from torch_geometric.data import DataLoader
+from autogl.datasets import utils
+from autogl.module.train import GraphClassificationFullTrainer
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+def graph_get_split(dataset, mask, is_loader=True, batch_size=128, num_workers=0):
+    out = getattr(dataset, f'{mask}_split')
+    if is_loader:
+        out = DataLoader(out, batch_size, num_workers=num_workers)
+    return out
+
+utils.graph_get_split = graph_get_split
+
+if __name__ == '__main__':
+
+    # seed = 100
+    dataset = TUDataset(os.path.expanduser('~/.pyg'), 'MUTAG')
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(2021)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_index = dataids[:fold * 8]
+    val_index = dataids[fold * 8: fold * 9]
+    test_index = dataids[fold * 9: ]
+    dataset.train_index = train_index
+    dataset.val_index = val_index
+    dataset.test_index = test_index
+    dataset.train_split = dataset[dataset.train_index]
+    dataset.val_split = dataset[dataset.val_index]
+    dataset.test_split = dataset[dataset.test_index]
+
+    labels = np.array([data.y.item() for data in dataset.test_split])
+
+    accs = []
+    from tqdm import tqdm
+    for seed in tqdm(range(50)):
+        set_seed(seed)
+
+        trainer = GraphClassificationFullTrainer(
+            model='gin',
+            device='cuda:2',
+            init=False,
+            num_features=dataset[0].x.size(1),
+            num_classes=max([data.y.item() for data in dataset]) + 1,
+            loss='cross_entropy',
+            feval=('acc')
+        ).duplicate_from_hyper_parameter(
+            {
+                # hp from trainer
+                "max_epoch": 100,
+                "batch_size": 32, 
+                "early_stopping_round": 101, 
+                "lr": 0.0001, 
+                "weight_decay": 0,
+
+                # hp from model
+                "num_layers": 5,
+                "hidden": [64,64,64,64],
+                "dropout": 0.5,
+                "act": "relu",
+                "eps": "False",
+                "mlp_layers": 2,
+                "neighbor_pooling_type": "sum",
+                "graph_pooling_type": "sum"
+            }
+        )
+
+        trainer.train(dataset, False)
+        out = trainer.predict(dataset, 'test').detach().cpu().numpy()
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/model_glf/gclf_pyg_trainer_dataset.py b/test/model_glf/gclf_pyg_trainer_dataset.py
new file mode 100644
index 0000000..9fe3037
--- /dev/null
+++ b/test/model_glf/gclf_pyg_trainer_dataset.py
@@ -0,0 +1,82 @@
+import sys
+
+sys.path.append('../../')
+
+import random
+import numpy as np
+
+from autogl.datasets import build_dataset_from_name, utils
+from autogl.module.train import GraphClassificationFullTrainer
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    # seed = 100
+    dataset = build_dataset_from_name('mutag')
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(2021)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_index = dataids[:fold * 8]
+    val_index = dataids[fold * 8: fold * 9]
+    test_index = dataids[fold * 9: ]
+    dataset.train_index = train_index
+    dataset.val_index = val_index
+    dataset.test_index = test_index
+
+    labels = np.array([data.data['y'].item() for data in dataset.test_split])
+
+    dataset = utils.conversion.general_static_graphs_to_pyg_dataset(dataset)
+
+    accs = []
+    from tqdm import tqdm
+    for seed in tqdm(range(50)):
+        set_seed(seed)
+
+        trainer = GraphClassificationFullTrainer(
+            model='gin',
+            device='cuda:2',
+            init=False,
+            num_features=dataset[0].x.size(1),
+            num_classes=max([data.y.item() for data in dataset]) + 1,
+            loss='cross_entropy',
+            feval=('acc')
+        ).duplicate_from_hyper_parameter(
+            {
+                # hp from trainer
+                "max_epoch": 100,
+                "batch_size": 32, 
+                "early_stopping_round": 101, 
+                "lr": 0.0001, 
+                "weight_decay": 0,
+
+                # hp from model
+                "num_layers": 5,
+                "hidden": [64,64,64,64],
+                "dropout": 0.5,
+                "act": "relu",
+                "eps": "False",
+                "mlp_layers": 2,
+                "neighbor_pooling_type": "sum",
+                "graph_pooling_type": "sum"
+            }
+        )
+
+        trainer.train(dataset, False)
+        out = trainer.predict(dataset, 'test').detach().cpu().numpy()
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))

From 5fa7f37a90bf9f698f72ba425751ef1d112b80e0 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Sun, 24 Oct 2021 02:41:15 +0000
Subject: [PATCH 50/75] change default backend, smaller iterations

---
 test/model_glf/gclf_pyg_trainer.py         | 2 +-
 test/model_glf/gclf_pyg_trainer_dataset.py | 4 +++-
 2 files changed, 4 insertions(+), 2 deletions(-)

diff --git a/test/model_glf/gclf_pyg_trainer.py b/test/model_glf/gclf_pyg_trainer.py
index 55c401c..a582e9c 100644
--- a/test/model_glf/gclf_pyg_trainer.py
+++ b/test/model_glf/gclf_pyg_trainer.py
@@ -57,7 +57,7 @@ if __name__ == '__main__':
 
     accs = []
     from tqdm import tqdm
-    for seed in tqdm(range(50)):
+    for seed in tqdm(range(10)):
         set_seed(seed)
 
         trainer = GraphClassificationFullTrainer(
diff --git a/test/model_glf/gclf_pyg_trainer_dataset.py b/test/model_glf/gclf_pyg_trainer_dataset.py
index 9fe3037..2bfc6a9 100644
--- a/test/model_glf/gclf_pyg_trainer_dataset.py
+++ b/test/model_glf/gclf_pyg_trainer_dataset.py
@@ -1,5 +1,7 @@
 import sys
+import os
 
+os.environ["AUTOGL_BACKEND"] = "pyg"
 sys.path.append('../../')
 
 import random
@@ -43,7 +45,7 @@ if __name__ == '__main__':
 
     accs = []
     from tqdm import tqdm
-    for seed in tqdm(range(50)):
+    for seed in tqdm(range(10)):
         set_seed(seed)
 
         trainer = GraphClassificationFullTrainer(

From db750076f316b5eb35811cdbc15e5bc34c144510 Mon Sep 17 00:00:00 2001
From: CoreLeader <Core-Leader@outlook.com>
Date: Sun, 24 Oct 2021 12:30:00 +0800
Subject: [PATCH 51/75] Debug

Debug for GeneralStaticGraph -> pyg Data conversion
Debug for autogl.datasets.utils
---
 .../utils/conversion/_pyg.py                  | 68 +++++++++----------
 autogl/datasets/utils/_general.py             | 12 ++--
 2 files changed, 40 insertions(+), 40 deletions(-)

diff --git a/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py b/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
index 0cd82af..4922e24 100644
--- a/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
@@ -1,6 +1,6 @@
 import torch
 import typing as _typing
-import autogl
+import torch_geometric
 from ... import GeneralStaticGraph
 
 
@@ -16,27 +16,35 @@ class StaticGraphToPyGData:
             raise TypeError
         elif not static_graph.nodes.is_homogeneous:
             raise ValueError("Provided static graph MUST consist of homogeneous nodes")
-        pyg_data: autogl.data.Data = autogl.data.Data()
-        for data_key in static_graph.nodes.data:
-            setattr(pyg_data, data_key, static_graph.nodes.data[data_key].detach())
         homogeneous_node_type: _typing.Optional[str] = (
             list(static_graph.nodes)[0]
             if len(list(static_graph.nodes)) > 0 else None
         )
+        data: _typing.Dict[str, torch.Tensor] = dict()
+        if isinstance(homogeneous_node_type, str):
+            node_and_edge_data_keys_intersection: _typing.Set[str] = (
+                    set(static_graph.nodes.data) & set(static_graph.data)
+            )
+            if len(node_and_edge_data_keys_intersection) > 0:
+                raise ValueError(
+                    f"Provided static graph contains duplicate data "
+                    f"with same keys {node_and_edge_data_keys_intersection}"
+                    f"for homogeneous nodes data and graph-level data, "
+                    f"please refer to doc for more details."
+                )
+            data.update(static_graph.nodes.data)
+            data.update(static_graph.data)
+        else:
+            data.update(static_graph.data)
+
         if len(list(static_graph.edges)) == 1:
-            pyg_data.edge_index = static_graph.edges.connections
-            for data_key in static_graph.edges.data:
-                if (
-                        hasattr(pyg_data, data_key) and
-                        getattr(pyg_data, data_key) is not None and
-                        isinstance(getattr(pyg_data, data_key), torch.Tensor)
-                ):
-                    raise ValueError(
-                        "Provided static graph contains duplicate data with same key, "
-                        "please refer to doc for more details."
-                    )
-                else:
-                    setattr(pyg_data, data_key, static_graph.edges.data[data_key].detach())
+            data["edge_index"] = static_graph.edges.connections
+            if len(set(data.keys()) & set(static_graph.edges.data.keys())) > 0:
+                raise ValueError(
+                    "Provided static graph contains duplicate data with same key, "
+                    "please refer to doc for more details."
+                )
+            data.update(static_graph.edges.data)
         elif len(list(static_graph.edges)) > 1:
             for canonical_edge_type in static_graph.edges:
                 if homogeneous_node_type is not None and isinstance(homogeneous_node_type, str) and (
@@ -46,32 +54,24 @@ class StaticGraphToPyGData:
                     continue
                 if len(canonical_edge_type.relation_type) < 4 or canonical_edge_type[-4:] != 'edge':
                     continue
+                data[f"{canonical_edge_type.relation_type}_index"] = (
+                    static_graph.edges[canonical_edge_type].connections
+                )
+
                 edge_type_prefix: str = canonical_edge_type.relation_type[:-4]
                 for data_key in static_graph.edges[canonical_edge_type].data:
                     if len(data_key) >= 4 and data_key[:4] == 'edge':
-                        setattr(
-                            pyg_data, edge_type_prefix + data_key,
+                        data[f"{edge_type_prefix}{data_key}"] = (
                             static_graph.edges[canonical_edge_type].data[data_key].detach()
                         )
                     else:
-                        setattr(
-                            pyg_data, f"{canonical_edge_type.relation_type}_{data_key}",
+                        data[f"{canonical_edge_type.relation_type}_{data_key}"] = (
                             static_graph.edges[canonical_edge_type].data[data_key].detach()
                         )
-        for data_key in static_graph.data:
-            if (
-                    hasattr(pyg_data, data_key) and
-                    getattr(pyg_data, data_key) is not None and
-                    isinstance(getattr(pyg_data, data_key), torch.Tensor)
-            ):
-                raise ValueError(
-                    "Provided static graph contains duplicate data with same key, "
-                    "please refer to doc for more details."
-                )
-            else:
-                setattr(pyg_data, data_key, static_graph.data[data_key].detach())
+
+        pyg_data: torch_geometric.data.Data = torch_geometric.data.Data(**data)
         return pyg_data
 
 
-def static_graph_to_pyg_data(static_graph: autogl.data.graph.GeneralStaticGraph):
+def static_graph_to_pyg_data(static_graph: GeneralStaticGraph) -> torch_geometric.data.Data:
     return StaticGraphToPyGData().__call__(static_graph)
diff --git a/autogl/datasets/utils/_general.py b/autogl/datasets/utils/_general.py
index bee87bb..25e1c7f 100644
--- a/autogl/datasets/utils/_general.py
+++ b/autogl/datasets/utils/_general.py
@@ -4,9 +4,8 @@ import torch
 import torch.utils.data
 import typing as _typing
 from sklearn.model_selection import StratifiedKFold, KFold
-from dgl.dataloading.pytorch import GraphDataLoader
 from autogl import backend as _backend
-from autogl.data import Data, Dataset, DataLoader, InMemoryStaticGraphSet
+from autogl.data import Data, Dataset, InMemoryStaticGraphSet
 from ...data.graph import GeneralStaticGraph, GeneralStaticGraphGenerator
 from . import _pyg
 
@@ -398,15 +397,16 @@ def graph_get_split(
         if not (_backend.DependentBackend.is_dgl() or _backend.DependentBackend.is_pyg()):
             raise RuntimeError("Unsupported backend")
         elif _backend.DependentBackend.is_dgl():
+            from dgl.dataloading.pytorch import GraphDataLoader
             return GraphDataLoader(
                 optional_dataset_split,
                 **{"batch_size": batch_size, "num_workers": num_workers}
             )
         elif _backend.DependentBackend.is_pyg():
-            return DataLoader(
-                optional_dataset_split,
-                batch_size=batch_size,
-                num_workers=num_workers
+            dataset_split: _typing.Any = optional_dataset_split
+            import torch_geometric
+            return torch_geometric.loader.DataLoader(
+                dataset_split, batch_size=batch_size, num_workers=num_workers
             )
     else:
         return optional_dataset_split

From 29c3bf7731a203476aa0c33af2cd9b53d6bd19b2 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Wed, 27 Oct 2021 08:14:48 +0000
Subject: [PATCH 52/75] add support to general static graph

---
 autogl/solver/classifier/graph_classifier.py | 15 ++++----
 autogl/solver/utils.py                       | 37 ++++++++++++++++++--
 2 files changed, 42 insertions(+), 10 deletions(-)

diff --git a/autogl/solver/classifier/graph_classifier.py b/autogl/solver/classifier/graph_classifier.py
index b88b738..b9f4688 100644
--- a/autogl/solver/classifier/graph_classifier.py
+++ b/autogl/solver/classifier/graph_classifier.py
@@ -15,7 +15,7 @@ from ...module.feature import FEATURE_DICT
 from ...module.model import BaseModel, MODEL_DICT
 from ...module.train import TRAINER_DICT, get_feval, BaseGraphClassificationTrainer
 from ..base import _initialize_single_model, _parse_hp_space
-from ..utils import LeaderBoard, get_dataset_labels, set_seed, get_graph_from_dataset, get_graph_node_features
+from ..utils import LeaderBoard, get_dataset_labels, set_seed, get_graph_from_dataset, get_graph_node_features, convert_dataset
 from ...datasets import utils
 from ..utils import get_logger
 from ...backend import DependentBackend
@@ -277,7 +277,7 @@ class AutoGraphClassifier(BaseClassifier):
 
         set_seed(seed)
 
-        num_classes = dataset.num_classes if BACKEND == 'pyg' else dataset.gclasses
+        num_classes = max(get_dataset_labels(dataset)) + 1
 
         if time_limit < 0:
             time_limit = 3600 * 24
@@ -351,8 +351,9 @@ class AutoGraphClassifier(BaseClassifier):
             device=self.runtime_device,
             loss="cross_entropy" if not hasattr(dataset, "loss") else dataset.loss,
             num_graph_features=(0
-            if not hasattr(dataset.data, "gf")
-            else dataset.data.gf.size(1)) if BACKEND == 'pyg' else 0,
+            if not hasattr(dataset[0], "gf")
+            else dataset[0].gf.size(1)) if BACKEND == 'pyg' else 
+            (0 if 'gf' not in dataset[0].data else dataset[0].data['gf'].size(1)),
         )
 
         # currently disabled
@@ -390,11 +391,11 @@ class AutoGraphClassifier(BaseClassifier):
                 )
             if self.hpo_module is None:
                 model.initialize()
-                model.train(dataset, True)
+                model.train(convert_dataset(dataset), True)
                 optimized = model
             else:
                 optimized, _ = self.hpo_module.optimize(
-                    trainer=model, dataset=dataset, time_limit=time_for_each_model
+                    trainer=model, dataset=convert_dataset(dataset), time_limit=time_for_each_model
                 )
             # to save memory, all the trainer derived will be mapped to cpu
             optimized.to(torch.device("cpu"))
@@ -615,7 +616,7 @@ class AutoGraphClassifier(BaseClassifier):
         self.trained_models[name].to(self.runtime_device)
         predicted = (
             self.trained_models[name]
-            .predict_proba(dataset, mask=mask)
+            .predict_proba(convert_dataset(dataset), mask=mask)
             .detach()
             .cpu()
             .numpy()
diff --git a/autogl/solver/utils.py b/autogl/solver/utils.py
index dd019a5..bc986e3 100644
--- a/autogl/solver/utils.py
+++ b/autogl/solver/utils.py
@@ -11,13 +11,19 @@ import torch.backends.cudnn
 import numpy as np
 import pandas as pd
 from ..backend import DependentBackend
+from ..data import Dataset
+from ..data.graph import GeneralStaticGraph
 
 from ..utils import get_logger
-
 LOGGER = get_logger("LeaderBoard")
 
 BACKEND = DependentBackend.get_backend_name()
 
+if BACKEND == 'dgl':
+    from autogl.datasets.utils.conversion import general_static_graphs_to_dgl_dataset as convert_dataset
+else:
+    from autogl.datasets.utils.conversion import general_static_graphs_to_pyg_dataset as convert_dataset
+
 class LeaderBoard:
     """
     The leaderBoard that can be used to store / sort the model performance automatically.
@@ -179,10 +185,17 @@ class LeaderBoard:
         )
 
 def get_graph_from_dataset(dataset, graph_id=0):
+    if isinstance(dataset, Dataset):
+        return dataset[graph_id]
     if BACKEND == 'pyg': return dataset[graph_id]
     return dataset.graph[graph_id]
 
 def get_graph_node_number(graph):
+    # FIXME: if the feature is None, this will throw an error
+    if isinstance(graph, GeneralStaticGraph):
+        if BACKEND == 'pyg':
+            return graph.nodes.data['x'].size(0)
+        return graph.nodes.data['feat'].size(0)
     if BACKEND == 'pyg':
         size = graph.x.shape[0]
     else:
@@ -190,6 +203,12 @@ def get_graph_node_number(graph):
     return size
 
 def get_graph_node_features(graph):
+    if isinstance(graph, GeneralStaticGraph):
+        if BACKEND == 'dgl' and 'feat' in graph.nodes.data:
+            return graph.nodes.data['feat']
+        if BACKEND == 'pyg' and 'x' in graph.nodes.data:
+            return graph.nodes.data['x']
+        return None
     if BACKEND == 'pyg' and hasattr(graph, 'x'):
         return graph.x
     elif BACKEND == 'dgl' and 'feat' in graph.ndata:
@@ -197,6 +216,10 @@ def get_graph_node_features(graph):
     return None
 
 def get_graph_masks(graph, mask='train'):
+    if isinstance(graph, GeneralStaticGraph):
+        if f'{mask}_mask' in graph.nodes.data:
+            return graph.nodes.data[f'{mask}_mask']
+        return None
     if BACKEND == 'pyg' and hasattr(graph, f'{mask}_mask'):
         return getattr(graph, f'{mask}_mask')
     if BACKEND == 'dgl' and f'{mask}_mask' in graph.ndata:
@@ -204,10 +227,18 @@ def get_graph_masks(graph, mask='train'):
     return None
 
 def get_graph_labels(graph):
-    if BACKEND == 'pyg': return graph.y
-    return graph.ndata['label']
+    if isinstance(graph, GeneralStaticGraph):
+        if 'label' in graph.data and BACKEND == 'dgl':
+            return graph.data['label']
+        if 'y' in graph.data and BACKEND == 'pyg':
+            return graph.data['y']
+        return None
+    if BACKEND == 'pyg' and hasattr(graph, 'y'): return graph.y
+    return None
 
 def get_dataset_labels(dataset):
+    if isinstance(dataset, Dataset):
+        return torch.LongTensor([d.data['label' if BACKEND == 'dgl' else 'y'] for d in dataset])
     if BACKEND == 'pyg':
         return dataset.data.y
     else:

From 9560cbfae347cdac963a145497a3744fdeb9b2c9 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Wed, 27 Oct 2021 08:15:37 +0000
Subject: [PATCH 53/75] remove unecessary keys

---
 autogl/module/model/dgl/topkpool.py | 47 ++++++++++-------------------
 1 file changed, 16 insertions(+), 31 deletions(-)

diff --git a/autogl/module/model/dgl/topkpool.py b/autogl/module/model/dgl/topkpool.py
index dbff6e9..2ea12ee 100644
--- a/autogl/module/model/dgl/topkpool.py
+++ b/autogl/module/model/dgl/topkpool.py
@@ -121,8 +121,6 @@ class Topkpool(torch.nn.Module):
                     "num_layers",
                     "hidden",
                     "dropout",
-                    "act",
-                    "mlp_layers",
                 ]
             )
             - set(self.args.keys())
@@ -137,19 +135,8 @@ class Topkpool(torch.nn.Module):
         self.num_layers = self.args["num_layers"]
         assert self.num_layers > 2, "Number of layers in GIN should not less than 3"
 
-        self.num_mlp_layers = self.args["mlp_layers"]
         input_dim = self.args["features_num"]
         hidden_dim = self.args["hidden"][0]
-        if self.args["act"] == "leaky_relu":
-            act = LeakyReLU()
-        elif self.args["act"] == "relu":
-            act = ReLU()
-        elif self.args["act"] == "elu":
-            act = ELU()
-        elif self.args["act"] == "tanh":
-            act = Tanh()
-        else:
-            act = ReLU()
         final_dropout = self.args["dropout"]
         output_dim = self.args["num_class"]
 
@@ -163,11 +150,6 @@ class Topkpool(torch.nn.Module):
             else:
                 self.gcnlayers.append(GraphConv(hidden_dim, hidden_dim))
 
-            if layer == 0:
-                mlp = MLP(self.num_mlp_layers, input_dim, hidden_dim, hidden_dim)
-            else:
-                mlp = MLP(self.num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)
-
             #self.gcnlayers.append(GraphConv(input_dim, hidden_dim))
             self.batch_norms.append(nn.BatchNorm1d(hidden_dim))
 
@@ -193,7 +175,7 @@ class Topkpool(torch.nn.Module):
     #def forward(self, g, h):
     def forward(self, data):
         g, _ = data
-        h = g.ndata.pop('attr')
+        h = g.ndata.pop('feat')
         # list of hidden representation at each layer (including input)
         hidden_rep = [h]
 
@@ -259,11 +241,15 @@ class AutoTopkpool(BaseModel):
         }
         self.space = [
             {
-                "parameterName": "ratio",
-                "type": "DOUBLE",
-                "maxValue": 0.9,
-                "minValue": 0.1,
-                "scalingType": "LINEAR",
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 1,
+                "minValue": [128],
+                "maxValue": [32],
+                "scalingType": "LOG",
+                "cutPara": (),
+                "cutFunc": lambda:1,
             },
             {
                 "parameterName": "dropout",
@@ -273,19 +259,18 @@ class AutoTopkpool(BaseModel):
                 "scalingType": "LINEAR",
             },
             {
-                "parameterName": "act",
-                "type": "CATEGORICAL",
-                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+                "parameterName": "num_layers",
+                "type": "INTEGER",
+                "minValue": 7,
+                "maxValue": 2,
+                "scalingType": "LINEAR"
             },
         ]
 
-        #self.hyperparams = {"ratio": 0.8, "dropout": 0.5, "act": "relu"}
         self.hyperparams = {
             "num_layers": 5,
             "hidden": [64],
-            "dropout": 0.5,
-            "act": "relu",
-            "mlp_layers": 2
+            "dropout": 0.5
         }
 
         self.initialized = False

From 1505dfa8d25ebb3495c9eb90a60f5b0f68c2c2ed Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Wed, 27 Oct 2021 08:15:59 +0000
Subject: [PATCH 54/75] unify performance check files

---
 test/model_glf/gclf_dgl.py                    | 257 ------------------
 test/model_glf/gclf_dgl_gin.py                | 169 ------------
 test/model_glf/gclf_dgl_gin_trainer.py        | 148 ----------
 test/model_glf/gclf_dgl_solver.py             | 141 ----------
 test/model_glf/gclf_dgl_topk.py               | 169 ------------
 test/model_glf/gclf_dgl_trainer_dataset.py    |  81 ------
 test/model_glf/gclf_pyg_trainer_dataset.py    |  84 ------
 test/model_glf/gin_helper.py                  | 156 -----------
 .../graph_classification/dgl/dgl.py}          |  17 +-
 .../graph_classification/dgl/model.py}        |  79 ++++--
 .../graph_classification/dgl/solver.py        |  95 +++++++
 .../graph_classification/dgl/trainer.py}      |  82 +++---
 .../dgl/trainer_dataset.py                    | 102 +++++++
 .../graph_classification/pyg/model.py         | 135 +++++++++
 .../graph_classification/pyg/pyg.py           | 196 +++++++++++++
 .../graph_classification/pyg/solver.py        | 107 ++++++++
 .../graph_classification/pyg/trainer.py}      |  71 +++--
 .../pyg/trainer_dataset.py                    | 119 ++++++++
 .../node_classification/pyg/model.py          | 125 +++++++++
 .../node_classification/pyg/pyg.py            | 133 +++++++++
 20 files changed, 1173 insertions(+), 1293 deletions(-)
 delete mode 100644 test/model_glf/gclf_dgl.py
 delete mode 100644 test/model_glf/gclf_dgl_gin.py
 delete mode 100644 test/model_glf/gclf_dgl_gin_trainer.py
 delete mode 100644 test/model_glf/gclf_dgl_solver.py
 delete mode 100644 test/model_glf/gclf_dgl_topk.py
 delete mode 100644 test/model_glf/gclf_dgl_trainer_dataset.py
 delete mode 100644 test/model_glf/gclf_pyg_trainer_dataset.py
 delete mode 100644 test/model_glf/gin_helper.py
 rename test/{model_glf/gclf_dgl_origin.py => performance/graph_classification/dgl/dgl.py} (97%)
 rename test/{model_glf/gclf_dgl_model.py => performance/graph_classification/dgl/model.py} (65%)
 create mode 100644 test/performance/graph_classification/dgl/solver.py
 rename test/{model_glf/gclf_dgl_trainer.py => performance/graph_classification/dgl/trainer.py} (66%)
 create mode 100644 test/performance/graph_classification/dgl/trainer_dataset.py
 create mode 100644 test/performance/graph_classification/pyg/model.py
 create mode 100644 test/performance/graph_classification/pyg/pyg.py
 create mode 100644 test/performance/graph_classification/pyg/solver.py
 rename test/{model_glf/gclf_pyg_trainer.py => performance/graph_classification/pyg/trainer.py} (54%)
 create mode 100644 test/performance/graph_classification/pyg/trainer_dataset.py
 create mode 100644 test/performance/node_classification/pyg/model.py
 create mode 100644 test/performance/node_classification/pyg/pyg.py

diff --git a/test/model_glf/gclf_dgl.py b/test/model_glf/gclf_dgl.py
deleted file mode 100644
index 86ea871..0000000
--- a/test/model_glf/gclf_dgl.py
+++ /dev/null
@@ -1,257 +0,0 @@
-import os
-import sys
-import logging
-logging.basicConfig(level=logging.INFO)
-from tqdm import tqdm
-import argparse
-
-sys.path.insert(0, "../../")
-
-print(os.getcwd())
-os.environ["AUTOGL_BACKEND"] = "dgl"
-from dgl.data import GINDataset
-import torch
-import torch.nn as nn
-import torch.optim as optim
-
-from gin_helper import GINDataLoader
-from autogl.module.model.dgl.gin import AutoGIN
-from autogl.module.train.graph_classification_full import GraphClassificationFullTrainer
-
-import numpy as np
-
-
-def train(args, net, trainloader, optimizer, criterion, epoch):
-    net.train()
-
-    running_loss = 0
-    total_iters = len(trainloader)
-    # setup the offset to avoid the overlap with mouse cursor
-    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
-
-    for pos, (graphs, labels) in zip(bar, trainloader):
-        # batch graphs will be shipped to device in forward part of model
-        labels = labels.to(args.device)
-        graphs = graphs.to(args.device)
-        feat = graphs.ndata.pop('attr')
-        outputs = net(graphs, feat)
-
-        loss = criterion(outputs, labels)
-        running_loss += loss.item()
-
-        # backprop
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-
-        # report
-        bar.set_description('epoch-{}'.format(epoch))
-    bar.close()
-    # the final batch will be aligned
-    running_loss = running_loss / total_iters
-
-    return running_loss
-
-
-def eval_net(args, net, dataloader, criterion):
-    net.eval()
-
-    total = 0
-    total_loss = 0
-    total_correct = 0
-
-    for data in dataloader:
-        graphs, labels = data
-        graphs = graphs.to(args.device)
-        labels = labels.to(args.device)
-        feat = graphs.ndata.pop('attr')
-        total += len(labels)
-        outputs = net(graphs, feat)
-        _, predicted = torch.max(outputs.data, 1)
-
-        total_correct += (predicted == labels.data).sum().item()
-        loss = criterion(outputs, labels)
-        # crossentropy(reduce=True) for default
-        total_loss += loss.item() * len(labels)
-
-    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
-
-    net.train()
-
-    return loss, acc
-
-
-def main(args):
-
-    # set up seeds, args.seed supported
-    torch.manual_seed(seed=args.seed)
-    np.random.seed(seed=args.seed)
-
-    # is_cuda = not args.disable_cuda and torch.cuda.is_available()
-    is_cuda = torch.cuda.is_available()
-
-    if is_cuda:
-        args.device = torch.device("cuda:" + str(args.device))
-        torch.cuda.manual_seed_all(seed=args.seed)
-    else:
-        args.device = torch.device("cpu")
-
-
-    dataset = GINDataset(args.dataset, not args.learn_eps)
-
-    trainloader, validloader = GINDataLoader(
-        dataset, batch_size=args.batch_size, device=args.device,
-        seed=args.seed, shuffle=True,
-        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
-    # or split_name='rand', split_ratio=0.7
-    automodel = AutoGIN(
-                num_classes=dataset.gclasses,
-                num_features=dataset.dim_nfeats,
-                device=args.device,
-                init=True)
-    model = automodel.model
-    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-    optimizer = optim.Adam(model.parameters(), lr=args.lr)
-    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
-
-    trainer = GraphClassificationFullTrainer(
-        model=automodel,
-        num_features=dataset.dim_nfeats,
-        num_classes=dataset.gclasses,
-        optimizer=optimizer,
-        lr=args.lr,
-        max_epoch=30,
-        # max_epoch=1,
-        batch_size=args.batch_size,
-        criterion=criterion,
-        feval="acc",
-    )
-
-    trainer.train_only(trainloader)
-    pred = trainer.predict(validloader)
-    print(pred)
-    print(trainer.evaluate(validloader, feval='acc'))
-
-    return 0
-
-
-    # it's not cost-effective to hanle the cursor and init 0
-    # https://stackoverflow.com/a/23121189
-    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
-    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
-    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
-
-    for epoch, _, _ in zip(tbar, vbar, lrbar):
-
-        train(args, model, trainloader, optimizer, criterion, epoch)
-        scheduler.step()
-
-        train_loss, train_acc = eval_net(
-            args, model, trainloader, criterion)
-        tbar.set_description(
-            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(train_loss, 100. * train_acc))
-
-        valid_loss, valid_acc = eval_net(
-            args, model, validloader, criterion)
-        vbar.set_description(
-            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(valid_loss, 100. * valid_acc))
-
-        if not args.filename == "":
-            with open(args.filename, 'a') as f:
-                f.write('%s %s %s %s' % (
-                    args.dataset,
-                    args.learn_eps,
-                    args.neighbor_pooling_type,
-                    args.graph_pooling_type
-                ))
-                f.write("\n")
-                f.write("%f %f %f %f" % (
-                    train_loss,
-                    train_acc,
-                    valid_loss,
-                    valid_acc
-                ))
-                f.write("\n")
-
-        # lrbar.set_description(
-        #     "Learning eps with learn_eps={}: {}".format(
-        #         args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
-
-    tbar.close()
-    vbar.close()
-    lrbar.close()
-
-
-if __name__ == '__main__':
-    parser = argparse.ArgumentParser(
-        "auto graph classification", formatter_class=argparse.ArgumentDefaultsHelpFormatter
-    )
-    parser.add_argument(
-        '--dataset', type=str, default="MUTAG",
-        choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI'],
-        help='name of dataset (default: MUTAG)')
-    parser.add_argument(
-        '--batch_size', type=int, default=32,
-        help='batch size for training and validation (default: 32)')
-    parser.add_argument(
-        '--fold_idx', type=int, default=0,
-        help='the index(<10) of fold in 10-fold validation.')
-    parser.add_argument(
-        '--filename', type=str, default="",
-        help='output file')
-
-    # device
-    parser.add_argument(
-        '--disable-cuda', action='store_true',
-        help='Disable CUDA')
-    parser.add_argument(
-        '--device', type=int, default=0,
-        help='which gpu device to use (default: 0)')
-
-    # net
-    parser.add_argument(
-        '--num_layers', type=int, default=5,
-        help='number of layers (default: 5)')
-    parser.add_argument(
-        '--num_mlp_layers', type=int, default=2,
-        help='number of MLP layers(default: 2). 1 means linear model.')
-    parser.add_argument(
-        '--hidden_dim', type=int, default=64,
-        help='number of hidden units (default: 64)')
-
-    # graph
-    parser.add_argument(
-        '--graph_pooling_type', type=str,
-        default="sum", choices=["sum", "mean", "max"],
-        help='type of graph pooling: sum, mean or max')
-    parser.add_argument(
-        '--neighbor_pooling_type', type=str,
-        default="sum", choices=["sum", "mean", "max"],
-        help='type of neighboring pooling: sum, mean or max')
-    parser.add_argument(
-        '--learn_eps', action="store_true",
-        help='learn the epsilon weighting')
-
-    # learning
-    parser.add_argument(
-        '--seed', type=int, default=0,
-        help='random seed (default: 0)')
-    parser.add_argument(
-        '--epochs', type=int, default=100,
-        help='number of epochs to train (default: 350)')
-    parser.add_argument(
-        '--lr', type=float, default=0.01,
-        help='learning rate (default: 0.01)')
-    parser.add_argument(
-        '--final_dropout', type=float, default=0.5,
-        help='final layer dropout (default: 0.5)')
-
-    args = parser.parse_args()
-    print('show all arguments configuration...')
-    print(args)
-    main(args)
-
-
-
diff --git a/test/model_glf/gclf_dgl_gin.py b/test/model_glf/gclf_dgl_gin.py
deleted file mode 100644
index 7546e79..0000000
--- a/test/model_glf/gclf_dgl_gin.py
+++ /dev/null
@@ -1,169 +0,0 @@
-import os
-import sys
-import logging
-logging.basicConfig(level=logging.INFO)
-from tqdm import tqdm
-
-sys.path.insert(0, "../../")
-print(os.getcwd())
-os.environ["AUTOGL_BACKEND"] = "dgl"
-from dgl.data import GINDataset
-import torch
-import torch.nn as nn
-import torch.optim as optim
-
-from gin_helper import Parser, GINDataLoader
-from autogl.module.model.dgl.gin import AutoGIN
-
-import numpy as np
-from autogl.solver.utils import set_seed
-set_seed(202106)
-
-
-def train(args, net, trainloader, optimizer, criterion, epoch):
-    net.train()
-
-    running_loss = 0
-    total_iters = len(trainloader)
-    # setup the offset to avoid the overlap with mouse cursor
-    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
-
-    for pos, data in zip(bar, trainloader):
-        data = [data[i].to(args.device) for i in range(len(data))]
-        _, labels = data
-        outputs = net(data)
-
-        loss = criterion(outputs, labels)
-        running_loss += loss.item()
-
-        # backprop
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-
-        # report
-        bar.set_description('epoch-{}'.format(epoch))
-    bar.close()
-    # the final batch will be aligned
-    running_loss = running_loss / total_iters
-
-    return running_loss
-
-
-def eval_net(args, net, dataloader, criterion):
-    net.eval()
-
-    total = 0
-    total_loss = 0
-    total_correct = 0
-
-    for data in dataloader:
-        data = [data[i].to(args.device) for i in range(len(data))]
-        _, labels = data
-        total += len(labels)
-        outputs = net(data)
-        _, predicted = torch.max(outputs.data, 1)
-
-        total_correct += (predicted == labels.data).sum().item()
-        loss = criterion(outputs, labels)
-        total_loss += loss.item() * len(labels)
-
-    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
-
-    net.train()
-
-    return loss, acc
-
-
-def main(args):
-
-    # set up seeds, args.seed supported
-    torch.manual_seed(seed=args.seed)
-    np.random.seed(seed=args.seed)
-
-    is_cuda = not args.disable_cuda and torch.cuda.is_available()
-
-    if is_cuda:
-        args.device = torch.device("cuda:" + str(args.device))
-        torch.cuda.manual_seed_all(seed=args.seed)
-    else:
-        args.device = torch.device("cpu")
-
-    dataset = GINDataset(args.dataset, not args.learn_eps)
-
-    best_val_acc = -1.0
-
-    trainloader, validloader = GINDataLoader(
-        dataset, batch_size=args.batch_size, device=args.device,
-        seed=args.seed, shuffle=True,
-        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
-    # or split_name='rand', split_ratio=0.7
-    automodel =  AutoGIN(
-                num_classes=dataset.gclasses,
-                num_features=dataset.dim_nfeats,
-                device=args.device,
-                init=True)
-    model = automodel.model
-    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-    optimizer = optim.Adam(model.parameters(), lr=args.lr)
-    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
-
-    # it's not cost-effective to hanle the cursor and init 0
-    # https://stackoverflow.com/a/23121189
-    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
-    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
-    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
-
-    for epoch, _, _ in zip(tbar, vbar, lrbar):
-
-        train(args, model, trainloader, optimizer, criterion, epoch)
-        scheduler.step()
-
-        train_loss, train_acc = eval_net(
-            args, model, trainloader, criterion)
-        tbar.set_description(
-            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(train_loss, 100. * train_acc))
-
-        valid_loss, valid_acc = eval_net(
-            args, model, validloader, criterion)
-        vbar.set_description(
-            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(valid_loss, 100. * valid_acc))
-
-        if valid_acc > best_val_acc:
-            best_val_acc = valid_acc
-
-        if not args.filename == "":
-            with open(args.filename, 'a') as f:
-                f.write('%s %s %s %s' % (
-                    args.dataset,
-                    args.learn_eps,
-                    args.neighbor_pooling_type,
-                    args.graph_pooling_type
-                ))
-                f.write("\n")
-                f.write("%f %f %f %f" % (
-                    train_loss,
-                    train_acc,
-                    valid_loss,
-                    valid_acc
-                ))
-                f.write("\n")
-
-        lrbar.set_description(
-            "Learning eps with learn_eps={}: {}".format(
-                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
-
-    tbar.close()
-    vbar.close()
-    lrbar.close()
-
-    print('\n\n\nBest val acc', best_val_acc)
-
-
-if __name__ == '__main__':
-    args = Parser(description='GIN').args
-    print('show all arguments configuration...')
-    print(args)
-    main(args)
diff --git a/test/model_glf/gclf_dgl_gin_trainer.py b/test/model_glf/gclf_dgl_gin_trainer.py
deleted file mode 100644
index 5a79b19..0000000
--- a/test/model_glf/gclf_dgl_gin_trainer.py
+++ /dev/null
@@ -1,148 +0,0 @@
-import os
-import sys
-import logging
-logging.basicConfig(level=logging.INFO)
-from tqdm import tqdm
-
-sys.path.insert(0, "../../")
-print(os.getcwd())
-os.environ["AUTOGL_BACKEND"] = "dgl"
-from dgl.data import GINDataset
-import torch
-from gin_helper import Parser, GINDataLoader
-from autogl.module.model.dgl.gin import AutoGIN
-
-from autogl.module.train.graph_classification_full import GraphClassificationFullTrainer
-
-
-import numpy as np
-
-from autogl.datasets import utils
-
-
-trainloader, validloader = None, None
-
-def test_graph_get_split(dataset, mask, is_loader=True, batch_size=128, num_workers=0):
-    global trainloader, validloader
-    if trainloader is None and validloader is None:
-        trainloader, validloader = GINDataLoader(
-            dataset, batch_size=args.batch_size, device=args.device,
-            seed=args.seed, shuffle=True,
-            split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
-
-    if mask == 'train':
-        return trainloader
-    elif mask == 'val':
-        return validloader
-    else:
-        assert False
-
-
-utils.graph_get_split = test_graph_get_split
-
-def train(args, net, trainloader, optimizer, criterion, epoch):
-    net.train()
-
-    running_loss = 0
-    total_iters = len(trainloader)
-    # setup the offset to avoid the overlap with mouse cursor
-    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
-
-    for pos, data in zip(bar, trainloader):
-        data = [data[i].to(args.device) for i in range(len(data))]
-        _, labels = data
-        outputs = net(data)
-
-        loss = criterion(outputs, labels)
-        running_loss += loss.item()
-
-        # backprop
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-
-        # report
-        bar.set_description('epoch-{}'.format(epoch))
-    bar.close()
-    # the final batch will be aligned
-    running_loss = running_loss / total_iters
-
-    return running_loss
-
-
-def eval_net(args, net, dataloader, criterion):
-    net.eval()
-
-    total = 0
-    total_loss = 0
-    total_correct = 0
-
-    for data in dataloader:
-        data = [data[i].to(args.device) for i in range(len(data))]
-        _, labels = data
-        total += len(labels)
-        outputs = net(data)
-        _, predicted = torch.max(outputs.data, 1)
-
-        total_correct += (predicted == labels.data).sum().item()
-        loss = criterion(outputs, labels)
-        total_loss += loss.item() * len(labels)
-
-    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
-
-    net.train()
-
-    return loss, acc
-
-
-def main(args):
-
-    # set up seeds, args.seed supported
-    torch.manual_seed(seed=args.seed)
-    np.random.seed(seed=args.seed)
-
-    is_cuda = not args.disable_cuda and torch.cuda.is_available()
-
-    if is_cuda:
-        args.device = torch.device("cuda:" + str(args.device))
-        torch.cuda.manual_seed_all(seed=args.seed)
-    else:
-        args.device = torch.device("cpu")
-
-    dataset = GINDataset(args.dataset, not args.learn_eps)
-
-    # or split_name='rand', split_ratio=0.7
-    automodel =  AutoGIN(
-                num_classes=dataset.gclasses,
-                num_features=dataset.dim_nfeats,
-                device=args.device,
-                init=True)
-    model = automodel.model
-
-    trainer = GraphClassificationFullTrainer(
-        model=automodel,
-        num_features=dataset.dim_nfeats,
-        num_classes=dataset.gclasses,
-        optimizer="adam",
-        lr=args.lr,
-        max_epoch=50,
-        # max_epoch=1,
-        batch_size=args.batch_size,
-        loss="cross_entropy",
-        feval="acc",
-        early_stopping_round=100,
-        weight_decay=0.0,
-    )
-
-    trainer.train(dataset)
-    print(trainer.evaluate(dataset, 'val'))
-    print(trainer.predict(dataset, 'val'))
-
-
-    return
-
-if __name__ == '__main__':
-    args = Parser(description='GIN').args
-    print('show all arguments configuration...')
-    print(args)
-    main(args)
\ No newline at end of file
diff --git a/test/model_glf/gclf_dgl_solver.py b/test/model_glf/gclf_dgl_solver.py
deleted file mode 100644
index 9e29594..0000000
--- a/test/model_glf/gclf_dgl_solver.py
+++ /dev/null
@@ -1,141 +0,0 @@
-import sys
-
-sys.path.append('../../')
-
-import torch
-import random
-import numpy as np
-from dgl.data import GINDataset
-from dgl.dataloading import GraphDataLoader
-from gin_helper import Parser, GINDataLoader
-
-from autogl.solver import AutoGraphClassifier
-from autogl.datasets import utils, build_dataset_from_name
-from autogl.module.train import GraphClassificationFullTrainer
-from autogl.module.model.dgl.gin import AutoGIN
-from autogl.solver.utils import set_seed
-import logging
-
-logging.basicConfig(level=logging.ERROR)
-
-class DatasetAbstraction():
-    def __init__(self, graphs, labels):
-        for g in graphs:
-            g.ndata['feat'] = g.ndata['attr']
-        self.graphs, self.labels = [], []
-        for g, l in zip(graphs, labels):
-            self.graphs.append(g)
-            self.labels.append(l)
-        self.gclasses = max(self.labels).item() + 1
-        self.graph = self.graphs
-    
-    def __len__(self):
-        return len(self.graphs)
-    
-    def __getitem__(self, idx):
-        if isinstance(idx, int):
-            return self.graphs[idx], self.labels[idx]
-        elif isinstance(idx, torch.BoolTensor):
-            idx = [i for i in range(len(idx)) if idx[i]]
-        elif isinstance(idx, torch.Tensor) and idx.unique()[0].sum().item() == 1:
-            idx = [i for i in range(len(idx)) if idx[i]]
-        return DatasetAbstraction([self.graphs[i] for i in idx], [self.labels[i] for i in idx])
-
-    @classmethod
-    def build_from_train_val(cls, train, val, test=None):
-        dataset = cls(train.graphs + val.graphs, train.labels + val.labels)
-        dataset.train_index = list(range(len(train)))
-        dataset.val_index = list(range(len(train), len(train) + len(val)))
-        if test is not None:
-            dataset.test_index = list(range(len(train) + len(val), len(train) + len(val) + len(test)))
-        dataset.train_split = train
-        dataset.val_split = val
-        if test is not None:
-            dataset.test_split = test
-        return dataset
-
-def graph_get_split(
-    dataset, mask="train", is_loader=True, batch_size=128, num_workers=0
-):
-    assert hasattr(
-        dataset, "%s_split" % (mask)
-    ), "Given dataset do not have %s split" % (mask)
-    if is_loader:
-        return GraphDataLoader(
-            getattr(dataset, "%s_split" % (mask)),
-            batch_size=batch_size,
-            num_workers=num_workers,
-        )
-    else:
-        return getattr(dataset, "%s_split" % (mask))
-
-
-utils.graph_get_split = graph_get_split
-
-def fixed(**kwargs):
-    return [{
-        'parameterName': k,
-        "type": "FIXED",
-        "value": v
-    } for k, v in kwargs.items()]
-
-if __name__ == '__main__':
-
-    # seed = 100
-    # dataset = build_dataset_from_name('mutag')
-    dataset = GINDataset('MUTAG', True)
-    dataset = DatasetAbstraction([g[0] for g in dataset], [g[1] for g in dataset])
-
-    # 1. split dataset [fix split]
-    dataids = list(range(len(dataset)))
-    random.seed(2021)
-    random.shuffle(dataids)
-    
-    fold = int(len(dataset) * 0.1)
-    train_dataset = dataset[dataids[:fold * 8]]
-    val_dataset = dataset[dataids[fold * 8: fold * 9]]
-    test_dataset = dataset[dataids[fold * 9: ]]
-
-    dataset = DatasetAbstraction.build_from_train_val(train_dataset, val_dataset, test_dataset)
-
-    labels = np.array([x.item() for x in test_dataset.labels])
-    # trainer = GraphClassificationFullTrainer(AutoGIN(), 'cuda:1', init=False)
-
-    accs = []
-    from tqdm import tqdm
-    for seed in tqdm(range(50)):
-        set_seed(seed)
-        solver = AutoGraphClassifier(
-            feature_module=None,
-            graph_models=["gin"],
-            hpo_module='random',
-            ensemble_module=None,
-            device="cuda:1", max_evals=1,
-            trainer_hp_space = fixed(
-                **{
-                    "max_epoch": 100,
-                    "batch_size": 32,
-                    "early_stopping_round": 101,
-                    "lr": 0.0001,
-                    "weight_decay": 1e-4,
-                }
-            ),
-            model_hp_spaces=[
-                fixed(
-                    num_layers = 5,
-                    hidden = [64],
-                    dropout = 0.5,
-                    act = "relu",
-                    eps = "False",
-                    mlp_layers = 2,
-                    neighbor_pooling_type = "sum",
-                    graph_pooling_type = "sum"
-                ),
-            ]
-        )
-        solver.fit(dataset, evaluation_method=['acc'])
-        solver.get_leaderboard().show()
-        out = solver.predict(dataset, mask='test')
-        acc = (out == labels).astype('float').mean()
-        accs.append(acc)
-    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/model_glf/gclf_dgl_topk.py b/test/model_glf/gclf_dgl_topk.py
deleted file mode 100644
index 31f9adb..0000000
--- a/test/model_glf/gclf_dgl_topk.py
+++ /dev/null
@@ -1,169 +0,0 @@
-import os
-import sys
-import logging
-logging.basicConfig(level=logging.INFO)
-from tqdm import tqdm
-
-sys.path.append("../../")
-print(os.getcwd())
-os.environ["AUTOGL_BACKEND"] = "dgl"
-from dgl.data import GINDataset
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-import torch.optim as optim
-
-from gin_helper import Parser, GINDataLoader
-from autogl.module.model import AutoTopkpool
-
-import numpy as np
-from autogl.solver.utils import set_seed
-set_seed(202106)
-
-
-def train(args, net, trainloader, optimizer, criterion, epoch):
-    net.train()
-
-    running_loss = 0
-    total_iters = len(trainloader)
-    # setup the offset to avoid the overlap with mouse cursor
-    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
-
-    for pos, data in zip(bar, trainloader):
-        data = [data[i].to(args.device) for i in range(len(data))]
-        _, labels = data
-        # batch graphs will be shipped to device in forward part of model
-        #labels = labels.to(args.device)
-        #graphs = graphs.to(args.device)
-        #feat = graphs.ndata.pop('attr')
-        #outputs = net(graphs, feat)
-        outputs = net(data)
-
-        loss = criterion(outputs, labels)
-        running_loss += loss.item()
-
-        # backprop
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-
-        # report
-        bar.set_description('epoch-{}'.format(epoch))
-    bar.close()
-    # the final batch will be aligned
-    running_loss = running_loss / total_iters
-
-    return running_loss
-
-
-def eval_net(args, net, dataloader, criterion):
-    net.eval()
-
-    total = 0
-    total_loss = 0
-    total_correct = 0
-
-    for data in dataloader:
-        data = [data[i].to(args.device) for i in range(len(data))]
-        _, labels = data
-        #graphs, labels = data
-        #graphs = graphs.to(args.device)
-        #labels = labels.to(args.device)
-        #feat = graphs.ndata.pop('attr')
-        total += len(labels)
-        #outputs = net(graphs, feat)
-        outputs = net(data)
-        _, predicted = torch.max(outputs.data, 1)
-
-        total_correct += (predicted == labels.data).sum().item()
-        loss = criterion(outputs, labels)
-        # crossentropy(reduce=True) for default
-        total_loss += loss.item() * len(labels)
-
-    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
-
-    net.train()
-
-    return loss, acc
-
-
-def main(args):
-
-    # set up seeds, args.seed supported
-    torch.manual_seed(seed=args.seed)
-    np.random.seed(seed=args.seed)
-
-    is_cuda = not args.disable_cuda and torch.cuda.is_available()
-
-    if is_cuda:
-        args.device = torch.device("cuda:" + str(args.device))
-        torch.cuda.manual_seed_all(seed=args.seed)
-    else:
-        args.device = torch.device("cpu")
-
-    dataset = GINDataset(args.dataset, not args.learn_eps)
-
-    trainloader, validloader = GINDataLoader(
-        dataset, batch_size=args.batch_size, device=args.device,
-        seed=args.seed, shuffle=True,
-        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
-    # or split_name='rand', split_ratio=0.7
-    automodel =  AutoTopkpool(
-                num_classes=dataset.gclasses,
-                num_features=dataset.dim_nfeats,
-                device=args.device,
-                init=True)
-    model = automodel.model
-    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-    optimizer = optim.Adam(model.parameters(), lr=args.lr)
-    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
-
-    # it's not cost-effective to hanle the cursor and init 0
-    # https://stackoverflow.com/a/23121189
-    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
-    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
-    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
-
-    for epoch, _, _ in zip(tbar, vbar, lrbar):
-
-        train(args, model, trainloader, optimizer, criterion, epoch)
-        scheduler.step()
-
-        train_loss, train_acc = eval_net(
-            args, model, trainloader, criterion)
-        tbar.set_description(
-            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(train_loss, 100. * train_acc))
-
-        valid_loss, valid_acc = eval_net(
-            args, model, validloader, criterion)
-        vbar.set_description(
-            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(valid_loss, 100. * valid_acc))
-
-        if not args.filename == "":
-            with open(args.filename, 'a') as f:
-                f.write('%s' % (
-                    args.dataset,
-                ))
-                f.write("\n")
-                f.write("%f %f %f %f" % (
-                    train_loss,
-                    train_acc,
-                    valid_loss,
-                    valid_acc
-                ))
-                f.write("\n")
-
-
-    tbar.close()
-    vbar.close()
-    lrbar.close()
-
-
-if __name__ == '__main__':
-    args = Parser(description='GIN').args
-    print('show all arguments configuration...')
-    print(args)
-    main(args)
-
diff --git a/test/model_glf/gclf_dgl_trainer_dataset.py b/test/model_glf/gclf_dgl_trainer_dataset.py
deleted file mode 100644
index f0a1ad3..0000000
--- a/test/model_glf/gclf_dgl_trainer_dataset.py
+++ /dev/null
@@ -1,81 +0,0 @@
-import sys
-
-sys.path.append('../../')
-
-import random
-import numpy as np
-
-from autogl.datasets import build_dataset_from_name, utils
-from autogl.module.train import GraphClassificationFullTrainer
-from autogl.solver.utils import set_seed
-import logging
-
-logging.basicConfig(level=logging.ERROR)
-
-def fixed(**kwargs):
-    return [{
-        'parameterName': k,
-        "type": "FIXED",
-        "value": v
-    } for k, v in kwargs.items()]
-
-if __name__ == '__main__':
-
-    # seed = 100
-    dataset = build_dataset_from_name('mutag')
-    
-    # 1. split dataset [fix split]
-    dataids = list(range(len(dataset)))
-    random.seed(2021)
-    random.shuffle(dataids)
-    
-    fold = int(len(dataset) * 0.1)
-    train_index = dataids[:fold * 8]
-    val_index = dataids[fold * 8: fold * 9]
-    test_index = dataids[fold * 9: ]
-    dataset.train_index = train_index
-    dataset.val_index = val_index
-    dataset.test_index = test_index
-
-    labels = np.array([data.data['label'].item() for data in dataset.test_split])
-
-    dataset = utils.conversion.general_static_graphs_to_dgl_dataset(dataset)
-
-    accs = []
-    from tqdm import tqdm
-    for seed in tqdm(range(10)):
-        set_seed(seed)
-
-        trainer = GraphClassificationFullTrainer(
-            model='gin',
-            device='cuda:1',
-            init=False,
-            num_features=dataset[0][0].ndata['feat'].size(1),
-            num_classes=max([graph[1].item() for graph in dataset]) + 1,
-            loss='cross_entropy'
-        ).duplicate_from_hyper_parameter(
-            {
-                # hp from trainer
-                "max_epoch": 100,
-                "batch_size": 32, 
-                "early_stopping_round": 101, 
-                "lr": 0.0001, 
-                "weight_decay": 0,
-
-                # hp from model
-                "num_layers": 5,
-                "hidden": [64],
-                "dropout": 0.5,
-                "act": "relu",
-                "eps": "False",
-                "mlp_layers": 2,
-                "neighbor_pooling_type": "sum",
-                "graph_pooling_type": "sum"
-            }
-        )
-
-        trainer.train(dataset, False)
-        out = trainer.predict(dataset, 'test').detach().cpu().numpy()
-        acc = (out == labels).astype('float').mean()
-        accs.append(acc)
-    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/model_glf/gclf_pyg_trainer_dataset.py b/test/model_glf/gclf_pyg_trainer_dataset.py
deleted file mode 100644
index 2bfc6a9..0000000
--- a/test/model_glf/gclf_pyg_trainer_dataset.py
+++ /dev/null
@@ -1,84 +0,0 @@
-import sys
-import os
-
-os.environ["AUTOGL_BACKEND"] = "pyg"
-sys.path.append('../../')
-
-import random
-import numpy as np
-
-from autogl.datasets import build_dataset_from_name, utils
-from autogl.module.train import GraphClassificationFullTrainer
-from autogl.solver.utils import set_seed
-import logging
-
-logging.basicConfig(level=logging.ERROR)
-
-def fixed(**kwargs):
-    return [{
-        'parameterName': k,
-        "type": "FIXED",
-        "value": v
-    } for k, v in kwargs.items()]
-
-if __name__ == '__main__':
-
-    # seed = 100
-    dataset = build_dataset_from_name('mutag')
-    
-    # 1. split dataset [fix split]
-    dataids = list(range(len(dataset)))
-    random.seed(2021)
-    random.shuffle(dataids)
-    
-    fold = int(len(dataset) * 0.1)
-    train_index = dataids[:fold * 8]
-    val_index = dataids[fold * 8: fold * 9]
-    test_index = dataids[fold * 9: ]
-    dataset.train_index = train_index
-    dataset.val_index = val_index
-    dataset.test_index = test_index
-
-    labels = np.array([data.data['y'].item() for data in dataset.test_split])
-
-    dataset = utils.conversion.general_static_graphs_to_pyg_dataset(dataset)
-
-    accs = []
-    from tqdm import tqdm
-    for seed in tqdm(range(10)):
-        set_seed(seed)
-
-        trainer = GraphClassificationFullTrainer(
-            model='gin',
-            device='cuda:2',
-            init=False,
-            num_features=dataset[0].x.size(1),
-            num_classes=max([data.y.item() for data in dataset]) + 1,
-            loss='cross_entropy',
-            feval=('acc')
-        ).duplicate_from_hyper_parameter(
-            {
-                # hp from trainer
-                "max_epoch": 100,
-                "batch_size": 32, 
-                "early_stopping_round": 101, 
-                "lr": 0.0001, 
-                "weight_decay": 0,
-
-                # hp from model
-                "num_layers": 5,
-                "hidden": [64,64,64,64],
-                "dropout": 0.5,
-                "act": "relu",
-                "eps": "False",
-                "mlp_layers": 2,
-                "neighbor_pooling_type": "sum",
-                "graph_pooling_type": "sum"
-            }
-        )
-
-        trainer.train(dataset, False)
-        out = trainer.predict(dataset, 'test').detach().cpu().numpy()
-        acc = (out == labels).astype('float').mean()
-        accs.append(acc)
-    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/model_glf/gin_helper.py b/test/model_glf/gin_helper.py
deleted file mode 100644
index 0637884..0000000
--- a/test/model_glf/gin_helper.py
+++ /dev/null
@@ -1,156 +0,0 @@
-"""
-Gin helper for testing
-"""
-
-import math
-import numpy as np
-from torch.utils.data.sampler import SubsetRandomSampler
-from sklearn.model_selection import StratifiedKFold
-from dgl.dataloading import GraphDataLoader
-import argparse
-
-class GINDataLoader():
-    def __init__(self,
-                 dataset,
-                 batch_size,
-                 device,
-                 collate_fn=None,
-                 seed=0,
-                 shuffle=True,
-                 split_name='fold10',
-                 fold_idx=0,
-                 split_ratio=0.7):
-
-        self.shuffle = shuffle
-        self.seed = seed
-        self.kwargs = {'pin_memory': True} if 'cuda' in device.type else {}
-
-        labels = [l for _, l in dataset]
-
-        if split_name == 'fold10':
-            train_idx, valid_idx = self._split_fold10(
-                labels, fold_idx, seed, shuffle)
-        elif split_name == 'rand':
-            train_idx, valid_idx = self._split_rand(
-                labels, split_ratio, seed, shuffle)
-        else:
-            raise NotImplementedError()
-
-        train_sampler = SubsetRandomSampler(train_idx)
-        valid_sampler = SubsetRandomSampler(valid_idx)
-
-        self.train_loader = GraphDataLoader(
-            dataset, sampler=train_sampler,
-            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
-        self.valid_loader = GraphDataLoader(
-            dataset, sampler=valid_sampler,
-            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
-
-    def train_valid_loader(self):
-        return self.train_loader, self.valid_loader
-
-    def _split_fold10(self, labels, fold_idx=0, seed=0, shuffle=True):
-        ''' 10 flod '''
-        assert 0 <= fold_idx and fold_idx < 10, print(
-            "fold_idx must be from 0 to 9.")
-
-        skf = StratifiedKFold(n_splits=10, shuffle=shuffle, random_state=seed)
-        idx_list = []
-        for idx in skf.split(np.zeros(len(labels)), labels):    # split(x, y)
-            idx_list.append(idx)
-        train_idx, valid_idx = idx_list[fold_idx]
-
-        print(
-            "train_set : test_set = %d : %d",
-            len(train_idx), len(valid_idx))
-
-        return train_idx, valid_idx
-
-    def _split_rand(self, labels, split_ratio=0.7, seed=0, shuffle=True):
-        num_entries = len(labels)
-        indices = list(range(num_entries))
-        np.random.seed(seed)
-        np.random.shuffle(indices)
-        split = int(math.floor(split_ratio * num_entries))
-        train_idx, valid_idx = indices[:split], indices[split:]
-
-        print(
-            "train_set : test_set = %d : %d",
-            len(train_idx), len(valid_idx))
-
-        return train_idx, valid_idx
-
-class Parser():
-
-    def __init__(self, description):
-        '''
-           arguments parser
-        '''
-        self.parser = argparse.ArgumentParser(description=description)
-        self.args = None
-        self._parse()
-
-    def _parse(self):
-        # dataset
-        self.parser.add_argument(
-            '--dataset', type=str, default="MUTAG",
-            choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI'],
-            help='name of dataset (default: MUTAG)')
-        self.parser.add_argument(
-            '--batch_size', type=int, default=32,
-            help='batch size for training and validation (default: 32)')
-        self.parser.add_argument(
-            '--fold_idx', type=int, default=0,
-            help='the index(<10) of fold in 10-fold validation.')
-        self.parser.add_argument(
-            '--filename', type=str, default="",
-            help='output file')
-
-        # device
-        self.parser.add_argument(
-            '--disable-cuda', action='store_true',
-            help='Disable CUDA')
-        self.parser.add_argument(
-            '--device', type=int, default=0,
-            help='which gpu device to use (default: 0)')
-
-        # net
-        self.parser.add_argument(
-            '--num_layers', type=int, default=5,
-            help='number of layers (default: 5)')
-        self.parser.add_argument(
-            '--num_mlp_layers', type=int, default=2,
-            help='number of MLP layers(default: 2). 1 means linear model.')
-        self.parser.add_argument(
-            '--hidden_dim', type=int, default=64,
-            help='number of hidden units (default: 64)')
-
-        # graph
-        self.parser.add_argument(
-            '--graph_pooling_type', type=str,
-            default="sum", choices=["sum", "mean", "max"],
-            help='type of graph pooling: sum, mean or max')
-        self.parser.add_argument(
-            '--neighbor_pooling_type', type=str,
-            default="sum", choices=["sum", "mean", "max"],
-            help='type of neighboring pooling: sum, mean or max')
-        self.parser.add_argument(
-            '--learn_eps', action="store_true",
-            help='learn the epsilon weighting')
-
-        # learning
-        self.parser.add_argument(
-            '--seed', type=int, default=0,
-            help='random seed (default: 0)')
-        self.parser.add_argument(
-            '--epochs', type=int, default=100,
-            help='number of epochs to train (default: 100)')
-        self.parser.add_argument(
-            '--lr', type=float, default=0.01,
-            help='learning rate (default: 0.01)')
-        self.parser.add_argument(
-            '--final_dropout', type=float, default=0.5,
-            help='final layer dropout (default: 0.5)')
-
-        # done
-        self.args = self.parser.parse_args()
diff --git a/test/model_glf/gclf_dgl_origin.py b/test/performance/graph_classification/dgl/dgl.py
similarity index 97%
rename from test/model_glf/gclf_dgl_origin.py
rename to test/performance/graph_classification/dgl/dgl.py
index ebc71c9..03e96c4 100644
--- a/test/model_glf/gclf_dgl_origin.py
+++ b/test/performance/graph_classification/dgl/dgl.py
@@ -1,4 +1,11 @@
-import sys
+"""
+Performance check of DGL original dataset, model, trainer setting
+
+Borrowed from DGL official examples: https://github.com/dmlc/dgl/tree/master/examples/pytorch/gin
+
+TopkPool is not supported currently
+"""
+
 from dgl.dataloading.pytorch.dataloader import GraphDataLoader
 import numpy as np
 from tqdm import tqdm
@@ -10,7 +17,6 @@ import torch.nn as nn
 import torch.optim as optim
 
 from dgl.data import GINDataset
-from gin_helper import Parser, GINDataLoader
 
 import torch
 import torch.nn as nn
@@ -262,7 +268,7 @@ def eval_net(net, dataloader, device):
 
 def main():
 
-    device = torch.device('cuda:1')
+    device = torch.device('cuda')
     dataset_ = GINDataset('MUTAG', False)
     dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
     
@@ -276,13 +282,12 @@ def main():
     val_dataset = dataset[dataids[fold * 8: fold * 9]]
     test_dataset = dataset[dataids[fold * 9: ]]
 
-    trainloader = GraphDataLoader(train_dataset, batch_size=32, shuffle=True)
+    trainloader = GraphDataLoader(train_dataset, batch_size=32, shuffle=False)
     valloader = GraphDataLoader(val_dataset, batch_size=32, shuffle=False)
     testloader = GraphDataLoader(test_dataset, batch_size=32, shuffle=False)
 
     accs = []
-    from tqdm import tqdm
-    for seed in tqdm(range(50)):
+    for seed in tqdm(range(10)):
         # set up seeds, args.seed supported
         torch.manual_seed(seed=seed)
         np.random.seed(seed=seed)
diff --git a/test/model_glf/gclf_dgl_model.py b/test/performance/graph_classification/dgl/model.py
similarity index 65%
rename from test/model_glf/gclf_dgl_model.py
rename to test/performance/graph_classification/dgl/model.py
index ea41789..140f0aa 100644
--- a/test/model_glf/gclf_dgl_model.py
+++ b/test/performance/graph_classification/dgl/model.py
@@ -1,5 +1,9 @@
-import sys
-sys.path.append('../../')
+"""
+Performance check of AutoGL model + DGL (dataset + trainer)
+"""
+
+import os
+os.environ["AUTOGL_BACKEND"] = "dgl"
 
 from dgl.dataloading.pytorch.dataloader import GraphDataLoader
 import numpy as np
@@ -16,7 +20,9 @@ from dgl.data import GINDataset
 import torch
 import torch.nn as nn
 from autogl.module.model.dgl.gin import AutoGIN
-
+from autogl.module.model.dgl.topkpool import AutoTopkpool
+from autogl.solver.utils import set_seed
+import argparse
 
 class DatasetAbstraction():
     def __init__(self, graphs, labels):
@@ -108,15 +114,15 @@ def eval_net(net, dataloader, device):
     return acc
 
 
-def main():
+def main(args):
 
-    device = torch.device('cuda:1')
-    dataset_ = GINDataset('MUTAG', False)
+    device = torch.device(args.device)
+    dataset_ = GINDataset(args.dataset, False)
     dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
     
     # 1. split dataset [fix split]
     dataids = list(range(len(dataset)))
-    random.seed(2021)
+    random.seed(args.dataset_seed)
     random.shuffle(dataids)
     
     fold = int(len(dataset) * 0.1)
@@ -124,44 +130,63 @@ def main():
     val_dataset = dataset[dataids[fold * 8: fold * 9]]
     test_dataset = dataset[dataids[fold * 9: ]]
 
-    trainloader = GraphDataLoader(train_dataset, batch_size=32, shuffle=True)
-    valloader = GraphDataLoader(val_dataset, batch_size=32, shuffle=False)
-    testloader = GraphDataLoader(test_dataset, batch_size=32, shuffle=False)
+    trainloader = GraphDataLoader(train_dataset, batch_size=args.batch_size, shuffle=False)
+    valloader = GraphDataLoader(val_dataset, batch_size=args.batch_size, shuffle=False)
+    testloader = GraphDataLoader(test_dataset, batch_size=args.batch_size, shuffle=False)
 
     accs = []
-    for seed in tqdm(range(50)):
+    for seed in tqdm(range(args.repeat)):
         # set up seeds, args.seed supported
-        torch.manual_seed(seed=seed)
-        np.random.seed(seed=seed)
-
-        model = AutoGIN(
-            num_features=dataset_.dim_nfeats,
-            num_classes=dataset_.gclasses,
-            device=device,
-        ).from_hyper_parameter(
-            {
-                # hp from model
+        set_seed(seed)
+
+        if args.model == 'gin':
+            model = AutoGIN(
+                num_features=dataset_.dim_nfeats,
+                num_classes=dataset_.gclasses,
+                device=device,
+            ).from_hyper_parameter({
                 "num_layers": 5,
-                "hidden": [64,64,64,64],
+                "hidden": [64],
                 "dropout": 0.5,
                 "act": "relu",
                 "eps": "False",
                 "mlp_layers": 2,
                 "neighbor_pooling_type": "sum",
                 "graph_pooling_type": "sum"
-            }
-        ).model
+            }).model
+        elif args.model == 'topkpool':
+            model = AutoTopkpool(
+                num_features=dataset_.dim_nfeats,
+                num_classes=dataset_.gclasses,
+                device=device,
+            ).from_hyper_parameter({
+                "num_layers": 5,
+                "hidden": [64],
+                "dropout": 0.5
+            }).model
 
         model = model.to(device)
 
         criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-        optimizer = optim.Adam(model.parameters(), lr=0.0001)
+        optimizer = optim.Adam(model.parameters(), lr=args.lr)
 
-        model = train(model, trainloader, valloader, optimizer, criterion, 100, device)
+        model = train(model, trainloader, valloader, optimizer, criterion, args.epoch, device)
         acc = eval_net(model, testloader, device)
         accs.append(acc)
 
     print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
 
 if __name__ == '__main__':
-    main()
+    parser = argparse.ArgumentParser('model parser')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K'], default='MUTAG')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
+    main(args)
diff --git a/test/performance/graph_classification/dgl/solver.py b/test/performance/graph_classification/dgl/solver.py
new file mode 100644
index 0000000..0727232
--- /dev/null
+++ b/test/performance/graph_classification/dgl/solver.py
@@ -0,0 +1,95 @@
+"""
+Performance check of AutoGL Solver
+"""
+
+import os
+os.environ["AUTOGL_BACKEND"] = "dgl"
+
+import random
+import numpy as np
+from tqdm import tqdm
+
+from autogl.solver import AutoGraphClassifier
+from autogl.datasets import build_dataset_from_name
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('dgl solver')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=[x.lower() for x in ['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K']], default='mutag')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = build_dataset_from_name(args.dataset)
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(args.dataset_seed)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    dataset.train_index = dataids[:fold * 8]
+    dataset.val_index = dataids[fold * 8: fold * 9]
+    dataset.test_index = dataids[fold * 9: ]
+
+    labels = np.array([x.data['label'].item() for x in dataset.test_split])
+
+    accs = []
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+        solver = AutoGraphClassifier(
+            feature_module=None,
+            graph_models=[args.model],
+            hpo_module='random',
+            ensemble_module=None,
+            device=args.device, max_evals=1,
+            trainer_hp_space = fixed(**{
+                    # hp from trainer
+                    "max_epoch": 100,
+                    "batch_size": 32,
+                    "early_stopping_round": 101,
+                    "lr": 0.0001,
+                    "weight_decay": 0,
+            }),
+            model_hp_spaces=[
+                fixed(**{
+                    # hp from model
+                    "num_layers": 5,
+                    "hidden": [64],
+                    "dropout": 0.5,
+                    "act": "relu",
+                    "eps": "False",
+                    "mlp_layers": 2,
+                    "neighbor_pooling_type": "sum",
+                    "graph_pooling_type": "sum"
+                }) if args.model == 'gin' else fixed(**{
+                    "num_layers": 5,
+                    "hidden": [64],
+                    "dropout": 0.5
+                }),
+            ]
+        )
+        solver.fit(dataset, evaluation_method=['acc'])
+        out = solver.predict(dataset, mask='test')
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/model_glf/gclf_dgl_trainer.py b/test/performance/graph_classification/dgl/trainer.py
similarity index 66%
rename from test/model_glf/gclf_dgl_trainer.py
rename to test/performance/graph_classification/dgl/trainer.py
index 7b22e82..6f581ba 100644
--- a/test/model_glf/gclf_dgl_trainer.py
+++ b/test/performance/graph_classification/dgl/trainer.py
@@ -1,6 +1,9 @@
-import sys
+"""
+Performance check of AutoGL (trainer + model) + DGL dataset
+"""
 
-sys.path.append('../../')
+import os
+os.environ["AUTOGL_BACKEND"] = "dgl"
 
 import torch
 import random
@@ -8,9 +11,8 @@ import numpy as np
 from dgl.data import GINDataset
 from dgl.dataloading import GraphDataLoader
 
-from autogl.datasets import utils, build_dataset_from_name
+from autogl.datasets import utils
 from autogl.module.train import GraphClassificationFullTrainer
-from autogl.module.model.dgl.gin import AutoGIN
 from autogl.solver.utils import set_seed
 import logging
 
@@ -70,23 +72,29 @@ def graph_get_split(
 
 utils.graph_get_split = graph_get_split
 
-def fixed(**kwargs):
-    return [{
-        'parameterName': k,
-        "type": "FIXED",
-        "value": v
-    } for k, v in kwargs.items()]
-
 if __name__ == '__main__':
 
+    import argparse
+    parser = argparse.ArgumentParser('dgl trainer')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K'], default='MUTAG')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
     # seed = 100
     # dataset = build_dataset_from_name('mutag')
-    dataset_ = GINDataset('MUTAG', False)
+    dataset_ = GINDataset(args.dataset, False)
     dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
 
     # 1. split dataset [fix split]
     dataids = list(range(len(dataset)))
-    random.seed(2021)
+    random.seed(args.dataset_seed)
     random.shuffle(dataids)
     
     fold = int(len(dataset) * 0.1)
@@ -99,35 +107,45 @@ if __name__ == '__main__':
     labels = np.array([x.item() for x in test_dataset.labels])
 
     accs = []
+
+    if args.model == 'gin':
+        model_hp = {
+            "num_layers": 5,
+            "hidden": [64],
+            "dropout": 0.5,
+            "act": "relu",
+            "eps": "False",
+            "mlp_layers": 2,
+            "neighbor_pooling_type": "sum",
+            "graph_pooling_type": "sum"
+        }
+    elif args.model == 'topkpool':
+        model_hp = {
+            "num_layers": 5,
+            "hidden": [64],
+            "dropout": 0.5
+        }
+
     from tqdm import tqdm
     for seed in tqdm(range(10)):
         set_seed(seed)
 
         trainer = GraphClassificationFullTrainer(
-            model='gin',
-            device='cuda:1',
+            model=args.model,
+            device='cuda',
             init=False,
             num_features=dataset.graph[0].ndata['feat'].size(1),
             num_classes=dataset.gclasses,
-            loss='cross_entropy'
-        ).duplicate_from_hyper_parameter(
-            {
+            loss='cross_entropy',
+            feval = ('acc')
+        ).duplicate_from_hyper_parameter({
                 # hp from trainer
-                "max_epoch": 100,
-                "batch_size": 32, 
-                "early_stopping_round": 101, 
-                "lr": 0.0001, 
+                "max_epoch": args.epoch,
+                "batch_size": args.batch_size, 
+                "early_stopping_round": args.epoch + 1, 
+                "lr": args.lr, 
                 "weight_decay": 0,
-
-                # hp from model
-                "num_layers": 5,
-                "hidden": [64],
-                "dropout": 0.5,
-                "act": "relu",
-                "eps": "False",
-                "mlp_layers": 2,
-                "neighbor_pooling_type": "sum",
-                "graph_pooling_type": "sum"
+                **model_hp
             }
         )
 
diff --git a/test/performance/graph_classification/dgl/trainer_dataset.py b/test/performance/graph_classification/dgl/trainer_dataset.py
new file mode 100644
index 0000000..2eced3a
--- /dev/null
+++ b/test/performance/graph_classification/dgl/trainer_dataset.py
@@ -0,0 +1,102 @@
+"""
+Performance check of AutoGL (trainer + model + dataset)
+"""
+
+import os
+os.environ["AUTOGL_BACKEND"] = "dgl"
+
+import random
+import numpy as np
+
+from autogl.datasets import build_dataset_from_name, utils
+from autogl.module.train import GraphClassificationFullTrainer
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('dgl dataset')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=[x.lower() for x in ['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K']], default='mutag')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = build_dataset_from_name(args.dataset)
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(args.dataset_seed)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_index = dataids[:fold * 8]
+    val_index = dataids[fold * 8: fold * 9]
+    test_index = dataids[fold * 9: ]
+    dataset.train_index = train_index
+    dataset.val_index = val_index
+    dataset.test_index = test_index
+
+    labels = np.array([data.data['label'].item() for data in dataset.test_split])
+
+    dataset = utils.conversion.general_static_graphs_to_dgl_dataset(dataset)
+
+    accs = []
+
+    if args.model == 'gin':
+        model_hp = {
+            "num_layers": 5,
+            "hidden": [64],
+            "dropout": 0.5,
+            "act": "relu",
+            "eps": "False",
+            "mlp_layers": 2,
+            "neighbor_pooling_type": "sum",
+            "graph_pooling_type": "sum"
+        }
+    elif args.model == 'topkpool':
+        model_hp = {
+            "num_layers": 5,
+            "hidden": [64],
+            "dropout": 0.5
+        }
+
+    from tqdm import tqdm
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        trainer = GraphClassificationFullTrainer(
+            model=args.model,
+            device=args.device,
+            init=False,
+            num_features=dataset[0][0].ndata['feat'].size(1),
+            num_classes=max([graph[1].item() for graph in dataset]) + 1,
+            loss='cross_entropy',
+            feval=('acc'),
+        ).duplicate_from_hyper_parameter(
+            {
+                # hp from trainer
+                "max_epoch": args.epoch,
+                "batch_size": args.batch_size, 
+                "early_stopping_round": args.epoch + 1, 
+                "lr": args.lr, 
+                "weight_decay": 0,
+
+                **model_hp
+            }
+        )
+
+        trainer.train(dataset, False)
+        out = trainer.predict(dataset, 'test').detach().cpu().numpy()
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/graph_classification/pyg/model.py b/test/performance/graph_classification/pyg/model.py
new file mode 100644
index 0000000..8f82d1c
--- /dev/null
+++ b/test/performance/graph_classification/pyg/model.py
@@ -0,0 +1,135 @@
+"""
+Performance check of AutoGL model + PYG (trainer + dataset)
+"""
+import os
+import random
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "pyg"
+
+import torch
+import torch.nn.functional as F
+from torch_geometric.datasets import TUDataset
+from torch_geometric.data import DataLoader
+from autogl.module.model.pyg import AutoGIN, AutoTopkpool
+from autogl.datasets import utils
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def test(model, loader, args):
+    model.eval()
+
+    correct = 0
+    for data in loader:
+        data = data.to(args.device)
+        output = model(data)
+        pred = output.max(dim=1)[1]
+        correct += pred.eq(data.y).sum().item()
+    return correct / len(loader.dataset)
+
+def train(model, train_loader, val_loader, args):
+    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr)
+
+    parameters = model.state_dict()
+    best_acc = 0.
+    for epoch in range(args.epoch):
+        model.train()
+        for data in train_loader:
+            data = data.to(args.device)
+            optimizer.zero_grad()
+            output = model(data)
+            loss = F.nll_loss(output, data.y)
+            loss.backward()
+            optimizer.step()
+
+        val_acc = test(model, val_loader, args)
+        if val_acc > best_acc:
+            best_acc = val_acc
+            parameters = model.state_dict()
+    
+    model.load_state_dict(parameters)
+    return model
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg trainer')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K'], default='MUTAG')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = TUDataset(os.path.expanduser('~/.pyg'), args.dataset)
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(args.dataset_seed)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_index = dataids[:fold * 8]
+    val_index = dataids[fold * 8: fold * 9]
+    test_index = dataids[fold * 9: ]
+    dataset.train_index = train_index
+    dataset.val_index = val_index
+    dataset.test_index = test_index
+    dataset.train_split = dataset[dataset.train_index]
+    dataset.val_split = dataset[dataset.val_index]
+    dataset.test_split = dataset[dataset.test_index]
+
+    labels = np.array([data.y.item() for data in dataset.test_split])
+
+    train_loader = DataLoader(dataset.train_split, batch_size=args.batch_size)
+    val_loader = DataLoader(dataset.val_split, batch_size=args.batch_size)
+    test_loader = DataLoader(dataset.test_split, batch_size=args.batch_size)
+    
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        if args.model == 'gin':
+            model = AutoGIN(
+                num_features=dataset.num_node_features,
+                num_classes=dataset.num_classes,
+                num_graph_features=0,
+                init=False
+            ).from_hyper_parameter({
+                # hp from model
+                "num_layers": 5,
+                "hidden": [64,64,64,64],
+                "dropout": 0.5,
+                "act": "relu",
+                "eps": "False",
+                "mlp_layers": 2,
+                "neighbor_pooling_type": "sum",
+                "graph_pooling_type": "sum"
+            }).model
+        elif args.model == 'topkpool':
+            model = AutoTopkpool(
+                num_features=dataset.num_node_features,
+                num_classes=dataset.num_classes,
+                num_graph_features=0,
+                init=False
+            ).from_hyper_parameter({
+                "ratio": 0.8,
+                "dropout": 0.5,
+                "act": "relu"
+            }).model
+        
+        model.to(args.device)
+
+        train(model, train_loader, val_loader, args)
+        acc = test(model, test_loader, args)
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/graph_classification/pyg/pyg.py b/test/performance/graph_classification/pyg/pyg.py
new file mode 100644
index 0000000..30105d8
--- /dev/null
+++ b/test/performance/graph_classification/pyg/pyg.py
@@ -0,0 +1,196 @@
+"""
+Performance check of PYG (model + trainer + dataset)
+"""
+import os
+import random
+import numpy as np
+from tqdm import tqdm
+import torch
+import torch.nn.functional as F
+from torch.nn import Sequential, Linear, ReLU
+from torch_geometric.datasets import TUDataset
+from torch_geometric.data import DataLoader
+from torch_geometric.nn import GINConv, global_add_pool, GraphConv, TopKPooling
+from torch_geometric.nn import global_mean_pool as gap, global_max_pool as gmp
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+class GIN(torch.nn.Module):
+    def __init__(self):
+        super(GIN, self).__init__()
+
+        num_features = dataset.num_features
+        dim = 32
+
+        nn1 = Sequential(Linear(num_features, dim), ReLU(), Linear(dim, dim))
+        self.conv1 = GINConv(nn1)
+        self.bn1 = torch.nn.BatchNorm1d(dim)
+
+        nn2 = Sequential(Linear(dim, dim), ReLU(), Linear(dim, dim))
+        self.conv2 = GINConv(nn2)
+        self.bn2 = torch.nn.BatchNorm1d(dim)
+
+        nn3 = Sequential(Linear(dim, dim), ReLU(), Linear(dim, dim))
+        self.conv3 = GINConv(nn3)
+        self.bn3 = torch.nn.BatchNorm1d(dim)
+
+        nn4 = Sequential(Linear(dim, dim), ReLU(), Linear(dim, dim))
+        self.conv4 = GINConv(nn4)
+        self.bn4 = torch.nn.BatchNorm1d(dim)
+
+        nn5 = Sequential(Linear(dim, dim), ReLU(), Linear(dim, dim))
+        self.conv5 = GINConv(nn5)
+        self.bn5 = torch.nn.BatchNorm1d(dim)
+
+        self.fc1 = Linear(dim, dim)
+        self.fc2 = Linear(dim, dataset.num_classes)
+
+    def forward(self, x, edge_index, batch):
+        x = F.relu(self.conv1(x, edge_index))
+        x = self.bn1(x)
+        x = F.relu(self.conv2(x, edge_index))
+        x = self.bn2(x)
+        x = F.relu(self.conv3(x, edge_index))
+        x = self.bn3(x)
+        x = F.relu(self.conv4(x, edge_index))
+        x = self.bn4(x)
+        x = F.relu(self.conv5(x, edge_index))
+        x = self.bn5(x)
+        x = global_add_pool(x, batch)
+        x = F.relu(self.fc1(x))
+        x = F.dropout(x, p=0.5, training=self.training)
+        x = self.fc2(x)
+        return F.log_softmax(x, dim=-1)
+
+class TopKPool(torch.nn.Module):
+    def __init__(self):
+        super(TopKPool, self).__init__()
+
+        self.conv1 = GraphConv(dataset.num_features, 128)
+        self.pool1 = TopKPooling(128, ratio=0.8)
+        self.conv2 = GraphConv(128, 128)
+        self.pool2 = TopKPooling(128, ratio=0.8)
+        self.conv3 = GraphConv(128, 128)
+        self.pool3 = TopKPooling(128, ratio=0.8)
+
+        self.lin1 = torch.nn.Linear(256, 128)
+        self.lin2 = torch.nn.Linear(128, 64)
+        self.lin3 = torch.nn.Linear(64, dataset.num_classes)
+
+    def forward(self, data):
+        x, edge_index, batch = data.x, data.edge_index, data.batch
+
+        x = F.relu(self.conv1(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool1(x, edge_index, None, batch)
+        x1 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = F.relu(self.conv2(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool2(x, edge_index, None, batch)
+        x2 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = F.relu(self.conv3(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool3(x, edge_index, None, batch)
+        x3 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = x1 + x2 + x3
+
+        x = F.relu(self.lin1(x))
+        x = F.dropout(x, p=0.5, training=self.training)
+        x = F.relu(self.lin2(x))
+        x = F.log_softmax(self.lin3(x), dim=-1)
+
+        return x
+
+def test(model, loader, args):
+    model.eval()
+
+    correct = 0
+    for data in loader:
+        data = data.to(args.device)
+        output = model(data)
+        pred = output.max(dim=1)[1]
+        correct += pred.eq(data.y).sum().item()
+    return correct / len(loader.dataset)
+
+def train(model, train_loader, val_loader, args):
+    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr)
+
+    parameters = model.state_dict()
+    best_acc = 0.
+    for epoch in range(args.epoch):
+        model.train()
+        for data in train_loader:
+            data = data.to(args.device)
+            optimizer.zero_grad()
+            output = model(data)
+            loss = F.nll_loss(output, data.y)
+            loss.backward()
+            optimizer.step()
+
+        val_acc = test(model, val_loader, args)
+        if val_acc > best_acc:
+            best_acc = val_acc
+            parameters = model.state_dict()
+    
+    model.load_state_dict(parameters)
+    return model
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg trainer')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K'], default='MUTAG')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = TUDataset(os.path.expanduser('~/.pyg'), args.dataset)
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(args.dataset_seed)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_index = dataids[:fold * 8]
+    val_index = dataids[fold * 8: fold * 9]
+    test_index = dataids[fold * 9: ]
+    dataset.train_index = train_index
+    dataset.val_index = val_index
+    dataset.test_index = test_index
+    dataset.train_split = dataset[dataset.train_index]
+    dataset.val_split = dataset[dataset.val_index]
+    dataset.test_split = dataset[dataset.test_index]
+
+    labels = np.array([data.y.item() for data in dataset.test_split])
+
+    train_loader = DataLoader(dataset.train_split, batch_size=args.batch_size)
+    val_loader = DataLoader(dataset.val_split, batch_size=args.batch_size)
+    test_loader = DataLoader(dataset.test_split, batch_size=args.batch_size)
+    
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        torch.manual_seed(seed)
+        np.random.seed(seed)
+        random.seed(seed)
+
+        if args.model == 'gin':
+            model = GIN()
+        elif args.model == 'topkpool':
+            model = TopKPool()
+        
+        model.to(args.device)
+
+        train(model, train_loader, val_loader, args)
+        acc = test(model, test_loader, args)
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/graph_classification/pyg/solver.py b/test/performance/graph_classification/pyg/solver.py
new file mode 100644
index 0000000..975b639
--- /dev/null
+++ b/test/performance/graph_classification/pyg/solver.py
@@ -0,0 +1,107 @@
+"""
+Performance check of AutoGL Solver
+"""
+
+import os
+os.environ["AUTOGL_BACKEND"] = "pyg"
+
+import random
+import numpy as np
+from tqdm import tqdm
+
+from autogl.solver import AutoGraphClassifier
+from autogl.datasets import build_dataset_from_name, utils
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def graph_get_split(dataset, mask, is_loader=True, batch_size=128, num_workers=0):
+    out = getattr(dataset, f'{mask}_split')
+    from torch_geometric.data import DataLoader
+    if is_loader:
+        out = DataLoader(out, batch_size, num_workers=num_workers)
+    return out
+
+utils.graph_get_split = graph_get_split
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg solver')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=[x.lower() for x in ['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K']], default='mutag')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = build_dataset_from_name(args.dataset)
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(args.dataset_seed)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    dataset.train_index = dataids[:fold * 8]
+    dataset.val_index = dataids[fold * 8: fold * 9]
+    dataset.test_index = dataids[fold * 9: ]
+    dataset.loss = 'nll_loss'
+
+    labels = np.array([x.data['y'].item() for x in dataset.test_split])
+
+    accs = []
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+        solver = AutoGraphClassifier(
+            feature_module=None,
+            graph_models=[args.model],
+            hpo_module='random',
+            ensemble_module=None,
+            device=args.device, max_evals=1,
+            trainer_hp_space = fixed(
+                **{
+                    # hp from trainer
+                    "max_epoch": args.epoch,
+                    "batch_size": args.batch_size, 
+                    "early_stopping_round": args.epoch + 1, 
+                    "lr": args.lr, 
+                    "weight_decay": 0,
+                }
+            ),
+            model_hp_spaces=[
+                fixed(**{
+                    # hp from model
+                    "num_layers": 5,
+                    "hidden": [64,64,64,64],
+                    "dropout": 0.5,
+                    "act": "relu",
+                    "eps": "False",
+                    "mlp_layers": 2,
+                    "neighbor_pooling_type": "sum",
+                    "graph_pooling_type": "sum"
+                }) if args.model == 'gin' else fixed(**{
+                    "ratio": 0.8,
+                    "dropout": 0.5,
+                    "act": "relu"
+                }),
+            ]
+        )
+        solver.fit(dataset, evaluation_method=['acc'])
+        out = solver.predict(dataset, mask='test')
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/model_glf/gclf_pyg_trainer.py b/test/performance/graph_classification/pyg/trainer.py
similarity index 54%
rename from test/model_glf/gclf_pyg_trainer.py
rename to test/performance/graph_classification/pyg/trainer.py
index a582e9c..39a7db9 100644
--- a/test/model_glf/gclf_pyg_trainer.py
+++ b/test/performance/graph_classification/pyg/trainer.py
@@ -1,10 +1,11 @@
-import sys
+"""
+Performance check of AutoGL trainer + PYG dataset
+"""
+
 import os
 
 os.environ["AUTOGL_BACKEND"] = "pyg"
 
-sys.path.append('../../')
-
 import random
 import numpy as np
 
@@ -34,12 +35,25 @@ utils.graph_get_split = graph_get_split
 
 if __name__ == '__main__':
 
+    import argparse
+    parser = argparse.ArgumentParser('pyg trainer')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K'], default='MUTAG')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
     # seed = 100
-    dataset = TUDataset(os.path.expanduser('~/.pyg'), 'MUTAG')
+    dataset = TUDataset(os.path.expanduser('~/.pyg'), args.dataset)
     
     # 1. split dataset [fix split]
     dataids = list(range(len(dataset)))
-    random.seed(2021)
+    random.seed(args.dataset_seed)
     random.shuffle(dataids)
     
     fold = int(len(dataset) * 0.1)
@@ -56,36 +70,47 @@ if __name__ == '__main__':
     labels = np.array([data.y.item() for data in dataset.test_split])
 
     accs = []
+
+    if args.model == 'gin':
+        model_hp = {
+            # hp from model
+            "num_layers": 5,
+            "hidden": [64,64,64,64],
+            "dropout": 0.5,
+            "act": "relu",
+            "eps": "False",
+            "mlp_layers": 2,
+            "neighbor_pooling_type": "sum",
+            "graph_pooling_type": "sum"
+        }
+    elif args.model == 'topkpool':
+        model_hp = {
+            "ratio": 0.8,
+            "dropout": 0.5,
+            "act": "relu"
+        }
+
     from tqdm import tqdm
-    for seed in tqdm(range(10)):
+    for seed in tqdm(range(args.repeat)):
         set_seed(seed)
 
         trainer = GraphClassificationFullTrainer(
-            model='gin',
-            device='cuda:2',
+            model=args.model,
+            device=args.device,
             init=False,
             num_features=dataset[0].x.size(1),
             num_classes=max([data.y.item() for data in dataset]) + 1,
-            loss='cross_entropy',
+            loss='nll_loss',
             feval=('acc')
         ).duplicate_from_hyper_parameter(
             {
                 # hp from trainer
-                "max_epoch": 100,
-                "batch_size": 32, 
-                "early_stopping_round": 101, 
-                "lr": 0.0001, 
+                "max_epoch": args.epoch,
+                "batch_size": args.batch_size, 
+                "early_stopping_round": args.epoch + 1, 
+                "lr": args.lr, 
                 "weight_decay": 0,
-
-                # hp from model
-                "num_layers": 5,
-                "hidden": [64,64,64,64],
-                "dropout": 0.5,
-                "act": "relu",
-                "eps": "False",
-                "mlp_layers": 2,
-                "neighbor_pooling_type": "sum",
-                "graph_pooling_type": "sum"
+                **model_hp
             }
         )
 
diff --git a/test/performance/graph_classification/pyg/trainer_dataset.py b/test/performance/graph_classification/pyg/trainer_dataset.py
new file mode 100644
index 0000000..f3185ca
--- /dev/null
+++ b/test/performance/graph_classification/pyg/trainer_dataset.py
@@ -0,0 +1,119 @@
+"""
+Performance check of AutGL Trainer + Dataset
+"""
+
+import os
+
+os.environ["AUTOGL_BACKEND"] = "pyg"
+
+import random
+import numpy as np
+
+from autogl.datasets import build_dataset_from_name, utils
+from autogl.module.train import GraphClassificationFullTrainer
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def graph_get_split(dataset, mask, is_loader=True, batch_size=128, num_workers=0):
+    out = getattr(dataset, f'{mask}_split')
+    from torch_geometric.data import DataLoader
+    if is_loader:
+        out = DataLoader(out, batch_size, num_workers=num_workers)
+    return out
+
+utils.graph_get_split = graph_get_split
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg trainer')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=[x.lower() for x in ['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K']], default='mutag')
+    parser.add_argument('--dataset_seed', type=int, default=2021)
+    parser.add_argument('--batch_size', type=int, default=32)
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
+    parser.add_argument('--lr', type=float, default=0.0001)
+    parser.add_argument('--epoch', type=int, default=100)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = build_dataset_from_name(args.dataset)
+    
+    # 1. split dataset [fix split]
+    dataids = list(range(len(dataset)))
+    random.seed(args.dataset_seed)
+    random.shuffle(dataids)
+    
+    fold = int(len(dataset) * 0.1)
+    train_index = dataids[:fold * 8]
+    val_index = dataids[fold * 8: fold * 9]
+    test_index = dataids[fold * 9: ]
+    dataset.train_index = train_index
+    dataset.val_index = val_index
+    dataset.test_index = test_index
+
+    labels = np.array([data.data['y'].item() for data in dataset.test_split])
+
+    dataset = utils.conversion.general_static_graphs_to_pyg_dataset(dataset)
+
+    accs = []
+
+    if args.model == 'gin':
+        model_hp = {
+            # hp from model
+            "num_layers": 5,
+            "hidden": [64,64,64,64],
+            "dropout": 0.5,
+            "act": "relu",
+            "eps": "False",
+            "mlp_layers": 2,
+            "neighbor_pooling_type": "sum",
+            "graph_pooling_type": "sum"
+        }
+    elif args.model == 'topkpool':
+        model_hp = {
+            "ratio": 0.8,
+            "dropout": 0.5,
+            "act": "relu"
+        }
+
+    from tqdm import tqdm
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        trainer = GraphClassificationFullTrainer(
+            model=args.model,
+            device=args.device,
+            init=False,
+            num_features=dataset[0].x.size(1),
+            num_classes=max([data.y.item() for data in dataset]) + 1,
+            loss='nll_loss',
+            feval=('acc')
+        ).duplicate_from_hyper_parameter(
+            {
+                # hp from trainer
+                "max_epoch": 100,
+                "batch_size": 32, 
+                "early_stopping_round": 101, 
+                "lr": 0.0001, 
+                "weight_decay": 0,
+                **model_hp
+            }
+        )
+
+        trainer.train(dataset, False)
+        out = trainer.predict(dataset, 'test').detach().cpu().numpy()
+        acc = (out == labels).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/node_classification/pyg/model.py b/test/performance/node_classification/pyg/model.py
new file mode 100644
index 0000000..0b41844
--- /dev/null
+++ b/test/performance/node_classification/pyg/model.py
@@ -0,0 +1,125 @@
+"""
+Performance check of AutoGL model + PYG (trainer + dataset)
+"""
+import os
+import random
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "pyg"
+
+import torch
+import torch.nn.functional as F
+from torch_geometric.datasets import Planetoid
+import torch_geometric.transforms as T
+from autogl.module.model.pyg import AutoGCN, AutoGAT, AutoSAGE
+from autogl.datasets import utils
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def test(model, data, mask):
+    model.eval()
+
+    if hasattr(model, 'cls_forward'):
+        out = model.cls_forward(data)[mask]
+    else:
+        out = model(data)[mask]
+    pred = out.max(1)[1]
+    acc = pred.eq(data.y[mask]).sum().item() / mask.sum().item()
+    return acc
+
+def train(model, data, args):
+    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
+
+    parameters = model.state_dict()
+    best_acc = 0.
+    for epoch in range(args.epoch):
+        model.train()
+        optimizer.zero_grad()
+        if hasattr(model, 'cls_forward'):
+            output = model.cls_forward(data)
+        else:
+            output = model(data)
+        loss = F.nll_loss(output[data.train_mask], data.y[data.train_mask])
+        loss.backward()
+        optimizer.step()
+
+        val_acc = test(model, data, data.val_mask)
+        if val_acc > best_acc:
+            best_acc = val_acc
+            parameters = model.state_dict()
+    
+    model.load_state_dict(parameters)
+    return model
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg model')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = Planetoid(os.path.expanduser('~/.cache-autogl'), args.dataset, transform=T.NormalizeFeatures())
+    data = dataset[0].to(args.device)
+
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        if args.model == 'gat':
+            model = AutoGAT(
+                num_features=dataset.num_node_features,
+                num_classes=dataset.num_classes,
+                device=args.device,
+                init=False
+            ).from_hyper_parameter({
+                # hp from model
+                "num_layers": 2,
+                "hidden": [8],
+                "heads": 8,
+                "dropout": 0.6,
+                "act": "elu",
+            }).model
+        elif args.model == 'gcn':
+            model = AutoGCN(
+                num_features=dataset.num_node_features,
+                num_classes=dataset.num_classes,
+                device=args.device,
+                init=False
+            ).from_hyper_parameter({
+                "num_layers": 2,
+                "hidden": [16],
+                "dropout": 0.5,
+                "act": "relu"
+            }).model
+        elif args.model == 'sage':
+            model = AutoSAGE(
+                num_features=dataset.num_node_features,
+                num_classes=dataset.num_classes,
+                device=args.device,
+                init=False
+            ).from_hyper_parameter({
+                "num_layers": 2,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "agg": "mean",
+            }).model
+        
+        model.to(args.device)
+
+        train(model, data, args)
+        acc = test(model, data, data.test_mask)
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/node_classification/pyg/pyg.py b/test/performance/node_classification/pyg/pyg.py
new file mode 100644
index 0000000..b3a7628
--- /dev/null
+++ b/test/performance/node_classification/pyg/pyg.py
@@ -0,0 +1,133 @@
+"""
+Performance check of AutoGL model + PYG (trainer + dataset)
+"""
+import os
+import random
+import numpy as np
+from tqdm import tqdm
+
+import torch
+import torch.nn.functional as F
+from torch_geometric.datasets import Planetoid
+import torch_geometric.transforms as T
+from torch_geometric.nn import GCNConv, GATConv, SAGEConv
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+class GCN(torch.nn.Module):
+    def __init__(self, num_features, num_classes):
+        super(GCN, self).__init__()
+        self.conv1 = GCNConv(num_features, 16)
+        self.conv2 = GCNConv(16, num_classes)
+
+    def forward(self, data):
+        x, edge_index, edge_weight = data.x, data.edge_index, data.edge_attr
+        x = F.relu(self.conv1(x, edge_index, edge_weight))
+        x = F.dropout(x, training=self.training)
+        x = self.conv2(x, edge_index, edge_weight)
+        return F.log_softmax(x, dim=1)
+
+class GAT(torch.nn.Module):
+    def __init__(self, num_features, num_classes):
+        super(GAT, self).__init__()
+
+        self.conv1 = GATConv(num_features, 8, heads=8, dropout=0.6)
+        self.conv2 = GATConv(8 * 8, num_classes, heads=1, concat=False,
+                             dropout=0.6)
+
+    def forward(self, data):
+        x, edge_index = data.x, data.edge_index
+        x = F.dropout(x, p=0.6, training=self.training)
+        x = F.elu(self.conv1(x, edge_index))
+        x = F.dropout(x, p=0.6, training=self.training)
+        x = self.conv2(x, edge_index)
+        return F.log_softmax(x, dim=-1)
+
+class SAGE(torch.nn.Module):
+    def __init__(self, num_features, hidden_channels, num_layers, num_classes):
+        super(SAGE, self).__init__()
+        self.num_layers = num_layers
+        self.convs = torch.nn.ModuleList()
+        for i in range(num_layers):
+            inc = outc = hidden_channels
+            if i == 0:
+                inc = num_features
+            if i == num_layers - 1:
+                outc = num_classes
+            self.convs.append(SAGEConv(inc, outc))
+
+    def forward(self, data):
+        x, edge_index = data.x, data.edge_index
+        for i, conv in enumerate(self.convs):
+            x = conv(x, edge_index)
+            if i != self.num_layers - 1:
+                x = x.relu()
+                x = F.dropout(x, p=0.5, training=self.training)
+        return F.log_softmax(x, dim=-1)
+
+def test(model, data, mask):
+    model.eval()
+
+    pred = model(data)[mask].max(1)[1]
+    acc = pred.eq(data.y[mask]).sum().item() / mask.sum().item()
+    return acc
+
+def train(model, data, args):
+    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
+
+    parameters = model.state_dict()
+    best_acc = 0.
+    for epoch in range(args.epoch):
+        model.train()
+        optimizer.zero_grad()
+        output = model(data)
+        loss = F.nll_loss(output[data.train_mask], data.y[data.train_mask])
+        loss.backward()
+        optimizer.step()
+
+        val_acc = test(model, data, data.val_mask)
+        if val_acc > best_acc:
+            best_acc = val_acc
+            parameters = model.state_dict()
+    
+    model.load_state_dict(parameters)
+    return model
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg model')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = Planetoid(os.path.expanduser('~/.cache-autogl'), args.dataset, transform=T.NormalizeFeatures())
+    data = dataset[0].to(args.device)
+
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        np.random.seed(seed)
+        torch.manual_seed(seed)
+
+        if args.model == 'gat':
+            model = GAT(dataset.num_node_features, dataset.num_classes)
+        elif args.model == 'gcn':
+            model = GCN(dataset.num_node_features, dataset.num_classes)
+        elif args.model == 'sage':
+            model = SAGE(dataset.num_node_features, 64, 2, dataset.num_classes)
+        
+        model.to(args.device)
+
+        train(model, data, args)
+        acc = test(model, data, data.test_mask)
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))

From cf822ede2fcca322dc14c8c9dc31f64cd4787c9e Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Thu, 28 Oct 2021 02:23:30 +0000
Subject: [PATCH 55/75] add trainer dataset pcheck

---
 .../module/train/node_classification_full.py  |   4 +-
 .../node_classification/pyg/trainer.py        | 127 ++++++++++++++++++
 .../pyg/trainer_dataset.py                    | 127 ++++++++++++++++++
 3 files changed, 256 insertions(+), 2 deletions(-)
 create mode 100644 test/performance/node_classification/pyg/trainer.py
 create mode 100644 test/performance/node_classification/pyg/trainer_dataset.py

diff --git a/autogl/module/train/node_classification_full.py b/autogl/module/train/node_classification_full.py
index 0a56131..e71fc0c 100644
--- a/autogl/module/train/node_classification_full.py
+++ b/autogl/module/train/node_classification_full.py
@@ -14,7 +14,7 @@ from torch.optim.lr_scheduler import (
 )
 import torch.nn.functional as F
 from ..model import MODEL_DICT, BaseModel
-from ..model.base import ClassificationSupportedSequentialModel
+from ..model.pyg.base import ClassificationSupportedSequentialModel
 from .evaluation import get_feval, Logloss
 from typing import Union
 from copy import deepcopy
@@ -345,7 +345,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
                 mask = data.train_mask
         else:
             mask = data.test_mask
-        ret = self.predict_only(data, mask)[mask]
+        ret = self.predict_only(data, mask) # [mask]
         if in_log_format is True:
             return ret
         else:
diff --git a/test/performance/node_classification/pyg/trainer.py b/test/performance/node_classification/pyg/trainer.py
new file mode 100644
index 0000000..6c6c1da
--- /dev/null
+++ b/test/performance/node_classification/pyg/trainer.py
@@ -0,0 +1,127 @@
+"""
+Performance check of AutoGL trainer + PYG dataset
+"""
+import os
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "pyg"
+
+import torch
+import torch.nn.functional as F
+from torch_geometric.datasets import Planetoid
+import torch_geometric.transforms as T
+from autogl.module.train import NodeClassificationFullTrainer
+from autogl.datasets import utils
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def test(model, data, mask):
+    model.eval()
+
+    if hasattr(model, 'cls_forward'):
+        out = model.cls_forward(data)[mask]
+    else:
+        out = model(data)[mask]
+    pred = out.max(1)[1]
+    acc = pred.eq(data.y[mask]).sum().item() / mask.sum().item()
+    return acc
+
+def train(model, data, args):
+    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
+
+    parameters = model.state_dict()
+    best_acc = 0.
+    for epoch in range(args.epoch):
+        model.train()
+        optimizer.zero_grad()
+        if hasattr(model, 'cls_forward'):
+            output = model.cls_forward(data)
+        else:
+            output = model(data)
+        loss = F.nll_loss(output[data.train_mask], data.y[data.train_mask])
+        loss.backward()
+        optimizer.step()
+
+        val_acc = test(model, data, data.val_mask)
+        if val_acc > best_acc:
+            best_acc = val_acc
+            parameters = model.state_dict()
+    
+    model.load_state_dict(parameters)
+    return model
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg model')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = Planetoid(os.path.expanduser('~/.cache-autogl'), args.dataset, transform=T.NormalizeFeatures())
+    data = dataset[0].to(args.device)
+    num_features = dataset.num_node_features
+    num_classes = dataset.num_classes
+    dataset = [data]
+
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        if args.model == 'gat':
+            model_hp = {
+                # hp from model
+                "num_layers": 2,
+                "hidden": [8],
+                "heads": 8,
+                "dropout": 0.6,
+                "act": "elu",
+            }
+        elif args.model == 'gcn':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [16],
+                "dropout": 0.5,
+                "act": "relu"
+            }
+        elif args.model == 'sage':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "agg": "mean",
+            }
+
+        trainer = NodeClassificationFullTrainer(
+            model=args.model,
+            num_features=num_features,
+            num_classes=num_classes,
+            device=args.device,
+            init=False,
+            feval=['acc'],
+            loss="nll_loss",
+        ).duplicate_from_hyper_parameter({
+            "max_epoch": args.epoch,
+            "early_stopping_round": args.epoch + 1,
+            "lr": args.lr,
+            "weight_decay": args.weight_decay,
+            **model_hp
+        })
+
+        trainer.train(dataset, False)
+        output = trainer.predict(dataset, 'test')
+        acc = (output == data.y[data.test_mask]).float().mean().item()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/node_classification/pyg/trainer_dataset.py b/test/performance/node_classification/pyg/trainer_dataset.py
new file mode 100644
index 0000000..b00580c
--- /dev/null
+++ b/test/performance/node_classification/pyg/trainer_dataset.py
@@ -0,0 +1,127 @@
+"""
+Performance check of AutoGL trainer + PYG dataset
+"""
+import os
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "pyg"
+
+import torch
+import torch.nn.functional as F
+from autogl.module.feature import NormalizeFeatures
+from autogl.module.train import NodeClassificationFullTrainer
+from autogl.datasets import utils, build_dataset_from_name
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def test(model, data, mask):
+    model.eval()
+
+    if hasattr(model, 'cls_forward'):
+        out = model.cls_forward(data)[mask]
+    else:
+        out = model(data)[mask]
+    pred = out.max(1)[1]
+    acc = pred.eq(data.y[mask]).sum().item() / mask.sum().item()
+    return acc
+
+def train(model, data, args):
+    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
+
+    parameters = model.state_dict()
+    best_acc = 0.
+    for epoch in range(args.epoch):
+        model.train()
+        optimizer.zero_grad()
+        if hasattr(model, 'cls_forward'):
+            output = model.cls_forward(data)
+        else:
+            output = model(data)
+        loss = F.nll_loss(output[data.train_mask], data.y[data.train_mask])
+        loss.backward()
+        optimizer.step()
+
+        val_acc = test(model, data, data.val_mask)
+        if val_acc > best_acc:
+            best_acc = val_acc
+            parameters = model.state_dict()
+    
+    model.load_state_dict(parameters)
+    return model
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg model')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = build_dataset_from_name('cora')
+    dataset = NormalizeFeatures().fit_transform(dataset)
+    dataset = utils.conversion.general_static_graphs_to_pyg_dataset(dataset)
+    data = dataset[0].to(args.device)
+    num_features = data.x.size(1)
+    num_classes = max([label.item() for label in data.y]) + 1
+
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        if args.model == 'gat':
+            model_hp = {
+                # hp from model
+                "num_layers": 2,
+                "hidden": [8],
+                "heads": 8,
+                "dropout": 0.6,
+                "act": "elu",
+            }
+        elif args.model == 'gcn':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [16],
+                "dropout": 0.5,
+                "act": "relu"
+            }
+        elif args.model == 'sage':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "agg": "mean",
+            }
+
+        trainer = NodeClassificationFullTrainer(
+            model=args.model,
+            num_features=num_features,
+            num_classes=num_classes,
+            device=args.device,
+            init=False,
+            feval=['acc'],
+            loss="nll_loss",
+        ).duplicate_from_hyper_parameter({
+            "max_epoch": args.epoch,
+            "early_stopping_round": args.epoch + 1,
+            "lr": args.lr,
+            "weight_decay": args.weight_decay,
+            **model_hp
+        })
+
+        trainer.train(dataset, False)
+        output = trainer.predict(dataset, 'test')
+        acc = (output == data.y[data.test_mask]).float().mean().item()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))

From 707cd21ebce1a3fec8af65c1e5fccb31fec9a063 Mon Sep 17 00:00:00 2001
From: CoreLeader <Core-Leader@outlook.com>
Date: Thu, 28 Oct 2021 12:53:00 +0800
Subject: [PATCH 56/75] Debug for Refactor of autogl.datasets and FE

Debug for feature.NormalizeFeatures
Debug for autogl.datasets.utils
---
 autogl/datasets/utils/_general.py           |  2 +-
 autogl/module/feature/_generators/_basic.py | 19 +++++++++++++------
 autogl/module/feature/_generators/_pyg.py   |  3 +++
 3 files changed, 17 insertions(+), 7 deletions(-)

diff --git a/autogl/datasets/utils/_general.py b/autogl/datasets/utils/_general.py
index 25e1c7f..244a0d1 100644
--- a/autogl/datasets/utils/_general.py
+++ b/autogl/datasets/utils/_general.py
@@ -405,7 +405,7 @@ def graph_get_split(
         elif _backend.DependentBackend.is_pyg():
             dataset_split: _typing.Any = optional_dataset_split
             import torch_geometric
-            return torch_geometric.loader.DataLoader(
+            return torch_geometric.data.DataLoader(
                 dataset_split, batch_size=batch_size, num_workers=num_workers
             )
     else:
diff --git a/autogl/module/feature/_generators/_basic.py b/autogl/module/feature/_generators/_basic.py
index b92866b..653f885 100644
--- a/autogl/module/feature/_generators/_basic.py
+++ b/autogl/module/feature/_generators/_basic.py
@@ -7,6 +7,13 @@ from .._feature_engineer_registry import FeatureEngineerUniversalRegistry
 
 
 class BaseFeatureGenerator(BaseFeatureEngineer):
+    def __init__(self, override_features: bool = False):
+        super(BaseFeatureGenerator, self).__init__()
+        if not isinstance(override_features, bool):
+            raise TypeError
+        else:
+            self._override_features: bool = override_features
+
     def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
         raise NotImplementedError
 
@@ -66,12 +73,12 @@ class BaseFeatureGenerator(BaseFeatureEngineer):
             )
             assert extracted_features.size(0) == nodes_features.size(0)
             assert extracted_features.dim() == nodes_features.dim() == 2
-            homogeneous_static_graph.nodes.data[feature_key] = torch.cat(
-                [
-                    nodes_features,
-                    extracted_features.to(nodes_features.device)
-                ],
-                dim=-1
+            homogeneous_static_graph.nodes.data[feature_key] = (
+                extracted_features.to(nodes_features.device)
+                if self._override_features
+                else torch.cat(
+                    [nodes_features, extracted_features.to(nodes_features.device)], dim=-1
+                )
             )
         else:
             if autogl.backend.DependentBackend.is_pyg():
diff --git a/autogl/module/feature/_generators/_pyg.py b/autogl/module/feature/_generators/_pyg.py
index 16042ea..4bac6d4 100644
--- a/autogl/module/feature/_generators/_pyg.py
+++ b/autogl/module/feature/_generators/_pyg.py
@@ -42,6 +42,9 @@ class LocalDegreeProfileGenerator(BaseFeatureGenerator):
 
 @FeatureEngineerUniversalRegistry.register_feature_engineer("NormalizeFeatures")
 class NormalizeFeatures(BaseFeatureGenerator):
+    def __init__(self):
+        super(NormalizeFeatures, self).__init__(override_features=True)
+
     def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
         if data.x is not None and isinstance(data.x, torch.Tensor):
             data.x.div_(data.x.sum(dim=-1, keepdim=True).clamp_(min=1.))

From 60e74370099302c586bda4050d30a4d79145bc38 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 1 Nov 2021 03:13:20 +0000
Subject: [PATCH 57/75] fix bugs in node

---
 .../module/train/node_classification_full.py  | 49 ++++++-------------
 autogl/solver/classifier/node_classifier.py   | 33 +++++++------
 autogl/solver/utils.py                        |  9 ++--
 3 files changed, 39 insertions(+), 52 deletions(-)

diff --git a/autogl/module/train/node_classification_full.py b/autogl/module/train/node_classification_full.py
index e71fc0c..07aef35 100644
--- a/autogl/module/train/node_classification_full.py
+++ b/autogl/module/train/node_classification_full.py
@@ -4,7 +4,7 @@ Node classification Full Trainer Implementation
 
 from . import register_trainer
 
-from .base import BaseNodeClassificationTrainer, EarlyStopping, Evaluation
+from .base import BaseNodeClassificationTrainer, EarlyStopping
 import torch
 from torch.optim.lr_scheduler import (
     StepLR,
@@ -14,7 +14,6 @@ from torch.optim.lr_scheduler import (
 )
 import torch.nn.functional as F
 from ..model import MODEL_DICT, BaseModel
-from ..model.pyg.base import ClassificationSupportedSequentialModel
 from .evaluation import get_feval, Logloss
 from typing import Union
 from copy import deepcopy
@@ -210,7 +209,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         for epoch in range(1, self.max_epoch):
             self.model.model.train()
             optimizer.zero_grad()
-            if isinstance(self.model.model, ClassificationSupportedSequentialModel):
+            if hasattr(self.model.model, 'cls_forward'):
                 res = self.model.model.cls_forward(data)
             else:
                 res = self.model.model.forward(data)
@@ -241,7 +240,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         if hasattr(data, "val_mask") and data.val_mask is not None:
             self.early_stopping.load_checkpoint(self.model.model)
 
-    def predict_only(self, data, test_mask=None):
+    def predict_only(self, data, mask=None):
         """
         The function of predicting on the given dataset and mask.
 
@@ -255,15 +254,13 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         res: The result of predicting on the given dataset.
 
         """
-        try:
-            mask = data.test_mask if test_mask is None else test_mask
-        except:
-            mask = None
+        if isinstance(mask, str):
+            mask = getattr(data, f'{mask}_mask')
 
         data = data.to(self.device)
         self.model.model.eval()
         with torch.no_grad():
-            if isinstance(self.model.model, ClassificationSupportedSequentialModel):
+            if hasattr(self.model.model, 'cls_forward'):
                 res = self.model.model.cls_forward(data)
             else:
                 res = self.model.model.forward(data)
@@ -293,8 +290,8 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         data = dataset[0]
         self.train_only(data)
         if keep_valid_result:
-            self.valid_result = self.predict_only(data)[data.val_mask].max(1)[1]
-            self.valid_result_prob = self.predict_only(data)[data.val_mask]
+            self.valid_result = self.predict_only(data, 'val').max(1)[1]
+            self.valid_result_prob = self.predict_only(data, 'val')
             self.valid_score = self.evaluate(
                 dataset, mask=data.val_mask, feval=self.feval
             )
@@ -324,7 +321,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         ----------
         dataset: The node classification dataset used to be predicted.
 
-        mask: ``train``, ``val``, or ``test``.
+        mask: ``train``, ``val``, ``test``, or ``Tensor``.
             The dataset mask.
 
         in_log_format: ``bool``.
@@ -336,16 +333,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         """
         data = dataset[0]
         data = data.to(self.device)
-        if mask is not None:
-            if mask == "val":
-                mask = data.val_mask
-            elif mask == "test":
-                mask = data.test_mask
-            elif mask == "train":
-                mask = data.train_mask
-        else:
-            mask = data.test_mask
-        ret = self.predict_only(data, mask) # [mask]
+        ret = self.predict_only(data, mask)
         if in_log_format is True:
             return ret
         else:
@@ -416,22 +404,17 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         """
         data = dataset[0]
         data = data.to(self.device)
-        test_mask = mask
+
+        if isinstance(mask, str):
+            mask = getattr(data, f'{mask}_mask')
+
         if feval is None:
             feval = self.feval
         else:
             feval = get_feval(feval)
-        if test_mask is None:
-            test_mask = data.test_mask
-        elif test_mask == "test":
-            test_mask = data.test_mask
-        elif test_mask == "val":
-            test_mask = data.val_mask
-        elif test_mask == "train":
-            test_mask = data.train_mask
         y_pred_prob = self.predict_proba(dataset, mask)
-        y_pred = y_pred_prob.max(1)[1]
-        y_true = data.y[test_mask]
+        
+        y_true = data.y[mask] if mask is not None else data.y
 
         if not isinstance(feval, list):
             feval = [feval]
diff --git a/autogl/solver/classifier/node_classifier.py b/autogl/solver/classifier/node_classifier.py
index 24e4bcd..f9dd636 100644
--- a/autogl/solver/classifier/node_classifier.py
+++ b/autogl/solver/classifier/node_classifier.py
@@ -19,7 +19,7 @@ from ...module.train import get_feval
 from ...module.nas.space import NAS_SPACE_DICT
 from ...module.nas.algorithm import NAS_ALGO_DICT
 from ...module.nas.estimator import NAS_ESTIMATOR_DICT, BaseEstimator
-from ..utils import LeaderBoard, get_graph_from_dataset, get_graph_labels, get_graph_masks, get_graph_node_features, get_graph_node_number, set_seed
+from ..utils import LeaderBoard, get_graph_from_dataset, get_graph_labels, get_graph_masks, get_graph_node_features, get_graph_node_number, set_seed, convert_dataset
 from ...datasets import utils
 from ...utils import get_logger
 
@@ -282,12 +282,16 @@ class AutoNodeClassifier(BaseClassifier):
             time_limit = 3600 * 24
         time_begin = time.time()
 
+        graph_data = get_graph_from_dataset(dataset, 0)
+        all_labels = get_graph_labels(graph_data)
+        num_classes = all_labels.max().item() + 1
+
         # initialize leaderboard
         if evaluation_method == "infer":
             if hasattr(dataset, "metric"):
                 evaluation_method = [dataset.metric]
             else:
-                num_of_label = dataset.num_classes
+                num_of_label = num_classes
                 if num_of_label == 2:
                     evaluation_method = ["auc"]
                 else:
@@ -300,7 +304,6 @@ class AutoNodeClassifier(BaseClassifier):
             {e.get_eval_name(): e.is_higher_better() for e in evaluator_list},
         )
 
-        graph_data = get_graph_from_dataset(dataset, 0)
 
         # set up the dataset
         if train_split is not None and val_split is not None:
@@ -312,8 +315,8 @@ class AutoNodeClassifier(BaseClassifier):
                 val_split = val_split if val_split > 1 else int(val_split * size)
                 utils.random_splits_mask_class(
                     dataset,
-                    num_train_per_class=train_split // dataset.num_classes,
-                    num_val_per_class=val_split // dataset.num_classes,
+                    num_train_per_class=train_split // num_classes,
+                    num_val_per_class=val_split // num_classes,
                     seed=seed,
                 )
             else:
@@ -351,7 +354,7 @@ class AutoNodeClassifier(BaseClassifier):
         self._init_graph_module(
             self.gml,
             num_features=num_features,
-            num_classes=self.dataset.num_classes,
+            num_classes=num_classes,
             feval=evaluator_list,
             device=self.runtime_device,
             loss="nll_loss" if not hasattr(dataset, "loss") else self.dataset.loss,
@@ -361,7 +364,7 @@ class AutoNodeClassifier(BaseClassifier):
             # perform neural architecture search
             self._init_nas_module(
                 num_features=num_features,
-                num_classes=self.dataset.num_classes,
+                num_classes=num_classes,
                 feval=evaluator_list,
                 device=self.runtime_device,
                 loss="nll_loss" if not hasattr(dataset, "loss") else dataset.loss,
@@ -378,7 +381,7 @@ class AutoNodeClassifier(BaseClassifier):
             for algo, space, estimator in zip(
                 self.nas_algorithms, self.nas_spaces, self.nas_estimators
             ):
-                model = algo.search(space, self.dataset, estimator)
+                model = algo.search(space, convert_dataset(self.dataset), estimator)
                 # insert model into default trainer
                 if isinstance(self._default_trainer, list):
                     train_name = self._default_trainer[idx_trainer]
@@ -389,7 +392,7 @@ class AutoNodeClassifier(BaseClassifier):
                     trainer = TRAINER_DICT[train_name](
                         model=model,
                         num_features=num_features,
-                        num_classes=self.dataset.num_classes,
+                        num_classes=num_classes,
                         loss="nll_loss"
                         if not hasattr(dataset, "loss")
                         else dataset.loss,
@@ -402,7 +405,7 @@ class AutoNodeClassifier(BaseClassifier):
                     trainer.model = model
                     trainer.update_parameters(
                         num_features=num_features,
-                        num_classes=self.dataset.num_classes,
+                        num_classes=num_classes,
                         loss="nll_loss"
                         if not hasattr(dataset, "loss")
                         else dataset.loss,
@@ -420,11 +423,11 @@ class AutoNodeClassifier(BaseClassifier):
             )
             if self.hpo_module is None:
                 model.initialize()
-                model.train(self.dataset, True)
+                model.train(convert_dataset(self.dataset), True)
                 optimized = model
             else:
                 optimized, _ = self.hpo_module.optimize(
-                    trainer=model, dataset=self.dataset, time_limit=time_for_each_model
+                    trainer=model, dataset=convert_dataset(self.dataset), time_limit=time_for_each_model
                 )
             # to save memory, all the trainer derived will be mapped to cpu
             optimized.to(torch.device("cpu"))
@@ -447,10 +450,10 @@ class AutoNodeClassifier(BaseClassifier):
         if self.ensemble_module is not None:
             performance = self.ensemble_module.fit(
                 result_valid,
-                get_graph_labels(graph_data)[get_graph_masks(graph_data, 'val')].cpu().numpy(),
+                all_labels[get_graph_masks(graph_data, 'val')].cpu().numpy(),
                 names,
                 evaluator_list,
-                n_classes=dataset.num_classes,
+                n_classes=num_classes,
             )
             self.leaderboard.insert_model_performance(
                 "ensemble",
@@ -647,7 +650,7 @@ class AutoNodeClassifier(BaseClassifier):
     def _predict_proba_by_name(self, dataset, name, mask="test"):
         self.trained_models[name].to(self.runtime_device)
         predicted = (
-            self.trained_models[name].predict_proba(dataset, mask=mask).cpu().numpy()
+            self.trained_models[name].predict_proba(convert_dataset(dataset), mask=mask).cpu().numpy()
         )
         self.trained_models[name].to(torch.device("cpu"))
         return predicted
diff --git a/autogl/solver/utils.py b/autogl/solver/utils.py
index bc986e3..4829bcd 100644
--- a/autogl/solver/utils.py
+++ b/autogl/solver/utils.py
@@ -228,12 +228,13 @@ def get_graph_masks(graph, mask='train'):
 
 def get_graph_labels(graph):
     if isinstance(graph, GeneralStaticGraph):
-        if 'label' in graph.data and BACKEND == 'dgl':
-            return graph.data['label']
-        if 'y' in graph.data and BACKEND == 'pyg':
-            return graph.data['y']
+        if 'label' in graph.nodes.data and BACKEND == 'dgl':
+            return graph.nodes.data['label']
+        if 'y' in graph.nodes.data and BACKEND == 'pyg':
+            return graph.nodes.data['y']
         return None
     if BACKEND == 'pyg' and hasattr(graph, 'y'): return graph.y
+    if BACKEND == 'dgl' and 'label' in graph.ndata: return graph.ndata['label']
     return None
 
 def get_dataset_labels(dataset):

From a25a177e867eb492fe13966bce31070182a3b75b Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 1 Nov 2021 03:13:49 +0000
Subject: [PATCH 58/75] add performance for node pyg

---
 .../node_classification/pyg/solver.py         | 91 +++++++++++++++++++
 .../node_classification/pyg/trainer.py        | 37 --------
 .../pyg/trainer_dataset.py                    | 37 --------
 3 files changed, 91 insertions(+), 74 deletions(-)
 create mode 100644 test/performance/node_classification/pyg/solver.py

diff --git a/test/performance/node_classification/pyg/solver.py b/test/performance/node_classification/pyg/solver.py
new file mode 100644
index 0000000..7138bd2
--- /dev/null
+++ b/test/performance/node_classification/pyg/solver.py
@@ -0,0 +1,91 @@
+"""
+Performance check of AutoGL trainer + PYG dataset
+"""
+import os
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "pyg"
+
+from autogl.module.feature import NormalizeFeatures
+from autogl.solver import AutoNodeClassifier
+from autogl.datasets import utils, build_dataset_from_name
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('pyg model')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = build_dataset_from_name('cora')
+    label = dataset[0].nodes.data['y'][dataset[0].nodes.data['test_mask']].numpy()
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        if args.model == 'gat':
+            model_hp = {
+                # hp from model
+                "num_layers": 2,
+                "hidden": [8],
+                "heads": 8,
+                "dropout": 0.6,
+                "act": "elu",
+            }
+        elif args.model == 'gcn':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [16],
+                "dropout": 0.5,
+                "act": "relu"
+            }
+        elif args.model == 'sage':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "agg": "mean",
+            }
+        
+        solver = AutoNodeClassifier(
+            feature_module='NormalizeFeatures',
+            graph_models=(args.model,),
+            ensemble_module=None,
+            max_evals=1,
+            hpo_module='random',
+            trainer_hp_space=fixed(**{
+                "max_epoch": args.epoch,
+                "early_stopping_round": args.epoch + 1,
+                "lr": args.lr,
+                "weight_decay": args.weight_decay,
+            }),
+            model_hp_spaces=[fixed(**model_hp)]
+        )
+
+        solver.fit(dataset)
+        output = solver.predict(dataset)
+        acc = (output == label).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/node_classification/pyg/trainer.py b/test/performance/node_classification/pyg/trainer.py
index 6c6c1da..6cb2eea 100644
--- a/test/performance/node_classification/pyg/trainer.py
+++ b/test/performance/node_classification/pyg/trainer.py
@@ -7,8 +7,6 @@ from tqdm import tqdm
 
 os.environ["AUTOGL_BACKEND"] = "pyg"
 
-import torch
-import torch.nn.functional as F
 from torch_geometric.datasets import Planetoid
 import torch_geometric.transforms as T
 from autogl.module.train import NodeClassificationFullTrainer
@@ -18,41 +16,6 @@ import logging
 
 logging.basicConfig(level=logging.ERROR)
 
-def test(model, data, mask):
-    model.eval()
-
-    if hasattr(model, 'cls_forward'):
-        out = model.cls_forward(data)[mask]
-    else:
-        out = model(data)[mask]
-    pred = out.max(1)[1]
-    acc = pred.eq(data.y[mask]).sum().item() / mask.sum().item()
-    return acc
-
-def train(model, data, args):
-    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
-
-    parameters = model.state_dict()
-    best_acc = 0.
-    for epoch in range(args.epoch):
-        model.train()
-        optimizer.zero_grad()
-        if hasattr(model, 'cls_forward'):
-            output = model.cls_forward(data)
-        else:
-            output = model(data)
-        loss = F.nll_loss(output[data.train_mask], data.y[data.train_mask])
-        loss.backward()
-        optimizer.step()
-
-        val_acc = test(model, data, data.val_mask)
-        if val_acc > best_acc:
-            best_acc = val_acc
-            parameters = model.state_dict()
-    
-    model.load_state_dict(parameters)
-    return model
-
 if __name__ == '__main__':
 
     import argparse
diff --git a/test/performance/node_classification/pyg/trainer_dataset.py b/test/performance/node_classification/pyg/trainer_dataset.py
index b00580c..9f82b78 100644
--- a/test/performance/node_classification/pyg/trainer_dataset.py
+++ b/test/performance/node_classification/pyg/trainer_dataset.py
@@ -7,8 +7,6 @@ from tqdm import tqdm
 
 os.environ["AUTOGL_BACKEND"] = "pyg"
 
-import torch
-import torch.nn.functional as F
 from autogl.module.feature import NormalizeFeatures
 from autogl.module.train import NodeClassificationFullTrainer
 from autogl.datasets import utils, build_dataset_from_name
@@ -17,41 +15,6 @@ import logging
 
 logging.basicConfig(level=logging.ERROR)
 
-def test(model, data, mask):
-    model.eval()
-
-    if hasattr(model, 'cls_forward'):
-        out = model.cls_forward(data)[mask]
-    else:
-        out = model(data)[mask]
-    pred = out.max(1)[1]
-    acc = pred.eq(data.y[mask]).sum().item() / mask.sum().item()
-    return acc
-
-def train(model, data, args):
-    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
-
-    parameters = model.state_dict()
-    best_acc = 0.
-    for epoch in range(args.epoch):
-        model.train()
-        optimizer.zero_grad()
-        if hasattr(model, 'cls_forward'):
-            output = model.cls_forward(data)
-        else:
-            output = model(data)
-        loss = F.nll_loss(output[data.train_mask], data.y[data.train_mask])
-        loss.backward()
-        optimizer.step()
-
-        val_acc = test(model, data, data.val_mask)
-        if val_acc > best_acc:
-            best_acc = val_acc
-            parameters = model.state_dict()
-    
-    model.load_state_dict(parameters)
-    return model
-
 if __name__ == '__main__':
 
     import argparse

From c5b4ec9c9a145d67b04781a75f5223b83a5dddab Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Mon, 1 Nov 2021 10:39:22 +0000
Subject: [PATCH 59/75] chage file name

---
 .../dgl/{dgl.py => base.py}                   |   0
 .../pyg/{pyg.py => base.py}                   |   0
 .../node_classification/dgl/base.py           | 140 ++++++++++++++++++
 .../pyg/{pyg.py => base.py}                   |   0
 4 files changed, 140 insertions(+)
 rename test/performance/graph_classification/dgl/{dgl.py => base.py} (100%)
 rename test/performance/graph_classification/pyg/{pyg.py => base.py} (100%)
 create mode 100644 test/performance/node_classification/dgl/base.py
 rename test/performance/node_classification/pyg/{pyg.py => base.py} (100%)

diff --git a/test/performance/graph_classification/dgl/dgl.py b/test/performance/graph_classification/dgl/base.py
similarity index 100%
rename from test/performance/graph_classification/dgl/dgl.py
rename to test/performance/graph_classification/dgl/base.py
diff --git a/test/performance/graph_classification/pyg/pyg.py b/test/performance/graph_classification/pyg/base.py
similarity index 100%
rename from test/performance/graph_classification/pyg/pyg.py
rename to test/performance/graph_classification/pyg/base.py
diff --git a/test/performance/node_classification/dgl/base.py b/test/performance/node_classification/dgl/base.py
new file mode 100644
index 0000000..4618ed8
--- /dev/null
+++ b/test/performance/node_classification/dgl/base.py
@@ -0,0 +1,140 @@
+"""
+Performance check of AutoGL model + DGL (trainer + dataset)
+"""
+import os
+import random
+import numpy as np
+from tqdm import tqdm
+
+import torch
+import torch.nn.functional as F
+
+import dgl
+from dgl.data import CoraGraphDataset, PubmedGraphDataset, CiteseerGraphDataset
+from dgl.nn.pytorch import GraphConv, GATConv, SAGEConv
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+class GCN(torch.nn.Module):
+    def __init__(self, num_features, num_classes):
+        super(GCN, self).__init__()
+        self.conv1 = GraphConv(num_features, 16)
+        self.conv2 = GraphConv(16, num_classes)
+
+    def forward(self, graph):
+        features = graph.ndata['feat']
+        features = F.relu(self.conv1(graph, features))
+        features = F.dropout(features, training=self.training)
+        features = self.conv2(graph, features)
+        return F.log_softmax(features, dim=-1)
+
+class GAT(torch.nn.Module):
+    def __init__(self, num_features, num_classes):
+        super(GAT, self).__init__()
+        self.conv1 = GATConv(num_features, 8, 8, feat_drop=.6, attn_drop=.6, activation=F.relu)
+        self.conv2 = GATConv(8 * 8, num_classes, 8, feat_drop=.6, attn_drop=.6)
+
+    def forward(self, graph):
+        features = graph.ndata['feat']
+        features = self.conv1(graph, features).flatten(1)
+        features = self.conv2(graph, features).mean(1)
+        return F.log_softmax(features, dim=-1)
+
+class SAGE(torch.nn.Module):
+    def __init__(self, num_features, hidden_channels, num_layers, num_classes):
+        super(SAGE, self).__init__()
+        self.num_layers = num_layers
+        self.convs = torch.nn.ModuleList()
+        for i in range(num_layers):
+            inc = outc = hidden_channels
+            if i == 0:
+                inc = num_features
+            if i == num_layers - 1:
+                outc = num_classes
+            self.convs.append(SAGEConv(inc, outc, "gcn"))
+        self.dropout = torch.nn.Dropout()
+
+    def forward(self, graph):
+        h = graph.ndata['feat']
+        h = self.dropout(h)
+        for i, conv in enumerate(self.convs):
+            h = conv(graph, h)
+            if i != self.num_layers - 1:
+                h = h.relu()
+                h = self.dropout(h)
+        return F.log_softmax(h, dim=-1)
+
+def test(model, graph, mask, label):
+    model.eval()
+
+    pred = model(graph)[mask].max(1)[1]
+    acc = pred.eq(label[mask]).sum().item() / mask.sum().item()
+    return acc
+
+def train(model, graph, args, label, train_mask, val_mask):
+    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
+
+    parameters = model.state_dict()
+    best_acc = 0.
+    for epoch in range(args.epoch):
+        model.train()
+        optimizer.zero_grad()
+        output = model(graph)
+        loss = F.nll_loss(output[train_mask], label[train_mask])
+        loss.backward()
+        optimizer.step()
+
+        val_acc = test(model, graph, val_mask, label)
+        if val_acc > best_acc:
+            best_acc = val_acc
+            parameters = model.state_dict()
+    
+    model.load_state_dict(parameters)
+    return model
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('dgl model')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    if args.dataset == 'Cora':
+        dataset = CoraGraphDataset()
+    elif args.dataset == 'CiteSeer':
+        dataset = CiteseerGraphDataset()
+    elif args.dataset == 'PubMed':
+        dataset = PubmedGraphDataset()
+    graph = dataset[0].to(args.device)
+    label = graph.ndata['label']
+    train_mask = graph.ndata['train_mask']
+    val_mask = graph.ndata['val_mask']
+    test_mask = graph.ndata['test_mask']
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        np.random.seed(seed)
+        torch.manual_seed(seed)
+
+        if args.model == 'gat':
+            model = GAT(graph.ndata['feat'].size(1), dataset.num_classes)
+        elif args.model == 'gcn':
+            model = GCN(graph.ndata['feat'].size(1), dataset.num_classes)
+        elif args.model == 'sage':
+            model = SAGE(graph.ndata['feat'].size(1), 64, 2, dataset.num_classes)
+        
+        model.to(args.device)
+
+        train(model, graph, args, label, train_mask, val_mask)
+        acc = test(model, graph, test_mask, label)
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/node_classification/pyg/pyg.py b/test/performance/node_classification/pyg/base.py
similarity index 100%
rename from test/performance/node_classification/pyg/pyg.py
rename to test/performance/node_classification/pyg/base.py

From 39859de69c4e66ad42c786af00e69fb216ecb650 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Mon, 23 Aug 2021 07:34:58 +0000
Subject: [PATCH 60/75] add dgl init for model

---
 autogl/module/model/__init__.py               | 30 +++++++------------
 autogl/module/model/dgl/__init__.py           |  1 +
 autogl/module/model/pyg/__init__.py           | 22 ++++++++++++++
 .../module/model/{ => pyg}/_model_registry.py |  0
 autogl/module/model/{ => pyg}/base.py         |  0
 autogl/module/model/{ => pyg}/gat.py          |  0
 autogl/module/model/{ => pyg}/gcn.py          |  0
 autogl/module/model/{ => pyg}/gin.py          |  0
 autogl/module/model/{ => pyg}/graph_saint.py  |  0
 autogl/module/model/{ => pyg}/graphsage.py    |  0
 autogl/module/model/{ => pyg}/topkpool.py     |  0
 11 files changed, 33 insertions(+), 20 deletions(-)
 create mode 100644 autogl/module/model/dgl/__init__.py
 create mode 100644 autogl/module/model/pyg/__init__.py
 rename autogl/module/model/{ => pyg}/_model_registry.py (100%)
 rename autogl/module/model/{ => pyg}/base.py (100%)
 rename autogl/module/model/{ => pyg}/gat.py (100%)
 rename autogl/module/model/{ => pyg}/gcn.py (100%)
 rename autogl/module/model/{ => pyg}/gin.py (100%)
 rename autogl/module/model/{ => pyg}/graph_saint.py (100%)
 rename autogl/module/model/{ => pyg}/graphsage.py (100%)
 rename autogl/module/model/{ => pyg}/topkpool.py (100%)

diff --git a/autogl/module/model/__init__.py b/autogl/module/model/__init__.py
index 0a816a2..c995d9c 100644
--- a/autogl/module/model/__init__.py
+++ b/autogl/module/model/__init__.py
@@ -1,22 +1,12 @@
-from ._model_registry import MODEL_DICT, ModelUniversalRegistry, register_model
-from .base import BaseModel
-from .topkpool import AutoTopkpool
+import importlib
+import sys
+from ...backend import DependentBackend
 
-# from .graph_sage import AutoSAGE
-from .graphsage import AutoSAGE
-from .graph_saint import GraphSAINTAggregationModel
-from .gcn import AutoGCN
-from .gat import AutoGAT
-from .gin import AutoGIN
+# load corresponding backend of subclass
+def _load_subclass_backend(backend):
+    sub_module = importlib.import_module(f'.{backend.get_backend_name()}', __name__)
+    this = sys.modules[__name__]
+    for api, obj in sub_module.__dict__.items():
+        setattr(this, api, obj)
 
-__all__ = [
-    "ModelUniversalRegistry",
-    "register_model",
-    "BaseModel",
-    "AutoTopkpool",
-    "AutoSAGE",
-    "GraphSAINTAggregationModel",
-    "AutoGCN",
-    "AutoGAT",
-    "AutoGIN",
-]
+_load_subclass_backend(DependentBackend)
diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
new file mode 100644
index 0000000..8b13789
--- /dev/null
+++ b/autogl/module/model/dgl/__init__.py
@@ -0,0 +1 @@
+
diff --git a/autogl/module/model/pyg/__init__.py b/autogl/module/model/pyg/__init__.py
new file mode 100644
index 0000000..0a816a2
--- /dev/null
+++ b/autogl/module/model/pyg/__init__.py
@@ -0,0 +1,22 @@
+from ._model_registry import MODEL_DICT, ModelUniversalRegistry, register_model
+from .base import BaseModel
+from .topkpool import AutoTopkpool
+
+# from .graph_sage import AutoSAGE
+from .graphsage import AutoSAGE
+from .graph_saint import GraphSAINTAggregationModel
+from .gcn import AutoGCN
+from .gat import AutoGAT
+from .gin import AutoGIN
+
+__all__ = [
+    "ModelUniversalRegistry",
+    "register_model",
+    "BaseModel",
+    "AutoTopkpool",
+    "AutoSAGE",
+    "GraphSAINTAggregationModel",
+    "AutoGCN",
+    "AutoGAT",
+    "AutoGIN",
+]
diff --git a/autogl/module/model/_model_registry.py b/autogl/module/model/pyg/_model_registry.py
similarity index 100%
rename from autogl/module/model/_model_registry.py
rename to autogl/module/model/pyg/_model_registry.py
diff --git a/autogl/module/model/base.py b/autogl/module/model/pyg/base.py
similarity index 100%
rename from autogl/module/model/base.py
rename to autogl/module/model/pyg/base.py
diff --git a/autogl/module/model/gat.py b/autogl/module/model/pyg/gat.py
similarity index 100%
rename from autogl/module/model/gat.py
rename to autogl/module/model/pyg/gat.py
diff --git a/autogl/module/model/gcn.py b/autogl/module/model/pyg/gcn.py
similarity index 100%
rename from autogl/module/model/gcn.py
rename to autogl/module/model/pyg/gcn.py
diff --git a/autogl/module/model/gin.py b/autogl/module/model/pyg/gin.py
similarity index 100%
rename from autogl/module/model/gin.py
rename to autogl/module/model/pyg/gin.py
diff --git a/autogl/module/model/graph_saint.py b/autogl/module/model/pyg/graph_saint.py
similarity index 100%
rename from autogl/module/model/graph_saint.py
rename to autogl/module/model/pyg/graph_saint.py
diff --git a/autogl/module/model/graphsage.py b/autogl/module/model/pyg/graphsage.py
similarity index 100%
rename from autogl/module/model/graphsage.py
rename to autogl/module/model/pyg/graphsage.py
diff --git a/autogl/module/model/topkpool.py b/autogl/module/model/pyg/topkpool.py
similarity index 100%
rename from autogl/module/model/topkpool.py
rename to autogl/module/model/pyg/topkpool.py

From be6a7054b0df1e4bff78da37d4574962be44dfc5 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Mon, 23 Aug 2021 07:57:34 +0000
Subject: [PATCH 61/75] fixed minor issue in model/pyg

---
 autogl/module/model/pyg/gat.py       | 2 +-
 autogl/module/model/pyg/gcn.py       | 2 +-
 autogl/module/model/pyg/gin.py       | 2 +-
 autogl/module/model/pyg/graphsage.py | 2 +-
 autogl/module/model/pyg/topkpool.py  | 2 +-
 5 files changed, 5 insertions(+), 5 deletions(-)

diff --git a/autogl/module/model/pyg/gat.py b/autogl/module/model/pyg/gat.py
index 07e7800..d153685 100644
--- a/autogl/module/model/pyg/gat.py
+++ b/autogl/module/model/pyg/gat.py
@@ -3,7 +3,7 @@ import torch.nn.functional as F
 from torch_geometric.nn import GATConv
 from . import register_model
 from .base import BaseModel, activate_func
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("GATModel")
 
diff --git a/autogl/module/model/pyg/gcn.py b/autogl/module/model/pyg/gcn.py
index af6671b..30bc1a7 100644
--- a/autogl/module/model/pyg/gcn.py
+++ b/autogl/module/model/pyg/gcn.py
@@ -6,7 +6,7 @@ from torch_geometric.nn.conv import GCNConv
 import autogl.data
 from . import register_model
 from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("GCNModel")
 
diff --git a/autogl/module/model/pyg/gin.py b/autogl/module/model/pyg/gin.py
index 6ea4390..52a495a 100644
--- a/autogl/module/model/pyg/gin.py
+++ b/autogl/module/model/pyg/gin.py
@@ -6,7 +6,7 @@ from torch.nn import BatchNorm1d
 from . import register_model
 from .base import BaseModel, activate_func
 from copy import deepcopy
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("GINModel")
 
diff --git a/autogl/module/model/pyg/graphsage.py b/autogl/module/model/pyg/graphsage.py
index 3b63baf..6cf5a17 100644
--- a/autogl/module/model/pyg/graphsage.py
+++ b/autogl/module/model/pyg/graphsage.py
@@ -6,7 +6,7 @@ import torch.nn.functional
 import autogl.data
 from . import register_model
 from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("SAGEModel")
 
diff --git a/autogl/module/model/pyg/topkpool.py b/autogl/module/model/pyg/topkpool.py
index 9fd64ef..c1872bd 100644
--- a/autogl/module/model/pyg/topkpool.py
+++ b/autogl/module/model/pyg/topkpool.py
@@ -4,7 +4,7 @@ from torch_geometric.nn import GraphConv, TopKPooling
 from torch_geometric.nn import global_mean_pool as gap, global_max_pool as gmp
 from . import register_model
 from .base import BaseModel, activate_func
-from ...utils import get_logger
+from ....utils import get_logger
 
 LOGGER = get_logger("TopkModel")
 

From 4795f97a9a43e6abc7a889f84e008cfcc796dc57 Mon Sep 17 00:00:00 2001
From: SwiftieH <changheng95@126.com>
Date: Mon, 23 Aug 2021 08:40:10 +0000
Subject: [PATCH 62/75] add glf example (dgl)

---
 autogl/module/model/dgl/__init__.py        |  23 ++
 autogl/module/model/dgl/_model_registry.py |  28 ++
 autogl/module/model/dgl/base.py            | 413 +++++++++++++++++++++
 autogl/module/model/dgl/dataloader_gin.py  |  85 +++++
 autogl/module/model/dgl/gat.py             | 223 +++++++++++
 autogl/module/model/dgl/gcn.py             | 408 ++++++++++++++++++++
 autogl/module/model/dgl/gin.py             | 232 ++++++++++++
 autogl/module/model/dgl/gin_dgl.py         | 171 +++++++++
 autogl/module/model/dgl/ginparser.py       |  81 ++++
 autogl/module/model/dgl/graph_saint.py     | 407 ++++++++++++++++++++
 autogl/module/model/dgl/graphsage.py       | 306 +++++++++++++++
 autogl/module/model/dgl/topkpool.py        | 169 +++++++++
 test/model_glf/gclf_dgl.py                 | 176 +++++++++
 13 files changed, 2722 insertions(+)
 create mode 100644 autogl/module/model/dgl/_model_registry.py
 create mode 100644 autogl/module/model/dgl/base.py
 create mode 100644 autogl/module/model/dgl/dataloader_gin.py
 create mode 100644 autogl/module/model/dgl/gat.py
 create mode 100644 autogl/module/model/dgl/gcn.py
 create mode 100644 autogl/module/model/dgl/gin.py
 create mode 100644 autogl/module/model/dgl/gin_dgl.py
 create mode 100644 autogl/module/model/dgl/ginparser.py
 create mode 100644 autogl/module/model/dgl/graph_saint.py
 create mode 100644 autogl/module/model/dgl/graphsage.py
 create mode 100644 autogl/module/model/dgl/topkpool.py
 create mode 100644 test/model_glf/gclf_dgl.py

diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index 8b13789..7a45f5e 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -1 +1,24 @@
+from ._model_registry import MODEL_DICT, ModelUniversalRegistry, register_model
+from .base import BaseModel
+from .topkpool import AutoTopkpool
 
+# from .graph_sage import AutoSAGE
+from .graphsage import AutoSAGE
+from .graph_saint import GraphSAINTAggregationModel
+from .gcn import AutoGCN
+from .gat import AutoGAT
+from .gin import AutoGIN
+from .gin_dgl import GIN
+
+__all__ = [
+    "ModelUniversalRegistry",
+    "register_model",
+    "BaseModel",
+    "AutoTopkpool",
+    "AutoSAGE",
+    "GraphSAINTAggregationModel",
+    "AutoGCN",
+    "AutoGAT",
+    "AutoGIN",
+    "GIN",
+]
diff --git a/autogl/module/model/dgl/_model_registry.py b/autogl/module/model/dgl/_model_registry.py
new file mode 100644
index 0000000..14aa2d9
--- /dev/null
+++ b/autogl/module/model/dgl/_model_registry.py
@@ -0,0 +1,28 @@
+import typing as _typing
+from .base import BaseModel
+
+MODEL_DICT: _typing.Dict[str, _typing.Type[BaseModel]] = {}
+
+
+def register_model(name):
+    def register_model_cls(cls):
+        if name in MODEL_DICT:
+            raise ValueError("Cannot register duplicate trainer ({})".format(name))
+        if not issubclass(cls, BaseModel):
+            raise ValueError(
+                "Trainer ({}: {}) must extend BaseModel".format(name, cls.__name__)
+            )
+        MODEL_DICT[name] = cls
+        return cls
+
+    return register_model_cls
+
+
+class ModelUniversalRegistry:
+    @classmethod
+    def get_model(cls, name: str) -> _typing.Type[BaseModel]:
+        if type(name) != str:
+            raise TypeError
+        if name not in MODEL_DICT:
+            raise KeyError
+        return MODEL_DICT.get(name)
diff --git a/autogl/module/model/dgl/base.py b/autogl/module/model/dgl/base.py
new file mode 100644
index 0000000..99f2c2c
--- /dev/null
+++ b/autogl/module/model/dgl/base.py
@@ -0,0 +1,413 @@
+"""
+auto graph model
+a list of models with their hyper parameters
+NOTE: neural architecture search (NAS) maybe included here
+"""
+import copy
+import logging
+import typing as _typing
+import torch
+import torch.nn.functional as F
+from copy import deepcopy
+
+base_approach_logger: logging.Logger = logging.getLogger("BaseModel")
+
+
+def activate_func(x, func):
+    if func == "tanh":
+        return torch.tanh(x)
+    elif hasattr(F, func):
+        return getattr(F, func)(x)
+    elif func == "":
+        pass
+    else:
+        raise TypeError("PyTorch does not support activation function {}".format(func))
+
+    return x
+
+
+class BaseModel:
+    def __init__(self, init=False, *args, **kwargs):
+        super(BaseModel, self).__init__()
+
+    def get_hyper_parameter(self):
+        return deepcopy(self.hyperparams)
+
+    @property
+    def hyper_parameter_space(self):
+        return self.space
+
+    @hyper_parameter_space.setter
+    def hyper_parameter_space(self, space):
+        self.space = space
+
+    def initialize(self):
+        pass
+
+    def forward(self):
+        pass
+
+    def to(self, device):
+        if isinstance(device, (str, torch.device)):
+            self.device = device
+        if (
+            hasattr(self, "model")
+            and self.model is not None
+            and isinstance(self.model, torch.nn.Module)
+        ):
+            self.model.to(self.device)
+        return self
+
+    def from_hyper_parameter(self, hp):
+        ret_self = self.__class__(
+            num_features=self.num_features,
+            num_classes=self.num_classes,
+            device=self.device,
+            init=False,
+        )
+        ret_self.hyperparams.update(hp)
+        ret_self.params.update(self.params)
+        ret_self.initialize()
+        return ret_self
+
+    def get_num_classes(self):
+        return self.num_classes
+
+    def set_num_classes(self, num_classes):
+        self.num_classes = num_classes
+        self.params["num_class"] = num_classes
+
+    def get_num_features(self):
+        return self.num_features
+
+    def set_num_features(self, num_features):
+        self.num_features = num_features
+        self.params["features_num"] = self.num_features
+
+    def set_num_graph_features(self, num_graph_features):
+        assert hasattr(
+            self, "num_graph_features"
+        ), "Cannot set graph features for tasks other than graph classification"
+        self.num_graph_features = num_graph_features
+        self.params["num_graph_features"] = num_graph_features
+
+
+class _BaseBaseModel:
+    # todo: after renaming the experimental base class _BaseModel to BaseModel,
+    #       rename this class to _BaseModel
+    """
+    The base class for class BaseModel,
+    designed to implement some basic functionality of BaseModel.
+    --  Designed by ZiXin Sun
+    """
+
+    @classmethod
+    def __formulate_device(
+        cls, device: _typing.Union[str, torch.device] = ...
+    ) -> torch.device:
+        if type(device) == torch.device or (
+            type(device) == str and device.strip().lower() != "auto"
+        ):
+            return torch.device(device)
+        elif torch.cuda.is_available() and torch.cuda.device_count() > 0:
+            return torch.device("cuda")
+        else:
+            return torch.device("cpu")
+
+    @property
+    def device(self) -> torch.device:
+        return self.__device
+
+    @device.setter
+    def device(self, __device: _typing.Union[str, torch.device, None]):
+        self.__device: torch.device = self.__formulate_device(__device)
+
+    @property
+    def model(self) -> _typing.Optional[torch.nn.Module]:
+        if self._model is None:
+            base_approach_logger.debug(
+                "property of model NOT initialized before accessing"
+            )
+        return self._model
+
+    @model.setter
+    def model(self, _model: torch.nn.Module) -> None:
+        if not isinstance(_model, torch.nn.Module):
+            raise TypeError(
+                "the property of model MUST be an instance of " "torch.nn.Module"
+            )
+        self._model = _model
+
+    def _initialize(self):
+        raise NotImplementedError
+
+    def initialize(self) -> bool:
+        """
+        Initialize the model in case that the model has NOT been initialized
+        :return: whether self._initialize() method called
+        """
+        if not self.__is_initialized:
+            self._initialize()
+            self.__is_initialized = True
+            return True
+        return False
+
+    # def to(self, *args, **kwargs):
+    #     """
+    #     Due to the signature of to() method in class BaseApproach
+    #     is inconsistent with the signature of the method
+    #     in the base class torch.nn.Module,
+    #     this intermediate overridden method is necessary to
+    #     walk around (bypass) the inspection for
+    #     signature of overriding method.
+    #     :param args: positional arguments list
+    #     :param kwargs: keyword arguments dict
+    #     :return: self
+    #     """
+    #     return super(_BaseBaseModel, self).to(*args, **kwargs)
+
+    def forward(self, *args, **kwargs):
+        if self.model is not None and isinstance(self.model, torch.nn.Module):
+            return self.model(*args, **kwargs)
+        else:
+            raise NotImplementedError
+
+    def __init__(
+        self,
+        model: _typing.Optional[torch.nn.Module] = None,
+        initialize: bool = False,
+        device: _typing.Union[str, torch.device] = ...,
+    ):
+        if type(initialize) != bool:
+            raise TypeError
+        super(_BaseBaseModel, self).__init__()
+        self.__device: torch.device = self.__formulate_device(device)
+        self._model: _typing.Optional[torch.nn.Module] = model
+        self.__is_initialized: bool = False
+        if initialize:
+            self.initialize()
+
+
+class _BaseModel(_BaseBaseModel, BaseModel):
+    """
+    The upcoming root base class for Model, i.e. BaseModel
+    --  Designed by ZiXin Sun
+    """
+
+    # todo: Deprecate and remove the legacy class "BaseModel",
+    #       then rename this class to "BaseModel",
+    #       correspondingly, this class will no longer extend
+    #       the legacy class "BaseModel" after the removal.
+    def _initialize(self):
+        raise NotImplementedError
+
+    def to(self, device: torch.device):
+        self.device = device
+        if self.model is not None and isinstance(self.model, torch.nn.Module):
+            self.model.to(self.device)
+        return super().to(device)
+
+    @property
+    def space(self) -> _typing.Sequence[_typing.Dict[str, _typing.Any]]:
+        # todo: deprecate and remove in future major version
+        return self.__hyper_parameter_space
+
+    @property
+    def hyper_parameter_space(self):
+        return self.__hyper_parameter_space
+
+    @hyper_parameter_space.setter
+    def hyper_parameter_space(
+        self, space: _typing.Sequence[_typing.Dict[str, _typing.Any]]
+    ):
+        self.__hyper_parameter_space = space
+
+    @property
+    def hyper_parameter(self) -> _typing.Dict[str, _typing.Any]:
+        return self.__hyper_parameter
+
+    @hyper_parameter.setter
+    def hyper_parameter(self, _hyper_parameter: _typing.Dict[str, _typing.Any]):
+        if not isinstance(_hyper_parameter, dict):
+            raise TypeError
+        self.__hyper_parameter = _hyper_parameter
+
+    def get_hyper_parameter(self) -> _typing.Dict[str, _typing.Any]:
+        """
+        todo: consider deprecating this trivial getter method in the future
+        :return: copied hyper parameter
+        """
+        return copy.deepcopy(self.__hyper_parameter)
+
+    def __init__(
+        self,
+        model: _typing.Optional[torch.nn.Module] = None,
+        initialize: bool = False,
+        hyper_parameter_space: _typing.Sequence[_typing.Any] = ...,
+        hyper_parameter: _typing.Dict[str, _typing.Any] = ...,
+        device: _typing.Union[str, torch.device] = ...,
+    ):
+        if type(initialize) != bool:
+            raise TypeError
+        super(_BaseModel, self).__init__(model, initialize, device)
+        if hyper_parameter_space != Ellipsis and isinstance(
+            hyper_parameter_space, _typing.Sequence
+        ):
+            self.__hyper_parameter_space: _typing.Sequence[
+                _typing.Dict[str, _typing.Any]
+            ] = hyper_parameter_space
+        else:
+            self.__hyper_parameter_space: _typing.Sequence[
+                _typing.Dict[str, _typing.Any]
+            ] = []
+        if hyper_parameter != Ellipsis and isinstance(hyper_parameter, dict):
+            self.__hyper_parameter: _typing.Dict[str, _typing.Any] = hyper_parameter
+        else:
+            self.__hyper_parameter: _typing.Dict[str, _typing.Any] = {}
+
+    def from_hyper_parameter(self, hyper_parameter: _typing.Dict[str, _typing.Any]):
+        raise NotImplementedError
+
+
+class ClassificationModel(_BaseModel):
+    def _initialize(self):
+        raise NotImplementedError
+
+    def from_hyper_parameter(
+        self, hyper_parameter: _typing.Dict[str, _typing.Any]
+    ) -> "ClassificationModel":
+        new_model: ClassificationModel = self.__class__(
+            num_features=self.num_features,
+            num_classes=self.num_classes,
+            device=self.device,
+            init=False,
+        )
+        _hyper_parameter = self.hyper_parameter
+        _hyper_parameter.update(hyper_parameter)
+        new_model.hyper_parameter = _hyper_parameter
+        new_model.initialize()
+        return new_model
+
+    def __init__(
+        self,
+        num_features: int = ...,
+        num_classes: int = ...,
+        num_graph_features: int = ...,
+        device: _typing.Union[str, torch.device] = ...,
+        hyper_parameter_space: _typing.Sequence[_typing.Any] = ...,
+        hyper_parameter: _typing.Dict[str, _typing.Any] = ...,
+        init: bool = False,
+        **kwargs
+    ):
+        if "initialize" in kwargs:
+            del kwargs["initialize"]
+        super(ClassificationModel, self).__init__(
+            initialize=init,
+            hyper_parameter_space=hyper_parameter_space,
+            hyper_parameter=hyper_parameter,
+            device=device,
+            **kwargs
+        )
+        if num_classes != Ellipsis and type(num_classes) == int:
+            self.__num_classes: int = num_classes if num_classes > 0 else 0
+        else:
+            self.__num_classes: int = 0
+        if num_features != Ellipsis and type(num_features) == int:
+            self.__num_features: int = num_features if num_features > 0 else 0
+        else:
+            self.__num_features: int = 0
+        if num_graph_features != Ellipsis and type(num_graph_features) == int:
+            if num_graph_features > 0:
+                self.__num_graph_features: int = num_graph_features
+            else:
+                self.__num_graph_features: int = 0
+        else:
+            self.__num_graph_features: int = 0
+
+    def __repr__(self) -> str:
+        import yaml
+
+        return yaml.dump(self.hyper_parameter)
+
+    @property
+    def num_classes(self) -> int:
+        return self.__num_classes
+
+    @num_classes.setter
+    def num_classes(self, __num_classes: int):
+        if type(__num_classes) != int:
+            raise TypeError
+        if not __num_classes > 0:
+            raise ValueError
+        self.__num_classes = __num_classes if __num_classes > 0 else 0
+
+    @property
+    def num_features(self) -> int:
+        return self.__num_features
+
+    @num_features.setter
+    def num_features(self, __num_features: int):
+        if type(__num_features) != int:
+            raise TypeError
+        if not __num_features > 0:
+            raise ValueError
+        self.__num_features = __num_features if __num_features > 0 else 0
+
+    def get_num_classes(self) -> int:
+        # todo: consider replacing with property with getter and setter
+        return self.__num_classes
+
+    def set_num_classes(self, num_classes: int) -> None:
+        # todo: consider replacing with property with getter and setter
+        if type(num_classes) != int:
+            raise TypeError
+        self.__num_classes = num_classes if num_classes > 0 else 0
+
+    def get_num_features(self) -> int:
+        # todo: consider replacing with property with getter and setter
+        return self.__num_features
+
+    def set_num_features(self, num_features: int):
+        # todo: consider replacing with property with getter and setter
+        if type(num_features) != int:
+            raise TypeError
+        self.__num_features = num_features if num_features > 0 else 0
+
+    def set_num_graph_features(self, num_graph_features: int):
+        # todo: consider replacing with property with getter and setter
+        if type(num_graph_features) != int:
+            raise TypeError
+        else:
+            if num_graph_features > 0:
+                self.__num_graph_features = num_graph_features
+            else:
+                self.__num_graph_features = 0
+
+
+class _ClassificationModel(torch.nn.Module):
+    def __init__(self):
+        super(_ClassificationModel, self).__init__()
+
+    def cls_encode(self, data) -> torch.Tensor:
+        raise NotImplementedError
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        raise NotImplementedError
+
+    def cls_forward(self, data) -> torch.Tensor:
+        return self.cls_decode(self.cls_encode(data))
+
+
+class ClassificationSupportedSequentialModel(_ClassificationModel):
+    def __init__(self):
+        super(ClassificationSupportedSequentialModel, self).__init__()
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        raise NotImplementedError
+
+    def cls_encode(self, data) -> torch.Tensor:
+        raise NotImplementedError
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        raise NotImplementedError
diff --git a/autogl/module/model/dgl/dataloader_gin.py b/autogl/module/model/dgl/dataloader_gin.py
new file mode 100644
index 0000000..0721b3a
--- /dev/null
+++ b/autogl/module/model/dgl/dataloader_gin.py
@@ -0,0 +1,85 @@
+"""
+PyTorch compatible dataloader
+"""
+
+
+import math
+import numpy as np
+import torch
+from torch.utils.data.sampler import SubsetRandomSampler
+from sklearn.model_selection import StratifiedKFold
+import dgl
+from dgl.dataloading import GraphDataLoader
+
+
+class GINDataLoader():
+    def __init__(self,
+                 dataset,
+                 batch_size,
+                 device,
+                 collate_fn=None,
+                 seed=0,
+                 shuffle=True,
+                 split_name='fold10',
+                 fold_idx=0,
+                 split_ratio=0.7):
+
+        self.shuffle = shuffle
+        self.seed = seed
+        self.kwargs = {'pin_memory': True} if 'cuda' in device.type else {}
+
+        labels = [l for _, l in dataset]
+
+        if split_name == 'fold10':
+            train_idx, valid_idx = self._split_fold10(
+                labels, fold_idx, seed, shuffle)
+        elif split_name == 'rand':
+            train_idx, valid_idx = self._split_rand(
+                labels, split_ratio, seed, shuffle)
+        else:
+            raise NotImplementedError()
+
+        train_sampler = SubsetRandomSampler(train_idx)
+        valid_sampler = SubsetRandomSampler(valid_idx)
+
+        self.train_loader = GraphDataLoader(
+            dataset, sampler=train_sampler,
+            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
+        self.valid_loader = GraphDataLoader(
+            dataset, sampler=valid_sampler,
+            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
+
+    def train_valid_loader(self):
+        return self.train_loader, self.valid_loader
+
+    def _split_fold10(self, labels, fold_idx=0, seed=0, shuffle=True):
+        ''' 10 flod '''
+        assert 0 <= fold_idx and fold_idx < 10, print(
+            "fold_idx must be from 0 to 9.")
+
+        skf = StratifiedKFold(n_splits=10, shuffle=shuffle, random_state=seed)
+        idx_list = []
+        for idx in skf.split(np.zeros(len(labels)), labels):    # split(x, y)
+            idx_list.append(idx)
+        train_idx, valid_idx = idx_list[fold_idx]
+
+        print(
+            "train_set : test_set = %d : %d",
+            len(train_idx), len(valid_idx))
+
+        return train_idx, valid_idx
+
+    def _split_rand(self, labels, split_ratio=0.7, seed=0, shuffle=True):
+        num_entries = len(labels)
+        indices = list(range(num_entries))
+        np.random.seed(seed)
+        np.random.shuffle(indices)
+        split = int(math.floor(split_ratio * num_entries))
+        train_idx, valid_idx = indices[:split], indices[split:]
+
+        print(
+            "train_set : test_set = %d : %d",
+            len(train_idx), len(valid_idx))
+
+        return train_idx, valid_idx
+
diff --git a/autogl/module/model/dgl/gat.py b/autogl/module/model/dgl/gat.py
new file mode 100644
index 0000000..d153685
--- /dev/null
+++ b/autogl/module/model/dgl/gat.py
@@ -0,0 +1,223 @@
+import torch
+import torch.nn.functional as F
+from torch_geometric.nn import GATConv
+from . import register_model
+from .base import BaseModel, activate_func
+from ....utils import get_logger
+
+LOGGER = get_logger("GATModel")
+
+
+def set_default(args, d):
+    for k, v in d.items():
+        if k not in args:
+            args[k] = v
+    return args
+
+
+class GAT(torch.nn.Module):
+    def __init__(self, args):
+        super(GAT, self).__init__()
+        self.args = args
+        self.num_layer = int(self.args["num_layers"])
+
+        missing_keys = list(
+            set(
+                [
+                    "features_num",
+                    "num_class",
+                    "num_layers",
+                    "hidden",
+                    "heads",
+                    "dropout",
+                    "act",
+                ]
+            )
+            - set(self.args.keys())
+        )
+        if len(missing_keys) > 0:
+            raise Exception("Missing keys: %s." % ",".join(missing_keys))
+
+        if not self.num_layer == len(self.args["hidden"]) + 1:
+            LOGGER.warn("Warning: layer size does not match the length of hidden units")
+        self.convs = torch.nn.ModuleList()
+        self.convs.append(
+            GATConv(
+                self.args["features_num"],
+                self.args["hidden"][0],
+                heads=self.args["heads"],
+                dropout=self.args["dropout"],
+            )
+        )
+        last_dim = self.args["hidden"][0] * self.args["heads"]
+        for i in range(self.num_layer - 2):
+            self.convs.append(
+                GATConv(
+                    last_dim,
+                    self.args["hidden"][i + 1],
+                    heads=self.args["heads"],
+                    dropout=self.args["dropout"],
+                )
+            )
+            last_dim = self.args["hidden"][i + 1] * self.args["heads"]
+        self.convs.append(
+            GATConv(
+                last_dim,
+                self.args["num_class"],
+                heads=1,
+                concat=False,
+                dropout=self.args["dropout"],
+            )
+        )
+
+    def forward(self, data):
+        try:
+            x = data.x
+        except:
+            print("no x")
+            pass
+        try:
+            edge_index = data.edge_index
+        except:
+            print("no index")
+            pass
+        try:
+            edge_weight = data.edge_weight
+        except:
+            edge_weight = None
+            pass
+
+        for i in range(self.num_layer):
+            x = F.dropout(x, p=self.args["dropout"], training=self.training)
+            x = self.convs[i](x, edge_index, edge_weight)
+            if i != self.num_layer - 1:
+                x = activate_func(x, self.args["act"])
+
+        return F.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x = data.x
+        for i in range(self.num_layer - 1):
+            x = self.convs[i](x, data.train_pos_edge_index)
+            if i != self.num_layer - 2:
+                x = activate_func(x, self.args["act"])
+                # x = F.dropout(x, p=self.args["dropout"], training=self.training)
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("gat")
+class AutoGAT(BaseModel):
+    r"""
+    AutoGAT. The model used in this automodel is GAT, i.e., the graph attentional network from the `"Graph Attention Networks"
+    <https://arxiv.org/abs/1710.10903>`_ paper. The layer is
+
+    .. math::
+        \mathbf{x}^{\prime}_i = \alpha_{i,i}\mathbf{\Theta}\mathbf{x}_{i} +
+        \sum_{j \in \mathcal{N}(i)} \alpha_{i,j}\mathbf{\Theta}\mathbf{x}_{j}
+
+    where the attention coefficients :math:`\alpha_{i,j}` are computed as
+
+    .. math::
+        \alpha_{i,j} =
+        \frac{
+        \exp\left(\mathrm{LeakyReLU}\left(\mathbf{a}^{\top}
+        [\mathbf{\Theta}\mathbf{x}_i \, \Vert \, \mathbf{\Theta}\mathbf{x}_j]
+        \right)\right)}
+        {\sum_{k \in \mathcal{N}(i) \cup \{ i \}}
+        \exp\left(\mathrm{LeakyReLU}\left(\mathbf{a}^{\top}
+        [\mathbf{\Theta}\mathbf{x}_i \, \Vert \, \mathbf{\Theta}\mathbf{x}_k]
+        \right)\right)}.
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+
+    args: Other parameters.
+    """
+
+    def __init__(
+        self, num_features=None, num_classes=None, device=None, init=False, **args
+    ):
+        super(AutoGAT, self).__init__()
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [64, 64, 64],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "heads",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,4,8,16",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+        ]
+
+        self.hyperparams = {
+            "num_layers": 2,
+            "hidden": [32],
+            "heads": 4,
+            "dropout": 0.2,
+            "act": "leaky_relu",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        # """Initialize model."""
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GAT({**self.params, **self.hyperparams}).to(self.device)
diff --git a/autogl/module/model/dgl/gcn.py b/autogl/module/model/dgl/gcn.py
new file mode 100644
index 0000000..30bc1a7
--- /dev/null
+++ b/autogl/module/model/dgl/gcn.py
@@ -0,0 +1,408 @@
+import torch
+import torch.nn.functional
+import typing as _typing
+
+from torch_geometric.nn.conv import GCNConv
+import autogl.data
+from . import register_model
+from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
+from ....utils import get_logger
+
+LOGGER = get_logger("GCNModel")
+
+
+class GCN(ClassificationSupportedSequentialModel):
+    class _GCNLayer(torch.nn.Module):
+        def __init__(
+            self,
+            input_channels: int,
+            output_channels: int,
+            add_self_loops: bool = True,
+            normalize: bool = True,
+            activation_name: _typing.Optional[str] = ...,
+            dropout_probability: _typing.Optional[float] = ...,
+        ):
+            super().__init__()
+            self._convolution: GCNConv = GCNConv(
+                input_channels,
+                output_channels,
+                add_self_loops=bool(add_self_loops),
+                normalize=bool(normalize),
+            )
+            if (
+                activation_name is not Ellipsis
+                and activation_name is not None
+                and type(activation_name) == str
+            ):
+                self._activation_name: _typing.Optional[str] = activation_name
+            else:
+                self._activation_name: _typing.Optional[str] = None
+            if (
+                dropout_probability is not Ellipsis
+                and dropout_probability is not None
+                and type(dropout_probability) == float
+            ):
+                if dropout_probability < 0:
+                    dropout_probability = 0
+                if dropout_probability > 1:
+                    dropout_probability = 1
+                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
+                    dropout_probability
+                )
+            else:
+                self._dropout: _typing.Optional[torch.nn.Dropout] = None
+
+        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
+            x: torch.Tensor = getattr(data, "x")
+            edge_index: torch.LongTensor = getattr(data, "edge_index")
+            edge_weight: _typing.Optional[torch.Tensor] = getattr(
+                data, "edge_weight", None
+            )
+            """ Validate the arguments """
+            if not type(x) == type(edge_index) == torch.Tensor:
+                raise TypeError
+            if edge_weight is not None and (
+                type(edge_weight) != torch.Tensor
+                or edge_index.size() != (2, edge_weight.size(0))
+            ):
+                edge_weight: _typing.Optional[torch.Tensor] = None
+
+            x: torch.Tensor = self._convolution.forward(x, edge_index, edge_weight)
+            if self._activation_name is not None and enable_activation:
+                x: torch.Tensor = activate_func(x, self._activation_name)
+            if self._dropout is not None:
+                x: torch.Tensor = self._dropout.forward(x)
+            return x
+
+    def __init__(
+        self,
+        num_features: int,
+        num_classes: int,
+        hidden_features: _typing.Sequence[int],
+        activation_name: str,
+        dropout: _typing.Union[
+            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
+        ] = None,
+        add_self_loops: bool = True,
+        normalize: bool = True,
+    ):
+        if isinstance(dropout, _typing.Sequence):
+            if len(dropout) != len(hidden_features) + 1:
+                raise TypeError(
+                    "When the dropout argument is a sequence, "
+                    "The sequence length must equal to the number of layers to construct."
+                )
+            for _dropout in dropout:
+                if _dropout is not None and type(_dropout) != float:
+                    raise TypeError(
+                        "When the dropout argument is a sequence, "
+                        "every item in the sequence must be float or None"
+                    )
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = dropout
+        elif type(dropout) == float:
+            if dropout < 0:
+                dropout = 0
+            if dropout > 1:
+                dropout = 1
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
+                dropout for _ in range(len(hidden_features))
+            ] + [None]
+        elif dropout in (None, Ellipsis, ...):
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
+                None for _ in range(len(hidden_features) + 1)
+            ]
+        else:
+            raise TypeError(
+                "The provided dropout argument must be a float number or None or "
+                "a sequence in which each item is either a float Number or None."
+            )
+        super().__init__()
+        if len(hidden_features) == 0:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    (
+                        self._GCNLayer(
+                            num_features,
+                            num_classes,
+                            add_self_loops,
+                            normalize,
+                            dropout_probability=dropout_list[0],
+                        ),
+                    )
+                )
+            )
+        else:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList()
+            )
+            self.__sequential_encoding_layers.append(
+                self._GCNLayer(
+                    num_features,
+                    hidden_features[0],
+                    add_self_loops,
+                    normalize,
+                    activation_name,
+                    dropout_list[0],
+                )
+            )
+            for hidden_feature_index in range(len(hidden_features)):
+                if hidden_feature_index + 1 < len(hidden_features):
+                    self.__sequential_encoding_layers.append(
+                        self._GCNLayer(
+                            hidden_features[hidden_feature_index],
+                            hidden_features[hidden_feature_index + 1],
+                            add_self_loops,
+                            normalize,
+                            activation_name,
+                            dropout_list[hidden_feature_index + 1],
+                        )
+                    )
+                else:
+                    self.__sequential_encoding_layers.append(
+                        self._GCNLayer(
+                            hidden_features[hidden_feature_index],
+                            num_classes,
+                            add_self_loops,
+                            normalize,
+                            dropout_list[-1],
+                        )
+                    )
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        return self.__sequential_encoding_layers
+
+    def __extract_edge_indexes_and_weights(
+        self, data
+    ) -> _typing.Union[
+        _typing.Sequence[
+            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
+        ],
+        _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
+    ]:
+        def __compose_edge_index_and_weight(
+            _edge_index: torch.LongTensor,
+            _edge_weight: _typing.Optional[torch.Tensor] = None,
+        ) -> _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]:
+            if type(_edge_index) != torch.Tensor or _edge_index.dtype != torch.int64:
+                raise TypeError
+            if _edge_weight is not None and (
+                type(_edge_weight) != torch.Tensor
+                or _edge_index.size() != (2, _edge_weight.size(0))
+            ):
+                _edge_weight: _typing.Optional[torch.Tensor] = None
+            return _edge_index, _edge_weight
+
+        if not (
+            hasattr(data, "edge_indexes")
+            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
+            and len(getattr(data, "edge_indexes"))
+            == len(self.__sequential_encoding_layers)
+        ):
+            return __compose_edge_index_and_weight(
+                getattr(data, "edge_index"), getattr(data, "edge_weight", None)
+            )
+        for __edge_index in getattr(data, "edge_indexes"):
+            if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
+                return __compose_edge_index_and_weight(
+                    getattr(data, "edge_index"), getattr(data, "edge_weight", None)
+                )
+
+        if (
+            hasattr(data, "edge_weights")
+            and isinstance(getattr(data, "edge_weights"), _typing.Sequence)
+            and len(getattr(data, "edge_weights"))
+            == len(self.__sequential_encoding_layers)
+        ):
+            return [
+                __compose_edge_index_and_weight(_edge_index, _edge_weight)
+                for _edge_index, _edge_weight in zip(
+                    getattr(data, "edge_indexes"), getattr(data, "edge_weights")
+                )
+            ]
+        else:
+            return [
+                __compose_edge_index_and_weight(__edge_index)
+                for __edge_index in getattr(data, "edge_indexes")
+            ]
+
+    def cls_encode(self, data) -> torch.Tensor:
+        edge_indexes_and_weights: _typing.Union[
+            _typing.Sequence[
+                _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
+            ],
+            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
+        ] = self.__extract_edge_indexes_and_weights(data)
+
+        if (not isinstance(edge_indexes_and_weights, tuple)) and isinstance(
+            edge_indexes_and_weights[0], tuple
+        ):
+            """ edge_indexes_and_weights is sequence of (edge_index, edge_weight) """
+            assert len(edge_indexes_and_weights) == len(
+                self.__sequential_encoding_layers
+            )
+            x: torch.Tensor = getattr(data, "x")
+            for _edge_index_and_weight, gcn in zip(
+                edge_indexes_and_weights, self.__sequential_encoding_layers
+            ):
+                _temp_data = autogl.data.Data(x=x, edge_index=_edge_index_and_weight[0])
+                _temp_data.edge_weight = _edge_index_and_weight[1]
+                x = gcn(_temp_data)
+            return x
+        else:
+            """ edge_indexes_and_weights is (edge_index, edge_weight) """
+            x = getattr(data, "x")
+            for gcn in self.__sequential_encoding_layers:
+                _temp_data = autogl.data.Data(
+                    x=x, edge_index=edge_indexes_and_weights[0]
+                )
+                _temp_data.edge_weight = edge_indexes_and_weights[1]
+                x = gcn(_temp_data)
+            return x
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        return torch.nn.functional.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x: torch.Tensor = getattr(data, "x")
+        for i in range(len(self.__sequential_encoding_layers) - 2):
+            x = self.__sequential_encoding_layers[i](
+                autogl.data.Data(x, getattr(data, "edge_index"))
+            )
+        x = self.__sequential_encoding_layers[-2](
+            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
+        )
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("gcn")
+class AutoGCN(BaseModel):
+    r"""
+    AutoGCN.
+    The model used in this automodel is GCN, i.e., the graph convolutional network from the
+    `"Semi-supervised Classification with Graph Convolutional
+    Networks" <https://arxiv.org/abs/1609.02907>`_ paper. The layer is
+
+    .. math::
+
+        \mathbf{X}^{\prime} = \mathbf{\hat{D}}^{-1/2} \mathbf{\hat{A}}
+        \mathbf{\hat{D}}^{-1/2} \mathbf{X} \mathbf{\Theta},
+
+    where :math:`\mathbf{\hat{A}} = \mathbf{A} + \mathbf{I}` denotes the
+    adjacency matrix with inserted self-loops and
+    :math:`\hat{D}_{ii} = \sum_{j=0} \hat{A}_{ij}` its diagonal degree matrix.
+
+    Parameters
+    ----------
+    num_features: ``int``
+        The dimension of features.
+
+    num_classes: ``int``
+        The number of classes.
+
+    device: ``torch.device`` or ``str``
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+    """
+
+    def __init__(
+        self,
+        num_features: int = ...,
+        num_classes: int = ...,
+        device: _typing.Union[str, torch.device] = ...,
+        init: bool = False,
+        **kwargs
+    ) -> None:
+        super().__init__()
+        self.num_features = num_features
+        self.num_classes = num_classes
+        self.device = device
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "add_self_loops",
+                "type": "CATEGORICAL",
+                "feasiblePoints": [1],
+            },
+            {
+                "parameterName": "normalize",
+                "type": "CATEGORICAL",
+                "feasiblePoints": [1],
+            },
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [128, 128, 128],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+        ]
+
+        # initial point of hp search
+        # self.hyperparams = {
+        #     "num_layers": 2,
+        #     "hidden": [16],
+        #     "dropout": 0.2,
+        #     "act": "leaky_relu",
+        # }
+
+        self.hyperparams = {
+            "num_layers": 3,
+            "hidden": [128, 64],
+            "dropout": 0,
+            "act": "relu",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GCN(
+            self.num_features,
+            self.num_classes,
+            self.hyperparams.get("hidden"),
+            self.hyperparams.get("act"),
+            self.hyperparams.get("dropout", None),
+            bool(self.hyperparams.get("add_self_loops", True)),
+            bool(self.hyperparams.get("normalize", True)),
+        ).to(self.device)
diff --git a/autogl/module/model/dgl/gin.py b/autogl/module/model/dgl/gin.py
new file mode 100644
index 0000000..52a495a
--- /dev/null
+++ b/autogl/module/model/dgl/gin.py
@@ -0,0 +1,232 @@
+import torch
+import torch.nn.functional as F
+from torch.nn import Linear, ReLU, Sequential, LeakyReLU, Tanh, ELU
+from torch_geometric.nn import GINConv, global_add_pool
+from torch.nn import BatchNorm1d
+from . import register_model
+from .base import BaseModel, activate_func
+from copy import deepcopy
+from ....utils import get_logger
+
+LOGGER = get_logger("GINModel")
+
+
+def set_default(args, d):
+    for k, v in d.items():
+        if k not in args:
+            args[k] = v
+    return args
+
+
+class GIN(torch.nn.Module):
+    def __init__(self, args):
+        super(GIN, self).__init__()
+        self.args = args
+        self.num_layer = int(self.args["num_layers"])
+        assert self.num_layer > 2, "Number of layers in GIN should not less than 3"
+
+        missing_keys = list(
+            set(
+                [
+                    "features_num",
+                    "num_class",
+                    "num_graph_features",
+                    "num_layers",
+                    "hidden",
+                    "dropout",
+                    "act",
+                    "mlp_layers",
+                    "eps",
+                ]
+            )
+            - set(self.args.keys())
+        )
+        if len(missing_keys) > 0:
+            raise Exception("Missing keys: %s." % ",".join(missing_keys))
+        if not self.num_layer == len(self.args["hidden"]) + 1:
+            LOGGER.warn("Warning: layer size does not match the length of hidden units")
+        self.num_graph_features = self.args["num_graph_features"]
+
+        if self.args["act"] == "leaky_relu":
+            act = LeakyReLU()
+        elif self.args["act"] == "relu":
+            act = ReLU()
+        elif self.args["act"] == "elu":
+            act = ELU()
+        elif self.args["act"] == "tanh":
+            act = Tanh()
+        else:
+            act = ReLU()
+
+        train_eps = True if self.args["eps"] == "True" else False
+
+        self.convs = torch.nn.ModuleList()
+        self.bns = torch.nn.ModuleList()
+
+        nn = [Linear(self.args["features_num"], self.args["hidden"][0])]
+        for _ in range(self.args["mlp_layers"] - 1):
+            nn.append(act)
+            nn.append(Linear(self.args["hidden"][0], self.args["hidden"][0]))
+        # nn.append(BatchNorm1d(self.args['hidden'][0]))
+        self.convs.append(GINConv(Sequential(*nn), train_eps=train_eps))
+        self.bns.append(BatchNorm1d(self.args["hidden"][0]))
+
+        for i in range(self.num_layer - 3):
+            nn = [Linear(self.args["hidden"][i], self.args["hidden"][i + 1])]
+            for _ in range(self.args["mlp_layers"] - 1):
+                nn.append(act)
+                nn.append(
+                    Linear(self.args["hidden"][i + 1], self.args["hidden"][i + 1])
+                )
+            # nn.append(BatchNorm1d(self.args['hidden'][i+1]))
+            self.convs.append(GINConv(Sequential(*nn), train_eps=train_eps))
+            self.bns.append(BatchNorm1d(self.args["hidden"][i + 1]))
+
+        self.fc1 = Linear(
+            self.args["hidden"][self.num_layer - 3] + self.num_graph_features,
+            self.args["hidden"][self.num_layer - 2],
+        )
+        self.fc2 = Linear(
+            self.args["hidden"][self.num_layer - 2], self.args["num_class"]
+        )
+
+    def forward(self, data):
+        x, edge_index, batch = data.x, data.edge_index, data.batch
+
+        if self.num_graph_features > 0:
+            graph_feature = data.gf
+
+        for i in range(self.num_layer - 2):
+            x = self.convs[i](x, edge_index)
+            x = activate_func(x, self.args["act"])
+            x = self.bns[i](x)
+
+        x = global_add_pool(x, batch)
+        if self.num_graph_features > 0:
+            x = torch.cat([x, graph_feature], dim=-1)
+        x = self.fc1(x)
+        x = activate_func(x, self.args["act"])
+        x = F.dropout(x, p=self.args["dropout"], training=self.training)
+
+        x = self.fc2(x)
+
+        return F.log_softmax(x, dim=1)
+
+
+@register_model("gin")
+class AutoGIN(BaseModel):
+    r"""
+    AutoGIN. The model used in this automodel is GIN, i.e., the graph isomorphism network from the `"How Powerful are
+    Graph Neural Networks?" <https://arxiv.org/abs/1810.00826>`_ paper. The layer is
+
+    .. math::
+        \mathbf{x}^{\prime}_i = h_{\mathbf{\Theta}} \left( (1 + \epsilon) \cdot
+        \mathbf{x}_i + \sum_{j \in \mathcal{N}(i)} \mathbf{x}_j \right)
+
+    or
+
+    .. math::
+        \mathbf{X}^{\prime} = h_{\mathbf{\Theta}} \left( \left( \mathbf{A} +
+        (1 + \epsilon) \cdot \mathbf{I} \right) \cdot \mathbf{X} \right),
+
+    here :math:`h_{\mathbf{\Theta}}` denotes a neural network, *.i.e.* an MLP.
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+    """
+
+    def __init__(
+        self,
+        num_features=None,
+        num_classes=None,
+        device=None,
+        init=False,
+        num_graph_features=None,
+        **args
+    ):
+
+        super(AutoGIN, self).__init__()
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.num_graph_features = (
+            int(num_graph_features) if num_graph_features is not None else 0
+        )
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+            "num_graph_features": self.num_graph_features,
+        }
+        self.space = [
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "4,5,6",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 5,
+                "minValue": [8, 8, 8, 8, 8],
+                "maxValue": [64, 64, 64, 64, 64],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.9,
+                "minValue": 0.1,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+            {
+                "parameterName": "eps",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["True", "False"],
+            },
+            {
+                "parameterName": "mlp_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+        ]
+
+        self.hyperparams = {
+            "num_layers": 3,
+            "hidden": [64, 32],
+            "dropout": 0.5,
+            "act": "relu",
+            "eps": "True",
+            "mlp_layers": 2,
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        # """Initialize model."""
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GIN({**self.params, **self.hyperparams}).to(self.device)
diff --git a/autogl/module/model/dgl/gin_dgl.py b/autogl/module/model/dgl/gin_dgl.py
new file mode 100644
index 0000000..8a5408e
--- /dev/null
+++ b/autogl/module/model/dgl/gin_dgl.py
@@ -0,0 +1,171 @@
+"""
+How Powerful are Graph Neural Networks
+https://arxiv.org/abs/1810.00826
+https://openreview.net/forum?id=ryGs6iA5Km
+Author's implementation: https://github.com/weihua916/powerful-gnns
+"""
+
+
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+from dgl.nn.pytorch.conv import GINConv
+from dgl.nn.pytorch.glob import SumPooling, AvgPooling, MaxPooling
+
+
+class ApplyNodeFunc(nn.Module):
+    """Update the node feature hv with MLP, BN and ReLU."""
+    def __init__(self, mlp):
+        super(ApplyNodeFunc, self).__init__()
+        self.mlp = mlp
+        self.bn = nn.BatchNorm1d(self.mlp.output_dim)
+
+    def forward(self, h):
+        h = self.mlp(h)
+        h = self.bn(h)
+        h = F.relu(h)
+        return h
+
+
+class MLP(nn.Module):
+    """MLP with linear output"""
+    def __init__(self, num_layers, input_dim, hidden_dim, output_dim):
+        """MLP layers construction
+
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+
+        """
+        super(MLP, self).__init__()
+        self.linear_or_not = True  # default is linear model
+        self.num_layers = num_layers
+        self.output_dim = output_dim
+
+        if num_layers < 1:
+            raise ValueError("number of layers should be positive!")
+        elif num_layers == 1:
+            # Linear model
+            self.linear = nn.Linear(input_dim, output_dim)
+        else:
+            # Multi-layer model
+            self.linear_or_not = False
+            self.linears = torch.nn.ModuleList()
+            self.batch_norms = torch.nn.ModuleList()
+
+            self.linears.append(nn.Linear(input_dim, hidden_dim))
+            for layer in range(num_layers - 2):
+                self.linears.append(nn.Linear(hidden_dim, hidden_dim))
+            self.linears.append(nn.Linear(hidden_dim, output_dim))
+
+            for layer in range(num_layers - 1):
+                self.batch_norms.append(nn.BatchNorm1d((hidden_dim)))
+
+    def forward(self, x):
+        if self.linear_or_not:
+            # If linear model
+            return self.linear(x)
+        else:
+            # If MLP
+            h = x
+            for i in range(self.num_layers - 1):
+                h = F.relu(self.batch_norms[i](self.linears[i](h)))
+            return self.linears[-1](h)
+
+
+class GIN(nn.Module):
+    """GIN model"""
+    def __init__(self, num_layers, num_mlp_layers, input_dim, hidden_dim,
+                 output_dim, final_dropout, learn_eps, graph_pooling_type,
+                 neighbor_pooling_type):
+        """model parameters setting
+
+        Paramters
+        ---------
+        num_layers: int
+            The number of linear layers in the neural network
+        num_mlp_layers: int
+            The number of linear layers in mlps
+        input_dim: int
+            The dimensionality of input features
+        hidden_dim: int
+            The dimensionality of hidden units at ALL layers
+        output_dim: int
+            The number of classes for prediction
+        final_dropout: float
+            dropout ratio on the final linear layer
+        learn_eps: boolean
+            If True, learn epsilon to distinguish center nodes from neighbors
+            If False, aggregate neighbors and center nodes altogether.
+        neighbor_pooling_type: str
+            how to aggregate neighbors (sum, mean, or max)
+        graph_pooling_type: str
+            how to aggregate entire nodes in a graph (sum, mean or max)
+
+        """
+        super(GIN, self).__init__()
+        self.num_layers = num_layers
+        self.learn_eps = learn_eps
+
+        # List of MLPs
+        self.ginlayers = torch.nn.ModuleList()
+        self.batch_norms = torch.nn.ModuleList()
+
+        for layer in range(self.num_layers - 1):
+            if layer == 0:
+                mlp = MLP(num_mlp_layers, input_dim, hidden_dim, hidden_dim)
+            else:
+                mlp = MLP(num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)
+
+            self.ginlayers.append(
+                GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, self.learn_eps))
+            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))
+
+        # Linear function for graph poolings of output of each layer
+        # which maps the output of different layers into a prediction score
+        self.linears_prediction = torch.nn.ModuleList()
+
+        for layer in range(num_layers):
+            if layer == 0:
+                self.linears_prediction.append(
+                    nn.Linear(input_dim, output_dim))
+            else:
+                self.linears_prediction.append(
+                    nn.Linear(hidden_dim, output_dim))
+
+        self.drop = nn.Dropout(final_dropout)
+
+        if graph_pooling_type == 'sum':
+            self.pool = SumPooling()
+        elif graph_pooling_type == 'mean':
+            self.pool = AvgPooling()
+        elif graph_pooling_type == 'max':
+            self.pool = MaxPooling()
+        else:
+            raise NotImplementedError
+
+    def forward(self, g, h):
+        # list of hidden representation at each layer (including input)
+        hidden_rep = [h]
+
+        for i in range(self.num_layers - 1):
+            h = self.ginlayers[i](g, h)
+            h = self.batch_norms[i](h)
+            h = F.relu(h)
+            hidden_rep.append(h)
+
+        score_over_layer = 0
+
+        # perform pooling over all nodes in each graph in every layer
+        for i, h in enumerate(hidden_rep):
+            pooled_h = self.pool(g, h)
+            score_over_layer += self.drop(self.linears_prediction[i](pooled_h))
+
+        return score_over_layer
diff --git a/autogl/module/model/dgl/ginparser.py b/autogl/module/model/dgl/ginparser.py
new file mode 100644
index 0000000..280aa12
--- /dev/null
+++ b/autogl/module/model/dgl/ginparser.py
@@ -0,0 +1,81 @@
+"""Parser for arguments
+
+Put all arguments in one file and group similar arguments
+"""
+import argparse
+
+
+class Parser():
+
+    def __init__(self, description):
+        '''
+           arguments parser
+        '''
+        self.parser = argparse.ArgumentParser(description=description)
+        self.args = None
+        self._parse()
+
+    def _parse(self):
+        # dataset
+        self.parser.add_argument(
+            '--dataset', type=str, default="MUTAG",
+            choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI'],
+            help='name of dataset (default: MUTAG)')
+        self.parser.add_argument(
+            '--batch_size', type=int, default=32,
+            help='batch size for training and validation (default: 32)')
+        self.parser.add_argument(
+            '--fold_idx', type=int, default=0,
+            help='the index(<10) of fold in 10-fold validation.')
+        self.parser.add_argument(
+            '--filename', type=str, default="",
+            help='output file')
+
+        # device
+        self.parser.add_argument(
+            '--disable-cuda', action='store_true',
+            help='Disable CUDA')
+        self.parser.add_argument(
+            '--device', type=int, default=0,
+            help='which gpu device to use (default: 0)')
+
+        # net
+        self.parser.add_argument(
+            '--num_layers', type=int, default=5,
+            help='number of layers (default: 5)')
+        self.parser.add_argument(
+            '--num_mlp_layers', type=int, default=2,
+            help='number of MLP layers(default: 2). 1 means linear model.')
+        self.parser.add_argument(
+            '--hidden_dim', type=int, default=64,
+            help='number of hidden units (default: 64)')
+
+        # graph
+        self.parser.add_argument(
+            '--graph_pooling_type', type=str,
+            default="sum", choices=["sum", "mean", "max"],
+            help='type of graph pooling: sum, mean or max')
+        self.parser.add_argument(
+            '--neighbor_pooling_type', type=str,
+            default="sum", choices=["sum", "mean", "max"],
+            help='type of neighboring pooling: sum, mean or max')
+        self.parser.add_argument(
+            '--learn_eps', action="store_true",
+            help='learn the epsilon weighting')
+
+        # learning
+        self.parser.add_argument(
+            '--seed', type=int, default=0,
+            help='random seed (default: 0)')
+        self.parser.add_argument(
+            '--epochs', type=int, default=350,
+            help='number of epochs to train (default: 350)')
+        self.parser.add_argument(
+            '--lr', type=float, default=0.01,
+            help='learning rate (default: 0.01)')
+        self.parser.add_argument(
+            '--final_dropout', type=float, default=0.5,
+            help='final layer dropout (default: 0.5)')
+
+        # done
+        self.args = self.parser.parse_args()
diff --git a/autogl/module/model/dgl/graph_saint.py b/autogl/module/model/dgl/graph_saint.py
new file mode 100644
index 0000000..1b4bc7a
--- /dev/null
+++ b/autogl/module/model/dgl/graph_saint.py
@@ -0,0 +1,407 @@
+import typing as _typing
+import torch.nn.functional
+from torch_geometric.nn.conv import MessagePassing
+from torch_sparse import SparseTensor, matmul
+
+from . import register_model
+from .base import ClassificationModel, ClassificationSupportedSequentialModel
+
+
+class _GraphSAINTAggregationLayers:
+    class MultiOrderAggregationLayer(torch.nn.Module):
+        class Order0Aggregator(torch.nn.Module):
+            def __init__(
+                self,
+                input_dimension: int,
+                output_dimension: int,
+                bias: bool = True,
+                activation: _typing.Optional[str] = "ReLU",
+                batch_norm: bool = True,
+            ):
+                super().__init__()
+                if not type(input_dimension) == type(output_dimension) == int:
+                    raise TypeError
+                if not (input_dimension > 0 and output_dimension > 0):
+                    raise ValueError
+                if not type(bias) == bool:
+                    raise TypeError
+                self.__linear_transform = torch.nn.Linear(
+                    input_dimension, output_dimension, bias
+                )
+                self.__linear_transform.reset_parameters()
+                if type(activation) == str:
+                    if activation.lower() == "ReLU".lower():
+                        self.__activation = torch.nn.functional.relu
+                    elif activation.lower() == "elu":
+                        self.__activation = torch.nn.functional.elu
+                    elif hasattr(torch.nn.functional, activation) and callable(
+                        getattr(torch.nn.functional, activation)
+                    ):
+                        self.__activation = getattr(torch.nn.functional, activation)
+                    else:
+                        self.__activation = lambda x: x
+                else:
+                    self.__activation = lambda x: x
+                if type(batch_norm) != bool:
+                    raise TypeError
+                else:
+                    self.__optional_batch_normalization: _typing.Optional[
+                        torch.nn.BatchNorm1d
+                    ] = (
+                        torch.nn.BatchNorm1d(output_dimension, 1e-8)
+                        if batch_norm
+                        else None
+                    )
+
+            def forward(
+                self,
+                x: _typing.Union[
+                    torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]
+                ],
+                _edge_index: torch.Tensor,
+                _edge_weight: _typing.Optional[torch.Tensor] = None,
+                _size: _typing.Optional[_typing.Tuple[int, int]] = None,
+            ) -> torch.Tensor:
+                __output: torch.Tensor = self.__linear_transform(x)
+                if self.__activation is not None and callable(self.__activation):
+                    __output: torch.Tensor = self.__activation(__output)
+                if self.__optional_batch_normalization is not None and isinstance(
+                    self.__optional_batch_normalization, torch.nn.BatchNorm1d
+                ):
+                    __output: torch.Tensor = self.__optional_batch_normalization(
+                        __output
+                    )
+                return __output
+
+        class Order1Aggregator(MessagePassing):
+            def __init__(
+                self,
+                input_dimension: int,
+                output_dimension: int,
+                bias: bool = True,
+                activation: _typing.Optional[str] = "ReLU",
+                batch_norm: bool = True,
+            ):
+                super().__init__(aggr="add")
+                if not type(input_dimension) == type(output_dimension) == int:
+                    raise TypeError
+                if not (input_dimension > 0 and output_dimension > 0):
+                    raise ValueError
+                if not type(bias) == bool:
+                    raise TypeError
+                self.__linear_transform = torch.nn.Linear(
+                    input_dimension, output_dimension, bias
+                )
+                self.__linear_transform.reset_parameters()
+                if type(activation) == str:
+                    if activation.lower() == "ReLU".lower():
+                        self.__activation = torch.nn.functional.relu
+                    elif activation.lower() == "elu":
+                        self.__activation = torch.nn.functional.elu
+                    elif hasattr(torch.nn.functional, activation) and callable(
+                        getattr(torch.nn.functional, activation)
+                    ):
+                        self.__activation = getattr(torch.nn.functional, activation)
+                    else:
+                        self.__activation = lambda x: x
+                else:
+                    self.__activation = lambda x: x
+                if type(batch_norm) != bool:
+                    raise TypeError
+                else:
+                    self.__optional_batch_normalization: _typing.Optional[
+                        torch.nn.BatchNorm1d
+                    ] = (
+                        torch.nn.BatchNorm1d(output_dimension, 1e-8)
+                        if batch_norm
+                        else None
+                    )
+
+            def forward(
+                self,
+                x: _typing.Union[
+                    torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]
+                ],
+                _edge_index: torch.Tensor,
+                _edge_weight: _typing.Optional[torch.Tensor] = None,
+                _size: _typing.Optional[_typing.Tuple[int, int]] = None,
+            ) -> torch.Tensor:
+
+                if type(x) == torch.Tensor:
+                    x: _typing.Tuple[torch.Tensor, torch.Tensor] = (x, x)
+
+                __output = self.propagate(
+                    _edge_index, x=x, edge_weight=_edge_weight, size=_size
+                )
+                __output: torch.Tensor = self.__linear_transform(__output)
+                if self.__activation is not None and callable(self.__activation):
+                    __output: torch.Tensor = self.__activation(__output)
+                if self.__optional_batch_normalization is not None and isinstance(
+                    self.__optional_batch_normalization, torch.nn.BatchNorm1d
+                ):
+                    __output: torch.Tensor = self.__optional_batch_normalization(
+                        __output
+                    )
+                return __output
+
+            def message(
+                self, x_j: torch.Tensor, edge_weight: _typing.Optional[torch.Tensor]
+            ) -> torch.Tensor:
+                return x_j if edge_weight is None else edge_weight.view(-1, 1) * x_j
+
+            def message_and_aggregate(
+                self,
+                adj_t: SparseTensor,
+                x: _typing.Union[
+                    torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]
+                ],
+            ) -> torch.Tensor:
+                return matmul(adj_t, x[0], reduce=self.aggr)
+
+        @property
+        def integral_output_dimension(self) -> int:
+            return (self._order + 1) * self._each_order_output_dimension
+
+        def __init__(
+            self,
+            _input_dimension: int,
+            _each_order_output_dimension: int,
+            _order: int,
+            bias: bool = True,
+            activation: _typing.Optional[str] = "ReLU",
+            batch_norm: bool = True,
+            _dropout: _typing.Optional[float] = ...,
+        ):
+            super().__init__()
+            if not (
+                type(_input_dimension) == type(_order) == int
+                and type(_each_order_output_dimension) == int
+            ):
+                raise TypeError
+            if _input_dimension <= 0 or _each_order_output_dimension <= 0:
+                raise ValueError
+            if _order not in (0, 1):
+                raise ValueError("Unsupported order number")
+            self._input_dimension: int = _input_dimension
+            self._each_order_output_dimension: int = _each_order_output_dimension
+            self._order: int = _order
+            if type(bias) != bool:
+                raise TypeError
+            self.__order0_transform = self.Order0Aggregator(
+                self._input_dimension,
+                self._each_order_output_dimension,
+                bias,
+                activation,
+                batch_norm,
+            )
+            if _order == 1:
+                self.__order1_transform = self.Order1Aggregator(
+                    self._input_dimension,
+                    self._each_order_output_dimension,
+                    bias,
+                    activation,
+                    batch_norm,
+                )
+            else:
+                self.__order1_transform = None
+            if _dropout is not None and type(_dropout) == float:
+                if _dropout < 0:
+                    _dropout = 0
+                if _dropout > 1:
+                    _dropout = 1
+                self.__optional_dropout: _typing.Optional[
+                    torch.nn.Dropout
+                ] = torch.nn.Dropout(_dropout)
+            else:
+                self.__optional_dropout: _typing.Optional[torch.nn.Dropout] = None
+
+        def _forward(
+            self,
+            x: _typing.Union[torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]],
+            edge_index: torch.Tensor,
+            edge_weight: _typing.Optional[torch.Tensor] = None,
+            size: _typing.Optional[_typing.Tuple[int, int]] = None,
+        ) -> torch.Tensor:
+            if self.__order1_transform is not None and isinstance(
+                self.__order1_transform, self.Order1Aggregator
+            ):
+                __output: torch.Tensor = torch.cat(
+                    [
+                        self.__order0_transform(x, edge_index, edge_weight, size),
+                        self.__order1_transform(x, edge_index, edge_weight, size),
+                    ],
+                    dim=1,
+                )
+            else:
+                __output: torch.Tensor = self.__order0_transform(
+                    x, edge_index, edge_weight, size
+                )
+            if self.__optional_dropout is not None and isinstance(
+                self.__optional_dropout, torch.nn.Dropout
+            ):
+                __output: torch.Tensor = self.__optional_dropout(__output)
+            return __output
+
+        def forward(self, data) -> torch.Tensor:
+            x: torch.Tensor = getattr(data, "x")
+            if type(x) != torch.Tensor:
+                raise TypeError
+            edge_index: torch.LongTensor = getattr(data, "edge_index")
+            if type(edge_index) != torch.Tensor:
+                raise TypeError
+            edge_weight: _typing.Optional[torch.Tensor] = getattr(
+                data, "edge_weight", None
+            )
+            if edge_weight is not None and type(edge_weight) != torch.Tensor:
+                raise TypeError
+            return self._forward(x, edge_index, edge_weight)
+
+    class WrappedDropout(torch.nn.Module):
+        def __init__(self, dropout_module: torch.nn.Dropout):
+            super().__init__()
+            self.__dropout_module: torch.nn.Dropout = dropout_module
+
+        def forward(self, tenser_or_data) -> torch.Tensor:
+            if type(tenser_or_data) == torch.Tensor:
+                return self.__dropout_module(tenser_or_data)
+            elif (
+                hasattr(tenser_or_data, "x")
+                and type(getattr(tenser_or_data, "x")) == torch.Tensor
+            ):
+                return self.__dropout_module(getattr(tenser_or_data, "x"))
+            else:
+                raise TypeError
+
+
+class GraphSAINTMultiOrderAggregationModel(ClassificationSupportedSequentialModel):
+    def __init__(
+        self,
+        num_features: int,
+        num_classes: int,
+        _output_dimension_for_each_order: int,
+        _layers_order_list: _typing.Sequence[int],
+        _pre_dropout: float,
+        _layers_dropout: _typing.Union[float, _typing.Sequence[float]],
+        activation: _typing.Optional[str] = "ReLU",
+        bias: bool = True,
+        batch_norm: bool = True,
+        normalize: bool = True,
+    ):
+        super(GraphSAINTMultiOrderAggregationModel, self).__init__()
+        if type(_output_dimension_for_each_order) != int:
+            raise TypeError
+        if not _output_dimension_for_each_order > 0:
+            raise ValueError
+        self._layers_order_list: _typing.Sequence[int] = _layers_order_list
+
+        if isinstance(_layers_dropout, _typing.Sequence):
+            if len(_layers_dropout) != len(_layers_order_list):
+                raise ValueError
+            else:
+                self._layers_dropout: _typing.Sequence[float] = _layers_dropout
+        elif type(_layers_dropout) == float:
+            if _layers_dropout < 0:
+                _layers_dropout = 0
+            if _layers_dropout > 1:
+                _layers_dropout = 1
+            self._layers_dropout: _typing.Sequence[float] = [
+                _layers_dropout for _ in _layers_order_list
+            ]
+        else:
+            raise TypeError
+        if type(_pre_dropout) != float:
+            raise TypeError
+        else:
+            if _pre_dropout < 0:
+                _pre_dropout = 0
+            if _pre_dropout > 1:
+                _pre_dropout = 1
+        self.__sequential_encoding_layers: torch.nn.ModuleList = torch.nn.ModuleList(
+            (
+                _GraphSAINTAggregationLayers.WrappedDropout(
+                    torch.nn.Dropout(_pre_dropout)
+                ),
+                _GraphSAINTAggregationLayers.MultiOrderAggregationLayer(
+                    num_features,
+                    _output_dimension_for_each_order,
+                    _layers_order_list[0],
+                    bias,
+                    activation,
+                    batch_norm,
+                    _layers_dropout[0],
+                ),
+            )
+        )
+        for _layer_index in range(1, len(_layers_order_list)):
+            self.__sequential_encoding_layers.append(
+                _GraphSAINTAggregationLayers.MultiOrderAggregationLayer(
+                    self.__sequential_encoding_layers[-1].integral_output_dimension,
+                    _output_dimension_for_each_order,
+                    _layers_order_list[_layer_index],
+                    bias,
+                    activation,
+                    batch_norm,
+                    _layers_dropout[_layer_index],
+                )
+            )
+        self.__apply_normalize: bool = normalize
+        self.__linear_transform: torch.nn.Linear = torch.nn.Linear(
+            self.__sequential_encoding_layers[-1].integral_output_dimension,
+            num_classes,
+            bias,
+        )
+        self.__linear_transform.reset_parameters()
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        if self.__apply_normalize:
+            x: torch.Tensor = torch.nn.functional.normalize(x, p=2, dim=1)
+        return torch.nn.functional.log_softmax(self.__linear_transform(x), dim=1)
+
+    def cls_encode(self, data) -> torch.Tensor:
+        if type(getattr(data, "x")) != torch.Tensor:
+            raise TypeError
+        if type(getattr(data, "edge_index")) != torch.Tensor:
+            raise TypeError
+        if (
+            getattr(data, "edge_weight", None) is not None
+            and type(getattr(data, "edge_weight")) != torch.Tensor
+        ):
+            raise TypeError
+        for encoding_layer in self.__sequential_encoding_layers:
+            setattr(data, "x", encoding_layer(data))
+        return getattr(data, "x")
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        return self.__sequential_encoding_layers
+
+
+@register_model("GraphSAINTAggregationModel")
+class GraphSAINTAggregationModel(ClassificationModel):
+    def __init__(
+        self,
+        num_features: int = ...,
+        num_classes: int = ...,
+        device: _typing.Union[str, torch.device] = ...,
+        init: bool = False,
+        **kwargs
+    ):
+        super(GraphSAINTAggregationModel, self).__init__(
+            num_features, num_classes, device=device, init=init, **kwargs
+        )
+        # todo: Initialize with default hyper parameter space and hyper parameter
+
+    def _initialize(self):
+        """ Initialize model """
+        self.model = GraphSAINTMultiOrderAggregationModel(
+            self.num_features,
+            self.num_classes,
+            self.hyper_parameter.get("output_dimension_for_each_order"),
+            self.hyper_parameter.get("layers_order_list"),
+            self.hyper_parameter.get("pre_dropout"),
+            self.hyper_parameter.get("layers_dropout"),
+            self.hyper_parameter.get("activation", "ReLU"),
+            bool(self.hyper_parameter.get("bias", True)),
+            bool(self.hyper_parameter.get("batch_norm", True)),
+            bool(self.hyper_parameter.get("normalize", True)),
+        ).to(self.device)
diff --git a/autogl/module/model/dgl/graphsage.py b/autogl/module/model/dgl/graphsage.py
new file mode 100644
index 0000000..6cf5a17
--- /dev/null
+++ b/autogl/module/model/dgl/graphsage.py
@@ -0,0 +1,306 @@
+import torch
+import typing as _typing
+
+from torch_geometric.nn.conv import SAGEConv
+import torch.nn.functional
+import autogl.data
+from . import register_model
+from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
+from ....utils import get_logger
+
+LOGGER = get_logger("SAGEModel")
+
+
+class GraphSAGE(ClassificationSupportedSequentialModel):
+    class _SAGELayer(torch.nn.Module):
+        def __init__(
+            self,
+            input_channels: int,
+            output_channels: int,
+            aggr: str,
+            activation_name: _typing.Optional[str] = ...,
+            dropout_probability: _typing.Optional[float] = ...,
+        ):
+            super().__init__()
+            self._convolution: SAGEConv = SAGEConv(
+                input_channels, output_channels, aggr=aggr
+            )
+            if (
+                activation_name is not Ellipsis
+                and activation_name is not None
+                and type(activation_name) == str
+            ):
+                self._activation_name: _typing.Optional[str] = activation_name
+            else:
+                self._activation_name: _typing.Optional[str] = None
+            if (
+                dropout_probability is not Ellipsis
+                and dropout_probability is not None
+                and type(dropout_probability) == float
+            ):
+                if dropout_probability < 0:
+                    dropout_probability = 0
+                if dropout_probability > 1:
+                    dropout_probability = 1
+                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
+                    dropout_probability
+                )
+            else:
+                self._dropout: _typing.Optional[torch.nn.Dropout] = None
+
+        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
+            x: torch.Tensor = getattr(data, "x")
+            edge_index: torch.Tensor = getattr(data, "edge_index")
+            if type(x) != torch.Tensor or type(edge_index) != torch.Tensor:
+                raise TypeError
+
+            x: torch.Tensor = self._convolution.forward(x, edge_index)
+            if self._activation_name is not None and enable_activation:
+                x: torch.Tensor = activate_func(x, self._activation_name)
+            if self._dropout is not None:
+                x: torch.Tensor = self._dropout.forward(x)
+            return x
+
+    def __init__(
+        self,
+        num_features: int,
+        num_classes: int,
+        hidden_features: _typing.Sequence[int],
+        activation_name: str,
+        layers_dropout: _typing.Union[
+            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
+        ] = None,
+        aggr: str = "mean",
+    ):
+        super().__init__()
+        if not type(num_features) == type(num_classes) == int:
+            raise TypeError
+        if not isinstance(hidden_features, _typing.Sequence):
+            raise TypeError
+        for hidden_feature in hidden_features:
+            if type(hidden_feature) != int:
+                raise TypeError
+            elif hidden_feature <= 0:
+                raise ValueError
+        if isinstance(layers_dropout, _typing.Sequence):
+            if len(layers_dropout) != (len(hidden_features) + 1):
+                raise TypeError
+            for d in layers_dropout:
+                if d is not None and type(d) != float:
+                    raise TypeError
+            _layers_dropout: _typing.Sequence[_typing.Optional[float]] = layers_dropout
+        elif layers_dropout is None or type(layers_dropout) == float:
+            _layers_dropout: _typing.Sequence[_typing.Optional[float]] = [
+                layers_dropout for _ in range(len(hidden_features))
+            ] + [None]
+        else:
+            raise TypeError
+        if not type(activation_name) == type(aggr) == str:
+            raise TypeError
+        if aggr not in ("add", "max", "mean"):
+            aggr = "mean"
+
+        if len(hidden_features) == 0:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    [
+                        self._SAGELayer(
+                            num_features,
+                            num_classes,
+                            aggr,
+                            activation_name,
+                            _layers_dropout[0],
+                        )
+                    ]
+                )
+            )
+        else:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    [
+                        self._SAGELayer(
+                            num_features,
+                            hidden_features[0],
+                            aggr,
+                            activation_name,
+                            _layers_dropout[0],
+                        )
+                    ]
+                )
+            )
+            for i in range(len(hidden_features)):
+                if i + 1 < len(hidden_features):
+                    self.__sequential_encoding_layers.append(
+                        self._SAGELayer(
+                            hidden_features[i],
+                            hidden_features[i + 1],
+                            aggr,
+                            activation_name,
+                            _layers_dropout[i + 1],
+                        )
+                    )
+                else:
+                    self.__sequential_encoding_layers.append(
+                        self._SAGELayer(
+                            hidden_features[i],
+                            num_classes,
+                            aggr,
+                            _layers_dropout[i + 1],
+                        )
+                    )
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        return self.__sequential_encoding_layers
+
+    def cls_encode(self, data) -> torch.Tensor:
+        if (
+            hasattr(data, "edge_indexes")
+            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
+            and len(getattr(data, "edge_indexes"))
+            == len(self.__sequential_encoding_layers)
+        ):
+            for __edge_index in getattr(data, "edge_indexes"):
+                if type(__edge_index) != torch.Tensor:
+                    raise TypeError
+            """ Layer-wise encode """
+            x: torch.Tensor = getattr(data, "x")
+            for i, __edge_index in enumerate(getattr(data, "edge_indexes")):
+                x: torch.Tensor = self.__sequential_encoding_layers[i](
+                    autogl.data.Data(x=x, edge_index=__edge_index)
+                )
+            return x
+        else:
+            x: torch.Tensor = getattr(data, "x")
+            for i in range(len(self.__sequential_encoding_layers)):
+                x = self.__sequential_encoding_layers[i](
+                    autogl.data.Data(x, getattr(data, "edge_index"))
+                )
+            return x
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        return torch.nn.functional.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x: torch.Tensor = getattr(data, "x")
+        for i in range(len(self.__sequential_encoding_layers) - 2):
+            x = self.__sequential_encoding_layers[i](
+                autogl.data.Data(x, getattr(data, "edge_index"))
+            )
+        x = self.__sequential_encoding_layers[-2](
+            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
+        )
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("sage")
+class AutoSAGE(BaseModel):
+    r"""
+    AutoSAGE. The model used in this automodel is GraphSAGE, i.e., the GraphSAGE from the `"Inductive Representation Learning on
+    Large Graphs" <https://arxiv.org/abs/1706.02216>`_ paper. The layer is
+
+    .. math::
+
+        \mathbf{x}^{\prime}_i = \mathbf{W}_1 \mathbf{x}_i + \mathbf{W_2} \cdot
+        \mathrm{mean}_{j \in \mathcal{N(i)}} \mathbf{x}_j
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+
+    """
+
+    def __init__(
+        self, num_features=None, num_classes=None, device=None, init=False, **args
+    ):
+
+        super(AutoSAGE, self).__init__()
+
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [128, 128, 128],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+            {
+                "parameterName": "agg",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["mean", "add", "max"],
+            },
+        ]
+
+        self.hyperparams = {
+            "num_layers": 3,
+            "hidden": [64, 32],
+            "dropout": 0.5,
+            "act": "relu",
+            "agg": "mean",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GraphSAGE(
+            self.num_features,
+            self.num_classes,
+            self.hyperparams.get("hidden"),
+            self.hyperparams.get("act", "relu"),
+            self.hyperparams.get("dropout", None),
+            self.hyperparams.get("agg", "mean"),
+        ).to(self.device)
diff --git a/autogl/module/model/dgl/topkpool.py b/autogl/module/model/dgl/topkpool.py
new file mode 100644
index 0000000..c1872bd
--- /dev/null
+++ b/autogl/module/model/dgl/topkpool.py
@@ -0,0 +1,169 @@
+import torch
+import torch.nn.functional as F
+from torch_geometric.nn import GraphConv, TopKPooling
+from torch_geometric.nn import global_mean_pool as gap, global_max_pool as gmp
+from . import register_model
+from .base import BaseModel, activate_func
+from ....utils import get_logger
+
+LOGGER = get_logger("TopkModel")
+
+
+def set_default(args, d):
+    for k, v in d.items():
+        if k not in args:
+            args[k] = v
+    return args
+
+
+class Topkpool(torch.nn.Module):
+    def __init__(self, args):
+        super(Topkpool, self).__init__()
+        self.args = args
+
+        missing_keys = list(
+            set(
+                [
+                    "features_num",
+                    "num_class",
+                    "num_graph_features",
+                    "ratio",
+                    "dropout",
+                    "act",
+                ]
+            )
+            - set(self.args.keys())
+        )
+        if len(missing_keys) > 0:
+            raise Exception("Missing keys: %s." % ",".join(missing_keys))
+
+        self.num_features = self.args["features_num"]
+        self.num_classes = self.args["num_class"]
+        self.ratio = self.args["ratio"]
+        self.dropout = self.args["dropout"]
+        self.num_graph_features = self.args["num_graph_features"]
+
+        self.conv1 = GraphConv(self.num_features, 128)
+        self.pool1 = TopKPooling(128, ratio=self.ratio)
+        self.conv2 = GraphConv(128, 128)
+        self.pool2 = TopKPooling(128, ratio=self.ratio)
+        self.conv3 = GraphConv(128, 128)
+        self.pool3 = TopKPooling(128, ratio=self.ratio)
+
+        self.lin1 = torch.nn.Linear(256 + self.num_graph_features, 128)
+        self.lin2 = torch.nn.Linear(128, 64)
+        self.lin3 = torch.nn.Linear(64, self.num_classes)
+
+    def forward(self, data):
+        x, edge_index, batch = data.x, data.edge_index, data.batch
+        if self.num_graph_features > 0:
+            graph_feature = data.gf
+
+        x = F.relu(self.conv1(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool1(x, edge_index, None, batch)
+        x1 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = F.relu(self.conv2(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool2(x, edge_index, None, batch)
+        x2 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = F.relu(self.conv3(x, edge_index))
+        x, edge_index, _, batch, _, _ = self.pool3(x, edge_index, None, batch)
+        x3 = torch.cat([gmp(x, batch), gap(x, batch)], dim=1)
+
+        x = x1 + x2 + x3
+        if self.num_graph_features > 0:
+            x = torch.cat([x, graph_feature], dim=-1)
+        x = self.lin1(x)
+        x = activate_func(x, self.args["act"])
+        x = F.dropout(x, p=self.dropout, training=self.training)
+        x = self.lin2(x)
+        x = activate_func(x, self.args["act"])
+        x = F.log_softmax(self.lin3(x), dim=-1)
+
+        return x
+
+
+@register_model("topkpool")
+class AutoTopkpool(BaseModel):
+    r"""
+    AutoTopkpool. The model used in this automodel is from https://arxiv.org/abs/1905.05178, https://arxiv.org/abs/1905.02850
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+
+    """
+
+    def __init__(
+        self,
+        num_features=None,
+        num_classes=None,
+        device=None,
+        init=False,
+        num_graph_features=None,
+        **args
+    ):
+        super(AutoTopkpool, self).__init__()
+        LOGGER.debug(
+            "topkpool __init__ get params num_graph_features {}".format(
+                num_graph_features
+            )
+        )
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.num_graph_features = (
+            int(num_graph_features) if num_graph_features is not None else 0
+        )
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+            "num_graph_features": self.num_graph_features,
+        }
+        self.space = [
+            {
+                "parameterName": "ratio",
+                "type": "DOUBLE",
+                "maxValue": 0.9,
+                "minValue": 0.1,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.9,
+                "minValue": 0.1,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+        ]
+
+        self.hyperparams = {"ratio": 0.8, "dropout": 0.5, "act": "relu"}
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        if self.initialized:
+            return
+        self.initialized = True
+        LOGGER.debug("topkpool initialize with parameters {}".format(self.params))
+        self.model = Topkpool({**self.params, **self.hyperparams}).to(self.device)
diff --git a/test/model_glf/gclf_dgl.py b/test/model_glf/gclf_dgl.py
new file mode 100644
index 0000000..a3d16b6
--- /dev/null
+++ b/test/model_glf/gclf_dgl.py
@@ -0,0 +1,176 @@
+import os
+import sys
+import logging
+logging.basicConfig(level=logging.INFO)
+from tqdm import tqdm
+
+sys.path.append("../../")
+print(os.getcwd())
+os.environ["AUTOGL_BACKEND"] = "dgl"
+#os.environ["AUTOGL_BACKEND"] = "pyg"
+from autogl.backend import DependentBackend
+import dgl
+from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+
+from autogl.module.model.ginparser import Parser
+from autogl.module.model.dataloader_gin import GINDataLoader
+from autogl.module.model import GIN
+
+from pdb import set_trace
+import numpy as np
+from autogl.solver.utils import set_seed
+set_seed(202106)
+
+
+def train(args, net, trainloader, optimizer, criterion, epoch):
+    net.train()
+
+    running_loss = 0
+    total_iters = len(trainloader)
+    # setup the offset to avoid the overlap with mouse cursor
+    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
+
+    for pos, (graphs, labels) in zip(bar, trainloader):
+        # batch graphs will be shipped to device in forward part of model
+        labels = labels.to(args.device)
+        graphs = graphs.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        outputs = net(graphs, feat)
+
+        loss = criterion(outputs, labels)
+        running_loss += loss.item()
+
+        # backprop
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        # report
+        bar.set_description('epoch-{}'.format(epoch))
+    bar.close()
+    # the final batch will be aligned
+    running_loss = running_loss / total_iters
+
+    return running_loss
+
+
+def eval_net(args, net, dataloader, criterion):
+    net.eval()
+
+    total = 0
+    total_loss = 0
+    total_correct = 0
+
+    for data in dataloader:
+        graphs, labels = data
+        graphs = graphs.to(args.device)
+        labels = labels.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        total += len(labels)
+        outputs = net(graphs, feat)
+        _, predicted = torch.max(outputs.data, 1)
+
+        total_correct += (predicted == labels.data).sum().item()
+        loss = criterion(outputs, labels)
+        # crossentropy(reduce=True) for default
+        total_loss += loss.item() * len(labels)
+
+    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
+
+    net.train()
+
+    return loss, acc
+
+
+def main(args):
+
+    # set up seeds, args.seed supported
+    torch.manual_seed(seed=args.seed)
+    np.random.seed(seed=args.seed)
+
+    is_cuda = not args.disable_cuda and torch.cuda.is_available()
+
+    if is_cuda:
+        args.device = torch.device("cuda:" + str(args.device))
+        torch.cuda.manual_seed_all(seed=args.seed)
+    else:
+        args.device = torch.device("cpu")
+
+    dataset = GINDataset(args.dataset, not args.learn_eps)
+
+    trainloader, validloader = GINDataLoader(
+        dataset, batch_size=args.batch_size, device=args.device,
+        seed=args.seed, shuffle=True,
+        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
+    # or split_name='rand', split_ratio=0.7
+
+    model = GIN(
+        args.num_layers, args.num_mlp_layers,
+        dataset.dim_nfeats, args.hidden_dim, dataset.gclasses,
+        args.final_dropout, args.learn_eps,
+        args.graph_pooling_type, args.neighbor_pooling_type).to(args.device)
+
+    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
+
+    # it's not cost-effective to hanle the cursor and init 0
+    # https://stackoverflow.com/a/23121189
+    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
+    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
+    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
+
+    for epoch, _, _ in zip(tbar, vbar, lrbar):
+
+        train(args, model, trainloader, optimizer, criterion, epoch)
+        scheduler.step()
+
+        train_loss, train_acc = eval_net(
+            args, model, trainloader, criterion)
+        tbar.set_description(
+            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(train_loss, 100. * train_acc))
+
+        valid_loss, valid_acc = eval_net(
+            args, model, validloader, criterion)
+        vbar.set_description(
+            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(valid_loss, 100. * valid_acc))
+
+        if not args.filename == "":
+            with open(args.filename, 'a') as f:
+                f.write('%s %s %s %s' % (
+                    args.dataset,
+                    args.learn_eps,
+                    args.neighbor_pooling_type,
+                    args.graph_pooling_type
+                ))
+                f.write("\n")
+                f.write("%f %f %f %f" % (
+                    train_loss,
+                    train_acc,
+                    valid_loss,
+                    valid_acc
+                ))
+                f.write("\n")
+
+        lrbar.set_description(
+            "Learning eps with learn_eps={}: {}".format(
+                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
+
+    tbar.close()
+    vbar.close()
+    lrbar.close()
+
+
+if __name__ == '__main__':
+    args = Parser(description='GIN').args
+    print('show all arguments configuration...')
+    print(args)
+
+    main(args)
+

From f424236b5921143acbc28d69725992b30668c69f Mon Sep 17 00:00:00 2001
From: Beini <xbn20@mails.tsinghua.edu.cn>
Date: Mon, 23 Aug 2021 09:11:46 +0000
Subject: [PATCH 63/75] nlf init (dgl)

---
 test/model_nlf/nclf_dgl.py | 176 +++++++++++++++++++++++++++++++++++++
 1 file changed, 176 insertions(+)
 create mode 100644 test/model_nlf/nclf_dgl.py

diff --git a/test/model_nlf/nclf_dgl.py b/test/model_nlf/nclf_dgl.py
new file mode 100644
index 0000000..a3d16b6
--- /dev/null
+++ b/test/model_nlf/nclf_dgl.py
@@ -0,0 +1,176 @@
+import os
+import sys
+import logging
+logging.basicConfig(level=logging.INFO)
+from tqdm import tqdm
+
+sys.path.append("../../")
+print(os.getcwd())
+os.environ["AUTOGL_BACKEND"] = "dgl"
+#os.environ["AUTOGL_BACKEND"] = "pyg"
+from autogl.backend import DependentBackend
+import dgl
+from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+
+from autogl.module.model.ginparser import Parser
+from autogl.module.model.dataloader_gin import GINDataLoader
+from autogl.module.model import GIN
+
+from pdb import set_trace
+import numpy as np
+from autogl.solver.utils import set_seed
+set_seed(202106)
+
+
+def train(args, net, trainloader, optimizer, criterion, epoch):
+    net.train()
+
+    running_loss = 0
+    total_iters = len(trainloader)
+    # setup the offset to avoid the overlap with mouse cursor
+    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
+
+    for pos, (graphs, labels) in zip(bar, trainloader):
+        # batch graphs will be shipped to device in forward part of model
+        labels = labels.to(args.device)
+        graphs = graphs.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        outputs = net(graphs, feat)
+
+        loss = criterion(outputs, labels)
+        running_loss += loss.item()
+
+        # backprop
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        # report
+        bar.set_description('epoch-{}'.format(epoch))
+    bar.close()
+    # the final batch will be aligned
+    running_loss = running_loss / total_iters
+
+    return running_loss
+
+
+def eval_net(args, net, dataloader, criterion):
+    net.eval()
+
+    total = 0
+    total_loss = 0
+    total_correct = 0
+
+    for data in dataloader:
+        graphs, labels = data
+        graphs = graphs.to(args.device)
+        labels = labels.to(args.device)
+        feat = graphs.ndata.pop('attr')
+        total += len(labels)
+        outputs = net(graphs, feat)
+        _, predicted = torch.max(outputs.data, 1)
+
+        total_correct += (predicted == labels.data).sum().item()
+        loss = criterion(outputs, labels)
+        # crossentropy(reduce=True) for default
+        total_loss += loss.item() * len(labels)
+
+    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
+
+    net.train()
+
+    return loss, acc
+
+
+def main(args):
+
+    # set up seeds, args.seed supported
+    torch.manual_seed(seed=args.seed)
+    np.random.seed(seed=args.seed)
+
+    is_cuda = not args.disable_cuda and torch.cuda.is_available()
+
+    if is_cuda:
+        args.device = torch.device("cuda:" + str(args.device))
+        torch.cuda.manual_seed_all(seed=args.seed)
+    else:
+        args.device = torch.device("cpu")
+
+    dataset = GINDataset(args.dataset, not args.learn_eps)
+
+    trainloader, validloader = GINDataLoader(
+        dataset, batch_size=args.batch_size, device=args.device,
+        seed=args.seed, shuffle=True,
+        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
+    # or split_name='rand', split_ratio=0.7
+
+    model = GIN(
+        args.num_layers, args.num_mlp_layers,
+        dataset.dim_nfeats, args.hidden_dim, dataset.gclasses,
+        args.final_dropout, args.learn_eps,
+        args.graph_pooling_type, args.neighbor_pooling_type).to(args.device)
+
+    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
+
+    # it's not cost-effective to hanle the cursor and init 0
+    # https://stackoverflow.com/a/23121189
+    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
+    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
+    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
+
+    for epoch, _, _ in zip(tbar, vbar, lrbar):
+
+        train(args, model, trainloader, optimizer, criterion, epoch)
+        scheduler.step()
+
+        train_loss, train_acc = eval_net(
+            args, model, trainloader, criterion)
+        tbar.set_description(
+            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(train_loss, 100. * train_acc))
+
+        valid_loss, valid_acc = eval_net(
+            args, model, validloader, criterion)
+        vbar.set_description(
+            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
+            .format(valid_loss, 100. * valid_acc))
+
+        if not args.filename == "":
+            with open(args.filename, 'a') as f:
+                f.write('%s %s %s %s' % (
+                    args.dataset,
+                    args.learn_eps,
+                    args.neighbor_pooling_type,
+                    args.graph_pooling_type
+                ))
+                f.write("\n")
+                f.write("%f %f %f %f" % (
+                    train_loss,
+                    train_acc,
+                    valid_loss,
+                    valid_acc
+                ))
+                f.write("\n")
+
+        lrbar.set_description(
+            "Learning eps with learn_eps={}: {}".format(
+                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
+
+    tbar.close()
+    vbar.close()
+    lrbar.close()
+
+
+if __name__ == '__main__':
+    args = Parser(description='GIN').args
+    print('show all arguments configuration...')
+    print(args)
+
+    main(args)
+

From 03b997d7f0e7a9e6c54afd396511e20e0306eca7 Mon Sep 17 00:00:00 2001
From: Beini <xbn20@mails.tsinghua.edu.cn>
Date: Tue, 24 Aug 2021 11:45:31 +0000
Subject: [PATCH 64/75] gcn

---
 autogl/module/model/dgl/gcn_dgl.py | 427 +++++++++++++++++++++++++++++
 1 file changed, 427 insertions(+)
 create mode 100644 autogl/module/model/dgl/gcn_dgl.py

diff --git a/autogl/module/model/dgl/gcn_dgl.py b/autogl/module/model/dgl/gcn_dgl.py
new file mode 100644
index 0000000..b610c08
--- /dev/null
+++ b/autogl/module/model/dgl/gcn_dgl.py
@@ -0,0 +1,427 @@
+import torch
+import torch.nn.functional
+import typing as _typing
+
+from dgl.nn.pytorch.conv import GraphConv
+import autogl.data
+from . import register_model
+from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
+from ....utils import get_logger
+
+LOGGER = get_logger("GCNModel")
+
+def add_self_loop(edge_index,num_nodes,edge_weight=None, fill_value=1.):
+    N = num_nodes
+    loop_index = torch.arange(0, N, dtype=torch.long, device=edge_index.device)
+    loop_index = loop_index.unsqueeze(0).repeat(2, 1)
+
+    if edge_weight is not None:
+        assert edge_weight.numel() == edge_index.size(1)
+        loop_weight = edge_weight.new_full((N, ), fill_value)
+        edge_weight = torch.cat([edge_weight, loop_weight], dim=0)
+
+    edge_index = torch.cat([edge_index, loop_index], dim=1)
+
+    return edge_index, edge_weight
+
+class GCN(ClassificationSupportedSequentialModel):
+    class _GCNLayer(torch.nn.Module):
+        def __init__(
+            self,
+            input_channels: int,
+            output_channels: int,
+            add_self_loops: bool = True,
+            normalize: bool = True,
+            activation_name: _typing.Optional[str] = ...,
+            dropout_probability: _typing.Optional[float] = ...,
+        ):
+            super().__init__()
+            self._convolution: GraphConv = GraphConv(
+                input_channels,
+                output_channels,
+                norm='both' if normalize else 'none',
+            )
+            self.add_self_loops = bool(add_self_loops),
+            if (
+                activation_name is not Ellipsis
+                and activation_name is not None
+                and type(activation_name) == str
+            ):
+                self._activation_name: _typing.Optional[str] = activation_name
+            else:
+                self._activation_name: _typing.Optional[str] = None
+            if (
+                dropout_probability is not Ellipsis
+                and dropout_probability is not None
+                and type(dropout_probability) == float
+            ):
+                if dropout_probability < 0:
+                    dropout_probability = 0
+                if dropout_probability > 1:
+                    dropout_probability = 1
+                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
+                    dropout_probability
+                )
+            else:
+                self._dropout: _typing.Optional[torch.nn.Dropout] = None
+
+        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
+            
+            x: torch.Tensor = data.ndata['feat']
+            edge_index: torch.LongTensor = data.edges
+            if self.add_self_loops:
+                edge_index, edge_weight = add_self_loop(edge_index, x.size(0), edge_weight)
+
+            
+            # edge_weight: _typing.Optional[torch.Tensor] = getattr(
+            #     data, "edge_weight", None
+            # )
+            # """ Validate the arguments """
+            # if not type(x) == type(edge_index) == torch.Tensor:
+            #     raise TypeError
+            # if edge_weight is not None and (
+            #     type(edge_weight) != torch.Tensor
+            #     or edge_index.size() != (2, edge_weight.size(0))
+            # ):
+            #     edge_weight: _typing.Optional[torch.Tensor] = None
+            
+
+            x: torch.Tensor = self._convolution.forward(data, x)
+            if self._activation_name is not None and enable_activation:
+                x: torch.Tensor = activate_func(x, self._activation_name)
+            if self._dropout is not None:
+                x: torch.Tensor = self._dropout.forward(x)
+            return x
+
+    def __init__(
+        self,
+        num_features: int,
+        num_classes: int,
+        hidden_features: _typing.Sequence[int],
+        activation_name: str,
+        dropout: _typing.Union[
+            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
+        ] = None,
+        add_self_loops: bool = True,
+        normalize: bool = True,
+    ):
+        if isinstance(dropout, _typing.Sequence):
+            if len(dropout) != len(hidden_features) + 1:
+                raise TypeError(
+                    "When the dropout argument is a sequence, "
+                    "The sequence length must equal to the number of layers to construct."
+                )
+            for _dropout in dropout:
+                if _dropout is not None and type(_dropout) != float:
+                    raise TypeError(
+                        "When the dropout argument is a sequence, "
+                        "every item in the sequence must be float or None"
+                    )
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = dropout
+        elif type(dropout) == float:
+            if dropout < 0:
+                dropout = 0
+            if dropout > 1:
+                dropout = 1
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
+                dropout for _ in range(len(hidden_features))
+            ] + [None]
+        elif dropout in (None, Ellipsis, ...):
+            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
+                None for _ in range(len(hidden_features) + 1)
+            ]
+        else:
+            raise TypeError(
+                "The provided dropout argument must be a float number or None or "
+                "a sequence in which each item is either a float Number or None."
+            )
+        super().__init__()
+        if len(hidden_features) == 0:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    (
+                        self._GCNLayer(
+                            num_features,
+                            num_classes,
+                            add_self_loops,
+                            normalize,
+                            dropout_probability=dropout_list[0],
+                        ),
+                    )
+                )
+            )
+        else:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList()
+            )
+            self.__sequential_encoding_layers.append(
+                self._GCNLayer(
+                    num_features,
+                    hidden_features[0],
+                    add_self_loops,
+                    normalize,
+                    activation_name,
+                    dropout_list[0],
+                )
+            )
+            for hidden_feature_index in range(len(hidden_features)):
+                if hidden_feature_index + 1 < len(hidden_features):
+                    self.__sequential_encoding_layers.append(
+                        self._GCNLayer(
+                            hidden_features[hidden_feature_index],
+                            hidden_features[hidden_feature_index + 1],
+                            add_self_loops,
+                            normalize,
+                            activation_name,
+                            dropout_list[hidden_feature_index + 1],
+                        )
+                    )
+                else:
+                    self.__sequential_encoding_layers.append(
+                        self._GCNLayer(
+                            hidden_features[hidden_feature_index],
+                            num_classes,
+                            add_self_loops,
+                            normalize,
+                            dropout_list[-1],
+                        )
+                    )
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        return self.__sequential_encoding_layers
+
+    def __extract_edge_indexes_and_weights(
+        self, data
+    ) -> _typing.Union[
+        _typing.Sequence[
+            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
+        ],
+        _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
+    ]:
+        def __compose_edge_index_and_weight(
+            _edge_index: torch.LongTensor,
+            _edge_weight: _typing.Optional[torch.Tensor] = None,
+        ) -> _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]:
+            if type(_edge_index) != torch.Tensor or _edge_index.dtype != torch.int64:
+                raise TypeError
+            if _edge_weight is not None and (
+                type(_edge_weight) != torch.Tensor
+                or _edge_index.size() != (2, _edge_weight.size(0))
+            ):
+                _edge_weight: _typing.Optional[torch.Tensor] = None
+            return _edge_index, _edge_weight
+
+        if not (
+            hasattr(data, "edge_indexes")
+            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
+            and len(getattr(data, "edge_indexes"))
+            == len(self.__sequential_encoding_layers)
+        ):
+            return __compose_edge_index_and_weight(
+                getattr(data, "edge_index"), getattr(data, "edge_weight", None)
+            )
+        for __edge_index in getattr(data, "edge_indexes"):
+            if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
+                return __compose_edge_index_and_weight(
+                    getattr(data, "edge_index"), getattr(data, "edge_weight", None)
+                )
+
+        if (
+            hasattr(data, "edge_weights")
+            and isinstance(getattr(data, "edge_weights"), _typing.Sequence)
+            and len(getattr(data, "edge_weights"))
+            == len(self.__sequential_encoding_layers)
+        ):
+            return [
+                __compose_edge_index_and_weight(_edge_index, _edge_weight)
+                for _edge_index, _edge_weight in zip(
+                    getattr(data, "edge_indexes"), getattr(data, "edge_weights")
+                )
+            ]
+        else:
+            return [
+                __compose_edge_index_and_weight(__edge_index)
+                for __edge_index in getattr(data, "edge_indexes")
+            ]
+
+    def cls_encode(self, data) -> torch.Tensor:
+        edge_indexes_and_weights: _typing.Union[
+            _typing.Sequence[
+                _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
+            ],
+            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
+        ] = self.__extract_edge_indexes_and_weights(data)
+
+        if (not isinstance(edge_indexes_and_weights, tuple)) and isinstance(
+            edge_indexes_and_weights[0], tuple
+        ):
+            """ edge_indexes_and_weights is sequence of (edge_index, edge_weight) """
+            assert len(edge_indexes_and_weights) == len(
+                self.__sequential_encoding_layers
+            )
+            x: torch.Tensor = getattr(data, "x")
+            for _edge_index_and_weight, gcn in zip(
+                edge_indexes_and_weights, self.__sequential_encoding_layers
+            ):
+                _temp_data = autogl.data.Data(x=x, edge_index=_edge_index_and_weight[0])
+                _temp_data.edge_weight = _edge_index_and_weight[1]
+                x = gcn(_temp_data)
+            return x
+        else:
+            """ edge_indexes_and_weights is (edge_index, edge_weight) """
+            x = getattr(data, "x")
+            for gcn in self.__sequential_encoding_layers:
+                _temp_data = autogl.data.Data(
+                    x=x, edge_index=edge_indexes_and_weights[0]
+                )
+                _temp_data.edge_weight = edge_indexes_and_weights[1]
+                x = gcn(_temp_data)
+            return x
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        return torch.nn.functional.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x: torch.Tensor = getattr(data, "x")
+        for i in range(len(self.__sequential_encoding_layers) - 2):
+            x = self.__sequential_encoding_layers[i](
+                autogl.data.Data(x, getattr(data, "edge_index"))
+            )
+        x = self.__sequential_encoding_layers[-2](
+            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
+        )
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("gcn")
+class AutoGCN(BaseModel):
+    r"""
+    AutoGCN.
+    The model used in this automodel is GCN, i.e., the graph convolutional network from the
+    `"Semi-supervised Classification with Graph Convolutional
+    Networks" <https://arxiv.org/abs/1609.02907>`_ paper. The layer is
+
+    .. math::
+
+        \mathbf{X}^{\prime} = \mathbf{\hat{D}}^{-1/2} \mathbf{\hat{A}}
+        \mathbf{\hat{D}}^{-1/2} \mathbf{X} \mathbf{\Theta},
+
+    where :math:`\mathbf{\hat{A}} = \mathbf{A} + \mathbf{I}` denotes the
+    adjacency matrix with inserted self-loops and
+    :math:`\hat{D}_{ii} = \sum_{j=0} \hat{A}_{ij}` its diagonal degree matrix.
+
+    Parameters
+    ----------
+    num_features: ``int``
+        The dimension of features.
+
+    num_classes: ``int``
+        The number of classes.
+
+    device: ``torch.device`` or ``str``
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+    """
+
+    def __init__(
+        self,
+        num_features: int = ...,
+        num_classes: int = ...,
+        device: _typing.Union[str, torch.device] = ...,
+        init: bool = False,
+        **kwargs
+    ) -> None:
+        super().__init__()
+        self.num_features = num_features
+        self.num_classes = num_classes
+        self.device = device
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "add_self_loops",
+                "type": "CATEGORICAL",
+                "feasiblePoints": [1],
+            },
+            {
+                "parameterName": "normalize",
+                "type": "CATEGORICAL",
+                "feasiblePoints": [1],
+            },
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [128, 128, 128],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+        ]
+
+        # initial point of hp search
+        # self.hyperparams = {
+        #     "num_layers": 2,
+        #     "hidden": [16],
+        #     "dropout": 0.2,
+        #     "act": "leaky_relu",
+        # }
+
+        self.hyperparams = {
+            "num_layers": 3,
+            "hidden": [128, 64],
+            "dropout": 0,
+            "act": "relu",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GCN(
+            self.num_features,
+            self.num_classes,
+            self.hyperparams.get("hidden"),
+            self.hyperparams.get("act"),
+            self.hyperparams.get("dropout", None),
+            bool(self.hyperparams.get("add_self_loops", True)),
+            bool(self.hyperparams.get("normalize", True)),
+        ).to(self.device)

From 4dfdea77b6b005e39beed77a2d1eccbcd0b4b867 Mon Sep 17 00:00:00 2001
From: Beini <xbn20@mails.tsinghua.edu.cn>
Date: Tue, 31 Aug 2021 02:27:01 +0000
Subject: [PATCH 65/75] node

---
 autogl/module/model/dgl/__init__.py      |   6 +
 autogl/module/model/dgl/gat_dgl.py       | 216 ++++++++++++++++
 autogl/module/model/dgl/gcn_dgl.py       |  63 ++---
 autogl/module/model/dgl/graphsage_dgl.py | 303 +++++++++++++++++++++++
 test/model_nlf/nclf_dgl.py               |   2 +-
 5 files changed, 547 insertions(+), 43 deletions(-)
 create mode 100644 autogl/module/model/dgl/gat_dgl.py
 create mode 100644 autogl/module/model/dgl/graphsage_dgl.py

diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index 7a45f5e..c9f4a8a 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -9,6 +9,9 @@ from .gcn import AutoGCN
 from .gat import AutoGAT
 from .gin import AutoGIN
 from .gin_dgl import GIN
+from .gcn_dgl import GCN
+from .graphsage_dgl import GraphSAGE
+from .gat_dgl import GAT
 
 __all__ = [
     "ModelUniversalRegistry",
@@ -21,4 +24,7 @@ __all__ = [
     "AutoGAT",
     "AutoGIN",
     "GIN",
+    "GCN",
+    "GraphSAGE",
+    "GAT"
 ]
diff --git a/autogl/module/model/dgl/gat_dgl.py b/autogl/module/model/dgl/gat_dgl.py
new file mode 100644
index 0000000..e54c63e
--- /dev/null
+++ b/autogl/module/model/dgl/gat_dgl.py
@@ -0,0 +1,216 @@
+import torch
+import torch.nn.functional as F
+from dgl.nn.pytorch.conv import GATConv
+from . import register_model
+from .base import BaseModel, activate_func
+from ....utils import get_logger
+
+LOGGER = get_logger("GATModel")
+
+
+def set_default(args, d):
+    for k, v in d.items():
+        if k not in args:
+            args[k] = v
+    return args
+
+
+class GAT(torch.nn.Module):
+    def __init__(self, args):
+        super(GAT, self).__init__()
+        self.args = args
+        self.num_layer = int(self.args["num_layers"])
+
+        missing_keys = list(
+            set(
+                [
+                    "features_num",
+                    "num_class",
+                    "num_layers",
+                    "hidden",
+                    "heads",
+                    "dropout",
+                    "act",
+                ]
+            )
+            - set(self.args.keys())
+        )
+        if len(missing_keys) > 0:
+            raise Exception("Missing keys: %s." % ",".join(missing_keys))
+
+        if not self.num_layer == len(self.args["hidden"]) + 1:
+            LOGGER.warn("Warning: layer size does not match the length of hidden units")
+        self.convs = torch.nn.ModuleList()
+        self.convs.append(
+            GATConv(
+                self.args["features_num"],
+                self.args["hidden"][0],
+                num_heads =self.args["heads"],
+                attn_drop=self.args["dropout"],
+            )
+        )
+        last_dim = self.args["hidden"][0] * self.args["heads"]
+        for i in range(self.num_layer - 2):
+            self.convs.append(
+                GATConv(
+                    last_dim,
+                    self.args["hidden"][i + 1],
+                    num_heads=self.args["heads"],
+                    attn_drop=self.args["dropout"],
+                )
+            )
+            last_dim = self.args["hidden"][i + 1] * self.args["heads"]
+        self.convs.append(
+            GATConv(
+                last_dim,
+                self.args["num_class"],
+                num_heads=1,
+                attn_drop=self.args["dropout"],
+            )
+        )
+
+    def forward(self, data):
+        try:
+            x = data.ndata['x']
+        except:
+            print("no x")
+            pass
+        
+        for i in range(self.num_layer):
+            x = F.dropout(x, p=self.args["dropout"], training=self.training)
+            x = self.convs[i](data, x)
+            # concat
+            x = x.view(-1, self.heads * self.out_channels)
+            if i != self.num_layer - 1:
+                x = activate_func(x, self.args["act"])
+
+        return F.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x = data.ndata['x']
+        for i in range(self.num_layer - 1):
+            x = self.convs[i](x, data.train_pos_edge_index)
+            # concat
+            x = x.view(-1, self.heads * self.out_channels)
+            if i != self.num_layer - 2:
+                x = activate_func(x, self.args["act"])
+                # x = F.dropout(x, p=self.args["dropout"], training=self.training)
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("gat")
+class AutoGAT(BaseModel):
+    r"""
+    AutoGAT. The model used in this automodel is GAT, i.e., the graph attentional network from the `"Graph Attention Networks"
+    <https://arxiv.org/abs/1710.10903>`_ paper. The layer is
+
+    .. math::
+        \mathbf{x}^{\prime}_i = \alpha_{i,i}\mathbf{\Theta}\mathbf{x}_{i} +
+        \sum_{j \in \mathcal{N}(i)} \alpha_{i,j}\mathbf{\Theta}\mathbf{x}_{j}
+
+    where the attention coefficients :math:`\alpha_{i,j}` are computed as
+
+    .. math::
+        \alpha_{i,j} =
+        \frac{
+        \exp\left(\mathrm{LeakyReLU}\left(\mathbf{a}^{\top}
+        [\mathbf{\Theta}\mathbf{x}_i \, \Vert \, \mathbf{\Theta}\mathbf{x}_j]
+        \right)\right)}
+        {\sum_{k \in \mathcal{N}(i) \cup \{ i \}}
+        \exp\left(\mathrm{LeakyReLU}\left(\mathbf{a}^{\top}
+        [\mathbf{\Theta}\mathbf{x}_i \, \Vert \, \mathbf{\Theta}\mathbf{x}_k]
+        \right)\right)}.
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+
+    args: Other parameters.
+    """
+
+    def __init__(
+        self, num_features=None, num_classes=None, device=None, init=False, **args
+    ):
+        super(AutoGAT, self).__init__()
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [64, 64, 64],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "heads",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,4,8,16",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+        ]
+
+        self.hyperparams = {
+            "num_layers": 2,
+            "hidden": [32],
+            "heads": 4,
+            "dropout": 0.2,
+            "act": "leaky_relu",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        # """Initialize model."""
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GAT({**self.params, **self.hyperparams}).to(self.device)
diff --git a/autogl/module/model/dgl/gcn_dgl.py b/autogl/module/model/dgl/gcn_dgl.py
index b610c08..4f24621 100644
--- a/autogl/module/model/dgl/gcn_dgl.py
+++ b/autogl/module/model/dgl/gcn_dgl.py
@@ -3,26 +3,15 @@ import torch.nn.functional
 import typing as _typing
 
 from dgl.nn.pytorch.conv import GraphConv
+from dgl import remove_self_loop, add_self_loop
 import autogl.data
 from . import register_model
 from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
 from ....utils import get_logger
 
-LOGGER = get_logger("GCNModel")
-
-def add_self_loop(edge_index,num_nodes,edge_weight=None, fill_value=1.):
-    N = num_nodes
-    loop_index = torch.arange(0, N, dtype=torch.long, device=edge_index.device)
-    loop_index = loop_index.unsqueeze(0).repeat(2, 1)
 
-    if edge_weight is not None:
-        assert edge_weight.numel() == edge_index.size(1)
-        loop_weight = edge_weight.new_full((N, ), fill_value)
-        edge_weight = torch.cat([edge_weight, loop_weight], dim=0)
-
-    edge_index = torch.cat([edge_index, loop_index], dim=1)
+LOGGER = get_logger("GCNModel")
 
-    return edge_index, edge_weight
 
 class GCN(ClassificationSupportedSequentialModel):
     class _GCNLayer(torch.nn.Module):
@@ -68,24 +57,12 @@ class GCN(ClassificationSupportedSequentialModel):
         def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
             
             x: torch.Tensor = data.ndata['feat']
-            edge_index: torch.LongTensor = data.edges
+            
             if self.add_self_loops:
-                edge_index, edge_weight = add_self_loop(edge_index, x.size(0), edge_weight)
+                data = remove_self_loop(data)
+                data = add_self_loop(data)
 
             
-            # edge_weight: _typing.Optional[torch.Tensor] = getattr(
-            #     data, "edge_weight", None
-            # )
-            # """ Validate the arguments """
-            # if not type(x) == type(edge_index) == torch.Tensor:
-            #     raise TypeError
-            # if edge_weight is not None and (
-            #     type(edge_weight) != torch.Tensor
-            #     or edge_index.size() != (2, edge_weight.size(0))
-            # ):
-            #     edge_weight: _typing.Optional[torch.Tensor] = None
-            
-
             x: torch.Tensor = self._convolution.forward(data, x)
             if self._activation_name is not None and enable_activation:
                 x: torch.Tensor = activate_func(x, self._activation_name)
@@ -218,19 +195,21 @@ class GCN(ClassificationSupportedSequentialModel):
             and len(getattr(data, "edge_indexes"))
             == len(self.__sequential_encoding_layers)
         ):
+            if not data.edata.has_key('edge_weights'):
+                data.edata['edge_weights']=None
             return __compose_edge_index_and_weight(
-                getattr(data, "edge_index"), getattr(data, "edge_weight", None)
+                data.edges(), data.edata['edge_weights']
             )
-        for __edge_index in getattr(data, "edge_indexes"):
-            if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
-                return __compose_edge_index_and_weight(
-                    getattr(data, "edge_index"), getattr(data, "edge_weight", None)
-                )
+        # for __edge_index in getattr(data, "edge_indexes"):
+        #     if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
+        #         return __compose_edge_index_and_weight(
+        #             data.edges(), getattr(data, "edge_weight", None)
+        #         )
 
         if (
-            hasattr(data, "edge_weights")
-            and isinstance(getattr(data, "edge_weights"), _typing.Sequence)
-            and len(getattr(data, "edge_weights"))
+            data.edata.has_key('edge_weights')
+            and isinstance(data.edata['edge_weights'], _typing.Sequence)
+            and len(data.edata.has_key('edge_weights'))
             == len(self.__sequential_encoding_layers)
         ):
             return [
@@ -260,7 +239,7 @@ class GCN(ClassificationSupportedSequentialModel):
             assert len(edge_indexes_and_weights) == len(
                 self.__sequential_encoding_layers
             )
-            x: torch.Tensor = getattr(data, "x")
+            x: torch.Tensor = data.ndata['x']
             for _edge_index_and_weight, gcn in zip(
                 edge_indexes_and_weights, self.__sequential_encoding_layers
             ):
@@ -270,7 +249,7 @@ class GCN(ClassificationSupportedSequentialModel):
             return x
         else:
             """ edge_indexes_and_weights is (edge_index, edge_weight) """
-            x = getattr(data, "x")
+            x = data.ndata['x']
             for gcn in self.__sequential_encoding_layers:
                 _temp_data = autogl.data.Data(
                     x=x, edge_index=edge_indexes_and_weights[0]
@@ -283,13 +262,13 @@ class GCN(ClassificationSupportedSequentialModel):
         return torch.nn.functional.log_softmax(x, dim=1)
 
     def lp_encode(self, data):
-        x: torch.Tensor = getattr(data, "x")
+        x: torch.Tensor = data.ndata['x']
         for i in range(len(self.__sequential_encoding_layers) - 2):
             x = self.__sequential_encoding_layers[i](
-                autogl.data.Data(x, getattr(data, "edge_index"))
+                autogl.data.Data(x, data.edges())
             )
         x = self.__sequential_encoding_layers[-2](
-            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
+            autogl.data.Data(x, data.edges()), enable_activation=False
         )
         return x
 
diff --git a/autogl/module/model/dgl/graphsage_dgl.py b/autogl/module/model/dgl/graphsage_dgl.py
new file mode 100644
index 0000000..6c18d71
--- /dev/null
+++ b/autogl/module/model/dgl/graphsage_dgl.py
@@ -0,0 +1,303 @@
+import torch
+import typing as _typing
+
+from dgl.nn.pytorch.conv import SAGEConv
+import torch.nn.functional
+import autogl.data
+from . import register_model
+from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
+from ....utils import get_logger
+
+LOGGER = get_logger("SAGEModel")
+
+
+class GraphSAGE(ClassificationSupportedSequentialModel):
+    class _SAGELayer(torch.nn.Module):
+        def __init__(
+            self,
+            input_channels: int,
+            output_channels: int,
+            aggr: str,
+            activation_name: _typing.Optional[str] = ...,
+            dropout_probability: _typing.Optional[float] = ...,
+        ):
+            super().__init__()
+            self._convolution: SAGEConv = SAGEConv(
+                input_channels, output_channels, aggregator_type=aggr
+            )
+            if (
+                activation_name is not Ellipsis
+                and activation_name is not None
+                and type(activation_name) == str
+            ):
+                self._activation_name: _typing.Optional[str] = activation_name
+            else:
+                self._activation_name: _typing.Optional[str] = None
+            if (
+                dropout_probability is not Ellipsis
+                and dropout_probability is not None
+                and type(dropout_probability) == float
+            ):
+                if dropout_probability < 0:
+                    dropout_probability = 0
+                if dropout_probability > 1:
+                    dropout_probability = 1
+                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
+                    dropout_probability
+                )
+            else:
+                self._dropout: _typing.Optional[torch.nn.Dropout] = None
+
+        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
+            x: torch.Tensor = data.ndata['x']
+            
+            x: torch.Tensor = self._convolution.forward(data, x)
+            if self._activation_name is not None and enable_activation:
+                x: torch.Tensor = activate_func(x, self._activation_name)
+            if self._dropout is not None:
+                x: torch.Tensor = self._dropout.forward(x)
+            return x
+
+    def __init__(
+        self,
+        num_features: int,
+        num_classes: int,
+        hidden_features: _typing.Sequence[int],
+        activation_name: str,
+        layers_dropout: _typing.Union[
+            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
+        ] = None,
+        aggr: str = "mean",
+    ):
+        super().__init__()
+        if not type(num_features) == type(num_classes) == int:
+            raise TypeError
+        if not isinstance(hidden_features, _typing.Sequence):
+            raise TypeError
+        for hidden_feature in hidden_features:
+            if type(hidden_feature) != int:
+                raise TypeError
+            elif hidden_feature <= 0:
+                raise ValueError
+        if isinstance(layers_dropout, _typing.Sequence):
+            if len(layers_dropout) != (len(hidden_features) + 1):
+                raise TypeError
+            for d in layers_dropout:
+                if d is not None and type(d) != float:
+                    raise TypeError
+            _layers_dropout: _typing.Sequence[_typing.Optional[float]] = layers_dropout
+        elif layers_dropout is None or type(layers_dropout) == float:
+            _layers_dropout: _typing.Sequence[_typing.Optional[float]] = [
+                layers_dropout for _ in range(len(hidden_features))
+            ] + [None]
+        else:
+            raise TypeError
+        if not type(activation_name) == type(aggr) == str:
+            raise TypeError
+        if aggr not in ("add", "max", "mean"):
+            aggr = "mean"
+
+        if len(hidden_features) == 0:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    [
+                        self._SAGELayer(
+                            num_features,
+                            num_classes,
+                            aggr,
+                            activation_name,
+                            _layers_dropout[0],
+                        )
+                    ]
+                )
+            )
+        else:
+            self.__sequential_encoding_layers: torch.nn.ModuleList = (
+                torch.nn.ModuleList(
+                    [
+                        self._SAGELayer(
+                            num_features,
+                            hidden_features[0],
+                            aggr,
+                            activation_name,
+                            _layers_dropout[0],
+                        )
+                    ]
+                )
+            )
+            for i in range(len(hidden_features)):
+                if i + 1 < len(hidden_features):
+                    self.__sequential_encoding_layers.append(
+                        self._SAGELayer(
+                            hidden_features[i],
+                            hidden_features[i + 1],
+                            aggr,
+                            activation_name,
+                            _layers_dropout[i + 1],
+                        )
+                    )
+                else:
+                    self.__sequential_encoding_layers.append(
+                        self._SAGELayer(
+                            hidden_features[i],
+                            num_classes,
+                            aggr,
+                            _layers_dropout[i + 1],
+                        )
+                    )
+
+    @property
+    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
+        return self.__sequential_encoding_layers
+
+    def cls_encode(self, data) -> torch.Tensor:
+        # if (
+        #     hasattr(data, "edge_indexes")
+        #     and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
+        #     and len(getattr(data, "edge_indexes"))
+        #     == len(self.__sequential_encoding_layers)
+        # ):
+        #     for __edge_index in getattr(data, "edge_indexes"):
+        #         if type(__edge_index) != torch.Tensor:
+        #             raise TypeError
+        #     """ Layer-wise encode """
+        #     x: torch.Tensor = getattr(data, "x")
+        #     for i, __edge_index in enumerate(getattr(data, "edge_indexes")):
+        #         x: torch.Tensor = self.__sequential_encoding_layers[i](
+        #             autogl.data.Data(x=x, edge_index=__edge_index)
+        #         )
+        #     return x
+        # else:
+        x: torch.Tensor = data.ndata['x']
+        for i in range(len(self.__sequential_encoding_layers)):
+            x = self.__sequential_encoding_layers[i](
+                autogl.data.Data(x, data.edges())
+            )
+        return x
+
+    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
+        return torch.nn.functional.log_softmax(x, dim=1)
+
+    def lp_encode(self, data):
+        x: torch.Tensor = data.ndata['x']
+        for i in range(len(self.__sequential_encoding_layers) - 2):
+            x = self.__sequential_encoding_layers[i](
+                autogl.data.Data(x, data.edges())
+            )
+        x = self.__sequential_encoding_layers[-2](
+            autogl.data.Data(x, data.edges()), enable_activation=False
+        )
+        return x
+
+    def lp_decode(self, z, pos_edge_index, neg_edge_index):
+        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
+        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
+        return logits
+
+    def lp_decode_all(self, z):
+        prob_adj = z @ z.t()
+        return (prob_adj > 0).nonzero(as_tuple=False).t()
+
+
+@register_model("sage")
+class AutoSAGE(BaseModel):
+    r"""
+    AutoSAGE. The model used in this automodel is GraphSAGE, i.e., the GraphSAGE from the `"Inductive Representation Learning on
+    Large Graphs" <https://arxiv.org/abs/1706.02216>`_ paper. The layer is
+
+    .. math::
+
+        \mathbf{x}^{\prime}_i = \mathbf{W}_1 \mathbf{x}_i + \mathbf{W_2} \cdot
+        \mathrm{mean}_{j \in \mathcal{N(i)}} \mathbf{x}_j
+
+    Parameters
+    ----------
+    num_features: `int`.
+        The dimension of features.
+
+    num_classes: `int`.
+        The number of classes.
+
+    device: `torch.device` or `str`
+        The device where model will be running on.
+
+    init: `bool`.
+        If True(False), the model will (not) be initialized.
+
+    """
+
+    def __init__(
+        self, num_features=None, num_classes=None, device=None, init=False, **args
+    ):
+
+        super(AutoSAGE, self).__init__()
+
+        self.num_features = num_features if num_features is not None else 0
+        self.num_classes = int(num_classes) if num_classes is not None else 0
+        self.device = device if device is not None else "cpu"
+        self.init = True
+
+        self.params = {
+            "features_num": self.num_features,
+            "num_class": self.num_classes,
+        }
+        self.space = [
+            {
+                "parameterName": "num_layers",
+                "type": "DISCRETE",
+                "feasiblePoints": "2,3,4",
+            },
+            {
+                "parameterName": "hidden",
+                "type": "NUMERICAL_LIST",
+                "numericalType": "INTEGER",
+                "length": 3,
+                "minValue": [8, 8, 8],
+                "maxValue": [128, 128, 128],
+                "scalingType": "LOG",
+                "cutPara": ("num_layers",),
+                "cutFunc": lambda x: x[0] - 1,
+            },
+            {
+                "parameterName": "dropout",
+                "type": "DOUBLE",
+                "maxValue": 0.8,
+                "minValue": 0.2,
+                "scalingType": "LINEAR",
+            },
+            {
+                "parameterName": "act",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
+            },
+            {
+                "parameterName": "agg",
+                "type": "CATEGORICAL",
+                "feasiblePoints": ["mean", "add", "max"],
+            },
+        ]
+
+        self.hyperparams = {
+            "num_layers": 3,
+            "hidden": [64, 32],
+            "dropout": 0.5,
+            "act": "relu",
+            "agg": "mean",
+        }
+
+        self.initialized = False
+        if init is True:
+            self.initialize()
+
+    def initialize(self):
+        if self.initialized:
+            return
+        self.initialized = True
+        self.model = GraphSAGE(
+            self.num_features,
+            self.num_classes,
+            self.hyperparams.get("hidden"),
+            self.hyperparams.get("act", "relu"),
+            self.hyperparams.get("dropout", None),
+            self.hyperparams.get("agg", "mean"),
+        ).to(self.device)
diff --git a/test/model_nlf/nclf_dgl.py b/test/model_nlf/nclf_dgl.py
index a3d16b6..d9fab66 100644
--- a/test/model_nlf/nclf_dgl.py
+++ b/test/model_nlf/nclf_dgl.py
@@ -7,7 +7,7 @@ from tqdm import tqdm
 sys.path.append("../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
-#os.environ["AUTOGL_BACKEND"] = "pyg"
+# os.environ["AUTOGL_BACKEND"] = "pyg"
 from autogl.backend import DependentBackend
 import dgl
 from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset

From dd371e587fc5c4dbd30df15c830bc30864f14a5c Mon Sep 17 00:00:00 2001
From: Beini <xbn20@mails.tsinghua.edu.cn>
Date: Wed, 15 Sep 2021 06:32:56 +0000
Subject: [PATCH 66/75] node model

---
 autogl/module/model/dgl/__init__.py        |  13 +-
 autogl/module/model/dgl/dataloader_gin.py  |  85 ------
 autogl/module/model/dgl/gcn_dgl.py         |  11 +-
 autogl/module/model/dgl/graph_saint_dgl.py | 299 +++++++++++++++++++++
 test/model_nlf/nclf_dgl.py                 | 188 ++++---------
 5 files changed, 363 insertions(+), 233 deletions(-)
 delete mode 100644 autogl/module/model/dgl/dataloader_gin.py
 create mode 100644 autogl/module/model/dgl/graph_saint_dgl.py

diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index c9f4a8a..6a245eb 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -3,13 +3,8 @@ from .base import BaseModel
 from .topkpool import AutoTopkpool
 
 # from .graph_sage import AutoSAGE
-from .graphsage import AutoSAGE
 from .graph_saint import GraphSAINTAggregationModel
-from .gcn import AutoGCN
-from .gat import AutoGAT
-from .gin import AutoGIN
-from .gin_dgl import GIN
-from .gcn_dgl import GCN
+from .gcn_dgl import GCN,AutoGCN
 from .graphsage_dgl import GraphSAGE
 from .gat_dgl import GAT
 
@@ -18,13 +13,9 @@ __all__ = [
     "register_model",
     "BaseModel",
     "AutoTopkpool",
-    "AutoSAGE",
     "GraphSAINTAggregationModel",
-    "AutoGCN",
-    "AutoGAT",
-    "AutoGIN",
-    "GIN",
     "GCN",
+    "AutoGCN",
     "GraphSAGE",
     "GAT"
 ]
diff --git a/autogl/module/model/dgl/dataloader_gin.py b/autogl/module/model/dgl/dataloader_gin.py
deleted file mode 100644
index 0721b3a..0000000
--- a/autogl/module/model/dgl/dataloader_gin.py
+++ /dev/null
@@ -1,85 +0,0 @@
-"""
-PyTorch compatible dataloader
-"""
-
-
-import math
-import numpy as np
-import torch
-from torch.utils.data.sampler import SubsetRandomSampler
-from sklearn.model_selection import StratifiedKFold
-import dgl
-from dgl.dataloading import GraphDataLoader
-
-
-class GINDataLoader():
-    def __init__(self,
-                 dataset,
-                 batch_size,
-                 device,
-                 collate_fn=None,
-                 seed=0,
-                 shuffle=True,
-                 split_name='fold10',
-                 fold_idx=0,
-                 split_ratio=0.7):
-
-        self.shuffle = shuffle
-        self.seed = seed
-        self.kwargs = {'pin_memory': True} if 'cuda' in device.type else {}
-
-        labels = [l for _, l in dataset]
-
-        if split_name == 'fold10':
-            train_idx, valid_idx = self._split_fold10(
-                labels, fold_idx, seed, shuffle)
-        elif split_name == 'rand':
-            train_idx, valid_idx = self._split_rand(
-                labels, split_ratio, seed, shuffle)
-        else:
-            raise NotImplementedError()
-
-        train_sampler = SubsetRandomSampler(train_idx)
-        valid_sampler = SubsetRandomSampler(valid_idx)
-
-        self.train_loader = GraphDataLoader(
-            dataset, sampler=train_sampler,
-            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
-        self.valid_loader = GraphDataLoader(
-            dataset, sampler=valid_sampler,
-            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
-
-    def train_valid_loader(self):
-        return self.train_loader, self.valid_loader
-
-    def _split_fold10(self, labels, fold_idx=0, seed=0, shuffle=True):
-        ''' 10 flod '''
-        assert 0 <= fold_idx and fold_idx < 10, print(
-            "fold_idx must be from 0 to 9.")
-
-        skf = StratifiedKFold(n_splits=10, shuffle=shuffle, random_state=seed)
-        idx_list = []
-        for idx in skf.split(np.zeros(len(labels)), labels):    # split(x, y)
-            idx_list.append(idx)
-        train_idx, valid_idx = idx_list[fold_idx]
-
-        print(
-            "train_set : test_set = %d : %d",
-            len(train_idx), len(valid_idx))
-
-        return train_idx, valid_idx
-
-    def _split_rand(self, labels, split_ratio=0.7, seed=0, shuffle=True):
-        num_entries = len(labels)
-        indices = list(range(num_entries))
-        np.random.seed(seed)
-        np.random.shuffle(indices)
-        split = int(math.floor(split_ratio * num_entries))
-        train_idx, valid_idx = indices[:split], indices[split:]
-
-        print(
-            "train_set : test_set = %d : %d",
-            len(train_idx), len(valid_idx))
-
-        return train_idx, valid_idx
-
diff --git a/autogl/module/model/dgl/gcn_dgl.py b/autogl/module/model/dgl/gcn_dgl.py
index 4f24621..2ff57d0 100644
--- a/autogl/module/model/dgl/gcn_dgl.py
+++ b/autogl/module/model/dgl/gcn_dgl.py
@@ -54,15 +54,12 @@ class GCN(ClassificationSupportedSequentialModel):
             else:
                 self._dropout: _typing.Optional[torch.nn.Dropout] = None
 
-        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
-            
-            x: torch.Tensor = data.ndata['feat']
+        def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
             
             if self.add_self_loops:
                 data = remove_self_loop(data)
                 data = add_self_loop(data)
 
-            
             x: torch.Tensor = self._convolution.forward(data, x)
             if self._activation_name is not None and enable_activation:
                 x: torch.Tensor = activate_func(x, self._activation_name)
@@ -224,6 +221,12 @@ class GCN(ClassificationSupportedSequentialModel):
                 for __edge_index in getattr(data, "edge_indexes")
             ]
 
+    def forward(self, data):
+        x = data.ndata['x']
+        for gcn in self.__sequential_encoding_layers:
+            x = gcn(data,x)
+        return x
+
     def cls_encode(self, data) -> torch.Tensor:
         edge_indexes_and_weights: _typing.Union[
             _typing.Sequence[
diff --git a/autogl/module/model/dgl/graph_saint_dgl.py b/autogl/module/model/dgl/graph_saint_dgl.py
new file mode 100644
index 0000000..eef4205
--- /dev/null
+++ b/autogl/module/model/dgl/graph_saint_dgl.py
@@ -0,0 +1,299 @@
+import torch.nn as nn
+import torch.nn.functional as F
+import torch as th
+import dgl.function as fn
+import math
+import os
+import time
+import torch as th
+import random
+import numpy as np
+import dgl.function as fn
+import dgl
+from dgl.sampling import random_walk, pack_traces
+
+class GCNLayer(nn.Module):
+    def __init__(self, in_dim, out_dim, order=1, act=None,
+                 dropout=0, batch_norm=False, aggr="concat"):
+        super(GCNLayer, self).__init__()
+        self.lins = nn.ModuleList()
+        self.bias = nn.ParameterList()
+        for _ in range(order + 1):
+            self.lins.append(nn.Linear(in_dim, out_dim, bias=False))
+            self.bias.append(nn.Parameter(th.zeros(out_dim)))
+
+        self.order = order
+        self.act = act
+        self.dropout = nn.Dropout(dropout)
+
+        self.batch_norm = batch_norm
+        if batch_norm:
+            self.offset, self.scale = nn.ParameterList(), nn.ParameterList()
+            for _ in range(order + 1):
+                self.offset.append(nn.Parameter(th.zeros(out_dim)))
+                self.scale.append(nn.Parameter(th.ones(out_dim)))
+
+        self.aggr = aggr
+        self.reset_parameters()
+
+    def reset_parameters(self):
+        for lin in self.lins:
+            nn.init.xavier_normal_(lin.weight)
+
+    def feat_trans(self, features, idx):
+        h = self.lins[idx](features) + self.bias[idx]
+
+        if self.act is not None:
+            h = self.act(h)
+
+        if self.batch_norm:
+            mean = h.mean(dim=1).view(h.shape[0], 1)
+            var = h.var(dim=1, unbiased=False).view(h.shape[0], 1) + 1e-9
+            h = (h - mean) * self.scale[idx] * th.rsqrt(var) + self.offset[idx]
+
+        return h
+
+    def forward(self, graph, features):
+        g = graph.local_var()
+        h_in = self.dropout(features)
+        h_hop = [h_in]
+
+        D_norm = g.ndata['train_D_norm'] if 'train_D_norm' in g.ndata else g.ndata['full_D_norm']
+        for _ in range(self.order):
+            g.ndata['h'] = h_hop[-1]
+            if 'w' not in g.edata:
+                g.edata['w'] = th.ones((g.num_edges(), )).to(features.device)
+            g.update_all(fn.u_mul_e('h', 'w', 'm'),
+                         fn.sum('m', 'h'))
+            h = g.ndata.pop('h')
+            h = h * D_norm
+            h_hop.append(h)
+
+        h_part = [self.feat_trans(ft, idx) for idx, ft in enumerate(h_hop)]
+        if self.aggr == "mean":
+            h_out = h_part[0]
+            for i in range(len(h_part) - 1):
+                h_out = h_out + h_part[i + 1]
+        elif self.aggr == "concat":
+            h_out = th.cat(h_part, 1)
+        else:
+            raise NotImplementedError
+
+        return h_out
+
+
+class GCNNet(nn.Module):
+    def __init__(self, in_dim, hid_dim, out_dim, arch="1-1-0",
+                 act=F.relu, dropout=0, batch_norm=False, aggr="concat"):
+        super(GCNNet, self).__init__()
+        self.gcn = nn.ModuleList()
+
+        orders = list(map(int, arch.split('-')))
+        self.gcn.append(GCNLayer(in_dim=in_dim, out_dim=hid_dim, order=orders[0],
+                                 act=act, dropout=dropout, batch_norm=batch_norm, aggr=aggr))
+        pre_out = ((aggr == "concat") * orders[0] + 1) * hid_dim
+
+        for i in range(1, len(orders)-1):
+            self.gcn.append(GCNLayer(in_dim=pre_out, out_dim=hid_dim, order=orders[i],
+                                     act=act, dropout=dropout, batch_norm=batch_norm, aggr=aggr))
+            pre_out = ((aggr == "concat") * orders[i] + 1) * hid_dim
+
+        self.gcn.append(GCNLayer(in_dim=pre_out, out_dim=hid_dim, order=orders[-1],
+                                 act=act, dropout=dropout, batch_norm=batch_norm, aggr=aggr))
+        pre_out = ((aggr == "concat") * orders[-1] + 1) * hid_dim
+
+        self.out_layer = GCNLayer(in_dim=pre_out, out_dim=out_dim, order=0,
+                                  act=None, dropout=dropout, batch_norm=False, aggr=aggr)
+
+    def forward(self, graph):
+        h = graph.ndata['feat']
+
+        for layer in self.gcn:
+            h = layer(graph, h)
+
+        h = F.normalize(h, p=2, dim=1)
+        h = self.out_layer(graph, h)
+
+        return h
+
+
+
+
+# The base class of sampler
+# (TODO): online sampling
+class SAINTSampler(object):
+    def __init__(self, dn, g, train_nid, node_budget, num_repeat=50):
+        """
+        :param dn: name of dataset
+        :param g: full graph
+        :param train_nid: ids of training nodes
+        :param node_budget: expected number of sampled nodes
+        :param num_repeat: number of times of repeating sampling one node
+        """
+        self.g = g
+        self.train_g: dgl.graph = g.subgraph(train_nid)
+        self.dn, self.num_repeat = dn, num_repeat
+        self.node_counter = th.zeros((self.train_g.num_nodes(),))
+        self.edge_counter = th.zeros((self.train_g.num_edges(),))
+        self.prob = None
+
+        graph_fn, norm_fn = self.__generate_fn__()
+
+        if os.path.exists(graph_fn):
+            self.subgraphs = np.load(graph_fn, allow_pickle=True)
+            aggr_norm, loss_norm = np.load(norm_fn, allow_pickle=True)
+        else:
+            os.makedirs('./subgraphs/', exist_ok=True)
+
+            self.subgraphs = []
+            self.N, sampled_nodes = 0, 0
+
+            t = time.perf_counter()
+            while sampled_nodes <= self.train_g.num_nodes() * num_repeat:
+                subgraph = self.__sample__()
+                self.subgraphs.append(subgraph)
+                sampled_nodes += subgraph.shape[0]
+                self.N += 1
+            print(f'Sampling time: [{time.perf_counter() - t:.2f}s]')
+            np.save(graph_fn, self.subgraphs)
+
+            t = time.perf_counter()
+            self.__counter__()
+            aggr_norm, loss_norm = self.__compute_norm__()
+            print(f'Normalization time: [{time.perf_counter() - t:.2f}s]')
+            np.save(norm_fn, (aggr_norm, loss_norm))
+
+        self.train_g.ndata['l_n'] = th.Tensor(loss_norm)
+        self.train_g.edata['w'] = th.Tensor(aggr_norm)
+        self.__compute_degree_norm()
+
+        self.num_batch = math.ceil(self.train_g.num_nodes() / node_budget)
+        random.shuffle(self.subgraphs)
+        self.__clear__()
+        print("The number of subgraphs is: ", len(self.subgraphs))
+        print("The size of subgraphs is about: ", len(self.subgraphs[-1]))
+
+    def __clear__(self):
+        self.prob = None
+        self.node_counter = None
+        self.edge_counter = None
+        self.g = None
+
+    def __counter__(self):
+
+        for sampled_nodes in self.subgraphs:
+            sampled_nodes = th.from_numpy(sampled_nodes)
+            self.node_counter[sampled_nodes] += 1
+
+            subg = self.train_g.subgraph(sampled_nodes)
+            sampled_edges = subg.edata[dgl.EID]
+            self.edge_counter[sampled_edges] += 1
+
+    def __generate_fn__(self):
+        raise NotImplementedError
+
+    def __compute_norm__(self):
+        self.node_counter[self.node_counter == 0] = 1
+        self.edge_counter[self.edge_counter == 0] = 1
+
+        loss_norm = self.N / self.node_counter / self.train_g.num_nodes()
+
+        self.train_g.ndata['n_c'] = self.node_counter
+        self.train_g.edata['e_c'] = self.edge_counter
+        self.train_g.apply_edges(fn.v_div_e('n_c', 'e_c', 'a_n'))
+        aggr_norm = self.train_g.edata.pop('a_n')
+
+        self.train_g.ndata.pop('n_c')
+        self.train_g.edata.pop('e_c')
+
+        return aggr_norm.numpy(), loss_norm.numpy()
+
+    def __compute_degree_norm(self):
+
+        self.train_g.ndata['train_D_norm'] = 1. / self.train_g.in_degrees().float().clamp(min=1).unsqueeze(1)
+        self.g.ndata['full_D_norm'] = 1. / self.g.in_degrees().float().clamp(min=1).unsqueeze(1)
+
+    def __sample__(self):
+        raise NotImplementedError
+
+    def __len__(self):
+        return self.num_batch
+
+    def __iter__(self):
+        self.n = 0
+        return self
+
+    def __next__(self):
+        if self.n < self.num_batch:
+            result = self.train_g.subgraph(self.subgraphs[self.n])
+            self.n += 1
+            return result
+        else:
+            random.shuffle(self.subgraphs)
+            raise StopIteration()
+
+
+class SAINTNodeSampler(SAINTSampler):
+    def __init__(self, node_budget, dn, g, train_nid, num_repeat=50):
+        self.node_budget = node_budget
+        super(SAINTNodeSampler, self).__init__(dn, g, train_nid, node_budget, num_repeat)
+
+    def __generate_fn__(self):
+        graph_fn = os.path.join('./subgraphs/{}_Node_{}_{}.npy'.format(self.dn, self.node_budget,
+                                                                       self.num_repeat))
+        norm_fn = os.path.join('./subgraphs/{}_Node_{}_{}_norm.npy'.format(self.dn, self.node_budget,
+                                                                           self.num_repeat))
+        return graph_fn, norm_fn
+
+    def __sample__(self):
+        if self.prob is None:
+            self.prob = self.train_g.in_degrees().float().clamp(min=1)
+
+        sampled_nodes = th.multinomial(self.prob, num_samples=self.node_budget, replacement=True).unique()
+        return sampled_nodes.numpy()
+
+
+class SAINTEdgeSampler(SAINTSampler):
+    def __init__(self, edge_budget, dn, g, train_nid, num_repeat=50):
+        self.edge_budget = edge_budget
+        super(SAINTEdgeSampler, self).__init__(dn, g, train_nid, edge_budget * 2, num_repeat)
+
+    def __generate_fn__(self):
+        graph_fn = os.path.join('./subgraphs/{}_Edge_{}_{}.npy'.format(self.dn, self.edge_budget,
+                                                                       self.num_repeat))
+        norm_fn = os.path.join('./subgraphs/{}_Edge_{}_{}_norm.npy'.format(self.dn, self.edge_budget,
+                                                                           self.num_repeat))
+        return graph_fn, norm_fn
+
+    def __sample__(self):
+        if self.prob is None:
+            src, dst = self.train_g.edges()
+            src_degrees, dst_degrees = self.train_g.in_degrees(src).float().clamp(min=1),\
+                                       self.train_g.in_degrees(dst).float().clamp(min=1)
+            self.prob = 1. / src_degrees + 1. / dst_degrees
+
+        sampled_edges = th.multinomial(self.prob, num_samples=self.edge_budget, replacement=True).unique()
+
+        sampled_src, sampled_dst = self.train_g.find_edges(sampled_edges)
+        sampled_nodes = th.cat([sampled_src, sampled_dst]).unique()
+        return sampled_nodes.numpy()
+
+
+class SAINTRandomWalkSampler(SAINTSampler):
+    def __init__(self, num_roots, length, dn, g, train_nid, num_repeat=50):
+        self.num_roots, self.length = num_roots, length
+        super(SAINTRandomWalkSampler, self).__init__(dn, g, train_nid, num_roots * length, num_repeat)
+
+    def __generate_fn__(self):
+        graph_fn = os.path.join('./subgraphs/{}_RW_{}_{}_{}.npy'.format(self.dn, self.num_roots,
+                                                                        self.length, self.num_repeat))
+        norm_fn = os.path.join('./subgraphs/{}_RW_{}_{}_{}_norm.npy'.format(self.dn, self.num_roots,
+                                                                            self.length, self.num_repeat))
+        return graph_fn, norm_fn
+
+    def __sample__(self):
+        sampled_roots = th.randint(0, self.train_g.num_nodes(), (self.num_roots, ))
+        traces, types = random_walk(self.train_g, nodes=sampled_roots, length=self.length)
+        sampled_nodes, _, _, _ = pack_traces(traces, types)
+        sampled_nodes = sampled_nodes.unique()
+        return sampled_nodes.numpy()
diff --git a/test/model_nlf/nclf_dgl.py b/test/model_nlf/nclf_dgl.py
index d9fab66..d1bdcb6 100644
--- a/test/model_nlf/nclf_dgl.py
+++ b/test/model_nlf/nclf_dgl.py
@@ -3,6 +3,7 @@ import sys
 import logging
 logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm
+import time
 
 sys.path.append("../../")
 print(os.getcwd())
@@ -16,9 +17,7 @@ import torch.nn as nn
 import torch.nn.functional as F
 import torch.optim as optim
 
-from autogl.module.model.ginparser import Parser
-from autogl.module.model.dataloader_gin import GINDataLoader
-from autogl.module.model import GIN
+from autogl.module.model import GCN
 
 from pdb import set_trace
 import numpy as np
@@ -26,151 +25,74 @@ from autogl.solver.utils import set_seed
 set_seed(202106)
 
 
-def train(args, net, trainloader, optimizer, criterion, epoch):
-    net.train()
+def evaluate(model, graph, labels, mask):
+    model.eval()
+    with torch.no_grad():
+        logits = model(graph)
+        logits = logits[mask]
+        labels = labels[mask]
+        _, indices = torch.max(logits, dim=1)
+        correct = torch.sum(indices == labels)
+        return correct.item() * 1.0 / len(labels)
 
-    running_loss = 0
-    total_iters = len(trainloader)
-    # setup the offset to avoid the overlap with mouse cursor
-    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
 
-    for pos, (graphs, labels) in zip(bar, trainloader):
-        # batch graphs will be shipped to device in forward part of model
-        labels = labels.to(args.device)
-        graphs = graphs.to(args.device)
-        feat = graphs.ndata.pop('attr')
-        outputs = net(graphs, feat)
-
-        loss = criterion(outputs, labels)
-        running_loss += loss.item()
-
-        # backprop
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-
-        # report
-        bar.set_description('epoch-{}'.format(epoch))
-    bar.close()
-    # the final batch will be aligned
-    running_loss = running_loss / total_iters
-
-    return running_loss
-
-
-def eval_net(args, net, dataloader, criterion):
-    net.eval()
-
-    total = 0
-    total_loss = 0
-    total_correct = 0
-
-    for data in dataloader:
-        graphs, labels = data
-        graphs = graphs.to(args.device)
-        labels = labels.to(args.device)
-        feat = graphs.ndata.pop('attr')
-        total += len(labels)
-        outputs = net(graphs, feat)
-        _, predicted = torch.max(outputs.data, 1)
-
-        total_correct += (predicted == labels.data).sum().item()
-        loss = criterion(outputs, labels)
-        # crossentropy(reduce=True) for default
-        total_loss += loss.item() * len(labels)
-
-    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
-
-    net.train()
-
-    return loss, acc
-
-
-def main(args):
+def main():
 
     # set up seeds, args.seed supported
-    torch.manual_seed(seed=args.seed)
-    np.random.seed(seed=args.seed)
+    torch.manual_seed(seed=202106)
+    np.random.seed(seed=202106)
 
-    is_cuda = not args.disable_cuda and torch.cuda.is_available()
+    is_cuda = torch.cuda.is_available()
 
     if is_cuda:
-        args.device = torch.device("cuda:" + str(args.device))
-        torch.cuda.manual_seed_all(seed=args.seed)
+        device = torch.device("cuda")
+        torch.cuda.manual_seed_all(seed=202106)
     else:
-        args.device = torch.device("cpu")
+        device = torch.device("cpu")
 
-    dataset = GINDataset(args.dataset, not args.learn_eps)
+    dataset = CoraGraphDataset()
+    data = dataset[0]
+    data.ndata['x'] = data.ndata['feat']
+    train_mask = data.ndata['train_mask']
+    val_mask = data.ndata['val_mask']
+    test_mask = data.ndata['test_mask']
+    labels = data.ndata['label']
+    n_edges = data.number_of_edges()
 
-    trainloader, validloader = GINDataLoader(
-        dataset, batch_size=args.batch_size, device=args.device,
-        seed=args.seed, shuffle=True,
-        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
-    # or split_name='rand', split_ratio=0.7
-
-    model = GIN(
-        args.num_layers, args.num_mlp_layers,
-        dataset.dim_nfeats, args.hidden_dim, dataset.gclasses,
-        args.final_dropout, args.learn_eps,
-        args.graph_pooling_type, args.neighbor_pooling_type).to(args.device)
+    model = GCN(data.ndata['x'].size(1), dataset.num_classes, [16], activation_name='relu',
+                dropout = 0.5).to(device)
 
     criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+    optimizer = optim.Adam(model.parameters(), lr=0.01)
     scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
 
-    # it's not cost-effective to hanle the cursor and init 0
-    # https://stackoverflow.com/a/23121189
-    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
-    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
-    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
-
-    for epoch, _, _ in zip(tbar, vbar, lrbar):
-
-        train(args, model, trainloader, optimizer, criterion, epoch)
-        scheduler.step()
-
-        train_loss, train_acc = eval_net(
-            args, model, trainloader, criterion)
-        tbar.set_description(
-            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(train_loss, 100. * train_acc))
-
-        valid_loss, valid_acc = eval_net(
-            args, model, validloader, criterion)
-        vbar.set_description(
-            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(valid_loss, 100. * valid_acc))
-
-        if not args.filename == "":
-            with open(args.filename, 'a') as f:
-                f.write('%s %s %s %s' % (
-                    args.dataset,
-                    args.learn_eps,
-                    args.neighbor_pooling_type,
-                    args.graph_pooling_type
-                ))
-                f.write("\n")
-                f.write("%f %f %f %f" % (
-                    train_loss,
-                    train_acc,
-                    valid_loss,
-                    valid_acc
-                ))
-                f.write("\n")
-
-        lrbar.set_description(
-            "Learning eps with learn_eps={}: {}".format(
-                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
-
-    tbar.close()
-    vbar.close()
-    lrbar.close()
+    dur = []
+    for epoch in range(200):
+        model.train()
+        if epoch >= 3:
+            t0 = time.time()
+        # forward
+        logits = model(data)
+        loss = criterion(logits[train_mask], labels[train_mask])
 
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
 
-if __name__ == '__main__':
-    args = Parser(description='GIN').args
-    print('show all arguments configuration...')
-    print(args)
+        if epoch >= 3:
+            dur.append(time.time() - t0)
+
+        acc = evaluate(model, data, labels, val_mask)
+        print("Epoch {:05d} | Time(s) {:.4f} | Loss {:.4f} | Accuracy {:.4f} | "
+              "ETputs(KTEPS) {:.2f}". format(epoch, np.mean(dur), loss.item(),
+                                             acc, n_edges / np.mean(dur) / 1000))
 
-    main(args)
+    print()
+    acc = evaluate(model, data, labels, test_mask)
+    print("Test accuracy {:.2%}".format(acc))
+
+
+if __name__ == '__main__':
+    
+    main()
 

From e8808ababd64e4ff6b5e34a2549264d65abf18b8 Mon Sep 17 00:00:00 2001
From: Beini <xbn20@mails.tsinghua.edu.cn>
Date: Wed, 15 Sep 2021 07:41:13 +0000
Subject: [PATCH 67/75] node cld

---
 autogl/module/model/dgl/gat_dgl.py       |  8 ++------
 autogl/module/model/dgl/graphsage_dgl.py | 19 ++++++++++++++-----
 test/model_nlf/nclf_dgl.py               | 23 +++++++++++++++++------
 3 files changed, 33 insertions(+), 17 deletions(-)

diff --git a/autogl/module/model/dgl/gat_dgl.py b/autogl/module/model/dgl/gat_dgl.py
index e54c63e..e7ecfc3 100644
--- a/autogl/module/model/dgl/gat_dgl.py
+++ b/autogl/module/model/dgl/gat_dgl.py
@@ -78,9 +78,7 @@ class GAT(torch.nn.Module):
         
         for i in range(self.num_layer):
             x = F.dropout(x, p=self.args["dropout"], training=self.training)
-            x = self.convs[i](data, x)
-            # concat
-            x = x.view(-1, self.heads * self.out_channels)
+            x = self.convs[i](data, x).flatten(1)
             if i != self.num_layer - 1:
                 x = activate_func(x, self.args["act"])
 
@@ -89,9 +87,7 @@ class GAT(torch.nn.Module):
     def lp_encode(self, data):
         x = data.ndata['x']
         for i in range(self.num_layer - 1):
-            x = self.convs[i](x, data.train_pos_edge_index)
-            # concat
-            x = x.view(-1, self.heads * self.out_channels)
+            x = self.convs[i](x, data.train_pos_edge_index).flatten(1)
             if i != self.num_layer - 2:
                 x = activate_func(x, self.args["act"])
                 # x = F.dropout(x, p=self.args["dropout"], training=self.training)
diff --git a/autogl/module/model/dgl/graphsage_dgl.py b/autogl/module/model/dgl/graphsage_dgl.py
index 6c18d71..433e0d7 100644
--- a/autogl/module/model/dgl/graphsage_dgl.py
+++ b/autogl/module/model/dgl/graphsage_dgl.py
@@ -1,6 +1,7 @@
 import torch
 import typing as _typing
 
+import torch.nn.functional as F
 from dgl.nn.pytorch.conv import SAGEConv
 import torch.nn.functional
 import autogl.data
@@ -48,11 +49,10 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
             else:
                 self._dropout: _typing.Optional[torch.nn.Dropout] = None
 
-        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
-            x: torch.Tensor = data.ndata['x']
-            
+        def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
+            # x = data.ndata['x']
             x: torch.Tensor = self._convolution.forward(data, x)
-            if self._activation_name is not None and enable_activation:
+            if (self._activation_name is not None) and enable_activation:
                 x: torch.Tensor = activate_func(x, self._activation_name)
             if self._dropout is not None:
                 x: torch.Tensor = self._dropout.forward(x)
@@ -142,7 +142,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
                             hidden_features[i],
                             num_classes,
                             aggr,
-                            _layers_dropout[i + 1],
+                            dropout_probability=_layers_dropout[i + 1],
                         )
                     )
 
@@ -197,6 +197,15 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
     def lp_decode_all(self, z):
         prob_adj = z @ z.t()
         return (prob_adj > 0).nonzero(as_tuple=False).t()
+    
+    def forward(self, data):
+        # only for test 
+        x = data.ndata['x']
+        for i in range(len(self.__sequential_encoding_layers)):
+            x = self.__sequential_encoding_layers[i](data,x)
+
+        return F.log_softmax(x, dim=1)
+
 
 
 @register_model("sage")
diff --git a/test/model_nlf/nclf_dgl.py b/test/model_nlf/nclf_dgl.py
index d1bdcb6..1bd39db 100644
--- a/test/model_nlf/nclf_dgl.py
+++ b/test/model_nlf/nclf_dgl.py
@@ -6,7 +6,6 @@ from tqdm import tqdm
 import time
 
 sys.path.append("../../")
-print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
 # os.environ["AUTOGL_BACKEND"] = "pyg"
 from autogl.backend import DependentBackend
@@ -17,13 +16,13 @@ import torch.nn as nn
 import torch.nn.functional as F
 import torch.optim as optim
 
-from autogl.module.model import GCN
+from autogl.module.model import GAT,GraphSAGE
 
 from pdb import set_trace
 import numpy as np
 from autogl.solver.utils import set_seed
 set_seed(202106)
-
+import argparse
 
 def evaluate(model, graph, labels, mask):
     model.eval()
@@ -37,6 +36,7 @@ def evaluate(model, graph, labels, mask):
 
 
 def main():
+    
 
     # set up seeds, args.seed supported
     torch.manual_seed(seed=202106)
@@ -59,12 +59,23 @@ def main():
     labels = data.ndata['label']
     n_edges = data.number_of_edges()
 
-    model = GCN(data.ndata['x'].size(1), dataset.num_classes, [16], activation_name='relu',
-                dropout = 0.5).to(device)
+    args={}
+    args["features_num"]=data.ndata['x'].size(1)
+    args['hidden']=[16]
+    args["heads"]=8
+    args['dropout']=0.6
+    args["num_class"]=dataset.num_classes
+    args["num_layers"]=2
+    args['act']='relu'
+
+
+    # model = GAT(args)
+    model = GraphSAGE(args["features_num"],
+                      args["num_class"],
+                      [16],'relu',0.5)
 
     criterion = nn.CrossEntropyLoss()  # defaul reduce is true
     optimizer = optim.Adam(model.parameters(), lr=0.01)
-    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
 
     dur = []
     for epoch in range(200):

From b0c7c5c49fe30c4792f7bc9847831cf2b6f6d74c Mon Sep 17 00:00:00 2001
From: Beini <xbn20@mails.tsinghua.edu.cn>
Date: Tue, 26 Oct 2021 07:14:28 +0000
Subject: [PATCH 68/75] auto

---
 autogl/module/model/dgl/__init__.py      |  12 +-
 autogl/module/model/dgl/gat.py           |  35 +-
 autogl/module/model/dgl/gat_dgl.py       | 212 ------------
 autogl/module/model/dgl/gcn.py           |  67 ++--
 autogl/module/model/dgl/gcn_dgl.py       | 409 -----------------------
 autogl/module/model/dgl/gin.py           | 232 -------------
 autogl/module/model/dgl/gin_dgl.py       | 171 ----------
 autogl/module/model/dgl/ginparser.py     |  81 -----
 autogl/module/model/dgl/graphsage.py     |  80 +++--
 autogl/module/model/dgl/graphsage_dgl.py | 312 -----------------
 10 files changed, 96 insertions(+), 1515 deletions(-)
 delete mode 100644 autogl/module/model/dgl/gat_dgl.py
 delete mode 100644 autogl/module/model/dgl/gcn_dgl.py
 delete mode 100644 autogl/module/model/dgl/gin.py
 delete mode 100644 autogl/module/model/dgl/gin_dgl.py
 delete mode 100644 autogl/module/model/dgl/ginparser.py
 delete mode 100644 autogl/module/model/dgl/graphsage_dgl.py

diff --git a/autogl/module/model/dgl/__init__.py b/autogl/module/model/dgl/__init__.py
index 6a245eb..a007c64 100644
--- a/autogl/module/model/dgl/__init__.py
+++ b/autogl/module/model/dgl/__init__.py
@@ -2,11 +2,11 @@ from ._model_registry import MODEL_DICT, ModelUniversalRegistry, register_model
 from .base import BaseModel
 from .topkpool import AutoTopkpool
 
-# from .graph_sage import AutoSAGE
+
 from .graph_saint import GraphSAINTAggregationModel
-from .gcn_dgl import GCN,AutoGCN
-from .graphsage_dgl import GraphSAGE
-from .gat_dgl import GAT
+from .gcn import GCN, AutoGCN
+from .graphsage import GraphSAGE, AutoSAGE
+from .gat import GAT,AutoGAT
 
 __all__ = [
     "ModelUniversalRegistry",
@@ -17,5 +17,7 @@ __all__ = [
     "GCN",
     "AutoGCN",
     "GraphSAGE",
-    "GAT"
+    "AutoSAGE",
+    "GAT",
+    "AutoGAT"
 ]
diff --git a/autogl/module/model/dgl/gat.py b/autogl/module/model/dgl/gat.py
index d153685..e7ecfc3 100644
--- a/autogl/module/model/dgl/gat.py
+++ b/autogl/module/model/dgl/gat.py
@@ -1,6 +1,6 @@
 import torch
 import torch.nn.functional as F
-from torch_geometric.nn import GATConv
+from dgl.nn.pytorch.conv import GATConv
 from . import register_model
 from .base import BaseModel, activate_func
 from ....utils import get_logger
@@ -45,8 +45,8 @@ class GAT(torch.nn.Module):
             GATConv(
                 self.args["features_num"],
                 self.args["hidden"][0],
-                heads=self.args["heads"],
-                dropout=self.args["dropout"],
+                num_heads =self.args["heads"],
+                attn_drop=self.args["dropout"],
             )
         )
         last_dim = self.args["hidden"][0] * self.args["heads"]
@@ -55,8 +55,8 @@ class GAT(torch.nn.Module):
                 GATConv(
                     last_dim,
                     self.args["hidden"][i + 1],
-                    heads=self.args["heads"],
-                    dropout=self.args["dropout"],
+                    num_heads=self.args["heads"],
+                    attn_drop=self.args["dropout"],
                 )
             )
             last_dim = self.args["hidden"][i + 1] * self.args["heads"]
@@ -64,41 +64,30 @@ class GAT(torch.nn.Module):
             GATConv(
                 last_dim,
                 self.args["num_class"],
-                heads=1,
-                concat=False,
-                dropout=self.args["dropout"],
+                num_heads=1,
+                attn_drop=self.args["dropout"],
             )
         )
 
     def forward(self, data):
         try:
-            x = data.x
+            x = data.ndata['x']
         except:
             print("no x")
             pass
-        try:
-            edge_index = data.edge_index
-        except:
-            print("no index")
-            pass
-        try:
-            edge_weight = data.edge_weight
-        except:
-            edge_weight = None
-            pass
-
+        
         for i in range(self.num_layer):
             x = F.dropout(x, p=self.args["dropout"], training=self.training)
-            x = self.convs[i](x, edge_index, edge_weight)
+            x = self.convs[i](data, x).flatten(1)
             if i != self.num_layer - 1:
                 x = activate_func(x, self.args["act"])
 
         return F.log_softmax(x, dim=1)
 
     def lp_encode(self, data):
-        x = data.x
+        x = data.ndata['x']
         for i in range(self.num_layer - 1):
-            x = self.convs[i](x, data.train_pos_edge_index)
+            x = self.convs[i](x, data.train_pos_edge_index).flatten(1)
             if i != self.num_layer - 2:
                 x = activate_func(x, self.args["act"])
                 # x = F.dropout(x, p=self.args["dropout"], training=self.training)
diff --git a/autogl/module/model/dgl/gat_dgl.py b/autogl/module/model/dgl/gat_dgl.py
deleted file mode 100644
index e7ecfc3..0000000
--- a/autogl/module/model/dgl/gat_dgl.py
+++ /dev/null
@@ -1,212 +0,0 @@
-import torch
-import torch.nn.functional as F
-from dgl.nn.pytorch.conv import GATConv
-from . import register_model
-from .base import BaseModel, activate_func
-from ....utils import get_logger
-
-LOGGER = get_logger("GATModel")
-
-
-def set_default(args, d):
-    for k, v in d.items():
-        if k not in args:
-            args[k] = v
-    return args
-
-
-class GAT(torch.nn.Module):
-    def __init__(self, args):
-        super(GAT, self).__init__()
-        self.args = args
-        self.num_layer = int(self.args["num_layers"])
-
-        missing_keys = list(
-            set(
-                [
-                    "features_num",
-                    "num_class",
-                    "num_layers",
-                    "hidden",
-                    "heads",
-                    "dropout",
-                    "act",
-                ]
-            )
-            - set(self.args.keys())
-        )
-        if len(missing_keys) > 0:
-            raise Exception("Missing keys: %s." % ",".join(missing_keys))
-
-        if not self.num_layer == len(self.args["hidden"]) + 1:
-            LOGGER.warn("Warning: layer size does not match the length of hidden units")
-        self.convs = torch.nn.ModuleList()
-        self.convs.append(
-            GATConv(
-                self.args["features_num"],
-                self.args["hidden"][0],
-                num_heads =self.args["heads"],
-                attn_drop=self.args["dropout"],
-            )
-        )
-        last_dim = self.args["hidden"][0] * self.args["heads"]
-        for i in range(self.num_layer - 2):
-            self.convs.append(
-                GATConv(
-                    last_dim,
-                    self.args["hidden"][i + 1],
-                    num_heads=self.args["heads"],
-                    attn_drop=self.args["dropout"],
-                )
-            )
-            last_dim = self.args["hidden"][i + 1] * self.args["heads"]
-        self.convs.append(
-            GATConv(
-                last_dim,
-                self.args["num_class"],
-                num_heads=1,
-                attn_drop=self.args["dropout"],
-            )
-        )
-
-    def forward(self, data):
-        try:
-            x = data.ndata['x']
-        except:
-            print("no x")
-            pass
-        
-        for i in range(self.num_layer):
-            x = F.dropout(x, p=self.args["dropout"], training=self.training)
-            x = self.convs[i](data, x).flatten(1)
-            if i != self.num_layer - 1:
-                x = activate_func(x, self.args["act"])
-
-        return F.log_softmax(x, dim=1)
-
-    def lp_encode(self, data):
-        x = data.ndata['x']
-        for i in range(self.num_layer - 1):
-            x = self.convs[i](x, data.train_pos_edge_index).flatten(1)
-            if i != self.num_layer - 2:
-                x = activate_func(x, self.args["act"])
-                # x = F.dropout(x, p=self.args["dropout"], training=self.training)
-        return x
-
-    def lp_decode(self, z, pos_edge_index, neg_edge_index):
-        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
-        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
-        return logits
-
-    def lp_decode_all(self, z):
-        prob_adj = z @ z.t()
-        return (prob_adj > 0).nonzero(as_tuple=False).t()
-
-
-@register_model("gat")
-class AutoGAT(BaseModel):
-    r"""
-    AutoGAT. The model used in this automodel is GAT, i.e., the graph attentional network from the `"Graph Attention Networks"
-    <https://arxiv.org/abs/1710.10903>`_ paper. The layer is
-
-    .. math::
-        \mathbf{x}^{\prime}_i = \alpha_{i,i}\mathbf{\Theta}\mathbf{x}_{i} +
-        \sum_{j \in \mathcal{N}(i)} \alpha_{i,j}\mathbf{\Theta}\mathbf{x}_{j}
-
-    where the attention coefficients :math:`\alpha_{i,j}` are computed as
-
-    .. math::
-        \alpha_{i,j} =
-        \frac{
-        \exp\left(\mathrm{LeakyReLU}\left(\mathbf{a}^{\top}
-        [\mathbf{\Theta}\mathbf{x}_i \, \Vert \, \mathbf{\Theta}\mathbf{x}_j]
-        \right)\right)}
-        {\sum_{k \in \mathcal{N}(i) \cup \{ i \}}
-        \exp\left(\mathrm{LeakyReLU}\left(\mathbf{a}^{\top}
-        [\mathbf{\Theta}\mathbf{x}_i \, \Vert \, \mathbf{\Theta}\mathbf{x}_k]
-        \right)\right)}.
-
-    Parameters
-    ----------
-    num_features: `int`.
-        The dimension of features.
-
-    num_classes: `int`.
-        The number of classes.
-
-    device: `torch.device` or `str`
-        The device where model will be running on.
-
-    init: `bool`.
-        If True(False), the model will (not) be initialized.
-
-    args: Other parameters.
-    """
-
-    def __init__(
-        self, num_features=None, num_classes=None, device=None, init=False, **args
-    ):
-        super(AutoGAT, self).__init__()
-        self.num_features = num_features if num_features is not None else 0
-        self.num_classes = int(num_classes) if num_classes is not None else 0
-        self.device = device if device is not None else "cpu"
-        self.init = True
-
-        self.params = {
-            "features_num": self.num_features,
-            "num_class": self.num_classes,
-        }
-        self.space = [
-            {
-                "parameterName": "num_layers",
-                "type": "DISCRETE",
-                "feasiblePoints": "2,3,4",
-            },
-            {
-                "parameterName": "hidden",
-                "type": "NUMERICAL_LIST",
-                "numericalType": "INTEGER",
-                "length": 3,
-                "minValue": [8, 8, 8],
-                "maxValue": [64, 64, 64],
-                "scalingType": "LOG",
-                "cutPara": ("num_layers",),
-                "cutFunc": lambda x: x[0] - 1,
-            },
-            {
-                "parameterName": "dropout",
-                "type": "DOUBLE",
-                "maxValue": 0.8,
-                "minValue": 0.2,
-                "scalingType": "LINEAR",
-            },
-            {
-                "parameterName": "heads",
-                "type": "DISCRETE",
-                "feasiblePoints": "2,4,8,16",
-            },
-            {
-                "parameterName": "act",
-                "type": "CATEGORICAL",
-                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
-            },
-        ]
-
-        self.hyperparams = {
-            "num_layers": 2,
-            "hidden": [32],
-            "heads": 4,
-            "dropout": 0.2,
-            "act": "leaky_relu",
-        }
-
-        self.initialized = False
-        if init is True:
-            self.initialize()
-
-    def initialize(self):
-        # """Initialize model."""
-        if self.initialized:
-            return
-        self.initialized = True
-        self.model = GAT({**self.params, **self.hyperparams}).to(self.device)
diff --git a/autogl/module/model/dgl/gcn.py b/autogl/module/model/dgl/gcn.py
index 30bc1a7..2ff57d0 100644
--- a/autogl/module/model/dgl/gcn.py
+++ b/autogl/module/model/dgl/gcn.py
@@ -2,12 +2,14 @@ import torch
 import torch.nn.functional
 import typing as _typing
 
-from torch_geometric.nn.conv import GCNConv
+from dgl.nn.pytorch.conv import GraphConv
+from dgl import remove_self_loop, add_self_loop
 import autogl.data
 from . import register_model
 from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
 from ....utils import get_logger
 
+
 LOGGER = get_logger("GCNModel")
 
 
@@ -23,12 +25,12 @@ class GCN(ClassificationSupportedSequentialModel):
             dropout_probability: _typing.Optional[float] = ...,
         ):
             super().__init__()
-            self._convolution: GCNConv = GCNConv(
+            self._convolution: GraphConv = GraphConv(
                 input_channels,
                 output_channels,
-                add_self_loops=bool(add_self_loops),
-                normalize=bool(normalize),
+                norm='both' if normalize else 'none',
             )
+            self.add_self_loops = bool(add_self_loops),
             if (
                 activation_name is not Ellipsis
                 and activation_name is not None
@@ -52,22 +54,13 @@ class GCN(ClassificationSupportedSequentialModel):
             else:
                 self._dropout: _typing.Optional[torch.nn.Dropout] = None
 
-        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
-            x: torch.Tensor = getattr(data, "x")
-            edge_index: torch.LongTensor = getattr(data, "edge_index")
-            edge_weight: _typing.Optional[torch.Tensor] = getattr(
-                data, "edge_weight", None
-            )
-            """ Validate the arguments """
-            if not type(x) == type(edge_index) == torch.Tensor:
-                raise TypeError
-            if edge_weight is not None and (
-                type(edge_weight) != torch.Tensor
-                or edge_index.size() != (2, edge_weight.size(0))
-            ):
-                edge_weight: _typing.Optional[torch.Tensor] = None
+        def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
+            
+            if self.add_self_loops:
+                data = remove_self_loop(data)
+                data = add_self_loop(data)
 
-            x: torch.Tensor = self._convolution.forward(x, edge_index, edge_weight)
+            x: torch.Tensor = self._convolution.forward(data, x)
             if self._activation_name is not None and enable_activation:
                 x: torch.Tensor = activate_func(x, self._activation_name)
             if self._dropout is not None:
@@ -199,19 +192,21 @@ class GCN(ClassificationSupportedSequentialModel):
             and len(getattr(data, "edge_indexes"))
             == len(self.__sequential_encoding_layers)
         ):
+            if not data.edata.has_key('edge_weights'):
+                data.edata['edge_weights']=None
             return __compose_edge_index_and_weight(
-                getattr(data, "edge_index"), getattr(data, "edge_weight", None)
+                data.edges(), data.edata['edge_weights']
             )
-        for __edge_index in getattr(data, "edge_indexes"):
-            if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
-                return __compose_edge_index_and_weight(
-                    getattr(data, "edge_index"), getattr(data, "edge_weight", None)
-                )
+        # for __edge_index in getattr(data, "edge_indexes"):
+        #     if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
+        #         return __compose_edge_index_and_weight(
+        #             data.edges(), getattr(data, "edge_weight", None)
+        #         )
 
         if (
-            hasattr(data, "edge_weights")
-            and isinstance(getattr(data, "edge_weights"), _typing.Sequence)
-            and len(getattr(data, "edge_weights"))
+            data.edata.has_key('edge_weights')
+            and isinstance(data.edata['edge_weights'], _typing.Sequence)
+            and len(data.edata.has_key('edge_weights'))
             == len(self.__sequential_encoding_layers)
         ):
             return [
@@ -226,6 +221,12 @@ class GCN(ClassificationSupportedSequentialModel):
                 for __edge_index in getattr(data, "edge_indexes")
             ]
 
+    def forward(self, data):
+        x = data.ndata['x']
+        for gcn in self.__sequential_encoding_layers:
+            x = gcn(data,x)
+        return x
+
     def cls_encode(self, data) -> torch.Tensor:
         edge_indexes_and_weights: _typing.Union[
             _typing.Sequence[
@@ -241,7 +242,7 @@ class GCN(ClassificationSupportedSequentialModel):
             assert len(edge_indexes_and_weights) == len(
                 self.__sequential_encoding_layers
             )
-            x: torch.Tensor = getattr(data, "x")
+            x: torch.Tensor = data.ndata['x']
             for _edge_index_and_weight, gcn in zip(
                 edge_indexes_and_weights, self.__sequential_encoding_layers
             ):
@@ -251,7 +252,7 @@ class GCN(ClassificationSupportedSequentialModel):
             return x
         else:
             """ edge_indexes_and_weights is (edge_index, edge_weight) """
-            x = getattr(data, "x")
+            x = data.ndata['x']
             for gcn in self.__sequential_encoding_layers:
                 _temp_data = autogl.data.Data(
                     x=x, edge_index=edge_indexes_and_weights[0]
@@ -264,13 +265,13 @@ class GCN(ClassificationSupportedSequentialModel):
         return torch.nn.functional.log_softmax(x, dim=1)
 
     def lp_encode(self, data):
-        x: torch.Tensor = getattr(data, "x")
+        x: torch.Tensor = data.ndata['x']
         for i in range(len(self.__sequential_encoding_layers) - 2):
             x = self.__sequential_encoding_layers[i](
-                autogl.data.Data(x, getattr(data, "edge_index"))
+                autogl.data.Data(x, data.edges())
             )
         x = self.__sequential_encoding_layers[-2](
-            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
+            autogl.data.Data(x, data.edges()), enable_activation=False
         )
         return x
 
diff --git a/autogl/module/model/dgl/gcn_dgl.py b/autogl/module/model/dgl/gcn_dgl.py
deleted file mode 100644
index 2ff57d0..0000000
--- a/autogl/module/model/dgl/gcn_dgl.py
+++ /dev/null
@@ -1,409 +0,0 @@
-import torch
-import torch.nn.functional
-import typing as _typing
-
-from dgl.nn.pytorch.conv import GraphConv
-from dgl import remove_self_loop, add_self_loop
-import autogl.data
-from . import register_model
-from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
-from ....utils import get_logger
-
-
-LOGGER = get_logger("GCNModel")
-
-
-class GCN(ClassificationSupportedSequentialModel):
-    class _GCNLayer(torch.nn.Module):
-        def __init__(
-            self,
-            input_channels: int,
-            output_channels: int,
-            add_self_loops: bool = True,
-            normalize: bool = True,
-            activation_name: _typing.Optional[str] = ...,
-            dropout_probability: _typing.Optional[float] = ...,
-        ):
-            super().__init__()
-            self._convolution: GraphConv = GraphConv(
-                input_channels,
-                output_channels,
-                norm='both' if normalize else 'none',
-            )
-            self.add_self_loops = bool(add_self_loops),
-            if (
-                activation_name is not Ellipsis
-                and activation_name is not None
-                and type(activation_name) == str
-            ):
-                self._activation_name: _typing.Optional[str] = activation_name
-            else:
-                self._activation_name: _typing.Optional[str] = None
-            if (
-                dropout_probability is not Ellipsis
-                and dropout_probability is not None
-                and type(dropout_probability) == float
-            ):
-                if dropout_probability < 0:
-                    dropout_probability = 0
-                if dropout_probability > 1:
-                    dropout_probability = 1
-                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
-                    dropout_probability
-                )
-            else:
-                self._dropout: _typing.Optional[torch.nn.Dropout] = None
-
-        def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
-            
-            if self.add_self_loops:
-                data = remove_self_loop(data)
-                data = add_self_loop(data)
-
-            x: torch.Tensor = self._convolution.forward(data, x)
-            if self._activation_name is not None and enable_activation:
-                x: torch.Tensor = activate_func(x, self._activation_name)
-            if self._dropout is not None:
-                x: torch.Tensor = self._dropout.forward(x)
-            return x
-
-    def __init__(
-        self,
-        num_features: int,
-        num_classes: int,
-        hidden_features: _typing.Sequence[int],
-        activation_name: str,
-        dropout: _typing.Union[
-            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
-        ] = None,
-        add_self_loops: bool = True,
-        normalize: bool = True,
-    ):
-        if isinstance(dropout, _typing.Sequence):
-            if len(dropout) != len(hidden_features) + 1:
-                raise TypeError(
-                    "When the dropout argument is a sequence, "
-                    "The sequence length must equal to the number of layers to construct."
-                )
-            for _dropout in dropout:
-                if _dropout is not None and type(_dropout) != float:
-                    raise TypeError(
-                        "When the dropout argument is a sequence, "
-                        "every item in the sequence must be float or None"
-                    )
-            dropout_list: _typing.Sequence[_typing.Optional[float]] = dropout
-        elif type(dropout) == float:
-            if dropout < 0:
-                dropout = 0
-            if dropout > 1:
-                dropout = 1
-            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
-                dropout for _ in range(len(hidden_features))
-            ] + [None]
-        elif dropout in (None, Ellipsis, ...):
-            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
-                None for _ in range(len(hidden_features) + 1)
-            ]
-        else:
-            raise TypeError(
-                "The provided dropout argument must be a float number or None or "
-                "a sequence in which each item is either a float Number or None."
-            )
-        super().__init__()
-        if len(hidden_features) == 0:
-            self.__sequential_encoding_layers: torch.nn.ModuleList = (
-                torch.nn.ModuleList(
-                    (
-                        self._GCNLayer(
-                            num_features,
-                            num_classes,
-                            add_self_loops,
-                            normalize,
-                            dropout_probability=dropout_list[0],
-                        ),
-                    )
-                )
-            )
-        else:
-            self.__sequential_encoding_layers: torch.nn.ModuleList = (
-                torch.nn.ModuleList()
-            )
-            self.__sequential_encoding_layers.append(
-                self._GCNLayer(
-                    num_features,
-                    hidden_features[0],
-                    add_self_loops,
-                    normalize,
-                    activation_name,
-                    dropout_list[0],
-                )
-            )
-            for hidden_feature_index in range(len(hidden_features)):
-                if hidden_feature_index + 1 < len(hidden_features):
-                    self.__sequential_encoding_layers.append(
-                        self._GCNLayer(
-                            hidden_features[hidden_feature_index],
-                            hidden_features[hidden_feature_index + 1],
-                            add_self_loops,
-                            normalize,
-                            activation_name,
-                            dropout_list[hidden_feature_index + 1],
-                        )
-                    )
-                else:
-                    self.__sequential_encoding_layers.append(
-                        self._GCNLayer(
-                            hidden_features[hidden_feature_index],
-                            num_classes,
-                            add_self_loops,
-                            normalize,
-                            dropout_list[-1],
-                        )
-                    )
-
-    @property
-    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
-        return self.__sequential_encoding_layers
-
-    def __extract_edge_indexes_and_weights(
-        self, data
-    ) -> _typing.Union[
-        _typing.Sequence[
-            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
-        ],
-        _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
-    ]:
-        def __compose_edge_index_and_weight(
-            _edge_index: torch.LongTensor,
-            _edge_weight: _typing.Optional[torch.Tensor] = None,
-        ) -> _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]:
-            if type(_edge_index) != torch.Tensor or _edge_index.dtype != torch.int64:
-                raise TypeError
-            if _edge_weight is not None and (
-                type(_edge_weight) != torch.Tensor
-                or _edge_index.size() != (2, _edge_weight.size(0))
-            ):
-                _edge_weight: _typing.Optional[torch.Tensor] = None
-            return _edge_index, _edge_weight
-
-        if not (
-            hasattr(data, "edge_indexes")
-            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
-            and len(getattr(data, "edge_indexes"))
-            == len(self.__sequential_encoding_layers)
-        ):
-            if not data.edata.has_key('edge_weights'):
-                data.edata['edge_weights']=None
-            return __compose_edge_index_and_weight(
-                data.edges(), data.edata['edge_weights']
-            )
-        # for __edge_index in getattr(data, "edge_indexes"):
-        #     if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
-        #         return __compose_edge_index_and_weight(
-        #             data.edges(), getattr(data, "edge_weight", None)
-        #         )
-
-        if (
-            data.edata.has_key('edge_weights')
-            and isinstance(data.edata['edge_weights'], _typing.Sequence)
-            and len(data.edata.has_key('edge_weights'))
-            == len(self.__sequential_encoding_layers)
-        ):
-            return [
-                __compose_edge_index_and_weight(_edge_index, _edge_weight)
-                for _edge_index, _edge_weight in zip(
-                    getattr(data, "edge_indexes"), getattr(data, "edge_weights")
-                )
-            ]
-        else:
-            return [
-                __compose_edge_index_and_weight(__edge_index)
-                for __edge_index in getattr(data, "edge_indexes")
-            ]
-
-    def forward(self, data):
-        x = data.ndata['x']
-        for gcn in self.__sequential_encoding_layers:
-            x = gcn(data,x)
-        return x
-
-    def cls_encode(self, data) -> torch.Tensor:
-        edge_indexes_and_weights: _typing.Union[
-            _typing.Sequence[
-                _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
-            ],
-            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
-        ] = self.__extract_edge_indexes_and_weights(data)
-
-        if (not isinstance(edge_indexes_and_weights, tuple)) and isinstance(
-            edge_indexes_and_weights[0], tuple
-        ):
-            """ edge_indexes_and_weights is sequence of (edge_index, edge_weight) """
-            assert len(edge_indexes_and_weights) == len(
-                self.__sequential_encoding_layers
-            )
-            x: torch.Tensor = data.ndata['x']
-            for _edge_index_and_weight, gcn in zip(
-                edge_indexes_and_weights, self.__sequential_encoding_layers
-            ):
-                _temp_data = autogl.data.Data(x=x, edge_index=_edge_index_and_weight[0])
-                _temp_data.edge_weight = _edge_index_and_weight[1]
-                x = gcn(_temp_data)
-            return x
-        else:
-            """ edge_indexes_and_weights is (edge_index, edge_weight) """
-            x = data.ndata['x']
-            for gcn in self.__sequential_encoding_layers:
-                _temp_data = autogl.data.Data(
-                    x=x, edge_index=edge_indexes_and_weights[0]
-                )
-                _temp_data.edge_weight = edge_indexes_and_weights[1]
-                x = gcn(_temp_data)
-            return x
-
-    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
-        return torch.nn.functional.log_softmax(x, dim=1)
-
-    def lp_encode(self, data):
-        x: torch.Tensor = data.ndata['x']
-        for i in range(len(self.__sequential_encoding_layers) - 2):
-            x = self.__sequential_encoding_layers[i](
-                autogl.data.Data(x, data.edges())
-            )
-        x = self.__sequential_encoding_layers[-2](
-            autogl.data.Data(x, data.edges()), enable_activation=False
-        )
-        return x
-
-    def lp_decode(self, z, pos_edge_index, neg_edge_index):
-        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
-        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
-        return logits
-
-    def lp_decode_all(self, z):
-        prob_adj = z @ z.t()
-        return (prob_adj > 0).nonzero(as_tuple=False).t()
-
-
-@register_model("gcn")
-class AutoGCN(BaseModel):
-    r"""
-    AutoGCN.
-    The model used in this automodel is GCN, i.e., the graph convolutional network from the
-    `"Semi-supervised Classification with Graph Convolutional
-    Networks" <https://arxiv.org/abs/1609.02907>`_ paper. The layer is
-
-    .. math::
-
-        \mathbf{X}^{\prime} = \mathbf{\hat{D}}^{-1/2} \mathbf{\hat{A}}
-        \mathbf{\hat{D}}^{-1/2} \mathbf{X} \mathbf{\Theta},
-
-    where :math:`\mathbf{\hat{A}} = \mathbf{A} + \mathbf{I}` denotes the
-    adjacency matrix with inserted self-loops and
-    :math:`\hat{D}_{ii} = \sum_{j=0} \hat{A}_{ij}` its diagonal degree matrix.
-
-    Parameters
-    ----------
-    num_features: ``int``
-        The dimension of features.
-
-    num_classes: ``int``
-        The number of classes.
-
-    device: ``torch.device`` or ``str``
-        The device where model will be running on.
-
-    init: `bool`.
-        If True(False), the model will (not) be initialized.
-    """
-
-    def __init__(
-        self,
-        num_features: int = ...,
-        num_classes: int = ...,
-        device: _typing.Union[str, torch.device] = ...,
-        init: bool = False,
-        **kwargs
-    ) -> None:
-        super().__init__()
-        self.num_features = num_features
-        self.num_classes = num_classes
-        self.device = device
-
-        self.params = {
-            "features_num": self.num_features,
-            "num_class": self.num_classes,
-        }
-        self.space = [
-            {
-                "parameterName": "add_self_loops",
-                "type": "CATEGORICAL",
-                "feasiblePoints": [1],
-            },
-            {
-                "parameterName": "normalize",
-                "type": "CATEGORICAL",
-                "feasiblePoints": [1],
-            },
-            {
-                "parameterName": "num_layers",
-                "type": "DISCRETE",
-                "feasiblePoints": "2,3,4",
-            },
-            {
-                "parameterName": "hidden",
-                "type": "NUMERICAL_LIST",
-                "numericalType": "INTEGER",
-                "length": 3,
-                "minValue": [8, 8, 8],
-                "maxValue": [128, 128, 128],
-                "scalingType": "LOG",
-                "cutPara": ("num_layers",),
-                "cutFunc": lambda x: x[0] - 1,
-            },
-            {
-                "parameterName": "dropout",
-                "type": "DOUBLE",
-                "maxValue": 0.8,
-                "minValue": 0.2,
-                "scalingType": "LINEAR",
-            },
-            {
-                "parameterName": "act",
-                "type": "CATEGORICAL",
-                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
-            },
-        ]
-
-        # initial point of hp search
-        # self.hyperparams = {
-        #     "num_layers": 2,
-        #     "hidden": [16],
-        #     "dropout": 0.2,
-        #     "act": "leaky_relu",
-        # }
-
-        self.hyperparams = {
-            "num_layers": 3,
-            "hidden": [128, 64],
-            "dropout": 0,
-            "act": "relu",
-        }
-
-        self.initialized = False
-        if init is True:
-            self.initialize()
-
-    def initialize(self):
-        if self.initialized:
-            return
-        self.initialized = True
-        self.model = GCN(
-            self.num_features,
-            self.num_classes,
-            self.hyperparams.get("hidden"),
-            self.hyperparams.get("act"),
-            self.hyperparams.get("dropout", None),
-            bool(self.hyperparams.get("add_self_loops", True)),
-            bool(self.hyperparams.get("normalize", True)),
-        ).to(self.device)
diff --git a/autogl/module/model/dgl/gin.py b/autogl/module/model/dgl/gin.py
deleted file mode 100644
index 52a495a..0000000
--- a/autogl/module/model/dgl/gin.py
+++ /dev/null
@@ -1,232 +0,0 @@
-import torch
-import torch.nn.functional as F
-from torch.nn import Linear, ReLU, Sequential, LeakyReLU, Tanh, ELU
-from torch_geometric.nn import GINConv, global_add_pool
-from torch.nn import BatchNorm1d
-from . import register_model
-from .base import BaseModel, activate_func
-from copy import deepcopy
-from ....utils import get_logger
-
-LOGGER = get_logger("GINModel")
-
-
-def set_default(args, d):
-    for k, v in d.items():
-        if k not in args:
-            args[k] = v
-    return args
-
-
-class GIN(torch.nn.Module):
-    def __init__(self, args):
-        super(GIN, self).__init__()
-        self.args = args
-        self.num_layer = int(self.args["num_layers"])
-        assert self.num_layer > 2, "Number of layers in GIN should not less than 3"
-
-        missing_keys = list(
-            set(
-                [
-                    "features_num",
-                    "num_class",
-                    "num_graph_features",
-                    "num_layers",
-                    "hidden",
-                    "dropout",
-                    "act",
-                    "mlp_layers",
-                    "eps",
-                ]
-            )
-            - set(self.args.keys())
-        )
-        if len(missing_keys) > 0:
-            raise Exception("Missing keys: %s." % ",".join(missing_keys))
-        if not self.num_layer == len(self.args["hidden"]) + 1:
-            LOGGER.warn("Warning: layer size does not match the length of hidden units")
-        self.num_graph_features = self.args["num_graph_features"]
-
-        if self.args["act"] == "leaky_relu":
-            act = LeakyReLU()
-        elif self.args["act"] == "relu":
-            act = ReLU()
-        elif self.args["act"] == "elu":
-            act = ELU()
-        elif self.args["act"] == "tanh":
-            act = Tanh()
-        else:
-            act = ReLU()
-
-        train_eps = True if self.args["eps"] == "True" else False
-
-        self.convs = torch.nn.ModuleList()
-        self.bns = torch.nn.ModuleList()
-
-        nn = [Linear(self.args["features_num"], self.args["hidden"][0])]
-        for _ in range(self.args["mlp_layers"] - 1):
-            nn.append(act)
-            nn.append(Linear(self.args["hidden"][0], self.args["hidden"][0]))
-        # nn.append(BatchNorm1d(self.args['hidden'][0]))
-        self.convs.append(GINConv(Sequential(*nn), train_eps=train_eps))
-        self.bns.append(BatchNorm1d(self.args["hidden"][0]))
-
-        for i in range(self.num_layer - 3):
-            nn = [Linear(self.args["hidden"][i], self.args["hidden"][i + 1])]
-            for _ in range(self.args["mlp_layers"] - 1):
-                nn.append(act)
-                nn.append(
-                    Linear(self.args["hidden"][i + 1], self.args["hidden"][i + 1])
-                )
-            # nn.append(BatchNorm1d(self.args['hidden'][i+1]))
-            self.convs.append(GINConv(Sequential(*nn), train_eps=train_eps))
-            self.bns.append(BatchNorm1d(self.args["hidden"][i + 1]))
-
-        self.fc1 = Linear(
-            self.args["hidden"][self.num_layer - 3] + self.num_graph_features,
-            self.args["hidden"][self.num_layer - 2],
-        )
-        self.fc2 = Linear(
-            self.args["hidden"][self.num_layer - 2], self.args["num_class"]
-        )
-
-    def forward(self, data):
-        x, edge_index, batch = data.x, data.edge_index, data.batch
-
-        if self.num_graph_features > 0:
-            graph_feature = data.gf
-
-        for i in range(self.num_layer - 2):
-            x = self.convs[i](x, edge_index)
-            x = activate_func(x, self.args["act"])
-            x = self.bns[i](x)
-
-        x = global_add_pool(x, batch)
-        if self.num_graph_features > 0:
-            x = torch.cat([x, graph_feature], dim=-1)
-        x = self.fc1(x)
-        x = activate_func(x, self.args["act"])
-        x = F.dropout(x, p=self.args["dropout"], training=self.training)
-
-        x = self.fc2(x)
-
-        return F.log_softmax(x, dim=1)
-
-
-@register_model("gin")
-class AutoGIN(BaseModel):
-    r"""
-    AutoGIN. The model used in this automodel is GIN, i.e., the graph isomorphism network from the `"How Powerful are
-    Graph Neural Networks?" <https://arxiv.org/abs/1810.00826>`_ paper. The layer is
-
-    .. math::
-        \mathbf{x}^{\prime}_i = h_{\mathbf{\Theta}} \left( (1 + \epsilon) \cdot
-        \mathbf{x}_i + \sum_{j \in \mathcal{N}(i)} \mathbf{x}_j \right)
-
-    or
-
-    .. math::
-        \mathbf{X}^{\prime} = h_{\mathbf{\Theta}} \left( \left( \mathbf{A} +
-        (1 + \epsilon) \cdot \mathbf{I} \right) \cdot \mathbf{X} \right),
-
-    here :math:`h_{\mathbf{\Theta}}` denotes a neural network, *.i.e.* an MLP.
-
-    Parameters
-    ----------
-    num_features: `int`.
-        The dimension of features.
-
-    num_classes: `int`.
-        The number of classes.
-
-    device: `torch.device` or `str`
-        The device where model will be running on.
-
-    init: `bool`.
-        If True(False), the model will (not) be initialized.
-    """
-
-    def __init__(
-        self,
-        num_features=None,
-        num_classes=None,
-        device=None,
-        init=False,
-        num_graph_features=None,
-        **args
-    ):
-
-        super(AutoGIN, self).__init__()
-        self.num_features = num_features if num_features is not None else 0
-        self.num_classes = int(num_classes) if num_classes is not None else 0
-        self.num_graph_features = (
-            int(num_graph_features) if num_graph_features is not None else 0
-        )
-        self.device = device if device is not None else "cpu"
-        self.init = True
-
-        self.params = {
-            "features_num": self.num_features,
-            "num_class": self.num_classes,
-            "num_graph_features": self.num_graph_features,
-        }
-        self.space = [
-            {
-                "parameterName": "num_layers",
-                "type": "DISCRETE",
-                "feasiblePoints": "4,5,6",
-            },
-            {
-                "parameterName": "hidden",
-                "type": "NUMERICAL_LIST",
-                "numericalType": "INTEGER",
-                "length": 5,
-                "minValue": [8, 8, 8, 8, 8],
-                "maxValue": [64, 64, 64, 64, 64],
-                "scalingType": "LOG",
-                "cutPara": ("num_layers",),
-                "cutFunc": lambda x: x[0] - 1,
-            },
-            {
-                "parameterName": "dropout",
-                "type": "DOUBLE",
-                "maxValue": 0.9,
-                "minValue": 0.1,
-                "scalingType": "LINEAR",
-            },
-            {
-                "parameterName": "act",
-                "type": "CATEGORICAL",
-                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
-            },
-            {
-                "parameterName": "eps",
-                "type": "CATEGORICAL",
-                "feasiblePoints": ["True", "False"],
-            },
-            {
-                "parameterName": "mlp_layers",
-                "type": "DISCRETE",
-                "feasiblePoints": "2,3,4",
-            },
-        ]
-
-        self.hyperparams = {
-            "num_layers": 3,
-            "hidden": [64, 32],
-            "dropout": 0.5,
-            "act": "relu",
-            "eps": "True",
-            "mlp_layers": 2,
-        }
-
-        self.initialized = False
-        if init is True:
-            self.initialize()
-
-    def initialize(self):
-        # """Initialize model."""
-        if self.initialized:
-            return
-        self.initialized = True
-        self.model = GIN({**self.params, **self.hyperparams}).to(self.device)
diff --git a/autogl/module/model/dgl/gin_dgl.py b/autogl/module/model/dgl/gin_dgl.py
deleted file mode 100644
index 8a5408e..0000000
--- a/autogl/module/model/dgl/gin_dgl.py
+++ /dev/null
@@ -1,171 +0,0 @@
-"""
-How Powerful are Graph Neural Networks
-https://arxiv.org/abs/1810.00826
-https://openreview.net/forum?id=ryGs6iA5Km
-Author's implementation: https://github.com/weihua916/powerful-gnns
-"""
-
-
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-from dgl.nn.pytorch.conv import GINConv
-from dgl.nn.pytorch.glob import SumPooling, AvgPooling, MaxPooling
-
-
-class ApplyNodeFunc(nn.Module):
-    """Update the node feature hv with MLP, BN and ReLU."""
-    def __init__(self, mlp):
-        super(ApplyNodeFunc, self).__init__()
-        self.mlp = mlp
-        self.bn = nn.BatchNorm1d(self.mlp.output_dim)
-
-    def forward(self, h):
-        h = self.mlp(h)
-        h = self.bn(h)
-        h = F.relu(h)
-        return h
-
-
-class MLP(nn.Module):
-    """MLP with linear output"""
-    def __init__(self, num_layers, input_dim, hidden_dim, output_dim):
-        """MLP layers construction
-
-        Paramters
-        ---------
-        num_layers: int
-            The number of linear layers
-        input_dim: int
-            The dimensionality of input features
-        hidden_dim: int
-            The dimensionality of hidden units at ALL layers
-        output_dim: int
-            The number of classes for prediction
-
-        """
-        super(MLP, self).__init__()
-        self.linear_or_not = True  # default is linear model
-        self.num_layers = num_layers
-        self.output_dim = output_dim
-
-        if num_layers < 1:
-            raise ValueError("number of layers should be positive!")
-        elif num_layers == 1:
-            # Linear model
-            self.linear = nn.Linear(input_dim, output_dim)
-        else:
-            # Multi-layer model
-            self.linear_or_not = False
-            self.linears = torch.nn.ModuleList()
-            self.batch_norms = torch.nn.ModuleList()
-
-            self.linears.append(nn.Linear(input_dim, hidden_dim))
-            for layer in range(num_layers - 2):
-                self.linears.append(nn.Linear(hidden_dim, hidden_dim))
-            self.linears.append(nn.Linear(hidden_dim, output_dim))
-
-            for layer in range(num_layers - 1):
-                self.batch_norms.append(nn.BatchNorm1d((hidden_dim)))
-
-    def forward(self, x):
-        if self.linear_or_not:
-            # If linear model
-            return self.linear(x)
-        else:
-            # If MLP
-            h = x
-            for i in range(self.num_layers - 1):
-                h = F.relu(self.batch_norms[i](self.linears[i](h)))
-            return self.linears[-1](h)
-
-
-class GIN(nn.Module):
-    """GIN model"""
-    def __init__(self, num_layers, num_mlp_layers, input_dim, hidden_dim,
-                 output_dim, final_dropout, learn_eps, graph_pooling_type,
-                 neighbor_pooling_type):
-        """model parameters setting
-
-        Paramters
-        ---------
-        num_layers: int
-            The number of linear layers in the neural network
-        num_mlp_layers: int
-            The number of linear layers in mlps
-        input_dim: int
-            The dimensionality of input features
-        hidden_dim: int
-            The dimensionality of hidden units at ALL layers
-        output_dim: int
-            The number of classes for prediction
-        final_dropout: float
-            dropout ratio on the final linear layer
-        learn_eps: boolean
-            If True, learn epsilon to distinguish center nodes from neighbors
-            If False, aggregate neighbors and center nodes altogether.
-        neighbor_pooling_type: str
-            how to aggregate neighbors (sum, mean, or max)
-        graph_pooling_type: str
-            how to aggregate entire nodes in a graph (sum, mean or max)
-
-        """
-        super(GIN, self).__init__()
-        self.num_layers = num_layers
-        self.learn_eps = learn_eps
-
-        # List of MLPs
-        self.ginlayers = torch.nn.ModuleList()
-        self.batch_norms = torch.nn.ModuleList()
-
-        for layer in range(self.num_layers - 1):
-            if layer == 0:
-                mlp = MLP(num_mlp_layers, input_dim, hidden_dim, hidden_dim)
-            else:
-                mlp = MLP(num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)
-
-            self.ginlayers.append(
-                GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, self.learn_eps))
-            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))
-
-        # Linear function for graph poolings of output of each layer
-        # which maps the output of different layers into a prediction score
-        self.linears_prediction = torch.nn.ModuleList()
-
-        for layer in range(num_layers):
-            if layer == 0:
-                self.linears_prediction.append(
-                    nn.Linear(input_dim, output_dim))
-            else:
-                self.linears_prediction.append(
-                    nn.Linear(hidden_dim, output_dim))
-
-        self.drop = nn.Dropout(final_dropout)
-
-        if graph_pooling_type == 'sum':
-            self.pool = SumPooling()
-        elif graph_pooling_type == 'mean':
-            self.pool = AvgPooling()
-        elif graph_pooling_type == 'max':
-            self.pool = MaxPooling()
-        else:
-            raise NotImplementedError
-
-    def forward(self, g, h):
-        # list of hidden representation at each layer (including input)
-        hidden_rep = [h]
-
-        for i in range(self.num_layers - 1):
-            h = self.ginlayers[i](g, h)
-            h = self.batch_norms[i](h)
-            h = F.relu(h)
-            hidden_rep.append(h)
-
-        score_over_layer = 0
-
-        # perform pooling over all nodes in each graph in every layer
-        for i, h in enumerate(hidden_rep):
-            pooled_h = self.pool(g, h)
-            score_over_layer += self.drop(self.linears_prediction[i](pooled_h))
-
-        return score_over_layer
diff --git a/autogl/module/model/dgl/ginparser.py b/autogl/module/model/dgl/ginparser.py
deleted file mode 100644
index 280aa12..0000000
--- a/autogl/module/model/dgl/ginparser.py
+++ /dev/null
@@ -1,81 +0,0 @@
-"""Parser for arguments
-
-Put all arguments in one file and group similar arguments
-"""
-import argparse
-
-
-class Parser():
-
-    def __init__(self, description):
-        '''
-           arguments parser
-        '''
-        self.parser = argparse.ArgumentParser(description=description)
-        self.args = None
-        self._parse()
-
-    def _parse(self):
-        # dataset
-        self.parser.add_argument(
-            '--dataset', type=str, default="MUTAG",
-            choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI'],
-            help='name of dataset (default: MUTAG)')
-        self.parser.add_argument(
-            '--batch_size', type=int, default=32,
-            help='batch size for training and validation (default: 32)')
-        self.parser.add_argument(
-            '--fold_idx', type=int, default=0,
-            help='the index(<10) of fold in 10-fold validation.')
-        self.parser.add_argument(
-            '--filename', type=str, default="",
-            help='output file')
-
-        # device
-        self.parser.add_argument(
-            '--disable-cuda', action='store_true',
-            help='Disable CUDA')
-        self.parser.add_argument(
-            '--device', type=int, default=0,
-            help='which gpu device to use (default: 0)')
-
-        # net
-        self.parser.add_argument(
-            '--num_layers', type=int, default=5,
-            help='number of layers (default: 5)')
-        self.parser.add_argument(
-            '--num_mlp_layers', type=int, default=2,
-            help='number of MLP layers(default: 2). 1 means linear model.')
-        self.parser.add_argument(
-            '--hidden_dim', type=int, default=64,
-            help='number of hidden units (default: 64)')
-
-        # graph
-        self.parser.add_argument(
-            '--graph_pooling_type', type=str,
-            default="sum", choices=["sum", "mean", "max"],
-            help='type of graph pooling: sum, mean or max')
-        self.parser.add_argument(
-            '--neighbor_pooling_type', type=str,
-            default="sum", choices=["sum", "mean", "max"],
-            help='type of neighboring pooling: sum, mean or max')
-        self.parser.add_argument(
-            '--learn_eps', action="store_true",
-            help='learn the epsilon weighting')
-
-        # learning
-        self.parser.add_argument(
-            '--seed', type=int, default=0,
-            help='random seed (default: 0)')
-        self.parser.add_argument(
-            '--epochs', type=int, default=350,
-            help='number of epochs to train (default: 350)')
-        self.parser.add_argument(
-            '--lr', type=float, default=0.01,
-            help='learning rate (default: 0.01)')
-        self.parser.add_argument(
-            '--final_dropout', type=float, default=0.5,
-            help='final layer dropout (default: 0.5)')
-
-        # done
-        self.args = self.parser.parse_args()
diff --git a/autogl/module/model/dgl/graphsage.py b/autogl/module/model/dgl/graphsage.py
index 6cf5a17..433e0d7 100644
--- a/autogl/module/model/dgl/graphsage.py
+++ b/autogl/module/model/dgl/graphsage.py
@@ -1,7 +1,8 @@
 import torch
 import typing as _typing
 
-from torch_geometric.nn.conv import SAGEConv
+import torch.nn.functional as F
+from dgl.nn.pytorch.conv import SAGEConv
 import torch.nn.functional
 import autogl.data
 from . import register_model
@@ -23,7 +24,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
         ):
             super().__init__()
             self._convolution: SAGEConv = SAGEConv(
-                input_channels, output_channels, aggr=aggr
+                input_channels, output_channels, aggregator_type=aggr
             )
             if (
                 activation_name is not Ellipsis
@@ -48,14 +49,10 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
             else:
                 self._dropout: _typing.Optional[torch.nn.Dropout] = None
 
-        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
-            x: torch.Tensor = getattr(data, "x")
-            edge_index: torch.Tensor = getattr(data, "edge_index")
-            if type(x) != torch.Tensor or type(edge_index) != torch.Tensor:
-                raise TypeError
-
-            x: torch.Tensor = self._convolution.forward(x, edge_index)
-            if self._activation_name is not None and enable_activation:
+        def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
+            # x = data.ndata['x']
+            x: torch.Tensor = self._convolution.forward(data, x)
+            if (self._activation_name is not None) and enable_activation:
                 x: torch.Tensor = activate_func(x, self._activation_name)
             if self._dropout is not None:
                 x: torch.Tensor = self._dropout.forward(x)
@@ -145,7 +142,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
                             hidden_features[i],
                             num_classes,
                             aggr,
-                            _layers_dropout[i + 1],
+                            dropout_probability=_layers_dropout[i + 1],
                         )
                     )
 
@@ -154,41 +151,41 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
         return self.__sequential_encoding_layers
 
     def cls_encode(self, data) -> torch.Tensor:
-        if (
-            hasattr(data, "edge_indexes")
-            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
-            and len(getattr(data, "edge_indexes"))
-            == len(self.__sequential_encoding_layers)
-        ):
-            for __edge_index in getattr(data, "edge_indexes"):
-                if type(__edge_index) != torch.Tensor:
-                    raise TypeError
-            """ Layer-wise encode """
-            x: torch.Tensor = getattr(data, "x")
-            for i, __edge_index in enumerate(getattr(data, "edge_indexes")):
-                x: torch.Tensor = self.__sequential_encoding_layers[i](
-                    autogl.data.Data(x=x, edge_index=__edge_index)
-                )
-            return x
-        else:
-            x: torch.Tensor = getattr(data, "x")
-            for i in range(len(self.__sequential_encoding_layers)):
-                x = self.__sequential_encoding_layers[i](
-                    autogl.data.Data(x, getattr(data, "edge_index"))
-                )
-            return x
+        # if (
+        #     hasattr(data, "edge_indexes")
+        #     and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
+        #     and len(getattr(data, "edge_indexes"))
+        #     == len(self.__sequential_encoding_layers)
+        # ):
+        #     for __edge_index in getattr(data, "edge_indexes"):
+        #         if type(__edge_index) != torch.Tensor:
+        #             raise TypeError
+        #     """ Layer-wise encode """
+        #     x: torch.Tensor = getattr(data, "x")
+        #     for i, __edge_index in enumerate(getattr(data, "edge_indexes")):
+        #         x: torch.Tensor = self.__sequential_encoding_layers[i](
+        #             autogl.data.Data(x=x, edge_index=__edge_index)
+        #         )
+        #     return x
+        # else:
+        x: torch.Tensor = data.ndata['x']
+        for i in range(len(self.__sequential_encoding_layers)):
+            x = self.__sequential_encoding_layers[i](
+                autogl.data.Data(x, data.edges())
+            )
+        return x
 
     def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
         return torch.nn.functional.log_softmax(x, dim=1)
 
     def lp_encode(self, data):
-        x: torch.Tensor = getattr(data, "x")
+        x: torch.Tensor = data.ndata['x']
         for i in range(len(self.__sequential_encoding_layers) - 2):
             x = self.__sequential_encoding_layers[i](
-                autogl.data.Data(x, getattr(data, "edge_index"))
+                autogl.data.Data(x, data.edges())
             )
         x = self.__sequential_encoding_layers[-2](
-            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
+            autogl.data.Data(x, data.edges()), enable_activation=False
         )
         return x
 
@@ -200,6 +197,15 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
     def lp_decode_all(self, z):
         prob_adj = z @ z.t()
         return (prob_adj > 0).nonzero(as_tuple=False).t()
+    
+    def forward(self, data):
+        # only for test 
+        x = data.ndata['x']
+        for i in range(len(self.__sequential_encoding_layers)):
+            x = self.__sequential_encoding_layers[i](data,x)
+
+        return F.log_softmax(x, dim=1)
+
 
 
 @register_model("sage")
diff --git a/autogl/module/model/dgl/graphsage_dgl.py b/autogl/module/model/dgl/graphsage_dgl.py
deleted file mode 100644
index 433e0d7..0000000
--- a/autogl/module/model/dgl/graphsage_dgl.py
+++ /dev/null
@@ -1,312 +0,0 @@
-import torch
-import typing as _typing
-
-import torch.nn.functional as F
-from dgl.nn.pytorch.conv import SAGEConv
-import torch.nn.functional
-import autogl.data
-from . import register_model
-from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
-from ....utils import get_logger
-
-LOGGER = get_logger("SAGEModel")
-
-
-class GraphSAGE(ClassificationSupportedSequentialModel):
-    class _SAGELayer(torch.nn.Module):
-        def __init__(
-            self,
-            input_channels: int,
-            output_channels: int,
-            aggr: str,
-            activation_name: _typing.Optional[str] = ...,
-            dropout_probability: _typing.Optional[float] = ...,
-        ):
-            super().__init__()
-            self._convolution: SAGEConv = SAGEConv(
-                input_channels, output_channels, aggregator_type=aggr
-            )
-            if (
-                activation_name is not Ellipsis
-                and activation_name is not None
-                and type(activation_name) == str
-            ):
-                self._activation_name: _typing.Optional[str] = activation_name
-            else:
-                self._activation_name: _typing.Optional[str] = None
-            if (
-                dropout_probability is not Ellipsis
-                and dropout_probability is not None
-                and type(dropout_probability) == float
-            ):
-                if dropout_probability < 0:
-                    dropout_probability = 0
-                if dropout_probability > 1:
-                    dropout_probability = 1
-                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
-                    dropout_probability
-                )
-            else:
-                self._dropout: _typing.Optional[torch.nn.Dropout] = None
-
-        def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
-            # x = data.ndata['x']
-            x: torch.Tensor = self._convolution.forward(data, x)
-            if (self._activation_name is not None) and enable_activation:
-                x: torch.Tensor = activate_func(x, self._activation_name)
-            if self._dropout is not None:
-                x: torch.Tensor = self._dropout.forward(x)
-            return x
-
-    def __init__(
-        self,
-        num_features: int,
-        num_classes: int,
-        hidden_features: _typing.Sequence[int],
-        activation_name: str,
-        layers_dropout: _typing.Union[
-            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
-        ] = None,
-        aggr: str = "mean",
-    ):
-        super().__init__()
-        if not type(num_features) == type(num_classes) == int:
-            raise TypeError
-        if not isinstance(hidden_features, _typing.Sequence):
-            raise TypeError
-        for hidden_feature in hidden_features:
-            if type(hidden_feature) != int:
-                raise TypeError
-            elif hidden_feature <= 0:
-                raise ValueError
-        if isinstance(layers_dropout, _typing.Sequence):
-            if len(layers_dropout) != (len(hidden_features) + 1):
-                raise TypeError
-            for d in layers_dropout:
-                if d is not None and type(d) != float:
-                    raise TypeError
-            _layers_dropout: _typing.Sequence[_typing.Optional[float]] = layers_dropout
-        elif layers_dropout is None or type(layers_dropout) == float:
-            _layers_dropout: _typing.Sequence[_typing.Optional[float]] = [
-                layers_dropout for _ in range(len(hidden_features))
-            ] + [None]
-        else:
-            raise TypeError
-        if not type(activation_name) == type(aggr) == str:
-            raise TypeError
-        if aggr not in ("add", "max", "mean"):
-            aggr = "mean"
-
-        if len(hidden_features) == 0:
-            self.__sequential_encoding_layers: torch.nn.ModuleList = (
-                torch.nn.ModuleList(
-                    [
-                        self._SAGELayer(
-                            num_features,
-                            num_classes,
-                            aggr,
-                            activation_name,
-                            _layers_dropout[0],
-                        )
-                    ]
-                )
-            )
-        else:
-            self.__sequential_encoding_layers: torch.nn.ModuleList = (
-                torch.nn.ModuleList(
-                    [
-                        self._SAGELayer(
-                            num_features,
-                            hidden_features[0],
-                            aggr,
-                            activation_name,
-                            _layers_dropout[0],
-                        )
-                    ]
-                )
-            )
-            for i in range(len(hidden_features)):
-                if i + 1 < len(hidden_features):
-                    self.__sequential_encoding_layers.append(
-                        self._SAGELayer(
-                            hidden_features[i],
-                            hidden_features[i + 1],
-                            aggr,
-                            activation_name,
-                            _layers_dropout[i + 1],
-                        )
-                    )
-                else:
-                    self.__sequential_encoding_layers.append(
-                        self._SAGELayer(
-                            hidden_features[i],
-                            num_classes,
-                            aggr,
-                            dropout_probability=_layers_dropout[i + 1],
-                        )
-                    )
-
-    @property
-    def sequential_encoding_layers(self) -> torch.nn.ModuleList:
-        return self.__sequential_encoding_layers
-
-    def cls_encode(self, data) -> torch.Tensor:
-        # if (
-        #     hasattr(data, "edge_indexes")
-        #     and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
-        #     and len(getattr(data, "edge_indexes"))
-        #     == len(self.__sequential_encoding_layers)
-        # ):
-        #     for __edge_index in getattr(data, "edge_indexes"):
-        #         if type(__edge_index) != torch.Tensor:
-        #             raise TypeError
-        #     """ Layer-wise encode """
-        #     x: torch.Tensor = getattr(data, "x")
-        #     for i, __edge_index in enumerate(getattr(data, "edge_indexes")):
-        #         x: torch.Tensor = self.__sequential_encoding_layers[i](
-        #             autogl.data.Data(x=x, edge_index=__edge_index)
-        #         )
-        #     return x
-        # else:
-        x: torch.Tensor = data.ndata['x']
-        for i in range(len(self.__sequential_encoding_layers)):
-            x = self.__sequential_encoding_layers[i](
-                autogl.data.Data(x, data.edges())
-            )
-        return x
-
-    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
-        return torch.nn.functional.log_softmax(x, dim=1)
-
-    def lp_encode(self, data):
-        x: torch.Tensor = data.ndata['x']
-        for i in range(len(self.__sequential_encoding_layers) - 2):
-            x = self.__sequential_encoding_layers[i](
-                autogl.data.Data(x, data.edges())
-            )
-        x = self.__sequential_encoding_layers[-2](
-            autogl.data.Data(x, data.edges()), enable_activation=False
-        )
-        return x
-
-    def lp_decode(self, z, pos_edge_index, neg_edge_index):
-        edge_index = torch.cat([pos_edge_index, neg_edge_index], dim=-1)
-        logits = (z[edge_index[0]] * z[edge_index[1]]).sum(dim=-1)
-        return logits
-
-    def lp_decode_all(self, z):
-        prob_adj = z @ z.t()
-        return (prob_adj > 0).nonzero(as_tuple=False).t()
-    
-    def forward(self, data):
-        # only for test 
-        x = data.ndata['x']
-        for i in range(len(self.__sequential_encoding_layers)):
-            x = self.__sequential_encoding_layers[i](data,x)
-
-        return F.log_softmax(x, dim=1)
-
-
-
-@register_model("sage")
-class AutoSAGE(BaseModel):
-    r"""
-    AutoSAGE. The model used in this automodel is GraphSAGE, i.e., the GraphSAGE from the `"Inductive Representation Learning on
-    Large Graphs" <https://arxiv.org/abs/1706.02216>`_ paper. The layer is
-
-    .. math::
-
-        \mathbf{x}^{\prime}_i = \mathbf{W}_1 \mathbf{x}_i + \mathbf{W_2} \cdot
-        \mathrm{mean}_{j \in \mathcal{N(i)}} \mathbf{x}_j
-
-    Parameters
-    ----------
-    num_features: `int`.
-        The dimension of features.
-
-    num_classes: `int`.
-        The number of classes.
-
-    device: `torch.device` or `str`
-        The device where model will be running on.
-
-    init: `bool`.
-        If True(False), the model will (not) be initialized.
-
-    """
-
-    def __init__(
-        self, num_features=None, num_classes=None, device=None, init=False, **args
-    ):
-
-        super(AutoSAGE, self).__init__()
-
-        self.num_features = num_features if num_features is not None else 0
-        self.num_classes = int(num_classes) if num_classes is not None else 0
-        self.device = device if device is not None else "cpu"
-        self.init = True
-
-        self.params = {
-            "features_num": self.num_features,
-            "num_class": self.num_classes,
-        }
-        self.space = [
-            {
-                "parameterName": "num_layers",
-                "type": "DISCRETE",
-                "feasiblePoints": "2,3,4",
-            },
-            {
-                "parameterName": "hidden",
-                "type": "NUMERICAL_LIST",
-                "numericalType": "INTEGER",
-                "length": 3,
-                "minValue": [8, 8, 8],
-                "maxValue": [128, 128, 128],
-                "scalingType": "LOG",
-                "cutPara": ("num_layers",),
-                "cutFunc": lambda x: x[0] - 1,
-            },
-            {
-                "parameterName": "dropout",
-                "type": "DOUBLE",
-                "maxValue": 0.8,
-                "minValue": 0.2,
-                "scalingType": "LINEAR",
-            },
-            {
-                "parameterName": "act",
-                "type": "CATEGORICAL",
-                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
-            },
-            {
-                "parameterName": "agg",
-                "type": "CATEGORICAL",
-                "feasiblePoints": ["mean", "add", "max"],
-            },
-        ]
-
-        self.hyperparams = {
-            "num_layers": 3,
-            "hidden": [64, 32],
-            "dropout": 0.5,
-            "act": "relu",
-            "agg": "mean",
-        }
-
-        self.initialized = False
-        if init is True:
-            self.initialize()
-
-    def initialize(self):
-        if self.initialized:
-            return
-        self.initialized = True
-        self.model = GraphSAGE(
-            self.num_features,
-            self.num_classes,
-            self.hyperparams.get("hidden"),
-            self.hyperparams.get("act", "relu"),
-            self.hyperparams.get("dropout", None),
-            self.hyperparams.get("agg", "mean"),
-        ).to(self.device)

From b3c97cce699dc4b4c552943e3f3b282a61b5af00 Mon Sep 17 00:00:00 2001
From: Beini <xbn20@mails.tsinghua.edu.cn>
Date: Tue, 26 Oct 2021 07:41:47 +0000
Subject: [PATCH 69/75] test_auto

---
 autogl/module/model/dgl/gcn.py |   2 +-
 test/model_glf/gclf_dgl.py     | 176 ---------------------------------
 test/model_nlf/nclf_dgl.py     |  34 ++++---
 test/test_backend/test01.py    |   5 -
 test/test_backend/test02.py    |   8 --
 test/test_backend/test03.py    |   8 --
 6 files changed, 22 insertions(+), 211 deletions(-)
 delete mode 100644 test/model_glf/gclf_dgl.py
 delete mode 100644 test/test_backend/test01.py
 delete mode 100644 test/test_backend/test02.py
 delete mode 100644 test/test_backend/test03.py

diff --git a/autogl/module/model/dgl/gcn.py b/autogl/module/model/dgl/gcn.py
index 2ff57d0..dff0980 100644
--- a/autogl/module/model/dgl/gcn.py
+++ b/autogl/module/model/dgl/gcn.py
@@ -386,7 +386,7 @@ class AutoGCN(BaseModel):
         self.hyperparams = {
             "num_layers": 3,
             "hidden": [128, 64],
-            "dropout": 0,
+            "dropout": 0.,
             "act": "relu",
         }
 
diff --git a/test/model_glf/gclf_dgl.py b/test/model_glf/gclf_dgl.py
deleted file mode 100644
index a3d16b6..0000000
--- a/test/model_glf/gclf_dgl.py
+++ /dev/null
@@ -1,176 +0,0 @@
-import os
-import sys
-import logging
-logging.basicConfig(level=logging.INFO)
-from tqdm import tqdm
-
-sys.path.append("../../")
-print(os.getcwd())
-os.environ["AUTOGL_BACKEND"] = "dgl"
-#os.environ["AUTOGL_BACKEND"] = "pyg"
-from autogl.backend import DependentBackend
-import dgl
-from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-import torch.optim as optim
-
-from autogl.module.model.ginparser import Parser
-from autogl.module.model.dataloader_gin import GINDataLoader
-from autogl.module.model import GIN
-
-from pdb import set_trace
-import numpy as np
-from autogl.solver.utils import set_seed
-set_seed(202106)
-
-
-def train(args, net, trainloader, optimizer, criterion, epoch):
-    net.train()
-
-    running_loss = 0
-    total_iters = len(trainloader)
-    # setup the offset to avoid the overlap with mouse cursor
-    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)
-
-    for pos, (graphs, labels) in zip(bar, trainloader):
-        # batch graphs will be shipped to device in forward part of model
-        labels = labels.to(args.device)
-        graphs = graphs.to(args.device)
-        feat = graphs.ndata.pop('attr')
-        outputs = net(graphs, feat)
-
-        loss = criterion(outputs, labels)
-        running_loss += loss.item()
-
-        # backprop
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-
-        # report
-        bar.set_description('epoch-{}'.format(epoch))
-    bar.close()
-    # the final batch will be aligned
-    running_loss = running_loss / total_iters
-
-    return running_loss
-
-
-def eval_net(args, net, dataloader, criterion):
-    net.eval()
-
-    total = 0
-    total_loss = 0
-    total_correct = 0
-
-    for data in dataloader:
-        graphs, labels = data
-        graphs = graphs.to(args.device)
-        labels = labels.to(args.device)
-        feat = graphs.ndata.pop('attr')
-        total += len(labels)
-        outputs = net(graphs, feat)
-        _, predicted = torch.max(outputs.data, 1)
-
-        total_correct += (predicted == labels.data).sum().item()
-        loss = criterion(outputs, labels)
-        # crossentropy(reduce=True) for default
-        total_loss += loss.item() * len(labels)
-
-    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total
-
-    net.train()
-
-    return loss, acc
-
-
-def main(args):
-
-    # set up seeds, args.seed supported
-    torch.manual_seed(seed=args.seed)
-    np.random.seed(seed=args.seed)
-
-    is_cuda = not args.disable_cuda and torch.cuda.is_available()
-
-    if is_cuda:
-        args.device = torch.device("cuda:" + str(args.device))
-        torch.cuda.manual_seed_all(seed=args.seed)
-    else:
-        args.device = torch.device("cpu")
-
-    dataset = GINDataset(args.dataset, not args.learn_eps)
-
-    trainloader, validloader = GINDataLoader(
-        dataset, batch_size=args.batch_size, device=args.device,
-        seed=args.seed, shuffle=True,
-        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
-    # or split_name='rand', split_ratio=0.7
-
-    model = GIN(
-        args.num_layers, args.num_mlp_layers,
-        dataset.dim_nfeats, args.hidden_dim, dataset.gclasses,
-        args.final_dropout, args.learn_eps,
-        args.graph_pooling_type, args.neighbor_pooling_type).to(args.device)
-
-    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-    optimizer = optim.Adam(model.parameters(), lr=args.lr)
-    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)
-
-    # it's not cost-effective to hanle the cursor and init 0
-    # https://stackoverflow.com/a/23121189
-    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
-    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
-    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)
-
-    for epoch, _, _ in zip(tbar, vbar, lrbar):
-
-        train(args, model, trainloader, optimizer, criterion, epoch)
-        scheduler.step()
-
-        train_loss, train_acc = eval_net(
-            args, model, trainloader, criterion)
-        tbar.set_description(
-            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(train_loss, 100. * train_acc))
-
-        valid_loss, valid_acc = eval_net(
-            args, model, validloader, criterion)
-        vbar.set_description(
-            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
-            .format(valid_loss, 100. * valid_acc))
-
-        if not args.filename == "":
-            with open(args.filename, 'a') as f:
-                f.write('%s %s %s %s' % (
-                    args.dataset,
-                    args.learn_eps,
-                    args.neighbor_pooling_type,
-                    args.graph_pooling_type
-                ))
-                f.write("\n")
-                f.write("%f %f %f %f" % (
-                    train_loss,
-                    train_acc,
-                    valid_loss,
-                    valid_acc
-                ))
-                f.write("\n")
-
-        lrbar.set_description(
-            "Learning eps with learn_eps={}: {}".format(
-                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))
-
-    tbar.close()
-    vbar.close()
-    lrbar.close()
-
-
-if __name__ == '__main__':
-    args = Parser(description='GIN').args
-    print('show all arguments configuration...')
-    print(args)
-
-    main(args)
-
diff --git a/test/model_nlf/nclf_dgl.py b/test/model_nlf/nclf_dgl.py
index 1bd39db..977805d 100644
--- a/test/model_nlf/nclf_dgl.py
+++ b/test/model_nlf/nclf_dgl.py
@@ -16,7 +16,7 @@ import torch.nn as nn
 import torch.nn.functional as F
 import torch.optim as optim
 
-from autogl.module.model import GAT,GraphSAGE
+from autogl.module.model import GAT,GraphSAGE,AutoSAGE,AutoGCN,AutoGAT
 
 from pdb import set_trace
 import numpy as np
@@ -51,7 +51,7 @@ def main():
         device = torch.device("cpu")
 
     dataset = CoraGraphDataset()
-    data = dataset[0]
+    data = dataset[0].to(device)
     data.ndata['x'] = data.ndata['feat']
     train_mask = data.ndata['train_mask']
     val_mask = data.ndata['val_mask']
@@ -59,20 +59,28 @@ def main():
     labels = data.ndata['label']
     n_edges = data.number_of_edges()
 
-    args={}
-    args["features_num"]=data.ndata['x'].size(1)
-    args['hidden']=[16]
-    args["heads"]=8
-    args['dropout']=0.6
-    args["num_class"]=dataset.num_classes
-    args["num_layers"]=2
-    args['act']='relu'
+    # args={}
+    # args["features_num"]=data.ndata['x'].size(1)
+    # args['hidden']=[16]
+    # args["heads"]=8
+    # args['dropout']=0.6
+    # args["num_class"]=dataset.num_classes
+    # args["num_layers"]=2
+    # args['act']='relu'
 
 
     # model = GAT(args)
-    model = GraphSAGE(args["features_num"],
-                      args["num_class"],
-                      [16],'relu',0.5)
+    # model = GraphSAGE(args["features_num"],
+    #                   args["num_class"],
+    #                   [16],'relu',0.5)
+    automodel = AutoGAT(
+        num_features = data.ndata['x'].size(1),
+        num_classes = dataset.num_classes,
+        device = device,
+        init = True
+    )
+
+    model = automodel.model
 
     criterion = nn.CrossEntropyLoss()  # defaul reduce is true
     optimizer = optim.Adam(model.parameters(), lr=0.01)
diff --git a/test/test_backend/test01.py b/test/test_backend/test01.py
deleted file mode 100644
index 3f087c6..0000000
--- a/test/test_backend/test01.py
+++ /dev/null
@@ -1,5 +0,0 @@
-from autogl.backend import DependentBackend
-
-if __name__ == '__main__':
-    print(DependentBackend.is_dgl())
-    print(DependentBackend.is_pyg())
diff --git a/test/test_backend/test02.py b/test/test_backend/test02.py
deleted file mode 100644
index 0f16dc2..0000000
--- a/test/test_backend/test02.py
+++ /dev/null
@@ -1,8 +0,0 @@
-import os
-
-os.environ["AUTOGL_BACKEND"] = "pyg"
-from autogl.backend import DependentBackend
-
-if __name__ == '__main__':
-    print(DependentBackend.is_dgl())
-    print(DependentBackend.is_pyg())
diff --git a/test/test_backend/test03.py b/test/test_backend/test03.py
deleted file mode 100644
index 6928d8a..0000000
--- a/test/test_backend/test03.py
+++ /dev/null
@@ -1,8 +0,0 @@
-import os
-
-os.environ["AUTOGL_BACKEND"] = "something_unexpected_value"
-from autogl.backend import DependentBackend
-
-if __name__ == '__main__':
-    print(DependentBackend.is_dgl())
-    print(DependentBackend.is_pyg())
\ No newline at end of file

From e31053973f0db7efd90426d5c6169e90d3524ec3 Mon Sep 17 00:00:00 2001
From: Beini <xbn20@mails.tsinghua.edu.cn>
Date: Tue, 26 Oct 2021 08:02:15 +0000
Subject: [PATCH 70/75] test_auto

---
 autogl/module/model/dgl/gat.py       | 4 ++--
 autogl/module/model/dgl/gcn.py       | 8 ++++----
 autogl/module/model/dgl/graphsage.py | 8 ++++----
 test/model_nlf/nclf_dgl.py           | 6 +++---
 4 files changed, 13 insertions(+), 13 deletions(-)

diff --git a/autogl/module/model/dgl/gat.py b/autogl/module/model/dgl/gat.py
index e7ecfc3..1aec580 100644
--- a/autogl/module/model/dgl/gat.py
+++ b/autogl/module/model/dgl/gat.py
@@ -71,7 +71,7 @@ class GAT(torch.nn.Module):
 
     def forward(self, data):
         try:
-            x = data.ndata['x']
+            x = data.ndata['feat']
         except:
             print("no x")
             pass
@@ -85,7 +85,7 @@ class GAT(torch.nn.Module):
         return F.log_softmax(x, dim=1)
 
     def lp_encode(self, data):
-        x = data.ndata['x']
+        x = data.ndata['feat']
         for i in range(self.num_layer - 1):
             x = self.convs[i](x, data.train_pos_edge_index).flatten(1)
             if i != self.num_layer - 2:
diff --git a/autogl/module/model/dgl/gcn.py b/autogl/module/model/dgl/gcn.py
index dff0980..f04f31f 100644
--- a/autogl/module/model/dgl/gcn.py
+++ b/autogl/module/model/dgl/gcn.py
@@ -222,7 +222,7 @@ class GCN(ClassificationSupportedSequentialModel):
             ]
 
     def forward(self, data):
-        x = data.ndata['x']
+        x = data.ndata['feat']
         for gcn in self.__sequential_encoding_layers:
             x = gcn(data,x)
         return x
@@ -242,7 +242,7 @@ class GCN(ClassificationSupportedSequentialModel):
             assert len(edge_indexes_and_weights) == len(
                 self.__sequential_encoding_layers
             )
-            x: torch.Tensor = data.ndata['x']
+            x: torch.Tensor = data.ndata['feat']
             for _edge_index_and_weight, gcn in zip(
                 edge_indexes_and_weights, self.__sequential_encoding_layers
             ):
@@ -252,7 +252,7 @@ class GCN(ClassificationSupportedSequentialModel):
             return x
         else:
             """ edge_indexes_and_weights is (edge_index, edge_weight) """
-            x = data.ndata['x']
+            x = data.ndata['feat']
             for gcn in self.__sequential_encoding_layers:
                 _temp_data = autogl.data.Data(
                     x=x, edge_index=edge_indexes_and_weights[0]
@@ -265,7 +265,7 @@ class GCN(ClassificationSupportedSequentialModel):
         return torch.nn.functional.log_softmax(x, dim=1)
 
     def lp_encode(self, data):
-        x: torch.Tensor = data.ndata['x']
+        x: torch.Tensor = data.ndata['feat']
         for i in range(len(self.__sequential_encoding_layers) - 2):
             x = self.__sequential_encoding_layers[i](
                 autogl.data.Data(x, data.edges())
diff --git a/autogl/module/model/dgl/graphsage.py b/autogl/module/model/dgl/graphsage.py
index 433e0d7..f17e151 100644
--- a/autogl/module/model/dgl/graphsage.py
+++ b/autogl/module/model/dgl/graphsage.py
@@ -50,7 +50,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
                 self._dropout: _typing.Optional[torch.nn.Dropout] = None
 
         def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
-            # x = data.ndata['x']
+            # x = data.ndata['feat']
             x: torch.Tensor = self._convolution.forward(data, x)
             if (self._activation_name is not None) and enable_activation:
                 x: torch.Tensor = activate_func(x, self._activation_name)
@@ -168,7 +168,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
         #         )
         #     return x
         # else:
-        x: torch.Tensor = data.ndata['x']
+        x: torch.Tensor = data.ndata['feat']
         for i in range(len(self.__sequential_encoding_layers)):
             x = self.__sequential_encoding_layers[i](
                 autogl.data.Data(x, data.edges())
@@ -179,7 +179,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
         return torch.nn.functional.log_softmax(x, dim=1)
 
     def lp_encode(self, data):
-        x: torch.Tensor = data.ndata['x']
+        x: torch.Tensor = data.ndata['feat']
         for i in range(len(self.__sequential_encoding_layers) - 2):
             x = self.__sequential_encoding_layers[i](
                 autogl.data.Data(x, data.edges())
@@ -200,7 +200,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
     
     def forward(self, data):
         # only for test 
-        x = data.ndata['x']
+        x = data.ndata['feat']
         for i in range(len(self.__sequential_encoding_layers)):
             x = self.__sequential_encoding_layers[i](data,x)
 
diff --git a/test/model_nlf/nclf_dgl.py b/test/model_nlf/nclf_dgl.py
index 977805d..0776edf 100644
--- a/test/model_nlf/nclf_dgl.py
+++ b/test/model_nlf/nclf_dgl.py
@@ -16,7 +16,7 @@ import torch.nn as nn
 import torch.nn.functional as F
 import torch.optim as optim
 
-from autogl.module.model import GAT,GraphSAGE,AutoSAGE,AutoGCN,AutoGAT
+from autogl.module.model import AutoSAGE,AutoGCN,AutoGAT
 
 from pdb import set_trace
 import numpy as np
@@ -52,7 +52,7 @@ def main():
 
     dataset = CoraGraphDataset()
     data = dataset[0].to(device)
-    data.ndata['x'] = data.ndata['feat']
+    # data.ndata['x'] = data.ndata['feat']
     train_mask = data.ndata['train_mask']
     val_mask = data.ndata['val_mask']
     test_mask = data.ndata['test_mask']
@@ -74,7 +74,7 @@ def main():
     #                   args["num_class"],
     #                   [16],'relu',0.5)
     automodel = AutoGAT(
-        num_features = data.ndata['x'].size(1),
+        num_features = data.ndata['feat'].size(1),
         num_classes = dataset.num_classes,
         device = device,
         init = True

From 17785d2267b65795d372092139c5ef85d30d8b42 Mon Sep 17 00:00:00 2001
From: lihy96 <lhy237451594@vip.qq.com>
Date: Wed, 27 Oct 2021 21:17:00 +0800
Subject: [PATCH 71/75] trainer_nlf

---
 .../module/train/node_classification_full.py  | 102 +++++++++----
 test/model_nlf/nclf_dgl.py                    |   2 +-
 test/model_nlf/nclf_dgl_trainer.py            | 140 ++++++++++++++++++
 3 files changed, 218 insertions(+), 26 deletions(-)
 create mode 100644 test/model_nlf/nclf_dgl_trainer.py

diff --git a/autogl/module/train/node_classification_full.py b/autogl/module/train/node_classification_full.py
index e9ec45d..7044e2f 100644
--- a/autogl/module/train/node_classification_full.py
+++ b/autogl/module/train/node_classification_full.py
@@ -21,6 +21,8 @@ from copy import deepcopy
 
 from ...utils import get_logger
 
+from ...backend import DependentBackend
+
 LOGGER = get_logger("node classification trainer")
 
 
@@ -115,6 +117,8 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
 
         self.initialized = False
 
+        self.pyg_dgl = DependentBackend.get_backend_name()
+
         self.space = [
             {
                 "parameterName": "max_epoch",
@@ -215,7 +219,10 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
             else:
                 res = self.model.model.forward(data)
             if hasattr(F, self.loss):
-                loss = getattr(F, self.loss)(res[mask], data.y[mask])
+                if self.pyg_dgl == 'pyg':
+                    loss = getattr(F, self.loss)(res[mask], data.y[mask])
+                elif self.pyg_dgl == 'dgl':
+                    loss = getattr(F, self.loss)(res[mask], data.ndata['label'][mask])
             else:
                 raise TypeError(
                     "PyTorch does not support loss type {}".format(self.loss)
@@ -226,18 +233,27 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
             if self.lr_scheduler_type:
                 scheduler.step()
 
-            if hasattr(data, "val_mask") and data.val_mask is not None:
+            if self.pyg_dgl == 'pyg' and hasattr(data, "val_mask") and data.val_mask is not None:
+                val_mask = data.val_mask
+            elif self.pyg_dgl == 'dgl' and data.ndata.get('val_mask', None) is not None:
+                val_mask = data.ndata['val_mask']
+            else:
+                val_mask = None
+
+            if val_mask is not None:
                 if type(self.feval) is list:
                     feval = self.feval[0]
                 else:
                     feval = self.feval
-                val_loss = self.evaluate([data], mask=data.val_mask, feval=feval)
+                val_loss = self.evaluate([data], mask=val_mask, feval=feval)
                 if feval.is_higher_better() is True:
                     val_loss = -val_loss
+
                 self.early_stopping(val_loss, self.model.model)
                 if self.early_stopping.early_stop:
                     LOGGER.debug("Early stopping at %d", epoch)
                     break
+
         if hasattr(data, "val_mask") and data.val_mask is not None:
             self.early_stopping.load_checkpoint(self.model.model)
 
@@ -265,7 +281,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
                 res = self.model.model.forward(data)
         return res
 
-    def train(self, dataset, keep_valid_result=True):
+    def train(self, dataset, keep_valid_result=True, train_mask=None):
         """
         The function of training on the given dataset and keeping valid result.
 
@@ -276,6 +292,8 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         keep_valid_result: ``bool``
             If True(False), save the validation result after training.
 
+        train_mask: The mask for training data
+
         Returns
         -------
         self: ``autogl.train.NodeClassificationTrainer``
@@ -283,13 +301,20 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
 
         """
         data = dataset[0]
-        self.train_only(data)
+        self.train_only(data, train_mask)
         if keep_valid_result:
-            self.valid_result = self.predict_only(data)[data.val_mask].max(1)[1]
-            self.valid_result_prob = self.predict_only(data)[data.val_mask]
+            if self.pyg_dgl == 'pyg':
+                val_mask = data.val_mask
+            elif self.pyg_dgl == 'dgl':
+                val_mask = data.ndata['val_mask']
+            else:
+                assert False
+            self.valid_result = self.predict_only(data)[val_mask].max(1)[1]
+            self.valid_result_prob = self.predict_only(data)[val_mask]
             self.valid_score = self.evaluate(
-                dataset, mask=data.val_mask, feval=self.feval
+                dataset, mask=val_mask, feval=self.feval
             )
+            # print(self.valid_score)
 
     def predict(self, dataset, mask=None):
         """
@@ -328,15 +353,26 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
         """
         data = dataset[0]
         data = data.to(self.device)
-        if mask is not None:
-            if mask == "val":
-                mask = data.val_mask
-            elif mask == "test":
+        if self.pyg_dgl == 'pyg':
+            if mask is not None:
+                if mask == "val":
+                    mask = data.val_mask
+                elif mask == "test":
+                    mask = data.test_mask
+                elif mask == "train":
+                    mask = data.train_mask
+            else:
+                mask = data.test_mask
+        elif self.pyg_dgl == 'dgl':
+            if mask is not None:
+                if mask == "val":
+                    mask = data.ndata['val_mask']
+                elif mask == "test":
+                    mask = data.ndata['test_mask']
+                elif mask == "train":
+                    mask = data.ndata['train_mask']
+            else:
                 mask = data.test_mask
-            elif mask == "train":
-                mask = data.train_mask
-        else:
-            mask = data.test_mask
         ret = self.predict_only(data, mask)[mask]
         if in_log_format is True:
             return ret
@@ -413,17 +449,33 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
             feval = self.feval
         else:
             feval = get_feval(feval)
-        if test_mask is None:
-            test_mask = data.test_mask
-        elif test_mask == "test":
-            test_mask = data.test_mask
-        elif test_mask == "val":
-            test_mask = data.val_mask
-        elif test_mask == "train":
-            test_mask = data.train_mask
+
+        if self.pyg_dgl == 'pyg':
+            if test_mask is None:
+                test_mask = data.test_mask
+            elif test_mask == "test":
+                test_mask = data.test_mask
+            elif test_mask == "val":
+                test_mask = data.val_mask
+            elif test_mask == "train":
+                test_mask = data.train_mask
+        elif self.pyg_dgl == 'dgl':
+            if test_mask is None:
+                test_mask = data.ndata['test_mask']
+            elif test_mask == "test":
+                test_mask = data.ndata['test_mask']
+            elif test_mask == "val":
+                test_mask = data.ndata['val_mask']
+            elif test_mask == "train":
+                test_mask = data.ndata['train_mask']
+
         y_pred_prob = self.predict_proba(dataset, mask)
         y_pred = y_pred_prob.max(1)[1]
-        y_true = data.y[test_mask]
+        if self.pyg_dgl == 'pyg':
+            y_true = data.y[test_mask]
+        elif self.pyg_dgl == 'dgl':
+            y_true = data.ndata['label'][test_mask]
+
 
         if not isinstance(feval, list):
             feval = [feval]
diff --git a/test/model_nlf/nclf_dgl.py b/test/model_nlf/nclf_dgl.py
index 0776edf..66c7729 100644
--- a/test/model_nlf/nclf_dgl.py
+++ b/test/model_nlf/nclf_dgl.py
@@ -5,7 +5,7 @@ logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm
 import time
 
-sys.path.append("../../")
+sys.path.insert(0, "../../")
 os.environ["AUTOGL_BACKEND"] = "dgl"
 # os.environ["AUTOGL_BACKEND"] = "pyg"
 from autogl.backend import DependentBackend
diff --git a/test/model_nlf/nclf_dgl_trainer.py b/test/model_nlf/nclf_dgl_trainer.py
new file mode 100644
index 0000000..f38dd75
--- /dev/null
+++ b/test/model_nlf/nclf_dgl_trainer.py
@@ -0,0 +1,140 @@
+import os
+import sys
+import logging
+logging.basicConfig(level=logging.INFO)
+from tqdm import tqdm
+import time
+
+sys.path.insert(0, "../../")
+os.environ["AUTOGL_BACKEND"] = "dgl"
+# os.environ["AUTOGL_BACKEND"] = "pyg"
+from autogl.backend import DependentBackend
+import dgl
+from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+
+from autogl.module.model import AutoSAGE,AutoGCN,AutoGAT
+from autogl.module.train import NodeClassificationFullTrainer
+from pdb import set_trace
+import numpy as np
+from autogl.solver.utils import set_seed
+set_seed(202106)
+import argparse
+
+def evaluate(model, graph, labels, mask):
+    model.eval()
+    with torch.no_grad():
+        logits = model(graph)
+        logits = logits[mask]
+        labels = labels[mask]
+        _, indices = torch.max(logits, dim=1)
+        correct = torch.sum(indices == labels)
+        return correct.item() * 1.0 / len(labels)
+
+
+def main():
+    
+
+    # set up seeds, args.seed supported
+    torch.manual_seed(seed=202106)
+    np.random.seed(seed=202106)
+
+    is_cuda = torch.cuda.is_available()
+
+    if is_cuda:
+        device = torch.device("cuda")
+        torch.cuda.manual_seed_all(seed=202106)
+    else:
+        device = torch.device("cpu")
+
+    dataset = CoraGraphDataset()
+    data = dataset[0].to(device)
+    # data.ndata['x'] = data.ndata['feat']
+    train_mask = data.ndata['train_mask']
+    val_mask = data.ndata['val_mask']
+    test_mask = data.ndata['test_mask']
+    labels = data.ndata['label']
+    n_edges = data.number_of_edges()
+
+    # args={}
+    # args["features_num"]=data.ndata['x'].size(1)
+    # args['hidden']=[16]
+    # args["heads"]=8
+    # args['dropout']=0.6
+    # args["num_class"]=dataset.num_classes
+    # args["num_layers"]=2
+    # args['act']='relu'
+
+
+    # model = GAT(args)
+    # model = GraphSAGE(args["features_num"],
+    #                   args["num_class"],
+    #                   [16],'relu',0.5)
+
+    automodel = AutoGAT(
+        num_features = data.ndata['feat'].size(1),
+        num_classes = dataset.num_classes,
+        device = device,
+        init = True
+    )
+
+    trainer = NodeClassificationFullTrainer(
+        model=automodel,
+        num_features=data.ndata['feat'].size(1),
+        num_classes=dataset.num_classes,
+        optimizer=None,
+        lr=0.01,
+        max_epoch=100,
+        weight_decay=0.0,
+        device='cuda',
+        init=False,
+        loss='cross_entropy',
+        feval=('acc'),
+    )
+
+    trainer.train(dataset, keep_valid_result=True, train_mask=train_mask)
+    out = trainer.predict(dataset, 'test').detach().cpu().numpy()
+    labels = labels[data.ndata['test_mask']].detach().cpu().numpy()
+    acc = np.count_nonzero(out == labels) / labels.shape[0]
+    print(acc)  # 0.764
+
+    return
+
+    model = automodel.model
+
+    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
+    optimizer = optim.Adam(model.parameters(), lr=0.01)
+
+    dur = []
+    for epoch in range(200):
+        model.train()
+        if epoch >= 3:
+            t0 = time.time()
+        # forward
+        logits = model(data)
+        loss = criterion(logits[train_mask], labels[train_mask])
+
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+        if epoch >= 3:
+            dur.append(time.time() - t0)
+
+        acc = evaluate(model, data, labels, val_mask)
+        print("Epoch {:05d} | Time(s) {:.4f} | Loss {:.4f} | Accuracy {:.4f} | "
+              "ETputs(KTEPS) {:.2f}". format(epoch, np.mean(dur), loss.item(),
+                                             acc, n_edges / np.mean(dur) / 1000))
+
+    print()
+    acc = evaluate(model, data, labels, test_mask)
+    print("Test accuracy {:.2%}".format(acc))
+
+
+if __name__ == '__main__':
+    
+    main()
+

From 3441c11596960b1f6bc044b8aad2d0d27aa712b5 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 2 Nov 2021 13:04:33 +0000
Subject: [PATCH 72/75] revise the hints and disable sampling for now

---
 autogl/module/model/dgl/gcn.py | 92 ++++++++++++++--------------------
 1 file changed, 39 insertions(+), 53 deletions(-)

diff --git a/autogl/module/model/dgl/gcn.py b/autogl/module/model/dgl/gcn.py
index f04f31f..bf6b070 100644
--- a/autogl/module/model/dgl/gcn.py
+++ b/autogl/module/model/dgl/gcn.py
@@ -1,6 +1,7 @@
 import torch
-import torch.nn.functional
-import typing as _typing
+import torch.nn.functional as F
+from typing import Sequence, Optional, Union, Tuple
+from numbers import Real
 
 from dgl.nn.pytorch.conv import GraphConv
 from dgl import remove_self_loop, add_self_loop
@@ -21,8 +22,8 @@ class GCN(ClassificationSupportedSequentialModel):
             output_channels: int,
             add_self_loops: bool = True,
             normalize: bool = True,
-            activation_name: _typing.Optional[str] = ...,
-            dropout_probability: _typing.Optional[float] = ...,
+            activation_name: Optional[str] = None,
+            dropout_probability: Optional[Real] = None,
         ):
             super().__init__()
             self._convolution: GraphConv = GraphConv(
@@ -31,28 +32,18 @@ class GCN(ClassificationSupportedSequentialModel):
                 norm='both' if normalize else 'none',
             )
             self.add_self_loops = bool(add_self_loops),
-            if (
-                activation_name is not Ellipsis
-                and activation_name is not None
-                and type(activation_name) == str
-            ):
-                self._activation_name: _typing.Optional[str] = activation_name
+            if isinstance(activation_name, str):
+                self._activation_name = activation_name
             else:
-                self._activation_name: _typing.Optional[str] = None
-            if (
-                dropout_probability is not Ellipsis
-                and dropout_probability is not None
-                and type(dropout_probability) == float
-            ):
+                self._activation_name = None
+            if isinstance(dropout_probability, Real):
                 if dropout_probability < 0:
                     dropout_probability = 0
                 if dropout_probability > 1:
                     dropout_probability = 1
-                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
-                    dropout_probability
-                )
+                self._dropout = torch.nn.Dropout(dropout_probability)
             else:
-                self._dropout: _typing.Optional[torch.nn.Dropout] = None
+                self._dropout = None
 
         def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
             
@@ -71,37 +62,35 @@ class GCN(ClassificationSupportedSequentialModel):
         self,
         num_features: int,
         num_classes: int,
-        hidden_features: _typing.Sequence[int],
+        hidden_features: Sequence[int],
         activation_name: str,
-        dropout: _typing.Union[
-            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
-        ] = None,
+        dropout: Union[Real, Sequence[Optional[Real]], None] = None,
         add_self_loops: bool = True,
         normalize: bool = True,
     ):
-        if isinstance(dropout, _typing.Sequence):
+        if isinstance(dropout, Sequence):
             if len(dropout) != len(hidden_features) + 1:
                 raise TypeError(
                     "When the dropout argument is a sequence, "
                     "The sequence length must equal to the number of layers to construct."
                 )
             for _dropout in dropout:
-                if _dropout is not None and type(_dropout) != float:
+                if _dropout is not None and not isinstance(_dropout, Real):
                     raise TypeError(
                         "When the dropout argument is a sequence, "
                         "every item in the sequence must be float or None"
                     )
-            dropout_list: _typing.Sequence[_typing.Optional[float]] = dropout
-        elif type(dropout) == float:
+            dropout_list: Sequence[Optional[Real]] = dropout
+        elif isinstance(dropout, Real):
             if dropout < 0:
                 dropout = 0
             if dropout > 1:
                 dropout = 1
-            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
+            dropout_list: Sequence[Real] = [
                 dropout for _ in range(len(hidden_features))
             ] + [None]
-        elif dropout in (None, Ellipsis, ...):
-            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
+        elif dropout is None:
+            dropout_list: Sequence[None] = [
                 None for _ in range(len(hidden_features) + 1)
             ]
         else:
@@ -125,9 +114,7 @@ class GCN(ClassificationSupportedSequentialModel):
                 )
             )
         else:
-            self.__sequential_encoding_layers: torch.nn.ModuleList = (
-                torch.nn.ModuleList()
-            )
+            self.__sequential_encoding_layers = torch.nn.ModuleList()
             self.__sequential_encoding_layers.append(
                 self._GCNLayer(
                     num_features,
@@ -138,6 +125,7 @@ class GCN(ClassificationSupportedSequentialModel):
                     dropout_list[0],
                 )
             )
+
             for hidden_feature_index in range(len(hidden_features)):
                 if hidden_feature_index + 1 < len(hidden_features):
                     self.__sequential_encoding_layers.append(
@@ -167,28 +155,26 @@ class GCN(ClassificationSupportedSequentialModel):
 
     def __extract_edge_indexes_and_weights(
         self, data
-    ) -> _typing.Union[
-        _typing.Sequence[
-            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
-        ],
-        _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
+    ) -> Union[
+        Sequence[Tuple[torch.LongTensor, Optional[torch.Tensor]]],
+        Tuple[torch.LongTensor, Optional[torch.Tensor]],
     ]:
         def __compose_edge_index_and_weight(
             _edge_index: torch.LongTensor,
-            _edge_weight: _typing.Optional[torch.Tensor] = None,
-        ) -> _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]:
+            _edge_weight: Optional[torch.Tensor] = None,
+        ) -> Tuple[torch.LongTensor, Optional[torch.Tensor]]:
             if type(_edge_index) != torch.Tensor or _edge_index.dtype != torch.int64:
                 raise TypeError
             if _edge_weight is not None and (
                 type(_edge_weight) != torch.Tensor
                 or _edge_index.size() != (2, _edge_weight.size(0))
             ):
-                _edge_weight: _typing.Optional[torch.Tensor] = None
+                _edge_weight: Optional[torch.Tensor] = None
             return _edge_index, _edge_weight
 
         if not (
             hasattr(data, "edge_indexes")
-            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
+            and isinstance(getattr(data, "edge_indexes"), Sequence)
             and len(getattr(data, "edge_indexes"))
             == len(self.__sequential_encoding_layers)
         ):
@@ -205,7 +191,7 @@ class GCN(ClassificationSupportedSequentialModel):
 
         if (
             data.edata.has_key('edge_weights')
-            and isinstance(data.edata['edge_weights'], _typing.Sequence)
+            and isinstance(data.edata['edge_weights'], Sequence)
             and len(data.edata.has_key('edge_weights'))
             == len(self.__sequential_encoding_layers)
         ):
@@ -225,14 +211,14 @@ class GCN(ClassificationSupportedSequentialModel):
         x = data.ndata['feat']
         for gcn in self.__sequential_encoding_layers:
             x = gcn(data,x)
-        return x
+        return F.log_softmax(x, dim=-1)
 
     def cls_encode(self, data) -> torch.Tensor:
-        edge_indexes_and_weights: _typing.Union[
-            _typing.Sequence[
-                _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
-            ],
-            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
+        return self(data)
+        
+        edge_indexes_and_weights: Union[
+            Sequence[Tuple[torch.LongTensor, Optional[torch.Tensor]]],
+            Tuple[torch.LongTensor, Optional[torch.Tensor]],
         ] = self.__extract_edge_indexes_and_weights(data)
 
         if (not isinstance(edge_indexes_and_weights, tuple)) and isinstance(
@@ -319,9 +305,9 @@ class AutoGCN(BaseModel):
 
     def __init__(
         self,
-        num_features: int = ...,
-        num_classes: int = ...,
-        device: _typing.Union[str, torch.device] = ...,
+        num_features: Optional[int] = None,
+        num_classes: Optional[int] = None,
+        device: Union[str, torch.device] = 'cpu',
         init: bool = False,
         **kwargs
     ) -> None:

From f75ad71341478dbd4176d1a20517335a676f2458 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 2 Nov 2021 13:04:48 +0000
Subject: [PATCH 73/75] disable sampling for now

---
 autogl/module/model/dgl/graphsage.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/autogl/module/model/dgl/graphsage.py b/autogl/module/model/dgl/graphsage.py
index f17e151..2718bf1 100644
--- a/autogl/module/model/dgl/graphsage.py
+++ b/autogl/module/model/dgl/graphsage.py
@@ -151,6 +151,8 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
         return self.__sequential_encoding_layers
 
     def cls_encode(self, data) -> torch.Tensor:
+        return self(data)
+
         # if (
         #     hasattr(data, "edge_indexes")
         #     and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)

From 6128812390e3236563072d0ee0ee4167d9f94aa2 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 2 Nov 2021 13:05:18 +0000
Subject: [PATCH 74/75] fill support for node clf

---
 autogl/module/train/node_classification_full.py | 13 +++++++++++--
 autogl/solver/utils.py                          | 16 ++++++++++++----
 2 files changed, 23 insertions(+), 6 deletions(-)

diff --git a/autogl/module/train/node_classification_full.py b/autogl/module/train/node_classification_full.py
index f0ad9b6..eab6584 100644
--- a/autogl/module/train/node_classification_full.py
+++ b/autogl/module/train/node_classification_full.py
@@ -191,7 +191,13 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
 
         """
         data = data.to(self.device)
-        mask = data.train_mask if train_mask is None else train_mask
+        if train_mask is None:
+            if self.pyg_dgl == 'pyg':
+                mask = data.train_mask
+            elif self.pyg_dgl == 'dgl':
+                mask = data.ndata['train_mask']
+        else:
+            mask = train_mask
         optimizer = self.optimizer(
             self.model.model.parameters(), lr=self.lr, weight_decay=self.weight_decay
         )
@@ -438,6 +444,9 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
                 mask = getattr(data, f'{mask}_mask')
             elif self.pyg_dgl == 'dgl':
                 mask = data.ndata[f'{mask}_mask']
+        
+        if self.pyg_dgl == 'pyg': label = data.y
+        elif self.pyg_dgl == 'dgl': label = data.ndata['label']
 
         if feval is None:
             feval = self.feval
@@ -446,7 +455,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
 
         y_pred_prob = self.predict_proba(dataset, mask)
         
-        y_true = data.y[mask] if mask is not None else data.y
+        y_true = label[mask] if mask is not None else label
 
         if not isinstance(feval, list):
             feval = [feval]
diff --git a/autogl/solver/utils.py b/autogl/solver/utils.py
index 4829bcd..f1b8c52 100644
--- a/autogl/solver/utils.py
+++ b/autogl/solver/utils.py
@@ -20,9 +20,9 @@ LOGGER = get_logger("LeaderBoard")
 BACKEND = DependentBackend.get_backend_name()
 
 if BACKEND == 'dgl':
-    from autogl.datasets.utils.conversion import general_static_graphs_to_dgl_dataset as convert_dataset
+    from autogl.datasets.utils.conversion import general_static_graphs_to_dgl_dataset as _convert_dataset
 else:
-    from autogl.datasets.utils.conversion import general_static_graphs_to_pyg_dataset as convert_dataset
+    from autogl.datasets.utils.conversion import general_static_graphs_to_pyg_dataset as _convert_dataset
 
 class LeaderBoard:
     """
@@ -188,8 +188,12 @@ def get_graph_from_dataset(dataset, graph_id=0):
     if isinstance(dataset, Dataset):
         return dataset[graph_id]
     if BACKEND == 'pyg': return dataset[graph_id]
-    return dataset.graph[graph_id]
-
+    if BACKEND == 'dgl':
+        from dgl import DGLGraph
+        data = dataset[graph_id]
+        if isinstance(data, DGLGraph): return data
+        return data[0]
+    
 def get_graph_node_number(graph):
     # FIXME: if the feature is None, this will throw an error
     if isinstance(graph, GeneralStaticGraph):
@@ -245,6 +249,10 @@ def get_dataset_labels(dataset):
     else:
         return torch.LongTensor([d[1] for d in dataset])
 
+def convert_dataset(dataset):
+    if isinstance(dataset, Dataset): return _convert_dataset(dataset)
+    return dataset
+
 def set_seed(seed=None):
     """
     Set seed of whole process

From e0a479e79944f5e8399c9267005c92b94925ac36 Mon Sep 17 00:00:00 2001
From: Frozenmad <frozenmad2015@outlook.com>
Date: Tue, 2 Nov 2021 13:07:00 +0000
Subject: [PATCH 75/75] add test performance check for dgl nodeclf

---
 test/backend.py                               |  25 ++++
 test/model_nlf/nclf_dgl.py                    | 117 ---------------
 test/model_nlf/nclf_dgl_trainer.py            | 140 ------------------
 .../node_classification/dgl/base.py           |   7 +-
 .../node_classification/dgl/model.py          | 126 ++++++++++++++++
 .../node_classification/dgl/solver.py         |  88 +++++++++++
 .../node_classification/dgl/trainer.py        |  95 ++++++++++++
 .../dgl/trainer_dataset.py                    |  92 ++++++++++++
 8 files changed, 428 insertions(+), 262 deletions(-)
 create mode 100644 test/backend.py
 delete mode 100644 test/model_nlf/nclf_dgl.py
 delete mode 100644 test/model_nlf/nclf_dgl_trainer.py
 create mode 100644 test/performance/node_classification/dgl/model.py
 create mode 100644 test/performance/node_classification/dgl/solver.py
 create mode 100644 test/performance/node_classification/dgl/trainer.py
 create mode 100644 test/performance/node_classification/dgl/trainer_dataset.py

diff --git a/test/backend.py b/test/backend.py
new file mode 100644
index 0000000..7c3d5cc
--- /dev/null
+++ b/test/backend.py
@@ -0,0 +1,25 @@
+import os
+import autogl
+
+def test_backend():
+    environ = os.environ.get("AUTOGL_BACKEND", None)
+    backend_name = autogl.backend.DependentBackend.get_backend_name()
+    if environ in ['pyg', 'dgl']:
+        assert backend_name == environ
+    else:
+        try:
+            import dgl
+            assert backend_name == 'dgl'
+            return
+        except ImportError:
+            pass
+
+        try:
+            import torch_geometric
+            assert backend_name == 'pyg'
+            return
+        except ImportError:
+            pass
+
+if __name__ == '__main__':
+    test_backend()
diff --git a/test/model_nlf/nclf_dgl.py b/test/model_nlf/nclf_dgl.py
deleted file mode 100644
index 66c7729..0000000
--- a/test/model_nlf/nclf_dgl.py
+++ /dev/null
@@ -1,117 +0,0 @@
-import os
-import sys
-import logging
-logging.basicConfig(level=logging.INFO)
-from tqdm import tqdm
-import time
-
-sys.path.insert(0, "../../")
-os.environ["AUTOGL_BACKEND"] = "dgl"
-# os.environ["AUTOGL_BACKEND"] = "pyg"
-from autogl.backend import DependentBackend
-import dgl
-from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-import torch.optim as optim
-
-from autogl.module.model import AutoSAGE,AutoGCN,AutoGAT
-
-from pdb import set_trace
-import numpy as np
-from autogl.solver.utils import set_seed
-set_seed(202106)
-import argparse
-
-def evaluate(model, graph, labels, mask):
-    model.eval()
-    with torch.no_grad():
-        logits = model(graph)
-        logits = logits[mask]
-        labels = labels[mask]
-        _, indices = torch.max(logits, dim=1)
-        correct = torch.sum(indices == labels)
-        return correct.item() * 1.0 / len(labels)
-
-
-def main():
-    
-
-    # set up seeds, args.seed supported
-    torch.manual_seed(seed=202106)
-    np.random.seed(seed=202106)
-
-    is_cuda = torch.cuda.is_available()
-
-    if is_cuda:
-        device = torch.device("cuda")
-        torch.cuda.manual_seed_all(seed=202106)
-    else:
-        device = torch.device("cpu")
-
-    dataset = CoraGraphDataset()
-    data = dataset[0].to(device)
-    # data.ndata['x'] = data.ndata['feat']
-    train_mask = data.ndata['train_mask']
-    val_mask = data.ndata['val_mask']
-    test_mask = data.ndata['test_mask']
-    labels = data.ndata['label']
-    n_edges = data.number_of_edges()
-
-    # args={}
-    # args["features_num"]=data.ndata['x'].size(1)
-    # args['hidden']=[16]
-    # args["heads"]=8
-    # args['dropout']=0.6
-    # args["num_class"]=dataset.num_classes
-    # args["num_layers"]=2
-    # args['act']='relu'
-
-
-    # model = GAT(args)
-    # model = GraphSAGE(args["features_num"],
-    #                   args["num_class"],
-    #                   [16],'relu',0.5)
-    automodel = AutoGAT(
-        num_features = data.ndata['feat'].size(1),
-        num_classes = dataset.num_classes,
-        device = device,
-        init = True
-    )
-
-    model = automodel.model
-
-    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-    optimizer = optim.Adam(model.parameters(), lr=0.01)
-
-    dur = []
-    for epoch in range(200):
-        model.train()
-        if epoch >= 3:
-            t0 = time.time()
-        # forward
-        logits = model(data)
-        loss = criterion(logits[train_mask], labels[train_mask])
-
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-
-        if epoch >= 3:
-            dur.append(time.time() - t0)
-
-        acc = evaluate(model, data, labels, val_mask)
-        print("Epoch {:05d} | Time(s) {:.4f} | Loss {:.4f} | Accuracy {:.4f} | "
-              "ETputs(KTEPS) {:.2f}". format(epoch, np.mean(dur), loss.item(),
-                                             acc, n_edges / np.mean(dur) / 1000))
-
-    print()
-    acc = evaluate(model, data, labels, test_mask)
-    print("Test accuracy {:.2%}".format(acc))
-
-
-if __name__ == '__main__':
-    
-    main()
-
diff --git a/test/model_nlf/nclf_dgl_trainer.py b/test/model_nlf/nclf_dgl_trainer.py
deleted file mode 100644
index f38dd75..0000000
--- a/test/model_nlf/nclf_dgl_trainer.py
+++ /dev/null
@@ -1,140 +0,0 @@
-import os
-import sys
-import logging
-logging.basicConfig(level=logging.INFO)
-from tqdm import tqdm
-import time
-
-sys.path.insert(0, "../../")
-os.environ["AUTOGL_BACKEND"] = "dgl"
-# os.environ["AUTOGL_BACKEND"] = "pyg"
-from autogl.backend import DependentBackend
-import dgl
-from dgl.data import CoraGraphDataset, CiteseerGraphDataset, PubmedGraphDataset, GINDataset
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-import torch.optim as optim
-
-from autogl.module.model import AutoSAGE,AutoGCN,AutoGAT
-from autogl.module.train import NodeClassificationFullTrainer
-from pdb import set_trace
-import numpy as np
-from autogl.solver.utils import set_seed
-set_seed(202106)
-import argparse
-
-def evaluate(model, graph, labels, mask):
-    model.eval()
-    with torch.no_grad():
-        logits = model(graph)
-        logits = logits[mask]
-        labels = labels[mask]
-        _, indices = torch.max(logits, dim=1)
-        correct = torch.sum(indices == labels)
-        return correct.item() * 1.0 / len(labels)
-
-
-def main():
-    
-
-    # set up seeds, args.seed supported
-    torch.manual_seed(seed=202106)
-    np.random.seed(seed=202106)
-
-    is_cuda = torch.cuda.is_available()
-
-    if is_cuda:
-        device = torch.device("cuda")
-        torch.cuda.manual_seed_all(seed=202106)
-    else:
-        device = torch.device("cpu")
-
-    dataset = CoraGraphDataset()
-    data = dataset[0].to(device)
-    # data.ndata['x'] = data.ndata['feat']
-    train_mask = data.ndata['train_mask']
-    val_mask = data.ndata['val_mask']
-    test_mask = data.ndata['test_mask']
-    labels = data.ndata['label']
-    n_edges = data.number_of_edges()
-
-    # args={}
-    # args["features_num"]=data.ndata['x'].size(1)
-    # args['hidden']=[16]
-    # args["heads"]=8
-    # args['dropout']=0.6
-    # args["num_class"]=dataset.num_classes
-    # args["num_layers"]=2
-    # args['act']='relu'
-
-
-    # model = GAT(args)
-    # model = GraphSAGE(args["features_num"],
-    #                   args["num_class"],
-    #                   [16],'relu',0.5)
-
-    automodel = AutoGAT(
-        num_features = data.ndata['feat'].size(1),
-        num_classes = dataset.num_classes,
-        device = device,
-        init = True
-    )
-
-    trainer = NodeClassificationFullTrainer(
-        model=automodel,
-        num_features=data.ndata['feat'].size(1),
-        num_classes=dataset.num_classes,
-        optimizer=None,
-        lr=0.01,
-        max_epoch=100,
-        weight_decay=0.0,
-        device='cuda',
-        init=False,
-        loss='cross_entropy',
-        feval=('acc'),
-    )
-
-    trainer.train(dataset, keep_valid_result=True, train_mask=train_mask)
-    out = trainer.predict(dataset, 'test').detach().cpu().numpy()
-    labels = labels[data.ndata['test_mask']].detach().cpu().numpy()
-    acc = np.count_nonzero(out == labels) / labels.shape[0]
-    print(acc)  # 0.764
-
-    return
-
-    model = automodel.model
-
-    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
-    optimizer = optim.Adam(model.parameters(), lr=0.01)
-
-    dur = []
-    for epoch in range(200):
-        model.train()
-        if epoch >= 3:
-            t0 = time.time()
-        # forward
-        logits = model(data)
-        loss = criterion(logits[train_mask], labels[train_mask])
-
-        optimizer.zero_grad()
-        loss.backward()
-        optimizer.step()
-
-        if epoch >= 3:
-            dur.append(time.time() - t0)
-
-        acc = evaluate(model, data, labels, val_mask)
-        print("Epoch {:05d} | Time(s) {:.4f} | Loss {:.4f} | Accuracy {:.4f} | "
-              "ETputs(KTEPS) {:.2f}". format(epoch, np.mean(dur), loss.item(),
-                                             acc, n_edges / np.mean(dur) / 1000))
-
-    print()
-    acc = evaluate(model, data, labels, test_mask)
-    print("Test accuracy {:.2%}".format(acc))
-
-
-if __name__ == '__main__':
-    
-    main()
-
diff --git a/test/performance/node_classification/dgl/base.py b/test/performance/node_classification/dgl/base.py
index 4618ed8..cf09735 100644
--- a/test/performance/node_classification/dgl/base.py
+++ b/test/performance/node_classification/dgl/base.py
@@ -1,15 +1,12 @@
 """
-Performance check of AutoGL model + DGL (trainer + dataset)
+Performance check of DGL model + trainer + dataset
 """
-import os
-import random
 import numpy as np
 from tqdm import tqdm
 
 import torch
 import torch.nn.functional as F
 
-import dgl
 from dgl.data import CoraGraphDataset, PubmedGraphDataset, CiteseerGraphDataset
 from dgl.nn.pytorch import GraphConv, GATConv, SAGEConv
 import logging
@@ -96,7 +93,7 @@ def train(model, graph, args, label, train_mask, val_mask):
 if __name__ == '__main__':
 
     import argparse
-    parser = argparse.ArgumentParser('dgl model')
+    parser = argparse.ArgumentParser('dgl')
     parser.add_argument('--device', type=str, default='cuda')
     parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
     parser.add_argument('--repeat', type=int, default=50)
diff --git a/test/performance/node_classification/dgl/model.py b/test/performance/node_classification/dgl/model.py
new file mode 100644
index 0000000..f45266c
--- /dev/null
+++ b/test/performance/node_classification/dgl/model.py
@@ -0,0 +1,126 @@
+"""
+Performance check of AutoGL model + DGL (trainer + dataset)
+"""
+import os
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "dgl"
+
+import torch
+import torch.nn.functional as F
+from dgl.data import CoraGraphDataset, PubmedGraphDataset, CiteseerGraphDataset
+from autogl.module.model.dgl import AutoGCN, AutoGAT, AutoSAGE
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def test(model, graph, mask, label):
+    model.eval()
+
+    pred = model(graph)[mask].max(1)[1]
+    acc = pred.eq(label[mask]).sum().item() / mask.sum().item()
+    return acc
+
+def train(model, graph, args, label, train_mask, val_mask):
+    optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
+
+    parameters = model.state_dict()
+    best_acc = 0.
+    for epoch in range(args.epoch):
+        model.train()
+        optimizer.zero_grad()
+        output = model(graph)
+        loss = F.nll_loss(output[train_mask], label[train_mask])
+        loss.backward()
+        optimizer.step()
+
+        val_acc = test(model, graph, val_mask, label)
+        if val_acc > best_acc:
+            best_acc = val_acc
+            parameters = model.state_dict()
+    
+    model.load_state_dict(parameters)
+    return model
+
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('dgl model')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    if args.dataset == 'Cora':
+        dataset = CoraGraphDataset()
+    elif args.dataset == 'CiteSeer':
+        dataset = CiteseerGraphDataset()
+    elif args.dataset == 'PubMed':
+        dataset = PubmedGraphDataset()
+    graph = dataset[0].to(args.device)
+    label = graph.ndata['label']
+    train_mask = graph.ndata['train_mask']
+    val_mask = graph.ndata['val_mask']
+    test_mask = graph.ndata['test_mask']
+    num_features = graph.ndata['feat'].size(1)
+    num_classes = dataset.num_classes
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        if args.model == 'gat':
+            model = AutoGAT(
+                num_features=num_features,
+                num_classes=num_classes,
+                device=args.device,
+                init=False
+            ).from_hyper_parameter({
+                # hp from model
+                "num_layers": 2,
+                "hidden": [8],
+                "heads": 8,
+                "dropout": 0.6,
+                "act": "elu",
+            }).model
+        elif args.model == 'gcn':
+            model = AutoGCN(
+                num_features=num_features,
+                num_classes=num_classes,
+                device=args.device,
+                init=False
+            ).from_hyper_parameter({
+                "num_layers": 2,
+                "hidden": [16],
+                "dropout": 0.5,
+                "act": "relu"
+            }).model
+        elif args.model == 'sage':
+            model = AutoSAGE(
+                num_features=num_features,
+                num_classes=num_classes,
+                device=args.device,
+                init=False
+            ).from_hyper_parameter({
+                "num_layers": 2,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "agg": "mean",
+            }).model
+        
+        model.to(args.device)
+
+        train(model, graph, args, label, train_mask, val_mask)
+        acc = test(model, graph, test_mask, label)
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/node_classification/dgl/solver.py b/test/performance/node_classification/dgl/solver.py
new file mode 100644
index 0000000..38423bc
--- /dev/null
+++ b/test/performance/node_classification/dgl/solver.py
@@ -0,0 +1,88 @@
+"""
+Performance check of AutoGL solver
+"""
+import os
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "dgl"
+
+from autogl.solver import AutoNodeClassifier
+from autogl.datasets import build_dataset_from_name
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+def fixed(**kwargs):
+    return [{
+        'parameterName': k,
+        "type": "FIXED",
+        "value": v
+    } for k, v in kwargs.items()]
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('dgl solver')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = build_dataset_from_name(args.dataset.lower())
+    label = dataset[0].nodes.data['label'][dataset[0].nodes.data['test_mask']].numpy()
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+
+        if args.model == 'gat':
+            model_hp = {
+                # hp from model
+                "num_layers": 2,
+                "hidden": [8],
+                "heads": 8,
+                "dropout": 0.6,
+                "act": "elu",
+            }
+        elif args.model == 'gcn':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [16],
+                "dropout": 0.5,
+                "act": "relu"
+            }
+        elif args.model == 'sage':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "agg": "mean",
+            }
+        
+        solver = AutoNodeClassifier(
+            feature_module=None,
+            graph_models=(args.model,),
+            ensemble_module=None,
+            max_evals=1,
+            hpo_module='random',
+            trainer_hp_space=fixed(**{
+                "max_epoch": args.epoch,
+                "early_stopping_round": args.epoch + 1,
+                "lr": args.lr,
+                "weight_decay": args.weight_decay,
+            }),
+            model_hp_spaces=[fixed(**model_hp)]
+        )
+
+        solver.fit(dataset, evaluation_method=['acc'], seed=seed)
+        output = solver.predict(dataset)
+        acc = (output == label).astype('float').mean()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/node_classification/dgl/trainer.py b/test/performance/node_classification/dgl/trainer.py
new file mode 100644
index 0000000..665b1b0
--- /dev/null
+++ b/test/performance/node_classification/dgl/trainer.py
@@ -0,0 +1,95 @@
+"""
+Performance check of AutoGL trainer + DGL dataset
+"""
+import os
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "dgl"
+
+from dgl.data import CoraGraphDataset, PubmedGraphDataset, CiteseerGraphDataset
+from autogl.module.train import NodeClassificationFullTrainer
+from autogl.solver.utils import set_seed
+import logging
+
+logging.basicConfig(level=logging.ERROR)
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('dgl trainer')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    if args.dataset == 'Cora':
+        dataset = CoraGraphDataset()
+    elif args.dataset == 'CiteSeer':
+        dataset = CiteseerGraphDataset()
+    elif args.dataset == 'PubMed':
+        dataset = PubmedGraphDataset()
+    graph = dataset[0].to(args.device)
+    label = graph.ndata['label']
+    train_mask = graph.ndata['train_mask']
+    val_mask = graph.ndata['val_mask']
+    test_mask = graph.ndata['test_mask']
+    num_features = graph.ndata['feat'].size(1)
+    num_classes = dataset.num_classes
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        if args.model == 'gat':
+            model_hp = {
+                # hp from model
+                "num_layers": 2,
+                "hidden": [8],
+                "heads": 8,
+                "dropout": 0.6,
+                "act": "elu",
+            }
+        elif args.model == 'gcn':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [16],
+                "dropout": 0.5,
+                "act": "relu"
+            }
+        elif args.model == 'sage':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "agg": "mean",
+            }
+
+        trainer = NodeClassificationFullTrainer(
+            model=args.model,
+            num_features=num_features,
+            num_classes=num_classes,
+            device=args.device,
+            init=False,
+            feval=['acc'],
+            loss="nll_loss",
+        ).duplicate_from_hyper_parameter({
+            "max_epoch": args.epoch,
+            "early_stopping_round": args.epoch + 1,
+            "lr": args.lr,
+            "weight_decay": args.weight_decay,
+            **model_hp
+        })
+
+        trainer.train(dataset, False)
+        output = trainer.predict(dataset, 'test')
+        acc = (output == label[test_mask]).float().mean().item()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))
diff --git a/test/performance/node_classification/dgl/trainer_dataset.py b/test/performance/node_classification/dgl/trainer_dataset.py
new file mode 100644
index 0000000..f3cb730
--- /dev/null
+++ b/test/performance/node_classification/dgl/trainer_dataset.py
@@ -0,0 +1,92 @@
+"""
+Performance check of AutoGL trainer + dataset
+"""
+import os
+import numpy as np
+from tqdm import tqdm
+
+os.environ["AUTOGL_BACKEND"] = "dgl"
+
+from autogl.datasets import build_dataset_from_name
+from autogl.datasets.utils.conversion import general_static_graphs_to_dgl_dataset
+from autogl.module.train import NodeClassificationFullTrainer
+from autogl.solver.utils import set_seed
+import logging
+
+
+logging.basicConfig(level=logging.ERROR)
+
+if __name__ == '__main__':
+
+    import argparse
+    parser = argparse.ArgumentParser('dgl trainer dataset')
+    parser.add_argument('--device', type=str, default='cuda')
+    parser.add_argument('--dataset', type=str, choices=['Cora', 'CiteSeer', 'PubMed'], default='Cora')
+    parser.add_argument('--repeat', type=int, default=50)
+    parser.add_argument('--model', type=str, choices=['gat', 'gcn', 'sage'], default='gat')
+    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--weight_decay', type=float, default=0.0)
+    parser.add_argument('--epoch', type=int, default=200)
+
+    args = parser.parse_args()
+
+    # seed = 100
+    dataset = build_dataset_from_name(args.dataset.lower())
+    dataset = general_static_graphs_to_dgl_dataset(dataset)
+    data = dataset[0].to(args.device)
+    num_features = data.ndata['feat'].size(1)
+    num_classes = data.ndata['label'].max().item() + 1
+    label = data.ndata['label']
+    test_mask = data.ndata['test_mask']
+
+    accs = []
+
+    for seed in tqdm(range(args.repeat)):
+        set_seed(seed)
+
+        if args.model == 'gat':
+            model_hp = {
+                # hp from model
+                "num_layers": 2,
+                "hidden": [8],
+                "heads": 8,
+                "dropout": 0.6,
+                "act": "elu",
+            }
+        elif args.model == 'gcn':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [16],
+                "dropout": 0.5,
+                "act": "relu"
+            }
+        elif args.model == 'sage':
+            model_hp = {
+                "num_layers": 2,
+                "hidden": [64],
+                "dropout": 0.5,
+                "act": "relu",
+                "agg": "mean",
+            }
+
+        trainer = NodeClassificationFullTrainer(
+            model=args.model,
+            num_features=num_features,
+            num_classes=num_classes,
+            device=args.device,
+            init=False,
+            feval=['acc'],
+            loss="nll_loss",
+        ).duplicate_from_hyper_parameter({
+            "max_epoch": args.epoch,
+            "early_stopping_round": args.epoch + 1,
+            "lr": args.lr,
+            "weight_decay": args.weight_decay,
+            **model_hp
+        })
+
+        trainer.train(dataset, False)
+        output = trainer.predict(dataset, 'test')
+        acc = (output == label[test_mask]).float().mean().item()
+        accs.append(acc)
+    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))