PR [#51] solver_dataset -> dglbackend

Add solver and dataset support
4 years ago · 0faae3753e
--- a/autogl/data/init.py
+++ b/autogl/data/init.py
@@ -1,6 +1,6 @@
 from .data import Data
 from .batch import Batch
 from .dataset import Dataset
 from ._dataset import Dataset, InMemoryDataset, InMemoryStaticGraphSet
 from .dataloader import DataLoader, DataListLoader, DenseDataLoader
 from .download import download_url
 from .extract import extract_tar, extract_zip, extract_bz2, extract_gz
@@ -9,6 +9,8 @@ __all__ = [
    "Data",
    "Batch",
    "Dataset",
    "InMemoryDataset",
    "InMemoryStaticGraphSet",
    "DataLoader",
    "DataListLoader",
    "DenseDataLoader",
--- a/autogl/data/_dataset/init.py
+++ b/autogl/data/_dataset/init.py
@@ -0,0 +1,2 @@
 from ._dataset import Dataset, InMemoryDataset
 from ._in_memory_static_graph_set import InMemoryStaticGraphSet
--- a/autogl/data/_dataset/_dataset.py
+++ b/autogl/data/_dataset/_dataset.py
@@ -0,0 +1,243 @@
 import typing as _typing

 _D = _typing.TypeVar('_D')


 class Dataset(_typing.Iterable[_D], _typing.Sized):
    def __len__(self) -> int:
        raise NotImplementedError

    def __iter__(self) -> _typing.Iterator[_D]:
        raise NotImplementedError

    def __getitem__(self, index: int) -> _D:
        raise NotImplementedError

    def __setitem__(self, index: int, data: _D):
        raise NotImplementedError

    @property
    def train_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
        raise NotImplementedError

    @property
    def val_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
        raise NotImplementedError

    @property
    def test_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
        raise NotImplementedError

    @property
    def train_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
        raise NotImplementedError

    @property
    def val_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
        raise NotImplementedError

    @property
    def test_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
        raise NotImplementedError

    @train_index.setter
    def train_index(self, train_index: _typing.Optional[_typing.Iterable[int]]):
        raise NotImplementedError

    @val_index.setter
    def val_index(self, val_index: _typing.Optional[_typing.Iterable[int]]):
        raise NotImplementedError

    @test_index.setter
    def test_index(self, test_index: _typing.Optional[_typing.Iterable[int]]):
        raise NotImplementedError


 class _FoldsContainer:
    def __init__(
            self,
            folds: _typing.Optional[_typing.Iterable[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]] = ...
    ):
        self._folds: _typing.Optional[_typing.List[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]] = (
            list(folds) if isinstance(folds, _typing.Iterable) else None
        )
        if self._folds is not None and len(self._folds) == 0:
            self._folds = None

    @property
    def folds(self) -> _typing.Optional[_typing.Sequence[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]]:
        if self._folds is not None and len(self._folds) == 0:
            self._folds = None
        return self._folds

    @folds.setter
    def folds(self, folds: _typing.Optional[_typing.Iterable[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]]):
        self._folds: _typing.Optional[_typing.List[_typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]]] = (
            list(folds) if isinstance(folds, _typing.Iterable) else None
        )
        if self._folds is not None and len(self._folds) == 0:
            self._folds = None


 class _FoldView:
    def __init__(self, folds_container: _FoldsContainer, fold_index: int):
        self._folds_container: _FoldsContainer = folds_container
        self._fold_index: int = fold_index

    @property
    def train_index(self) -> _typing.Sequence[int]:
        return self._folds_container.folds[self._fold_index][0]

    @property
    def val_index(self) -> _typing.Sequence[int]:
        return self._folds_container.folds[self._fold_index][1]


 class _FoldsView(_typing.Sequence[_FoldView]):
    def __init__(self, folds_container: _FoldsContainer):
        self._folds_container = folds_container

    def __len__(self) -> int:
        return (
            len(self._folds_container.folds)
            if self._folds_container.folds is not None
            else 0
        )

    def __getitem__(self, fold_index: int) -> _FoldView:
        return _FoldView(self._folds_container, fold_index)


 class InMemoryDataset(Dataset[_D]):
    def __init__(
            self, data: _typing.Iterable[_D],
            train_index: _typing.Optional[_typing.Iterable[int]] = ...,
            val_index: _typing.Optional[_typing.Iterable[int]] = ...,
            test_index: _typing.Optional[_typing.Iterable[int]] = ...
    ):
        self.__data: _typing.MutableSequence[_D] = list(data)
        self.__train_index: _typing.Optional[_typing.Iterable[int]] = (
            train_index if isinstance(train_index, _typing.Iterable) else None
        )
        self.__val_index: _typing.Optional[_typing.Iterable[int]] = (
            val_index if isinstance(val_index, _typing.Iterable) else None
        )
        self.__test_index: _typing.Optional[_typing.Iterable[int]] = (
            test_index if isinstance(test_index, _typing.Iterable) else None
        )
        self.__folds_container: _FoldsContainer = _FoldsContainer()

    @property
    def folds(self) -> _typing.Optional[_FoldsView]:
        return (
            _FoldsView(self.__folds_container)
            if (
                    self.__folds_container.folds is not None and
                    len(self.__folds_container.folds) > 0
            )
            else None
        )

    @folds.setter
    def folds(
            self,
            folds: _typing.Optional[
                _typing.Iterable[
                    _typing.Tuple[_typing.Sequence[int], _typing.Sequence[int]]
                ]
            ] = ...
    ):
        self.__folds_container.folds = folds

    def __len__(self) -> int:
        return len(self.__data)

    def __iter__(self) -> _typing.Iterator[_D]:
        return iter(self.__data)

    def __getitem__(self, index: int) -> _D:
        return self.__data[index]

    def __setitem__(self, index: int, data: _D):
        self.__data[index] = data

    def reset_dataset(self, data: _typing.Iterable[_D]):
        if not isinstance(data, _typing.Iterable):
            raise TypeError
        __data: _typing.MutableSequence[_D] = list(data)
        __preserve_info: bool = __data == len(self)
        self.__data: _typing.MutableSequence[_D] = __data
        if not __preserve_info:
            self.train_index = self.val_index = self.test_index = None

    @property
    def train_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
        return (
            [self.__data[i] for i in self.__train_index]
            if isinstance(self.__train_index, _typing.Iterable) else None
        )

    @property
    def val_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
        return (
            [self.__data[i] for i in self.__val_index]
            if isinstance(self.__val_index, _typing.Iterable) else None
        )

    @property
    def test_split(self) -> _typing.Optional[_typing.Iterable[_D]]:
        return (
            [self.__data[i] for i in self.__test_index]
            if isinstance(self.__test_index, _typing.Iterable) else None
        )

    @property
    def train_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
        return self.__train_index

    @property
    def val_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
        return self.__val_index

    @property
    def test_index(self) -> _typing.Optional[_typing.AbstractSet[int]]:
        return self.__test_index

    @train_index.setter
    def train_index(self, train_index: _typing.Optional[_typing.Iterable[int]]):
        if not (train_index is None or isinstance(train_index, _typing.Iterable)):
            raise TypeError
        elif train_index is None:
            self.__train_index: _typing.Optional[_typing.Iterable[int]] = None
        elif isinstance(train_index, _typing.Iterable):
            if not all([isinstance(i, int) for i in train_index]):
                raise TypeError
            if not (0 <= min(train_index) <= max(train_index) < len(self)):
                raise ValueError
            self.__train_index: _typing.Optional[_typing.Iterable[int]] = train_index

    @val_index.setter
    def val_index(self, val_index: _typing.Optional[_typing.Iterable[int]]):
        if not (val_index is None or isinstance(val_index, _typing.Iterable)):
            raise TypeError
        elif val_index is None:
            self.__val_index: _typing.Optional[_typing.Iterable[int]] = None
        elif isinstance(val_index, _typing.Iterable):
            if not all([isinstance(i, int) for i in val_index]):
                raise TypeError
            if not (0 <= min(val_index) <= max(val_index) < len(self)):
                raise ValueError
            self.__val_index: _typing.Optional[_typing.Iterable[int]] = val_index

    @test_index.setter
    def test_index(self, test_index: _typing.Optional[_typing.Iterable[int]]):
        if not (test_index is None or isinstance(test_index, _typing.Iterable)):
            raise TypeError
        elif test_index is None:
            self.__test_index: _typing.Optional[_typing.Set[int]] = None
        elif isinstance(test_index, _typing.Iterable):
            if not all([isinstance(i, int) for i in test_index]):
                raise TypeError
            if not (0 <= min(test_index) <= max(test_index) < len(self)):
                raise ValueError
            self.__test_index: _typing.Optional[_typing.Iterable[int]] = test_index
--- a/autogl/data/_dataset/_in_memory_static_graph_set.py
+++ b/autogl/data/_dataset/_in_memory_static_graph_set.py
@@ -0,0 +1,24 @@
 import typing as _typing
 from ._dataset import InMemoryDataset
 from ..graph import GeneralStaticGraph


 class InMemoryStaticGraphSet(InMemoryDataset[GeneralStaticGraph]):
    def __init__(
            self, graphs: _typing.Iterable[GeneralStaticGraph],
            train_index: _typing.Optional[_typing.Iterable[int]] = ...,
            val_index: _typing.Optional[_typing.Iterable[int]] = ...,
            test_index: _typing.Optional[_typing.Iterable[int]] = ...
    ):
        super(InMemoryStaticGraphSet, self).__init__(
            graphs, train_index, val_index, test_index
        )

    def __iter__(self) -> _typing.Iterator[GeneralStaticGraph]:
        return super(InMemoryStaticGraphSet, self).__iter__()

    def __getitem__(self, index: int) -> GeneralStaticGraph:
        return super(InMemoryStaticGraphSet, self).__getitem__(index)

    def __setitem__(self, index: int, data: GeneralStaticGraph):
        super(InMemoryStaticGraphSet, self).__setitem__(index, data)
--- a/autogl/data/dataset.py
+++ b/autogl/data/dataset.py
@@ -1,134 +0,0 @@
 import collections
 import os.path as osp

 import torch.utils.data

 from .makedirs import makedirs


 def to_list(x):
    if not isinstance(x, collections.Iterable) or isinstance(x, str):
        x = [x]
    return x


 def files_exist(files):
    return all([osp.exists(f) for f in files])


 class Dataset(torch.utils.data.Dataset):
    r"""Dataset base class for creating graph datasets.
    See `here <https://rusty1s.github.io/pycogdl/build/html/notes/
    create_dataset.html>`__ for the accompanying tutorial.

    Args:
        root (string): Root directory where the dataset should be saved.
        transform (callable, optional): A function/transform that takes in an
            :obj:`cogdl.data.Data` object and returns a transformed
            version. The data object will be transformed before every access.
            (default: :obj:`None`)
        pre_transform (callable, optional): A function/transform that takes in
            an :obj:`cogdl.data.Data` object and returns a
            transformed version. The data object will be transformed before
            being saved to disk. (default: :obj:`None`)
        pre_filter (callable, optional): A function that takes in an
            :obj:`cogdl.data.Data` object and returns a boolean
            value, indicating whether the data object should be included in the
            final dataset. (default: :obj:`None`)
    """

    @property
    def raw_file_names(self):
        r"""The name of the files to find in the :obj:`self.raw_dir` folder in
        order to skip the download."""
        raise NotImplementedError

    @property
    def processed_file_names(self):
        r"""The name of the files to find in the :obj:`self.processed_dir`
        folder in order to skip the processing."""
        raise NotImplementedError

    def download(self):
        r"""Downloads the dataset to the :obj:`self.raw_dir` folder."""
        raise NotImplementedError

    def process(self):
        r"""Processes the dataset to the :obj:`self.processed_dir` folder."""
        raise NotImplementedError

    def __len__(self):
        r"""The number of examples in the dataset."""
        raise NotImplementedError

    def get(self, idx):
        r"""Gets the data object at index :obj:`idx`."""
        raise NotImplementedError

    def __init__(self, root, transform=None, pre_transform=None, pre_filter=None):
        super(Dataset, self).__init__()

        self.root = osp.expanduser(osp.normpath(root))
        self.raw_dir = osp.join(self.root, "raw")
        self.processed_dir = osp.join(self.root, "processed")
        self.transform = transform
        self.pre_transform = pre_transform
        self.pre_filter = pre_filter

        self._download()
        self._process()

    @property
    def get_label_number(self):
        r"""Get the number of labels in this dataset as dict."""
        label_num = {}
        labels = self[0].y.unique().cpu().detach().numpy().tolist()
        for label in labels:
            label_num[label] = (self[0].y == label).sum().item()
        return label_num

    @property
    def num_features(self):
        r"""Returns the number of features per node in the graph."""
        return self[0].num_features

    @property
    def raw_paths(self):
        r"""The filepaths to find in order to skip the download."""
        files = to_list(self.raw_file_names)
        return [osp.join(self.raw_dir, f) for f in files]

    @property
    def processed_paths(self):
        r"""The filepaths to find in the :obj:`self.processed_dir`
        folder in order to skip the processing."""
        files = to_list(self.processed_file_names)
        return [osp.join(self.processed_dir, f) for f in files]

    def _download(self):
        if files_exist(self.raw_paths):  # pragma: no cover
            return

        makedirs(self.raw_dir)
        self.download()

    def _process(self):
        if files_exist(self.processed_paths):  # pragma: no cover
            return

        print("Processing...")

        makedirs(self.processed_dir)
        self.process()

        print("Done!")

    def __getitem__(self, idx):  # pragma: no cover
        r"""Gets the data object at index :obj:`idx` and transforms it (in case
        a :obj:`self.transform` is given)."""
        data = self.get(idx)
        data = data if self.transform is None else self.transform(data)
        return data

    def __repr__(self):  # pragma: no cover
        return "{}({})".format(self.__class__.__name__, len(self))
--- a/autogl/data/graph/init.py
+++ b/autogl/data/graph/init.py
@@ -0,0 +1,4 @@
 from ._general_static_graph import (
   GeneralStaticGraph, GeneralStaticGraphGenerator
 )
 from . import utils
--- a/autogl/data/graph/_general_static_graph/init.py
+++ b/autogl/data/graph/_general_static_graph/init.py
@@ -0,0 +1,2 @@
 from ._general_static_graph import GeneralStaticGraph
 from ._general_static_graph_generator import GeneralStaticGraphGenerator
--- a/autogl/data/graph/_general_static_graph/_abstract_views.py
+++ b/autogl/data/graph/_general_static_graph/_abstract_views.py
@@ -0,0 +1,162 @@
 import torch
 import typing as _typing
 from . import _canonical_edge_type


 class SpecificTypedNodeDataView(_typing.MutableMapping[str, torch.Tensor]):
    def __getitem__(self, data_key: str) -> torch.Tensor:
        raise NotImplementedError

    def __setitem__(self, data_key: str, value: torch.Tensor):
        raise NotImplementedError

    def __delitem__(self, data_key: str) -> None:
        raise NotImplementedError

    def __len__(self) -> int:
        raise NotImplementedError

    def __iter__(self) -> _typing.Iterator[str]:
        raise NotImplementedError


 class SpecificTypedNodeView:
    @property
    def data(self) -> SpecificTypedNodeDataView:
        raise NotImplementedError

    @data.setter
    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
        raise NotImplementedError


 class HeterogeneousNodeView(_typing.Iterable[str]):
    @property
    def data(self) -> SpecificTypedNodeDataView:
        raise NotImplementedError

    @data.setter
    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
        raise NotImplementedError

    def __getitem__(self, node_type: _typing.Optional[str]) -> SpecificTypedNodeView:
        raise NotImplementedError

    def __setitem__(
            self, node_t: _typing.Optional[str],
            nodes_data: _typing.Mapping[str, torch.Tensor]
    ):
        raise NotImplementedError

    def __delitem__(self, node_t: _typing.Optional[str]):
        raise NotImplementedError

    def __iter__(self) -> _typing.Iterator[str]:
        raise NotImplementedError

    @property
    def is_homogeneous(self) -> bool:
        raise NotImplementedError


 class HomogeneousEdgesDataView(_typing.MutableMapping[str, torch.Tensor]):
    def __getitem__(self, data_key: str) -> torch.Tensor:
        raise NotImplementedError

    def __setitem__(self, data_key: str, value: torch.Tensor):
        raise NotImplementedError

    def __delitem__(self, data_key: str):
        raise NotImplementedError

    def __len__(self) -> int:
        raise NotImplementedError

    def __iter__(self) -> _typing.Iterator[str]:
        raise NotImplementedError


 class HomogeneousEdgesView:
    @property
    def connections(self) -> torch.LongTensor:
        raise NotImplementedError

    @property
    def data(self) -> HomogeneousEdgesDataView:
        raise NotImplementedError


 class HeterogeneousEdgesView(_typing.Collection[_canonical_edge_type.CanonicalEdgeType]):
    @property
    def connections(self) -> torch.LongTensor:
        raise NotImplementedError

    @property
    def data(self) -> HomogeneousEdgesDataView:
        raise NotImplementedError

    @property
    def is_homogeneous(self) -> bool:
        raise NotImplementedError

    def set(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str]],
            connections: torch.LongTensor, data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ):
        raise NotImplementedError

    def __getitem__(
            self,
            edge_t: _typing.Union[
                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
            ]
    ) -> HomogeneousEdgesView:
        raise NotImplementedError

    def __setitem__(
            self,
            edge_t: _typing.Union[
                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
            ],
            edges: _typing.Union[torch.LongTensor]
    ):
        raise NotImplementedError

    def __delitem__(
            self,
            edge_t: _typing.Union[
                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
            ]
    ):
        raise NotImplementedError

    def __len__(self) -> int:
        raise NotImplementedError

    def __iter__(self) -> _typing.Iterator[_canonical_edge_type.CanonicalEdgeType]:
        raise NotImplementedError

    def __contains__(
            self,
            edge_type: _typing.Union[
                str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
            ]
    ) -> bool:
        raise NotImplementedError


 class GraphDataView(_typing.MutableMapping[str, torch.Tensor]):
    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
        raise NotImplementedError

    def __delitem__(self, data_key: str) -> None:
        raise NotImplementedError

    def __getitem__(self, data_key: str) -> torch.Tensor:
        raise NotImplementedError

    def __len__(self) -> int:
        raise NotImplementedError

    def __iter__(self) -> _typing.Iterator[str]:
        raise NotImplementedError
--- a/autogl/data/graph/_general_static_graph/_canonical_edge_type.py
+++ b/autogl/data/graph/_general_static_graph/_canonical_edge_type.py
@@ -0,0 +1,56 @@
 import typing as _typing


 class CanonicalEdgeType(_typing.Sequence[str]):
    def __init__(self, source_node_type: str, relation_type: str, target_node_type: str):
        if not isinstance(source_node_type, str):
            raise TypeError
        elif ' ' in source_node_type:
            raise ValueError
        if not isinstance(relation_type, str):
            raise TypeError
        elif ' ' in relation_type:
            raise ValueError
        if not isinstance(target_node_type, str):
            raise TypeError
        elif ' ' in target_node_type:
            raise ValueError
        self.__source_node_type: str = source_node_type
        self.__relation_type: str = relation_type
        self.__destination_node_type: str = target_node_type

    @property
    def source_node_type(self) -> str:
        return self.__source_node_type

    @property
    def relation_type(self) -> str:
        return self.__relation_type

    @property
    def target_node_type(self) -> str:
        return self.__destination_node_type

    def __eq__(self, other):
        if not (isinstance(other, CanonicalEdgeType) or isinstance(other, _typing.Sequence)):
            return False
        elif isinstance(other, _typing.Sequence):
            if not (len(other) == 3 and all([(isinstance(t, str) and ' ' not in t) for t in other])):
                raise TypeError
            return (
                    other[0] == self.source_node_type and
                    other[1] == self.relation_type and
                    other[2] == self.target_node_type
            )
        elif isinstance(other, CanonicalEdgeType):
            return (
                    other.source_node_type == self.source_node_type and
                    other.relation_type == self.relation_type and
                    other.target_node_type == self.target_node_type
            )

    def __getitem__(self, index: int):
        return (self.source_node_type, self.relation_type, self.target_node_type)[index]

    def __len__(self) -> int:
        return 3
--- a/autogl/data/graph/_general_static_graph/_general_static_graph.py
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph.py
@@ -0,0 +1,15 @@
 from . import _abstract_views


 class GeneralStaticGraph:
    @property
    def nodes(self) -> _abstract_views.HeterogeneousNodeView:
        raise NotImplementedError

    @property
    def edges(self) -> _abstract_views.HeterogeneousEdgesView:
        raise NotImplementedError

    @property
    def data(self) -> _abstract_views.GraphDataView:
        raise NotImplementedError
--- a/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph_default_implementation.py
@@ -0,0 +1,940 @@
 import pandas as pd
 import torch
 import typing as _typing
 from . import (
    _abstract_views,
    _canonical_edge_type,
    _general_static_graph
 )


 class HeterogeneousNodesContainer:
    @property
    def node_types(self) -> _typing.AbstractSet[str]:
        raise NotImplementedError

    def remove_nodes(self, node_t: _typing.Optional[str]) -> 'HeterogeneousNodesContainer':
        raise NotImplementedError

    def reset_nodes(
            self, node_t: _typing.Optional[str],
            nodes_data: _typing.Mapping[str, torch.Tensor]
    ) -> 'HeterogeneousNodesContainer':
        raise NotImplementedError

    def set_data(
            self, node_t: _typing.Optional[str], data_key: str, data: torch.Tensor
    ) -> 'HeterogeneousNodesContainer':
        raise NotImplementedError

    def get_data(
            self, node_t: _typing.Optional[str] = ...,
            data_key: _typing.Optional[str] = ...
    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
        raise NotImplementedError

    def delete_data(
            self, node_t: _typing.Optional[str], data_key: str
    ) -> 'HeterogeneousNodesContainer':
        raise TypeError

    def remove_data(
            self, node_t: _typing.Optional[str], data_key: str
    ) -> 'HeterogeneousNodesContainer':
        return self.delete_data(node_t, data_key)


 class HeterogeneousNodesContainerImplementation(HeterogeneousNodesContainer):
    def __init__(self, data: _typing.Optional[_typing.Mapping[str, _typing.Mapping[str, torch.Tensor]]] = ...):
        self.__nodes_data: _typing.MutableMapping[str, _typing.MutableMapping[str, torch.Tensor]] = {}
        if data not in (None, Ellipsis) and isinstance(data, _typing.Mapping):
            for node_t, nodes_data in data.items():
                self.reset_nodes(node_t, nodes_data)

    @property
    def node_types(self) -> _typing.AbstractSet[str]:
        return self.__nodes_data.keys()

    def remove_nodes(self, node_t: _typing.Optional[str]) -> HeterogeneousNodesContainer:
        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
            raise TypeError
        elif node_t in (Ellipsis, None):
            if len(self.node_types) == 0:
                return self
            elif len(self.node_types) == 1:
                del self.__nodes_data[tuple(self.node_types)[0]]
            else:
                _error_message: str = ' '.join((
                    "Unable to determine node type automatically,",
                    "possible cause is that the graph contains heterogeneous nodes,",
                    "node type must be specified for graph containing heterogeneous nodes."
                ))
                raise TypeError(_error_message)
        elif isinstance(node_t, str):
            try:
                del self.__nodes_data[node_t]
            except Exception:
                raise ValueError(f"nodes with type [{node_t}] NOT exists")
        return self

    def reset_nodes(
            self, node_t: _typing.Optional[str],
            nodes_data: _typing.Mapping[str, torch.Tensor]
    ) -> HeterogeneousNodesContainer:
        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
            raise TypeError
        elif node_t in (Ellipsis, None) and len(self.node_types) > 1:
            _error_message: str = ' '.join((
                "Unable to determine node type automatically,",
                "possible cause is that the graph contains heterogeneous nodes,",
                "node type must be specified for graph containing heterogeneous nodes."
            ))
            raise TypeError(_error_message)
        elif isinstance(node_t, str) and ' ' in node_t:
            raise ValueError("node type must NOT contain space character (\' \').")
        __node_t: str = "" if node_t is Ellipsis else node_t

        num_nodes: int = ...
        for data_key, data_item in nodes_data.items():
            if not isinstance(data_key, str):
                raise TypeError
            if ' ' in data_key:
                raise ValueError("data key must NOT contain space character (\' \').")
            if not isinstance(data_item, torch.Tensor):
                raise TypeError
            if not data_item.dim() > 0:
                raise ValueError(
                    "data item MUST have at least one dimension, "
                    "and the first dimension corresponds to data for diverse nodes."
                )
            if not isinstance(num_nodes, int):
                num_nodes: int = data_item.size(0)
            if data_item.size(0) != num_nodes:
                raise ValueError
            self.__nodes_data[__node_t] = dict(nodes_data)
        return self

    def set_data(
            self, node_t: _typing.Optional[str], data_key: str, data: torch.Tensor
    ) -> HeterogeneousNodesContainer:
        if node_t in (Ellipsis, None):
            if len(self.node_types) == 0:
                __node_t: str = ""  # Default node type for homogeneous graph
            elif len(self.node_types) == 1:
                __node_t: str = list(self.node_types)[0]
            else:
                _error_message: str = ' '.join((
                    "Unable to determine node type automatically,",
                    "possible cause is that the graph contains heterogeneous nodes,",
                    "node type must be specified for graph containing heterogeneous nodes."
                ))
                raise TypeError(_error_message)
        elif isinstance(node_t, str):
            __node_t: str = node_t
        else:
            raise TypeError
        if not isinstance(data_key, str):
            raise TypeError
        if not isinstance(data, torch.Tensor):
            raise TypeError
        if ' ' in __node_t:
            raise ValueError
        if ' ' in data_key:
            raise ValueError
        if not data.dim() > 0:
            raise ValueError(
                "data item MUST have at least one dimension, "
                "and the first dimension corresponds to data for diverse nodes."
            )
        if __node_t not in self.node_types:
            self.__nodes_data[__node_t] = dict([(data_key, data)])
        else:
            obsolete_data: _typing.Optional[torch.Tensor] = self.__nodes_data[__node_t].get(data_key)
            if obsolete_data is not None and isinstance(obsolete_data, torch.Tensor):
                if data.size(0) != obsolete_data.size(0):
                    raise ValueError
            elif len(self.__nodes_data.get(__node_t)) > 0:
                num_nodes: int = self.__nodes_data[__node_t][list(self.__nodes_data[__node_t].keys())[0]].size(0)
                if data.size(0) != num_nodes:
                    raise ValueError
            self.__nodes_data[__node_t][data_key] = data
        return self

    def __get_data_for_specific_node_type(
            self, node_t: str, data_key: _typing.Optional[str] = ...
    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
        if not isinstance(node_t, str):
            raise TypeError
        elif ' ' in node_t:
            raise ValueError
        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
            raise TypeError
        elif isinstance(data_key, str) and ' ' in data_key:
            raise ValueError
        if node_t not in self.node_types:
            raise ValueError("Node type NOT exists")
        elif isinstance(data_key, str):
            data: _typing.Optional[torch.Tensor] = self.__nodes_data[node_t].get(data_key)
            if data is not None:
                return data
            else:
                raise KeyError(
                    f"Data with key [{data_key}] NOT exists "
                    f"for nodes with specific type [{node_t}]"
                )
        else:
            return self.__nodes_data[node_t]

    def __get_data_for_specific_data_key(
            self, data_key: str, node_t: _typing.Optional[str] = ...
    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError
        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
            raise TypeError
        elif isinstance(node_t, str) and ' ' in node_t:
            raise ValueError
        if isinstance(node_t, str):
            if node_t not in self.node_types:
                raise ValueError("Node type NOT exists")
            else:
                data: _typing.Optional[torch.Tensor] = (
                    self.__nodes_data[node_t].get(data_key)
                )
                if data is not None:
                    return data
                else:
                    raise KeyError(
                        f"Data with key [{data_key}] NOT exists "
                        f"for nodes with specific type [{node_t}]"
                    )
        else:
            if len(self.node_types) == 0:
                raise RuntimeError("Unable to get data from empty graph")
            elif len(self.node_types) == 1:
                __node_t: str = tuple(self.node_types)[0]
                __optional_data: _typing.Optional[torch.Tensor] = (
                    self.__nodes_data[__node_t].get(data_key)
                )
                if __optional_data is not None:
                    return __optional_data
                else:
                    raise KeyError(f"Data with key [{data_key}] NOT exists")
            else:
                __result: _typing.Dict[str, torch.Tensor] = {}
                for __node_t, __nodes_data in self.__nodes_data.items():
                    __optional_data: _typing.Optional[torch.Tensor] = (
                        __nodes_data.get(data_key)
                    )
                    if (
                            __optional_data is not None and
                            isinstance(__optional_data, torch.Tensor)
                    ):
                        __result[__node_t] = __optional_data
                if len(__result):
                    return __result
                else:
                    raise KeyError(f"Data with key [{data_key}] NOT exists")

    def get_data(
            self, node_t: _typing.Optional[str] = ...,
            data_key: _typing.Optional[str] = ...
    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
            raise TypeError
        elif isinstance(node_t, str) and ' ' in node_t:
            raise ValueError
        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
            raise TypeError
        elif isinstance(data_key, str) and ' ' in data_key:
            raise ValueError
        if isinstance(node_t, str):
            return self.__get_data_for_specific_node_type(node_t, data_key)
        elif node_t in (Ellipsis, None) and isinstance(data_key, str):
            return self.__get_data_for_specific_data_key(data_key)
        elif node_t in (Ellipsis, None) and data_key in (Ellipsis, None):
            if len(self.node_types) == 1:
                __node_t: str = tuple(self.node_types)[0]
                return self.__get_data_for_specific_node_type(__node_t)
            else:
                raise TypeError(
                    "Unable to determine node type automatically, "
                    "possible cause is that the graph contains heterogeneous nodes or is empty, "
                    "node type must be specified for graph containing heterogeneous nodes."
                )

    def delete_data(
            self, node_t: _typing.Optional[str], data_key: str
    ) -> HeterogeneousNodesContainer:
        if not (node_t in (Ellipsis, None) or isinstance(node_t, str)):
            raise TypeError
        elif node_t in (Ellipsis, None):
            if len(self.node_types) == 1:
                __node_t: str = tuple(self.node_types)[0]
            else:
                raise TypeError(
                    "Unable to determine node type automatically, "
                    "possible cause is that the graph contains heterogeneous nodes or is empty, "
                    "node type must be specified for graph containing heterogeneous nodes."
                )
        elif isinstance(node_t, str):
            if node_t in self.node_types:
                __node_t: str = node_t
            else:
                raise ValueError("node type NOT exists")
        else:
            raise TypeError
        if not isinstance(data_key, str):
            raise TypeError
        elif data_key not in self.__nodes_data.get(__node_t):
            raise KeyError(
                f"Data with key [{data_key}] NOT exists for nodes with type [{__node_t}]"
            )
        else:
            self.__nodes_data[__node_t].__delitem__(data_key)
            if len(self.__nodes_data.get(__node_t)) == 0:
                del self.__nodes_data[__node_t]
        return self


 class _SpecificTypedNodeDataView(_abstract_views.SpecificTypedNodeDataView):
    def __init__(
            self, heterogeneous_nodes_container: HeterogeneousNodesContainer,
            node_type: _typing.Optional[str]
    ):
        if not isinstance(heterogeneous_nodes_container, HeterogeneousNodesContainer):
            raise TypeError
        else:
            self._heterogeneous_nodes_container: HeterogeneousNodesContainer = (
                heterogeneous_nodes_container
            )
        if not (isinstance(node_type, str) or node_type in (Ellipsis, None)):
            raise TypeError
        elif isinstance(node_type, str):
            if node_type not in self._heterogeneous_nodes_container.node_types:
                raise ValueError("Invalid node type")
        self.__node_t: _typing.Optional[str] = node_type

    def __getitem__(self, data_key: str) -> torch.Tensor:
        return self._heterogeneous_nodes_container.get_data(self.__node_t, data_key)

    def __setitem__(self, data_key: str, value: torch.Tensor):
        self._heterogeneous_nodes_container.set_data(self.__node_t, data_key, value)

    def __delitem__(self, data_key: str) -> None:
        self._heterogeneous_nodes_container.delete_data(self.__node_t, data_key)

    def __len__(self) -> int:
        return len(self._heterogeneous_nodes_container.get_data(self.__node_t))

    def __iter__(self) -> _typing.Iterator[str]:
        return iter(self._heterogeneous_nodes_container.get_data(self.__node_t))


 class _SpecificTypedNodeView(_abstract_views.SpecificTypedNodeView):
    def __init__(
            self, nodes_container: HeterogeneousNodesContainer,
            node_t: _typing.Optional[str]
    ):
        self._heterogeneous_nodes_container: HeterogeneousNodesContainer = nodes_container
        self.__node_t: _typing.Optional[str] = node_t

    @property
    def data(self) -> _SpecificTypedNodeDataView:
        return _SpecificTypedNodeDataView(self._heterogeneous_nodes_container, self.__node_t)

    @data.setter
    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
        self._heterogeneous_nodes_container.reset_nodes(self.__node_t, nodes_data)


 class _HeterogeneousNodeView(_abstract_views.HeterogeneousNodeView):
    def __init__(self, nodes_container: HeterogeneousNodesContainer):
        self._heterogeneous_nodes_container: HeterogeneousNodesContainer = nodes_container

    def __getitem__(self, node_type: _typing.Optional[str]) -> _SpecificTypedNodeView:
        return _SpecificTypedNodeView(self._heterogeneous_nodes_container, node_type)

    def __setitem__(
            self, node_t: _typing.Optional[str],
            nodes_data: _typing.Mapping[str, torch.Tensor]
    ) -> None:
        self._heterogeneous_nodes_container.reset_nodes(node_t, nodes_data)

    def __delitem__(self, node_t: _typing.Optional[str]):
        self._heterogeneous_nodes_container.remove_nodes(node_t)

    def __iter__(self) -> _typing.Iterator[str]:
        return iter(self._heterogeneous_nodes_container.node_types)

    @property
    def data(self) -> _SpecificTypedNodeDataView:
        return _SpecificTypedNodeDataView(self._heterogeneous_nodes_container, ...)

    @data.setter
    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
        self._heterogeneous_nodes_container.reset_nodes(..., nodes_data)

    @property
    def is_homogeneous(self) -> bool:
        return len(self._heterogeneous_nodes_container.node_types) <= 1


 class HomogeneousEdgesContainer:
    @property
    def connections(self) -> torch.Tensor:
        raise NotImplementedError

    @property
    def data_keys(self) -> _typing.Iterable[str]:
        raise NotImplementedError

    def get_data(
            self, data_key: _typing.Optional[str] = ...
    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
        raise NotImplementedError

    def set_data(self, data_key: str, data: torch.Tensor):
        raise NotImplementedError

    def delete_data(self, data_key: str):
        raise NotImplementedError


 class HomogeneousEdgesContainerImplementation(HomogeneousEdgesContainer):
    def __init__(
            self, edge_connections: torch.Tensor,
            data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ):
        if not isinstance(edge_connections, torch.Tensor):
            raise TypeError
        if not (data in (Ellipsis, None) or isinstance(data, _typing.Mapping)):
            raise TypeError
        if not (
                edge_connections.dtype == torch.int64 and
                edge_connections.dim() == edge_connections.size(0) == 2
        ):
            raise ValueError
        self.__connections: torch.Tensor = edge_connections
        if not isinstance(data, _typing.Mapping):
            self.__data: _typing.MutableMapping[str, torch.Tensor] = {}
        else:
            for data_key, data_item in data.items():
                if not isinstance(data_key, str):
                    raise TypeError
                if not isinstance(data_item, torch.Tensor):
                    raise TypeError
                if ' ' in data_key:
                    raise ValueError
                if not data_item.dim() > 0:
                    raise ValueError
                if data_item.size(0) != self.__connections.size(1):
                    raise ValueError
            self.__data: _typing.MutableMapping[str, torch.Tensor] = dict(data)

    @property
    def connections(self) -> torch.Tensor:
        return self.__connections

    @property
    def data_keys(self) -> _typing.Iterable[str]:
        return self.__data.keys()

    def set_data(self, data_key: str, data: torch.Tensor) -> HomogeneousEdgesContainer:
        if not isinstance(data_key, str):
            raise TypeError
        if not isinstance(data, torch.Tensor):
            raise TypeError
        if ' ' in data_key:
            raise ValueError
        if data.dim() == 0 or data.size(0) != self.__connections.size(1):
            raise ValueError
        self.__data[data_key] = data
        return self

    def get_data(
            self, data_key: _typing.Optional[str] = ...
    ) -> _typing.Union[torch.Tensor, _typing.Mapping[str, torch.Tensor]]:
        if not (data_key in (Ellipsis, None) or isinstance(data_key, str)):
            raise TypeError
        if isinstance(data_key, str):
            if ' ' in data_key:
                raise ValueError
            temp: _typing.Optional[torch.Tensor] = self.__data.get(data_key)
            if temp is None:
                raise KeyError(f"Data with key [{data_key}] NOT exists")
            else:
                return temp
        else:
            return dict(self.__data)

    def delete_data(self, data_key: str) -> HomogeneousEdgesContainer:
        if not isinstance(data_key, str):
            raise TypeError
        if ' ' in data_key:
            raise ValueError
        try:
            del self.__data[data_key]
        finally:
            return self


 class HeterogeneousEdgesAggregation(
    _typing.MutableMapping[
        _typing.Union[str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
        HomogeneousEdgesContainer
    ]
 ):
    def __setitem__(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
            edges: _typing.Union[HomogeneousEdgesContainer, torch.LongTensor]
    ) -> None:
        self._set_edges(edge_t, edges)

    def __delitem__(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]
    ) -> None:
        self._delete_edges(edge_t)

    def __getitem__(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType] = ...
    ) -> HomogeneousEdgesContainer:
        return self._get_edges(edge_t)

    def __len__(self) -> int:
        return len(list(self._edge_types))

    def __iter__(self) -> _typing.Iterator[_canonical_edge_type.CanonicalEdgeType]:
        return iter(self._edge_types)

    @property
    def _edge_types(self) -> _typing.Iterable[_canonical_edge_type.CanonicalEdgeType]:
        raise NotImplementedError

    def _get_edges(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType] = ...
    ) -> HomogeneousEdgesContainer:
        raise NotImplementedError

    def _set_edges(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
            edges: _typing.Union[HomogeneousEdgesContainer, torch.LongTensor]
    ):
        raise NotImplementedError

    def _delete_edges(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]
    ) -> None:
        raise NotImplementedError


 class HeterogeneousEdgesAggregationImplementation(HeterogeneousEdgesAggregation):
    def __init__(self):
        self.__heterogeneous_edges_data_frame: pd.DataFrame = pd.DataFrame(
            columns=('s', 'r', 't', 'edges'),
        )

    @property
    def _edge_types(self) -> _typing.Iterable[_canonical_edge_type.CanonicalEdgeType]:
        return [
            _canonical_edge_type.CanonicalEdgeType(getattr(row_tuple, 's'), getattr(row_tuple, 'r'), getattr(row_tuple, 't'))
            for row_tuple in self.__heterogeneous_edges_data_frame.itertuples(False, name="Edge")
        ]

    def _get_edges(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType] = ...
    ) -> HomogeneousEdgesContainer:
        if edge_t in (Ellipsis, None):
            if len(self.__heterogeneous_edges_data_frame) == 1:
                return self.__heterogeneous_edges_data_frame.iloc[0]['edges']
            else:
                raise RuntimeError  # Undetermined
        elif isinstance(edge_t, str):
            if ' ' in edge_t:
                raise ValueError
            if len(
                    self.__heterogeneous_edges_data_frame.loc[
                        self.__heterogeneous_edges_data_frame['r'] == edge_t
                    ]
            ) != 1:
                raise ValueError  # todo: Unable to determine
            else:
                temp: HomogeneousEdgesContainer = self.__heterogeneous_edges_data_frame.loc[
                    self.__heterogeneous_edges_data_frame['r'] == edge_t, 'edges'
                ]
                if not isinstance(temp, HomogeneousEdgesContainer):
                    raise RuntimeError
                else:
                    return temp
        elif isinstance(edge_t, _typing.Tuple) or isinstance(edge_t, _canonical_edge_type.CanonicalEdgeType):
            if isinstance(edge_t, _typing.Tuple) and not (
                    len(edge_t) == 3 and
                    isinstance(edge_t[0], str) and
                    isinstance(edge_t[1], str) and
                    isinstance(edge_t[2], str) and
                    ' ' not in edge_t[0] and ' ' not in edge_t[1] and ' ' not in edge_t[2]
            ):
                raise TypeError("Illegal canonical edge type")
            __edge_t: _typing.Tuple[str, str, str] = (
                (edge_t.source_node_type, edge_t.relation_type, edge_t.target_node_type)
                if isinstance(edge_t, _canonical_edge_type.CanonicalEdgeType) else edge_t
            )
            partial_data_frame: pd.DataFrame = self.__heterogeneous_edges_data_frame.loc[
                (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
                (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
                (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
                ]
            if len(partial_data_frame) == 0:
                raise ValueError
            elif len(partial_data_frame) == 1:
                temp: HomogeneousEdgesContainer = partial_data_frame.iloc[0]['edges']
                if not isinstance(temp, HomogeneousEdgesContainer):
                    raise RuntimeError
                else:
                    return temp
            else:
                raise RuntimeError

    def _set_edges(
            self,
            edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
            edges: _typing.Union[HomogeneousEdgesContainer, torch.LongTensor]
    ):
        if not (isinstance(edges, HomogeneousEdgesContainer) or isinstance(edges, torch.Tensor)):
            raise TypeError
        if edge_t in (Ellipsis, None):
            if len(self.__heterogeneous_edges_data_frame) == 0:
                self.__heterogeneous_edges_data_frame: pd.DataFrame = (
                    self.__heterogeneous_edges_data_frame.append(
                        pd.DataFrame(
                            {
                                's': [''], 'r': [''], 't': [''],
                                'edges': [
                                    edges if isinstance(edges, HomogeneousEdgesContainer)
                                    else HomogeneousEdgesContainerImplementation(edges)
                                ]
                            }
                        )
                    )
                )
            elif len(self.__heterogeneous_edges_data_frame) == 1:
                self.__heterogeneous_edges_data_frame.iloc[0]['edges'] = (
                    edges if isinstance(edges, HomogeneousEdgesContainer)
                    else HomogeneousEdgesContainerImplementation(edges)
                )
            else:
                raise RuntimeError  # todo: Unable to determine error
        elif isinstance(edge_t, str):
            if ' ' in edge_t:
                raise ValueError
            if len(
                    self.__heterogeneous_edges_data_frame.loc[
                        self.__heterogeneous_edges_data_frame['r'] == edge_t
                    ]
            ) == 1:
                self.__heterogeneous_edges_data_frame.loc[
                    self.__heterogeneous_edges_data_frame['r'] == edge_t, 'edges'
                ] = (
                    edges if isinstance(edges, HomogeneousEdgesContainer)
                    else HomogeneousEdgesContainerImplementation(edges)
                )
            else:
                raise RuntimeError
        elif isinstance(edge_t, _typing.Tuple) or isinstance(edge_t, _canonical_edge_type.CanonicalEdgeType):
            if isinstance(edge_t, _typing.Tuple) and not (
                    len(edge_t) == 3 and
                    isinstance(edge_t[0], str) and
                    isinstance(edge_t[1], str) and
                    isinstance(edge_t[2], str) and
                    ' ' not in edge_t[0] and ' ' not in edge_t[1] and ' ' not in edge_t[2]
            ):
                raise TypeError("Illegal canonical edge type")
            __edge_t: _typing.Tuple[str, str, str] = (
                (edge_t.source_node_type, edge_t.relation_type, edge_t.target_node_type)
                if isinstance(edge_t, _canonical_edge_type.CanonicalEdgeType) else edge_t
            )
            if len(
                    self.__heterogeneous_edges_data_frame.loc[
                        (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
                        (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
                        (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
                    ]
            ) == 0:
                self.__heterogeneous_edges_data_frame: pd.DataFrame = (
                    self.__heterogeneous_edges_data_frame.append(
                        pd.DataFrame(
                            {
                                's': [__edge_t[0]],
                                'r': [__edge_t[1]],
                                't': [__edge_t[2]],
                                'edges': [
                                    edges if isinstance(edges, HomogeneousEdgesContainer)
                                    else HomogeneousEdgesContainerImplementation(edges)
                                ]
                            }
                        )
                    )
                )
            elif len(
                    self.__heterogeneous_edges_data_frame.loc[
                        (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
                        (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
                        (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2])
                    ]
            ) == 1:
                self.__heterogeneous_edges_data_frame.loc[
                    (self.__heterogeneous_edges_data_frame['s'] == __edge_t[0]) &
                    (self.__heterogeneous_edges_data_frame['r'] == __edge_t[1]) &
                    (self.__heterogeneous_edges_data_frame['t'] == __edge_t[2]),
                    'edges'
                ] = (
                    edges if isinstance(edges, HomogeneousEdgesContainer)
                    else HomogeneousEdgesContainerImplementation(edges)
                )
            else:
                raise RuntimeError  # todo: Unable to determine error
        else:
            raise RuntimeError

    def _delete_edges(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType] = ...
    ) -> None:
        if edge_t in (Ellipsis, None):
            if len(self.__heterogeneous_edges_data_frame) == 1:
                self.__heterogeneous_edges_data_frame.drop(
                    self.__heterogeneous_edges_data_frame.index[0], inplace=True
                )
            elif len(self.__heterogeneous_edges_data_frame) > 1:
                raise ValueError("Edge Type must be specified for graph containing heterogeneous edges")
        raise NotImplementedError  # todo: Complete this function


 class _HomogeneousEdgesDataView(_abstract_views.HomogeneousEdgesDataView):
    def __init__(self, homogeneous_edges_container: HomogeneousEdgesContainer):
        if not isinstance(homogeneous_edges_container, HomogeneousEdgesContainer):
            raise TypeError
        self._homogeneous_edges_container: HomogeneousEdgesContainer = homogeneous_edges_container

    def __getitem__(self, data_key: str) -> torch.Tensor:
        if not isinstance(data_key, str):
            raise TypeError
        if ' ' in data_key:
            raise ValueError
        return self._homogeneous_edges_container.get_data(data_key)

    def __setitem__(self, data_key: str, data: torch.Tensor):
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError
        if not isinstance(data, torch.Tensor):
            raise TypeError
        elif not data.dim() > 0:
            raise ValueError
        self._homogeneous_edges_container.set_data(data_key, data)

    def __delitem__(self, data_key: str):
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError
        self._homogeneous_edges_container.delete_data(data_key)

    def __len__(self):
        return len(list(self._homogeneous_edges_container.data_keys))

    def __iter__(self) -> _typing.Iterator[str]:
        return iter(self._homogeneous_edges_container.data_keys)


 class _SpecificTypedHomogeneousEdgesView(_abstract_views.HomogeneousEdgesView):
    def __init__(self, homogeneous_edges_container: HomogeneousEdgesContainer):
        if not isinstance(homogeneous_edges_container, HomogeneousEdgesContainer):
            raise TypeError
        self._homogeneous_edges_container: HomogeneousEdgesContainer = homogeneous_edges_container

    @property
    def connections(self) -> torch.Tensor:
        return self._homogeneous_edges_container.connections

    @property
    def data(self) -> _HomogeneousEdgesDataView:
        return _HomogeneousEdgesDataView(self._homogeneous_edges_container)


 class _HeterogeneousEdgesView(_abstract_views.HeterogeneousEdgesView):
    def __init__(self, _heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation):
        if not isinstance(_heterogeneous_edges_aggregation, HeterogeneousEdgesAggregation):
            raise TypeError
        self._heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation = (
            _heterogeneous_edges_aggregation
        )

    def __getitem__(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]
    ) -> _SpecificTypedHomogeneousEdgesView:
        return _SpecificTypedHomogeneousEdgesView(self._heterogeneous_edges_aggregation[edge_t])

    def __setitem__(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType],
            edges: _typing.Union[HomogeneousEdgesContainer, torch.LongTensor]
    ):
        self._heterogeneous_edges_aggregation[edge_t] = edges

    def __delitem__(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]
    ):
        del self._heterogeneous_edges_aggregation[edge_t]

    def __len__(self) -> int:
        return len(self._heterogeneous_edges_aggregation)

    def __iter__(self) -> _typing.Iterator[_canonical_edge_type.CanonicalEdgeType]:
        return iter(self._heterogeneous_edges_aggregation)

    def __contains__(self, edge_type: _typing.Union[str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType]) -> bool:
        if isinstance(edge_type, str):
            if ' ' in edge_type:
                raise ValueError
            else:
                for existing_edge_type in self:
                    if existing_edge_type.relation_type == edge_type:
                        return True
                return False
        elif isinstance(edge_type, _typing.Tuple):
            if not (
                    len(edge_type) == 3 and
                    all([(isinstance(t, str) and ' ' not in t) for t in edge_type])
            ):
                raise TypeError
            else:
                for existing_edge_type in self:
                    if existing_edge_type.__eq__(edge_type):
                        return True
                return False
        elif isinstance(edge_type, _canonical_edge_type.CanonicalEdgeType):
            for existing_edge_type in self:
                if existing_edge_type == edge_type:
                    return True
            return False
        else:
            raise TypeError

    @property
    def connections(self) -> torch.Tensor:
        return self[...].connections

    @property
    def data(self) -> _HomogeneousEdgesDataView:
        return self[...].data

    @property
    def is_homogeneous(self) -> bool:
        return len(self) <= 1

    def set(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str]],
            connections: torch.LongTensor, data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ):
        self[edge_t] = HomogeneousEdgesContainerImplementation(connections, data)


 class _StaticGraphDataContainer(_typing.MutableMapping[str, torch.Tensor]):
    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
        raise NotImplementedError

    def __delitem__(self, data_key: str) -> None:
        raise NotImplementedError

    def __getitem__(self, data_key: str) -> torch.Tensor:
        raise NotImplementedError

    def __len__(self) -> int:
        raise NotImplementedError

    def __iter__(self) -> _typing.Iterator[str]:
        raise NotImplementedError


 class StaticGraphDataAggregation(_StaticGraphDataContainer):
    def __init__(
            self, graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ):
        self.__data: _typing.MutableMapping[str, torch.Tensor] = (
            dict(graph_data) if isinstance(graph_data, _typing.Mapping)
            else {}
        )

    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
        self.__data[data_key] = data

    def __delitem__(self, data_key: str) -> None:
        del self.__data[data_key]

    def __getitem__(self, data_key: str) -> torch.Tensor:
        return self.__data[data_key]

    def __len__(self) -> int:
        return len(self.__data)

    def __iter__(self) -> _typing.Iterator[str]:
        return iter(self.__data)


 class _StaticGraphDataView(_abstract_views.GraphDataView):
    def __init__(self, graph_data_container: _StaticGraphDataContainer):
        self.__graph_data_container: _StaticGraphDataContainer = (
            graph_data_container
        )

    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
        self.__graph_data_container[data_key] = data

    def __delitem__(self, data_key: str) -> None:
        del self.__graph_data_container[data_key]

    def __getitem__(self, data_key: str) -> torch.Tensor:
        return self.__graph_data_container[data_key]

    def __len__(self) -> int:
        return len(self.__graph_data_container)

    def __iter__(self) -> _typing.Iterator[str]:
        return iter(self.__graph_data_container)


 class GeneralStaticGraphImplementation(_general_static_graph.GeneralStaticGraph):
    def __init__(
            self, _heterogeneous_nodes_container: _typing.Optional[HeterogeneousNodesContainer] = ...,
            _heterogeneous_edges_aggregation: _typing.Optional[HeterogeneousEdgesAggregation] = ...,
            graph_data_container: _typing.Optional[_StaticGraphDataContainer] = ...
    ):
        self._static_graph_data_container: _StaticGraphDataContainer = (
            graph_data_container
            if isinstance(graph_data_container, _StaticGraphDataContainer)
            else StaticGraphDataAggregation()
        )
        self._heterogeneous_nodes_container: HeterogeneousNodesContainer = (
            _heterogeneous_nodes_container
            if isinstance(_heterogeneous_nodes_container, HeterogeneousNodesContainer)
            else HeterogeneousNodesContainerImplementation()
        )
        self._heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation = (
            _heterogeneous_edges_aggregation
            if isinstance(_heterogeneous_edges_aggregation, HeterogeneousEdgesAggregation)
            else HeterogeneousEdgesAggregationImplementation()
        )

    @property
    def nodes(self) -> _HeterogeneousNodeView:
        return _HeterogeneousNodeView(self._heterogeneous_nodes_container)

    @property
    def edges(self) -> _HeterogeneousEdgesView:
        return _HeterogeneousEdgesView(self._heterogeneous_edges_aggregation)

    @property
    def data(self) -> _StaticGraphDataView:
        return _StaticGraphDataView(self._static_graph_data_container)
--- a/autogl/data/graph/_general_static_graph/_general_static_graph_dgl_implementation.py
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph_dgl_implementation.py
@@ -0,0 +1,651 @@
 import dgl
 import torch
 import typing as _typing
 from . import (
    _abstract_views,
    _canonical_edge_type,
    _general_static_graph
 )


 class _DGLGraphHolder:
    def __init__(self, dgl_graph: dgl.DGLGraph):
        if not isinstance(dgl_graph, dgl.DGLGraph):
            raise TypeError
        self.__graph: dgl.DGLGraph = dgl_graph

    @property
    def graph(self) -> dgl.DGLGraph:
        return self.__graph

    @graph.setter
    def graph(self, dgl_graph: dgl.DGLGraph):
        if not isinstance(dgl_graph, dgl.DGLGraph):
            raise TypeError
        else:
            self.__graph = dgl_graph


 class _SpecificTypedNodeDataView(_abstract_views.SpecificTypedNodeDataView):
    def __init__(
            self, dgl_graph_holder: _DGLGraphHolder,
            node_type: _typing.Optional[str] = ...
    ):
        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
            raise TypeError
        if not (node_type in (Ellipsis, None) or isinstance(node_type, str)):
            raise TypeError
        elif isinstance(node_type, str) and ' ' in node_type:
            raise ValueError("Illegal node type")
        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
        self.__optional_node_type: _typing.Optional[str] = (
            node_type if isinstance(node_type, str) else None
        )

    def __getitem__(self, data_key: str) -> torch.Tensor:
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError("Illegal data key")
        if isinstance(self.__optional_node_type, str):
            node_type: str = self.__optional_node_type
        else:
            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
                raise ValueError("the graph is empty")
            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
                raise ValueError(
                    "Unable to automatically determine node type, "
                    "the graph consists of heterogeneous node types"
                )
            else:
                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
        if data_key in self.__dgl_graph_holder.graph.nodes[node_type].data:
            return self.__dgl_graph_holder.graph.nodes[node_type].data[data_key]
        else:
            raise KeyError  # todo: Complete message

    def __setitem__(self, data_key: str, value: torch.Tensor):
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError("Illegal data key")
        if not isinstance(value, torch.Tensor):
            raise TypeError
        elif value.dim() == 0:
            raise ValueError
        if isinstance(self.__optional_node_type, str):
            node_type: str = self.__optional_node_type
        else:
            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
                raise ValueError("the graph is empty")
            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
                raise ValueError(
                    "Unable to automatically determine node type, "
                    "the graph consists of heterogeneous node types"
                )
            else:
                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
        if value.size(0) != self.__dgl_graph_holder.graph.num_nodes(node_type):
            raise ValueError  # todo: Complete error message
        else:
            # todo: 现在这个方法没有处理node_type不存在的情况
            self.__dgl_graph_holder.graph.nodes[node_type].data[data_key] = value

    def __delitem__(self, data_key: str) -> None:
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError("Illegal data key")
        if isinstance(self.__optional_node_type, str):
            node_type: str = self.__optional_node_type
        else:
            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
                raise ValueError("the graph is empty")
            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
                raise ValueError(
                    "Unable to automatically determine node type, "
                    "the graph consists of heterogeneous node types"
                )
            else:
                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
        if data_key in self.__dgl_graph_holder.graph.nodes[node_type].data:
            try:
                del self.__dgl_graph_holder.graph.nodes[node_type].data[data_key]
            except KeyError:
                pass  # todo: Use logger to warn

    def __len__(self) -> int:
        if isinstance(self.__optional_node_type, str):
            node_type: str = self.__optional_node_type
        else:
            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
                raise ValueError("the graph is empty")
            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
                raise ValueError(
                    "Unable to automatically determine node type, "
                    "the graph consists of heterogeneous node types"
                )
            else:
                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
        return len(self.__dgl_graph_holder.graph.nodes[node_type].data)

    def __iter__(self) -> _typing.Iterator[str]:
        if isinstance(self.__optional_node_type, str):
            node_type: str = self.__optional_node_type
        else:
            if len(self.__dgl_graph_holder.graph.ntypes) == 0:
                raise ValueError("the graph is empty")
            elif len(self.__dgl_graph_holder.graph.ntypes) > 1:
                raise ValueError(
                    "Unable to automatically determine node type, "
                    "the graph consists of heterogeneous node types"
                )
            else:
                node_type: str = self.__dgl_graph_holder.graph.ntypes[0]
        return iter(self.__dgl_graph_holder.graph.nodes[node_type].data)


 class _SpecificTypedNodeView(_abstract_views.SpecificTypedNodeView):
    def __init__(
            self, dgl_graph_holder: _DGLGraphHolder,
            node_type: _typing.Optional[str] = ...
    ):
        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
            raise TypeError
        if not (node_type in (Ellipsis, None) or isinstance(node_type, str)):
            raise TypeError
        elif isinstance(node_type, str) and ' ' in node_type:
            raise ValueError("Illegal node type")
        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
        self.__optional_node_type: _typing.Optional[str] = (
            node_type if isinstance(node_type, str) else None
        )

    @property
    def data(self) -> _SpecificTypedNodeDataView:
        return _SpecificTypedNodeDataView(
            self.__dgl_graph_holder, self.__optional_node_type
        )

    @data.setter
    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
        raise NotImplementedError  # todo: Currently, DGL not support this operation


 class _HeterogeneousNodeView(_abstract_views.HeterogeneousNodeView):
    def __init__(self, dgl_graph_holder: _DGLGraphHolder):
        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
            raise TypeError
        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder

    @property
    def data(self) -> _SpecificTypedNodeDataView:
        return _SpecificTypedNodeDataView(self.__dgl_graph_holder, ...)

    @data.setter
    def data(self, nodes_data: _typing.Mapping[str, torch.Tensor]):
        if not isinstance(nodes_data, _typing.Mapping):
            raise TypeError
        _SpecificTypedNodeView(self.__dgl_graph_holder, ...).data = nodes_data

    def __getitem__(self, node_type: _typing.Optional[str]) -> _SpecificTypedNodeView:
        if not (node_type in (Ellipsis, None) or isinstance(node_type, str)):
            raise TypeError
        elif isinstance(node_type, str) and ' ' in node_type:
            raise ValueError("Illegal edge type")
        return _SpecificTypedNodeView(self.__dgl_graph_holder, node_type)

    def __setitem__(
            self, node_type: _typing.Optional[str],
            nodes_data: _typing.Mapping[str, torch.Tensor]
    ):
        if not (node_type in (Ellipsis, None) or isinstance(node_type, str)):
            raise TypeError
        elif isinstance(node_type, str) and ' ' in node_type:
            raise ValueError("Illegal edge type")
        if not isinstance(nodes_data, _typing.Mapping):
            raise TypeError
        _SpecificTypedNodeView(
            self.__dgl_graph_holder, node_type if isinstance(node_type, str) else None
        ).data = nodes_data

    def __delitem__(self, node_t: _typing.Optional[str]):
        raise NotImplementedError  # todo: Currently, DGL not support this operation

    def __iter__(self) -> _typing.Iterator[str]:
        return iter(self.__dgl_graph_holder.graph.ntypes)

    @property
    def is_homogeneous(self) -> bool:
        return len(self.__dgl_graph_holder.graph.ntypes) <= 1


 class _HomogeneousEdgesDataView(_abstract_views.HomogeneousEdgesDataView):
    def __init__(
            self, dgl_graph_holder: _DGLGraphHolder,
            edge_type: _typing.Union[
                None, str, _typing.Tuple[str, str, str],
                _canonical_edge_type.CanonicalEdgeType
            ] = ...
    ):
        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
            raise TypeError
        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
        if edge_type in (Ellipsis, None):
            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = None
        elif isinstance(edge_type, str):
            if ' ' in edge_type:
                raise ValueError("Illegal edge type")
            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = edge_type
        elif isinstance(edge_type, _typing.Sequence) and not isinstance(edge_type, str):
            if not (
                    len(edge_type) == 3 and
                    isinstance(edge_type[0], str) and ' ' not in edge_type[0] and
                    isinstance(edge_type[1], str) and ' ' not in edge_type[1] and
                    isinstance(edge_type[2], str) and ' ' not in edge_type[2]
            ):
                raise ValueError("Illegal edge type")
            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = tuple(edge_type)
        elif isinstance(edge_type, _canonical_edge_type.CanonicalEdgeType):
            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = (
                edge_type.source_node_type, edge_type.relation_type, edge_type.target_node_type
            )
        else:
            raise TypeError

    def __get_canonical_edge_type(self) -> _typing.Tuple[str, str, str]:
        if self.__optional_edge_type in (Ellipsis, None):
            if len(self.__dgl_graph_holder.graph.canonical_etypes) == 0:
                raise ValueError("The graph is empty")
            elif len(self.__dgl_graph_holder.graph.canonical_etypes) > 1:
                raise ValueError(
                    "Unable to automatically determine edge type, "
                    "the graph consists of heterogeneous edge types."
                )
            else:
                return self.__dgl_graph_holder.graph.canonical_etypes[0]
        elif isinstance(self.__optional_edge_type, str):
            try:
                canonical_edge_type = self.__dgl_graph_holder.graph.to_canonical_etype(
                    self.__optional_edge_type
                )
            except dgl.DGLError as e:
                raise e
            else:
                return canonical_edge_type
        else:
            return self.__optional_edge_type

    def __getitem__(self, data_key: str) -> torch.Tensor:
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError("Illegal data key")
        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()

        found = False
        for et in self.__dgl_graph_holder.graph.canonical_etypes:
            if all([a == b for a, b in zip(et, edge_type)]):
                found = True
                break
        if not found:
            raise ValueError("edge type not exist")

        if data_key in self.__dgl_graph_holder.graph.edges[edge_type].data:
            return self.__dgl_graph_holder.graph.edges[edge_type].data[data_key]
        else:
            raise KeyError  # todo: Complete error message

    def __setitem__(self, data_key: str, value: torch.Tensor):
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError("Illegal data key")
        if not isinstance(value, torch.Tensor):
            raise TypeError
        if value.dim() == 0:
            raise ValueError
        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()

        found = False
        for et in self.__dgl_graph_holder.graph.canonical_etypes:
            if all([a == b for a, b in zip(et, edge_type)]):
                found = True
                break
        if not found:
            raise ValueError("edge type not exist")

        self.__dgl_graph_holder.graph.edges[edge_type].data[data_key] = value

    def __delitem__(self, data_key: str):
        if not isinstance(data_key, str):
            raise TypeError
        elif ' ' in data_key:
            raise ValueError("Illegal data key")
        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()

        found = False
        for et in self.__dgl_graph_holder.graph.canonical_etypes:
            if all([a == b for a, b in zip(et, edge_type)]):
                found = True
                break
        if not found:
            raise ValueError("edge type not exist")

        if data_key in self.__dgl_graph_holder.graph.edges[edge_type].data:
            del self.__dgl_graph_holder.graph.edges[edge_type].data[data_key]
        else:
            raise KeyError  # todo: Complete error message

    def __len__(self) -> int:
        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()

        found = False
        for et in self.__dgl_graph_holder.graph.canonical_etypes:
            if all([a == b for a, b in zip(et, edge_type)]):
                found = True
                break
        if not found:
            raise ValueError("edge type not exist")

        return len(self.__dgl_graph_holder.graph.edges[edge_type].data)

    def __iter__(self) -> _typing.Iterator[str]:
        edge_type: _typing.Tuple[str, str, str] = self.__get_canonical_edge_type()

        found = False
        for et in self.__dgl_graph_holder.graph.canonical_etypes:
            if all([a == b for a, b in zip(et, edge_type)]):
                found = True
                break
        if not found:
            raise ValueError("edge type not exist")

        return iter(self.__dgl_graph_holder.graph.edges[edge_type].data)


 class _HomogeneousEdgesView(_abstract_views.HomogeneousEdgesView):
    def __init__(
            self, dgl_graph_holder: _DGLGraphHolder,
            edge_type: _typing.Union[
                None, str, _typing.Tuple[str, str, str],
                _canonical_edge_type.CanonicalEdgeType
            ] = ...
    ):
        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
            raise TypeError
        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
        if edge_type in (Ellipsis, None):
            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = None
        elif isinstance(edge_type, str):
            if ' ' in edge_type:
                raise ValueError("Illegal edge type")
            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = edge_type
        elif isinstance(edge_type, _typing.Sequence) and not isinstance(edge_type, str):
            if not (
                    len(edge_type) == 3 and
                    isinstance(edge_type[0], str) and ' ' not in edge_type[0] and
                    isinstance(edge_type[1], str) and ' ' not in edge_type[1] and
                    isinstance(edge_type[2], str) and ' ' not in edge_type[2]
            ):
                raise ValueError("Illegal edge type")
            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = tuple(edge_type)
        elif isinstance(edge_type, _canonical_edge_type.CanonicalEdgeType):
            self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = (
                edge_type.source_node_type, edge_type.relation_type, edge_type.target_node_type
            )
        else:
            raise TypeError

    def __get_canonical_edge_type(self) -> _typing.Tuple[str, str, str]:
        if self.__optional_edge_type in (Ellipsis, None):
            if len(self.__dgl_graph_holder.graph.canonical_etypes) == 0:
                raise ValueError("The graph is empty")
            elif len(self.__dgl_graph_holder.graph.canonical_etypes) > 1:
                raise ValueError(
                    "Unable to automatically determine edge type, "
                    "the graph consists of heterogeneous edge types."
                )
            else:
                return self.__dgl_graph_holder.graph.canonical_etypes[0]
        elif isinstance(self.__optional_edge_type, str):
            try:
                canonical_edge_type = self.__dgl_graph_holder.graph.to_canonical_etype(
                    self.__optional_edge_type
                )
            except dgl.DGLError as e:
                raise e
            else:
                return canonical_edge_type
        else:
            return self.__optional_edge_type

    @property
    def connections(self) -> torch.Tensor:
        return torch.vstack(
            self.__dgl_graph_holder.graph.edges(etype=self.__get_canonical_edge_type())
        )

    @property
    def data(self) -> _HomogeneousEdgesDataView:
        return _HomogeneousEdgesDataView(self.__dgl_graph_holder, self.__optional_edge_type)


 class _HeterogeneousEdgesView(_abstract_views.HeterogeneousEdgesView):
    def __init__(self, dgl_graph_holder: _DGLGraphHolder):
        if not isinstance(dgl_graph_holder, _DGLGraphHolder):
            raise TypeError
        self.__dgl_graph_holder: _DGLGraphHolder = dgl_graph_holder
        self.__optional_edge_type: _typing.Union[None, str, _typing.Tuple[str, str, str]] = None

    def __get_canonical_edge_type(self) -> _typing.Tuple[str, str, str]:
        if self.__optional_edge_type in (Ellipsis, None):
            if len(self.__dgl_graph_holder.graph.canonical_etypes) == 0:
                raise ValueError("The graph is empty")
            elif len(self.__dgl_graph_holder.graph.canonical_etypes) > 1:
                raise ValueError(
                    "Unable to automatically determine edge type, "
                    "the graph consists of heterogeneous edge types."
                )
            else:
                return self.__dgl_graph_holder.graph.canonical_etypes[0]
        elif isinstance(self.__optional_edge_type, str):
            try:
                canonical_edge_type = self.__dgl_graph_holder.graph.to_canonical_etype(
                    self.__optional_edge_type
                )
            except dgl.DGLError as e:
                raise e
            else:
                return canonical_edge_type
        else:
            return self.__optional_edge_type

    @property
    def connections(self) -> torch.Tensor:
        return _HomogeneousEdgesView(self.__dgl_graph_holder, ...).connections

    @property
    def data(self) -> _HomogeneousEdgesDataView:
        return _HomogeneousEdgesView(self.__dgl_graph_holder, ...).data

    @property
    def is_homogeneous(self) -> bool:
        return len(self.__dgl_graph_holder.graph.canonical_etypes) <= 1

    def set(
            self, edge_t: _typing.Union[None, str, _typing.Tuple[str, str, str]],
            connections: torch.LongTensor,
            data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ):
        raise NotImplementedError  # todo: Complete this function or this error message

    def __getitem__(
            self,
            edge_t: _typing.Union[
                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
            ]
    ) -> _HomogeneousEdgesView:
        return _HomogeneousEdgesView(self.__dgl_graph_holder, edge_t)

    def __setitem__(
            self,
            edge_t: _typing.Union[
                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
            ],
            edges: _typing.Union[torch.LongTensor]
    ):
        raise NotImplementedError  # todo: Complete this function or this error message

    def __delitem__(
            self,
            edge_t: _typing.Union[
                None, str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
            ]
    ):
        raise NotImplementedError  # todo: Complete this function or this error message

    def __len__(self) -> int:
        return len(self.__dgl_graph_holder.graph.canonical_etypes)

    def __iter__(self) -> _typing.Iterator[_canonical_edge_type.CanonicalEdgeType]:
        return iter([
            _canonical_edge_type.CanonicalEdgeType(et[0], et[1], et[2])
            for et in self.__dgl_graph_holder.graph.canonical_etypes
        ])

    def __contains__(
            self,
            edge_type: _typing.Union[
                str, _typing.Tuple[str, str, str], _canonical_edge_type.CanonicalEdgeType
            ]
    ) -> bool:
        # raise NotImplementedError
        if isinstance(edge_type, str):
            if ' ' in edge_type:
                raise ValueError("Illegal edge type")
            else:
                return edge_type in self.__dgl_graph_holder.graph.etypes
        elif isinstance(edge_type, _typing.Sequence) and not isinstance(edge_type, str):
            if not (
                    len(edge_type) == 3 and
                    isinstance(edge_type[0], str) and ' ' not in edge_type[0] and
                    isinstance(edge_type[1], str) and ' ' not in edge_type[1] and
                    isinstance(edge_type[2], str) and ' ' not in edge_type[2]
            ):
                raise ValueError("Illegal edge type")
            found = False
            for et in self.__dgl_graph_holder.graph.canonical_etypes:
                if all([a == b for a, b in zip(et, edge_type)]):
                    found = True
                    break
            return found
        elif isinstance(edge_type, _canonical_edge_type.CanonicalEdgeType):
            found = False
            for et in self.__dgl_graph_holder.graph.canonical_etypes:
                if (
                        et[0] == edge_type.source_node_type and
                        et[1] == edge_type.relation_type and
                        et[2] == edge_type.target_node_type
                ):
                    found = True
                    break
            return found
        else:
            raise TypeError


 class _StaticGraphDataContainer(_typing.MutableMapping[str, torch.Tensor]):
    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
        raise NotImplementedError

    def __delitem__(self, data_key: str) -> None:
        raise NotImplementedError

    def __getitem__(self, data_key: str) -> torch.Tensor:
        raise NotImplementedError

    def __len__(self) -> int:
        raise NotImplementedError

    def __iter__(self) -> _typing.Iterator[str]:
        raise NotImplementedError


 class StaticGraphDataAggregation(_StaticGraphDataContainer):
    def __init__(
            self, graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ):
        self.__data: _typing.MutableMapping[str, torch.Tensor] = (
            dict(graph_data) if isinstance(graph_data, _typing.Mapping)
            else {}
        )

    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
        self.__data[data_key] = data

    def __delitem__(self, data_key: str) -> None:
        del self.__data[data_key]

    def __getitem__(self, data_key: str) -> torch.Tensor:
        return self.__data[data_key]

    def __len__(self) -> int:
        return len(self.__data)

    def __iter__(self) -> _typing.Iterator[str]:
        return iter(self.__data)


 class _StaticGraphDataView(_abstract_views.GraphDataView):
    def __init__(self, graph_data_container: _StaticGraphDataContainer):
        self.__graph_data_container: _StaticGraphDataContainer = (
            graph_data_container
        )

    def __setitem__(self, data_key: str, data: torch.Tensor) -> None:
        self.__graph_data_container[data_key] = data

    def __delitem__(self, data_key: str) -> None:
        del self.__graph_data_container[data_key]

    def __getitem__(self, data_key: str) -> torch.Tensor:
        return self.__graph_data_container[data_key]

    def __len__(self) -> int:
        return len(self.__graph_data_container)

    def __iter__(self) -> _typing.Iterator[str]:
        return iter(self.__graph_data_container)


 class GeneralStaticGraphDGLImplementation(
    _general_static_graph.GeneralStaticGraph
 ):
    def __init__(
            self, dgl_graph: dgl.DGLGraph,
            graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ):
        if not isinstance(dgl_graph, dgl.DGLGraph) and (
                graph_data in (Ellipsis, None) or
                isinstance(graph_data, _typing.Mapping)
        ):
            raise TypeError
        self.__dgl_graph_holder: _DGLGraphHolder = _DGLGraphHolder(dgl_graph)
        self.__graph_data_container: _StaticGraphDataContainer = (
            StaticGraphDataAggregation(
                graph_data if isinstance(graph_data, _typing.Mapping) else None
            )
        )

    @property
    def nodes(self) -> _abstract_views.HeterogeneousNodeView:
        return _HeterogeneousNodeView(self.__dgl_graph_holder)

    @property
    def edges(self) -> _abstract_views.HeterogeneousEdgesView:
        return _HeterogeneousEdgesView(self.__dgl_graph_holder)

    @property
    def data(self) -> _abstract_views.GraphDataView:
        return _StaticGraphDataView(self.__graph_data_container)
--- a/autogl/data/graph/_general_static_graph/_general_static_graph_generator.py
+++ b/autogl/data/graph/_general_static_graph/_general_static_graph_generator.py
@@ -0,0 +1,80 @@
 import torch
 import typing as _typing
 from . import _general_static_graph
 from ._general_static_graph_default_implementation import (
    HeterogeneousNodesContainer, HeterogeneousNodesContainerImplementation,
    HomogeneousEdgesContainerImplementation,
    HeterogeneousEdgesAggregation, HeterogeneousEdgesAggregationImplementation,
    StaticGraphDataAggregation, GeneralStaticGraphImplementation
 )


 class GeneralStaticGraphGenerator:
    @classmethod
    def create_heterogeneous_static_graph(
            cls, heterogeneous_nodes_data: _typing.Mapping[str, _typing.Mapping[str, torch.Tensor]],
            heterogeneous_edges: _typing.Mapping[
                _typing.Tuple[str, str, str],
                _typing.Union[
                    torch.Tensor,
                    _typing.Tuple[
                        torch.Tensor,
                        _typing.Optional[_typing.Mapping[str, torch.Tensor]]
                    ]
                ]
            ],
            graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ) -> _general_static_graph.GeneralStaticGraph:
        _heterogeneous_nodes_container: HeterogeneousNodesContainer = (
            HeterogeneousNodesContainerImplementation(heterogeneous_nodes_data)
        )
        _heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation = (
            HeterogeneousEdgesAggregationImplementation()
        )
        for canonical_edge_type, specific_typed_edges in heterogeneous_edges.items():
            if isinstance(specific_typed_edges, torch.Tensor):
                connections = specific_typed_edges
                data = None
            elif (
                    isinstance(specific_typed_edges, _typing.Sequence) and
                    len(specific_typed_edges) == 2 and
                    isinstance(specific_typed_edges[0], torch.Tensor) and
                    (
                            specific_typed_edges[1] is None or
                            isinstance(specific_typed_edges[1], _typing.Mapping)
                    )
            ):
                connections = specific_typed_edges[0]
                data = specific_typed_edges[1]
            else:
                raise TypeError
            _heterogeneous_edges_aggregation[canonical_edge_type] = (
                HomogeneousEdgesContainerImplementation(connections, data)
            )
        return GeneralStaticGraphImplementation(
            _heterogeneous_nodes_container,
            _heterogeneous_edges_aggregation,
            StaticGraphDataAggregation(graph_data)
        )

    @classmethod
    def create_homogeneous_static_graph(
            cls, nodes_data: _typing.Mapping[str, torch.Tensor],
            edges_connections: torch.Tensor,
            edges_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...,
            graph_data: _typing.Optional[_typing.Mapping[str, torch.Tensor]] = ...
    ) -> _general_static_graph.GeneralStaticGraph:
        _heterogeneous_nodes_container: HeterogeneousNodesContainer = (
            HeterogeneousNodesContainerImplementation({'': nodes_data})
        )
        _heterogeneous_edges_aggregation: HeterogeneousEdgesAggregation = (
            HeterogeneousEdgesAggregationImplementation()
        )
        _heterogeneous_edges_aggregation[('', '', '')] = (
            HomogeneousEdgesContainerImplementation(edges_connections, edges_data)
        )
        return GeneralStaticGraphImplementation(
            _heterogeneous_nodes_container,
            _heterogeneous_edges_aggregation,
            StaticGraphDataAggregation(graph_data)
        )
--- a/autogl/data/graph/_general_static_graph/utils/init.py
+++ b/autogl/data/graph/_general_static_graph/utils/init.py
--- a/autogl/data/graph/_general_static_graph/utils/conversion/init.py
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/init.py
@@ -0,0 +1,19 @@
 from ._nx import (
    HomogeneousStaticGraphToNetworkX
 )

 try:
    import dgl
 except ModuleNotFoundError:
    dgl = None
 else:
    from ._dgl import (
        DGLGraphToGeneralStaticGraph, dgl_graph_to_general_static_graph,
        GeneralStaticGraphToDGLGraph, general_static_graph_to_dgl_graph,
    )
 try:
    import torch_geometric
 except ModuleNotFoundError:
    torch_geometric = None
 else:
    from ._pyg import StaticGraphToPyGData, static_graph_to_pyg_data
--- a/autogl/data/graph/_general_static_graph/utils/conversion/_dgl.py
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_dgl.py
@@ -0,0 +1,136 @@
 import dgl
 import torch
 import typing as _typing
 from ..._general_static_graph import GeneralStaticGraph
 from ... import (
    _general_static_graph_generator, _general_static_graph_dgl_implementation
 )


 class GeneralStaticGraphToDGLGraph:
    def __init__(self, *__args, **__kwargs):
        pass

    def __call__(self, static_graph: GeneralStaticGraph) -> dgl.DGLGraph:
        dgl_graph: dgl.DGLGraph = dgl.heterograph(
            dict([
                (
                    (
                        canonical_edge_type.source_node_type,
                        canonical_edge_type.relation_type,
                        canonical_edge_type.target_node_type
                    ),
                    (
                        static_graph.edges[canonical_edge_type].connections[0],
                        static_graph.edges[canonical_edge_type].connections[1]
                    )
                )
                for canonical_edge_type in static_graph.edges
            ])
        )
        for node_type in static_graph.nodes:
            for data_key in static_graph.nodes[node_type].data:
                dgl_graph.nodes[node_type].data[data_key] = (
                    static_graph.nodes[node_type].data[data_key]
                )
        for canonical_edge_type in static_graph.edges:
            for data_key in static_graph.edges[canonical_edge_type].data:
                dgl_graph.edges[
                    (
                        canonical_edge_type.source_node_type,
                        canonical_edge_type.relation_type,
                        canonical_edge_type.target_node_type
                    )
                ].data[data_key] = (
                    static_graph.edges[canonical_edge_type].data[data_key]
                )
        # Set graph level data by `setattr`
        if len(static_graph.data) > 0:
            setattr(dgl_graph, "graph_data", dict(static_graph.data))
            if "gf" in static_graph.data:
                setattr(dgl_graph, "gf", static_graph.data["gf"].detach().clone())
        return dgl_graph


 class DGLGraphToGeneralStaticGraph:
    def __init__(
            self, as_universal_storage_format: bool = False,
            *__args, **__kwargs
    ):
        if not isinstance(as_universal_storage_format, bool):
            raise TypeError
        else:
            self._as_universal_storage_format: bool = as_universal_storage_format

    def __call__(
            self, dgl_graph: dgl.DGLGraph,
            as_universal_storage_format: _typing.Optional[bool] = ...,
            *__args, **__kwargs
    ) -> GeneralStaticGraph:
        if not (
                as_universal_storage_format in (Ellipsis, None) or
                isinstance(as_universal_storage_format, bool)
        ):
            raise TypeError
        _as_universal_storage_format: bool = (
            as_universal_storage_format
            if isinstance(as_universal_storage_format, bool)
            else self._as_universal_storage_format
        )

        if not _as_universal_storage_format:
            general_static_graph: GeneralStaticGraph = (
                _general_static_graph_dgl_implementation.GeneralStaticGraphDGLImplementation(dgl_graph)
            )

        else:
            general_static_graph: GeneralStaticGraph = (
                _general_static_graph_generator.GeneralStaticGraphGenerator.create_heterogeneous_static_graph(
                    dict([(node_type, dgl_graph.nodes[node_type].data) for node_type in dgl_graph.ntypes]),
                    dict([
                        (
                            canonical_edge_type,
                            (
                                torch.vstack(dgl_graph.edges(etype=canonical_edge_type)),
                                dgl_graph.edges[canonical_edge_type].data
                            )
                        )
                        for canonical_edge_type in dgl_graph.canonical_etypes]
                    )
                )
            )
        if (
                hasattr(dgl_graph, "graph_data") and
                isinstance(getattr(dgl_graph, "graph_data"), _typing.Mapping)
        ):
            graph_data: _typing.Mapping[str, torch.Tensor] = getattr(dgl_graph, "graph_data")
            for k, v in graph_data.items():
                if (
                        isinstance(k, str) and ' ' not in k and
                        isinstance(v, torch.Tensor)
                ):
                    general_static_graph.data[k] = v
        for k in ("gf",):
            if (
                    hasattr(dgl_graph, k) and
                    isinstance(getattr(dgl_graph, k), torch.Tensor)
            ):
                general_static_graph.data[k] = getattr(dgl_graph, k)
        return general_static_graph


 def general_static_graph_to_dgl_graph(
        general_static_graph: GeneralStaticGraph, *__args, **__kwargs
 ) -> dgl.DGLGraph:
    return GeneralStaticGraphToDGLGraph(*__args, **__kwargs).__call__(
        general_static_graph
    )


 def dgl_graph_to_general_static_graph(
        dgl_graph: dgl.DGLGraph, as_universal_storage_format: bool = False,
        *__args, **__kwargs
 ) -> GeneralStaticGraph:
    return DGLGraphToGeneralStaticGraph(as_universal_storage_format).__call__(
        dgl_graph, as_universal_storage_format
    )
--- a/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_nx.py
@@ -0,0 +1,74 @@
 import typing as _typing
 import networkx as nx
 from autogl.data.graph._general_static_graph import GeneralStaticGraph


 class HomogeneousStaticGraphToNetworkX:
    def __init__(
            self, remove_self_loops: bool = False, to_undirected: bool = False,
            *__args, **__kwargs
    ):
        if not isinstance(remove_self_loops, bool):
            raise TypeError
        if not isinstance(to_undirected, bool):
            raise TypeError
        self.__remove_self_loops: bool = remove_self_loops
        self.__to_undirected: bool = to_undirected

    def __call__(
            self, homogeneous_static_graph: GeneralStaticGraph,
            remove_self_loops: _typing.Optional[bool] = ...,
            to_undirected: _typing.Optional[bool] = ...,
            *args, **kwargs
    ):
        if not isinstance(homogeneous_static_graph, GeneralStaticGraph):
            raise TypeError
        elif not (
                homogeneous_static_graph.nodes.is_homogeneous and
                homogeneous_static_graph.edges.is_homogeneous
        ):
            raise ValueError("Only homogeneous static graph can be converted to NetworkX")

        if not (remove_self_loops in (Ellipsis, None) or isinstance(remove_self_loops, bool)):
            raise TypeError
        else:
            __remove_self_loops: bool = (
                remove_self_loops if isinstance(remove_self_loops, bool)
                else self.__remove_self_loops
            )
        if not (to_undirected in (Ellipsis, None) or isinstance(to_undirected, bool)):
            raise TypeError
        else:
            __to_undirected: bool = (
                to_undirected if isinstance(to_undirected, bool)
                else self.__to_undirected
            )

        num_nodes: int = homogeneous_static_graph.edges.connections.max().item() + 1
        # todo: Note that this is an assumption

        g: nx.Graph = nx.Graph() if __to_undirected else nx.DiGraph()
        g.add_nodes_from(range(num_nodes))

        nodes_data: _typing.MutableMapping[str, list] = {}
        for data_key in homogeneous_static_graph.nodes.data:
            nodes_data[data_key] = (
                homogeneous_static_graph.nodes.data[data_key].squeeze().tolist()
            )
        edges_data: _typing.MutableMapping[str, list] = {}
        for data_key in homogeneous_static_graph.edges.data:
            edges_data[data_key] = (
                homogeneous_static_graph.edges.data[data_key].squeeze().tolist()
            )
        for i, (u, v) in enumerate(homogeneous_static_graph.edges.connections.t().tolist()):
            if __remove_self_loops and v == u:
                continue
            g.add_edge(u, v)
            for data_key in edges_data:
                g[u][v][data_key] = edges_data[data_key][i]
        for data_key in nodes_data:
            for i, feature_dict in g.nodes(data=True):
                feature_dict.update(
                    {data_key: nodes_data[data_key][i]}
                )
        return g
--- a/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
+++ b/autogl/data/graph/_general_static_graph/utils/conversion/_pyg.py
@@ -0,0 +1,77 @@
 import torch
 import typing as _typing
 import torch_geometric
 from ... import GeneralStaticGraph


 class StaticGraphToPyGData:
    def __init__(self, *__args, **__kwargs):
        pass

    def __call__(
            self, static_graph: GeneralStaticGraph,
            *__args, **__kwargs
    ):
        if not isinstance(static_graph, GeneralStaticGraph):
            raise TypeError
        elif not static_graph.nodes.is_homogeneous:
            raise ValueError("Provided static graph MUST consist of homogeneous nodes")
        homogeneous_node_type: _typing.Optional[str] = (
            list(static_graph.nodes)[0]
            if len(list(static_graph.nodes)) > 0 else None
        )
        data: _typing.Dict[str, torch.Tensor] = dict()
        if isinstance(homogeneous_node_type, str):
            node_and_edge_data_keys_intersection: _typing.Set[str] = (
                    set(static_graph.nodes.data) & set(static_graph.data)
            )
            if len(node_and_edge_data_keys_intersection) > 0:
                raise ValueError(
                    f"Provided static graph contains duplicate data "
                    f"with same keys {node_and_edge_data_keys_intersection}"
                    f"for homogeneous nodes data and graph-level data, "
                    f"please refer to doc for more details."
                )
            data.update(static_graph.nodes.data)
            data.update(static_graph.data)
        else:
            data.update(static_graph.data)

        if len(list(static_graph.edges)) == 1:
            data["edge_index"] = static_graph.edges.connections
            if len(set(data.keys()) & set(static_graph.edges.data.keys())) > 0:
                raise ValueError(
                    "Provided static graph contains duplicate data with same key, "
                    "please refer to doc for more details."
                )
            data.update(static_graph.edges.data)
        elif len(list(static_graph.edges)) > 1:
            for canonical_edge_type in static_graph.edges:
                if homogeneous_node_type is not None and isinstance(homogeneous_node_type, str) and (
                        canonical_edge_type.source_node_type != homogeneous_node_type or
                        canonical_edge_type.target_node_type != homogeneous_node_type
                ):
                    continue
                if len(canonical_edge_type.relation_type) < 4 or canonical_edge_type[-4:] != 'edge':
                    continue
                data[f"{canonical_edge_type.relation_type}_index"] = (
                    static_graph.edges[canonical_edge_type].connections
                )

                edge_type_prefix: str = canonical_edge_type.relation_type[:-4]
                for data_key in static_graph.edges[canonical_edge_type].data:
                    if len(data_key) >= 4 and data_key[:4] == 'edge':
                        data[f"{edge_type_prefix}{data_key}"] = (
                            static_graph.edges[canonical_edge_type].data[data_key].detach()
                        )
                    else:
                        data[f"{canonical_edge_type.relation_type}_{data_key}"] = (
                            static_graph.edges[canonical_edge_type].data[data_key].detach()
                        )

        pyg_data: torch_geometric.data.Data = torch_geometric.data.Data(**data)
        return pyg_data


 def static_graph_to_pyg_data(static_graph: GeneralStaticGraph) -> torch_geometric.data.Data:
    return StaticGraphToPyGData().__call__(static_graph)
--- a/autogl/data/graph/_general_static_graph_.py
+++ b/autogl/data/graph/_general_static_graph_.py
--- a/autogl/data/graph/utils/init.py
+++ b/autogl/data/graph/utils/init.py
--- a/autogl/data/graph/utils/conversion.py
+++ b/autogl/data/graph/utils/conversion.py
@@ -0,0 +1 @@
 from .._general_static_graph.utils.conversion import *
--- a/autogl/datasets/README.md
+++ b/autogl/datasets/README.md
@@ -1,65 +0,0 @@

 Datasets are derived from PyG, OGB and CogDL.
 =================
 AutoGL now supports the following benchmarks for different tasks:
 - semi-supervised node classification: Cora, Citeseer, Pubmed, Amazon Computers\*, Amazon Photo\*, Coauthor CS\*, Coauthor Physics\*, Reddit （\*: using `utils.random_splits_mask_class` for splitting dataset is recommended.)


 |  Dataset  |  PyG  |  CogDL  | x | y | edge_index | edge_attr | train/val/test node | train/val/test mask |
 |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |
 | Cora | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  | ✓ |
 | Citeseer | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  | ✓ |
 | Pubmed | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  | ✓ |
 | Amazon Computers | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |  |
 | Amazon Photo | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |  |
 | Coauthor CS | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |  |
 | Coauthor Physics | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |  |
 | Reddit | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  | ✓ |


 - supervised graph classification: MUTAG, IMDB-B, IMDB-M, PROTEINS, COLLAB

 |  Dataset  |  PyG  |  CogDL  | x | y | edge_index | edge_attr | train/val/test node | train/val/test mask | adj|
 |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |
 | Mutag | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |    |    |
 | IMDB-B | ✓ |    |    | ✓ | ✓   |    |  |    |    |
 | IMDB-M | ✓ |    |    | ✓ | ✓   |    |  |    |    |
 | PROTEINS | ✓ |    |  ✓  | ✓ | ✓   |    |  |    |    |
 | COLLAB | ✓ |    |    | ✓ | ✓   |    |  |    |    |

 - node classification datasets from OGB: ogbn-products, ogbn-proteins, ogbn-arxiv, ogbn-papers100M and ogbn-mag.

 - graph classification datasets from OGB: ogbg-molhiv, ogbg-molpcba, ogbg-ppa and ogbg-code.

 ---

 TODO:
 In future version, AutoGL will support the following benchmarks for different tasks:
 - unsupervised node classification: PPI, Blogcatalog, Wikipedia
 - heterogeneous node classification: DBLP, ACM, IMDB
 - link prediction: PPI, Wikipedia, Blogcatalog
 - multiplex link prediction: Amazon, YouTube, Twitter
 - link prediction datasets from OGB: ogbl-ppa, ogbl-collab, ogbl-ddi, ogbl-citation, ogbl-wikikg and ogbl-biokg.

 <!--
 |  Dataset  |  PyG  |  CogDL  | x | y | edge_index | edge_attr | train/val/test node | train/val/test mask | adj|
 |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |  ----  |
 |  ACM  |  |  ✓  |  ✓  | ✓ |  ✓  |    | ✓ |    | ✓ list |
 |  DBLP |  |  ✓  |  ✓  | ✓ |  ✓  |    | ✓ |    | ✓ list |
 |  IMDB |  |  ✓  |  ✓  | ✓ |  ✓  |    | ✓ |    | ✓ list |
 | Flickr |  |  ✓  |    | ✓ |  ✓  |  ✓  |  |    |    |
 | Blogcatalog |  |  ✓  |    | ✓ |  ✓  |  ✓  |  |    |    |
 | PPI |  |  ✓  |    | ✓ |  ✓  |  ✓  |  |    |    |
 | Wikipedia |  |  ✓  |    | ✓ |  ✓  |  ✓  |  |    |    |
 | Amazon |  |  ✓  |    |  |    |    | ✓ data |    |    |
 | Twitter |  |  ✓  |    |  |    |    | ✓ data |    |    |
 | Youtube |  |  ✓  |    |  |    |    | ✓ data |    |    |
 | NCI1 | ✓ |    |  ✓  | ✓ |  ✓  |    |  |    |    |
 | NCI109 | ✓ |    |  ✓  | ✓ |  ✓  |    |  |    |    |
 | Enzyme | ✓ |    |  ✓  | ✓ |  ✓  |    |  |    |    |
 | Reddit-B | ✓ |    |    | ✓ | ✓   |    |  |    |    |
 | Reddit-Multi-5k | ✓ |    |    | ✓ | ✓   |    |  |    |    |
 | Reddit-Multi-12k | ✓ |    |    | ✓ | ✓   |    |  |    |    |
 | PTC-MR | ✓ |    |  ✓  | ✓ |  ✓  |  ✓  |  |    |    |
 -->

--- a/autogl/datasets/init.py
+++ b/autogl/datasets/init.py
@@ -1,203 +1,70 @@
 import os.path as osp
 import os
 import torch
 from ..data.dataset import Dataset


 try:
    import torch_geometric
 except ImportError:
    torch_geometric = None
    pyg = False
 else:
    pyg = True

 DATASET_DICT = {}


 def register_dataset(name):
    """
    New dataset types can be added to autogl with the :func:`register_dataset`
    function decorator.

    For example::

        @register_dataset('my_dataset')
        class MyDataset():
            (...)

    Args:
        name (str): the name of the dataset
    """

    def register_dataset_cls(cls):
        if name in DATASET_DICT:
            raise ValueError("Cannot register duplicate dataset ({})".format(name))
        if not issubclass(cls, Dataset) and (
            pyg and not issubclass(cls, torch_geometric.data.Dataset)
        ):
            raise ValueError(
                "Dataset ({}: {}) must extend autogl.data.Dataset".format(
                    name, cls.__name__
                )
            )
        DATASET_DICT[name] = cls
        return cls

    return register_dataset_cls


 from .pyg import (
    AmazonComputersDataset,
    AmazonPhotoDataset,
    CoauthorPhysicsDataset,
    CoauthorCSDataset,
    CoraDataset,
    CiteSeerDataset,
    PubMedDataset,
    RedditDataset,
    MUTAGDataset,
    IMDBBinaryDataset,
    IMDBMultiDataset,
    CollabDataset,
    ProteinsDataset,
    REDDITBinary,
    REDDITMulti5K,
    REDDITMulti12K,
    PTCMRDataset,
    NCI1Dataset,
    ENZYMES,
    QM9Dataset,
 )
 from .ogb import (
    OGBNproductsDataset,
    OGBNproteinsDataset,
    OGBNarxivDataset,
    OGBNpapers100MDataset,
    OGBNmagDataset,
    OGBGmolhivDataset,
    OGBGmolpcbaDataset,
    OGBGppaDataset,
    OGBGcodeDataset,
    OGBLppaDataset,
    OGBLcollabDataset,
    OGBLddiDataset,
    OGBLcitationDataset,
    OGBLwikikgDataset,
    OGBLbiokgDataset,
 )
 from .gatne import GatneDataset, AmazonDataset, TwitterDataset, YouTubeDataset
 from .gtn_data import GTNDataset, ACM_GTNDataset, DBLP_GTNDataset, IMDB_GTNDataset
 from .han_data import HANDataset, ACM_HANDataset, DBLP_HANDataset, IMDB_HANDataset
 from .matlab_matrix import (
    MatlabMatrix,
    BlogcatalogDataset,
    WikipediaDataset,
    PPIDataset,
 )
 from .modelnet import (
    ModelNet10,
    ModelNet40,
    ModelNet10Train,
    ModelNet10Test,
    ModelNet40Train,
    ModelNet40Test,
 )
 from .utils import (
    get_label_number,
    random_splits_mask,
    random_splits_mask_class,
    graph_cross_validation,
    graph_set_fold_id,
    graph_random_splits,
    graph_get_split,
 from autogl import backend as _backend
 from ._dataset_registry import (
    DatasetUniversalRegistry,
    build_dataset_from_name
 )

 from ._gtn_data import (
    GTNACMDataset,
    GTNDBLPDataset,
    GTNIMDBDataset,
 )

 def build_dataset(args, path="~/.cache-autogl/"):
    path = osp.join(path, "data", args.dataset)
    path = os.path.expanduser(path)
    return DATASET_DICT[args.dataset](path)


 def build_dataset_from_name(dataset_name, path="~/.cache-autogl/"):
    path = osp.join(path, "data", dataset_name)
    path = os.path.expanduser(path)
    dataset = DATASET_DICT[dataset_name](path)
    if "ogbn" in dataset_name:
        # dataset.data, dataset.slices = dataset.collate([dataset.data])
        # dataset.data.num_nodes = dataset.data.num_nodes[0]
        if dataset.data.y.shape[-1] == 1:
            dataset.data.y = torch.squeeze(dataset.data.y)
    return dataset

 from ._matlab_matrix import BlogCatalogDataset, WIKIPEDIADataset
 from ._ogb import (
    OGBNProductsDataset, OGBNProteinsDataset, OGBNArxivDataset, OGBNPapers100MDataset,
    OGBLPPADataset, OGBLCOLLABDataset, OGBLDDIDataset, OGBLCitation2Dataset,
    OGBGMOLHIVDataset, OGBGMOLPCBADataset, OGBGPPADataset, OGBGCode2Dataset
 )

 __all__ = [
    "register_dataset",
    "build_dataset",
    "build_dataset_from_name",
    "get_label_number",
    "random_splits_mask",
    "random_splits_mask_class",
    "graph_cross_validation",
    "graph_set_fold_id",
    "graph_random_splits",
    "graph_get_split",
    "AmazonComputersDataset",
    "AmazonPhotoDataset",
    "CoauthorPhysicsDataset",
    "CoauthorCSDataset",
    "CoraDataset",
    "CiteSeerDataset",
    "PubMedDataset",
    "RedditDataset",
    "MUTAGDataset",
    "IMDBBinaryDataset",
    "IMDBMultiDataset",
    "CollabDataset",
    "ProteinsDataset",
    "REDDITBinary",
    "REDDITMulti5K",
    "REDDITMulti12K",
    "PTCMRDataset",
    "NCI1Dataset",
    "ENZYMES",
    "QM9Dataset",
    "OGBNproductsDataset",
    "OGBNproteinsDataset",
    "OGBNarxivDataset",
    "OGBNpapers100MDataset",
    "OGBNmagDataset",
    "OGBGmolhivDataset",
    "OGBGmolpcbaDataset",
    "OGBGppaDataset",
    "OGBGcodeDataset",
    "OGBLppaDataset",
    "OGBLcollabDataset",
    "OGBLddiDataset",
    "OGBLcitationDataset",
    "OGBLwikikgDataset",
    "OGBLbiokgDataset",
    "GatneDataset",
    "AmazonDataset",
    "TwitterDataset",
    "YouTubeDataset",
    "GTNDataset",
    "ACM_GTNDataset",
    "DBLP_GTNDataset",
    "IMDB_GTNDataset",
    "HANDataset",
    "ACM_HANDataset",
    "DBLP_HANDataset",
    "IMDB_HANDataset",
    "MatlabMatrix",
    "BlogcatalogDataset",
    "WikipediaDataset",
    "PPIDataset",
    "ModelNet10",
    "ModelNet40",
    "ModelNet10Train",
    "ModelNet10Test",
    "ModelNet40Train",
    "ModelNet40Test",
 ]
 if _backend.DependentBackend.is_dgl():
    from ._dgl import (
        CoraDataset,
        CiteSeerDataset,
        PubMedDataset,
        RedditDataset,
        AmazonComputersDataset,
        AmazonPhotoDataset,
        CoauthorPhysicsDataset,
        CoauthorCSDataset,
        MUTAGDataset,
        ENZYMESDataset,
        IMDBBinaryDataset,
        IMDBMultiDataset,
        RedditBinaryDataset,
        REDDITMulti5KDataset,
        COLLABDataset,
        ProteinsDataset,
        PTCMRDataset,
        NCI1Dataset
    )
 elif _backend.DependentBackend.is_pyg():
    from ._pyg import (
        CoraDataset,
        CiteSeerDataset,
        PubMedDataset,
        FlickrDataset,
        RedditDataset,
        AmazonComputersDataset,
        AmazonPhotoDataset,
        CoauthorPhysicsDataset,
        CoauthorCSDataset,
        PPIDataset,
        QM9Dataset,
        MUTAGDataset,
        ENZYMESDataset,
        IMDBBinaryDataset,
        IMDBMultiDataset,
        RedditBinaryDataset,
        REDDITMulti5KDataset,
        REDDITMulti12KDataset,
        COLLABDataset,
        ProteinsDataset,
        PTCMRDataset,
        NCI1Dataset,
        NCI109Dataset,
        ModelNet10TrainingDataset,
        ModelNet10TestDataset,
        ModelNet40TrainingDataset,
        ModelNet40TestDataset
    )
--- a/autogl/datasets/_data_source.py
+++ b/autogl/datasets/_data_source.py
@@ -0,0 +1,80 @@
 import os
 import typing as _typing


 class OnlineDataSource:
    @property
    def _raw_directory(self) -> str:
        return os.path.join(self.__path, "raw")

    @property
    def _processed_directory(self) -> str:
        return os.path.join(self.__path, "processed")

    @property
    def _raw_filenames(self) -> _typing.Iterable[str]:
        raise NotImplementedError

    @property
    def _processed_filenames(self) -> _typing.Iterable[str]:
        raise NotImplementedError

    @property
    def _raw_file_paths(self) -> _typing.Iterable[str]:
        return [
            os.path.join(self._raw_directory, raw_filename)
            for raw_filename in self._raw_filenames
        ]

    @property
    def _processed_file_paths(self) -> _typing.Iterable[str]:
        return [
            os.path.join(self._processed_directory, processed_filename)
            for processed_filename in self._processed_filenames
        ]

    @classmethod
    def __files_exist(cls, files: _typing.Iterable[str]) -> bool:
        return all([os.path.exists(file) for file in files])

    @classmethod
    def __make_directory(cls, path):
        import errno
        try:
            os.makedirs(os.path.expanduser(os.path.normpath(path)))
        except OSError as e:
            if e.errno != errno.EEXIST and os.path.isdir(path):
                raise e

    def _fetch(self):
        raise NotImplementedError

    def __fetch(self):
        if not self.__files_exist(self._raw_file_paths):
            self.__make_directory(self._raw_directory)
            self._fetch()

    def _process(self):
        raise NotImplementedError

    def __preprocess(self):
        if not self.__files_exist(self._processed_file_paths):
            self.__make_directory(self._processed_directory)
            self._process()

    def __getitem__(self, index: int) -> _typing.Any:
        raise NotImplementedError

    def __len__(self) -> int:
        raise NotImplementedError

    def __init__(
            self, path: str,
            # transform: _typing.Optional[_typing.Callable[[_typing.Any], _typing.Any]] = ...
    ):
        self.__path: str = os.path.expanduser(os.path.normpath(path))
        # self.__transform: _typing.Optional[_typing.Callable[[_typing.Any], _typing.Any]] = (
        #     transform if transform not in (Ellipsis, None) and callable(transform) else None
        # )
        self.__fetch()
        self.__preprocess()
--- a/autogl/datasets/_dataset_registry.py
+++ b/autogl/datasets/_dataset_registry.py
@@ -0,0 +1,45 @@
 import os
 import typing as _typing
 from autogl.data import Dataset


 class _DatasetUniversalRegistryMetaclass(type):
    def __new__(
            mcs, name: str, bases: _typing.Tuple[type, ...],
            namespace: _typing.Dict[str, _typing.Any]
    ):
        return super(_DatasetUniversalRegistryMetaclass, mcs).__new__(
            mcs, name, bases, namespace
        )

    def __init__(
            cls, name: str, bases: _typing.Tuple[type, ...],
            namespace: _typing.Dict[str, _typing.Any]
    ):
        super(_DatasetUniversalRegistryMetaclass, cls).__init__(name, bases, namespace)
        cls._dataset_universal_registry: _typing.MutableMapping[str, _typing.Type[Dataset]] = {}


 class DatasetUniversalRegistry(metaclass=_DatasetUniversalRegistryMetaclass):
    @classmethod
    def register_dataset(cls, dataset_name: str):
        def register_dataset_cls(dataset: _typing.Type[Dataset]):
            if dataset_name in cls._dataset_universal_registry:
                raise ValueError(f"Dataset with name \"{dataset_name}\" already exists!")
            elif not issubclass(dataset, Dataset):
                raise TypeError
            else:
                cls._dataset_universal_registry[dataset_name] = dataset
                return dataset

        return register_dataset_cls

    @classmethod
    def get_dataset(cls, dataset_name: str) -> _typing.Type[Dataset]:
        return cls._dataset_universal_registry.get(dataset_name)


 def build_dataset_from_name(dataset_name: str, path: str = "~/.cache-autogl/"):
    path = os.path.expanduser(os.path.join(path, "data", dataset_name))
    _dataset = DatasetUniversalRegistry.get_dataset(dataset_name)
    return _dataset(path)
--- a/autogl/datasets/_dgl.py
+++ b/autogl/datasets/_dgl.py
@@ -0,0 +1,544 @@
 import os
 import torch
 import dgl

 # from autogl.data.graph import GeneralStaticGraphGenerator
 from autogl.data.graph.utils import conversion as _conversion
 from autogl.data import InMemoryStaticGraphSet
 from ._dataset_registry import DatasetUniversalRegistry


@DatasetUniversalRegistry.register_dataset("cora")
 class CoraDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.CoraGraphDataset(
            os.path.join(path, '_dgl')
        )
        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
        super(CoraDataset, self).__init__(
            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
        )
        # super(CoraDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'feat': dgl_graph.ndata['feat'],
        #                 'label': dgl_graph.ndata['label'],
        #                 'train_mask': dgl_graph.ndata['train_mask'],
        #                 'val_mask': dgl_graph.ndata['val_mask'],
        #                 'test_mask': dgl_graph.ndata['test_mask']
        #             },
        #             torch.vstack(dgl_graph.edges())
        #         )
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("CiteSeer".lower())
 class CiteSeerDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.CiteseerGraphDataset(
            os.path.join(path, '_dgl')
        )
        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
        super(CiteSeerDataset, self).__init__(
            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
        )
        # super(CiteSeerDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'feat': dgl_graph.ndata['feat'],
        #                 'label': dgl_graph.ndata['label'],
        #                 'train_mask': dgl_graph.ndata['train_mask'],
        #                 'val_mask': dgl_graph.ndata['val_mask'],
        #                 'test_mask': dgl_graph.ndata['test_mask']
        #             },
        #             torch.vstack(dgl_graph.edges())
        #         )
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("PubMed".lower())
 class PubMedDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.PubmedGraphDataset(
            os.path.join(path, '_dgl')
        )
        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
        super(PubMedDataset, self).__init__(
            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
        )
        # super(PubMedDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'feat': dgl_graph.ndata['feat'],
        #                 'label': dgl_graph.ndata['label'],
        #                 'train_mask': dgl_graph.ndata['train_mask'],
        #                 'val_mask': dgl_graph.ndata['val_mask'],
        #                 'test_mask': dgl_graph.ndata['test_mask']
        #             },
        #             torch.vstack(dgl_graph.edges())
        #         )
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("reddit")
 class RedditDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.RedditDataset(
            raw_dir=os.path.join(path, '_dgl')
        )
        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
        super(RedditDataset, self).__init__(
            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
        )
        # super(RedditDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'feat': dgl_graph.ndata['feat'],
        #                 'label': dgl_graph.ndata['label'],
        #                 'train_mask': dgl_graph.ndata['train_mask'],
        #                 'val_mask': dgl_graph.ndata['val_mask'],
        #                 'test_mask': dgl_graph.ndata['test_mask']
        #             },
        #             torch.vstack(dgl_graph.edges())
        #         )
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("amazon_computers")
 class AmazonComputersDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.AmazonCoBuyComputerDataset(
            raw_dir=os.path.join(path, '_dgl')
        )
        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
        super(AmazonComputersDataset, self).__init__(
            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
        )
        # super(AmazonComputersDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'feat': dgl_graph.ndata['feat'],
        #                 'label': dgl_graph.ndata['label']
        #             },
        #             torch.vstack(dgl_graph.edges())
        #         )
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("amazon_photo")
 class AmazonPhotoDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.AmazonCoBuyPhotoDataset(
            raw_dir=os.path.join(path, '_dgl')
        )
        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
        super(AmazonPhotoDataset, self).__init__(
            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
        )
        # super(AmazonPhotoDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'feat': dgl_graph.ndata['feat'],
        #                 'label': dgl_graph.ndata['label']
        #             },
        #             torch.vstack(dgl_graph.edges())
        #         )
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("coauthor_physics")
 class CoauthorPhysicsDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.CoauthorPhysicsDataset(
            raw_dir=os.path.join(path, '_dgl')
        )
        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
        super(CoauthorPhysicsDataset, self).__init__(
            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
        )
        # super(CoauthorPhysicsDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'feat': dgl_graph.ndata['feat'],
        #                 'label': dgl_graph.ndata['label']
        #             },
        #             torch.vstack(dgl_graph.edges())
        #         )
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("coauthor_cs")
 class CoauthorCSDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.CoauthorCSDataset(
            raw_dir=os.path.join(path, '_dgl')
        )
        dgl_graph: dgl.DGLGraph = dgl_dataset[0]
        super(CoauthorCSDataset, self).__init__(
            [_conversion.dgl_graph_to_general_static_graph(dgl_graph)]
        )
        # super(CoauthorCSDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'feat': dgl_graph.ndata['feat'],
        #                 'label': dgl_graph.ndata['label']
        #             },
        #             torch.vstack(dgl_graph.edges())
        #         )
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("mutag")
 class MUTAGDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "MUTAG", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(MUTAGDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(MUTAGDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("enzymes")
 class ENZYMESDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.TUDataset(
            "ENZYMES", raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['node_attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['node_labels']
            del dgl_graph.ndata['node_attr']
            del dgl_graph.ndata['node_labels']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(ENZYMESDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(ENZYMESDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'node_labels': dgl_graph.ndata['node_labels'],
        #                 'node_attr': dgl_graph.ndata['node_attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': label}
        #         ) for (dgl_graph, label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("imdb-b")
 class IMDBBinaryDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "IMDBBINARY", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(IMDBBinaryDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(IMDBBinaryDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("imdb-m")
 class IMDBMultiDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "IMDBMULTI", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(IMDBMultiDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(IMDBMultiDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("reddit-b")
 class RedditBinaryDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "REDDITBINARY", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(RedditBinaryDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(RedditBinaryDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("reddit-multi-5k")
 class REDDITMulti5KDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "REDDITMULTI5K", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(REDDITMulti5KDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )

        # super(REDDITMulti5KDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("collab")
 class COLLABDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "COLLAB", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(COLLABDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(COLLABDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("proteins")
 class ProteinsDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "PROTEINS", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(ProteinsDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(ProteinsDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("ptc-mr")
 class PTCMRDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "PTC", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(PTCMRDataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(PTCMRDataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )


@DatasetUniversalRegistry.register_dataset("nci1")
 class NCI1Dataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        dgl_dataset = dgl.data.GINDataset(
            "NCI1", False, raw_dir=os.path.join(path, "_dgl")
        )

        def _transform(dgl_graph: dgl.DGLGraph, label: torch.Tensor):
            dgl_graph.ndata['feat'] = dgl_graph.ndata['attr']
            dgl_graph.ndata['node_label'] = dgl_graph.ndata['label']
            del dgl_graph.ndata['attr']
            del dgl_graph.ndata['label']
            static_graph = _conversion.dgl_graph_to_general_static_graph(dgl_graph)
            static_graph.data['label'] = label
            return static_graph

        super(NCI1Dataset, self).__init__(
            [_transform(dgl_graph, label) for (dgl_graph, label) in dgl_dataset]
        )
        # super(NCI1Dataset, self).__init__(
        #     [
        #         GeneralStaticGraphGenerator.create_homogeneous_static_graph(
        #             {
        #                 'label': dgl_graph.ndata['label'],
        #                 'attr': dgl_graph.ndata['attr']
        #             },
        #             torch.vstack(dgl_graph.edges()),
        #             graph_data={'label': graph_label}
        #         )
        #         for (dgl_graph, graph_label) in dgl_dataset
        #     ]
        # )
--- a/autogl/datasets/_gtn_data.py
+++ b/autogl/datasets/_gtn_data.py
@@ -0,0 +1,244 @@
 import os
 import os.path as osp
 import shutil
 import pickle
 import numpy as np
 import torch
 import typing as _typing

 from autogl.data import Data, download_url, InMemoryStaticGraphSet
 from autogl.data.graph import GeneralStaticGraphGenerator
 from ._dataset_registry import DatasetUniversalRegistry
 from ._data_source import OnlineDataSource
 from .. import backend as _backend


 def _untar(path, fname, delete_tar=True):
    """
    Unpacks the given archive file to the same directory, then (by default)
    deletes the archive file.
    """
    print("unpacking " + fname)
    full_path = os.path.join(path, fname)
    shutil.unpack_archive(full_path, path)
    if delete_tar:
        os.remove(full_path)


 class _GTNDataSource(OnlineDataSource):
    def __init__(self, path: str, name: str):
        self.__name: str = name
        self.__url: str = (
            f"https://github.com/cenyk1230/gtn-data/blob/master/{name}.zip?raw=true"
        )
        super(_GTNDataSource, self).__init__(path)
        self.__data = torch.load(list(self._processed_file_paths)[0])

    @property
    def _raw_filenames(self) -> _typing.Iterable[str]:
        return ["edges.pkl", "labels.pkl", "node_features.pkl"]

    @property
    def _processed_filenames(self) -> _typing.Iterable[str]:
        return ["data.pt"]

    def __read_gtn_data(self, directory):
        edges = pickle.load(open(osp.join(directory, "edges.pkl"), "rb"))
        labels = pickle.load(open(osp.join(directory, "labels.pkl"), "rb"))
        node_features = pickle.load(open(osp.join(directory, "node_features.pkl"), "rb"))

        data = Data()
        data.x = torch.from_numpy(node_features).float()

        num_nodes = edges[0].shape[0]

        node_type = np.zeros(num_nodes, dtype=int)
        assert len(edges) == 4
        assert len(edges[0].nonzero()) == 2

        node_type[edges[0].nonzero()[0]] = 0
        node_type[edges[0].nonzero()[1]] = 1
        node_type[edges[1].nonzero()[0]] = 1
        node_type[edges[1].nonzero()[1]] = 0
        node_type[edges[2].nonzero()[0]] = 0
        node_type[edges[2].nonzero()[1]] = 2
        node_type[edges[3].nonzero()[0]] = 2
        node_type[edges[3].nonzero()[1]] = 0

        print(node_type)
        data.pos = torch.from_numpy(node_type)

        edge_list = []
        for i, edge in enumerate(edges):
            edge_tmp = torch.from_numpy(
                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
            ).long()
            edge_list.append(edge_tmp)
        data.edge_index = torch.cat(edge_list, 1)

        A = []
        for i, edge in enumerate(edges):
            edge_tmp = torch.from_numpy(
                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
            ).long()
            value_tmp = torch.ones(edge_tmp.shape[1]).float()
            A.append((edge_tmp, value_tmp))
        edge_tmp = torch.stack(
            (torch.arange(0, num_nodes), torch.arange(0, num_nodes))
        ).long()
        value_tmp = torch.ones(num_nodes).float()
        A.append((edge_tmp, value_tmp))
        data.adj = A

        data.train_node = torch.from_numpy(np.array(labels[0])[:, 0]).long()
        data.train_target = torch.from_numpy(np.array(labels[0])[:, 1]).long()
        data.valid_node = torch.from_numpy(np.array(labels[1])[:, 0]).long()
        data.valid_target = torch.from_numpy(np.array(labels[1])[:, 1]).long()
        data.test_node = torch.from_numpy(np.array(labels[2])[:, 0]).long()
        data.test_target = torch.from_numpy(np.array(labels[2])[:, 1]).long()

        y = np.zeros(num_nodes, dtype=int)
        x_index = torch.cat((data.train_node, data.valid_node, data.test_node))
        y_index = torch.cat((data.train_target, data.valid_target, data.test_target))
        y[x_index.numpy()] = y_index.numpy()
        data.y = torch.from_numpy(y)
        self.__data = data

    def __transform_gtn_data(self):
        self.__data.train_mask: torch.Tensor = torch.zeros(self.__data.x.size(0), dtype=torch.bool)
        self.__data.val_mask: torch.Tensor = torch.zeros(self.__data.x.size(0), dtype=torch.bool)
        self.__data.test_mask: torch.Tensor = torch.zeros(self.__data.x.size(0), dtype=torch.bool)
        self.__data.train_mask[getattr(self.__data, "train_node")] = True
        self.__data.val_mask[getattr(self.__data, "valid_node")] = True
        self.__data.test_mask[getattr(self.__data, "test_node")] = True

    def _fetch(self):
        download_url(self.__url, self._raw_directory, name=f"{self.__name}.zip")
        _untar(self._raw_directory, f"{self.__name}.zip")

    def _process(self):
        self.__read_gtn_data(self._raw_directory)
        self.__transform_gtn_data()
        torch.save(self.__data, list(self._processed_file_paths)[0])

    def __len__(self) -> int:
        return 1

    def __getitem__(self, index):
        if index != 0:
            raise IndexError
        return self.__data


@DatasetUniversalRegistry.register_dataset("gtn-acm")
 class GTNACMDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        data = _GTNDataSource(path, "gtn-acm")[0]
        if _backend.DependentBackend.is_dgl():
            super(GTNACMDataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {
                            'feat': getattr(data, 'x'),
                            'label': getattr(data, 'y'),
                            'pos': getattr(data, 'pos'),
                            'train_mask': getattr(data, 'train_mask'),
                            'val_mask': getattr(data, 'val_mask'),
                            'test_mask': getattr(data, 'test_mask')
                        },
                        getattr(data, 'edge_index')
                    )
                ]
            )
        elif _backend.DependentBackend.is_pyg():
            super(GTNACMDataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {
                            'x': getattr(data, 'x'),
                            'y': getattr(data, 'y'),
                            'pos': getattr(data, 'pos'),
                            'train_mask': getattr(data, 'train_mask'),
                            'val_mask': getattr(data, 'val_mask'),
                            'test_mask': getattr(data, 'test_mask')
                        },
                        getattr(data, 'edge_index')
                    )
                ]
            )


@DatasetUniversalRegistry.register_dataset("gtn-dblp")
 class GTNDBLPDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        data = _GTNDataSource(path, "gtn-dblp")[0]
        if _backend.DependentBackend.is_dgl():
            super(GTNDBLPDataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {
                            'feat': getattr(data, 'x'),
                            'label': getattr(data, 'y'),
                            'pos': getattr(data, 'pos'),
                            'train_mask': getattr(data, 'train_mask'),
                            'val_mask': getattr(data, 'val_mask'),
                            'test_mask': getattr(data, 'test_mask')
                        },
                        getattr(data, 'edge_index')
                    )
                ]
            )
        elif _backend.DependentBackend.is_pyg():
            super(GTNDBLPDataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {
                            'x': getattr(data, 'x'),
                            'y': getattr(data, 'y'),
                            'pos': getattr(data, 'pos'),
                            'train_mask': getattr(data, 'train_mask'),
                            'val_mask': getattr(data, 'val_mask'),
                            'test_mask': getattr(data, 'test_mask')
                        },
                        getattr(data, 'edge_index')
                    )
                ]
            )


@DatasetUniversalRegistry.register_dataset("gtn-imdb")
 class GTNIMDBDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        data = _GTNDataSource(path, "gtn-imdb")[0]
        if _backend.DependentBackend.is_dgl():
            super(GTNIMDBDataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {
                            'feat': getattr(data, 'x'),
                            'label': getattr(data, 'y'),
                            'pos': getattr(data, 'pos'),
                            'train_mask': getattr(data, 'train_mask'),
                            'val_mask': getattr(data, 'val_mask'),
                            'test_mask': getattr(data, 'test_mask')
                        },
                        getattr(data, 'edge_index')
                    )
                ]
            )
        elif _backend.DependentBackend.is_pyg():
            super(GTNIMDBDataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {
                            'x': getattr(data, 'x'),
                            'y': getattr(data, 'y'),
                            'pos': getattr(data, 'pos'),
                            'train_mask': getattr(data, 'train_mask'),
                            'val_mask': getattr(data, 'val_mask'),
                            'test_mask': getattr(data, 'test_mask')
                        },
                        getattr(data, 'edge_index')
                    )
                ]
            )
--- a/autogl/datasets/_matlab_matrix.py
+++ b/autogl/datasets/_matlab_matrix.py
@@ -0,0 +1,112 @@
 import itertools
 import os

 import scipy.io
 import torch
 import typing as _typing

 from autogl.data import Data, download_url, InMemoryStaticGraphSet
 from autogl.data.graph import GeneralStaticGraphGenerator
 from ._dataset_registry import DatasetUniversalRegistry
 from ._data_source import OnlineDataSource
 from .. import backend as _backend


 class _MATLABMatrix(OnlineDataSource):
    @property
    def _raw_filenames(self) -> _typing.Iterable[str]:
        splits = [self.__name]
        files = ["mat"]
        return [
            "{}.{}".format(s, f) for s, f
            in itertools.product(splits, files)
        ]

    @property
    def _processed_filenames(self) -> _typing.Iterable[str]:
        return ["data.pt"]

    def _fetch(self):
        for name in self._raw_filenames:
            download_url(self.__url + name, self._raw_directory)

    def _process(self):
        path = os.path.join(self._raw_directory, f"{self.__name}.mat")
        mat = scipy.io.loadmat(path)
        adj_matrix, group = mat["network"], mat["group"]

        y = torch.from_numpy(group.todense()).to(torch.float)

        row_ind, col_ind = adj_matrix.nonzero()
        edge_index = torch.stack([torch.tensor(row_ind), torch.tensor(col_ind)], dim=0)
        edge_attr = torch.tensor(adj_matrix[row_ind, col_ind])
        data = Data(edge_index=edge_index, edge_attr=edge_attr, x=None, y=y)
        torch.save(data, list(self._processed_file_paths)[0])

    def __len__(self) -> int:
        return 1

    def __getitem__(self, index: int):
        if index != 0:
            raise IndexError
        return self.__data

    def __init__(self, path: str, name: str, url: str):
        self.__name: str = name
        self.__url: str = url
        super(_MATLABMatrix, self).__init__(path)
        self.__data = torch.load(
            list(self._processed_file_paths)[0]
        )


@DatasetUniversalRegistry.register_dataset("BlogCatalog".lower())
 class BlogCatalogDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        filename: str = "BlogCatalog".lower()
        url: str = "http://leitang.net/code/social-dimension/data/"
        data = _MATLABMatrix(path, filename, url)[0]
        if _backend.DependentBackend.is_dgl():
            super(BlogCatalogDataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {'label': data.y}, data.edge_index,
                        {'edge_attr': data.edge_attr}
                    )
                ]
            )
        elif _backend.DependentBackend.is_pyg():
            super(BlogCatalogDataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {'y': data.y}, data.edge_index,
                        {'edge_attr': data.edge_attr}
                    )
                ]
            )


@DatasetUniversalRegistry.register_dataset("WikiPEDIA".lower())
 class WIKIPEDIADataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        filename: str = "POS"
        url = "http://snap.stanford.edu/node2vec/"
        data = _MATLABMatrix(path, filename, url)[0]
        if _backend.DependentBackend.is_dgl():
            super(WIKIPEDIADataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {'label': data.y}, data.edge_index,
                        {'attr': data.edge_attr}
                    )
                ]
            )
        elif _backend.DependentBackend.is_pyg():
            super(WIKIPEDIADataset, self).__init__(
                [
                    GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                        {'y': data.y}, data.edge_index,
                        {'attr': data.edge_attr}
                    )
                ]
            )
--- a/autogl/datasets/_ogb.py
+++ b/autogl/datasets/_ogb.py
@@ -0,0 +1,445 @@
 import numpy as np
 import torch
 import typing as _typing
 from ogb.nodeproppred import NodePropPredDataset
 from ogb.linkproppred import LinkPropPredDataset
 from ogb.graphproppred import GraphPropPredDataset

 from autogl import backend as _backend
 from autogl.data import InMemoryStaticGraphSet
 from autogl.data.graph import (
    GeneralStaticGraph, GeneralStaticGraphGenerator
 )
 from ._dataset_registry import DatasetUniversalRegistry
 from .utils import index_to_mask


 class _OGBDatasetUtil:
    ...


 class _OGBNDatasetUtil(_OGBDatasetUtil):
    @classmethod
    def ogbn_data_to_general_static_graph(
            cls, ogbn_data: _typing.Mapping[str, _typing.Union[np.ndarray, int]],
            nodes_label: np.ndarray = ..., nodes_label_key: str = ...,
            train_index: _typing.Optional[np.ndarray] = ...,
            val_index: _typing.Optional[np.ndarray] = ...,
            test_index: _typing.Optional[np.ndarray] = ...,
            nodes_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
            edges_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
            graph_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...
    ) -> GeneralStaticGraph:
        homogeneous_static_graph: GeneralStaticGraph = (
            GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                dict([
                    (target_key, torch.from_numpy(ogbn_data[source_key]))
                    for source_key, target_key in nodes_data_key_mapping.items()
                ]),
                torch.from_numpy(ogbn_data['edge_index']),
                dict([
                    (target_key, torch.from_numpy(ogbn_data[source_key]))
                    for source_key, target_key in edges_data_key_mapping.items()
                ]) if isinstance(edges_data_key_mapping, _typing.Mapping) else ...,
                dict([
                    (target_key, torch.from_numpy(ogbn_data[source_key]))
                    for source_key, target_key in graph_data_key_mapping.items()
                ]) if isinstance(graph_data_key_mapping, _typing.Mapping) else ...
            )
        )
        if isinstance(nodes_label, np.ndarray) and isinstance(nodes_label_key, str):
            if ' ' in nodes_label_key:
                raise ValueError("Illegal nodes label key")
            homogeneous_static_graph.nodes.data[nodes_label_key] = (
                torch.from_numpy(nodes_label.squeeze()).squeeze()
            )
        if isinstance(train_index, np.ndarray):
            homogeneous_static_graph.nodes.data['train_mask'] = index_to_mask(
                torch.from_numpy(train_index), ogbn_data['num_nodes']
            )
        if isinstance(val_index, np.ndarray):
            homogeneous_static_graph.nodes.data['val_mask'] = index_to_mask(
                torch.from_numpy(val_index), ogbn_data['num_nodes']
            )
        if isinstance(test_index, np.ndarray):
            homogeneous_static_graph.nodes.data['test_mask'] = index_to_mask(
                torch.from_numpy(test_index), ogbn_data['num_nodes']
            )
        return homogeneous_static_graph

    @classmethod
    def ogbn_dataset_to_general_static_graph(
            cls, ogbn_dataset: NodePropPredDataset,
            nodes_label_key: str,
            nodes_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
            edges_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
            graph_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...
    ) -> GeneralStaticGraph:
        split_idx = ogbn_dataset.get_idx_split()
        return cls.ogbn_data_to_general_static_graph(
            ogbn_dataset[0][0],
            ogbn_dataset[0][1],
            nodes_label_key,
            split_idx["train"],
            split_idx["valid"],
            split_idx["test"],
            nodes_data_key_mapping,
            edges_data_key_mapping,
            graph_data_key_mapping
        )


@DatasetUniversalRegistry.register_dataset("ogbn-products")
 class OGBNProductsDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbn_dataset = NodePropPredDataset("ogbn-products", path)
        if _backend.DependentBackend.is_dgl():
            super(OGBNProductsDataset, self).__init__([
                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                    ogbn_dataset, "label",
                    {"node_feat": "feat"},
                    {"edge_feat": "edge_feat"}
                )
            ])
        elif _backend.DependentBackend.is_pyg():
            super(OGBNProductsDataset, self).__init__([
                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                    ogbn_dataset, "y",
                    {"node_feat": "x"}
                )
            ])


@DatasetUniversalRegistry.register_dataset("ogbn-proteins")
 class OGBNProteinsDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbn_dataset = NodePropPredDataset("ogbn-proteins", path)
        if _backend.DependentBackend.is_dgl():
            super(OGBNProteinsDataset, self).__init__([
                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                    ogbn_dataset, "label",
                    {"node_species": "species"},
                    {"edge_feat": "edge_feat"}
                )
            ])
        elif _backend.DependentBackend.is_pyg():
            super(OGBNProteinsDataset, self).__init__([
                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                    ogbn_dataset, "y",
                    {"node_species": "species"},
                    {"edge_feat": "edge_feat"}
                )
            ])


@DatasetUniversalRegistry.register_dataset("ogbn-arxiv")
 class OGBNArxivDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbn_dataset = NodePropPredDataset("ogbn-arxiv", path)
        if _backend.DependentBackend.is_dgl():
            super(OGBNArxivDataset, self).__init__([
                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                    ogbn_dataset, "label",
                    {
                        "node_feat": "feat",
                        "node_year": "year"
                    }
                )
            ])
        elif _backend.DependentBackend.is_pyg():
            super(OGBNArxivDataset, self).__init__([
                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                    ogbn_dataset, "y",
                    {
                        "node_feat": "x",
                        "node_year": "year"
                    }
                )
            ])


@DatasetUniversalRegistry.register_dataset("ogbn-papers100M")
 class OGBNPapers100MDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbn_dataset = NodePropPredDataset("ogbn-papers100M", path)
        if _backend.DependentBackend.is_dgl():
            super(OGBNPapers100MDataset, self).__init__([
                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                    ogbn_dataset, "label",
                    {
                        "node_feat": "feat",
                        "node_year": "year"
                    }
                )
            ])
        elif _backend.DependentBackend.is_pyg():
            super(OGBNPapers100MDataset, self).__init__([
                _OGBNDatasetUtil.ogbn_dataset_to_general_static_graph(
                    ogbn_dataset, "y",
                    {
                        "node_feat": "x",
                        "node_year": "year"
                    }
                )
            ])


 # todo: currently homogeneous dataset `ogbn-mag` NOT supported


 class _OGBLDatasetUtil(_OGBDatasetUtil):
    @classmethod
    def ogbl_data_to_general_static_graph(
            cls, ogbl_data: _typing.Mapping[str, _typing.Union[np.ndarray, int]],
            heterogeneous_edges: _typing.Mapping[
                _typing.Tuple[str, str, str],
                _typing.Union[
                    torch.Tensor,
                    _typing.Tuple[torch.Tensor, _typing.Optional[_typing.Mapping[str, torch.Tensor]]]
                ]
            ] = ...,
            nodes_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...,
            graph_data_key_mapping: _typing.Optional[_typing.Mapping[str, str]] = ...
    ) -> GeneralStaticGraph:
        return GeneralStaticGraphGenerator.create_heterogeneous_static_graph(
            {
                '': dict([
                    (target_data_key, torch.from_numpy(ogbl_data[source_data_key]).squeeze())
                    for source_data_key, target_data_key in nodes_data_key_mapping.items()
                ])
            },
            heterogeneous_edges,
            dict([
                (target_data_key, torch.from_numpy(ogbl_data[source_data_key]).squeeze())
                for source_data_key, target_data_key in graph_data_key_mapping.items()
            ]) if isinstance(graph_data_key_mapping, _typing.Mapping) else ...
        )


@DatasetUniversalRegistry.register_dataset("ogbl-ppa")
 class OGBLPPADataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbl_dataset = LinkPropPredDataset("ogbl-ppa", path)
        edge_split = ogbl_dataset.get_edge_split()
        super(OGBLPPADataset, self).__init__([
            _OGBLDatasetUtil.ogbl_data_to_general_static_graph(
                ogbl_dataset[0], {
                    ('', '', ''): torch.from_numpy(ogbl_dataset[0]['edge_index']),
                    ('', 'train_pos_edge', ''): torch.from_numpy(edge_split['train']['edge']),
                    ('', 'val_pos_edge', ''): torch.from_numpy(edge_split['valid']['edge']),
                    ('', 'val_neg_edge', ''): torch.from_numpy(edge_split['valid']['edge_neg']),
                    ('', 'test_pos_edge', ''): torch.from_numpy(edge_split['test']['edge']),
                    ('', 'test_neg_edge', ''): torch.from_numpy(edge_split['test']['edge_neg'])
                },
                {'node_feat': 'feat'} if _backend.DependentBackend.is_dgl() else {'node_feat': 'x'}
            )
        ])


@DatasetUniversalRegistry.register_dataset("ogbl-collab")
 class OGBLCOLLABDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbl_dataset = LinkPropPredDataset("ogbl-collab", path)
        edge_split = ogbl_dataset.get_edge_split()
        super(OGBLCOLLABDataset, self).__init__([
            _OGBLDatasetUtil.ogbl_data_to_general_static_graph(
                ogbl_dataset[0], {
                    ('', '', ''): torch.from_numpy(ogbl_dataset[0]['edge_index']),
                    ('', 'train_pos_edge', ''): (
                        torch.from_numpy(edge_split['train']['edge']),
                        {
                            'weight': torch.from_numpy(edge_split['train']['weight']),
                            'year': torch.from_numpy(edge_split['train']['year'])
                        }
                    ),
                    ('', 'val_pos_edge', ''): (
                        torch.from_numpy(edge_split['valid']['edge']),
                        {
                            'weight': torch.from_numpy(edge_split['valid']['weight']),
                            'year': torch.from_numpy(edge_split['valid']['year'])
                        }
                    ),
                    ('', 'val_neg_edge', ''): torch.from_numpy(edge_split['valid']['edge_neg']),
                    ('', 'test_pos_edge', ''): (
                        torch.from_numpy(edge_split['test']['edge']),
                        {
                            'weight': torch.from_numpy(edge_split['test']['weight']),
                            'year': torch.from_numpy(edge_split['test']['year'])
                        }
                    ),
                    ('', 'test_neg_edge', ''): torch.from_numpy(edge_split['test']['edge_neg'])
                },
                {'node_feat': 'feat'} if _backend.DependentBackend.is_dgl() else {'node_feat': 'x'}
            )
        ])


@DatasetUniversalRegistry.register_dataset("ogbl-ddi")
 class OGBLDDIDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbl_dataset = LinkPropPredDataset("ogbl-ddi", path)
        edge_split = ogbl_dataset.get_edge_split()
        super(OGBLDDIDataset, self).__init__([
            GeneralStaticGraphGenerator.create_heterogeneous_static_graph(
                {'': {'_NID': torch.arange(ogbl_dataset[0]['num_nodes'])}},
                {
                    ('', '', ''): torch.from_numpy(ogbl_dataset[0]['edge_index']),
                    ('', 'train_pos_edge', ''): torch.from_numpy(edge_split['train']['edge']),
                    ('', 'val_pos_edge', ''): torch.from_numpy(edge_split['valid']['edge']),
                    ('', 'val_neg_edge', ''): torch.from_numpy(edge_split['valid']['edge_neg']),
                    ('', 'test_pos_edge', ''): torch.from_numpy(edge_split['test']['edge']),
                    ('', 'test_neg_edge', ''): torch.from_numpy(edge_split['test']['edge_neg'])
                }
            )
        ])


@DatasetUniversalRegistry.register_dataset("ogbl-citation")
@DatasetUniversalRegistry.register_dataset("ogbl-citation2")
 class OGBLCitation2Dataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbl_dataset = LinkPropPredDataset("ogbl-citation2", path)
        edge_split = ogbl_dataset.get_edge_split()
        super(OGBLCitation2Dataset, self).__init__([
            _OGBLDatasetUtil.ogbl_data_to_general_static_graph(
                ogbl_dataset[0],
                {
                    ('', '', ''): torch.from_numpy(ogbl_dataset[0]['edge_index']),
                    ('', 'train_pos_edge', ''): torch.from_numpy(edge_split['train']['edge']),
                    ('', 'val_pos_edge', ''): torch.from_numpy(edge_split['valid']['edge']),
                    ('', 'val_neg_edge', ''): torch.from_numpy(edge_split['valid']['edge_neg']),
                    ('', 'test_pos_edge', ''): torch.from_numpy(edge_split['test']['edge']),
                    ('', 'test_neg_edge', ''): torch.from_numpy(edge_split['test']['edge_neg'])
                },
                (
                    {'node_feat': 'feat', 'node_year': 'year'}
                    if _backend.DependentBackend.is_dgl()
                    else {'node_feat': 'x', 'node_year': 'year'}
                )
            )
        ])


 # todo: currently homogeneous dataset `ogbl-wikikg2` and `ogbl-biokg` NOT supported


 class _OGBGDatasetUtil:
    ...


@DatasetUniversalRegistry.register_dataset("ogbg-molhiv")
 class OGBGMOLHIVDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbl_dataset = GraphPropPredDataset("ogbg-molhiv", path)
        idx_split: _typing.Mapping[str, np.ndarray] = ogbl_dataset.get_idx_split()
        train_index: _typing.Any = idx_split['train'].tolist()
        test_index: _typing.Any = idx_split['test'].tolist()
        val_index: _typing.Any = idx_split['valid'].tolist()
        super(OGBGMOLHIVDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    (
                        {"feat": torch.from_numpy(data['node_feat'])}
                        if _backend.DependentBackend.is_dgl()
                        else {"x": torch.from_numpy(data['node_feat'])}
                    ),
                    torch.from_numpy(data['edge_index']),
                    {'edge_feat': torch.from_numpy(data['edge_feat'])},
                    (
                        {'label': torch.from_numpy(label)}
                        if _backend.DependentBackend.is_dgl()
                        else {'y': torch.from_numpy(label)}
                    )
                ) for data, label in ogbl_dataset
            ],
            train_index, val_index, test_index
        )


@DatasetUniversalRegistry.register_dataset("ogbg-molpcba")
 class OGBGMOLPCBADataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbl_dataset = GraphPropPredDataset("ogbg-molhiv", path)
        idx_split: _typing.Mapping[str, np.ndarray] = ogbl_dataset.get_idx_split()
        train_index: _typing.Any = idx_split['train'].tolist()
        test_index: _typing.Any = idx_split['test'].tolist()
        val_index: _typing.Any = idx_split['valid'].tolist()
        super(OGBGMOLPCBADataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    (
                        {"feat": torch.from_numpy(data['node_feat'])}
                        if _backend.DependentBackend.is_dgl()
                        else {"x": torch.from_numpy(data['node_feat'])}
                    ),
                    torch.from_numpy(data['edge_index']),
                    {'edge_feat': torch.from_numpy(data['edge_feat'])},
                    (
                        {'label': torch.from_numpy(label)}
                        if _backend.DependentBackend.is_dgl()
                        else {'y': torch.from_numpy(label)}
                    )
                ) for data, label in ogbl_dataset
            ],
            train_index, val_index, test_index
        )


@DatasetUniversalRegistry.register_dataset("ogbg-ppa")
 class OGBGPPADataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbl_dataset = GraphPropPredDataset("ogbg-molhiv", path)
        idx_split: _typing.Mapping[str, np.ndarray] = ogbl_dataset.get_idx_split()
        train_index: _typing.Any = idx_split['train'].tolist()
        test_index: _typing.Any = idx_split['test'].tolist()
        val_index: _typing.Any = idx_split['valid'].tolist()
        super(OGBGPPADataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'_NID': torch.arange(data['num_nodes'])},
                    torch.from_numpy(data['edge_index']),
                    {'edge_feat': torch.from_numpy(data['edge_feat'])},
                    (
                        {'label': torch.from_numpy(label)}
                        if _backend.DependentBackend.is_dgl()
                        else {'y': torch.from_numpy(label)}
                    )
                ) for data, label in ogbl_dataset
            ],
            train_index, val_index, test_index
        )


@DatasetUniversalRegistry.register_dataset("ogbg-code")
@DatasetUniversalRegistry.register_dataset("ogbg-code2")
 class OGBGCode2Dataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        ogbl_dataset = GraphPropPredDataset("ogbg-molhiv", path)
        idx_split: _typing.Mapping[str, np.ndarray] = ogbl_dataset.get_idx_split()
        train_index: _typing.Any = idx_split['train'].tolist()
        test_index: _typing.Any = idx_split['test'].tolist()
        val_index: _typing.Any = idx_split['valid'].tolist()
        super(OGBGCode2Dataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    (
                        {
                            "feat": torch.from_numpy(data['node_feat']),
                            "node_is_attributed": torch.from_numpy(data["node_is_attributed"]),
                            "node_dfs_order": torch.from_numpy(data["node_dfs_order"]),
                            "node_depth": torch.from_numpy(data["node_depth"])
                        }
                        if _backend.DependentBackend.is_dgl()
                        else
                        {
                            "x": torch.from_numpy(data['node_feat']),
                            "node_is_attributed": torch.from_numpy(data["node_is_attributed"]),
                            "node_dfs_order": torch.from_numpy(data["node_dfs_order"]),
                            "node_depth": torch.from_numpy(data["node_depth"])
                        }
                    ),
                    torch.from_numpy(data['edge_index'])
                ) for data, label in ogbl_dataset
            ],
            train_index, val_index, test_index
        )
--- a/autogl/datasets/_pyg.py
+++ b/autogl/datasets/_pyg.py
@@ -0,0 +1,567 @@
 import os
 from autogl.data.graph import GeneralStaticGraphGenerator
 from autogl.data import InMemoryStaticGraphSet
 from ._dataset_registry import DatasetUniversalRegistry
 import torch_geometric
 from torch_geometric.datasets import (
    Amazon, Coauthor, Flickr, ModelNet,
    Planetoid, PPI, QM9, Reddit, TUDataset
 )


@DatasetUniversalRegistry.register_dataset("cora")
 class CoraDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Planetoid(os.path.join(path, '_pyg'), "Cora")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]

        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {
                'x': pyg_data.x,
                'y': pyg_data.y,
                'train_mask': getattr(pyg_data, 'train_mask'),
                'val_mask': getattr(pyg_data, 'val_mask'),
                'test_mask': getattr(pyg_data, 'test_mask')
            },
            pyg_data.edge_index
        )
        super(CoraDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("CiteSeer".lower())
 class CiteSeerDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Planetoid(os.path.join(path, '_pyg'), "CiteSeer")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]

        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {
                'x': pyg_data.x,
                'y': pyg_data.y,
                'train_mask': getattr(pyg_data, 'train_mask'),
                'val_mask': getattr(pyg_data, 'val_mask'),
                'test_mask': getattr(pyg_data, 'test_mask')
            },
            pyg_data.edge_index
        )
        super(CiteSeerDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("PubMed".lower())
 class PubMedDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Planetoid(os.path.join(path, '_pyg'), "PubMed")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]

        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {
                'x': pyg_data.x,
                'y': pyg_data.y,
                'train_mask': getattr(pyg_data, 'train_mask'),
                'val_mask': getattr(pyg_data, 'val_mask'),
                'test_mask': getattr(pyg_data, 'test_mask')
            },
            pyg_data.edge_index
        )
        super(PubMedDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("flickr")
 class FlickrDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Flickr(os.path.join(path, '_pyg'))
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]

        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {
                'x': pyg_data.x,
                'y': pyg_data.y,
                'train_mask': getattr(pyg_data, 'train_mask'),
                'val_mask': getattr(pyg_data, 'val_mask'),
                'test_mask': getattr(pyg_data, 'test_mask')
            },
            pyg_data.edge_index
        )
        super(FlickrDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("reddit")
 class RedditDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Reddit(os.path.join(path, '_pyg'))
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]

        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {
                'x': pyg_data.x,
                'y': pyg_data.y,
                'train_mask': getattr(pyg_data, 'train_mask'),
                'val_mask': getattr(pyg_data, 'val_mask'),
                'test_mask': getattr(pyg_data, 'test_mask')
            },
            pyg_data.edge_index
        )
        super(RedditDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("amazon_computers")
 class AmazonComputersDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Amazon(os.path.join(path, '_pyg'), "Computers")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]
        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {'x': pyg_data.x, 'y': pyg_data.y},
            pyg_data.edge_index
        )
        super(AmazonComputersDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("amazon_photo")
 class AmazonPhotoDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Amazon(os.path.join(path, '_pyg'), "Photo")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]
        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {'x': pyg_data.x, 'y': pyg_data.y},
            pyg_data.edge_index
        )
        super(AmazonPhotoDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("coauthor_physics")
 class CoauthorPhysicsDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Coauthor(os.path.join(path, '_pyg'), "Physics")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]
        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {'x': pyg_data.x, 'y': pyg_data.y},
            pyg_data.edge_index
        )
        super(CoauthorPhysicsDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("coauthor_cs")
 class CoauthorCSDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = Coauthor(os.path.join(path, '_pyg'), "CS")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        pyg_data = pyg_dataset[0]
        static_graph = GeneralStaticGraphGenerator.create_homogeneous_static_graph(
            {'x': pyg_data.x, 'y': pyg_data.y},
            pyg_data.edge_index
        )
        super(CoauthorCSDataset, self).__init__([static_graph])


@DatasetUniversalRegistry.register_dataset("ppi")
 class PPIDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        train_dataset = PPI(os.path.join(path, '_pyg'), 'train')
        if hasattr(train_dataset, "__data_list__"):
            delattr(train_dataset, "__data_list__")
        if hasattr(train_dataset, "_data_list"):
            delattr(train_dataset, "_data_list")
        val_dataset = PPI(os.path.join(path, '_pyg'), 'val')
        if hasattr(val_dataset, "__data_list__"):
            delattr(val_dataset, "__data_list__")
        if hasattr(val_dataset, "_data_list"):
            delattr(val_dataset, "_data_list")
        test_dataset = PPI(os.path.join(path, '_pyg'), 'test')
        if hasattr(test_dataset, "__data_list__"):
            delattr(test_dataset, "__data_list__")
        if hasattr(test_dataset, "_data_list"):
            delattr(test_dataset, "_data_list")
        train_index = range(len(train_dataset))
        val_index = range(len(train_dataset), len(train_dataset) + len(val_dataset))
        test_index = range(
            len(train_dataset) + len(val_dataset),
            len(train_dataset) + len(val_dataset) + len(test_dataset)
        )
        super(PPIDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': data.x, 'y': data.y}, data.edge_index
                ) for data in train_dataset
            ] +
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': data.x, 'y': data.y}, data.edge_index
                ) for data in val_dataset
            ] +
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': data.x, 'y': data.y}, data.edge_index
                ) for data in test_dataset
            ],
            train_index, val_index, test_index
        )


@DatasetUniversalRegistry.register_dataset("qm9")
 class QM9Dataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = QM9(os.path.join(path, '_pyg'))
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(QM9Dataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': data.x, 'pos': data.pos, 'z': data.z},
                    data.edge_index,
                    edges_data={'edge_attr': data.edge_attr},
                    graph_data={'idx': data.idx, 'y': data.y}
                ) for data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("mutag")
 class MUTAGDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "MUTAG")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(MUTAGDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': pyg_data.x}, pyg_data.edge_index,
                    edges_data={'edge_attr': pyg_data.edge_attr},
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("enzymes")
 class ENZYMESDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "ENZYMES")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(ENZYMESDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': pyg_data.x}, pyg_data.edge_index,
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("imdb-b")
 class IMDBBinaryDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "IMDB-BINARY")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(IMDBBinaryDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("imdb-m")
 class IMDBMultiDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "IMDB-MULTI")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(IMDBMultiDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("reddit-b")
 class RedditBinaryDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "REDDIT-BINARY")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(RedditBinaryDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("reddit-multi-5k")
 class REDDITMulti5KDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "REDDIT-MULTI-5K")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(REDDITMulti5KDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("reddit-multi-12k")
 class REDDITMulti12KDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "REDDIT-MULTI-12K")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(REDDITMulti12KDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("collab")
 class COLLABDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "COLLAB")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(COLLABDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("proteins")
 class ProteinsDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "PROTEINS")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(ProteinsDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': pyg_data.x}, pyg_data.edge_index, graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("ptc-mr")
 class PTCMRDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "PTC_MR")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(PTCMRDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': pyg_data.x}, pyg_data.edge_index,
                    edges_data={'edge_attr': pyg_data.edge_attr},
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("nci1")
 class NCI1Dataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "NCI1")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(NCI1Dataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': pyg_data.x}, pyg_data.edge_index,
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("nci109")
 class NCI109Dataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = TUDataset(os.path.join(path, '_pyg'), "NCI109")
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(NCI109Dataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'x': pyg_data.x}, pyg_data.edge_index,
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("ModelNet10Training")
 class ModelNet10TrainingDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = ModelNet(
            os.path.join(path, '_pyg'), '10', True,
            pre_transform=torch_geometric.transforms.FaceToEdge()
        )
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(ModelNet10TrainingDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'pos': pyg_data.pos},
                    pyg_data.edge_index,
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("ModelNet10Test")
 class ModelNet10TestDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = ModelNet(
            os.path.join(path, '_pyg'), '10', False,
            pre_transform=torch_geometric.transforms.FaceToEdge()
        )
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(ModelNet10TestDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'pos': pyg_data.pos},
                    pyg_data.edge_index,
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("ModelNet40Training")
 class ModelNet40TrainingDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = ModelNet(
            os.path.join(path, '_pyg'), '40', True,
            pre_transform=torch_geometric.transforms.FaceToEdge()
        )
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(ModelNet40TrainingDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'pos': pyg_data.pos},
                    pyg_data.edge_index,
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )


@DatasetUniversalRegistry.register_dataset("ModelNet40Test")
 class ModelNet40TestDataset(InMemoryStaticGraphSet):
    def __init__(self, path: str):
        pyg_dataset = ModelNet(
            os.path.join(path, '_pyg'), '40', False,
            pre_transform=torch_geometric.transforms.FaceToEdge()
        )
        if hasattr(pyg_dataset, "__data_list__"):
            delattr(pyg_dataset, "__data_list__")
        if hasattr(pyg_dataset, "_data_list"):
            delattr(pyg_dataset, "_data_list")
        super(ModelNet40TestDataset, self).__init__(
            [
                GeneralStaticGraphGenerator.create_homogeneous_static_graph(
                    {'pos': pyg_data.pos},
                    pyg_data.edge_index,
                    graph_data={'y': pyg_data.y}
                )
                for pyg_data in pyg_dataset
            ]
        )
--- a/autogl/datasets/gatne.py
+++ b/autogl/datasets/gatne.py
@@ -1,113 +0,0 @@
 import os.path as osp
 import sys

 import torch

 from ..data import Data, Dataset, download_url

 from . import register_dataset


 def read_gatne_data(folder):
    train_data = {}
    with open(osp.join(folder, "{}".format("train.txt")), "r") as f:
        for line in f:
            items = line.strip().split()
            if items[0] not in train_data:
                train_data[items[0]] = []
            train_data[items[0]].append([int(items[1]), int(items[2])])

    valid_data = {}
    with open(osp.join(folder, "{}".format("valid.txt")), "r") as f:
        for line in f:
            items = line.strip().split()
            if items[0] not in valid_data:
                valid_data[items[0]] = [[], []]
            valid_data[items[0]][1 - int(items[3])].append(
                [int(items[1]), int(items[2])]
            )

    test_data = {}
    with open(osp.join(folder, "{}".format("test.txt")), "r") as f:
        for line in f:
            items = line.strip().split()
            if items[0] not in test_data:
                test_data[items[0]] = [[], []]
            test_data[items[0]][1 - int(items[3])].append(
                [int(items[1]), int(items[2])]
            )

    data = Data()
    data.train_data = train_data
    data.valid_data = valid_data
    data.test_data = test_data
    return data


 class GatneDataset(Dataset):
    r"""The network datasets "Amazon", "Twitter" and "YouTube" from the
    `"Representation Learning for Attributed Multiplex Heterogeneous Network"
    <https://arxiv.org/abs/1905.01669>`_ paper.

    Args:
        root (string): Root directory where the dataset should be saved.
        name (string): The name of the dataset (:obj:`"Amazon"`,
            :obj:`"Twitter"`, :obj:`"YouTube"`).
    """

    url = "https://github.com/THUDM/GATNE/raw/master/data"

    def __init__(self, root, name):
        self.name = name
        super(GatneDataset, self).__init__(root)
        self.data = torch.load(self.processed_paths[0])

    @property
    def raw_file_names(self):
        names = ["train.txt", "valid.txt", "test.txt"]
        return names

    @property
    def processed_file_names(self):
        return ["data.pt"]

    def get(self, idx):
        assert idx == 0
        return self.data

    def download(self):
        for name in self.raw_file_names:
            download_url(
                "{}/{}/{}".format(self.url, self.name.lower(), name), self.raw_dir
            )

    def process(self):
        data = read_gatne_data(self.raw_dir)
        torch.save(data, self.processed_paths[0])

    def __repr__(self):
        return "{}()".format(self.name)


@register_dataset("amazon")
 class AmazonDataset(GatneDataset):
    def __init__(self, path):
        dataset = "amazon"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(AmazonDataset, self).__init__(path, dataset)


@register_dataset("twitter")
 class TwitterDataset(GatneDataset):
    def __init__(self, path):
        dataset = "twitter"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(TwitterDataset, self).__init__(path, dataset)


@register_dataset("youtube")
 class YouTubeDataset(GatneDataset):
    def __init__(self, path):
        dataset = "youtube"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(YouTubeDataset, self).__init__(path, dataset)
--- a/autogl/datasets/gtn_data.py
+++ b/autogl/datasets/gtn_data.py
@@ -1,188 +0,0 @@
 import sys
 import time
 import os
 import os.path as osp
 import requests
 import shutil
 import tqdm
 import pickle
 import numpy as np

 import torch

 from ..data import Data, Dataset, download_url

 from . import register_dataset


 def untar(path, fname, deleteTar=True):
    """
    Unpacks the given archive file to the same directory, then (by default)
    deletes the archive file.
    """
    print("unpacking " + fname)
    fullpath = os.path.join(path, fname)
    shutil.unpack_archive(fullpath, path)
    if deleteTar:
        os.remove(fullpath)


 class GTNDataset(Dataset):
    r"""The network datasets "ACM", "DBLP" and "IMDB" from the
    `"Graph Transformer Networks"
    <https://arxiv.org/abs/1911.06455>`_ paper.

    Args:
        root (string): Root directory where the dataset should be saved.
        name (string): The name of the dataset (:obj:`"gtn-acm"`,
            :obj:`"gtn-dblp"`, :obj:`"gtn-imdb"`).
    """

    def __init__(self, root, name):
        self.name = name
        self.url = (
            f"https://github.com/cenyk1230/gtn-data/blob/master/{name}.zip?raw=true"
        )
        super(GTNDataset, self).__init__(root)
        self.data = torch.load(self.processed_paths[0])
        self.num_classes = torch.max(self.data.train_target).item() + 1
        self.num_edge = len(self.data.adj)
        self.num_nodes = self.data.x.shape[0]

    @property
    def raw_file_names(self):
        names = ["edges.pkl", "labels.pkl", "node_features.pkl"]
        return names

    @property
    def processed_file_names(self):
        return ["data.pt"]

    def read_gtn_data(self, folder):
        edges = pickle.load(open(osp.join(folder, "edges.pkl"), "rb"))
        labels = pickle.load(open(osp.join(folder, "labels.pkl"), "rb"))
        node_features = pickle.load(open(osp.join(folder, "node_features.pkl"), "rb"))

        data = Data()
        data.x = torch.from_numpy(node_features).type(torch.FloatTensor)

        num_nodes = edges[0].shape[0]

        node_type = np.zeros((num_nodes), dtype=int)
        assert len(edges) == 4
        assert len(edges[0].nonzero()) == 2

        node_type[edges[0].nonzero()[0]] = 0
        node_type[edges[0].nonzero()[1]] = 1
        node_type[edges[1].nonzero()[0]] = 1
        node_type[edges[1].nonzero()[1]] = 0
        node_type[edges[2].nonzero()[0]] = 0
        node_type[edges[2].nonzero()[1]] = 2
        node_type[edges[3].nonzero()[0]] = 2
        node_type[edges[3].nonzero()[1]] = 0

        print(node_type)
        data.pos = torch.from_numpy(node_type)

        edge_list = []
        for i, edge in enumerate(edges):
            edge_tmp = torch.from_numpy(
                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
            ).type(torch.LongTensor)
            edge_list.append(edge_tmp)
        data.edge_index = torch.cat(edge_list, 1)

        A = []
        for i, edge in enumerate(edges):
            edge_tmp = torch.from_numpy(
                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
            ).type(torch.LongTensor)
            value_tmp = torch.ones(edge_tmp.shape[1]).type(torch.FloatTensor)
            A.append((edge_tmp, value_tmp))
        edge_tmp = torch.stack(
            (torch.arange(0, num_nodes), torch.arange(0, num_nodes))
        ).type(torch.LongTensor)
        value_tmp = torch.ones(num_nodes).type(torch.FloatTensor)
        A.append((edge_tmp, value_tmp))
        data.adj = A

        data.train_node = torch.from_numpy(np.array(labels[0])[:, 0]).type(
            torch.LongTensor
        )
        data.train_target = torch.from_numpy(np.array(labels[0])[:, 1]).type(
            torch.LongTensor
        )
        data.valid_node = torch.from_numpy(np.array(labels[1])[:, 0]).type(
            torch.LongTensor
        )
        data.valid_target = torch.from_numpy(np.array(labels[1])[:, 1]).type(
            torch.LongTensor
        )
        data.test_node = torch.from_numpy(np.array(labels[2])[:, 0]).type(
            torch.LongTensor
        )
        data.test_target = torch.from_numpy(np.array(labels[2])[:, 1]).type(
            torch.LongTensor
        )

        y = np.zeros((num_nodes), dtype=int)
        x_index = torch.cat((data.train_node, data.valid_node, data.test_node))
        y_index = torch.cat((data.train_target, data.valid_target, data.test_target))
        y[x_index.numpy()] = y_index.numpy()
        data.y = torch.from_numpy(y)
        self.data = data

    def get(self, idx):
        assert idx == 0
        return self.data

    def apply_to_device(self, device):
        self.data.x = self.data.x.to(device)

        self.data.train_node = self.data.train_node.to(device)
        self.data.valid_node = self.data.valid_node.to(device)
        self.data.test_node = self.data.test_node.to(device)

        self.data.train_target = self.data.train_target.to(device)
        self.data.valid_target = self.data.valid_target.to(device)
        self.data.test_target = self.data.test_target.to(device)

        new_adj = []
        for (t1, t2) in self.data.adj:
            new_adj.append((t1.to(device), t2.to(device)))
        self.data.adj = new_adj

    def download(self):
        download_url(self.url, self.raw_dir, name=self.name + ".zip")
        untar(self.raw_dir, self.name + ".zip")

    def process(self):
        self.read_gtn_data(self.raw_dir)
        torch.save(self.data, self.processed_paths[0])

    def __repr__(self):
        return "{}()".format(self.name)


@register_dataset("gtn-acm")
 class ACM_GTNDataset(GTNDataset):
    def __init__(self, path):
        dataset = "gtn-acm"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(ACM_GTNDataset, self).__init__(path, dataset)


@register_dataset("gtn-dblp")
 class DBLP_GTNDataset(GTNDataset):
    def __init__(self, path):
        dataset = "gtn-dblp"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(DBLP_GTNDataset, self).__init__(path, dataset)


@register_dataset("gtn-imdb")
 class IMDB_GTNDataset(GTNDataset):
    def __init__(self, path):
        dataset = "gtn-imdb"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(IMDB_GTNDataset, self).__init__(path, dataset)
--- a/autogl/datasets/han_data.py
+++ b/autogl/datasets/han_data.py
@@ -1,187 +0,0 @@
 import sys
 import time
 import os
 import os.path as osp
 import requests
 import shutil
 import tqdm
 import pickle
 import numpy as np
 import scipy.io as sio
 import scipy.sparse as sp

 import torch

 from ..data import Data, Dataset, download_url

 from . import register_dataset


 def untar(path, fname, deleteTar=True):
    """
    Unpacks the given archive file to the same directory, then (by default)
    deletes the archive file.
    """
    print("unpacking " + fname)
    fullpath = os.path.join(path, fname)
    shutil.unpack_archive(fullpath, path)
    if deleteTar:
        os.remove(fullpath)


 def sample_mask(idx, l):
    """Create mask."""
    mask = np.zeros(l)
    mask[idx] = 1
    return np.array(mask, dtype=np.bool)


 class HANDataset(Dataset):
    r"""The network datasets "ACM", "DBLP" and "IMDB" from the
    `"Heterogeneous Graph Attention Network"
    <https://arxiv.org/abs/1903.07293>`_ paper.

    Args:
        root (string): Root directory where the dataset should be saved.
        name (string): The name of the dataset (:obj:`"han-acm"`,
            :obj:`"han-dblp"`, :obj:`"han-imdb"`).
    """

    def __init__(self, root, name):
        self.name = name
        self.url = (
            f"https://github.com/cenyk1230/han-data/blob/master/{name}.zip?raw=true"
        )
        super(HANDataset, self).__init__(root)
        self.data = torch.load(self.processed_paths[0])
        self.num_classes = torch.max(self.data.train_target).item() + 1
        self.num_edge = len(self.data.adj)
        self.num_nodes = self.data.x.shape[0]

    @property
    def raw_file_names(self):
        names = ["data.mat"]
        return names

    @property
    def processed_file_names(self):
        return ["data.pt"]

    def read_gtn_data(self, folder):
        data = sio.loadmat(osp.join(folder, "data.mat"))
        if self.name == "han-acm" or self.name == "han-imdb":
            truelabels, truefeatures = data["label"], data["feature"].astype(float)
        elif self.name == "han-dblp":
            truelabels, truefeatures = data["label"], data["features"].astype(float)
        num_nodes = truefeatures.shape[0]
        if self.name == "han-acm":
            rownetworks = [
                data["PAP"] - np.eye(num_nodes),
                data["PLP"] - np.eye(num_nodes),
            ]
        elif self.name == "han-dblp":
            rownetworks = [
                data["net_APA"] - np.eye(num_nodes),
                data["net_APCPA"] - np.eye(num_nodes),
                data["net_APTPA"] - np.eye(num_nodes),
            ]
        elif self.name == "han-imdb":
            rownetworks = [
                data["MAM"] - np.eye(num_nodes),
                data["MDM"] - np.eye(num_nodes),
                data["MYM"] - np.eye(num_nodes),
            ]

        y = truelabels
        train_idx = data["train_idx"]
        val_idx = data["val_idx"]
        test_idx = data["test_idx"]

        train_mask = sample_mask(train_idx, y.shape[0])
        val_mask = sample_mask(val_idx, y.shape[0])
        test_mask = sample_mask(test_idx, y.shape[0])

        y_train = np.argmax(y[train_mask, :], axis=1)
        y_val = np.argmax(y[val_mask, :], axis=1)
        y_test = np.argmax(y[test_mask, :], axis=1)

        data = Data()
        A = []
        for i, edge in enumerate(rownetworks):
            edge_tmp = torch.from_numpy(
                np.vstack((edge.nonzero()[0], edge.nonzero()[1]))
            ).type(torch.LongTensor)
            value_tmp = torch.ones(edge_tmp.shape[1]).type(torch.FloatTensor)
            A.append((edge_tmp, value_tmp))
        edge_tmp = torch.stack(
            (torch.arange(0, num_nodes), torch.arange(0, num_nodes))
        ).type(torch.LongTensor)
        value_tmp = torch.ones(num_nodes).type(torch.FloatTensor)
        A.append((edge_tmp, value_tmp))
        data.adj = A

        data.x = torch.from_numpy(truefeatures).type(torch.FloatTensor)

        data.train_node = torch.from_numpy(train_idx[0]).type(torch.LongTensor)
        data.train_target = torch.from_numpy(y_train).type(torch.LongTensor)
        data.valid_node = torch.from_numpy(val_idx[0]).type(torch.LongTensor)
        data.valid_target = torch.from_numpy(y_val).type(torch.LongTensor)
        data.test_node = torch.from_numpy(test_idx[0]).type(torch.LongTensor)
        data.test_target = torch.from_numpy(y_test).type(torch.LongTensor)

        self.data = data

    def get(self, idx):
        assert idx == 0
        return self.data

    def apply_to_device(self, device):
        self.data.x = self.data.x.to(device)

        self.data.train_node = self.data.train_node.to(device)
        self.data.valid_node = self.data.valid_node.to(device)
        self.data.test_node = self.data.test_node.to(device)

        self.data.train_target = self.data.train_target.to(device)
        self.data.valid_target = self.data.valid_target.to(device)
        self.data.test_target = self.data.test_target.to(device)

        new_adj = []
        for (t1, t2) in self.data.adj:
            new_adj.append((t1.to(device), t2.to(device)))
        self.data.adj = new_adj

    def download(self):
        download_url(self.url, self.raw_dir, name=self.name + ".zip")
        untar(self.raw_dir, self.name + ".zip")

    def process(self):
        self.read_gtn_data(self.raw_dir)
        torch.save(self.data, self.processed_paths[0])

    def __repr__(self):
        return "{}()".format(self.name)


@register_dataset("han-acm")
 class ACM_HANDataset(HANDataset):
    def __init__(self, path):
        dataset = "han-acm"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(ACM_HANDataset, self).__init__(path, dataset)


@register_dataset("han-dblp")
 class DBLP_HANDataset(HANDataset):
    def __init__(self, path):
        dataset = "han-dblp"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(DBLP_HANDataset, self).__init__(path, dataset)


@register_dataset("han-imdb")
 class IMDB_HANDataset(HANDataset):
    def __init__(self, path):
        dataset = "han-imdb"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(IMDB_HANDataset, self).__init__(path, dataset)
--- a/autogl/datasets/matlab_matrix.py
+++ b/autogl/datasets/matlab_matrix.py
@@ -1,96 +0,0 @@
 import json
 import os
 import os.path as osp
 from itertools import product

 import numpy as np
 import scipy.io
 import torch

 from ..data import Data, Dataset, download_url

 from . import register_dataset


 class MatlabMatrix(Dataset):
    r"""The networks datasets "Blogcatalog", "Flickr", "Wikipedia" and "PPI" from the http://leitang.net/code/social-dimension/data/ or http://snap.stanford.edu/node2vec/

    Args:
        root (string): Root directory where the dataset should be saved.
        name (string): The name of the dataset (:obj:`"Blogcatalog"`).
    """

    def __init__(self, root, name, url):
        self.name = name
        self.url = url
        super(MatlabMatrix, self).__init__(root)
        self.data = torch.load(self.processed_paths[0])

    @property
    def raw_file_names(self):
        splits = [self.name]
        files = ["mat"]
        return ["{}.{}".format(s, f) for s, f in product(splits, files)]

    @property
    def processed_file_names(self):
        return ["data.pt"]

    def download(self):
        for name in self.raw_file_names:
            download_url("{}{}".format(self.url, name), self.raw_dir)

    def get(self, idx):
        assert idx == 0
        return self.data

    def process(self):
        path = osp.join(self.raw_dir, "{}.mat".format(self.name))
        smat = scipy.io.loadmat(path)
        adj_matrix, group = smat["network"], smat["group"]

        y = torch.from_numpy(group.todense()).to(torch.float)

        row_ind, col_ind = adj_matrix.nonzero()
        edge_index = torch.stack([torch.tensor(row_ind), torch.tensor(col_ind)], dim=0)
        edge_attr = torch.tensor(adj_matrix[row_ind, col_ind])

        data = Data(edge_index=edge_index, edge_attr=edge_attr, x=None, y=y)

        torch.save(data, self.processed_paths[0])


@register_dataset("blogcatalog")
 class BlogcatalogDataset(MatlabMatrix):
    def __init__(self, path):
        dataset, filename = "blogcatalog", "blogcatalog"
        url = "http://leitang.net/code/social-dimension/data/"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(BlogcatalogDataset, self).__init__(path, filename, url)


 # @register_dataset("flickr")
 # class FlickrDataset(MatlabMatrix):
 #     def __init__(self, path):
 #         dataset, filename = "flickr", "flickr"
 #         url = "http://leitang.net/code/social-dimension/data/"
 #         # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
 #         super(FlickrDataset, self).__init__(path, filename, url)


@register_dataset("wikipedia")
 class WikipediaDataset(MatlabMatrix):
    def __init__(self, path):
        dataset, filename = "wikipedia", "POS"
        url = "http://snap.stanford.edu/node2vec/"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(WikipediaDataset, self).__init__(path, filename, url)


@register_dataset("ppi")
 class PPIDataset(MatlabMatrix):
    def __init__(self, path):
        dataset, filename = "ppi", "Homo_sapiens"
        url = "http://snap.stanford.edu/node2vec/"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(PPIDataset, self).__init__(path, filename, url)
--- a/autogl/datasets/modelnet.py
+++ b/autogl/datasets/modelnet.py
@@ -1,70 +0,0 @@
 # import os.path as osp
 # import torch_geometric.transforms as T
 from torch_geometric.datasets import ModelNet
 from . import register_dataset


 class ModelNet10(ModelNet):
    def __init__(self, path: str, train: bool):
        # pre_transform, transform = T.NormalizeScale(), T.SamplePoints(1024)
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(ModelNet10, self).__init__(path, name="10", train=train)


 class ModelNet40(ModelNet):
    def __init__(self, path: str, train: bool):
        # pre_transform, transform = T.NormalizeScale(), T.SamplePoints(1024)
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        super(ModelNet40, self).__init__(path, name="40", train=train)


@register_dataset("ModelNet10Train")
 class ModelNet10Train(ModelNet):
    def __init__(self, path: str):
        super(ModelNet10Train, self).__init__(path, "10", train=True)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(ModelNet10Train, self).get(idx)


@register_dataset("ModelNet10Test")
 class ModelNet10Test(ModelNet):
    def __init__(self, path: str):
        super(ModelNet10Test, self).__init__(path, "10", train=False)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(ModelNet10Test, self).get(idx)


@register_dataset("ModelNet40Train")
 class ModelNet40Train(ModelNet):
    def __init__(self, path: str):
        super(ModelNet40Train, self).__init__(path, "40", train=True)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(ModelNet40Train, self).get(idx)


@register_dataset("ModelNet40Test")
 class ModelNet40Test(ModelNet):
    def __init__(self, path: str):
        super(ModelNet40Test, self).__init__(path, "40", train=False)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(ModelNet40Test, self).get(idx)
--- a/autogl/datasets/ogb.py
+++ b/autogl/datasets/ogb.py
@@ -1,358 +0,0 @@
 import torch_geometric.transforms as T
 from ogb.nodeproppred import PygNodePropPredDataset
 from ogb.graphproppred import PygGraphPropPredDataset
 from ogb.linkproppred import PygLinkPropPredDataset
 from . import register_dataset
 from .utils import index_to_mask
 from torch_geometric.data import Data


 # OGBN


@register_dataset("ogbn-products")
 class OGBNproductsDataset(PygNodePropPredDataset):
    def __init__(self, path):
        dataset = "ogbn-products"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygNodePropPredDataset(name=dataset, root=path)
        super(OGBNproductsDataset, self).__init__(dataset, path)
        # Pre-compute GCN normalization.
        # adj_t = self.data.adj_t.set_diag()
        # deg = adj_t.sum(dim=1).to(torch.float)
        # deg_inv_sqrt = deg.pow(-0.5)
        # deg_inv_sqrt[deg_inv_sqrt == float('inf')] = 0
        # adj_t = deg_inv_sqrt.view(-1, 1) * adj_t * deg_inv_sqrt.view(1, -1)
        # self.data.adj_t = adj_t

        setattr(OGBNproductsDataset, "metric", "Accuracy")
        setattr(OGBNproductsDataset, "loss", "nll_loss")
        split_idx = self.get_idx_split()
        datalist = []
        for d in self:
            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
            datalist.append(d)
        self.data, self.slices = self.collate(datalist)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBNproductsDataset, self).get(idx)


@register_dataset("ogbn-proteins")
 class OGBNproteinsDataset(PygNodePropPredDataset):
    def __init__(self, path):
        dataset = "ogbn-proteins"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygNodePropPredDataset(name=dataset, root=path)
        super(OGBNproteinsDataset, self).__init__(dataset, path)
        dataset_t = PygNodePropPredDataset(
            name=dataset, root=path, transform=T.ToSparseTensor()
        )

        # Move edge features to node features.
        self.data.x = dataset_t[0].adj_t.mean(dim=1)
        # dataset_t[0].adj_t.set_value_(None)
        del dataset_t

        setattr(OGBNproteinsDataset, "metric", "ROC-AUC")
        setattr(OGBNproteinsDataset, "loss", "binary_cross_entropy_with_logits")
        split_idx = self.get_idx_split()
        datalist = []
        for d in self:
            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
            datalist.append(d)
        self.data, self.slices = self.collate(datalist)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBNproteinsDataset, self).get(idx)


@register_dataset("ogbn-arxiv")
 class OGBNarxivDataset(PygNodePropPredDataset):
    def __init__(self, path):
        dataset = "ogbn-arxiv"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygNodePropPredDataset(name=dataset, root=path)
        super(OGBNarxivDataset, self).__init__(dataset, path)
        setattr(OGBNarxivDataset, "metric", "Accuracy")
        setattr(OGBNarxivDataset, "loss", "nll_loss")
        split_idx = self.get_idx_split()

        datalist = []
        for d in self:
            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
            datalist.append(d)
        self.data, self.slices = self.collate(datalist)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBNarxivDataset, self).get(idx)


@register_dataset("ogbn-papers100M")
 class OGBNpapers100MDataset(PygNodePropPredDataset):
    def __init__(self, path):
        dataset = "ogbn-papers100M"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygNodePropPredDataset(name=dataset, root=path)
        super(OGBNpapers100MDataset, self).__init__(dataset, path)
        setattr(OGBNpapers100MDataset, "metric", "Accuracy")
        setattr(OGBNpapers100MDataset, "loss", "nll_loss")
        split_idx = self.get_idx_split()
        datalist = []
        for d in self:
            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
            datalist.append(d)
        self.data, self.slices = self.collate(datalist)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBNpapers100MDataset, self).get(idx)


@register_dataset("ogbn-mag")
 class OGBNmagDataset(PygNodePropPredDataset):
    def __init__(self, path):
        dataset = "ogbn-mag"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygNodePropPredDataset(name=dataset, root=path)
        super(OGBNmagDataset, self).__init__(dataset, path)

        # Preprocess
        rel_data = self[0]
        # We are only interested in paper <-> paper relations.
        self.data = Data(
            x=rel_data.x_dict["paper"],
            edge_index=rel_data.edge_index_dict[("paper", "cites", "paper")],
            y=rel_data.y_dict["paper"],
        )

        # self.data = T.ToSparseTensor()(data)
        # self[0].adj_t = self[0].adj_t.to_symmetric()

        setattr(OGBNmagDataset, "metric", "Accuracy")
        setattr(OGBNmagDataset, "loss", "nll_loss")
        split_idx = self.get_idx_split()

        datalist = []
        for d in self:
            setattr(d, "train_mask", index_to_mask(split_idx["train"], d.y.shape[0]))
            setattr(d, "val_mask", index_to_mask(split_idx["valid"], d.y.shape[0]))
            setattr(d, "test_mask", index_to_mask(split_idx["test"], d.y.shape[0]))
            datalist.append(d)
        self.data, self.slices = self.collate(datalist)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBNmagDataset, self).get(idx)


 # OGBG


@register_dataset("ogbg-molhiv")
 class OGBGmolhivDataset(PygGraphPropPredDataset):
    def __init__(self, path):
        dataset = "ogbg-molhiv"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygGraphPropPredDataset(name=dataset, root=path)
        super(OGBGmolhivDataset, self).__init__(dataset, path)
        setattr(OGBGmolhivDataset, "metric", "ROC-AUC")
        setattr(OGBGmolhivDataset, "loss", "binary_cross_entropy_with_logits")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBGmolhivDataset, self).get(idx)


@register_dataset("ogbg-molpcba")
 class OGBGmolpcbaDataset(PygGraphPropPredDataset):
    def __init__(self, path):
        dataset = "ogbg-molpcba"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygGraphPropPredDataset(name=dataset, root=path)
        super(OGBGmolpcbaDataset, self).__init__(dataset, path)
        setattr(OGBGmolpcbaDataset, "metric", "AP")
        setattr(OGBGmolpcbaDataset, "loss", "binary_cross_entropy_with_logits")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBGmolpcbaDataset, self).get(idx)


@register_dataset("ogbg-ppa")
 class OGBGppaDataset(PygGraphPropPredDataset):
    def __init__(self, path):
        dataset = "ogbg-ppa"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygGraphPropPredDataset(name=dataset, root=path)
        super(OGBGppaDataset, self).__init__(dataset, path)
        setattr(OGBGppaDataset, "metric", "Accuracy")
        setattr(OGBGppaDataset, "loss", "cross_entropy")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBGppaDataset, self).get(idx)


@register_dataset("ogbg-code")
 class OGBGcodeDataset(PygGraphPropPredDataset):
    def __init__(self, path):
        dataset = "ogbg-code"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygGraphPropPredDataset(name=dataset, root=path)
        super(OGBGcodeDataset, self).__init__(dataset, path)
        setattr(OGBGcodeDataset, "metric", "F1 score")
        setattr(OGBGcodeDataset, "loss", "cross_entropy")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBGcodeDataset, self).get(idx)


 # OGBL


@register_dataset("ogbl-ppa")
 class OGBLppaDataset(PygLinkPropPredDataset):
    def __init__(self, path):
        dataset = "ogbl-ppa"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygLinkPropPredDataset(name=dataset, root=path)
        super(OGBLppaDataset, self).__init__(dataset, path)
        setattr(OGBLppaDataset, "metric", "Hits@100")
        setattr(OGBLppaDataset, "loss", "pos_neg_loss")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBLppaDataset, self).get(idx)


@register_dataset("ogbl-collab")
 class OGBLcollabDataset(PygLinkPropPredDataset):
    def __init__(self, path):
        dataset = "ogbl-collab"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygLinkPropPredDataset(name=dataset, root=path)
        super(OGBLcollabDataset, self).__init__(dataset, path)
        setattr(OGBLcollabDataset, "metric", "Hits@50")
        setattr(OGBLcollabDataset, "loss", "pos_neg_loss")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBLcollabDataset, self).get(idx)


@register_dataset("ogbl-ddi")
 class OGBLddiDataset(PygLinkPropPredDataset):
    def __init__(self, path):
        dataset = "ogbl-ddi"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygLinkPropPredDataset(name=dataset, root=path)
        super(OGBLddiDataset, self).__init__(dataset, path)
        setattr(OGBLddiDataset, "metric", "Hits@20")
        setattr(OGBLddiDataset, "loss", "pos_neg_loss")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBLddiDataset, self).get(idx)


@register_dataset("ogbl-citation")
 class OGBLcitationDataset(PygLinkPropPredDataset):
    def __init__(self, path):
        dataset = "ogbl-citation"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygLinkPropPredDataset(name=dataset, root=path)
        super(OGBLcitationDataset, self).__init__(dataset, path)
        setattr(OGBLcitationDataset, "metric", "MRR")
        setattr(OGBLcitationDataset, "loss", "pos_neg_loss")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBLcitationDataset, self).get(idx)


@register_dataset("ogbl-wikikg")
 class OGBLwikikgDataset(PygLinkPropPredDataset):
    def __init__(self, path):
        dataset = "ogbl-wikikg"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygLinkPropPredDataset(name=dataset, root=path)
        super(OGBLwikikgDataset, self).__init__(dataset, path)
        setattr(OGBLwikikgDataset, "metric", "MRR")
        setattr(OGBLwikikgDataset, "loss", "pos_neg_loss")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBLwikikgDataset, self).get(idx)


@register_dataset("ogbl-biokg")
 class OGBLbiokgDataset(PygLinkPropPredDataset):
    def __init__(self, path):
        dataset = "ogbl-biokg"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        PygLinkPropPredDataset(name=dataset, root=path)
        super(OGBLbiokgDataset, self).__init__(dataset, path)
        setattr(OGBLbiokgDataset, "metric", "MRR")
        setattr(OGBLbiokgDataset, "loss", "pos_neg_loss")

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(OGBLbiokgDataset, self).get(idx)
--- a/autogl/datasets/pyg.py
+++ b/autogl/datasets/pyg.py
@@ -1,407 +0,0 @@
 import os.path as osp

 import torch

 # import torch_geometric.transforms as T
 from torch_geometric.datasets import (
    Planetoid,
    Reddit,
    TUDataset,
    QM9,
    Amazon,
    Coauthor,
    Flickr,
 )
 from torch_geometric.utils import remove_self_loops
 from . import register_dataset


@register_dataset("amazon_computers")
 class AmazonComputersDataset(Amazon):
    def __init__(self, path):
        dataset = "Computers"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        Amazon(path, dataset)
        super(AmazonComputersDataset, self).__init__(path, dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(AmazonComputersDataset, self).get(idx)


@register_dataset("amazon_photo")
 class AmazonPhotoDataset(Amazon):
    def __init__(self, path):
        dataset = "Photo"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        Amazon(path, dataset)
        super(AmazonPhotoDataset, self).__init__(path, dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(AmazonPhotoDataset, self).get(idx)


@register_dataset("coauthor_physics")
 class CoauthorPhysicsDataset(Coauthor):
    def __init__(self, path):
        dataset = "Physics"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        Coauthor(path, dataset)
        super(CoauthorPhysicsDataset, self).__init__(path, dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(CoauthorPhysicsDataset, self).get(idx)


@register_dataset("coauthor_cs")
 class CoauthorCSDataset(Coauthor):
    def __init__(self, path):
        dataset = "CS"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        Coauthor(path, dataset)
        super(CoauthorCSDataset, self).__init__(path, dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(CoauthorCSDataset, self).get(idx)


@register_dataset("cora")
 class CoraDataset(Planetoid):
    def __init__(self, path):
        dataset = "Cora"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        Planetoid(path, dataset)
        super(CoraDataset, self).__init__(path, dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(CoraDataset, self).get(idx)


@register_dataset("citeseer")
 class CiteSeerDataset(Planetoid):
    def __init__(self, path):
        dataset = "CiteSeer"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        Planetoid(path, dataset)
        super(CiteSeerDataset, self).__init__(path, dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(CiteSeerDataset, self).get(idx)


@register_dataset("pubmed")
 class PubMedDataset(Planetoid):
    def __init__(self, path):
        dataset = "PubMed"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        Planetoid(path, dataset)
        super(PubMedDataset, self).__init__(path, dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(PubMedDataset, self).get(idx)


@register_dataset("reddit")
 class RedditDataset(Reddit):
    def __init__(self, path):
        dataset = "Reddit"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        Reddit(path)
        super(RedditDataset, self).__init__(path)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(RedditDataset, self).get(idx)


@register_dataset("flickr")
 class FlickrDataset(Flickr):
    def __init__(self, path):
        Flickr(path)
        super(FlickrDataset, self).__init__(path)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(FlickrDataset, self).get(idx)


@register_dataset("mutag")
 class MUTAGDataset(TUDataset):
    def __init__(self, path):
        dataset = "MUTAG"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(MUTAGDataset, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(MUTAGDataset, self).get(idx)


@register_dataset("imdb-b")
 class IMDBBinaryDataset(TUDataset):
    def __init__(self, path):
        dataset = "IMDB-BINARY"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(IMDBBinaryDataset, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(IMDBBinaryDataset, self).get(idx)


@register_dataset("imdb-m")
 class IMDBMultiDataset(TUDataset):
    def __init__(self, path):
        dataset = "IMDB-MULTI"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(IMDBMultiDataset, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(IMDBMultiDataset, self).get(idx)


@register_dataset("collab")
 class CollabDataset(TUDataset):
    def __init__(self, path):
        dataset = "COLLAB"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(CollabDataset, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(CollabDataset, self).get(idx)


@register_dataset("proteins")
 class ProteinsDataset(TUDataset):
    def __init__(self, path):
        dataset = "PROTEINS"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(ProteinsDataset, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(ProteinsDataset, self).get(idx)


@register_dataset("reddit-b")
 class REDDITBinary(TUDataset):
    def __init__(self, path):
        dataset = "REDDIT-BINARY"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(REDDITBinary, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(REDDITBinary, self).get(idx)


@register_dataset("reddit-multi-5k")
 class REDDITMulti5K(TUDataset):
    def __init__(self, path):
        dataset = "REDDIT-MULTI-5K"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(REDDITMulti5K, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(REDDITMulti5K, self).get(idx)


@register_dataset("reddit-multi-12k")
 class REDDITMulti12K(TUDataset):
    def __init__(self, path):
        dataset = "REDDIT-MULTI-12K"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(REDDITMulti12K, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(REDDITMulti12K, self).get(idx)


@register_dataset("ptc-mr")
 class PTCMRDataset(TUDataset):
    def __init__(self, path):
        dataset = "PTC_MR"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(PTCMRDataset, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(PTCMRDataset, self).get(idx)


@register_dataset("nci1")
 class NCI1Dataset(TUDataset):
    def __init__(self, path):
        dataset = "NCI1"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(NCI1Dataset, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(NCI1Dataset, self).get(idx)


@register_dataset("nci109")
 class NCI109Dataset(TUDataset):
    def __init__(self, path):
        dataset = "NCI109"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(NCI109Dataset, self).__init__(path, name=dataset)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(NCI109Dataset, self).get(idx)


@register_dataset("enzymes")
 class ENZYMES(TUDataset):
    def __init__(self, path):
        dataset = "ENZYMES"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)
        TUDataset(path, name=dataset)
        super(ENZYMES, self).__init__(path, name=dataset)

    def __getitem__(self, idx):
        if isinstance(idx, int):
            data = self.get(self.indices()[idx])
            data = data
            edge_nodes = data.edge_index.max() + 1
            if edge_nodes < data.x.size(0):
                data.x = data.x[:edge_nodes]
            return data
        else:
            return self.index_select(idx)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(ENZYMES, self).get(idx)


@register_dataset("qm9")
 class QM9Dataset(QM9):
    def __init__(self, path):
        dataset = "QM9"
        # path = osp.join(osp.dirname(osp.realpath(__file__)), "../..", "data", dataset)

        target = 0

        class MyTransform(object):
            def __call__(self, data):
                # Specify target.
                data.y = data.y[:, target]
                return data

        class Complete(object):
            def __call__(self, data):
                device = data.edge_index.device
                row = torch.arange(data.num_nodes, dtype=torch.long, device=device)
                col = torch.arange(data.num_nodes, dtype=torch.long, device=device)
                row = row.view(-1, 1).repeat(1, data.num_nodes).view(-1)
                col = col.repeat(data.num_nodes)
                edge_index = torch.stack([row, col], dim=0)
                edge_attr = None
                if data.edge_attr is not None:
                    idx = data.edge_index[0] * data.num_nodes + data.edge_index[1]
                    size = list(data.edge_attr.size())
                    size[0] = data.num_nodes * data.num_nodes
                    edge_attr = data.edge_attr.new_zeros(size)
                    edge_attr[idx] = data.edge_attr
                edge_index, edge_attr = remove_self_loops(edge_index, edge_attr)
                data.edge_attr = edge_attr
                data.edge_index = edge_index
                return data

        if not osp.exists(path):
            QM9(path)
        super(QM9Dataset, self).__init__(path)

    def get(self, idx):
        if hasattr(self, "__data_list__"):
            delattr(self, "__data_list__")
        if hasattr(self, "_data_list"):
            delattr(self, "_data_list")
        return super(QM9Dataset, self).get(idx)
--- a/autogl/datasets/utils.py
+++ b/autogl/datasets/utils.py
@@ -1,453 +0,0 @@
 from pdb import set_trace
 import torch
 import numpy as np
 from torch_geometric.data import DataLoader
 from torch_geometric.utils import train_test_split_edges
 from sklearn.model_selection import StratifiedKFold, KFold


 def split_edges(dataset, train_ratio, val_ratio):
    datas = [data for data in dataset]
    for i in range(len(datas)):
        datas[i] = train_test_split_edges(
            datas[i], val_ratio, 1 - train_ratio - val_ratio
        )
    dataset.data, dataset.slices = dataset.collate(datas)


 def get_label_number(dataset):
    r"""Get the number of labels in this dataset as dict."""
    label_num = {}
    labels = dataset.data.y.unique().cpu().detach().numpy().tolist()
    for label in labels:
        label_num[label] = (dataset.data.y == label).sum().item()
    return label_num


 def index_to_mask(index, size):
    mask = torch.zeros(size, dtype=torch.bool, device=index.device)
    mask[index] = 1
    return mask


 def random_splits_mask(dataset, train_ratio=0.2, val_ratio=0.4, seed=None):
    r"""If the data has masks for train/val/test, return the splits with specific ratio.

    Parameters
    ----------
    train_ratio : float
        the portion of data that used for training.

    val_ratio : float
        the portion of data that used for validation.

    seed : int
        random seed for splitting dataset.
    """

    assert (
        train_ratio + val_ratio <= 1
    ), "the sum of train_ratio and val_ratio is larger than 1"
    _dataset = [d for d in dataset]
    for data in _dataset:
        r_s = torch.get_rng_state()
        if torch.cuda.is_available():
            r_s_cuda = torch.cuda.get_rng_state()
        if seed is not None:
            torch.manual_seed(seed)
            if torch.cuda.is_available():
                torch.cuda.manual_seed(seed)

        perm = torch.randperm(data.num_nodes)
        train_index = perm[: int(data.num_nodes * train_ratio)]
        val_index = perm[
            int(data.num_nodes * train_ratio) : int(
                data.num_nodes * (train_ratio + val_ratio)
            )
        ]
        test_index = perm[int(data.num_nodes * (train_ratio + val_ratio)) :]
        data.train_mask = index_to_mask(train_index, size=data.num_nodes)
        data.val_mask = index_to_mask(val_index, size=data.num_nodes)
        data.test_mask = index_to_mask(test_index, size=data.num_nodes)

        torch.set_rng_state(r_s)
        if torch.cuda.is_available():
            torch.cuda.set_rng_state(r_s_cuda)

    dataset.data, dataset.slices = dataset.collate(_dataset)
    if hasattr(dataset, "__data_list__"):
        delattr(dataset, "__data_list__")
    # while type(dataset.data.num_nodes) == list:
    #    dataset.data.num_nodes = dataset.data.num_nodes[0]
    # dataset.data.num_nodes = dataset.data.num_nodes[0]
    return dataset


 def random_splits_mask_class(
    dataset,
    num_train_per_class=20,
    num_val_per_class=30,
    num_val=None,
    num_test=None,
    seed=None,
 ):
    r"""If the data has masks for train/val/test, return the splits with specific number of samples from every class for training as suggested in Pitfalls of graph neural network evaluation [#]_ for semi-supervised learning.

    References
    ----------
    .. [#] Shchur, O., Mumme, M., Bojchevski, A., & Günnemann, S. (2018).
        Pitfalls of graph neural network evaluation.
        arXiv preprint arXiv:1811.05868.

    Parameters
    ----------
    num_train_per_class : int
        the number of samples from every class used for training.

    num_val_per_class : int
        the number of samples from every class used for validation.

    num_val : int
        the total number of nodes that used for validation as alternative.

    num_test : int
        the total number of nodes that used for testing as alternative. The rest of the data will be seleted as test set if num_test set to None.

    seed : int
        random seed for splitting dataset.
    """
    data = dataset[0]

    r_s = torch.get_rng_state()
    if torch.cuda.is_available():
        r_s_cuda = torch.cuda.get_rng_state()
    if seed is not None:
        torch.manual_seed(seed)
        if torch.cuda.is_available():
            torch.cuda.manual_seed(seed)

    num_classes = data.y.max().cpu().item() + 1
    try:
        data.train_mask.fill_(False)
        data.val_mask.fill_(False)
        data.test_mask.fill_(False)
    except:
        train_mask = torch.zeros(
            data.num_nodes, dtype=torch.bool, device=data.edge_index.device
        )
        val_mask = torch.zeros(
            data.num_nodes, dtype=torch.bool, device=data.edge_index.device
        )
        test_mask = torch.zeros(
            data.num_nodes, dtype=torch.bool, device=data.edge_index.device
        )
        setattr(data, "train_mask", train_mask)
        setattr(data, "val_mask", val_mask)
        setattr(data, "test_mask", test_mask)
    for c_i in range(num_classes):
        idx = (data.y == c_i).nonzero().view(-1)
        assert num_train_per_class + num_val_per_class < idx.size(0), (
            "the total number of samples from every class used for training and validation is larger than the total samples in class "
            + str(c_i)
        )
        idx_idx_rand = torch.randperm(idx.size(0))
        idx_train = idx[idx_idx_rand[:num_train_per_class]]
        idx_val = idx[
            idx_idx_rand[num_train_per_class : num_train_per_class + num_val_per_class]
        ]
        data.train_mask[idx_train] = True
        data.val_mask[idx_val] = True

    if num_val is not None:
        remaining = (~data.train_mask).nonzero().view(-1)
        remaining = remaining[torch.randperm(remaining.size(0))]
        data.val_mask[remaining[:num_val]] = True
        if num_test is not None:
            data.test_mask[remaining[num_val : num_val + num_test]] = True
        else:
            data.test_mask[remaining[num_val:]] = True
    else:
        remaining = (~(data.train_mask + data.val_mask)).nonzero().view(-1)
        data.test_mask[remaining] = True

    torch.set_rng_state(r_s)
    if torch.cuda.is_available():
        torch.cuda.set_rng_state(r_s_cuda)

    datalist = []
    for d in dataset:
        setattr(d, "train_mask", data.train_mask)
        setattr(d, "val_mask", data.val_mask)
        setattr(d, "test_mask", data.test_mask)
        datalist.append(d)
    dataset.data, dataset.slices = dataset.collate(datalist)
    if hasattr(dataset, "__data_list__"):
        delattr(dataset, "__data_list__")
    # while type(dataset.data.num_nodes) == list:
    #     dataset.data.num_nodes = dataset.data.num_nodes[0]
    # dataset.data.num_nodes = dataset.data.num_nodes[0]
    return dataset


 def graph_cross_validation(
    dataset, n_splits=10, shuffle=True, random_seed=42, stratify=False
 ):
    r"""Cross validation for graph classification data, returning one fold with specific idx in autogl.datasets or pyg.Dataloader(default)

    Parameters
    ----------
    dataset : str
        dataset with multiple graphs.

    n_splits : int
        the number of how many folds will be splitted.

    shuffle : bool
        shuffle or not for sklearn.model_selection.StratifiedKFold

    random_seed : int
        random_state for sklearn.model_selection.StratifiedKFold
    """
    if stratify:
        skf = StratifiedKFold(
            n_splits=n_splits, shuffle=shuffle, random_state=random_seed
        )
    else:
        skf = KFold(n_splits=n_splits, shuffle=shuffle, random_state=random_seed)
    idx_list = []

    # BUG: from pytorch_geometric, not sure whether it is a bug. The dataset.data will return
    # the data of original dataset even if the input dataset is subset of original. We hackfix
    # this bug currently by iterating y.

    dataset_y = [data.y[0].tolist() for data in dataset]

    for idx in skf.split(np.zeros(len(dataset_y)), dataset_y):
        idx_list.append(idx)
    dataset.idx_list = idx_list
    dataset.n_splits = n_splits
    # BUG: only saving idx will result in different references when calling multiple times,
    # we need to also save splits in advance.
    dataset.cv_dict = [
        {
            "train": dataset[dataset.idx_list[idx][0].tolist()],
            "val": dataset[dataset.idx_list[idx][1].tolist()],
        }
        for idx in range(n_splits)
    ]
    graph_set_fold_id(dataset, 0)

    return dataset


 def graph_set_fold_id(dataset, fold_id):
    r"""Set the current fold id of graph dataset.

    Parameters
    ----------
    dataset: ``torch_geometric.data.dataset.Dataset``
        dataset with multiple graphs.

    fold_id: ``int``
        The current fold id this dataset uses. Should be in [0, dataset.n_splits)

    Returns
    -------
    ``torch_geometric.data.dataset.Dataset``
        The reference original dataset.
    """
    if not hasattr(dataset, "n_splits"):
        raise ValueError("Dataset set fold id before cross validated!")
    assert (
        0 <= fold_id < dataset.n_splits
    ), "Fold id %d exceed total cross validation split number %d" % (
        fold_id,
        dataset.n_splits,
    )
    dataset.current_fold_id = fold_id
    dataset.train_split = dataset.cv_dict[dataset.current_fold_id]["train"]
    dataset.val_split = dataset.cv_dict[dataset.current_fold_id]["val"]
    dataset.train_index = dataset.idx_list[dataset.current_fold_id][0]
    dataset.val_index = dataset.idx_list[dataset.current_fold_id][1]
    return dataset


 def graph_random_splits(dataset, train_ratio=0.2, val_ratio=0.4, seed=None):
    r"""Splitting graph dataset with specific ratio for train/val/test.

    Parameters
    ----------
    dataset: ``torch_geometric.data.dataset.Dataset``
        dataset with multiple graphs.

    train_ratio : float
        the portion of data that used for training.

    val_ratio : float
        the portion of data that used for validation.

    seed : int
        random seed for splitting dataset.

    Returns
    -------
    ``torch_geometric.data.dataset.Dataset``
        The reference of original dataset
    """

    assert (
        train_ratio + val_ratio <= 1
    ), "the sum of train_ratio and val_ratio is larger than 1"
    r_s = torch.get_rng_state()
    if torch.cuda.is_available():
        r_s_cuda = torch.cuda.get_rng_state()
    if seed is not None:
        torch.manual_seed(seed)
        if torch.cuda.is_available():
            torch.cuda.manual_seed(seed)

    perm = torch.randperm(len(dataset))
    train_index = perm[: int(len(dataset) * train_ratio)]
    val_index = perm[
        int(len(dataset) * train_ratio) : int(len(dataset) * (train_ratio + val_ratio))
    ]
    test_index = perm[int(len(dataset) * (train_ratio + val_ratio)) :]
    train_dataset = dataset[train_index]
    val_dataset = dataset[val_index]
    test_dataset = dataset[test_index]

    # set train_idx, val_idx and test_idx as dataset attribute
    dataset.train_split = train_dataset
    dataset.val_split = val_dataset
    dataset.test_split = test_dataset

    dataset.train_index = train_index
    dataset.val_index = val_index
    dataset.test_index = test_index

    torch.set_rng_state(r_s)
    if torch.cuda.is_available():
        torch.cuda.set_rng_state(r_s_cuda)

    return dataset


 def graph_get_split(
    dataset, mask="train", is_loader=True, batch_size=128, num_workers=0
 ):
    r"""Get train/test dataset/dataloader after cross validation.

    Parameters
    ----------
    dataset: ``torch_geometric.data.dataset.Dataset``
        dataset with multiple graphs.

    mask : str
        return with which dataset/dataloader

    is_loader : bool
        return with autogl.datasets or pyg.Dataloader

    batch_size : int
        batch_size for generateing Dataloader

    """
    assert hasattr(
        dataset, "%s_split" % (mask)
    ), "Given dataset do not have %s split" % (mask)
    if is_loader:
        return DataLoader(
            getattr(dataset, "%s_split" % (mask)),
            batch_size=batch_size,
            num_workers=num_workers,
        )
    else:
        return getattr(dataset, "%s_split" % (mask))


 '''
 def graph_cross_validation(dataset, n_splits = 10, shuffle = True, random_seed = 42, fold_idx = 0, batch_size = 32, dataloader = True):
    r"""Cross validation for graph classification data, returning one fold with specific idx in autogl.datasets or pyg.Dataloader(default)

    Parameters
    ----------
    dataset : str
        dataset with multiple graphs.

    n_splits : int
        the number of how many folds will be splitted.

    shuffle : bool
        shuffle or not for sklearn.model_selection.StratifiedKFold

    random_seed : int
        random_state for sklearn.model_selection.StratifiedKFold

    fold_idx : int
        specific fold id from 0 to n_splits-1

    batch_size : int
        batch_size for generateing Dataloader

    dataloader : bool
        return with autogl.datasets or pyg.Dataloader
    """
    skf = StratifiedKFold(n_splits=n_splits, shuffle = shuffle, random_state = random_seed)
    idx_list = []
    for idx in skf.split(np.zeros(len(dataset.data.y)), dataset.data.y):
        idx_list.append(idx)
    assert 0 <= fold_idx and fold_idx < n_splits, "fold_idx must be from 0 to " + str(n_splits-1)
    train_idx, test_idx = idx_list[fold_idx]
    test_dataset = dataset[test_idx.tolist()]
    train_dataset = dataset[train_idx.tolist()]
    if dataloader:
        return DataLoader(train_dataset, batch_size=128), DataLoader(test_dataset, batch_size=128)
    else:
        return train_dataset, test_dataset
 '''


 def train_test_split(self, method="auto", ratio=None):
    raise NotImplementedError()


 def train_valid_split(self, method="auto", ratio=None):
    raise NotImplementedError()


 def cross_validation_split(self, method="auto", cv_fold_num=5):
    return NotImplementedError()


 # below get_* can also be set as property
 def get_train_dataset(self):
    raise NotImplementedError()


 def get_test_dataset(self):
    raise NotImplementedError()


 def get_valid_dataset(self):
    raise NotImplementedError()


 def get_train_generator(self, batch_size):
    """
    should return a torch.utils.data.Dataloader
    """
    raise NotImplementedError()


 def get_test_generator(self, batch_size):
    """
    should return a torch.utils.data.Dataloader
    """
    raise NotImplementedError()


 def get_valid_generator(self, batch_size):
    """
    should return a torch.utils.data.Dataloader
    """
    raise NotImplementedError()
--- a/autogl/datasets/utils/init.py
+++ b/autogl/datasets/utils/init.py
@@ -0,0 +1,9 @@
 from ._general import (
    index_to_mask,
    split_edges,
    random_splits_mask,
    random_splits_mask_class,
    graph_cross_validation,
    graph_random_splits,
    graph_get_split
 )
--- a/autogl/datasets/utils/_general.py
+++ b/autogl/datasets/utils/_general.py
@@ -0,0 +1,412 @@
 import numpy as np
 import random
 import torch
 import torch.utils.data
 import typing as _typing
 from sklearn.model_selection import StratifiedKFold, KFold
 from autogl import backend as _backend
 from autogl.data import Data, Dataset, InMemoryStaticGraphSet
 from ...data.graph import GeneralStaticGraph, GeneralStaticGraphGenerator
 from . import _pyg


 def index_to_mask(index: torch.Tensor, size):
    mask = torch.zeros(size, dtype=torch.bool, device=index.device)
    mask[index] = True
    return mask


 def split_edges(
        dataset: InMemoryStaticGraphSet,
        train_ratio: float, val_ratio: float
 ) -> InMemoryStaticGraphSet:
    test_ratio: float = 1 - train_ratio - val_ratio

    def _split_edges_for_graph(homogeneous_static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
        if not isinstance(homogeneous_static_graph, GeneralStaticGraph):
            raise TypeError
        elif not homogeneous_static_graph.edges.is_homogeneous:
            raise ValueError("The provided graph MUST consist of homogeneous edges.")
        else:
            split_data = _pyg.train_test_split_edges(
                Data(
                    edge_index=homogeneous_static_graph.edges.connections.detach().clone(),
                    edge_attr=(
                        homogeneous_static_graph.edges.data['edge_attr'].detach().clone()
                        if 'edge_attr' in homogeneous_static_graph.edges.data else None
                    )
                ),
                val_ratio, test_ratio
            )
            original_edge_type = [et for et in homogeneous_static_graph.edges][0]

            split_static_graph = GeneralStaticGraphGenerator.create_heterogeneous_static_graph(
                dict([
                    (node_type, homogeneous_static_graph.nodes[node_type].data)
                    for node_type in homogeneous_static_graph.nodes
                ]),
                {
                    (original_edge_type.source_node_type, "train_pos_edge", original_edge_type.target_node_type): (
                        getattr(split_data, "train_pos_edge_index"),
                        {"edge_attr": getattr(split_data, "train_pos_edge_attr")}
                        if isinstance(getattr(split_data, "train_pos_edge_attr"), torch.Tensor)
                        else None
                    ),
                    (original_edge_type.source_node_type, "val_pos_edge", original_edge_type.target_node_type): (
                        getattr(split_data, "val_pos_edge_index"),
                        {"edge_attr": getattr(split_data, "val_pos_edge_attr")}
                        if isinstance(getattr(split_data, "val_pos_edge_attr"), torch.Tensor)
                        else None
                    ),
                    (original_edge_type.source_node_type, "val_neg_edge", original_edge_type.target_node_type):
                        getattr(split_data, "val_neg_edge_index"),
                    (original_edge_type.source_node_type, "test_pos_edge", original_edge_type.target_node_type): (
                        getattr(split_data, "test_pos_edge_index"),
                        {"edge_attr": getattr(split_data, "test_pos_edge_attr")}
                        if isinstance(getattr(split_data, "test_pos_edge_attr"), torch.Tensor)
                        else None
                    ),
                    (original_edge_type.source_node_type, "test_neg_edge", original_edge_type.target_node_type):
                        getattr(split_data, "test_neg_edge_index")
                },
                homogeneous_static_graph.data
            )
            return split_static_graph

    if not isinstance(dataset, InMemoryStaticGraphSet):
        raise TypeError
    for index in range(len(dataset)):
        dataset[index] = _split_edges_for_graph(dataset[index])
    return dataset


 def random_splits_mask(
        dataset: InMemoryStaticGraphSet,
        train_ratio: float = 0.2, val_ratio: float = 0.4,
        seed: _typing.Optional[int] = None
 ) -> InMemoryStaticGraphSet:
    r"""If the data has masks for train/val/test, return the splits with specific ratio.

    Parameters
    ----------
    dataset : InMemoryStaticGraphSet
        graph set
    train_ratio : float
        the portion of data that used for training.

    val_ratio : float
        the portion of data that used for validation.

    seed : int
        random seed for splitting dataset.
    """
    if not train_ratio + val_ratio <= 1:
        raise ValueError("the sum of provided train_ratio and val_ratio is larger than 1")

    def __random_split_masks(
            num_nodes: int
    ) -> _typing.Tuple[torch.Tensor, torch.Tensor, torch.Tensor]:
        _rng_state: torch.Tensor = torch.get_rng_state()
        if seed is not None and isinstance(seed, int):
            torch.manual_seed(seed)
        perm = torch.randperm(num_nodes)
        train_index = perm[:int(num_nodes * train_ratio)]
        val_index = perm[int(num_nodes * train_ratio): int(num_nodes * (train_ratio + val_ratio))]
        test_index = perm[int(num_nodes * (train_ratio + val_ratio)):]
        torch.set_rng_state(_rng_state)
        return (
            index_to_mask(train_index, num_nodes),
            index_to_mask(val_index, num_nodes),
            index_to_mask(test_index, num_nodes)
        )

    for index in range(len(dataset)):
        for node_type in dataset[index].nodes:
            data_keys = [data_key for data_key in dataset[index].nodes.data]
            if len(data_keys) > 0:
                _num_nodes: int = dataset[index].nodes[node_type].data[data_keys[0]].size(0)
                _masks: _typing.Tuple[torch.Tensor, torch.Tensor, torch.Tensor] = (
                    __random_split_masks(_num_nodes)
                )
                dataset[index].nodes[node_type].data["train_mask"] = _masks[0]
                dataset[index].nodes[node_type].data["val_mask"] = _masks[1]
                dataset[index].nodes[node_type].data["test_mask"] = _masks[2]
    return dataset


 def random_splits_mask_class(
        dataset: InMemoryStaticGraphSet,
        num_train_per_class: int = 20,
        num_val_per_class: int = 30,
        total_num_val: _typing.Optional[int] = ...,
        total_num_test: _typing.Optional[int] = ...,
        seed: _typing.Optional[int] = ...
 ):
    r"""If the data has masks for train/val/test, return the splits with specific number of samples from every class for training as suggested in Pitfalls of graph neural network evaluation [#]_ for semi-supervised learning.

    References
    ----------
    .. [#] Shchur, O., Mumme, M., Bojchevski, A., & Günnemann, S. (2018).
        Pitfalls of graph neural network evaluation.
        arXiv preprint arXiv:1811.05868.

    Parameters
    ----------
    dataset: InMemoryStaticGraphSet
        instance of InMemoryStaticGraphSet
    num_train_per_class : int
        the number of samples from every class used for training.

    num_val_per_class : int
        the number of samples from every class used for validation.

    total_num_val : int
        the total number of nodes that used for validation as alternative.

    total_num_test : int
        the total number of nodes that used for testing as alternative. The rest of the data will be seleted as test set if num_test set to None.

    seed : int
        random seed for splitting dataset.
    """
    for graph_index in range(len(dataset)):
        for node_type in dataset[graph_index].nodes:
            if (
                    'y' in dataset[graph_index].nodes[node_type].data and
                    'label' in dataset[graph_index].nodes[node_type].data
            ):
                raise ValueError(
                    f"Both 'y' and 'label' data exist "
                    f"for node type [{node_type}] in "
                    f"graph with index [{graph_index}]."
                )
            elif (
                    'y' not in dataset[graph_index].nodes[node_type].data and
                    'label' not in dataset[graph_index].nodes[node_type].data
            ):
                continue
            elif 'y' in dataset[graph_index].nodes[node_type].data:
                label: torch.Tensor = dataset[graph_index].nodes[node_type].data['y']
            elif 'label' in dataset[graph_index].nodes[node_type].data:
                label: torch.Tensor = dataset[graph_index].nodes[node_type].data['label']
            else:
                raise RuntimeError
            num_nodes: int = label.size(0)
            num_classes: int = label.cpu().max().item() + 1

            _rng_state: torch.Tensor = torch.get_rng_state()
            if seed not in (Ellipsis, None) and isinstance(seed, int):
                torch.manual_seed(seed)
            train_mask = torch.zeros(num_nodes, dtype=torch.bool, device=label.device)
            val_mask = torch.zeros(num_nodes, dtype=torch.bool, device=label.device)
            test_mask = torch.zeros(num_nodes, dtype=torch.bool, device=label.device)
            for class_index in range(num_classes):
                idx = (label == class_index).nonzero().view(-1)
                assert num_train_per_class + num_val_per_class < idx.size(0), (
                    f"the total number of samples from every class "
                    f"used for training and validation is larger than "
                    f"the total samples in class [{class_index}] for node type [{node_type}] "
                    f"in graph with index [{graph_index}]"
                )
                randomized_index: torch.Tensor = torch.randperm(idx.size(0))
                train_idx = idx[randomized_index[:num_train_per_class]]
                val_idx = idx[
                    randomized_index[num_train_per_class: (num_train_per_class + num_val_per_class)]
                ]
                train_mask[train_idx] = True
                val_mask[val_idx] = True

            if isinstance(total_num_val, int) and total_num_val > 0:
                remaining = (~train_mask).nonzero().view(-1)
                remaining = remaining[torch.randperm(remaining.size(0))]
                val_mask[remaining[:total_num_val]] = True
                if isinstance(total_num_test, int) and total_num_test > 0:
                    test_mask[remaining[total_num_val: (total_num_val + total_num_test)]] = True
                else:
                    test_mask[remaining[total_num_val:]] = True
            else:
                remaining = (~(train_mask + val_mask)).nonzero().view(-1)
                test_mask[remaining] = True

            torch.set_rng_state(_rng_state)
            dataset[graph_index].nodes[node_type].data["train_mask"] = train_mask
            dataset[graph_index].nodes[node_type].data["val_mask"] = val_mask
            dataset[graph_index].nodes[node_type].data["test_mask"] = test_mask
    return dataset


 def graph_cross_validation(
        dataset: InMemoryStaticGraphSet,
        n_splits: int = 10, shuffle: bool = True,
        random_seed: _typing.Optional[int] = ...,
        stratify: bool = False
 ) -> InMemoryStaticGraphSet:
    r"""Cross validation for graph classification data, returning one fold with specific idx in autogl.datasets or pyg.Dataloader(default)

    Parameters
    ----------
    dataset : str
        dataset with multiple graphs.

    n_splits : int
        the number of how many folds will be splitted.

    shuffle : bool
        shuffle or not for sklearn.model_selection.StratifiedKFold

    random_seed : int
        random_state for sklearn.model_selection.StratifiedKFold

    stratify: bool
    """
    if not isinstance(dataset, InMemoryStaticGraphSet):
        raise TypeError
    if not isinstance(n_splits, int):
        raise TypeError
    elif not n_splits > 0:
        raise ValueError
    if not isinstance(shuffle, bool):
        raise TypeError
    if not (random_seed in (Ellipsis, None) or isinstance(random_seed, int)):
        raise TypeError
    elif isinstance(random_seed, int) and random_seed >= 0:
        _random_seed: int = random_seed
    else:
        _random_seed: int = random.randrange(0, 65536)
    if not isinstance(stratify, bool):
        raise TypeError

    if stratify:
        kf = StratifiedKFold(
            n_splits=n_splits, shuffle=shuffle, random_state=_random_seed
        )
    else:
        kf = KFold(
            n_splits=n_splits, shuffle=shuffle, random_state=_random_seed
        )
    dataset_y = [g.data['y'].item() for g in dataset]
    idx_list = [
        (train_index.tolist(), test_index.tolist())
        for train_index, test_index
        in kf.split(np.zeros(len(dataset)), np.array(dataset_y))
    ]

    dataset.folds = idx_list
    dataset.train_index = idx_list[0][0]
    dataset.val_index = idx_list[0][1]
    return dataset


 def graph_random_splits(
        dataset: InMemoryStaticGraphSet,
        train_ratio: float = 0.2,
        val_ratio: float = 0.4,
        seed: _typing.Optional[int] = ...
 ):
    r"""Splitting graph dataset with specific ratio for train/val/test.

    Parameters
    ----------
    dataset: ``InMemoryStaticGraphSet``

    train_ratio : float
        the portion of data that used for training.

    val_ratio : float
        the portion of data that used for validation.

    seed : int
        random seed for splitting dataset.
    """
    _rng_state = torch.get_rng_state()
    if isinstance(seed, int):
        torch.manual_seed(seed)
    perm = torch.randperm(len(dataset))
    train_index = perm[: int(len(dataset) * train_ratio)]
    val_index = (
        perm[int(len(dataset) * train_ratio): int(len(dataset) * (train_ratio + val_ratio))]
    )
    test_index = perm[int(len(dataset) * (train_ratio + val_ratio)):]
    dataset.train_index = train_index
    dataset.val_index = val_index
    dataset.test_index = test_index
    torch.set_rng_state(_rng_state)
    return dataset


 def graph_get_split(
        dataset: Dataset, mask: str = "train",
        is_loader: bool = True, batch_size: int = 128,
        num_workers: int = 0
 ) -> _typing.Union[torch.utils.data.DataLoader, _typing.Iterable]:
    r"""Get train/test dataset/dataloader after cross validation.

    Parameters
    ----------
    dataset:
        dataset with multiple graphs.

    mask : str

    is_loader : bool
        return original dataset or data loader

    batch_size : int
        batch_size for generating Dataloader
    num_workers : int
        number of workers parameter for data loader
    """
    if not isinstance(dataset, Dataset):
        raise TypeError
    if not isinstance(mask, str):
        raise TypeError
    elif mask.lower() not in ("train", "val", "test"):
        raise ValueError
    if not isinstance(is_loader, bool):
        raise TypeError
    if not isinstance(batch_size, int):
        raise TypeError
    elif not batch_size > 0:
        raise ValueError
    if not isinstance(num_workers, int):
        raise TypeError
    elif not num_workers >= 0:
        raise ValueError

    if mask.lower() not in ("train", "val", "test"):
        raise ValueError
    elif mask.lower() == "train":
        optional_dataset_split = dataset.train_split
    elif mask.lower() == "val":
        optional_dataset_split = dataset.val_split
    elif mask.lower() == "test":
        optional_dataset_split = dataset.test_split
    else:
        raise ValueError(
            f"The provided mask parameter must be a str in ['train', 'val', 'test'], "
            f"illegal provided value is [{mask}]"
        )
    if (
            optional_dataset_split is None or
            not isinstance(optional_dataset_split, _typing.Iterable)
    ):
        raise ValueError(
            f"Provided dataset do NOT have {mask} split"
        )
    if is_loader:
        if not (_backend.DependentBackend.is_dgl() or _backend.DependentBackend.is_pyg()):
            raise RuntimeError("Unsupported backend")
        elif _backend.DependentBackend.is_dgl():
            from dgl.dataloading.pytorch import GraphDataLoader
            return GraphDataLoader(
                optional_dataset_split,
                **{"batch_size": batch_size, "num_workers": num_workers}
            )
        elif _backend.DependentBackend.is_pyg():
            dataset_split: _typing.Any = optional_dataset_split
            import torch_geometric
            return torch_geometric.data.DataLoader(
                dataset_split, batch_size=batch_size, num_workers=num_workers
            )
    else:
        return optional_dataset_split
--- a/autogl/datasets/utils/_pyg.py
+++ b/autogl/datasets/utils/_pyg.py
@@ -0,0 +1,116 @@
 """ Migrated `train_test_split_edges` function from PyTorch-Geometric """
 import math
 import torch
 import typing as _typing


 def to_undirected(
        edge_index: torch.Tensor, edge_attr: _typing.Optional[torch.Tensor] = None
 ) -> _typing.Union[torch.Tensor, _typing.Tuple[torch.Tensor, torch.Tensor]]:
    r"""Converts the graph given by :attr:`edge_index` to an undirected graph
    such that :math:`(j,i) \in \mathcal{E}` for every edge :math:`(i,j) \in
    \mathcal{E}`.

    Args:
        edge_index (LongTensor): The edge indices.
        edge_attr (Tensor, optional): Edge weights or multi-dimensional
            edge features. (default: :obj:`None`)
        num_nodes (int, optional): The number of nodes, *i.e.*
            :obj:`max_val + 1` of :attr:`edge_index`. (default: :obj:`None`)

    :rtype: :class:`LongTensor` if :attr:`edge_attr` is :obj:`None`, else
        (:class:`LongTensor`, :class:`Tensor`)
    """

    row, col = edge_index
    row, col = torch.cat([row, col], dim=0), torch.cat([col, row], dim=0)
    edge_index = torch.stack([row, col], dim=0)
    if edge_attr is not None:
        edge_attr = torch.cat([edge_attr, edge_attr], dim=0)

    if edge_attr is None:
        return edge_index
    else:
        return edge_index, edge_attr


 def train_test_split_edges(data, val_ratio: float = 0.05,
                           test_ratio: float = 0.1):
    r"""Splits the edges of a :class:`torch_geometric.data.Data` object
    into positive and negative train/val/test edges.
    As such, it will replace the :obj:`edge_index` attribute with
    :obj:`train_pos_edge_index`, :obj:`train_pos_neg_adj_mask`,
    :obj:`val_pos_edge_index`, :obj:`val_neg_edge_index` and
    :obj:`test_pos_edge_index` attributes.
    If :obj:`data` has edge features named :obj:`edge_attr`, then
    :obj:`train_pos_edge_attr`, :obj:`val_pos_edge_attr` and
    :obj:`test_pos_edge_attr` will be added as well.

    Args:
        data (Data): The data object.
        val_ratio (float, optional): The ratio of positive validation edges.
            (default: :obj:`0.05`)
        test_ratio (float, optional): The ratio of positive test edges.
            (default: :obj:`0.1`)

    :rtype: :class:`torch_geometric.data.Data`
    """

    num_nodes = data.num_nodes
    row, col = data.edge_index
    edge_attr = data.edge_attr
    data.edge_index = data.edge_attr = None

    # Return upper triangular portion.
    mask = row < col
    row, col = row[mask], col[mask]

    if edge_attr is not None:
        edge_attr = edge_attr[mask]

    n_v = int(math.floor(val_ratio * row.size(0)))
    n_t = int(math.floor(test_ratio * row.size(0)))

    # Positive edges.
    perm = torch.randperm(row.size(0))
    row, col = row[perm], col[perm]
    if edge_attr is not None:
        edge_attr = edge_attr[perm]

    r, c = row[:n_v], col[:n_v]
    data.val_pos_edge_index = torch.stack([r, c], dim=0)
    if edge_attr is not None:
        data.val_pos_edge_attr = edge_attr[:n_v]

    r, c = row[n_v:n_v + n_t], col[n_v:n_v + n_t]
    data.test_pos_edge_index = torch.stack([r, c], dim=0)
    if edge_attr is not None:
        data.test_pos_edge_attr = edge_attr[n_v:n_v + n_t]

    r, c = row[n_v + n_t:], col[n_v + n_t:]
    data.train_pos_edge_index = torch.stack([r, c], dim=0)
    if edge_attr is not None:
        out = to_undirected(data.train_pos_edge_index, edge_attr[n_v + n_t:])
        data.train_pos_edge_index, data.train_pos_edge_attr = out
    else:
        data.train_pos_edge_index = to_undirected(data.train_pos_edge_index)

    # Negative edges.
    neg_adj_mask = torch.ones(num_nodes, num_nodes, dtype=torch.uint8)
    neg_adj_mask = neg_adj_mask.triu(diagonal=1).to(torch.bool)
    neg_adj_mask[row, col] = 0

    neg_row, neg_col = neg_adj_mask.nonzero().t()
    perm = torch.randperm(neg_row.size(0))[:n_v + n_t]
    neg_row, neg_col = neg_row[perm], neg_col[perm]

    neg_adj_mask[neg_row, neg_col] = 0
    data.train_neg_adj_mask = neg_adj_mask

    row, col = neg_row[:n_v], neg_col[:n_v]
    data.val_neg_edge_index = torch.stack([row, col], dim=0)

    row, col = neg_row[n_v:n_v + n_t], neg_col[n_v:n_v + n_t]
    data.test_neg_edge_index = torch.stack([row, col], dim=0)

    return data
--- a/autogl/datasets/utils/conversion/init.py
+++ b/autogl/datasets/utils/conversion/init.py
@@ -0,0 +1,12 @@
 try:
    import dgl
 except ModuleNotFoundError:
    dgl = None
 else:
    from ._to_dgl_dataset import general_static_graphs_to_dgl_dataset
 try:
    import torch_geometric
 except ModuleNotFoundError:
    torch_geometric = None
 else:
    from ._to_pyg_dataset import general_static_graphs_to_pyg_dataset
--- a/autogl/datasets/utils/conversion/_to_dgl_dataset.py
+++ b/autogl/datasets/utils/conversion/_to_dgl_dataset.py
@@ -0,0 +1,36 @@
 import dgl
 import torch
 import typing as _typing
 from autogl.data import Dataset, InMemoryDataset
 from autogl.data.graph import GeneralStaticGraph
 from autogl.data.graph.utils import conversion


 def general_static_graphs_to_dgl_dataset(
        general_static_graphs: _typing.Iterable[GeneralStaticGraph]
 ) -> Dataset[_typing.Union[dgl.DGLGraph, _typing.Tuple[dgl.DGLGraph, torch.Tensor]]]:
    def _transform(
            general_static_graph: GeneralStaticGraph
    ) -> _typing.Union[dgl.DGLGraph, _typing.Tuple[dgl.DGLGraph, torch.Tensor]]:
        if not isinstance(general_static_graph, GeneralStaticGraph):
            raise TypeError
        if 'label' in general_static_graph.data:
            label: _typing.Optional[torch.Tensor] = general_static_graph.data['label']
        elif 'y' in general_static_graph.data:
            label: _typing.Optional[torch.Tensor] = general_static_graph.data['y']
        else:
            label: _typing.Optional[torch.Tensor] = None
        if label is not None and isinstance(label, torch.Tensor) and torch.is_tensor(label):
            return conversion.general_static_graph_to_dgl_graph(general_static_graph), label
        else:
            return conversion.general_static_graph_to_dgl_graph(general_static_graph)

    if isinstance(general_static_graphs, Dataset):
        return InMemoryDataset(
            [_transform(g) for g in general_static_graphs],
            general_static_graphs.train_index,
            general_static_graphs.val_index,
            general_static_graphs.test_index
        )
    else:
        return InMemoryDataset([_transform(g) for g in general_static_graphs])
--- a/autogl/datasets/utils/conversion/_to_pyg_dataset.py
+++ b/autogl/datasets/utils/conversion/_to_pyg_dataset.py
@@ -0,0 +1,18 @@
 import typing as _typing
 from autogl.data import Data, Dataset, InMemoryDataset
 from autogl.data.graph import GeneralStaticGraph
 from autogl.data.graph.utils import conversion


 def general_static_graphs_to_pyg_dataset(
        graphs: _typing.Iterable[GeneralStaticGraph]
 ) -> Dataset[Data]:
    if isinstance(graphs, Dataset):
        return InMemoryDataset(
            [conversion.static_graph_to_pyg_data(g) for g in graphs],
            graphs.train_index, graphs.val_index, graphs.test_index
        )
    else:
        return InMemoryDataset(
            [conversion.static_graph_to_pyg_data(g) for g in graphs]
        )
--- a/autogl/module/_feature/init.py
+++ b/autogl/module/_feature/init.py
@@ -0,0 +1,103 @@
 from .base import BaseFeature
 from .base import BaseFeatureEngineer

 FEATURE_DICT = {}


 def register_feature(name):
    def register_feature_cls(cls):
        if name in FEATURE_DICT:
            raise ValueError(
                "Cannot register duplicate feature engineer ({})".format(name)
            )
        # if not issubclass(cls, BaseFeatureEngineer):
        if not issubclass(cls, BaseFeature):
            raise ValueError(
                "Trainer ({}: {}) must extend BaseFeatureEngineer".format(
                    name, cls.__name__
                )
            )
        FEATURE_DICT[name] = cls
        return cls

    return register_feature_cls


 from .auto_feature import AutoFeatureEngineer

 from .generators import (
    BaseGenerator,
    GeGraphlet,
    GeEigen,
    GePageRank,
    register_pyg,
    pygfunc,
    PYGGenerator,
    PYGLocalDegreeProfile,
    PYGNormalizeFeatures,
    PYGOneHotDegree,
 )

 from .selectors import BaseSelector, SeFilterConstant, SeGBDT

 from .graph import (
    BaseGraph,
    SgNetLSD,
    register_nx,
    NxGraph,
    nxfunc,
    NxLargeCliqueSize,
    NxAverageClusteringApproximate,
    NxDegreeAssortativityCoefficient,
    NxDegreePearsonCorrelationCoefficient,
    NxHasBridge,
    NxGraphCliqueNumber,
    NxGraphNumberOfCliques,
    NxTransitivity,
    NxAverageClustering,
    NxIsConnected,
    NxNumberConnectedComponents,
    NxIsDistanceRegular,
    NxLocalEfficiency,
    NxGlobalEfficiency,
    NxIsEulerian,
 )

 __all__ = [
    "BaseFeatureEngineer",
    "AutoFeatureEngineer",
    "BaseFeature",
    "BaseGenerator",
    "GeGraphlet",
    "GeEigen",
    "GePageRank",
    "register_pyg",
    "pygfunc",
    "PYGGenerator",
    "PYGLocalDegreeProfile",
    "PYGNormalizeFeatures",
    "PYGOneHotDegree",
    "BaseSelector",
    "SeFilterConstant",
    "SeGBDT",
    "BaseGraph",
    "SgNetLSD",
    "register_nx",
    "NxGraph",
    "nxfunc",
    "NxLargeCliqueSize",
    "NxAverageClusteringApproximate",
    "NxDegreeAssortativityCoefficient",
    "NxDegreePearsonCorrelationCoefficient",
    "NxHasBridge",
    "NxGraphCliqueNumber",
    "NxGraphNumberOfCliques",
    "NxTransitivity",
    "NxAverageClustering",
    "NxIsConnected",
    "NxNumberConnectedComponents",
    "NxIsDistanceRegular",
    "NxLocalEfficiency",
    "NxGlobalEfficiency",
    "NxIsEulerian",
 ]
--- a/autogl/module/_feature/auto_feature.py
+++ b/autogl/module/_feature/auto_feature.py
--- a/autogl/module/_feature/base.py
+++ b/autogl/module/_feature/base.py
--- a/autogl/module/_feature/generators/init.py
+++ b/autogl/module/_feature/generators/init.py
--- a/autogl/module/_feature/generators/base.py
+++ b/autogl/module/_feature/generators/base.py
--- a/autogl/module/_feature/generators/eigen.py
+++ b/autogl/module/_feature/generators/eigen.py
--- a/autogl/module/_feature/generators/graphlet.py
+++ b/autogl/module/_feature/generators/graphlet.py
--- a/autogl/module/_feature/generators/page_rank.py
+++ b/autogl/module/_feature/generators/page_rank.py
--- a/autogl/module/_feature/generators/pyg.py
+++ b/autogl/module/_feature/generators/pyg.py
--- a/autogl/module/_feature/graph/init.py
+++ b/autogl/module/_feature/graph/init.py
--- a/autogl/module/_feature/graph/base.py
+++ b/autogl/module/_feature/graph/base.py
--- a/autogl/module/_feature/graph/netlsd.py
+++ b/autogl/module/_feature/graph/netlsd.py
--- a/autogl/module/_feature/graph/nx.py
+++ b/autogl/module/_feature/graph/nx.py
--- a/autogl/module/_feature/selectors/init.py
+++ b/autogl/module/_feature/selectors/init.py
--- a/autogl/module/_feature/selectors/base.py
+++ b/autogl/module/_feature/selectors/base.py
--- a/autogl/module/_feature/selectors/se_filter_constant.py
+++ b/autogl/module/_feature/selectors/se_filter_constant.py
--- a/autogl/module/_feature/selectors/se_gbdt.py
+++ b/autogl/module/_feature/selectors/se_gbdt.py
--- a/autogl/module/_feature/utils.py
+++ b/autogl/module/_feature/utils.py
--- a/autogl/module/feature/init.py
+++ b/autogl/module/feature/init.py
@@ -1,103 +1,35 @@
 from .base import BaseFeature
 from .base import BaseFeatureEngineer

 FEATURE_DICT = {}


 def register_feature(name):
    def register_feature_cls(cls):
        if name in FEATURE_DICT:
            raise ValueError(
                "Cannot register duplicate feature engineer ({})".format(name)
            )
        # if not issubclass(cls, BaseFeatureEngineer):
        if not issubclass(cls, BaseFeature):
            raise ValueError(
                "Trainer ({}: {}) must extend BaseFeatureEngineer".format(
                    name, cls.__name__
                )
            )
        FEATURE_DICT[name] = cls
        return cls

    return register_feature_cls


 from .auto_feature import AutoFeatureEngineer

 from .generators import (
    BaseGenerator,
    GeGraphlet,
    GeEigen,
    GePageRank,
    register_pyg,
    pygfunc,
    PYGGenerator,
    PYGLocalDegreeProfile,
    PYGNormalizeFeatures,
    PYGOneHotDegree,
 from ._base_feature_engineer import (
    BaseFeatureEngineer, BaseFeature
 )

 from .selectors import BaseSelector, SeFilterConstant, SeGBDT

 from .graph import (
    BaseGraph,
    SgNetLSD,
    register_nx,
    NxGraph,
    nxfunc,
    NxLargeCliqueSize,
    NxAverageClusteringApproximate,
    NxDegreeAssortativityCoefficient,
    NxDegreePearsonCorrelationCoefficient,
    NxHasBridge,
    NxGraphCliqueNumber,
    NxGraphNumberOfCliques,
    NxTransitivity,
    NxAverageClustering,
    NxIsConnected,
    NxNumberConnectedComponents,
    NxIsDistanceRegular,
    NxLocalEfficiency,
    NxGlobalEfficiency,
    NxIsEulerian,
 from ._feature_engineer_registry import (
    FeatureEngineerUniversalRegistry, FEATURE_DICT
 )
 from ._generators import (
    OneHotFeatureGenerator,
    EigenFeatureGenerator,
    GraphletGenerator,
    PageRankFeatureGenerator,
    LocalDegreeProfileGenerator,
    NormalizeFeatures,
    OneHotDegreeGenerator
 )
 from ._graph import (
    NetLSD,
    NXLargeCliqueSize,
    NXDegreeAssortativityCoefficient,
    NXDegreePearsonCorrelationCoefficient,
    NXHasBridges,
    NXGraphCliqueNumber,
    NXGraphNumberOfCliques,
    NXTransitivity,
    NXAverageClustering,
    NXIsConnected,
    NXNumberConnectedComponents,
    NXIsDistanceRegular,
    NXLocalEfficiency,
    NXGlobalEfficiency,
    NXIsEulerian,
 )
 from ._selectors import (
    FilterConstant, GBDTFeatureSelector
 )

 __all__ = [
    "BaseFeatureEngineer",
    "AutoFeatureEngineer",
    "BaseFeature",
    "BaseGenerator",
    "GeGraphlet",
    "GeEigen",
    "GePageRank",
    "register_pyg",
    "pygfunc",
    "PYGGenerator",
    "PYGLocalDegreeProfile",
    "PYGNormalizeFeatures",
    "PYGOneHotDegree",
    "BaseSelector",
    "SeFilterConstant",
    "SeGBDT",
    "BaseGraph",
    "SgNetLSD",
    "register_nx",
    "NxGraph",
    "nxfunc",
    "NxLargeCliqueSize",
    "NxAverageClusteringApproximate",
    "NxDegreeAssortativityCoefficient",
    "NxDegreePearsonCorrelationCoefficient",
    "NxHasBridge",
    "NxGraphCliqueNumber",
    "NxGraphNumberOfCliques",
    "NxTransitivity",
    "NxAverageClustering",
    "NxIsConnected",
    "NxNumberConnectedComponents",
    "NxIsDistanceRegular",
    "NxLocalEfficiency",
    "NxGlobalEfficiency",
    "NxIsEulerian",
 ]
--- a/autogl/module/feature/_base_feature_engineer.py
+++ b/autogl/module/feature/_base_feature_engineer.py
@@ -0,0 +1,90 @@
 import copy
 import logging
 import torch
 import typing as _typing
 from autogl.data import Dataset

 LOGGER = logging.getLogger("FeatureEngineer")


 class _BaseFeatureEngineer:
    def __and__(self, other):
        raise NotImplementedError

    def fit_transform(self, dataset: Dataset, inplace=True) -> Dataset:
        """
        Fit and transform dataset inplace or not w.r.t bool argument ``inplace``
        """
        dataset = self.fit(dataset)
        return self.transform(dataset, inplace=inplace)

    def fit(self, dataset: Dataset) -> Dataset:
        raise NotImplementedError

    def transform(self, dataset: Dataset, inplace: bool = True) -> Dataset:
        raise NotImplementedError


 class _ComposedFeatureEngineer(_BaseFeatureEngineer):
    @property
    def fe_components(self) -> _typing.Iterable[_BaseFeatureEngineer]:
        return self.__fe_components

    def __init__(self, feature_engineers: _typing.Iterable[_BaseFeatureEngineer]):
        self.__fe_components: _typing.List[_BaseFeatureEngineer] = []
        for fe in feature_engineers:
            if isinstance(fe, _ComposedFeatureEngineer):
                self.__fe_components.extend(fe.fe_components)
            else:
                self.__fe_components.append(fe)

    def __and__(self, other: _BaseFeatureEngineer):
        return _ComposedFeatureEngineer((self, other))

    def fit(self, dataset) -> Dataset:
        for fe in self.fe_components:
            dataset = fe.fit(dataset)
        return dataset

    def transform(self, dataset: Dataset, inplace: bool = True) -> Dataset:
        for fe in self.fe_components:
            dataset = fe.transform(dataset, inplace)
        return dataset


 class BaseFeature(_BaseFeatureEngineer):
    def __init__(self, multi_graph: bool = True, subgraph=False):
        self._multi_graph: bool = multi_graph

    def __and__(self, other):
        return _ComposedFeatureEngineer((self, other))

    def _preprocess(self, data: _typing.Any) -> _typing.Any:
        return data

    def _fit(self, data: _typing.Any) -> _typing.Any:
        return data

    def _transform(self, data: _typing.Any) -> _typing.Any:
        return data

    def _postprocess(self, data: _typing.Any) -> _typing.Any:
        return data

    def fit(self, dataset: Dataset) -> Dataset:
        with torch.no_grad():
            for i, data in enumerate(dataset):
                dataset[i] = self._postprocess(self._transform(self._fit(self._preprocess(data))))
            return dataset

    def transform(self, dataset: Dataset, inplace: bool = True) -> Dataset:
        if not inplace:
            dataset = copy.deepcopy(dataset)
        with torch.no_grad():
            for i, data in enumerate(dataset):
                dataset[i] = self._postprocess(self._transform(self._preprocess(data)))
            return dataset


 class BaseFeatureEngineer(BaseFeature):
    ...
--- a/autogl/module/feature/_feature_engineer_registry.py
+++ b/autogl/module/feature/_feature_engineer_registry.py
@@ -0,0 +1,62 @@
 import typing as _typing

 from ._base_feature_engineer import BaseFeatureEngineer


 class _FeatureEngineerUniversalRegistryMetaclass(type):
    def __new__(
            mcs, name: str, bases: _typing.Tuple[type, ...],
            namespace: _typing.Dict[str, _typing.Any]
    ):
        return super(_FeatureEngineerUniversalRegistryMetaclass, mcs).__new__(
            mcs, name, bases, namespace
        )

    def __init__(
            cls, name: str, bases: _typing.Tuple[type, ...],
            namespace: _typing.Dict[str, _typing.Any]
    ):
        super(_FeatureEngineerUniversalRegistryMetaclass, cls).__init__(
            name, bases, namespace
        )
        cls._feature_engineer_universal_registry: _typing.MutableMapping[
            str, _typing.Type[BaseFeatureEngineer]
        ] = {}


 class FeatureEngineerUniversalRegistry(metaclass=_FeatureEngineerUniversalRegistryMetaclass):
    @classmethod
    def register_feature_engineer(cls, name: str) -> _typing.Callable[
        [_typing.Type[BaseFeatureEngineer]], _typing.Type[BaseFeatureEngineer]
    ]:
        def register_fe(
                fe: _typing.Type[BaseFeatureEngineer]
        ) -> _typing.Type[BaseFeatureEngineer]:
            if name in cls._feature_engineer_universal_registry:
                raise ValueError(
                    f"Feature Engineer with name \"{name}\" already exists!"
                )
            elif not issubclass(fe, BaseFeatureEngineer):
                raise TypeError
            else:
                cls._feature_engineer_universal_registry[name] = fe
                return fe
        return register_fe

    @classmethod
    def get_feature_engineer(cls, name: str) -> _typing.Type[BaseFeatureEngineer]:
        if name in cls._feature_engineer_universal_registry:
            return cls._feature_engineer_universal_registry[name]
        else:
            raise ValueError(f"cannot find feature engineer {name}")


 class _DeprecatedFeatureDict:
    def __contains__(self, name: str) -> bool:
        return name in FeatureEngineerUniversalRegistry._feature_engineer_universal_registry

    def __getitem__(self, name: str) -> _typing.Type[BaseFeatureEngineer]:
        return FeatureEngineerUniversalRegistry.get_feature_engineer(name)


 FEATURE_DICT = _DeprecatedFeatureDict()
--- a/autogl/module/feature/_generators/init.py
+++ b/autogl/module/feature/_generators/init.py
@@ -0,0 +1,19 @@
 from ._basic import OneHotFeatureGenerator
 from ._eigen import EigenFeatureGenerator
 from ._graphlet import GraphletGenerator
 from ._page_rank import PageRankFeatureGenerator
 from ._pyg import (
    LocalDegreeProfileGenerator,
    NormalizeFeatures,
    OneHotDegreeGenerator
 )

 __all__ = [
    "OneHotFeatureGenerator",
    "EigenFeatureGenerator",
    "GraphletGenerator",
    "PageRankFeatureGenerator",
    "LocalDegreeProfileGenerator",
    "NormalizeFeatures",
    "OneHotDegreeGenerator"
 ]
--- a/autogl/module/feature/_generators/_basic.py
+++ b/autogl/module/feature/_generators/_basic.py
@@ -0,0 +1,107 @@
 import torch
 import typing as _typing
 import autogl
 from autogl.data.graph import GeneralStaticGraph
 from .._base_feature_engineer import BaseFeatureEngineer
 from .._feature_engineer_registry import FeatureEngineerUniversalRegistry


 class BaseFeatureGenerator(BaseFeatureEngineer):
    def __init__(self, override_features: bool = False):
        super(BaseFeatureGenerator, self).__init__()
        if not isinstance(override_features, bool):
            raise TypeError
        else:
            self._override_features: bool = override_features

    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
        raise NotImplementedError

    def __transform_homogeneous_static_graph(
            self, homogeneous_static_graph: GeneralStaticGraph
    ) -> GeneralStaticGraph:
        if not (
                homogeneous_static_graph.nodes.is_homogeneous and
                homogeneous_static_graph.edges.is_homogeneous
        ):
            raise ValueError("Provided static graph must be homogeneous")
        if 'x' in homogeneous_static_graph.nodes.data:
            feature_key: _typing.Optional[str] = 'x'
            features: _typing.Optional[torch.Tensor] = (
                homogeneous_static_graph.nodes.data['x']
            )
        elif 'feat' in homogeneous_static_graph.nodes.data:
            feature_key: _typing.Optional[str] = 'feat'
            features: _typing.Optional[torch.Tensor] = (
                homogeneous_static_graph.nodes.data['feat']
            )
        else:
            feature_key: _typing.Optional[str] = None
            features: _typing.Optional[torch.Tensor] = None
        if 'y' in homogeneous_static_graph.nodes.data:
            label: _typing.Optional[torch.Tensor] = (
                homogeneous_static_graph.nodes.data['y']
            )
        elif 'label' in homogeneous_static_graph.nodes.data:
            label: _typing.Optional[torch.Tensor] = (
                homogeneous_static_graph.nodes.data['label']
            )
        else:
            label: _typing.Optional[torch.Tensor] = None
        if (
                'edge_weight' in homogeneous_static_graph.edges.data and
                homogeneous_static_graph.edges.data['edge_weight'].dim() == 1
        ):
            edge_weight: torch.Tensor = (
                homogeneous_static_graph.edges.data['edge_weight']
            )
        else:
            edge_weight: torch.Tensor = torch.ones(
                homogeneous_static_graph.edges.connections.size(1)
            )
        data = autogl.data.Data(
            edge_index=homogeneous_static_graph.edges.connections,
            x=features, y=label
        )
        setattr(data, "edge_weight", edge_weight)
        extracted_features: torch.Tensor = self._extract_nodes_feature(data)
        if isinstance(feature_key, str):
            nodes_features: torch.Tensor = (
                homogeneous_static_graph.nodes.data[feature_key].view(-1, 1)
                if homogeneous_static_graph.nodes.data[feature_key].dim() == 1
                else homogeneous_static_graph.nodes.data[feature_key]
            )
            assert extracted_features.size(0) == nodes_features.size(0)
            assert extracted_features.dim() == nodes_features.dim() == 2
            homogeneous_static_graph.nodes.data[feature_key] = (
                extracted_features.to(nodes_features.device)
                if self._override_features
                else torch.cat(
                    [nodes_features, extracted_features.to(nodes_features.device)], dim=-1
                )
            )
        else:
            if autogl.backend.DependentBackend.is_pyg():
                homogeneous_static_graph.nodes.data['x'] = extracted_features
            elif autogl.backend.DependentBackend.is_dgl():
                homogeneous_static_graph.nodes.data['feat'] = extracted_features
        return homogeneous_static_graph

    def _transform(self, data: _typing.Any) -> _typing.Any:
        if isinstance(data, GeneralStaticGraph):
            return self.__transform_homogeneous_static_graph(data)
        else:
            raise NotImplementedError(
                f"Feature Generator only support instance of {GeneralStaticGraph} as provided data"
            )


@FeatureEngineerUniversalRegistry.register_feature_engineer("OneHot".lower())
 class OneHotFeatureGenerator(BaseFeatureGenerator):
    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
        num_nodes: int = (
            data.x.size(0)
            if data.x is not None and isinstance(data.x, torch.Tensor)
            else (data.edge_index.max().item() + 1)
        )
        return torch.eye(num_nodes)
--- a/autogl/module/feature/_generators/_eigen.py
+++ b/autogl/module/feature/_generators/_eigen.py
@@ -0,0 +1,92 @@
 import autogl
 import numpy as np
 from scipy.sparse import csr_matrix
 import scipy.sparse as ssp
 import scipy.sparse.linalg
 import networkx as nx
 import torch
 from ._basic import BaseFeatureGenerator
 from .._feature_engineer_registry import FeatureEngineerUniversalRegistry


 class _Eigen:
    def __init__(self):
        ...

    @classmethod
    def __normalize_adj(cls, adj):
        row_sum = np.array(adj.sum(1))
        d_inv_sqrt = np.power(row_sum, -0.5).flatten()
        d_inv_sqrt[np.isinf(d_inv_sqrt)] = 0.0
        d_inv_sqrt = ssp.diags(d_inv_sqrt)
        return adj.dot(d_inv_sqrt).transpose().dot(d_inv_sqrt)

    def __call__(self, adj, d, use_eigenvalues=0, adj_norm=1):
        G = nx.from_scipy_sparse_matrix(adj)
        comp = list(nx.connected_components(G))
        results = np.zeros((adj.shape[0], d))
        for i in range(len(comp)):
            node_index = np.array(list(comp[i]))
            d_temp = min(len(node_index) - 2, d)
            if d_temp <= 0:
                continue
            temp_adj = adj[node_index, :][:, node_index].asfptype()
            if adj_norm == 1:
                temp_adj = self.__normalize_adj(temp_adj)
            lamb, X = scipy.sparse.linalg.eigs(temp_adj, d_temp)
            lamb, X = lamb.real, X.real
            temp_order = np.argsort(lamb)
            lamb, X = lamb[temp_order], X[:, temp_order]
            for i in range(X.shape[1]):
                if np.sum(X[:, i]) < 0:
                    X[:, i] = -X[:, i]
            if use_eigenvalues == 1:
                X = X.dot(np.diag(np.sqrt(np.absolute(lamb))))
            elif use_eigenvalues == 2:
                X = X.dot(np.diag(lamb))
            results[node_index, :d_temp] = X
        return results


@FeatureEngineerUniversalRegistry.register_feature_engineer("eigen")
 class EigenFeatureGenerator(BaseFeatureGenerator):
    r"""
    concat Eigen features

    Notes
    -----
    An implementation of [#]_

    References
    ----------
    .. [#] Ziwei Zhang, Peng Cui, Jian Pei, Xin Wang, Wenwu Zhu:
        Eigen-GNN: A Graph Structure Preserving Plug-in for GNNs. CoRR abs/2006.04330 (2020)
        https://arxiv.org/abs/2006.04330


    Parameters
    ----------
    size : int
        EigenGNN hidden size
    """
    def __init__(self, size: int = 32):
        super(EigenFeatureGenerator, self).__init__()
        self.__size: int = size

    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
        edge_index: np.ndarray = data.edge_index.numpy()
        edge_weight: np.ndarray = getattr(data, "edge_weight").numpy()
        num_nodes: int = (
            data.x.size(0)
            if data.x is not None and isinstance(data.x, torch.Tensor)
            else (data.edge_index.max().item() + 1)
        )
        adj = csr_matrix(
            (edge_weight, (edge_index[0, :], edge_index[1, :])),
            shape=(num_nodes, num_nodes)
        )
        if np.max(adj - adj.T) > 1e-5:
            adj = adj + adj.T
        mf = _Eigen()
        features: np.ndarray = mf(adj, self.__size)
        return torch.from_numpy(features)
--- a/autogl/module/feature/_generators/_graphlet.py
+++ b/autogl/module/feature/_generators/_graphlet.py
@@ -0,0 +1,247 @@
 import logging
 import numpy as np
 import torch
 from tqdm import tqdm
 import autogl
 from ._basic import BaseFeatureGenerator
 from .._feature_engineer_registry import FeatureEngineerUniversalRegistry

 _LOGGER = logging.getLogger("FE")


 class _Graphlet:
    def __init__(self, data, sample_error=0.1, sample_confidence=0.1):
        self._data = data
        self._init()

        self._sample_error = sample_error
        self._sample_confidence = sample_confidence
        self._dw = int(
            np.ceil(
                0.5 * (self._sample_error ** -2) * np.log(2 / self._sample_confidence)
            )
        )
        _LOGGER.info(
            "sample error {} , confidence {},num {}".format(
                self._sample_error, self._sample_confidence, self._dw
            )
        )

    def _init(self):
        self._edges = list(self._data.edge_index)
        self._edges = [self._edges[0], self._edges[1]]
        self._num_nodes = self._data.x.shape[0]
        self._num_edges = len(self._edges[0])
        self._neighbours = [[] for _ in range(self._num_nodes)]
        for i in range(len(self._edges[0])):
            u, v = self._edges[0][i], self._edges[1][i]
            self._neighbours[u].append(v)

        _LOGGER.info("nodes {} , edges {}".format(self._num_nodes, self._num_edges))

        # sorting
        self._node_degrees = np.array([len(x) for x in self._neighbours])
        self._nodes = np.argsort(self._node_degrees)
        for i in self._nodes:
            self._neighbours[i] = [
                x
                for _, x in sorted(
                    zip(self._node_degrees[self._neighbours[i]], self._neighbours[i]),
                    reverse=True,
                )
            ]
        self._neighbours = [np.array(x) for x in self._neighbours]

    def _get_gdv(self, v, u):
        if self._node_degrees[v] >= self._node_degrees[u]:
            pass
        else:
            u, v = v, u
        Sv, Su, Te = set(), set(), set()
        sigma1, sigma2 = 0, 0
        nb = self._neighbours
        N = self._num_nodes
        M = self._num_edges
        phi = np.zeros(self._num_nodes, dtype=int)
        c1, c2, c3, c4 = 1, 2, 3, 4
        x = np.zeros(16, dtype=int)
        # p1
        for w in nb[v]:
            if w != u:
                Sv.add(w)
                phi[w] = c1
        # p2
        for w in nb[u]:
            if w != v:
                if phi[w] == c1:
                    Te.add(w)
                    phi[w] = c3
                    Sv.remove(w)
                else:
                    Su.add(w)
                    phi[w] = c2
        # p3
        for w in Te:
            for r in nb[w]:
                if phi[r] == c3:
                    x[5] += 1
            phi[w] = c4
            sigma2 = sigma2 + len(nb[w]) - 2
        # p4
        for w in Su:
            for r in nb[w]:
                if phi[r] == c1:
                    x[8] += 1
                if phi[r] == c2:
                    x[7] += 1
                if phi[r] == c4:
                    sigma1 += 1
            phi[w] = 0
            sigma2 = sigma2 + len(nb[w]) - 1
        # p5
        for w in Sv:
            for r in nb[w]:
                if phi[r] == c1:
                    x[7] += 1
                if phi[r] == c4:
                    sigma1 += 1
            phi[w] = 0
            sigma2 = sigma2 + len(nb[w]) - 1

        lsv, lsu, lte, du, dv = len(Sv), len(Su), len(Te), len(nb[u]), len(nb[v])
        # 3-graphlet
        x[1] = lte
        x[2] = du + dv - 2 - 2 * x[1]
        x[3] = N - x[2] - x[1] - 2
        x[4] = N * (N - 1) * (N - 2) / 6 - (x[1] + x[2] + x[3])
        # 4 connected graphlets
        x[6] = x[1] * (x[1] - 1) / 2 - x[5]
        x[10] = lsv * lsu - x[8]
        x[9] = lsv * (lsv - 1) / 2 + lsu * (lsu - 1) / 2 - x[7]
        # 4 disconnected graphlets
        t1 = N - (lte + lsu + lsv + 2)
        x[11] = x[1] * t1
        x[12] = M - (du + dv - 1) - (sigma2 - sigma1 - x[5] - x[8] - x[7])
        x[13] = (lsu + lsv) * t1
        x[14] = t1 * (t1 - 1) / 2 - x[12]
        x[15] = N * (N - 1) * (N - 2) * (N - 3) / 24 - np.sum(x[5:15])

        return x

    def _get_gdv_sample(self, v, u):
        if self._node_degrees[v] >= self._node_degrees[u]:
            pass
        else:
            u, v = v, u
        Sv = set()
        sigma1, sigma2 = 0, 0
        nb = self._neighbours
        N = self._num_nodes
        M = self._num_edges
        phi = np.zeros(self._num_nodes, dtype=int)
        c1, c2, c3, c4 = 1, 2, 3, 4
        x = np.zeros(16)
        dw = self._dw

        # p1
        Sv = set(nb[v][nb[v] != u])
        phi[list(Sv)] = c1
        # p2
        p2w = nb[u][nb[u] != c1]
        p2w1 = p2w[phi[p2w] == c1]
        p2w2 = p2w[phi[p2w] != c1]
        Te = p2w1
        phi[p2w1] = c3
        Sv -= set(list(p2w1))
        Su = p2w2
        phi[p2w2] = c2
        # p3
        for w in Te:
            if dw >= len(nb[w]):
                region = nb[w]
                inc = 1
            else:
                region = np.random.choice(nb[w], dw, replace=False)
                inc = self._node_degrees[w] / dw
            phir = phi[region]
            x[5] += inc * np.sum(phir == c3)
            phi[w] = c4
            sigma2 = sigma2 + len(nb[w]) - 2
        # p4
        for w in Su:
            if dw >= len(nb[w]):
                region = nb[w]
                inc = 1
            else:
                region = np.random.choice(nb[w], dw, replace=False)
                inc = self._node_degrees[w] / dw
            phir = phi[region]
            x[8] += inc * np.sum(phir == c1)
            x[7] += inc * np.sum(phir == c2)
            sigma1 += inc * np.sum(phir == c4)
            phi[w] = 0
            sigma2 = sigma2 + len(nb[w]) - 1
        # p5
        for w in Sv:
            if dw >= len(nb[w]):
                region = nb[w]
                inc = 1
            else:
                region = np.random.choice(nb[w], dw, replace=False)
                inc = self._node_degrees[w] / dw
            phir = phi[region]
            x[7] += inc * np.sum(phir == c1)
            sigma1 += inc * np.sum(phir == c4)
            phi[w] = 0
            sigma2 = sigma2 + len(nb[w]) - 1

        lsv, lsu, lte, du, dv = len(Sv), len(Su), len(Te), len(nb[u]), len(nb[v])
        # 3-graphlet
        x[1] = lte
        x[2] = du + dv - 2 - 2 * x[1]
        x[3] = N - x[2] - x[1] - 2
        x[4] = N * (N - 1) * (N - 2) / 6 - (x[1] + x[2] + x[3])
        # 4 connected graphlets
        x[6] = x[1] * (x[1] - 1) / 2 - x[5]
        x[10] = lsv * lsu - x[8]
        x[9] = lsv * (lsv - 1) / 2 + lsu * (lsu - 1) / 2 - x[7]
        # 4 disconnected graphlets
        t1 = N - (lte + lsu + lsv + 2)
        x[11] = x[1] * t1
        x[12] = M - (du + dv - 1) - (sigma2 - sigma1 - x[5] - x[8] - x[7])
        x[13] = (lsu + lsv) * t1
        x[14] = t1 * (t1 - 1) / 2 - x[12]
        x[15] = N * (N - 1) * (N - 2) * (N - 3) / 24 - np.sum(x[5:15])

        return x

    def get_gdvs(self, sample=True):
        res = np.zeros((self._num_nodes, 15))
        for u in tqdm(range(self._num_nodes)):
            vs = self._neighbours[u]
            if len(vs) != 0:
                gdvs = []
                for v in tqdm(vs, disable=len(vs) < 100):
                    if sample:
                        gdvs.append(self._get_gdv_sample(u, v))
                    else:
                        gdvs.append(self._get_gdv(u, v))
                res[u, :] = np.mean(gdvs, axis=0)[1:]
        return res


@FeatureEngineerUniversalRegistry.register_feature_engineer("graph" + "let")
 class GraphletGenerator(BaseFeatureGenerator):
    r"""generate local graphlet numbers as features. The implementation refers to [#]_ .

    References
    ----------
    .. [#] Ahmed, N. K., Willke, T. L., & Rossi, R. A. (2016).
        Estimation of local subgraph counts. Proceedings - 2016 IEEE International Conference on Big Data, Big Data 2016, 586–595.
        https://doi.org/10.1109/BigData.2016.7840651

    """

    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
        result: np.ndarray = _Graphlet(data).get_gdvs()
        return torch.from_numpy(result)
--- a/autogl/module/feature/_generators/_page_rank.py
+++ b/autogl/module/feature/_generators/_page_rank.py
@@ -0,0 +1,29 @@
 import numpy as np
 import networkx as nx
 import torch
 import autogl
 from ._basic import BaseFeatureGenerator
 from .._feature_engineer_registry import FeatureEngineerUniversalRegistry


@FeatureEngineerUniversalRegistry.register_feature_engineer("PageRank".lower())
 class PageRankFeatureGenerator(BaseFeatureGenerator):
    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
        edge_weight = getattr(data, "edge_weight").tolist()
        g = nx.DiGraph()
        g.add_weighted_edges_from(
            [
                (u, v, edge_weight[i])
                for i, (u, v) in enumerate(data.edge_index.t().tolist())
            ]
        )
        page_rank = nx.pagerank(g)
        num_nodes: int = (
            data.x.size(0)
            if data.x is not None and isinstance(data.x, torch.Tensor)
            else (data.edge_index.max().item() + 1)
        )
        pr = np.zeros(num_nodes)
        for i, v in page_rank.items():
            pr[i] = v
        return torch.from_numpy(pr)
--- a/autogl/module/feature/_generators/_pyg.py
+++ b/autogl/module/feature/_generators/_pyg.py
@@ -0,0 +1,81 @@
 import torch.nn.functional
 import autogl
 from ._basic import BaseFeatureGenerator
 from ._pyg_impl import degree, scatter_min, scatter_max, scatter_mean, scatter_std
 from .._feature_engineer_registry import FeatureEngineerUniversalRegistry


@FeatureEngineerUniversalRegistry.register_feature_engineer("LocalDegreeProfile")
 class LocalDegreeProfileGenerator(BaseFeatureGenerator):
    r"""Appends the Local Degree Profile (LDP) from the `"A Simple yet
    Effective Baseline for Non-attribute Graph Classification"
    <https://arxiv.org/abs/1811.03508>`_ paper

    .. math::
        \mathbf{x}_i = \mathbf{x}_i \, \Vert \, (\deg(i), \min(DN(i)),
        \max(DN(i)), \textrm{mean}(DN(i)), \textrm{std}(DN(i)))

    to the node features, where :math:`DN(i) = \{ \deg(j) \mid j \in
    \mathcal{N}(i) \}`.
    """

    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
        row, col = data.edge_index
        if data.x is not None and isinstance(data.x, torch.Tensor):
            N = data.x.size(0)
        else:
            N = (torch.max(data.edge_index).item() + 1)

        deg = degree(row, N, dtype=torch.float)
        deg_col = deg[col]

        min_deg, _ = scatter_min(deg_col, row, dim_size=N)
        min_deg[min_deg > 10000] = 0
        max_deg, _ = scatter_max(deg_col, row, dim_size=N)
        max_deg[max_deg < -10000] = 0
        mean_deg = scatter_mean(deg_col, row, dim_size=N)
        std_deg = scatter_std(deg_col, row, dim_size=N)

        x = torch.stack([deg, min_deg, max_deg, mean_deg, std_deg], dim=1)
        return x


@FeatureEngineerUniversalRegistry.register_feature_engineer("NormalizeFeatures")
 class NormalizeFeatures(BaseFeatureGenerator):
    def __init__(self):
        super(NormalizeFeatures, self).__init__(override_features=True)

    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
        if data.x is not None and isinstance(data.x, torch.Tensor):
            data.x.div_(data.x.sum(dim=-1, keepdim=True).clamp_(min=1.))
        return data.x


@FeatureEngineerUniversalRegistry.register_feature_engineer("OneHotDegree")
 class OneHotDegreeGenerator(BaseFeatureGenerator):
    r"""Adds the node degree as one hot encodings to the node features.

    Args:
        max_degree (int): Maximum degree.
        in_degree (bool, optional): If set to :obj:`True`, will compute the
            in-degree of nodes instead of the out-degree.
            (default: :obj:`False`)
        cat (bool, optional): Concat node degrees to node features instead
            of replacing them. (default: :obj:`True`)
    """
    def __init__(
            self, max_degree: int = 1000,
            in_degree: bool = False, cat: bool = True
    ):
        self.__max_degree: int = max_degree
        self.__in_degree: bool = in_degree
        self.__cat: bool = cat
        super(OneHotDegreeGenerator, self).__init__()

    def _extract_nodes_feature(self, data: autogl.data.Data) -> torch.Tensor:
        idx, x = data.edge_index[1 if self.__in_degree else 0], data.x
        deg = degree(idx, data.num_nodes, dtype=torch.long)
        deg = torch.nn.functional.one_hot(
            deg, num_classes=self.__max_degree + 1
        ).to(torch.float)
        return deg
--- a/autogl/module/feature/_generators/_pyg_impl.py
+++ b/autogl/module/feature/_generators/_pyg_impl.py
@@ -0,0 +1,234 @@
 import torch
 import typing as _typing
 from typing import Optional, Tuple


 def degree(index, num_nodes: _typing.Optional[int] = None,
           dtype: _typing.Optional[torch.dtype] = None):
    r"""Computes the (unweighted) degree of a given one-dimensional index
    tensor.

    Args:
        index (LongTensor): Index tensor.
        num_nodes (int, optional): The number of nodes, *i.e.*
            :obj:`max_val + 1` of :attr:`index`. (default: :obj:`None`)
        dtype (:obj:`torch.dtype`, optional): The desired data type of the
            returned tensor.

    :rtype: :class:`Tensor`
    """

    def maybe_num_nodes(edge_index, __num_nodes=None):
        if __num_nodes is not None:
            return __num_nodes
        elif isinstance(edge_index, torch.Tensor):
            return int(edge_index.max()) + 1 if edge_index.numel() > 0 else 0
        else:
            return max(edge_index.size(0), edge_index.size(1))

    N = maybe_num_nodes(index, num_nodes)
    out = torch.zeros((N,), dtype=dtype, device=index.device)
    one = torch.ones((index.size(0),), dtype=out.dtype, device=out.device)
    return out.scatter_add_(0, index, one)


 def broadcast(src: torch.Tensor, other: torch.Tensor, dim: int):
    if dim < 0:
        dim = other.dim() + dim
    if src.dim() == 1:
        for _ in range(0, dim):
            src = src.unsqueeze(0)
    for _ in range(src.dim(), other.dim()):
        src = src.unsqueeze(-1)
    src = src.expand_as(other)
    return src


 def scatter_sum(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
                out: Optional[torch.Tensor] = None,
                dim_size: Optional[int] = None) -> torch.Tensor:
    index = broadcast(index, src, dim)
    if out is None:
        size = list(src.size())
        if dim_size is not None:
            size[dim] = dim_size
        elif index.numel() == 0:
            size[dim] = 0
        else:
            size[dim] = int(index.max()) + 1
        out = torch.zeros(size, dtype=src.dtype, device=src.device)
        return out.scatter_add_(dim, index, src)
    else:
        return out.scatter_add_(dim, index, src)


 def scatter_add(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
                out: Optional[torch.Tensor] = None,
                dim_size: Optional[int] = None) -> torch.Tensor:
    return scatter_sum(src, index, dim, out, dim_size)


 def scatter_mul(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
                out: Optional[torch.Tensor] = None,
                dim_size: Optional[int] = None) -> torch.Tensor:
    return torch.ops.torch_scatter.scatter_mul(src, index, dim, out, dim_size)


 def scatter_mean(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
                 out: Optional[torch.Tensor] = None,
                 dim_size: Optional[int] = None) -> torch.Tensor:
    out = scatter_sum(src, index, dim, out, dim_size)
    dim_size = out.size(dim)

    index_dim = dim
    if index_dim < 0:
        index_dim = index_dim + src.dim()
    if index.dim() <= index_dim:
        index_dim = index.dim() - 1

    ones = torch.ones(index.size(), dtype=src.dtype, device=src.device)
    count = scatter_sum(ones, index, index_dim, None, dim_size)
    count[count < 1] = 1
    count = broadcast(count, out, dim)
    if out.is_floating_point():
        out.true_divide_(count)
    else:
        out.floor_divide_(count)
    return out


 def scatter_min(
        src: torch.Tensor, index: torch.Tensor, dim: int = -1,
        out: Optional[torch.Tensor] = None,
        dim_size: Optional[int] = None) -> Tuple[torch.Tensor, torch.Tensor]:
    return torch.ops.torch_scatter.scatter_min(src, index, dim, out, dim_size)


 def scatter_max(
        src: torch.Tensor, index: torch.Tensor, dim: int = -1,
        out: Optional[torch.Tensor] = None,
        dim_size: Optional[int] = None) -> Tuple[torch.Tensor, torch.Tensor]:
    return torch.ops.torch_scatter.scatter_max(src, index, dim, out, dim_size)


 def scatter_std(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
                out: Optional[torch.Tensor] = None,
                dim_size: Optional[int] = None,
                unbiased: bool = True) -> torch.Tensor:
    if out is not None:
        dim_size = out.size(dim)

    if dim < 0:
        dim = src.dim() + dim

    count_dim = dim
    if index.dim() <= dim:
        count_dim = index.dim() - 1

    ones = torch.ones(index.size(), dtype=src.dtype, device=src.device)
    count = scatter_sum(ones, index, count_dim, dim_size=dim_size)

    index = broadcast(index, src, dim)
    tmp = scatter_sum(src, index, dim, dim_size=dim_size)
    count = broadcast(count, tmp, dim).clamp(1)
    mean = tmp.div(count)

    var = (src - mean.gather(dim, index))
    var = var * var
    out = scatter_sum(var, index, dim, out, dim_size)

    if unbiased:
        count = count.sub(1).clamp_(1)
    out = out.div(count + 1e-6).sqrt()

    return out


 def scatter(src: torch.Tensor, index: torch.Tensor, dim: int = -1,
            out: Optional[torch.Tensor] = None, dim_size: Optional[int] = None,
            reduce: str = "sum") -> torch.Tensor:
    r"""
    |

    .. image:: https://raw.githubusercontent.com/rusty1s/pytorch_scatter/
            master/docs/source/_figures/add.svg?sanitize=true
        :align: center
        :width: 400px

    |

    Reduces all values from the :attr:`src` tensor into :attr:`out` at the
    indices specified in the :attr:`index` tensor along a given axis
    :attr:`dim`.
    For each value in :attr:`src`, its output index is specified by its index
    in :attr:`src` for dimensions outside of :attr:`dim` and by the
    corresponding value in :attr:`index` for dimension :attr:`dim`.
    The applied reduction is defined via the :attr:`reduce` argument.

    Formally, if :attr:`src` and :attr:`index` are :math:`n`-dimensional
    tensors with size :math:`(x_0, ..., x_{i-1}, x_i, x_{i+1}, ..., x_{n-1})`
    and :attr:`dim` = `i`, then :attr:`out` must be an :math:`n`-dimensional
    tensor with size :math:`(x_0, ..., x_{i-1}, y, x_{i+1}, ..., x_{n-1})`.
    Moreover, the values of :attr:`index` must be between :math:`0` and
    :math:`y - 1`, although no specific ordering of indices is required.
    The :attr:`index` tensor supports broadcasting in case its dimensions do
    not match with :attr:`src`.

    For one-dimensional tensors with :obj:`reduce="sum"`, the operation
    computes

    .. math::
        \mathrm{out}_i = \mathrm{out}_i + \sum_j~\mathrm{src}_j

    where :math:`\sum_j` is over :math:`j` such that
    :math:`\mathrm{index}_j = i`.

    .. note::

        This operation is implemented via atomic operations on the GPU and is
        therefore **non-deterministic** since the order of parallel operations
        to the same value is undetermined.
        For floating-point variables, this results in a source of variance in
        the result.

    :param src: The source tensor.
    :param index: The indices of elements to scatter.
    :param dim: The axis along which to index. (default: :obj:`-1`)
    :param out: The destination tensor.
    :param dim_size: If :attr:`out` is not given, automatically create output
        with size :attr:`dim_size` at dimension :attr:`dim`.
        If :attr:`dim_size` is not given, a minimal sized output tensor
        according to :obj:`index.max() + 1` is returned.
    :param reduce: The reduce operation (:obj:`"sum"`, :obj:`"mul"`,
        :obj:`"mean"`, :obj:`"min"` or :obj:`"max"`). (default: :obj:`"sum"`)

    :rtype: :class:`Tensor`

    .. code-block:: python

        from torch_scatter import scatter

        src = torch.randn(10, 6, 64)
        index = torch.tensor([0, 1, 0, 1, 2, 1])

        # Broadcasting in the first and last dim.
        out = scatter(src, index, dim=1, reduce="sum")

        print(out.size())

    .. code-block::

        torch.Size([10, 3, 64])
    """
    if reduce == 'sum' or reduce == 'add':
        return scatter_sum(src, index, dim, out, dim_size)
    if reduce == 'mul':
        return scatter_mul(src, index, dim, out, dim_size)
    elif reduce == 'mean':
        return scatter_mean(src, index, dim, out, dim_size)
    elif reduce == 'min':
        return scatter_min(src, index, dim, out, dim_size)[0]
    elif reduce == 'max':
        return scatter_max(src, index, dim, out, dim_size)[0]
    else:
        raise ValueError
--- a/autogl/module/feature/_graph/init.py
+++ b/autogl/module/feature/_graph/init.py
@@ -0,0 +1,17 @@
 from ._netlsd import NetLSD
 from ._networkx import (
    NXLargeCliqueSize,
    NXDegreeAssortativityCoefficient,
    NXDegreePearsonCorrelationCoefficient,
    NXHasBridges,
    NXGraphCliqueNumber,
    NXGraphNumberOfCliques,
    NXTransitivity,
    NXAverageClustering,
    NXIsConnected,
    NXNumberConnectedComponents,
    NXIsDistanceRegular,
    NXLocalEfficiency,
    NXGlobalEfficiency,
    NXIsEulerian,
 )
--- a/autogl/module/feature/_graph/_netlsd.py
+++ b/autogl/module/feature/_graph/_netlsd.py
@@ -0,0 +1,82 @@
 import netlsd
 import networkx
 import torch
 from autogl.data.graph import GeneralStaticGraph
 from autogl.data.graph.utils import conversion
 from .._base_feature_engineer import BaseFeatureEngineer
 from .._feature_engineer_registry import FeatureEngineerUniversalRegistry


@FeatureEngineerUniversalRegistry.register_feature_engineer("NetLSD".lower())
 class NetLSD(BaseFeatureEngineer):
    r"""
    Notes
    -----
    a graph feature generation method. This is a simple wrapper of NetLSD [#]_.

    References
    ----------
    ..  [#] A. Tsitsulin, D. Mottin, P. Karras, A. Bronstein, and E. Müller, “NetLSD: Hearing the shape of a graph,”
        Proc. ACM SIGKDD Int. Conf. Knowl. Discov. Data Min., pp. 2347–2356, 2018.
    """

    def __init__(self, *args, **kwargs):
        self.__args = args
        self.__kwargs = kwargs
        super(NetLSD, self).__init__()

    def __extract(self, nx_g: networkx.Graph) -> torch.Tensor:
        return torch.tensor(netlsd.heat(nx_g, *self.__args, **self.__kwargs)).view(-1)

    def __transform_homogeneous_static_graph(
            self, homogeneous_static_graph: GeneralStaticGraph
    ) -> GeneralStaticGraph:
        if not (
                homogeneous_static_graph.nodes.is_homogeneous and
                homogeneous_static_graph.edges.is_homogeneous
        ):
            raise ValueError("Provided static graph must be homogeneous")
        dsc: torch.Tensor = self.__extract(
            conversion.HomogeneousStaticGraphToNetworkX(to_undirected=True).__call__(
                homogeneous_static_graph, to_undirected=True
            )
        )
        if 'gf' in homogeneous_static_graph.data:
            gf = homogeneous_static_graph.data['gf'].view(-1)
            homogeneous_static_graph.data['gf'] = torch.cat([gf, dsc])
        else:
            homogeneous_static_graph.data['gf'] = dsc
        return homogeneous_static_graph

    @classmethod
    def __edge_index_to_nx_graph(cls, edge_index: torch.Tensor) -> networkx.Graph:
        g: networkx.Graph = networkx.Graph()
        for u, v in edge_index.t().tolist():
            if u == v:
                continue
            else:
                g.add_edge(u, v)
        return g

    def __transform_data(self, data):
        if not (
                hasattr(data, "edge_index") and
                torch.is_tensor(data.edge_index) and
                isinstance(data.edge_index, torch.Tensor) and
                data.edge_index.dim() == data.edge_index.size(0) == 2 and
                data.edge_index.dtype == torch.long
        ):
            raise TypeError("Unsupported provided data")
        dsc: torch.Tensor = self.__extract(self.__edge_index_to_nx_graph(data.edge_index))
        if hasattr(data, 'gf') and isinstance(data.gf, torch.Tensor):
            gf = data.gf.view(-1)
            data.gf = torch.cat([gf, dsc])
        else:
            data.gf = dsc
        return data

    def _transform(self, data):
        if isinstance(data, GeneralStaticGraph):
            return self.__transform_homogeneous_static_graph(data)
        else:
            return self.__transform_data(data)
--- a/autogl/module/feature/_graph/_networkx.py
+++ b/autogl/module/feature/_graph/_networkx.py
@@ -0,0 +1,176 @@
 import torch
 import typing as _typing
 import networkx
 from networkx.algorithms.euler import is_eulerian
 from networkx.algorithms.efficiency_measures import global_efficiency
 from networkx.algorithms.efficiency_measures import local_efficiency
 from networkx.algorithms.distance_regular import is_distance_regular
 from networkx.algorithms.components import number_connected_components
 from networkx.algorithms.components import is_connected
 # from networkx.algorithms.cluster import average_clustering
 from networkx.algorithms.cluster import transitivity
 from networkx.algorithms.clique import graph_number_of_cliques
 from networkx.algorithms.clique import graph_clique_number
 from networkx.algorithms.bridges import has_bridges
 from networkx.algorithms.assortativity import degree_pearson_correlation_coefficient
 from networkx.algorithms.assortativity import degree_assortativity_coefficient
 from networkx.algorithms.approximation.clustering_coefficient import average_clustering
 from networkx.algorithms.approximation.clique import large_clique_size

 from autogl.data.graph import GeneralStaticGraph
 from autogl.data.graph.utils import conversion
 from .._base_feature_engineer import BaseFeatureEngineer
 from .._feature_engineer_registry import FeatureEngineerUniversalRegistry


 class _NetworkXGraphFeatureEngineer(BaseFeatureEngineer):
    def __init__(self, feature_extractor: _typing.Callable[[networkx.Graph], _typing.Any]):
        self.__feature_extractor: _typing.Callable[[networkx.Graph], _typing.Any] = feature_extractor
        super(_NetworkXGraphFeatureEngineer, self).__init__()

    def __transform_homogeneous_static_graph(
            self, homogeneous_static_graph: GeneralStaticGraph
    ) -> GeneralStaticGraph:
        if not (
                homogeneous_static_graph.nodes.is_homogeneous and
                homogeneous_static_graph.edges.is_homogeneous
        ):
            raise ValueError("Provided static graph must be homogeneous")
        dsc: torch.Tensor = torch.tensor(
            [
                self.__feature_extractor(
                    conversion.HomogeneousStaticGraphToNetworkX(to_undirected=True)(homogeneous_static_graph)
                )
            ]
        ).view(-1)
        if 'gf' in homogeneous_static_graph.data:
            gf = homogeneous_static_graph.data['gf'].view(-1)
            homogeneous_static_graph.data['gf'] = torch.cat([gf, dsc])
        else:
            homogeneous_static_graph.data['gf'] = dsc
        return homogeneous_static_graph

    @classmethod
    def __edge_index_to_nx_graph(cls, edge_index: torch.Tensor) -> networkx.Graph:
        g: networkx.Graph = networkx.Graph()
        for u, v in edge_index.t().tolist():
            if u == v:
                continue
            else:
                g.add_edge(u, v)
        return g

    def __transform_data(self, data):
        if not (
                hasattr(data, "edge_index") and
                torch.is_tensor(data.edge_index) and
                isinstance(data.edge_index, torch.Tensor) and
                data.edge_index.dim() == data.edge_index.size(0) == 2 and
                data.edge_index.dtype == torch.long
        ):
            raise TypeError("Unsupported provided data")
        dsc: torch.Tensor = torch.tensor(
            [self.__feature_extractor(self.__edge_index_to_nx_graph(data.edge_index))]
        ).view(-1)
        if hasattr(data, 'gf') and isinstance(data.gf, torch.Tensor):
            gf = data.gf.view(-1)
            data.gf = torch.cat([gf, dsc])
        else:
            data.gf = dsc
        return data

    def _transform(self, data):
        if isinstance(data, GeneralStaticGraph):
            return self.__transform_homogeneous_static_graph(data)
        else:
            return self.__transform_data(data)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXLargeCliqueSize")
 class NXLargeCliqueSize(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXLargeCliqueSize, self).__init__(large_clique_size)


 # @FeatureEngineerUniversalRegistry.register_feature_engineer("NXAverageClusteringApproximate")
 # class NXAverageClusteringApproximate(_NetworkXGraphFeatureEngineer):
 #     def __init__(self):
 #         super(NXAverageClusteringApproximate, self).__init__(average_clustering)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXDegreeAssortativityCoefficient")
 class NXDegreeAssortativityCoefficient(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXDegreeAssortativityCoefficient, self).__init__(degree_assortativity_coefficient)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXDegreePearsonCorrelationCoefficient")
 class NXDegreePearsonCorrelationCoefficient(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXDegreePearsonCorrelationCoefficient, self).__init__(degree_pearson_correlation_coefficient)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXHasBridges")
 class NXHasBridges(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXHasBridges, self).__init__(has_bridges)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXGraphCliqueNumber")
 class NXGraphCliqueNumber(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXGraphCliqueNumber, self).__init__(graph_clique_number)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXGraphNumberOfCliques")
 class NXGraphNumberOfCliques(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXGraphNumberOfCliques, self).__init__(graph_number_of_cliques)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXTransitivity")
 class NXTransitivity(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXTransitivity, self).__init__(transitivity)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXAverageClustering")
 class NXAverageClustering(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXAverageClustering, self).__init__(average_clustering)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXIsConnected")
 class NXIsConnected(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXIsConnected, self).__init__(is_connected)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXNumberConnectedComponents")
 class NXNumberConnectedComponents(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXNumberConnectedComponents, self).__init__(number_connected_components)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXIsDistanceRegular")
 class NXIsDistanceRegular(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXIsDistanceRegular, self).__init__(is_distance_regular)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXLocalEfficiency")
 class NXLocalEfficiency(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXLocalEfficiency, self).__init__(local_efficiency)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXGlobalEfficiency")
 class NXGlobalEfficiency(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXGlobalEfficiency, self).__init__(global_efficiency)


@FeatureEngineerUniversalRegistry.register_feature_engineer("NXIsEulerian")
 class NXIsEulerian(_NetworkXGraphFeatureEngineer):
    def __init__(self):
        super(NXIsEulerian, self).__init__(is_eulerian)
--- a/autogl/module/feature/_selectors/init.py
+++ b/autogl/module/feature/_selectors/init.py
@@ -0,0 +1,2 @@
 from ._basic import FilterConstant
 from ._gbdt import GBDTFeatureSelector
--- a/autogl/module/feature/_selectors/_basic.py
+++ b/autogl/module/feature/_selectors/_basic.py
@@ -0,0 +1,58 @@
 import numpy as np
 import torch
 import typing as _typing
 from autogl.data.graph import GeneralStaticGraph
 from .._base_feature_engineer import BaseFeatureEngineer
 from .._feature_engineer_registry import FeatureEngineerUniversalRegistry


 class BaseFeatureSelector(BaseFeatureEngineer):
    def __init__(self):
        self._selection = _typing.Optional[torch.Tensor] = None
        super(BaseFeatureSelector, self).__init__()

    def _transform(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
        if (
                'x' in static_graph.nodes.data and
                self._selection not in (Ellipsis, None) and
                isinstance(self._selection, torch.Tensor) and
                torch.is_tensor(self._selection) and self._selection.dim() == 1
        ):
            static_graph.nodes.data['x'] = static_graph.nodes.data['x'][:, self._selection]
        if (
                'feat' in static_graph.nodes.data and
                self._selection not in (Ellipsis, None) and
                isinstance(self._selection, torch.Tensor) and
                torch.is_tensor(self._selection) and self._selection.dim() == 1
        ):
            static_graph.nodes.data['feat'] = static_graph.nodes.data['feat'][:, self._selection]
        return static_graph


@FeatureEngineerUniversalRegistry.register_feature_engineer("FilterConstant")
 class FilterConstant(BaseFeatureSelector):
    r"""drop constant features"""

    def _fit(self, static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
        if (
                'x' in static_graph.nodes.data and
                self._selection not in (Ellipsis, None) and
                isinstance(self._selection, torch.Tensor) and
                torch.is_tensor(self._selection) and self._selection.dim() == 1
        ):
            feature: _typing.Optional[np.ndarray] = static_graph.nodes.data['x'].numpy()
        elif (
                'feat' in static_graph.nodes.data and
                self._selection not in (Ellipsis, None) and
                isinstance(self._selection, torch.Tensor) and
                torch.is_tensor(self._selection) and self._selection.dim() == 1
        ):
            feature: _typing.Optional[np.ndarray] = static_graph.nodes.data['feat'].numpy()
        else:
            feature: _typing.Optional[np.ndarray] = None
        self._selection: _typing.Optional[torch.Tensor] = torch.from_numpy(
            np.where(np.all(feature == feature[0, :], axis=0) == np.array(False))[0]
            if feature is not None and isinstance(feature, np.ndarray) and feature.ndim == 2
            else None
        )
        return static_graph
--- a/autogl/module/feature/_selectors/_gbdt.py
+++ b/autogl/module/feature/_selectors/_gbdt.py
@@ -0,0 +1,139 @@
 import numpy as np
 import pandas as pd
 import torch
 import typing as _typing
 import autogl
 from autogl.data.graph import GeneralStaticGraph
 from .. import _feature_engineer_registry
 import lightgbm
 from sklearn.model_selection import train_test_split
 from ._basic import BaseFeatureSelector


 def _gbdt_generator(
        data: autogl.data.Data, fixlen: int = 1000,
        params: _typing.Mapping[str, _typing.Any] = ...,
        is_val: bool = True, train_val_ratio: float = 0.2,
        **optimizer_parameters
 ) -> _typing.Optional[np.ndarray]:
    parameters: _typing.Dict[str, _typing.Any] = (
        dict(params)
        if (
                params not in (Ellipsis, None) and
                isinstance(params, _typing.Mapping)
        )
        else {
            "boosting_type": "gbdt",
            "verbosity": -1,
            "random_state": 47,
            "objective": "multiclass",
            "metric": ["multi_logloss"],
            "max_bin": 63,
            "save_binary": True,
            "num_threads": 20,
            "num_leaves": 16,
            "subsample": 0.9,
            "subsample_freq": 1,
            "colsample_bytree": 0.8,
            # 'is_training_metric': True,
            # 'metric_freq': 1,
        }
    )

    num_classes: int = torch.max(data.y).item() + 1
    __optimizer_parameters = {
        "num_boost_round": 100,
        "early_stopping_rounds": 5,
        "verbose_eval": False
    }
    __optimizer_parameters.update(optimizer_parameters)
    if hasattr(data, "train_mask") and data.train_mask is not None and (
            isinstance(data.train_mask, np.ndarray) or
            isinstance(data.train_mask, torch.Tensor)
    ):
        x: np.ndarray = data.x[data.train_mask].numpy()
        label: np.ndarray = data.y[data.train_mask].numpy()
    else:
        x: np.ndarray = data.x.numpy()
        label: np.ndarray = data.y.numpy()
        is_val: bool = False
    _, num_features = x.shape
    if num_features < fixlen:
        return None

    feature_index: np.ndarray = np.array(
        [f"f{i}" for i in range(num_features)]
    )
    if is_val:
        x_train, x_val, y_train, y_val = train_test_split(
            x, label, test_size=train_val_ratio, stratify=label, random_state=47
        )
        dtrain = lightgbm.Dataset(x_train, label=y_train)
        dval = lightgbm.Dataset(x_val, label=y_val)
        clf = lightgbm.train(
            train_set=dtrain, params=parameters, valid_sets=dval,
            **__optimizer_parameters
        )
    else:
        train_x = pd.DataFrame(x, columns=feature_index, index=None)
        dtrain = lightgbm.Dataset(train_x, label=label)
        clf = lightgbm.train(
            train_set=dtrain, params=params,
            **__optimizer_parameters
        )

    imp = np.array(list(clf.feature_importance()))
    return np.argsort(imp)[-fixlen:]


@_feature_engineer_registry.FeatureEngineerUniversalRegistry.register_feature_engineer("gbdt")
 class GBDTFeatureSelector(BaseFeatureSelector):
    r"""simple wrapper of lightgbm , using importance ranking to select top-k features.

    Parameters
    ----------
    fixlen : int
        K for top-K important features.
    """

    def __init__(self, fixlen: int = 10, *args, **kwargs):
        super(GBDTFeatureSelector, self).__init__()
        self.__fixlen = fixlen
        self.__args = args
        self.__kwargs = kwargs

    def _fit(self, homogeneous_static_graph: GeneralStaticGraph) -> GeneralStaticGraph:
        if not isinstance(homogeneous_static_graph, GeneralStaticGraph):
            raise TypeError
        elif not (
            homogeneous_static_graph.nodes.is_homogeneous and
            homogeneous_static_graph.edges.is_homogeneous
        ):
            raise ValueError
        if 'x' in homogeneous_static_graph.nodes.data:
            features: torch.Tensor = homogeneous_static_graph.nodes.data['x']
        elif 'feat' in homogeneous_static_graph.nodes.data:
            features: torch.Tensor = homogeneous_static_graph.nodes.data['feat']
        else:
            raise ValueError("Node features not exists")
        if 'y' in homogeneous_static_graph.nodes.data:
            label: torch.Tensor = homogeneous_static_graph.nodes.data['y']
        elif 'label' in homogeneous_static_graph.nodes.data:
            label: torch.Tensor = homogeneous_static_graph.nodes.data['label']
        else:
            raise ValueError("Node label not exists")
        if 'train_mask' in homogeneous_static_graph.nodes.data:
            train_mask: _typing.Optional[torch.Tensor] = (
                homogeneous_static_graph.nodes.data['train_mask']
            )
        else:
            train_mask: _typing.Optional[torch.Tensor] = None
        data = autogl.data.Data(
            edge_index=homogeneous_static_graph.edges.connections,
            x=features, y=label
        )
        data.train_mask = train_mask
        self._selection = _gbdt_generator(
            data, self.__fixlen, *self.__args, **self.__kwargs
        )
        return homogeneous_static_graph
--- a/autogl/module/hpo/autone.py
+++ b/autogl/module/hpo/autone.py
@@ -12,7 +12,7 @@ from .autone_file import utils

 from torch_geometric.data import GraphSAINTRandomWalkSampler

 from ..feature.graph import SgNetLSD
 from ..feature import NetLSD as SgNetLSD

 from torch_geometric.data import InMemoryDataset

--- a/autogl/module/model/dgl/init.py
+++ b/autogl/module/model/dgl/init.py
@@ -2,11 +2,11 @@ from ._model_registry import MODEL_DICT, ModelUniversalRegistry, register_model
 from .base import BaseModel
 from .topkpool import AutoTopkpool

 # from .graph_sage import AutoSAGE
 from .graphsage import AutoSAGE

 from .graph_saint import GraphSAINTAggregationModel
 from .gcn import AutoGCN
 from .gat import AutoGAT
 from .gcn import GCN, AutoGCN
 from .graphsage import GraphSAGE, AutoSAGE
 from .gat import GAT,AutoGAT
 from .gin import AutoGIN

 __all__ = [
@@ -14,9 +14,12 @@ __all__ = [
    "register_model",
    "BaseModel",
    "AutoTopkpool",
    "AutoSAGE",
    "GraphSAINTAggregationModel",
    "GCN",
    "AutoGCN",
    "GraphSAGE",
    "AutoSAGE",
    "GAT",
    "AutoGAT",
    "AutoGIN"
 ]
--- a/autogl/module/model/dgl/gat.py
+++ b/autogl/module/model/dgl/gat.py
@@ -1,6 +1,6 @@
 import torch
 import torch.nn.functional as F
 from torch_geometric.nn import GATConv
 from dgl.nn.pytorch.conv import GATConv
 from . import register_model
 from .base import BaseModel, activate_func
 from ....utils import get_logger
@@ -45,8 +45,8 @@ class GAT(torch.nn.Module):
            GATConv(
                self.args["features_num"],
                self.args["hidden"][0],
                heads=self.args["heads"],
                dropout=self.args["dropout"],
                num_heads =self.args["heads"],
                attn_drop=self.args["dropout"],
            )
        )
        last_dim = self.args["hidden"][0] * self.args["heads"]
@@ -55,8 +55,8 @@ class GAT(torch.nn.Module):
                GATConv(
                    last_dim,
                    self.args["hidden"][i + 1],
                    heads=self.args["heads"],
                    dropout=self.args["dropout"],
                    num_heads=self.args["heads"],
                    attn_drop=self.args["dropout"],
                )
            )
            last_dim = self.args["hidden"][i + 1] * self.args["heads"]
@@ -64,41 +64,30 @@ class GAT(torch.nn.Module):
            GATConv(
                last_dim,
                self.args["num_class"],
                heads=1,
                concat=False,
                dropout=self.args["dropout"],
                num_heads=1,
                attn_drop=self.args["dropout"],
            )
        )

    def forward(self, data):
        try:
            x = data.x
            x = data.ndata['feat']
        except:
            print("no x")
            pass
        try:
            edge_index = data.edge_index
        except:
            print("no index")
            pass
        try:
            edge_weight = data.edge_weight
        except:
            edge_weight = None
            pass

        
        for i in range(self.num_layer):
            x = F.dropout(x, p=self.args["dropout"], training=self.training)
            x = self.convs[i](x, edge_index, edge_weight)
            x = self.convs[i](data, x).flatten(1)
            if i != self.num_layer - 1:
                x = activate_func(x, self.args["act"])

        return F.log_softmax(x, dim=1)

    def lp_encode(self, data):
        x = data.x
        x = data.ndata['feat']
        for i in range(self.num_layer - 1):
            x = self.convs[i](x, data.train_pos_edge_index)
            x = self.convs[i](x, data.train_pos_edge_index).flatten(1)
            if i != self.num_layer - 2:
                x = activate_func(x, self.args["act"])
                # x = F.dropout(x, p=self.args["dropout"], training=self.training)
@@ -161,6 +150,7 @@ class AutoGAT(BaseModel):
        self.num_features = num_features if num_features is not None else 0
        self.num_classes = int(num_classes) if num_classes is not None else 0
        self.device = device if device is not None else "cpu"
        self.init = True

        self.params = {
            "features_num": self.num_features,
--- a/autogl/module/model/dgl/gcn.py
+++ b/autogl/module/model/dgl/gcn.py
@@ -1,13 +1,16 @@
 import torch
 import torch.nn.functional
 import typing as _typing
 import torch.nn.functional as F
 from typing import Sequence, Optional, Union, Tuple
 from numbers import Real

 from torch_geometric.nn.conv import GCNConv
 from dgl.nn.pytorch.conv import GraphConv
 from dgl import remove_self_loop, add_self_loop
 import autogl.data
 from . import register_model
 from .base import BaseModel, activate_func, ClassificationSupportedSequentialModel
 from ....utils import get_logger


 LOGGER = get_logger("GCNModel")


@@ -19,55 +22,36 @@ class GCN(ClassificationSupportedSequentialModel):
            output_channels: int,
            add_self_loops: bool = True,
            normalize: bool = True,
            activation_name: _typing.Optional[str] = ...,
            dropout_probability: _typing.Optional[float] = ...,
            activation_name: Optional[str] = None,
            dropout_probability: Optional[Real] = None,
        ):
            super().__init__()
            self._convolution: GCNConv = GCNConv(
            self._convolution: GraphConv = GraphConv(
                input_channels,
                output_channels,
                add_self_loops=bool(add_self_loops),
                normalize=bool(normalize),
                norm='both' if normalize else 'none',
            )
            if (
                activation_name is not Ellipsis
                and activation_name is not None
                and type(activation_name) == str
            ):
                self._activation_name: _typing.Optional[str] = activation_name
            self.add_self_loops = bool(add_self_loops),
            if isinstance(activation_name, str):
                self._activation_name = activation_name
            else:
                self._activation_name: _typing.Optional[str] = None
            if (
                dropout_probability is not Ellipsis
                and dropout_probability is not None
                and type(dropout_probability) == float
            ):
                self._activation_name = None
            if isinstance(dropout_probability, Real):
                if dropout_probability < 0:
                    dropout_probability = 0
                if dropout_probability > 1:
                    dropout_probability = 1
                self._dropout: _typing.Optional[torch.nn.Dropout] = torch.nn.Dropout(
                    dropout_probability
                )
                self._dropout = torch.nn.Dropout(dropout_probability)
            else:
                self._dropout: _typing.Optional[torch.nn.Dropout] = None
                self._dropout = None

        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
            x: torch.Tensor = getattr(data, "x")
            edge_index: torch.LongTensor = getattr(data, "edge_index")
            edge_weight: _typing.Optional[torch.Tensor] = getattr(
                data, "edge_weight", None
            )
            """ Validate the arguments """
            if not type(x) == type(edge_index) == torch.Tensor:
                raise TypeError
            if edge_weight is not None and (
                type(edge_weight) != torch.Tensor
                or edge_index.size() != (2, edge_weight.size(0))
            ):
                edge_weight: _typing.Optional[torch.Tensor] = None
        def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
            
            if self.add_self_loops:
                data = remove_self_loop(data)
                data = add_self_loop(data)

            x: torch.Tensor = self._convolution.forward(x, edge_index, edge_weight)
            x: torch.Tensor = self._convolution.forward(data, x)
            if self._activation_name is not None and enable_activation:
                x: torch.Tensor = activate_func(x, self._activation_name)
            if self._dropout is not None:
@@ -78,37 +62,35 @@ class GCN(ClassificationSupportedSequentialModel):
        self,
        num_features: int,
        num_classes: int,
        hidden_features: _typing.Sequence[int],
        hidden_features: Sequence[int],
        activation_name: str,
        dropout: _typing.Union[
            _typing.Optional[float], _typing.Sequence[_typing.Optional[float]]
        ] = None,
        dropout: Union[Real, Sequence[Optional[Real]], None] = None,
        add_self_loops: bool = True,
        normalize: bool = True,
    ):
        if isinstance(dropout, _typing.Sequence):
        if isinstance(dropout, Sequence):
            if len(dropout) != len(hidden_features) + 1:
                raise TypeError(
                    "When the dropout argument is a sequence, "
                    "The sequence length must equal to the number of layers to construct."
                )
            for _dropout in dropout:
                if _dropout is not None and type(_dropout) != float:
                if _dropout is not None and not isinstance(_dropout, Real):
                    raise TypeError(
                        "When the dropout argument is a sequence, "
                        "every item in the sequence must be float or None"
                    )
            dropout_list: _typing.Sequence[_typing.Optional[float]] = dropout
        elif type(dropout) == float:
            dropout_list: Sequence[Optional[Real]] = dropout
        elif isinstance(dropout, Real):
            if dropout < 0:
                dropout = 0
            if dropout > 1:
                dropout = 1
            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
            dropout_list: Sequence[Real] = [
                dropout for _ in range(len(hidden_features))
            ] + [None]
        elif dropout in (None, Ellipsis, ...):
            dropout_list: _typing.Sequence[_typing.Optional[float]] = [
        elif dropout is None:
            dropout_list: Sequence[None] = [
                None for _ in range(len(hidden_features) + 1)
            ]
        else:
@@ -132,9 +114,7 @@ class GCN(ClassificationSupportedSequentialModel):
                )
            )
        else:
            self.__sequential_encoding_layers: torch.nn.ModuleList = (
                torch.nn.ModuleList()
            )
            self.__sequential_encoding_layers = torch.nn.ModuleList()
            self.__sequential_encoding_layers.append(
                self._GCNLayer(
                    num_features,
@@ -145,6 +125,7 @@ class GCN(ClassificationSupportedSequentialModel):
                    dropout_list[0],
                )
            )

            for hidden_feature_index in range(len(hidden_features)):
                if hidden_feature_index + 1 < len(hidden_features):
                    self.__sequential_encoding_layers.append(
@@ -174,44 +155,44 @@ class GCN(ClassificationSupportedSequentialModel):

    def __extract_edge_indexes_and_weights(
        self, data
    ) -> _typing.Union[
        _typing.Sequence[
            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
        ],
        _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
    ) -> Union[
        Sequence[Tuple[torch.LongTensor, Optional[torch.Tensor]]],
        Tuple[torch.LongTensor, Optional[torch.Tensor]],
    ]:
        def __compose_edge_index_and_weight(
            _edge_index: torch.LongTensor,
            _edge_weight: _typing.Optional[torch.Tensor] = None,
        ) -> _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]:
            _edge_weight: Optional[torch.Tensor] = None,
        ) -> Tuple[torch.LongTensor, Optional[torch.Tensor]]:
            if type(_edge_index) != torch.Tensor or _edge_index.dtype != torch.int64:
                raise TypeError
            if _edge_weight is not None and (
                type(_edge_weight) != torch.Tensor
                or _edge_index.size() != (2, _edge_weight.size(0))
            ):
                _edge_weight: _typing.Optional[torch.Tensor] = None
                _edge_weight: Optional[torch.Tensor] = None
            return _edge_index, _edge_weight

        if not (
            hasattr(data, "edge_indexes")
            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
            and isinstance(getattr(data, "edge_indexes"), Sequence)
            and len(getattr(data, "edge_indexes"))
            == len(self.__sequential_encoding_layers)
        ):
            if not data.edata.has_key('edge_weights'):
                data.edata['edge_weights']=None
            return __compose_edge_index_and_weight(
                getattr(data, "edge_index"), getattr(data, "edge_weight", None)
                data.edges(), data.edata['edge_weights']
            )
        for __edge_index in getattr(data, "edge_indexes"):
            if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
                return __compose_edge_index_and_weight(
                    getattr(data, "edge_index"), getattr(data, "edge_weight", None)
                )
        # for __edge_index in getattr(data, "edge_indexes"):
        #     if type(__edge_index) != torch.Tensor or __edge_index.dtype != torch.int64:
        #         return __compose_edge_index_and_weight(
        #             data.edges(), getattr(data, "edge_weight", None)
        #         )

        if (
            hasattr(data, "edge_weights")
            and isinstance(getattr(data, "edge_weights"), _typing.Sequence)
            and len(getattr(data, "edge_weights"))
            data.edata.has_key('edge_weights')
            and isinstance(data.edata['edge_weights'], Sequence)
            and len(data.edata.has_key('edge_weights'))
            == len(self.__sequential_encoding_layers)
        ):
            return [
@@ -226,12 +207,18 @@ class GCN(ClassificationSupportedSequentialModel):
                for __edge_index in getattr(data, "edge_indexes")
            ]

    def forward(self, data):
        x = data.ndata['feat']
        for gcn in self.__sequential_encoding_layers:
            x = gcn(data,x)
        return F.log_softmax(x, dim=-1)

    def cls_encode(self, data) -> torch.Tensor:
        edge_indexes_and_weights: _typing.Union[
            _typing.Sequence[
                _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]]
            ],
            _typing.Tuple[torch.LongTensor, _typing.Optional[torch.Tensor]],
        return self(data)
        
        edge_indexes_and_weights: Union[
            Sequence[Tuple[torch.LongTensor, Optional[torch.Tensor]]],
            Tuple[torch.LongTensor, Optional[torch.Tensor]],
        ] = self.__extract_edge_indexes_and_weights(data)

        if (not isinstance(edge_indexes_and_weights, tuple)) and isinstance(
@@ -241,7 +228,7 @@ class GCN(ClassificationSupportedSequentialModel):
            assert len(edge_indexes_and_weights) == len(
                self.__sequential_encoding_layers
            )
            x: torch.Tensor = getattr(data, "x")
            x: torch.Tensor = data.ndata['feat']
            for _edge_index_and_weight, gcn in zip(
                edge_indexes_and_weights, self.__sequential_encoding_layers
            ):
@@ -251,7 +238,7 @@ class GCN(ClassificationSupportedSequentialModel):
            return x
        else:
            """ edge_indexes_and_weights is (edge_index, edge_weight) """
            x = getattr(data, "x")
            x = data.ndata['feat']
            for gcn in self.__sequential_encoding_layers:
                _temp_data = autogl.data.Data(
                    x=x, edge_index=edge_indexes_and_weights[0]
@@ -264,13 +251,13 @@ class GCN(ClassificationSupportedSequentialModel):
        return torch.nn.functional.log_softmax(x, dim=1)

    def lp_encode(self, data):
        x: torch.Tensor = getattr(data, "x")
        x: torch.Tensor = data.ndata['feat']
        for i in range(len(self.__sequential_encoding_layers) - 2):
            x = self.__sequential_encoding_layers[i](
                autogl.data.Data(x, getattr(data, "edge_index"))
                autogl.data.Data(x, data.edges())
            )
        x = self.__sequential_encoding_layers[-2](
            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
            autogl.data.Data(x, data.edges()), enable_activation=False
        )
        return x

@@ -318,9 +305,9 @@ class AutoGCN(BaseModel):

    def __init__(
        self,
        num_features: int = ...,
        num_classes: int = ...,
        device: _typing.Union[str, torch.device] = ...,
        num_features: Optional[int] = None,
        num_classes: Optional[int] = None,
        device: Union[str, torch.device] = 'cpu',
        init: bool = False,
        **kwargs
    ) -> None:
@@ -385,7 +372,7 @@ class AutoGCN(BaseModel):
        self.hyperparams = {
            "num_layers": 3,
            "hidden": [128, 64],
            "dropout": 0,
            "dropout": 0.,
            "act": "relu",
        }

--- a/autogl/module/model/dgl/gin.py
+++ b/autogl/module/model/dgl/gin.py
@@ -205,7 +205,7 @@ class GIN(torch.nn.Module):
    #def forward(self, g, h):
    def forward(self, data):
        g, _ = data
        h = g.ndata.pop('attr')
        h = g.ndata.pop('feat')
        # list of hidden representation at each layer (including input)
        hidden_rep = [h]

--- a/autogl/module/model/dgl/graph_saint_dgl.py
+++ b/autogl/module/model/dgl/graph_saint_dgl.py
@@ -0,0 +1,299 @@
 import torch.nn as nn
 import torch.nn.functional as F
 import torch as th
 import dgl.function as fn
 import math
 import os
 import time
 import torch as th
 import random
 import numpy as np
 import dgl.function as fn
 import dgl
 from dgl.sampling import random_walk, pack_traces

 class GCNLayer(nn.Module):
    def __init__(self, in_dim, out_dim, order=1, act=None,
                 dropout=0, batch_norm=False, aggr="concat"):
        super(GCNLayer, self).__init__()
        self.lins = nn.ModuleList()
        self.bias = nn.ParameterList()
        for _ in range(order + 1):
            self.lins.append(nn.Linear(in_dim, out_dim, bias=False))
            self.bias.append(nn.Parameter(th.zeros(out_dim)))

        self.order = order
        self.act = act
        self.dropout = nn.Dropout(dropout)

        self.batch_norm = batch_norm
        if batch_norm:
            self.offset, self.scale = nn.ParameterList(), nn.ParameterList()
            for _ in range(order + 1):
                self.offset.append(nn.Parameter(th.zeros(out_dim)))
                self.scale.append(nn.Parameter(th.ones(out_dim)))

        self.aggr = aggr
        self.reset_parameters()

    def reset_parameters(self):
        for lin in self.lins:
            nn.init.xavier_normal_(lin.weight)

    def feat_trans(self, features, idx):
        h = self.lins[idx](features) + self.bias[idx]

        if self.act is not None:
            h = self.act(h)

        if self.batch_norm:
            mean = h.mean(dim=1).view(h.shape[0], 1)
            var = h.var(dim=1, unbiased=False).view(h.shape[0], 1) + 1e-9
            h = (h - mean) * self.scale[idx] * th.rsqrt(var) + self.offset[idx]

        return h

    def forward(self, graph, features):
        g = graph.local_var()
        h_in = self.dropout(features)
        h_hop = [h_in]

        D_norm = g.ndata['train_D_norm'] if 'train_D_norm' in g.ndata else g.ndata['full_D_norm']
        for _ in range(self.order):
            g.ndata['h'] = h_hop[-1]
            if 'w' not in g.edata:
                g.edata['w'] = th.ones((g.num_edges(), )).to(features.device)
            g.update_all(fn.u_mul_e('h', 'w', 'm'),
                         fn.sum('m', 'h'))
            h = g.ndata.pop('h')
            h = h * D_norm
            h_hop.append(h)

        h_part = [self.feat_trans(ft, idx) for idx, ft in enumerate(h_hop)]
        if self.aggr == "mean":
            h_out = h_part[0]
            for i in range(len(h_part) - 1):
                h_out = h_out + h_part[i + 1]
        elif self.aggr == "concat":
            h_out = th.cat(h_part, 1)
        else:
            raise NotImplementedError

        return h_out


 class GCNNet(nn.Module):
    def __init__(self, in_dim, hid_dim, out_dim, arch="1-1-0",
                 act=F.relu, dropout=0, batch_norm=False, aggr="concat"):
        super(GCNNet, self).__init__()
        self.gcn = nn.ModuleList()

        orders = list(map(int, arch.split('-')))
        self.gcn.append(GCNLayer(in_dim=in_dim, out_dim=hid_dim, order=orders[0],
                                 act=act, dropout=dropout, batch_norm=batch_norm, aggr=aggr))
        pre_out = ((aggr == "concat") * orders[0] + 1) * hid_dim

        for i in range(1, len(orders)-1):
            self.gcn.append(GCNLayer(in_dim=pre_out, out_dim=hid_dim, order=orders[i],
                                     act=act, dropout=dropout, batch_norm=batch_norm, aggr=aggr))
            pre_out = ((aggr == "concat") * orders[i] + 1) * hid_dim

        self.gcn.append(GCNLayer(in_dim=pre_out, out_dim=hid_dim, order=orders[-1],
                                 act=act, dropout=dropout, batch_norm=batch_norm, aggr=aggr))
        pre_out = ((aggr == "concat") * orders[-1] + 1) * hid_dim

        self.out_layer = GCNLayer(in_dim=pre_out, out_dim=out_dim, order=0,
                                  act=None, dropout=dropout, batch_norm=False, aggr=aggr)

    def forward(self, graph):
        h = graph.ndata['feat']

        for layer in self.gcn:
            h = layer(graph, h)

        h = F.normalize(h, p=2, dim=1)
        h = self.out_layer(graph, h)

        return h




 # The base class of sampler
 # (TODO): online sampling
 class SAINTSampler(object):
    def __init__(self, dn, g, train_nid, node_budget, num_repeat=50):
        """
        :param dn: name of dataset
        :param g: full graph
        :param train_nid: ids of training nodes
        :param node_budget: expected number of sampled nodes
        :param num_repeat: number of times of repeating sampling one node
        """
        self.g = g
        self.train_g: dgl.graph = g.subgraph(train_nid)
        self.dn, self.num_repeat = dn, num_repeat
        self.node_counter = th.zeros((self.train_g.num_nodes(),))
        self.edge_counter = th.zeros((self.train_g.num_edges(),))
        self.prob = None

        graph_fn, norm_fn = self.__generate_fn__()

        if os.path.exists(graph_fn):
            self.subgraphs = np.load(graph_fn, allow_pickle=True)
            aggr_norm, loss_norm = np.load(norm_fn, allow_pickle=True)
        else:
            os.makedirs('./subgraphs/', exist_ok=True)

            self.subgraphs = []
            self.N, sampled_nodes = 0, 0

            t = time.perf_counter()
            while sampled_nodes <= self.train_g.num_nodes() * num_repeat:
                subgraph = self.__sample__()
                self.subgraphs.append(subgraph)
                sampled_nodes += subgraph.shape[0]
                self.N += 1
            print(f'Sampling time: [{time.perf_counter() - t:.2f}s]')
            np.save(graph_fn, self.subgraphs)

            t = time.perf_counter()
            self.__counter__()
            aggr_norm, loss_norm = self.__compute_norm__()
            print(f'Normalization time: [{time.perf_counter() - t:.2f}s]')
            np.save(norm_fn, (aggr_norm, loss_norm))

        self.train_g.ndata['l_n'] = th.Tensor(loss_norm)
        self.train_g.edata['w'] = th.Tensor(aggr_norm)
        self.__compute_degree_norm()

        self.num_batch = math.ceil(self.train_g.num_nodes() / node_budget)
        random.shuffle(self.subgraphs)
        self.__clear__()
        print("The number of subgraphs is: ", len(self.subgraphs))
        print("The size of subgraphs is about: ", len(self.subgraphs[-1]))

    def __clear__(self):
        self.prob = None
        self.node_counter = None
        self.edge_counter = None
        self.g = None

    def __counter__(self):

        for sampled_nodes in self.subgraphs:
            sampled_nodes = th.from_numpy(sampled_nodes)
            self.node_counter[sampled_nodes] += 1

            subg = self.train_g.subgraph(sampled_nodes)
            sampled_edges = subg.edata[dgl.EID]
            self.edge_counter[sampled_edges] += 1

    def __generate_fn__(self):
        raise NotImplementedError

    def __compute_norm__(self):
        self.node_counter[self.node_counter == 0] = 1
        self.edge_counter[self.edge_counter == 0] = 1

        loss_norm = self.N / self.node_counter / self.train_g.num_nodes()

        self.train_g.ndata['n_c'] = self.node_counter
        self.train_g.edata['e_c'] = self.edge_counter
        self.train_g.apply_edges(fn.v_div_e('n_c', 'e_c', 'a_n'))
        aggr_norm = self.train_g.edata.pop('a_n')

        self.train_g.ndata.pop('n_c')
        self.train_g.edata.pop('e_c')

        return aggr_norm.numpy(), loss_norm.numpy()

    def __compute_degree_norm(self):

        self.train_g.ndata['train_D_norm'] = 1. / self.train_g.in_degrees().float().clamp(min=1).unsqueeze(1)
        self.g.ndata['full_D_norm'] = 1. / self.g.in_degrees().float().clamp(min=1).unsqueeze(1)

    def __sample__(self):
        raise NotImplementedError

    def __len__(self):
        return self.num_batch

    def __iter__(self):
        self.n = 0
        return self

    def __next__(self):
        if self.n < self.num_batch:
            result = self.train_g.subgraph(self.subgraphs[self.n])
            self.n += 1
            return result
        else:
            random.shuffle(self.subgraphs)
            raise StopIteration()


 class SAINTNodeSampler(SAINTSampler):
    def __init__(self, node_budget, dn, g, train_nid, num_repeat=50):
        self.node_budget = node_budget
        super(SAINTNodeSampler, self).__init__(dn, g, train_nid, node_budget, num_repeat)

    def __generate_fn__(self):
        graph_fn = os.path.join('./subgraphs/{}_Node_{}_{}.npy'.format(self.dn, self.node_budget,
                                                                       self.num_repeat))
        norm_fn = os.path.join('./subgraphs/{}_Node_{}_{}_norm.npy'.format(self.dn, self.node_budget,
                                                                           self.num_repeat))
        return graph_fn, norm_fn

    def __sample__(self):
        if self.prob is None:
            self.prob = self.train_g.in_degrees().float().clamp(min=1)

        sampled_nodes = th.multinomial(self.prob, num_samples=self.node_budget, replacement=True).unique()
        return sampled_nodes.numpy()


 class SAINTEdgeSampler(SAINTSampler):
    def __init__(self, edge_budget, dn, g, train_nid, num_repeat=50):
        self.edge_budget = edge_budget
        super(SAINTEdgeSampler, self).__init__(dn, g, train_nid, edge_budget * 2, num_repeat)

    def __generate_fn__(self):
        graph_fn = os.path.join('./subgraphs/{}_Edge_{}_{}.npy'.format(self.dn, self.edge_budget,
                                                                       self.num_repeat))
        norm_fn = os.path.join('./subgraphs/{}_Edge_{}_{}_norm.npy'.format(self.dn, self.edge_budget,
                                                                           self.num_repeat))
        return graph_fn, norm_fn

    def __sample__(self):
        if self.prob is None:
            src, dst = self.train_g.edges()
            src_degrees, dst_degrees = self.train_g.in_degrees(src).float().clamp(min=1),\
                                       self.train_g.in_degrees(dst).float().clamp(min=1)
            self.prob = 1. / src_degrees + 1. / dst_degrees

        sampled_edges = th.multinomial(self.prob, num_samples=self.edge_budget, replacement=True).unique()

        sampled_src, sampled_dst = self.train_g.find_edges(sampled_edges)
        sampled_nodes = th.cat([sampled_src, sampled_dst]).unique()
        return sampled_nodes.numpy()


 class SAINTRandomWalkSampler(SAINTSampler):
    def __init__(self, num_roots, length, dn, g, train_nid, num_repeat=50):
        self.num_roots, self.length = num_roots, length
        super(SAINTRandomWalkSampler, self).__init__(dn, g, train_nid, num_roots * length, num_repeat)

    def __generate_fn__(self):
        graph_fn = os.path.join('./subgraphs/{}_RW_{}_{}_{}.npy'.format(self.dn, self.num_roots,
                                                                        self.length, self.num_repeat))
        norm_fn = os.path.join('./subgraphs/{}_RW_{}_{}_{}_norm.npy'.format(self.dn, self.num_roots,
                                                                            self.length, self.num_repeat))
        return graph_fn, norm_fn

    def __sample__(self):
        sampled_roots = th.randint(0, self.train_g.num_nodes(), (self.num_roots, ))
        traces, types = random_walk(self.train_g, nodes=sampled_roots, length=self.length)
        sampled_nodes, _, _, _ = pack_traces(traces, types)
        sampled_nodes = sampled_nodes.unique()
        return sampled_nodes.numpy()
--- a/autogl/module/model/dgl/graphsage.py
+++ b/autogl/module/model/dgl/graphsage.py
@@ -1,7 +1,8 @@
 import torch
 import typing as _typing

 from torch_geometric.nn.conv import SAGEConv
 import torch.nn.functional as F
 from dgl.nn.pytorch.conv import SAGEConv
 import torch.nn.functional
 import autogl.data
 from . import register_model
@@ -23,7 +24,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
        ):
            super().__init__()
            self._convolution: SAGEConv = SAGEConv(
                input_channels, output_channels, aggr=aggr
                input_channels, output_channels, aggregator_type=aggr
            )
            if (
                activation_name is not Ellipsis
@@ -48,14 +49,10 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
            else:
                self._dropout: _typing.Optional[torch.nn.Dropout] = None

        def forward(self, data, enable_activation: bool = True) -> torch.Tensor:
            x: torch.Tensor = getattr(data, "x")
            edge_index: torch.Tensor = getattr(data, "edge_index")
            if type(x) != torch.Tensor or type(edge_index) != torch.Tensor:
                raise TypeError

            x: torch.Tensor = self._convolution.forward(x, edge_index)
            if self._activation_name is not None and enable_activation:
        def forward(self, data, x, enable_activation: bool = True) -> torch.Tensor:
            # x = data.ndata['feat']
            x: torch.Tensor = self._convolution.forward(data, x)
            if (self._activation_name is not None) and enable_activation:
                x: torch.Tensor = activate_func(x, self._activation_name)
            if self._dropout is not None:
                x: torch.Tensor = self._dropout.forward(x)
@@ -145,7 +142,7 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
                            hidden_features[i],
                            num_classes,
                            aggr,
                            _layers_dropout[i + 1],
                            dropout_probability=_layers_dropout[i + 1],
                        )
                    )

@@ -154,41 +151,43 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
        return self.__sequential_encoding_layers

    def cls_encode(self, data) -> torch.Tensor:
        if (
            hasattr(data, "edge_indexes")
            and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
            and len(getattr(data, "edge_indexes"))
            == len(self.__sequential_encoding_layers)
        ):
            for __edge_index in getattr(data, "edge_indexes"):
                if type(__edge_index) != torch.Tensor:
                    raise TypeError
            """ Layer-wise encode """
            x: torch.Tensor = getattr(data, "x")
            for i, __edge_index in enumerate(getattr(data, "edge_indexes")):
                x: torch.Tensor = self.__sequential_encoding_layers[i](
                    autogl.data.Data(x=x, edge_index=__edge_index)
                )
            return x
        else:
            x: torch.Tensor = getattr(data, "x")
            for i in range(len(self.__sequential_encoding_layers)):
                x = self.__sequential_encoding_layers[i](
                    autogl.data.Data(x, getattr(data, "edge_index"))
                )
            return x
        return self(data)

        # if (
        #     hasattr(data, "edge_indexes")
        #     and isinstance(getattr(data, "edge_indexes"), _typing.Sequence)
        #     and len(getattr(data, "edge_indexes"))
        #     == len(self.__sequential_encoding_layers)
        # ):
        #     for __edge_index in getattr(data, "edge_indexes"):
        #         if type(__edge_index) != torch.Tensor:
        #             raise TypeError
        #     """ Layer-wise encode """
        #     x: torch.Tensor = getattr(data, "x")
        #     for i, __edge_index in enumerate(getattr(data, "edge_indexes")):
        #         x: torch.Tensor = self.__sequential_encoding_layers[i](
        #             autogl.data.Data(x=x, edge_index=__edge_index)
        #         )
        #     return x
        # else:
        x: torch.Tensor = data.ndata['feat']
        for i in range(len(self.__sequential_encoding_layers)):
            x = self.__sequential_encoding_layers[i](
                autogl.data.Data(x, data.edges())
            )
        return x

    def cls_decode(self, x: torch.Tensor) -> torch.Tensor:
        return torch.nn.functional.log_softmax(x, dim=1)

    def lp_encode(self, data):
        x: torch.Tensor = getattr(data, "x")
        x: torch.Tensor = data.ndata['feat']
        for i in range(len(self.__sequential_encoding_layers) - 2):
            x = self.__sequential_encoding_layers[i](
                autogl.data.Data(x, getattr(data, "edge_index"))
                autogl.data.Data(x, data.edges())
            )
        x = self.__sequential_encoding_layers[-2](
            autogl.data.Data(x, getattr(data, "edge_index")), enable_activation=False
            autogl.data.Data(x, data.edges()), enable_activation=False
        )
        return x

@@ -200,6 +199,15 @@ class GraphSAGE(ClassificationSupportedSequentialModel):
    def lp_decode_all(self, z):
        prob_adj = z @ z.t()
        return (prob_adj > 0).nonzero(as_tuple=False).t()
    
    def forward(self, data):
        # only for test 
        x = data.ndata['feat']
        for i in range(len(self.__sequential_encoding_layers)):
            x = self.__sequential_encoding_layers[i](data,x)

        return F.log_softmax(x, dim=1)



@register_model("sage")
@@ -238,6 +246,7 @@ class AutoSAGE(BaseModel):
        self.num_features = num_features if num_features is not None else 0
        self.num_classes = int(num_classes) if num_classes is not None else 0
        self.device = device if device is not None else "cpu"
        self.init = True

        self.params = {
            "features_num": self.num_features,
--- a/autogl/module/model/dgl/topkpool.py
+++ b/autogl/module/model/dgl/topkpool.py
@@ -121,8 +121,6 @@ class Topkpool(torch.nn.Module):
                    "num_layers",
                    "hidden",
                    "dropout",
                    "act",
                    "mlp_layers",
                ]
            )
            - set(self.args.keys())
@@ -137,19 +135,8 @@ class Topkpool(torch.nn.Module):
        self.num_layers = self.args["num_layers"]
        assert self.num_layers > 2, "Number of layers in GIN should not less than 3"

        self.num_mlp_layers = self.args["mlp_layers"]
        input_dim = self.args["features_num"]
        hidden_dim = self.args["hidden"][0]
        if self.args["act"] == "leaky_relu":
            act = LeakyReLU()
        elif self.args["act"] == "relu":
            act = ReLU()
        elif self.args["act"] == "elu":
            act = ELU()
        elif self.args["act"] == "tanh":
            act = Tanh()
        else:
            act = ReLU()
        final_dropout = self.args["dropout"]
        output_dim = self.args["num_class"]

@@ -163,11 +150,6 @@ class Topkpool(torch.nn.Module):
            else:
                self.gcnlayers.append(GraphConv(hidden_dim, hidden_dim))

            if layer == 0:
                mlp = MLP(self.num_mlp_layers, input_dim, hidden_dim, hidden_dim)
            else:
                mlp = MLP(self.num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)

            #self.gcnlayers.append(GraphConv(input_dim, hidden_dim))
            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))

@@ -193,7 +175,7 @@ class Topkpool(torch.nn.Module):
    #def forward(self, g, h):
    def forward(self, data):
        g, _ = data
        h = g.ndata.pop('attr')
        h = g.ndata.pop('feat')
        # list of hidden representation at each layer (including input)
        hidden_rep = [h]

@@ -259,11 +241,15 @@ class AutoTopkpool(BaseModel):
        }
        self.space = [
            {
                "parameterName": "ratio",
                "type": "DOUBLE",
                "maxValue": 0.9,
                "minValue": 0.1,
                "scalingType": "LINEAR",
                "parameterName": "hidden",
                "type": "NUMERICAL_LIST",
                "numericalType": "INTEGER",
                "length": 1,
                "minValue": [128],
                "maxValue": [32],
                "scalingType": "LOG",
                "cutPara": (),
                "cutFunc": lambda:1,
            },
            {
                "parameterName": "dropout",
@@ -273,19 +259,18 @@ class AutoTopkpool(BaseModel):
                "scalingType": "LINEAR",
            },
            {
                "parameterName": "act",
                "type": "CATEGORICAL",
                "feasiblePoints": ["leaky_relu", "relu", "elu", "tanh"],
                "parameterName": "num_layers",
                "type": "INTEGER",
                "minValue": 7,
                "maxValue": 2,
                "scalingType": "LINEAR"
            },
        ]

        #self.hyperparams = {"ratio": 0.8, "dropout": 0.5, "act": "relu"}
        self.hyperparams = {
            "num_layers": 5,
            "hidden": [64],
            "dropout": 0.5,
            "act": "relu",
            "mlp_layers": 2
            "dropout": 0.5
        }

        self.initialized = False
--- a/autogl/module/train/node_classification_full.py
+++ b/autogl/module/train/node_classification_full.py
@@ -4,7 +4,7 @@ Node classification Full Trainer Implementation

 from . import register_trainer

 from .base import BaseNodeClassificationTrainer, EarlyStopping, Evaluation
 from .base import BaseNodeClassificationTrainer, EarlyStopping
 import torch
 from torch.optim.lr_scheduler import (
    StepLR,
@@ -14,13 +14,14 @@ from torch.optim.lr_scheduler import (
 )
 import torch.nn.functional as F
 from ..model import MODEL_DICT, BaseModel
 from ..model.base import ClassificationSupportedSequentialModel
 from .evaluation import get_feval, Logloss
 from typing import Union
 from copy import deepcopy

 from ...utils import get_logger

 from ...backend import DependentBackend

 LOGGER = get_logger("node classification trainer")


@@ -115,6 +116,8 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):

        self.initialized = False

        self.pyg_dgl = DependentBackend.get_backend_name()

        self.space = [
            {
                "parameterName": "max_epoch",
@@ -188,7 +191,13 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):

        """
        data = data.to(self.device)
        mask = data.train_mask if train_mask is None else train_mask
        if train_mask is None:
            if self.pyg_dgl == 'pyg':
                mask = data.train_mask
            elif self.pyg_dgl == 'dgl':
                mask = data.ndata['train_mask']
        else:
            mask = train_mask
        optimizer = self.optimizer(
            self.model.model.parameters(), lr=self.lr, weight_decay=self.weight_decay
        )
@@ -210,12 +219,15 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
        for epoch in range(1, self.max_epoch):
            self.model.model.train()
            optimizer.zero_grad()
            if isinstance(self.model.model, ClassificationSupportedSequentialModel):
            if hasattr(self.model.model, 'cls_forward'):
                res = self.model.model.cls_forward(data)
            else:
                res = self.model.model.forward(data)
            if hasattr(F, self.loss):
                loss = getattr(F, self.loss)(res[mask], data.y[mask])
                if self.pyg_dgl == 'pyg':
                    loss = getattr(F, self.loss)(res[mask], data.y[mask])
                elif self.pyg_dgl == 'dgl':
                    loss = getattr(F, self.loss)(res[mask], data.ndata['label'][mask])
            else:
                raise TypeError(
                    "PyTorch does not support loss type {}".format(self.loss)
@@ -226,22 +238,31 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
            if self.lr_scheduler_type:
                scheduler.step()

            if hasattr(data, "val_mask") and data.val_mask is not None:
            if self.pyg_dgl == 'pyg' and hasattr(data, "val_mask") and data.val_mask is not None:
                val_mask = data.val_mask
            elif self.pyg_dgl == 'dgl' and data.ndata.get('val_mask', None) is not None:
                val_mask = data.ndata['val_mask']
            else:
                val_mask = None

            if val_mask is not None:
                if type(self.feval) is list:
                    feval = self.feval[0]
                else:
                    feval = self.feval
                val_loss = self.evaluate([data], mask=data.val_mask, feval=feval)
                val_loss = self.evaluate([data], mask=val_mask, feval=feval)
                if feval.is_higher_better() is True:
                    val_loss = -val_loss

                self.early_stopping(val_loss, self.model.model)
                if self.early_stopping.early_stop:
                    LOGGER.debug("Early stopping at %d", epoch)
                    break

        if hasattr(data, "val_mask") and data.val_mask is not None:
            self.early_stopping.load_checkpoint(self.model.model)

    def predict_only(self, data, test_mask=None):
    def predict_only(self, data, mask=None):
        """
        The function of predicting on the given dataset and mask.

@@ -255,15 +276,16 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
        res: The result of predicting on the given dataset.

        """
        try:
            mask = data.test_mask if test_mask is None else test_mask
        except:
            mask = None
        if isinstance(mask, str):
            if self.pyg_dgl == 'pyg':
                mask = getattr(data, f'{mask}_mask')
            elif self.pyg_dgl == 'dgl':
                mask = data.ndata[f'{mask}_mask']

        data = data.to(self.device)
        self.model.model.eval()
        with torch.no_grad():
            if isinstance(self.model.model, ClassificationSupportedSequentialModel):
            if hasattr(self.model.model, 'cls_forward'):
                res = self.model.model.cls_forward(data)
            else:
                res = self.model.model.forward(data)
@@ -273,7 +295,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
        else:
            return res[mask]

    def train(self, dataset, keep_valid_result=True):
    def train(self, dataset, keep_valid_result=True, train_mask=None):
        """
        The function of training on the given dataset and keeping valid result.

@@ -284,6 +306,8 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
        keep_valid_result: ``bool``
            If True(False), save the validation result after training.

        train_mask: The mask for training data

        Returns
        -------
        self: ``autogl.train.NodeClassificationTrainer``
@@ -291,13 +315,20 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):

        """
        data = dataset[0]
        self.train_only(data)
        self.train_only(data, train_mask)
        if keep_valid_result:
            self.valid_result = self.predict_only(data)[data.val_mask].max(1)[1]
            self.valid_result_prob = self.predict_only(data)[data.val_mask]
            if self.pyg_dgl == 'pyg':
                val_mask = data.val_mask
            elif self.pyg_dgl == 'dgl':
                val_mask = data.ndata['val_mask']
            else:
                assert False
            self.valid_result = self.predict_only(data)[val_mask].max(1)[1]
            self.valid_result_prob = self.predict_only(data)[val_mask]
            self.valid_score = self.evaluate(
                dataset, mask=data.val_mask, feval=self.feval
                dataset, mask=val_mask, feval=self.feval
            )
            # print(self.valid_score)

    def predict(self, dataset, mask=None):
        """
@@ -324,7 +355,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
        ----------
        dataset: The node classification dataset used to be predicted.

        mask: ``train``, ``val``, or ``test``.
        mask: ``train``, ``val``, ``test``, or ``Tensor``.
            The dataset mask.

        in_log_format: ``bool``.
@@ -336,16 +367,7 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
        """
        data = dataset[0]
        data = data.to(self.device)
        if mask is not None:
            if mask == "val":
                mask = data.val_mask
            elif mask == "test":
                mask = data.test_mask
            elif mask == "train":
                mask = data.train_mask
        else:
            mask = data.test_mask
        ret = self.predict_only(data, mask)[mask]
        ret = self.predict_only(data, mask)
        if in_log_format is True:
            return ret
        else:
@@ -416,22 +438,24 @@ class NodeClassificationFullTrainer(BaseNodeClassificationTrainer):
        """
        data = dataset[0]
        data = data.to(self.device)
        test_mask = mask

        if isinstance(mask, str):
            if self.pyg_dgl == 'pyg':
                mask = getattr(data, f'{mask}_mask')
            elif self.pyg_dgl == 'dgl':
                mask = data.ndata[f'{mask}_mask']
        
        if self.pyg_dgl == 'pyg': label = data.y
        elif self.pyg_dgl == 'dgl': label = data.ndata['label']

        if feval is None:
            feval = self.feval
        else:
            feval = get_feval(feval)
        if test_mask is None:
            test_mask = data.test_mask
        elif test_mask == "test":
            test_mask = data.test_mask
        elif test_mask == "val":
            test_mask = data.val_mask
        elif test_mask == "train":
            test_mask = data.train_mask

        y_pred_prob = self.predict_proba(dataset, mask)
        y_pred = y_pred_prob.max(1)[1]
        y_true = data.y[test_mask]
        
        y_true = label[mask] if mask is not None else label

        if not isinstance(feval, list):
            feval = [feval]
--- a/autogl/solver/base.py
+++ b/autogl/solver/base.py
@@ -4,7 +4,7 @@ Solver base class
 Provide some standard solver interface.
 """

 from typing import Any, Tuple
 from typing import Any, Iterable, Tuple
 from copy import deepcopy

 import torch
@@ -175,7 +175,7 @@ class BaseSolver:
            self.feature_module = None
        elif isinstance(feature_module, (BaseFeature, str)):
            self.feature_module = get_feature(feature_module)
        elif isinstance(feature_module, list):
        elif isinstance(feature_module, Iterable):
            self.feature_module = get_feature(feature_module[0])
            for feature_engineer in feature_module[1:]:
                self.feature_module &= get_feature(feature_engineer)
@@ -306,15 +306,15 @@ class BaseSolver:

        nas_algorithms = (
            nas_algorithms
            if isinstance(nas_algorithms, (list, tuple))
            if isinstance(nas_algorithms, Iterable)
            else [nas_algorithms]
        )
        nas_spaces = (
            nas_spaces if isinstance(nas_spaces, (list, tuple)) else [nas_spaces]
            nas_spaces if isinstance(nas_spaces, Iterable) else [nas_spaces]
        )
        nas_estimators = (
            nas_estimators
            if isinstance(nas_estimators, (list, tuple))
            if isinstance(nas_estimators, Iterable)
            else [nas_estimators]
        )

--- a/autogl/solver/classifier/graph_classifier.py
+++ b/autogl/solver/classifier/graph_classifier.py
@@ -15,12 +15,13 @@ from ...module.feature import FEATURE_DICT
 from ...module.model import BaseModel, MODEL_DICT
 from ...module.train import TRAINER_DICT, get_feval, BaseGraphClassificationTrainer
 from ..base import _initialize_single_model, _parse_hp_space
 from ..utils import LeaderBoard, set_seed
 from ..utils import LeaderBoard, get_dataset_labels, set_seed, get_graph_from_dataset, get_graph_node_features, convert_dataset
 from ...datasets import utils
 from ...utils import get_logger
 from ..utils import get_logger
 from ...backend import DependentBackend

 LOGGER = get_logger("GraphClassifier")

 BACKEND = DependentBackend.get_backend_name()

 class AutoGraphClassifier(BaseClassifier):
    """
@@ -239,7 +240,7 @@ class AutoGraphClassifier(BaseClassifier):

        Parameters
        ----------
        dataset: torch_geometric.data.dataset.Dataset
        dataset: autogl.data.dataset
            The multi-graph dataset needed to fit on.

        time_limit: int
@@ -276,6 +277,8 @@ class AutoGraphClassifier(BaseClassifier):

        set_seed(seed)

        num_classes = max(get_dataset_labels(dataset)) + 1

        if time_limit < 0:
            time_limit = 3600 * 24
        time_begin = time.time()
@@ -285,8 +288,7 @@ class AutoGraphClassifier(BaseClassifier):
            if hasattr(dataset, "metric"):
                evaluation_method = [dataset.metric]
            else:
                num_of_label = dataset.num_classes
                if num_of_label == 2:
                if num_classes == 2:
                    evaluation_method = ["auc"]
                else:
                    evaluation_method = ["acc"]
@@ -327,23 +329,31 @@ class AutoGraphClassifier(BaseClassifier):
            dataset = self.feature_module.transform(dataset, inplace=inplace)

        self.dataset = dataset
        assert dataset[0].x is not None, (
        
        # check whether the dataset has features.
        # currently we only support graph classification with features.
        
        feat = get_graph_node_features(get_graph_from_dataset(dataset))
        assert feat is not None, (
            "Does not support fit on non node-feature dataset!"
            " Please add node features to dataset or specify feature engineers that generate"
            " node features."
        )
        num_features = feat.size(-1)

        # initialize graph networks
        self._init_graph_module(
            self.gml,
            num_features=dataset.num_node_features,
            num_classes=dataset.num_classes,
            # TODO: what should we use to get feature dimension?
            num_features=num_features,
            num_classes=num_classes,
            feval=evaluator_list,
            device=self.runtime_device,
            loss="cross_entropy" if not hasattr(dataset, "loss") else dataset.loss,
            num_graph_features=0
            if not hasattr(dataset.data, "gf")
            else dataset.data.gf.size(1),
            num_graph_features=(0
            if not hasattr(dataset[0], "gf")
            else dataset[0].gf.size(1)) if BACKEND == 'pyg' else 
            (0 if 'gf' not in dataset[0].data else dataset[0].data['gf'].size(1)),
        )

        # currently disabled
@@ -381,11 +391,11 @@ class AutoGraphClassifier(BaseClassifier):
                )
            if self.hpo_module is None:
                model.initialize()
                model.train(dataset, True)
                model.train(convert_dataset(dataset), True)
                optimized = model
            else:
                optimized, _ = self.hpo_module.optimize(
                    trainer=model, dataset=dataset, time_limit=time_for_each_model
                    trainer=model, dataset=convert_dataset(dataset), time_limit=time_for_each_model
                )
            # to save memory, all the trainer derived will be mapped to cpu
            optimized.to(torch.device("cpu"))
@@ -410,7 +420,7 @@ class AutoGraphClassifier(BaseClassifier):
        if self.ensemble_module is not None:
            performance = self.ensemble_module.fit(
                result_valid,
                dataset.data.y[dataset.val_index].cpu().detach().numpy(),
                get_dataset_labels(dataset)[dataset.val_index].cpu().numpy(),
                names,
                evaluator_list,
                n_classes=dataset.num_classes,
@@ -519,7 +529,7 @@ class AutoGraphClassifier(BaseClassifier):

        Parameters
        ----------
        dataset: torch_geometric.data.dataset.Dataset or None
        dataset: autogl.data.Dataset or None
            The dataset needed to predict. If ``None``, will use the processed dataset
            passed to ``fit()`` instead. Default ``None``.

@@ -606,7 +616,7 @@ class AutoGraphClassifier(BaseClassifier):
        self.trained_models[name].to(self.runtime_device)
        predicted = (
            self.trained_models[name]
            .predict_proba(dataset, mask=mask)
            .predict_proba(convert_dataset(dataset), mask=mask)
            .detach()
            .cpu()
            .numpy()
@@ -629,7 +639,7 @@ class AutoGraphClassifier(BaseClassifier):

        Parameters
        ----------
        dataset: torch_geometric.data.dataset.Dataset or None
        dataset: autogl.data.Dataset or None
            The dataset needed to predict. If ``None``, will use the processed dataset passed
            to ``fit()`` instead. Default ``None``.

--- a/autogl/solver/classifier/link_predictor.py
+++ b/autogl/solver/classifier/link_predictor.py
@@ -16,12 +16,13 @@ from ...module.feature import FEATURE_DICT
 from ...module.model import MODEL_DICT, BaseModel
 from ...module.train import TRAINER_DICT, BaseLinkPredictionTrainer
 from ...module.train import get_feval
 from ..utils import LeaderBoard, set_seed
 from ..utils import LeaderBoard, get_graph_from_dataset, get_graph_node_features, set_seed
 from ...datasets import utils
 from ...utils import get_logger
 from ..utils import get_logger
 from ...backend import DependentBackend

 LOGGER = get_logger("LinkPredictor")

 BACKEND = DependentBackend.get_backend_name()

 class AutoLinkPredictor(BaseClassifier):
    """
@@ -276,26 +277,35 @@ class AutoLinkPredictor(BaseClassifier):
            {e.get_eval_name(): e.is_higher_better() for e in evaluator_list},
        )

        graph_data = get_graph_from_dataset(dataset)

        # set up the dataset
        if train_split is not None and val_split is not None:
            utils.split_edges(dataset, train_split, val_split)
        else:
            assert all(
                [
                    hasattr(dataset.data, f"{name}")
                    for name in [
                        "train_pos_edge_index",
                        "train_neg_adj_mask",
                        "val_pos_edge_index",
                        "val_neg_edge_index",
                        "test_pos_edge_index",
                        "test_neg_edge_index",
            if BACKEND == 'pyg':
                assert all(
                    [
                        hasattr(graph_data, f"{name}")
                        for name in [
                            "train_pos_edge_index",
                            "train_neg_adj_mask",
                            "val_pos_edge_index",
                            "val_neg_edge_index",
                            "test_pos_edge_index",
                            "test_neg_edge_index",
                        ]
                    ]
                ]
            ), (
                "The dataset has no default train/val split! Please manually pass "
                "train and val ratio."
            )
                ), (
                    "The dataset has no default train/val split! Please manually pass "
                    "train and val ratio."
                )
            elif BACKEND == 'dgl':
                assert hasattr(graph_data, 'edata') and "train_mask" in graph_data.edata and "val_mask" in graph_data.edata, (
                    "The dataset has no default train/val split! Please manually pass "
                    "train and val ratio."
                )

            LOGGER.info("Use the default train/val/test ratio in given dataset")

        # feature engineering
@@ -303,16 +313,24 @@ class AutoLinkPredictor(BaseClassifier):
            dataset = self.feature_module.fit_transform(dataset, inplace=inplace)

        self.dataset = dataset
        assert self.dataset[0].x is not None, (

        # check whether the dataset has features.
        # currently we only support graph classification with features.
        
        feat = get_graph_node_features(graph_data)
        assert feat is not None, (
            "Does not support fit on non node-feature dataset!"
            " Please add node features to dataset or specify feature engineers that generate"
            " node features."
        )
        
        # TODO: how can we get num_features?
        num_features = feat.size(-1)

        # initialize graph networks
        self._init_graph_module(
            self.gml,
            num_features=self.dataset[0].x.shape[1],
            num_features=num_features,
            feval=evaluator_list,
            device=self.runtime_device,
            loss="binary_cross_entropy_with_logits"
@@ -356,20 +374,25 @@ class AutoLinkPredictor(BaseClassifier):

        # fit the ensemble model
        if self.ensemble_module is not None:
            pos_edge_index, neg_edge_index = (
                self.dataset[0].val_pos_edge_index,
                self.dataset[0].val_neg_edge_index,
            )
            E = pos_edge_index.size(1) + neg_edge_index.size(1)
            link_labels = torch.zeros(E, dtype=torch.float)
            link_labels[: pos_edge_index.size(1)] = 1.0
            if BACKEND == 'pyg':
                pos_edge_index, neg_edge_index = (
                    self.dataset[0].val_pos_edge_index,
                    self.dataset[0].val_neg_edge_index,
                )
                E = pos_edge_index.size(1) + neg_edge_index.size(1)
                link_labels = torch.zeros(E, dtype=torch.float)
                link_labels[: pos_edge_index.size(1)] = 1.0
            elif BACKEND == 'dgl':
                val_mask = self.dataset[0].edata["val_mask"]
                val_index = torch.nonzero(val_mask, as_tuple=False).squeeze()
                link_labels = self.dataset[0].edata['etype'][val_index]

            performance = self.ensemble_module.fit(
                result_valid,
                link_labels.detach().cpu().numpy(),
                names,
                evaluator_list,
                n_classes=dataset.num_classes,
                n_classes=2
            )
            self.leaderboard.insert_model_performance(
                "ensemble",
--- a/autogl/solver/classifier/node_classifier.py
+++ b/autogl/solver/classifier/node_classifier.py
@@ -7,7 +7,6 @@ import json
 from copy import deepcopy

 import torch
 import torch.nn.functional as F
 import numpy as np
 import yaml

@@ -20,15 +19,12 @@ from ...module.train import get_feval
 from ...module.nas.space import NAS_SPACE_DICT
 from ...module.nas.algorithm import NAS_ALGO_DICT
 from ...module.nas.estimator import NAS_ESTIMATOR_DICT, BaseEstimator
 from ..utils import LeaderBoard, set_seed
 from ..utils import LeaderBoard, get_graph_from_dataset, get_graph_labels, get_graph_masks, get_graph_node_features, get_graph_node_number, set_seed, convert_dataset
 from ...datasets import utils
 from ...utils import get_logger

 from torch_geometric.nn import GATConv, GCNConv

 LOGGER = get_logger("NodeClassifier")


 class AutoNodeClassifier(BaseClassifier):
    """
    Auto Multi-class Graph Node Classifier.
@@ -241,7 +237,7 @@ class AutoNodeClassifier(BaseClassifier):

        Parameters
        ----------
        dataset: torch_geometric.data.dataset.Dataset
        dataset: autogl.data.Dataset
            The dataset needed to fit on. This dataset must have only one graph.

        time_limit: int
@@ -286,12 +282,16 @@ class AutoNodeClassifier(BaseClassifier):
            time_limit = 3600 * 24
        time_begin = time.time()

        graph_data = get_graph_from_dataset(dataset, 0)
        all_labels = get_graph_labels(graph_data)
        num_classes = all_labels.max().item() + 1

        # initialize leaderboard
        if evaluation_method == "infer":
            if hasattr(dataset, "metric"):
                evaluation_method = [dataset.metric]
            else:
                num_of_label = dataset.num_classes
                num_of_label = num_classes
                if num_of_label == 2:
                    evaluation_method = ["auc"]
                else:
@@ -304,9 +304,10 @@ class AutoNodeClassifier(BaseClassifier):
            {e.get_eval_name(): e.is_higher_better() for e in evaluator_list},
        )


        # set up the dataset
        if train_split is not None and val_split is not None:
            size = dataset.data.x.shape[0]
            size = get_graph_node_number(graph_data)
            if balanced:
                train_split = (
                    train_split if train_split > 1 else int(train_split * size)
@@ -314,8 +315,8 @@ class AutoNodeClassifier(BaseClassifier):
                val_split = val_split if val_split > 1 else int(val_split * size)
                utils.random_splits_mask_class(
                    dataset,
                    num_train_per_class=train_split // dataset.num_classes,
                    num_val_per_class=val_split // dataset.num_classes,
                    num_train_per_class=train_split // num_classes,
                    num_val_per_class=val_split // num_classes,
                    seed=seed,
                )
            else:
@@ -325,9 +326,7 @@ class AutoNodeClassifier(BaseClassifier):
                    dataset, train_ratio=train_split, val_ratio=val_split
                )
        else:
            assert hasattr(dataset.data, "train_mask") and hasattr(
                dataset.data, "val_mask"
            ), (
            assert get_graph_masks(graph_data, 'train') is not None and get_graph_masks(graph_data, 'val') is not None, (
                "The dataset has no default train/val split! Please manually pass "
                "train and val ratio."
            )
@@ -338,27 +337,34 @@ class AutoNodeClassifier(BaseClassifier):
            dataset = self.feature_module.fit_transform(dataset, inplace=inplace)

        self.dataset = dataset
        assert self.dataset[0].x is not None, (

        # check whether the dataset has features.
        # currently we only support graph classification with features.

        feat = get_graph_node_features(graph_data)
        assert feat is not None, (
            "Does not support fit on non node-feature dataset!"
            " Please add node features to dataset or specify feature engineers that generate"
            " node features."
        )

        num_features = feat.size(-1)

        # initialize graph networks
        self._init_graph_module(
            self.gml,
            num_features=self.dataset[0].x.shape[1],
            num_classes=dataset.num_classes,
            num_features=num_features,
            num_classes=num_classes,
            feval=evaluator_list,
            device=self.runtime_device,
            loss="nll_loss" if not hasattr(dataset, "loss") else dataset.loss,
            loss="nll_loss" if not hasattr(dataset, "loss") else self.dataset.loss,
        )

        if self.nas_algorithms is not None:
            # perform neural architecture search
            self._init_nas_module(
                num_features=self.dataset[0].x.shape[1],
                num_classes=self.dataset.num_classes,
                num_features=num_features,
                num_classes=num_classes,
                feval=evaluator_list,
                device=self.runtime_device,
                loss="nll_loss" if not hasattr(dataset, "loss") else dataset.loss,
@@ -375,7 +381,7 @@ class AutoNodeClassifier(BaseClassifier):
            for algo, space, estimator in zip(
                self.nas_algorithms, self.nas_spaces, self.nas_estimators
            ):
                model = algo.search(space, self.dataset, estimator)
                model = algo.search(space, convert_dataset(self.dataset), estimator)
                # insert model into default trainer
                if isinstance(self._default_trainer, list):
                    train_name = self._default_trainer[idx_trainer]
@@ -385,8 +391,8 @@ class AutoNodeClassifier(BaseClassifier):
                if isinstance(train_name, str):
                    trainer = TRAINER_DICT[train_name](
                        model=model,
                        num_features=self.dataset[0].x.shape[1],
                        num_classes=self.dataset.num_classes,
                        num_features=num_features,
                        num_classes=num_classes,
                        loss="nll_loss"
                        if not hasattr(dataset, "loss")
                        else dataset.loss,
@@ -398,8 +404,8 @@ class AutoNodeClassifier(BaseClassifier):
                    trainer = train_name
                    trainer.model = model
                    trainer.update_parameters(
                        num_classes=self.dataset.num_classes,
                        num_features=self.dataset[0].x.shape[1],
                        num_features=num_features,
                        num_classes=num_classes,
                        loss="nll_loss"
                        if not hasattr(dataset, "loss")
                        else dataset.loss,
@@ -417,11 +423,11 @@ class AutoNodeClassifier(BaseClassifier):
            )
            if self.hpo_module is None:
                model.initialize()
                model.train(self.dataset, True)
                model.train(convert_dataset(self.dataset), True)
                optimized = model
            else:
                optimized, _ = self.hpo_module.optimize(
                    trainer=model, dataset=self.dataset, time_limit=time_for_each_model
                    trainer=model, dataset=convert_dataset(self.dataset), time_limit=time_for_each_model
                )
            # to save memory, all the trainer derived will be mapped to cpu
            optimized.to(torch.device("cpu"))
@@ -444,10 +450,10 @@ class AutoNodeClassifier(BaseClassifier):
        if self.ensemble_module is not None:
            performance = self.ensemble_module.fit(
                result_valid,
                self.dataset[0].y[self.dataset[0].val_mask].cpu().numpy(),
                all_labels[get_graph_masks(graph_data, 'val')].cpu().numpy(),
                names,
                evaluator_list,
                n_classes=dataset.num_classes,
                n_classes=num_classes,
            )
            self.leaderboard.insert_model_performance(
                "ensemble",
@@ -644,7 +650,7 @@ class AutoNodeClassifier(BaseClassifier):
    def _predict_proba_by_name(self, dataset, name, mask="test"):
        self.trained_models[name].to(self.runtime_device)
        predicted = (
            self.trained_models[name].predict_proba(dataset, mask=mask).cpu().numpy()
            self.trained_models[name].predict_proba(convert_dataset(dataset), mask=mask).cpu().numpy()
        )
        self.trained_models[name].to(torch.device("cpu"))
        return predicted
--- a/autogl/solver/utils.py
+++ b/autogl/solver/utils.py
@@ -6,14 +6,23 @@ Utilities used by the solver

 import random
 import typing as _typing
 import torch
 import torch.backends.cudnn
 import numpy as np
 import pandas as pd
 from ..backend import DependentBackend
 from ..data import Dataset
 from ..data.graph import GeneralStaticGraph

 from ..utils import get_logger

 LOGGER = get_logger("LeaderBoard")

 BACKEND = DependentBackend.get_backend_name()

 if BACKEND == 'dgl':
    from autogl.datasets.utils.conversion import general_static_graphs_to_dgl_dataset as _convert_dataset
 else:
    from autogl.datasets.utils.conversion import general_static_graphs_to_pyg_dataset as _convert_dataset

 class LeaderBoard:
    """
@@ -175,6 +184,74 @@ class LeaderBoard:
            )
        )

 def get_graph_from_dataset(dataset, graph_id=0):
    if isinstance(dataset, Dataset):
        return dataset[graph_id]
    if BACKEND == 'pyg': return dataset[graph_id]
    if BACKEND == 'dgl':
        from dgl import DGLGraph
        data = dataset[graph_id]
        if isinstance(data, DGLGraph): return data
        return data[0]
    
 def get_graph_node_number(graph):
    # FIXME: if the feature is None, this will throw an error
    if isinstance(graph, GeneralStaticGraph):
        if BACKEND == 'pyg':
            return graph.nodes.data['x'].size(0)
        return graph.nodes.data['feat'].size(0)
    if BACKEND == 'pyg':
        size = graph.x.shape[0]
    else:
        size = graph.num_nodes()
    return size

 def get_graph_node_features(graph):
    if isinstance(graph, GeneralStaticGraph):
        if BACKEND == 'dgl' and 'feat' in graph.nodes.data:
            return graph.nodes.data['feat']
        if BACKEND == 'pyg' and 'x' in graph.nodes.data:
            return graph.nodes.data['x']
        return None
    if BACKEND == 'pyg' and hasattr(graph, 'x'):
        return graph.x
    elif BACKEND == 'dgl' and 'feat' in graph.ndata:
        return graph.ndata['feat']
    return None

 def get_graph_masks(graph, mask='train'):
    if isinstance(graph, GeneralStaticGraph):
        if f'{mask}_mask' in graph.nodes.data:
            return graph.nodes.data[f'{mask}_mask']
        return None
    if BACKEND == 'pyg' and hasattr(graph, f'{mask}_mask'):
        return getattr(graph, f'{mask}_mask')
    if BACKEND == 'dgl' and f'{mask}_mask' in graph.ndata:
        return graph.ndata[f'{mask}_mask']
    return None

 def get_graph_labels(graph):
    if isinstance(graph, GeneralStaticGraph):
        if 'label' in graph.nodes.data and BACKEND == 'dgl':
            return graph.nodes.data['label']
        if 'y' in graph.nodes.data and BACKEND == 'pyg':
            return graph.nodes.data['y']
        return None
    if BACKEND == 'pyg' and hasattr(graph, 'y'): return graph.y
    if BACKEND == 'dgl' and 'label' in graph.ndata: return graph.ndata['label']
    return None

 def get_dataset_labels(dataset):
    if isinstance(dataset, Dataset):
        return torch.LongTensor([d.data['label' if BACKEND == 'dgl' else 'y'] for d in dataset])
    if BACKEND == 'pyg':
        return dataset.data.y
    else:
        return torch.LongTensor([d[1] for d in dataset])

 def convert_dataset(dataset):
    if isinstance(dataset, Dataset): return _convert_dataset(dataset)
    return dataset

 def set_seed(seed=None):
    """
--- a/test/backend.py
+++ b/test/backend.py
@@ -0,0 +1,25 @@
 import os
 import autogl

 def test_backend():
    environ = os.environ.get("AUTOGL_BACKEND", None)
    backend_name = autogl.backend.DependentBackend.get_backend_name()
    if environ in ['pyg', 'dgl']:
        assert backend_name == environ
    else:
        try:
            import dgl
            assert backend_name == 'dgl'
            return
        except ImportError:
            pass

        try:
            import torch_geometric
            assert backend_name == 'pyg'
            return
        except ImportError:
            pass

 if __name__ == '__main__':
    test_backend()
--- a/test/model_glf/gclf_dgl.py
+++ b/test/model_glf/gclf_dgl.py
@@ -1,257 +0,0 @@
 import os
 import sys
 import logging
 logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm
 import argparse

 sys.path.insert(0, "../../")

 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
 from dgl.data import GINDataset
 import torch
 import torch.nn as nn
 import torch.optim as optim

 from gin_helper import GINDataLoader
 from autogl.module.model.dgl.gin import AutoGIN
 from autogl.module.train.graph_classification_full import GraphClassificationFullTrainer

 import numpy as np


 def train(args, net, trainloader, optimizer, criterion, epoch):
    net.train()

    running_loss = 0
    total_iters = len(trainloader)
    # setup the offset to avoid the overlap with mouse cursor
    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)

    for pos, (graphs, labels) in zip(bar, trainloader):
        # batch graphs will be shipped to device in forward part of model
        labels = labels.to(args.device)
        graphs = graphs.to(args.device)
        feat = graphs.ndata.pop('attr')
        outputs = net(graphs, feat)

        loss = criterion(outputs, labels)
        running_loss += loss.item()

        # backprop
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # report
        bar.set_description('epoch-{}'.format(epoch))
    bar.close()
    # the final batch will be aligned
    running_loss = running_loss / total_iters

    return running_loss


 def eval_net(args, net, dataloader, criterion):
    net.eval()

    total = 0
    total_loss = 0
    total_correct = 0

    for data in dataloader:
        graphs, labels = data
        graphs = graphs.to(args.device)
        labels = labels.to(args.device)
        feat = graphs.ndata.pop('attr')
        total += len(labels)
        outputs = net(graphs, feat)
        _, predicted = torch.max(outputs.data, 1)

        total_correct += (predicted == labels.data).sum().item()
        loss = criterion(outputs, labels)
        # crossentropy(reduce=True) for default
        total_loss += loss.item() * len(labels)

    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total

    net.train()

    return loss, acc


 def main(args):

    # set up seeds, args.seed supported
    torch.manual_seed(seed=args.seed)
    np.random.seed(seed=args.seed)

    # is_cuda = not args.disable_cuda and torch.cuda.is_available()
    is_cuda = torch.cuda.is_available()

    if is_cuda:
        args.device = torch.device("cuda:" + str(args.device))
        torch.cuda.manual_seed_all(seed=args.seed)
    else:
        args.device = torch.device("cpu")


    dataset = GINDataset(args.dataset, not args.learn_eps)

    trainloader, validloader = GINDataLoader(
        dataset, batch_size=args.batch_size, device=args.device,
        seed=args.seed, shuffle=True,
        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
    # or split_name='rand', split_ratio=0.7
    automodel = AutoGIN(
                num_classes=dataset.gclasses,
                num_features=dataset.dim_nfeats,
                device=args.device,
                init=True)
    model = automodel.model
    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
    optimizer = optim.Adam(model.parameters(), lr=args.lr)
    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)

    trainer = GraphClassificationFullTrainer(
        model=automodel,
        num_features=dataset.dim_nfeats,
        num_classes=dataset.gclasses,
        optimizer=optimizer,
        lr=args.lr,
        max_epoch=30,
        # max_epoch=1,
        batch_size=args.batch_size,
        criterion=criterion,
        feval="acc",
    )

    trainer.train_only(trainloader)
    pred = trainer.predict(validloader)
    print(pred)
    print(trainer.evaluate(validloader, feval='acc'))

    return 0


    # it's not cost-effective to hanle the cursor and init 0
    # https://stackoverflow.com/a/23121189
    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)

    for epoch, _, _ in zip(tbar, vbar, lrbar):

        train(args, model, trainloader, optimizer, criterion, epoch)
        scheduler.step()

        train_loss, train_acc = eval_net(
            args, model, trainloader, criterion)
        tbar.set_description(
            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
            .format(train_loss, 100. * train_acc))

        valid_loss, valid_acc = eval_net(
            args, model, validloader, criterion)
        vbar.set_description(
            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
            .format(valid_loss, 100. * valid_acc))

        if not args.filename == "":
            with open(args.filename, 'a') as f:
                f.write('%s %s %s %s' % (
                    args.dataset,
                    args.learn_eps,
                    args.neighbor_pooling_type,
                    args.graph_pooling_type
                ))
                f.write("\n")
                f.write("%f %f %f %f" % (
                    train_loss,
                    train_acc,
                    valid_loss,
                    valid_acc
                ))
                f.write("\n")

        # lrbar.set_description(
        #     "Learning eps with learn_eps={}: {}".format(
        #         args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))

    tbar.close()
    vbar.close()
    lrbar.close()


 if __name__ == '__main__':
    parser = argparse.ArgumentParser(
        "auto graph classification", formatter_class=argparse.ArgumentDefaultsHelpFormatter
    )
    parser.add_argument(
        '--dataset', type=str, default="MUTAG",
        choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI'],
        help='name of dataset (default: MUTAG)')
    parser.add_argument(
        '--batch_size', type=int, default=32,
        help='batch size for training and validation (default: 32)')
    parser.add_argument(
        '--fold_idx', type=int, default=0,
        help='the index(<10) of fold in 10-fold validation.')
    parser.add_argument(
        '--filename', type=str, default="",
        help='output file')

    # device
    parser.add_argument(
        '--disable-cuda', action='store_true',
        help='Disable CUDA')
    parser.add_argument(
        '--device', type=int, default=0,
        help='which gpu device to use (default: 0)')

    # net
    parser.add_argument(
        '--num_layers', type=int, default=5,
        help='number of layers (default: 5)')
    parser.add_argument(
        '--num_mlp_layers', type=int, default=2,
        help='number of MLP layers(default: 2). 1 means linear model.')
    parser.add_argument(
        '--hidden_dim', type=int, default=64,
        help='number of hidden units (default: 64)')

    # graph
    parser.add_argument(
        '--graph_pooling_type', type=str,
        default="sum", choices=["sum", "mean", "max"],
        help='type of graph pooling: sum, mean or max')
    parser.add_argument(
        '--neighbor_pooling_type', type=str,
        default="sum", choices=["sum", "mean", "max"],
        help='type of neighboring pooling: sum, mean or max')
    parser.add_argument(
        '--learn_eps', action="store_true",
        help='learn the epsilon weighting')

    # learning
    parser.add_argument(
        '--seed', type=int, default=0,
        help='random seed (default: 0)')
    parser.add_argument(
        '--epochs', type=int, default=100,
        help='number of epochs to train (default: 350)')
    parser.add_argument(
        '--lr', type=float, default=0.01,
        help='learning rate (default: 0.01)')
    parser.add_argument(
        '--final_dropout', type=float, default=0.5,
        help='final layer dropout (default: 0.5)')

    args = parser.parse_args()
    print('show all arguments configuration...')
    print(args)
    main(args)



--- a/test/model_glf/gclf_dgl_gin.py
+++ b/test/model_glf/gclf_dgl_gin.py
@@ -1,169 +0,0 @@
 import os
 import sys
 import logging
 logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm

 sys.path.insert(0, "../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
 from dgl.data import GINDataset
 import torch
 import torch.nn as nn
 import torch.optim as optim

 from gin_helper import Parser, GINDataLoader
 from autogl.module.model.dgl.gin import AutoGIN

 import numpy as np
 from autogl.solver.utils import set_seed
 set_seed(202106)


 def train(args, net, trainloader, optimizer, criterion, epoch):
    net.train()

    running_loss = 0
    total_iters = len(trainloader)
    # setup the offset to avoid the overlap with mouse cursor
    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)

    for pos, data in zip(bar, trainloader):
        data = [data[i].to(args.device) for i in range(len(data))]
        _, labels = data
        outputs = net(data)

        loss = criterion(outputs, labels)
        running_loss += loss.item()

        # backprop
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # report
        bar.set_description('epoch-{}'.format(epoch))
    bar.close()
    # the final batch will be aligned
    running_loss = running_loss / total_iters

    return running_loss


 def eval_net(args, net, dataloader, criterion):
    net.eval()

    total = 0
    total_loss = 0
    total_correct = 0

    for data in dataloader:
        data = [data[i].to(args.device) for i in range(len(data))]
        _, labels = data
        total += len(labels)
        outputs = net(data)
        _, predicted = torch.max(outputs.data, 1)

        total_correct += (predicted == labels.data).sum().item()
        loss = criterion(outputs, labels)
        total_loss += loss.item() * len(labels)

    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total

    net.train()

    return loss, acc


 def main(args):

    # set up seeds, args.seed supported
    torch.manual_seed(seed=args.seed)
    np.random.seed(seed=args.seed)

    is_cuda = not args.disable_cuda and torch.cuda.is_available()

    if is_cuda:
        args.device = torch.device("cuda:" + str(args.device))
        torch.cuda.manual_seed_all(seed=args.seed)
    else:
        args.device = torch.device("cpu")

    dataset = GINDataset(args.dataset, not args.learn_eps)

    best_val_acc = -1.0

    trainloader, validloader = GINDataLoader(
        dataset, batch_size=args.batch_size, device=args.device,
        seed=args.seed, shuffle=True,
        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
    # or split_name='rand', split_ratio=0.7
    automodel =  AutoGIN(
                num_classes=dataset.gclasses,
                num_features=dataset.dim_nfeats,
                device=args.device,
                init=True)
    model = automodel.model
    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
    optimizer = optim.Adam(model.parameters(), lr=args.lr)
    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)

    # it's not cost-effective to hanle the cursor and init 0
    # https://stackoverflow.com/a/23121189
    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)

    for epoch, _, _ in zip(tbar, vbar, lrbar):

        train(args, model, trainloader, optimizer, criterion, epoch)
        scheduler.step()

        train_loss, train_acc = eval_net(
            args, model, trainloader, criterion)
        tbar.set_description(
            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
            .format(train_loss, 100. * train_acc))

        valid_loss, valid_acc = eval_net(
            args, model, validloader, criterion)
        vbar.set_description(
            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
            .format(valid_loss, 100. * valid_acc))

        if valid_acc > best_val_acc:
            best_val_acc = valid_acc

        if not args.filename == "":
            with open(args.filename, 'a') as f:
                f.write('%s %s %s %s' % (
                    args.dataset,
                    args.learn_eps,
                    args.neighbor_pooling_type,
                    args.graph_pooling_type
                ))
                f.write("\n")
                f.write("%f %f %f %f" % (
                    train_loss,
                    train_acc,
                    valid_loss,
                    valid_acc
                ))
                f.write("\n")

        lrbar.set_description(
            "Learning eps with learn_eps={}: {}".format(
                args.learn_eps, [layer.eps.data.item() for layer in model.ginlayers]))

    tbar.close()
    vbar.close()
    lrbar.close()

    print('\n\n\nBest val acc', best_val_acc)


 if __name__ == '__main__':
    args = Parser(description='GIN').args
    print('show all arguments configuration...')
    print(args)
    main(args)
--- a/test/model_glf/gclf_dgl_gin_trainer.py
+++ b/test/model_glf/gclf_dgl_gin_trainer.py
@@ -1,148 +0,0 @@
 import os
 import sys
 import logging
 logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm

 sys.path.insert(0, "../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
 from dgl.data import GINDataset
 import torch
 from gin_helper import Parser, GINDataLoader
 from autogl.module.model.dgl.gin import AutoGIN

 from autogl.module.train.graph_classification_full import GraphClassificationFullTrainer


 import numpy as np

 from autogl.datasets import utils


 trainloader, validloader = None, None

 def test_graph_get_split(dataset, mask, is_loader=True, batch_size=128, num_workers=0):
    global trainloader, validloader
    if trainloader is None and validloader is None:
        trainloader, validloader = GINDataLoader(
            dataset, batch_size=args.batch_size, device=args.device,
            seed=args.seed, shuffle=True,
            split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()

    if mask == 'train':
        return trainloader
    elif mask == 'val':
        return validloader
    else:
        assert False


 utils.graph_get_split = test_graph_get_split

 def train(args, net, trainloader, optimizer, criterion, epoch):
    net.train()

    running_loss = 0
    total_iters = len(trainloader)
    # setup the offset to avoid the overlap with mouse cursor
    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)

    for pos, data in zip(bar, trainloader):
        data = [data[i].to(args.device) for i in range(len(data))]
        _, labels = data
        outputs = net(data)

        loss = criterion(outputs, labels)
        running_loss += loss.item()

        # backprop
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # report
        bar.set_description('epoch-{}'.format(epoch))
    bar.close()
    # the final batch will be aligned
    running_loss = running_loss / total_iters

    return running_loss


 def eval_net(args, net, dataloader, criterion):
    net.eval()

    total = 0
    total_loss = 0
    total_correct = 0

    for data in dataloader:
        data = [data[i].to(args.device) for i in range(len(data))]
        _, labels = data
        total += len(labels)
        outputs = net(data)
        _, predicted = torch.max(outputs.data, 1)

        total_correct += (predicted == labels.data).sum().item()
        loss = criterion(outputs, labels)
        total_loss += loss.item() * len(labels)

    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total

    net.train()

    return loss, acc


 def main(args):

    # set up seeds, args.seed supported
    torch.manual_seed(seed=args.seed)
    np.random.seed(seed=args.seed)

    is_cuda = not args.disable_cuda and torch.cuda.is_available()

    if is_cuda:
        args.device = torch.device("cuda:" + str(args.device))
        torch.cuda.manual_seed_all(seed=args.seed)
    else:
        args.device = torch.device("cpu")

    dataset = GINDataset(args.dataset, not args.learn_eps)

    # or split_name='rand', split_ratio=0.7
    automodel =  AutoGIN(
                num_classes=dataset.gclasses,
                num_features=dataset.dim_nfeats,
                device=args.device,
                init=True)
    model = automodel.model

    trainer = GraphClassificationFullTrainer(
        model=automodel,
        num_features=dataset.dim_nfeats,
        num_classes=dataset.gclasses,
        optimizer="adam",
        lr=args.lr,
        max_epoch=50,
        # max_epoch=1,
        batch_size=args.batch_size,
        loss="cross_entropy",
        feval="acc",
        early_stopping_round=100,
        weight_decay=0.0,
    )

    trainer.train(dataset)
    print(trainer.evaluate(dataset, 'val'))
    print(trainer.predict(dataset, 'val'))


    return

 if __name__ == '__main__':
    args = Parser(description='GIN').args
    print('show all arguments configuration...')
    print(args)
    main(args)
--- a/test/model_glf/gclf_dgl_topk.py
+++ b/test/model_glf/gclf_dgl_topk.py
@@ -1,169 +0,0 @@
 import os
 import sys
 import logging
 logging.basicConfig(level=logging.INFO)
 from tqdm import tqdm

 sys.path.append("../../")
 print(os.getcwd())
 os.environ["AUTOGL_BACKEND"] = "dgl"
 from dgl.data import GINDataset
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 import torch.optim as optim

 from gin_helper import Parser, GINDataLoader
 from autogl.module.model import AutoTopkpool

 import numpy as np
 from autogl.solver.utils import set_seed
 set_seed(202106)


 def train(args, net, trainloader, optimizer, criterion, epoch):
    net.train()

    running_loss = 0
    total_iters = len(trainloader)
    # setup the offset to avoid the overlap with mouse cursor
    bar = tqdm(range(total_iters), unit='batch', position=2, file=sys.stdout)

    for pos, data in zip(bar, trainloader):
        data = [data[i].to(args.device) for i in range(len(data))]
        _, labels = data
        # batch graphs will be shipped to device in forward part of model
        #labels = labels.to(args.device)
        #graphs = graphs.to(args.device)
        #feat = graphs.ndata.pop('attr')
        #outputs = net(graphs, feat)
        outputs = net(data)

        loss = criterion(outputs, labels)
        running_loss += loss.item()

        # backprop
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # report
        bar.set_description('epoch-{}'.format(epoch))
    bar.close()
    # the final batch will be aligned
    running_loss = running_loss / total_iters

    return running_loss


 def eval_net(args, net, dataloader, criterion):
    net.eval()

    total = 0
    total_loss = 0
    total_correct = 0

    for data in dataloader:
        data = [data[i].to(args.device) for i in range(len(data))]
        _, labels = data
        #graphs, labels = data
        #graphs = graphs.to(args.device)
        #labels = labels.to(args.device)
        #feat = graphs.ndata.pop('attr')
        total += len(labels)
        #outputs = net(graphs, feat)
        outputs = net(data)
        _, predicted = torch.max(outputs.data, 1)

        total_correct += (predicted == labels.data).sum().item()
        loss = criterion(outputs, labels)
        # crossentropy(reduce=True) for default
        total_loss += loss.item() * len(labels)

    loss, acc = 1.0*total_loss / total, 1.0*total_correct / total

    net.train()

    return loss, acc


 def main(args):

    # set up seeds, args.seed supported
    torch.manual_seed(seed=args.seed)
    np.random.seed(seed=args.seed)

    is_cuda = not args.disable_cuda and torch.cuda.is_available()

    if is_cuda:
        args.device = torch.device("cuda:" + str(args.device))
        torch.cuda.manual_seed_all(seed=args.seed)
    else:
        args.device = torch.device("cpu")

    dataset = GINDataset(args.dataset, not args.learn_eps)

    trainloader, validloader = GINDataLoader(
        dataset, batch_size=args.batch_size, device=args.device,
        seed=args.seed, shuffle=True,
        split_name='fold10', fold_idx=args.fold_idx).train_valid_loader()
    # or split_name='rand', split_ratio=0.7
    automodel =  AutoTopkpool(
                num_classes=dataset.gclasses,
                num_features=dataset.dim_nfeats,
                device=args.device,
                init=True)
    model = automodel.model
    criterion = nn.CrossEntropyLoss()  # defaul reduce is true
    optimizer = optim.Adam(model.parameters(), lr=args.lr)
    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=50, gamma=0.5)

    # it's not cost-effective to hanle the cursor and init 0
    # https://stackoverflow.com/a/23121189
    tbar = tqdm(range(args.epochs), unit="epoch", position=3, ncols=0, file=sys.stdout)
    vbar = tqdm(range(args.epochs), unit="epoch", position=4, ncols=0, file=sys.stdout)
    lrbar = tqdm(range(args.epochs), unit="epoch", position=5, ncols=0, file=sys.stdout)

    for epoch, _, _ in zip(tbar, vbar, lrbar):

        train(args, model, trainloader, optimizer, criterion, epoch)
        scheduler.step()

        train_loss, train_acc = eval_net(
            args, model, trainloader, criterion)
        tbar.set_description(
            'train set - average loss: {:.4f}, accuracy: {:.0f}%'
            .format(train_loss, 100. * train_acc))

        valid_loss, valid_acc = eval_net(
            args, model, validloader, criterion)
        vbar.set_description(
            'valid set - average loss: {:.4f}, accuracy: {:.0f}%'
            .format(valid_loss, 100. * valid_acc))

        if not args.filename == "":
            with open(args.filename, 'a') as f:
                f.write('%s' % (
                    args.dataset,
                ))
                f.write("\n")
                f.write("%f %f %f %f" % (
                    train_loss,
                    train_acc,
                    valid_loss,
                    valid_acc
                ))
                f.write("\n")


    tbar.close()
    vbar.close()
    lrbar.close()


 if __name__ == '__main__':
    args = Parser(description='GIN').args
    print('show all arguments configuration...')
    print(args)
    main(args)

--- a/test/model_glf/gin_helper.py
+++ b/test/model_glf/gin_helper.py
@@ -1,156 +0,0 @@
 """
 Gin helper for testing
 """

 import math
 import numpy as np
 from torch.utils.data.sampler import SubsetRandomSampler
 from sklearn.model_selection import StratifiedKFold
 from dgl.dataloading import GraphDataLoader
 import argparse

 class GINDataLoader():
    def __init__(self,
                 dataset,
                 batch_size,
                 device,
                 collate_fn=None,
                 seed=0,
                 shuffle=True,
                 split_name='fold10',
                 fold_idx=0,
                 split_ratio=0.7):

        self.shuffle = shuffle
        self.seed = seed
        self.kwargs = {'pin_memory': True} if 'cuda' in device.type else {}

        labels = [l for _, l in dataset]

        if split_name == 'fold10':
            train_idx, valid_idx = self._split_fold10(
                labels, fold_idx, seed, shuffle)
        elif split_name == 'rand':
            train_idx, valid_idx = self._split_rand(
                labels, split_ratio, seed, shuffle)
        else:
            raise NotImplementedError()

        train_sampler = SubsetRandomSampler(train_idx)
        valid_sampler = SubsetRandomSampler(valid_idx)

        self.train_loader = GraphDataLoader(
            dataset, sampler=train_sampler,
            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)
        self.valid_loader = GraphDataLoader(
            dataset, sampler=valid_sampler,
            batch_size=batch_size, collate_fn=collate_fn, **self.kwargs)

    def train_valid_loader(self):
        return self.train_loader, self.valid_loader

    def _split_fold10(self, labels, fold_idx=0, seed=0, shuffle=True):
        ''' 10 flod '''
        assert 0 <= fold_idx and fold_idx < 10, print(
            "fold_idx must be from 0 to 9.")

        skf = StratifiedKFold(n_splits=10, shuffle=shuffle, random_state=seed)
        idx_list = []
        for idx in skf.split(np.zeros(len(labels)), labels):    # split(x, y)
            idx_list.append(idx)
        train_idx, valid_idx = idx_list[fold_idx]

        print(
            "train_set : test_set = %d : %d",
            len(train_idx), len(valid_idx))

        return train_idx, valid_idx

    def _split_rand(self, labels, split_ratio=0.7, seed=0, shuffle=True):
        num_entries = len(labels)
        indices = list(range(num_entries))
        np.random.seed(seed)
        np.random.shuffle(indices)
        split = int(math.floor(split_ratio * num_entries))
        train_idx, valid_idx = indices[:split], indices[split:]

        print(
            "train_set : test_set = %d : %d",
            len(train_idx), len(valid_idx))

        return train_idx, valid_idx

 class Parser():

    def __init__(self, description):
        '''
           arguments parser
        '''
        self.parser = argparse.ArgumentParser(description=description)
        self.args = None
        self._parse()

    def _parse(self):
        # dataset
        self.parser.add_argument(
            '--dataset', type=str, default="MUTAG",
            choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI'],
            help='name of dataset (default: MUTAG)')
        self.parser.add_argument(
            '--batch_size', type=int, default=32,
            help='batch size for training and validation (default: 32)')
        self.parser.add_argument(
            '--fold_idx', type=int, default=0,
            help='the index(<10) of fold in 10-fold validation.')
        self.parser.add_argument(
            '--filename', type=str, default="",
            help='output file')

        # device
        self.parser.add_argument(
            '--disable-cuda', action='store_true',
            help='Disable CUDA')
        self.parser.add_argument(
            '--device', type=int, default=0,
            help='which gpu device to use (default: 0)')

        # net
        self.parser.add_argument(
            '--num_layers', type=int, default=5,
            help='number of layers (default: 5)')
        self.parser.add_argument(
            '--num_mlp_layers', type=int, default=2,
            help='number of MLP layers(default: 2). 1 means linear model.')
        self.parser.add_argument(
            '--hidden_dim', type=int, default=64,
            help='number of hidden units (default: 64)')

        # graph
        self.parser.add_argument(
            '--graph_pooling_type', type=str,
            default="sum", choices=["sum", "mean", "max"],
            help='type of graph pooling: sum, mean or max')
        self.parser.add_argument(
            '--neighbor_pooling_type', type=str,
            default="sum", choices=["sum", "mean", "max"],
            help='type of neighboring pooling: sum, mean or max')
        self.parser.add_argument(
            '--learn_eps', action="store_true",
            help='learn the epsilon weighting')

        # learning
        self.parser.add_argument(
            '--seed', type=int, default=0,
            help='random seed (default: 0)')
        self.parser.add_argument(
            '--epochs', type=int, default=100,
            help='number of epochs to train (default: 100)')
        self.parser.add_argument(
            '--lr', type=float, default=0.01,
            help='learning rate (default: 0.01)')
        self.parser.add_argument(
            '--final_dropout', type=float, default=0.5,
            help='final layer dropout (default: 0.5)')

        # done
        self.args = self.parser.parse_args()
--- a/test/performance/graph_classification/dgl/base.py
+++ b/test/performance/graph_classification/dgl/base.py
@@ -0,0 +1,309 @@
 """
 Performance check of DGL original dataset, model, trainer setting

 Borrowed from DGL official examples: https://github.com/dmlc/dgl/tree/master/examples/pytorch/gin

 TopkPool is not supported currently
 """

 from dgl.dataloading.pytorch.dataloader import GraphDataLoader
 import numpy as np
 from tqdm import tqdm

 import random

 import torch
 import torch.nn as nn
 import torch.optim as optim

 from dgl.data import GINDataset

 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 from dgl.nn.pytorch.conv import GINConv
 from dgl.nn.pytorch.glob import SumPooling, AvgPooling, MaxPooling


 class DatasetAbstraction():
    def __init__(self, graphs, labels):
        for g in graphs:
            g.ndata['feat'] = g.ndata['attr']
        self.graphs, self.labels = [], []
        for g, l in zip(graphs, labels):
            self.graphs.append(g)
            self.labels.append(l)
        self.gclasses = max(self.labels).item() + 1
        self.graph = self.graphs
    
    def __len__(self):
        return len(self.graphs)
    
    def __getitem__(self, idx):
        if isinstance(idx, int):
            return self.graphs[idx], self.labels[idx]
        elif isinstance(idx, torch.BoolTensor):
            idx = [i for i in range(len(idx)) if idx[i]]
        elif isinstance(idx, torch.Tensor) and idx.unique()[0].sum().item() == 1:
            idx = [i for i in range(len(idx)) if idx[i]]
        return DatasetAbstraction([self.graphs[i] for i in idx], [self.labels[i] for i in idx])

 class ApplyNodeFunc(nn.Module):
    """Update the node feature hv with MLP, BN and ReLU."""
    def __init__(self, mlp):
        super(ApplyNodeFunc, self).__init__()
        self.mlp = mlp
        self.bn = nn.BatchNorm1d(self.mlp.output_dim)

    def forward(self, h):
        h = self.mlp(h)
        h = self.bn(h)
        h = F.relu(h)
        return h


 class MLP(nn.Module):
    """MLP with linear output"""
    def __init__(self, num_layers, input_dim, hidden_dim, output_dim):
        """MLP layers construction
        Paramters
        ---------
        num_layers: int
            The number of linear layers
        input_dim: int
            The dimensionality of input features
        hidden_dim: int
            The dimensionality of hidden units at ALL layers
        output_dim: int
            The number of classes for prediction
        """
        super(MLP, self).__init__()
        self.linear_or_not = True  # default is linear model
        self.num_layers = num_layers
        self.output_dim = output_dim

        if num_layers < 1:
            raise ValueError("number of layers should be positive!")
        elif num_layers == 1:
            # Linear model
            self.linear = nn.Linear(input_dim, output_dim)
        else:
            # Multi-layer model
            self.linear_or_not = False
            self.linears = torch.nn.ModuleList()
            self.batch_norms = torch.nn.ModuleList()

            self.linears.append(nn.Linear(input_dim, hidden_dim))
            for layer in range(num_layers - 2):
                self.linears.append(nn.Linear(hidden_dim, hidden_dim))
            self.linears.append(nn.Linear(hidden_dim, output_dim))

            for layer in range(num_layers - 1):
                self.batch_norms.append(nn.BatchNorm1d((hidden_dim)))

    def forward(self, x):
        if self.linear_or_not:
            # If linear model
            return self.linear(x)
        else:
            # If MLP
            h = x
            for i in range(self.num_layers - 1):
                h = F.relu(self.batch_norms[i](self.linears[i](h)))
            return self.linears[-1](h)


 class GIN(nn.Module):
    """GIN model"""
    def __init__(self, num_layers, num_mlp_layers, input_dim, hidden_dim,
                 output_dim, final_dropout, learn_eps, graph_pooling_type,
                 neighbor_pooling_type):
        """model parameters setting
        Paramters
        ---------
        num_layers: int
            The number of linear layers in the neural network
        num_mlp_layers: int
            The number of linear layers in mlps
        input_dim: int
            The dimensionality of input features
        hidden_dim: int
            The dimensionality of hidden units at ALL layers
        output_dim: int
            The number of classes for prediction
        final_dropout: float
            dropout ratio on the final linear layer
        learn_eps: boolean
            If True, learn epsilon to distinguish center nodes from neighbors
            If False, aggregate neighbors and center nodes altogether.
        neighbor_pooling_type: str
            how to aggregate neighbors (sum, mean, or max)
        graph_pooling_type: str
            how to aggregate entire nodes in a graph (sum, mean or max)
        """
        super(GIN, self).__init__()
        self.num_layers = num_layers
        self.learn_eps = learn_eps

        # List of MLPs
        self.ginlayers = torch.nn.ModuleList()
        self.batch_norms = torch.nn.ModuleList()

        for layer in range(self.num_layers - 1):
            if layer == 0:
                mlp = MLP(num_mlp_layers, input_dim, hidden_dim, hidden_dim)
            else:
                mlp = MLP(num_mlp_layers, hidden_dim, hidden_dim, hidden_dim)

            self.ginlayers.append(
                GINConv(ApplyNodeFunc(mlp), neighbor_pooling_type, 0, self.learn_eps))
            self.batch_norms.append(nn.BatchNorm1d(hidden_dim))

        # Linear function for graph poolings of output of each layer
        # which maps the output of different layers into a prediction score
        self.linears_prediction = torch.nn.ModuleList()

        for layer in range(num_layers):
            if layer == 0:
                self.linears_prediction.append(
                    nn.Linear(input_dim, output_dim))
            else:
                self.linears_prediction.append(
                    nn.Linear(hidden_dim, output_dim))

        self.drop = nn.Dropout(final_dropout)

        if graph_pooling_type == 'sum':
            self.pool = SumPooling()
        elif graph_pooling_type == 'mean':
            self.pool = AvgPooling()
        elif graph_pooling_type == 'max':
            self.pool = MaxPooling()
        else:
            raise NotImplementedError

    def forward(self, g, h):
        # list of hidden representation at each layer (including input)
        hidden_rep = [h]

        for i in range(self.num_layers - 1):
            h = self.ginlayers[i](g, h)
            h = self.batch_norms[i](h)
            h = F.relu(h)
            hidden_rep.append(h)

        score_over_layer = 0

        # perform pooling over all nodes in each graph in every layer
        for i, h in enumerate(hidden_rep):
            pooled_h = self.pool(g, h)
            score_over_layer += self.drop(self.linears_prediction[i](pooled_h))

        return score_over_layer


 def train(net, trainloader, validloader, optimizer, criterion, epoch, device):
    best_model = net.state_dict()
    
    best_acc = 0.
    for e in range(epoch):
        for graphs, labels in trainloader:
            net.train()

            labels = labels.to(device)
            graphs = graphs.to(device)
            feat = graphs.ndata.pop('attr')
            outputs = net(graphs, feat)

            loss = criterion(outputs, labels)

            # backprop
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        
        gt = []
        pr = []
        for graphs, labels in validloader:
            labels = labels.to(device)
            graphs = graphs.to(device)
            gt.append(labels)
            feat = graphs.ndata.pop('attr')
            outputs = net(graphs, feat)
            pr.append(outputs.argmax(1))
        gt = torch.cat(gt, dim=0)
        pr = torch.cat(pr, dim=0)
        acc = (gt == pr).float().mean().item()
        if acc > best_acc:
            best_acc = acc
            best_model = net.state_dict()
    
    net.load_state_dict(best_model)

    return net

 def eval_net(net, dataloader, device):
    net.eval()

    total = 0
    total_correct = 0

    for data in dataloader:
        graphs, labels = data
        graphs = graphs.to(device)
        labels = labels.to(device)
        feat = graphs.ndata.pop('attr')
        total += len(labels)
        outputs = net(graphs, feat)
        _, predicted = torch.max(outputs.data, 1)

        total_correct += (predicted == labels.data).sum().item()

    acc = 1.0 * total_correct / total

    net.train()

    return acc


 def main():

    device = torch.device('cuda')
    dataset_ = GINDataset('MUTAG', False)
    dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
    
    # 1. split dataset [fix split]
    dataids = list(range(len(dataset)))
    random.seed(2021)
    random.shuffle(dataids)
    
    fold = int(len(dataset) * 0.1)
    train_dataset = dataset[dataids[:fold * 8]]
    val_dataset = dataset[dataids[fold * 8: fold * 9]]
    test_dataset = dataset[dataids[fold * 9: ]]

    trainloader = GraphDataLoader(train_dataset, batch_size=32, shuffle=False)
    valloader = GraphDataLoader(val_dataset, batch_size=32, shuffle=False)
    testloader = GraphDataLoader(test_dataset, batch_size=32, shuffle=False)

    accs = []
    for seed in tqdm(range(10)):
        # set up seeds, args.seed supported
        torch.manual_seed(seed=seed)
        np.random.seed(seed=seed)

        model = GIN(
            5, 2, dataset_.dim_nfeats, 64, dataset_.gclasses, 0.5, False,
            "sum", "sum").to(device)

        criterion = nn.CrossEntropyLoss()  # defaul reduce is true
        optimizer = optim.Adam(model.parameters(), lr=0.0001)

        model = train(model, trainloader, valloader, optimizer, criterion, 100, device)
        acc = eval_net(model, testloader, device)
        accs.append(acc)

    print(np.mean(accs), np.std(accs))

 if __name__ == '__main__':
    main()
--- a/test/performance/graph_classification/dgl/model.py
+++ b/test/performance/graph_classification/dgl/model.py
@@ -0,0 +1,192 @@
 """
 Performance check of AutoGL model + DGL (dataset + trainer)
 """

 import os
 os.environ["AUTOGL_BACKEND"] = "dgl"

 from dgl.dataloading.pytorch.dataloader import GraphDataLoader
 import numpy as np
 from tqdm import tqdm

 import random

 import torch
 import torch.nn as nn
 import torch.optim as optim

 from dgl.data import GINDataset

 import torch
 import torch.nn as nn
 from autogl.module.model.dgl.gin import AutoGIN
 from autogl.module.model.dgl.topkpool import AutoTopkpool
 from autogl.solver.utils import set_seed
 import argparse

 class DatasetAbstraction():
    def __init__(self, graphs, labels):
        for g in graphs:
            g.ndata['feat'] = g.ndata['attr']
        self.graphs, self.labels = [], []
        for g, l in zip(graphs, labels):
            self.graphs.append(g)
            self.labels.append(l)
        self.gclasses = max(self.labels).item() + 1
        self.graph = self.graphs
    
    def __len__(self):
        return len(self.graphs)
    
    def __getitem__(self, idx):
        if isinstance(idx, int):
            return self.graphs[idx], self.labels[idx]
        elif isinstance(idx, torch.BoolTensor):
            idx = [i for i in range(len(idx)) if idx[i]]
        elif isinstance(idx, torch.Tensor) and idx.unique()[0].sum().item() == 1:
            idx = [i for i in range(len(idx)) if idx[i]]
        return DatasetAbstraction([self.graphs[i] for i in idx], [self.labels[i] for i in idx])

 def train(net, trainloader, validloader, optimizer, criterion, epoch, device):
    best_model = net.state_dict()
    
    best_acc = 0.
    for e in range(epoch):
        for graphs, labels in trainloader:
            net.train()

            labels = labels.to(device)
            graphs = graphs.to(device)
            outputs = net((graphs, labels))
            # feat = graphs.ndata.pop('attr')
            # outputs = net(graphs, feat)

            loss = criterion(outputs, labels)

            # backprop
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        
        gt = []
        pr = []
        for graphs, labels in validloader:
            labels = labels.to(device)
            graphs = graphs.to(device)
            gt.append(labels)
            # feat = graphs.ndata.pop('attr')
            # outputs = net(graphs, feat)
            outputs = net((graphs, labels))
            pr.append(outputs.argmax(1))
        gt = torch.cat(gt, dim=0)
        pr = torch.cat(pr, dim=0)
        acc = (gt == pr).float().mean().item()
        if acc > best_acc:
            best_acc = acc
            best_model = net.state_dict()
    
    net.load_state_dict(best_model)

    return net

 def eval_net(net, dataloader, device):
    net.eval()

    total = 0
    total_correct = 0

    for data in dataloader:
        graphs, labels = data
        graphs = graphs.to(device)
        labels = labels.to(device)
        # feat = graphs.ndata.pop('attr')
        total += len(labels)
        # outputs = net(graphs, feat)
        outputs = net((graphs, labels))
        _, predicted = torch.max(outputs.data, 1)

        total_correct += (predicted == labels.data).sum().item()

    acc = 1.0 * total_correct / total

    net.train()

    return acc


 def main(args):

    device = torch.device(args.device)
    dataset_ = GINDataset(args.dataset, False)
    dataset = DatasetAbstraction([g[0] for g in dataset_], [g[1] for g in dataset_])
    
    # 1. split dataset [fix split]
    dataids = list(range(len(dataset)))
    random.seed(args.dataset_seed)
    random.shuffle(dataids)
    
    fold = int(len(dataset) * 0.1)
    train_dataset = dataset[dataids[:fold * 8]]
    val_dataset = dataset[dataids[fold * 8: fold * 9]]
    test_dataset = dataset[dataids[fold * 9: ]]

    trainloader = GraphDataLoader(train_dataset, batch_size=args.batch_size, shuffle=False)
    valloader = GraphDataLoader(val_dataset, batch_size=args.batch_size, shuffle=False)
    testloader = GraphDataLoader(test_dataset, batch_size=args.batch_size, shuffle=False)

    accs = []
    for seed in tqdm(range(args.repeat)):
        # set up seeds, args.seed supported
        set_seed(seed)

        if args.model == 'gin':
            model = AutoGIN(
                num_features=dataset_.dim_nfeats,
                num_classes=dataset_.gclasses,
                device=device,
            ).from_hyper_parameter({
                "num_layers": 5,
                "hidden": [64],
                "dropout": 0.5,
                "act": "relu",
                "eps": "False",
                "mlp_layers": 2,
                "neighbor_pooling_type": "sum",
                "graph_pooling_type": "sum"
            }).model
        elif args.model == 'topkpool':
            model = AutoTopkpool(
                num_features=dataset_.dim_nfeats,
                num_classes=dataset_.gclasses,
                device=device,
            ).from_hyper_parameter({
                "num_layers": 5,
                "hidden": [64],
                "dropout": 0.5
            }).model

        model = model.to(device)

        criterion = nn.CrossEntropyLoss()  # defaul reduce is true
        optimizer = optim.Adam(model.parameters(), lr=args.lr)

        model = train(model, trainloader, valloader, optimizer, criterion, args.epoch, device)
        acc = eval_net(model, testloader, device)
        accs.append(acc)

    print('{:.4f} ~ {:.4f}'.format(np.mean(accs), np.std(accs)))

 if __name__ == '__main__':
    parser = argparse.ArgumentParser('model parser')
    parser.add_argument('--device', type=str, default='cuda')
    parser.add_argument('--dataset', type=str, choices=['MUTAG', 'COLLAB', 'IMDBBINARY', 'IMDBMULTI', 'NCI1', 'PROTEINS', 'PTC', 'REDDITBINARY', 'REDDITMULTI5K'], default='MUTAG')
    parser.add_argument('--dataset_seed', type=int, default=2021)
    parser.add_argument('--batch_size', type=int, default=32)
    parser.add_argument('--repeat', type=int, default=50)
    parser.add_argument('--model', type=str, choices=['gin', 'topkpool'], default='gin')
    parser.add_argument('--lr', type=float, default=0.0001)
    parser.add_argument('--epoch', type=int, default=100)

    args = parser.parse_args()

    main(args)