diff --git a/README.md b/README.md index 4bd44ed4..b1232381 100644 --- a/README.md +++ b/README.md @@ -3,6 +3,7 @@ DataCollector项目主要介绍NLP预训练模型训练数据集资源、数据清洗过滤方法。 [[网页数据介绍及清洗过滤方法](#网页数据介绍及清洗过滤方法)] + - Common Crawl介绍 - Common Crawl数据格式 @@ -16,6 +17,7 @@ [[加入鹏程·PanGu-α微信交流群](#微信交流群)]