直接下载(强烈推荐)
我已经传到CSDN上去了,不需要积分,点击出发
数据集说明如下所示: https://imbalanced-learn.org/stable/datasets/index.html#imbalanced-datasets-for-benchmark
最简单的使用
- 安装imblearn库
pip install imblearn
- 下载你需要的数据集
数据集信息,可以从这里查看(https://imbalanced-learn.org/stable/datasets/index.html)
from imblearn.datasets import fetch_datasets
import pandas as pd
name = "数据集名字"
data = fetch_datasets()['name]
data.to_csv(f"{name}.csv",index=False)
KEEL数据集的使用(不太推荐)
- 首先去官网: http://www.keel.es/
然后红框中的都是数据集的种类,都是可以下载的
这里我点击Standard classification data sets (76)
这个链接
- 如何下载?
- 如何使用
3.1 如果你用的是matlab应该可以直接使用
3.2 如果你用的是python,还需要把这个文件转换为.csv
文件
- 转换文件
转换文件需要KEEL软件
,点我去下载,免费
然后解压文件,进入文件夹,在文件夹中执行下面的命令(需要提前安装java才能运行文件)
java -jar ./dist/GraphInterKeel.jar
运行软件后,点击这个
接下来,点击这个
接下来,点击这个
接下来,点击这个
最后点save
,然后指定你保存的位置就可以了
如果你想将数据集中的文本全部映射成数字,可以执行下面的python代码,(记得替换数据集的名字)
|
|