1
2
|
import warnings
warnings.filterwarnings("ignore")
|
-
取消科学技术法()
np.set_printoptions(suppress=True)
-
保留3位有效数字
np.set_printoptions(precision=3)
-
数组扁平
data.flatten()
-
填充NAN
a[np.isnan(a)]=1
-
判断一列是否有缺失值
np.isnan(data).any(axis=0)
-
判断一行是否有缺失值
np.isnan(data).any(axis=1)
-
显示所有列
pd.set_option('display.max_columns', None)
-
显示所有行
pd.set_option('display.max_rows', None)
-
取消科学技术法
pd.set_option('display.float_format', lambda x: '%.3f' % x)
-
时间戳转正常时间
pd.to_datetime(时间戳 ,unit='ms') # ms是毫秒
-
分组求最大值所在行
.idxmax()
-
按某列排序
df.sort_values(by="sales",ascending=False)
-
每个样本多少次
value_counts()
-
按索引排序
sort_index()
-
重置索引
.reset_index()
-
按列统计缺失值
df.isna().sum()
-
获得一个分组
get_group("分组名字")
-
条件筛选
mask 满足条件赋值为指定值
-
描述数据
data.describe
最大最小归一化
from sklearn.preprocessing import MinMaxScaler
- 范围参数 feature_range=(0, 1)
- 转化 fit_transform
- 反转化 inverse_transform
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
时间戳转日期
=TEXT((B2/1000+83600)/86400+70365+19,"yyyy-mm-dd hh:mm:ss")