Python 常忘函数

忽略警告

import warnings
warnings.filterwarnings("ignore")

Numpy

  • 取消科学技术法() np.set_printoptions(suppress=True)

  • 保留3位有效数字 np.set_printoptions(precision=3)

  • 数组扁平 data.flatten()

  • 填充NAN a[np.isnan(a)]=1

  • 判断一列是否有缺失值 np.isnan(data).any(axis=0)

  • 判断一行是否有缺失值 np.isnan(data).any(axis=1)

Pandas

  • 显示所有列 pd.set_option(‘display.max_columns’, None)

  • 显示所有行 pd.set_option(‘display.max_rows’, None)

  • 取消科学技术法 pd.set_option(‘display.float_format’, lambda x: ‘%.3f’ % x)

  • 时间戳转正常时间 pd.to_datetime(时间戳 ,unit=‘ms’) # ms是毫秒

  • 分组求最大值所在行 .idxmax()

  • 按某列排序 df.sort_values(by=“sales”,ascending=False)

  • 每个样本多少次 value_counts()

  • 按索引排序 sort_index()

  • 重置索引 .reset_index()

  • 按列统计缺失值 df.isna().sum()

  • 获得一个分组 get_group(“分组名字”)

  • 条件筛选 mask 满足条件赋值为指定值

  • 描述数据 data.describe

Matplotlib

  • 中文字体显示不出来 plt.rcParams[‘font.sans-serif’]=[‘Microsoft YaHei’]

  • 图紧凑 plt.tight_layout()

  • 加一条线

    • 水平线 ax.axhline(y, linestyle='–', color=‘k’) #

    • 垂直线 ax.axvline(x, linestyle='–', color=‘k’)

  • 魔术命令

    • magic有行魔法%time 和单元魔法%%time
  • 坐标轴标签旋转 plt.xticks(rotation=50)

Sklearn

  • 最大最小归一化 from sklearn.preprocessing import MinMaxScaler
    • 范围参数 feature_range=(0, 1)
    • 转化 fit_transform
    • 反转化 inverse_transform

其他

  • ssh 验证失败
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

Excel

  • 时间戳转日期 =TEXT((B2/1000+83600)/86400+70365+19,“yyyy-mm-dd hh:mm:ss”)