ML之FE:特征工程处理中常用的数据变换(log取对数变换等)之详细攻略

ML之FE:特征工程处理中常用的数据变换(log取对数变换等)之详细攻略


特征工程处理中常用的数据变换(log取对数变换等)之详细攻略

log取对数变换

意义:取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度。让方差恒定,即让波动相对稳定,消除异方差问题。

import numpy as np
import pandas as pd

array_data=np.array([[1,  2,  3,  4,  5],
                    [0.1,0.2,0.3,0.4,0.5])
print(array_data.shape)

array_data2log = -np.log(array_data)  # 取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度。让方差恒定,即让波动相对稳定。消除异方差问题
print(array_data2log)
dis = np.sqrt(array_data2log)
print(dis)

更新……

(0)

相关推荐