tabular data
-
Tabular Data Augmentations인공지능(Artificial Intelligence)/기계학습(Machine Learning) 2022. 6. 27. 00:37
Tabular Data Augmentations 표 데이터 증강 이미지나 가끔은 텍스트/시계열 데이터에서 데이터 증강이 효과적임을 보곤한다. 강아지 이미지가 회전을 하더라도 강아지이고, 신경망은 이를 이해할 수 있다. 하지만 tabular data를 다룰 때는 상황이 약간 달라진다. table을 회전하거나 확대/축소를 할 수는 없으니. 그렇다면 뭘 해야할까? Simple Noise (Jitter) 간단히 말해서, columns 그 자체에 노이즈를 추가 할 수 있다. 이 방식에서 간단한 개선 사항을 생각한다면, 노이즈를 추가하려 할 때 columns의 표준편차(std)를 고려하는 것이다. Swap Noise 과거에 여러 번 사용되었다. (1), (2) 이 방법은 같은 feature column에 있는 값을..