반응형
위의 dataframe의 전처리 작업을 위해 아래와 같이 코드를 작성하였다.
코드는 dataframe 내의 모든 셀들을 특정 threshold 이상이면 None을 주고 나머지 값들은 살려두려고 한다.
즉, threshold 이상의 값이면 None 값으로 replace 한다는 뜻이다.
기존에는 이중포문으로 시행을 했었으며, 출력된 시간을 확인하면 시간이 꽤 소요된다는것을 알 수 있다.
pandas의 boolean indexing 이라는 것을 확인했다.
위와 같이 변경했으며, 현저하게 빠른 속도로 처리했음을 확인했다.
반응형