본문 바로가기

Python/파이썬 기초

dataframe 이중 for문 없애기

반응형

 

 

위의 dataframe의 전처리 작업을 위해 아래와 같이 코드를 작성하였다.

 

 

코드는 dataframe 내의 모든 셀들을 특정 threshold 이상이면 None을 주고 나머지 값들은 살려두려고 한다.

즉, threshold 이상의 값이면 None 값으로 replace 한다는 뜻이다.

 

기존에는 이중포문으로 시행을 했었으며, 출력된 시간을 확인하면 시간이 꽤 소요된다는것을 알 수 있다.

 

pandas의 boolean indexing 이라는 것을 확인했다.

 

 

pandas documentation

 

 

 

 

위와 같이 변경했으며, 현저하게 빠른 속도로 처리했음을 확인했다.

반응형

'Python > 파이썬 기초' 카테고리의 다른 글

이미지 회전시키기  (0) 2020.10.09
함수-1  (0) 2020.01.23
입력과 출력-2  (0) 2020.01.22
입력과 출력-1  (0) 2020.01.21
제어문-2  (0) 2020.01.21