부스트코스

결측치: 측정되지 않은 수치, 무언가의 이유로 인해 측정/기록되지 않은 수치를 말한다. 본 포스팅에서는 인공지능 학습 데이터셋의 결측치를 다루고자 한다. 일반적으로 결측치는 np.nan 으로 표기된다. np.nan이 열마다 얼마나 확인하기 위해서 df.info()를 사용하며, 결과 예시는 다음과 같다. 상단의 표를 보면, 18번째 열인 "TotalCharges"에 11개의 null 값이 있다는 것을 확인할 수 있다. 그런데, 이게 결측치의 전부일까? 😈 1. number 결측치 찾아내기 첫 번째로, df.describe()을 실행한다. 이 함수는 숫자 계열의 데이터들의 평균, 편차, 중위값 등을 알려주는데 EDA(Exploraatory Data Analysis)적인 관점이 필요하다. tenure는 통신사..
inthree3
'부스트코스' 태그의 글 목록