[CodesSates] AI 부트캠프

Feature Engineering

웅탈 2021. 3. 5. 17:51

Feature Engineering

 

Undifined / Nan / Null 차이점
  • Undifined : 선언은 되었으나 값이 할당 되지 않은 상태
  • Nan : 숫자가 아니다
  • Null : 아무런 값도 나타내지 않는 특수한 값

 

데이터 불러오기
  • 'header = None' : 데이터의 첫 행이 나오지 않을 때 사용
  • 'Thound' = ',' : 불러올 때 천 단위 마침표 제거
  • 'names = ' : 불러올 coulmns 지정
문자열 변경
  • replace('대상문자',  '변환문자')
  • re.sub('text',  '대상문자', '변환문자')
  • table = str.maketrans('대상문자','변환문자') 만든 후 'text'.translate(table)로 변환
DataFrmae 생성
raw = {'구분' : ['18년','19년'],
       '종가' : [101500,93800],
       '발행주식수' : [137292497,137292497],
       '시가총액' : [13935188445500,12878036218600],
       '시장점유율' : [0.62,0.635],
       '시장규모' : [15000000000000,15000000000000]}
df2 = pd.DataFrame(raw)

{} : 딕셔너리 형식

 

시각화 할 때 뜨는 이상한 메세지 제거
import warnings
warnings.filterwarnings("ignore") # warnings 뭐시기무시기
plt.show() # figure 뭐시기뭐시기

 


아직까지는 내가 아는 내용에서 과제가 나와서 매우 수월하다. 하지만, 점점 어려워지면 어떻게 될지 걱정되면서도 재미있음! 

그리고 자기주도형 학습 + 매일 과제를 하는 실습중심 수업이 매우 Good!

디스코드에서 같이 듣는 동기들 끼리 과제에 대해 토론하는데 다들 너무 착하심... 본받도록 하자!

 

<주의사항>

1. 앞으로는 에러 메시지가 뜨면 그 내용도 블로깅 해서 정리하도록

 

2. 과제가 일찍 끝나면 예습 복습을 하던 네이버 부스트 코스 공부를 하던 놀지말자

 

3. 내꺼 다했다고 만족하지 말고 모르는 사람 도우며 다시한번 내용 되새기자 

 

4. 블로그엔 아는거 말고 모르는 거만 블로깅하기

 

5. Google에 검색하면 다 있다 ㄹㅇ

 

'[CodesSates] AI 부트캠프' 카테고리의 다른 글

Hypothesis Test  (0) 2021.03.14
Hypothesis Test  (0) 2021.03.14
Data Visualize  (0) 2021.03.09
Data Manipulation  (0) 2021.03.09
EDA  (0) 2021.03.04