Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 링글
- 영어시험
- 소통챌린지
- 영어공부
- 영어로전세계와소통하기
- 영어공부법
- #링글후기
- #영어공부
- Ringle
- 뉴노멀챌린지
- CommunicateWiththeWorld
- 링글커리어
- 성내동장어
- #영어발음교정
- 총각네장어
- 강동구장어맛집
- 해외취업컨퍼런스
- #체험수업
- #링글
- 오피스밋업
- #nlp
- 장어랑고기같이
- #직장인영어
- #Ringle
- 영어회화
- 둔촌역장어
- 스몰토크
- 화상영어
- 링글리뷰
- 링글경험담
Archives
- Today
- Total
목록Kaggle (1)
Soohyun’s Machine-learning
Tabular Playground Series - Apr 2021 후기
데이터 특성 1) 기존의 타이타닉 생존 데이터를 기반으로, CTGAN으로 인위적으로 생성한 데이터(10만) 2) 1번 때문인지 실제 현실에서는 불가능한 데이터들이 껴 있었다 (e.g. 승선한 가족 사이즈가 수십명이거나..) Preprocessing & EDA (+ Pseudo labels) 1) 결측치 처리 : 데이터 자체의 비현실성이 컸고, 실제 타이타닉 데이터의 칭호처럼 레퍼런스할 수 있는 항목도 없었으므로, 결측치는 해당 칼럼의 mean값이나 median 값으로 그냥 채워주었다 (뭘로 하든 결과에서 유의미한 차이를 느끼지 못했음) 2) feature 생성 : FamilySize 외에는 만들지 않았다 3) 다른 캐글러가 트레이닝 셋으로 모델을 트레이닝하고, 다시 트레이닝 + 테스트를 섞어서 얻어낸 결..
Kaggle
2021. 5. 3. 16:52