본문 바로가기

Python/머신러닝8

[머신러닝] 텍스트 데이터 분석 TEST - 네이버 지식인에서 '남자친구 선물' 크롤링 후 자연어 분석 1. 텍스트 데이터 변환하기 - 말뭉치 엔진 '꼬꼬마', '한나눔', 'tweeter(Okt)' 를 이용해 '대한민국의 영토는 한반도와 그 부속도서로 한다' 분석 2. '남자 친구 선물' 을 네이버에서 검색하여 10 * 1000개의 지식인 페이지의 데이터를 크롤링한 뒤 분석. - wordcloud 그리기 - word2vector 사용 최다 빈도수의 most_similar 구하기 2020. 7. 27.
[머신러닝] Kaggle - 타이타닉 생존자 분석 캐글 업로드! 2020. 7. 27.
[머신러닝] 랜덤 포레스트 (Random Forest) 개념 및 예제 실습 / 독버섯 예제 랜덤 포레트스 랜덤 포레스트 - Random Forest 집단 학습을 기반으로 고정밀 분류, 회귀, 클러스트링 구현 학습 데이터로 다수의 의사결정 트리를 만들고 그 결과의 다수결 결과 유도로 높은 정밀도 무작위 샘플링과 다수의 의사결정 트리 => Random Forest 결정 트리(Decision Tree) 분류(Classification)와 회귀(Regression) 모두 가능한 지도 학습 모델 중 하나 결정 트리는 스무고개 하듯이 예/아니오 질문을 이어가며 학습 한 번의 분기 때마다 변수 영역을 두 개로 구분 매, 펭귄, 돌고래, 곰을 구분한다고 생각해보자 Terminal Node는 LeafNode 라고도 함 프로세스 1. 데이터를 가장 잘 구분할 수 있는 질문을 기준으로 나누기 2. 나뉜 각 범주에.. 2020. 7. 24.
[머신러닝] 서포트 벡터 머신(SVM) 예제 실습 / BMI 예제 / LinearSVC 2020. 7. 24.