전체 글90 [머신러닝] 랜덤 포레스트 (Random Forest) 개념 및 예제 실습 / 독버섯 예제 랜덤 포레트스 랜덤 포레스트 - Random Forest 집단 학습을 기반으로 고정밀 분류, 회귀, 클러스트링 구현 학습 데이터로 다수의 의사결정 트리를 만들고 그 결과의 다수결 결과 유도로 높은 정밀도 무작위 샘플링과 다수의 의사결정 트리 => Random Forest 결정 트리(Decision Tree) 분류(Classification)와 회귀(Regression) 모두 가능한 지도 학습 모델 중 하나 결정 트리는 스무고개 하듯이 예/아니오 질문을 이어가며 학습 한 번의 분기 때마다 변수 영역을 두 개로 구분 매, 펭귄, 돌고래, 곰을 구분한다고 생각해보자 Terminal Node는 LeafNode 라고도 함 프로세스 1. 데이터를 가장 잘 구분할 수 있는 질문을 기준으로 나누기 2. 나뉜 각 범주에.. 2020. 7. 24. [머신러닝] 서포트 벡터 머신(SVM) 예제 실습 / BMI 예제 / LinearSVC 2020. 7. 24. [머신러닝] 서포트 벡터 머신 (SVM) 개념 머신러닝 서포트 벡터 머신(SVM) - Support Vector Machine 다양한 연구를 통해 굉장히 높은 인식 성능 발휘 선을 구성하는 매개변수를 조정해서 요소의 구분선을 찾고 이른 기반으로 패턴 인식 주어진 데이터가 어느 카테고리에 속할지 판단하는 이진 선형 분류 모델 서포트 벡터 머신 (SVM) 개념 빨간 X와 파란 O를 구분 하는 선 중 두 데이터를 잘 구분한 선은? (SVM 알고리즘의 매개변수를 조절해서 선을 그림) Margin의 최대화 가운데 선이 Margin을 최대화 Margin은 선과 가장 가까운 양 옆 데이터와의 거리 서포트 벡터(Support Vector) : 선과 가장 가까운 데이터 Margin은 선과 서포트 벡터와의 거리 Descision Boundary : 데이터 구분하는 선.. 2020. 7. 24. [머신러닝] 데이터 전처리 / 레이블인코딩 / 원-핫 인코딩 / LabelEncoder / 피처 스케일링 / 붓꽃 데이터 2020. 7. 23. 이전 1 ··· 4 5 6 7 8 9 10 ··· 23 다음