본문 바로가기
ML

머신러닝 2_2 (사이킷런 기반프레임워크)

by haribodang 2022. 4. 22.
반응형

- 지도학습

  • Estimator : 지도학습의 모든 알고리즘을 구현한 클래스
  • ~Classifier 분류(Classification) 알고리즘이 구현된 클래스
    • DecisionTreeClassifier
    • RandomForestClassifier
    • GradientBoostingClassifier
    • GaussianNB
    • SVC
  • ~Regressor 회귀(Regression) 알고리즘이 구현된 클래스
    • LinearRegression
    • Ridge
    • Lasso
    • RandomForestRegressor
    • GradientBoostingRegressor
  • fit() 지도학습 알고리즘을 학습시킬 때 사용되는 메서드
  • predict() 지도학습 알고리즘을 이용하여 예측을 할 때 사용되는 메서드

- 비지도학습

  • 차원 축소
  • 클러스터링
  • 피처 추출(Feature Extraction)
  • fit() 입력 데이터의 형태에 맞춰 데이터를 변환하기 위하나 사전 구조를 맞추는 작업
  • transform() 입력 데이터의 차원 변환, 클러스터링, 피처 추출 등의 실제 작업을 수행
  • fit_transform() fit()과 transform()을 하나로 결합한 메서드


iris_data = load_iris()
print(type(iris_data))
#<class 'sklearn.utils.Bunch'> Bunch클래스는 파이썬 딕셔너리 자료형과 유사



keys = iris_data.keys()
print('붓꽃 데이터 세트의 키들:', keys)


키는 보통 data, target, target_name, feature_names, DESCR로 구성돼 있습니다.
개별 키가 가리키는 의미는 다음과 같습니다.
* data는 피처의 데이터 세트를 가리킵니다. 넘파이 배열(ndarray) 타입
* target은 분류 시 레이블 값, 회귀일 때는 숫자 결과값 데이터 세트입니다.넘파이 배열(ndarray) 타입
* target_names는 개별 레이블의 이름을 나타냅니다.넘파이 배열(ndarray) 또는 파이썬 리스트(list) 타입
* feature_names는 피처의 이름을 나타냅니다.넘파이 배열(ndarray) 또는 파이썬 리스트(list) 타입
* DESCR은 데이터 세트에 대한 설명과 각 피처의 설명을 나타냅니다.(string) 타입

print('\n feature_names 의 type:',type(iris_data.feature_names))
print(' feature_names 의 shape:',len(iris_data.feature_names))
print(iris_data.feature_names)


반응형

'ML' 카테고리의 다른 글

머신러닝 2_5 데이터 전처리(Preprocessing)  (0) 2022.04.28
머신러닝 2_4 교차검증  (0) 2022.04.28
머신러닝 2_3 ModelSelection  (0) 2022.04.22
머신러닝 2_1  (0) 2022.04.21

댓글