julia coding story

머신러닝 기초 개념-05. feature engineering (1) 본문

카테고리 없음

머신러닝 기초 개념-05. feature engineering (1)

julia-biolat 2023. 5. 9. 00:57
728x90

Source : https://developers.google.com/machine-learning/crash-course/representation/feature-engineering

RECAP

  • 데이터 마트까지 구성된 데이터를 input vector라고 부릅니다. (정형화 되어 있는 수치들)
  • 이 input vector를 머신러닝 모델에 사용할 feature vector 로 바꾸는 작업이 feature engineering입니다.
  • feature vector란 input vector에서 머신러닝 모델이 보아야할 특징(feature)를 정의한 수치값들입니다.
  • feature engineering에 따라 머신러닝 모델의 성능이 굉장히 크게 변할 수 있습니다.
  • feature engineering을 할 때 체크해야 하는 사항들을 중점적으로 확인해야 합니다.
  • feature vector가 표현되는 공간을 feature space라고 합니다.

Source : https://freecontent.manning.com/the-computer-vision-pipeline-part-4-feature-extraction/

  • feature engineering을 통해서 input data는 P(performance measure)를 높일 수 있는 수치 정보로 변환이 된다.
  • 이러한 수치 정보(feature vector)를 만드는 방법을 feature extraction algorism이라고 한다.
  • 대표적인 feature extraction algorithm에는 PCA(Principlal Compoent Analysis), AutoEncoder등이 있다.
  • 이미지, 텍스트 같은 특정 도메인에 있는 데이터를 해당 도메인의 특성에 맞게 feature extraction 방법을 발전되어 왔다.
    • 데이터 마트까지 구성된 데이터를 input vector라고 부릅니다. (정형화 되어 있는 수치들)
    • 이 input vector를 머신러닝 모델에 사용할 feature vector 로 바꾸는 작업이 feature engineering입니다.
    • feature vector란 input vector에서 머신러닝 모델이 보아야할 특징(feature)를 정의한 수치값들입니다.
    • feature engineering에 따라 머신러닝 모델의 성능이 굉장히 크게 변할 수 있습니다.
    • feature engineering을 할 때 체크해야 하는 사항들을 중점적으로 확인해야 합니다.
    • feature vector가 표현되는 공간을 feature space라고 합니다.최근에는 Deep Learning을 사용하여 새롭게 feature를 생성하는 임베딩(Embedding)(원본 회손하지 않고 수축하는 것)방식을 사용합니다.Source : https://developers.google.com/machine-learning/crash-course/representation/feature-engineering
    • feature engineering을 통해서 input data는 P(performance measure)를 높일 수 있는 수치 정보로 변환이 된다.
    • 이러한 수치 정보(feature vector)를 만드는 방법을 feature extraction algorism이라고 한다.
    • 대표적인 feature extraction algorithm에는 PCA(Principlal Compoent Analysis), AutoEncoder등이 있다.
    • 이미지, 텍스트 같은 특정 도메인에 있는 데이터를 해당 도메인의 특성에 맞게 feature extraction 방법을 발전되어 왔다.
    • 최근에는 Deep Learning을 사용하여 새롭게 feature를 생성하는 임베딩(Embedding)(원본 회손하지 않고 수축하는 것)방식을 사용합니다
  • Source : https://freecontent.manning.com/the-computer-vision-pipeline-part-4-feature-extraction/
  • RECAP