목록전체 글 (93)
julia coding story
💡 loss function : 모델의 inference 결과와 실제값 사이의 틀린 정도를 계산하는 함수 Source : https://datahacker.rs/003-pytorch-how-to-implement-linear-regression-in-pytorch/ hat y(예측값 predicted value)와 y(traget value) 사이의 차이를 계산해주는 함수. 덜 틀릴 수록(= 차이가 적을 수록) 학습을 잘한 것 그럼 Loss function의 결과에 영향을 주는 변수는 무엇일까? → parameter (weight) Loss function의 결과가 가장 작아질 수 있는 parameter를 찾는 것이 학습의 목표 Loss Function Optimization Source : https:..
💡 inference : 학습된 머신러닝 모델에 test data를 넣어서 결과를 내는 것 = 파라미터랑 weight를 고정시키고 평가하는 것 학습된 모델과 test data가 있어야 가능 inference에서는 학습이 일어나지 않음 = 오답정리 X y = wx + b 라고 하면, w와 b가 직선을 결정합니다. w와 b는 이미 학습과정에서 결정됨 정해진 모델에 “평가”만 이루어짐 이 때는 객관성을 유지하기 위해서 training data가 아닌 test data를 사용함 우리의 학습 목표는 inference의 성능이 높아지길 기대하는 것 → “Prediction for Unseen data” Hands-on 앞에서 들었던 족보 예시를 통해서 생각해 봤을 때, training data와 test data가..
Source : https://developers.google.com/machine-learning/crash-course/representation/feature-engineering RECAP 데이터 마트까지 구성된 데이터를 input vector라고 부릅니다. (정형화 되어 있는 수치들) 이 input vector를 머신러닝 모델에 사용할 feature vector 로 바꾸는 작업이 feature engineering입니다. feature vector란 input vector에서 머신러닝 모델이 보아야할 특징(feature)를 정의한 수치값들입니다. feature engineering에 따라 머신러닝 모델의 성능이 굉장히 크게 변할 수 있습니다. feature engineering을 할 때 체크해야..
💡 training : 머신러닝 모델이 데이터의 패턴을 파악하는 과 어떤 모델을 사용하느냐에 따라서, 학습되는 정보가 다름 데이터를 보고 정해진 기준에 따라서 정보를 학습함 학습된 정보를 기준으로 판단(=예측)을 한다. 판단한 내용으로 성능을 평가함. 평가한 성능이 점차 향상되어야 함 앞에서 보았던 그림을 예시로 들면, 빨간 선이 노란 선으로 바뀌어 가는 과정이라고 볼 수 있습니다. (조금 자세히) $y = wx + b$ 라고 하면, w와 b가 직선을 결정합니다. (앞에서 이러한 변수들을 parameter라고 불렀습니다.) 어떤 모델을 사용하느냐에 따라서, 학습되는 정보가 다름 데이터를 보고 정해진 기준에 따라서 정보를 학습함 학습된 정보를 기준으로 판단(=예측)을 한다. 판단한 내용으로 성능을 평가함...
💡 data split : 학습에 사용할 데이터와 평가를 할 때 사용할 데이터를 나누는 방법 data split : train-test split을 이야기함(test/ test 데이터를 겹치지 않음) training data는 학습에 사용하고, test data는 평가에 사용함 직관적인 설명을 위해 예시를 하나 가정하겠습니다. 우리는 2022년 “머신러닝” 과목의 기말고사는 100점 맞고 싶습니다. 우리에겐 10년치 족보 문제와 답안이 함께 있습니다. (완벽한 답안이라고 가정합니다) 기말고사를 100점 맞기 위해서 어떻게 공부 방법을 설계하는 것이 좋을까요? 8년치를 열심히 공부하고(오답정리), 2년치는 시험 직전 날에 풀기 → train - test split 6년치 열심히 공부하고(오답정리), 그 때..
💡 머신러닝(Machine Learning) : Definition (from Wiki) “A Computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E.” 머신러닝이란, 경험 E를 통해서 주어진 T에 대해 P로 측정한 값이 향상되는 프로그램 우리가 공부한 것과 비슷함. 특정 과목 기말고사에서 주어진 족보를 풀어 기말고사 점수가 향상되는 과정을 학습이라고 함. 이 과정을 수학적으로 주어진 입력(X)와 찾으려는 값(y) ..
▶COMMIT : 삽입, 갱신, 삭제를 완전히 데이터베이스에 기록하는 것 ▶ROLLBACK : 이전 작업으로 돌아감 ▶INSERT : 테이블에 데이터를 입력한다. DROP TABLE IF EXISTS TB_LINK; CREATE TABLE TB_LINK ( LINK_NO INT PRIMARY KEY , URL VARCHAR(255) NOT NULL , LINK_NM VARCHAR(255) NOT NULL , DSCRPTN VARCHAR (255) , LAST_UPDATE_DE DATE ); COMMIT; INSERT INTO TB_LINK (LINK_NO, URL, LINK_NM, DSCRPTN, LAST_UPDATE_DE) VALUES (1, 'www.fastcampus.co.kr', '패스트캠퍼스',..