본문 바로가기

728x90
반응형

전체 글

(59)
[GCP] 구글 클라우드 플랫폼 웹 서버 구축 (1) 1. 구글 클라우드 플랫폼(GCP) 로그인 구글 클라우드 플랫폼 이하 GCP는 구글에서 개발한 클라우드 컴퓨팅 플랫폼입니다. 아파치나, NGINX 등을 사용해 서버를 구축하고 웹 사이트를 서비스할 수 있습니다. 24시간 서버를 운영 가능하며, 안정성이 준수합니다. 또한 AWS와 같은 플랫폼에 비해 직관적이고 사용이 쉽다는 장점이 있습니다. 아래 링크로 이동하여 구글에 로그인 해줍시다. 클라우드 컴퓨팅 서비스 | Google Cloud 클라우드 컴퓨팅 서비스 | Google Cloud 데이터 관리, 하이브리드 및 멀티 클라우드, AI와 머신러닝 등 Google의 클라우드 컴퓨팅 서비스로 비즈니스 당면 과제를 해결하세요. cloud.google.com 로그인을 마쳤다면 무료로 시작하기를 클릭합니다. 서비스 ..
[파이썬] Ridge,Lasso Regression and Confusion matrix 1. Ridge, Lasso Regression Bias는 예측 값(prediction)과 실제 값(actual value, target)의 차이입니다. Bias는 값을 예측하기 위한 모델(회귀, 분류)에 중요한 정보를 충분하게 제공하지 못한 경우 값이 커지게 됩니다. 학습데이터가 적은 경우, 비선형 데이터에 선형 모델을 적용할 경우 Bias값이 커지며 이는 Underfitting이라고 할 수 있습니다. Variance는 데이터 변동에 대한 모델의 민감도로, 모델이 불필요한 데이터(noise)까지 학습하는 경우 Variance가 커지게 됩니다. Overfitting의 경우이며 학습에 적용된 데이터에 대한 예측은 정확하지만, 학습에 사용되지 않은 데이터(test/validation data)에 대한 예측은..
[파이썬] 딥러닝 BGD_SGD 1. BGD BGD는 Batch Gradient Descent로 모든 학습 데이터의 loss를 누적한 뒤, 가중치를 update합니다. 1 epoch에 대한 가중치 update 횟수는 1회이며, 계산량이 매우 많고 많은 메모리가 필요합니다. Global optimal 수렴에 안정적이나, local optimal에 수렴되면 탈출이 어렵다는 단점이 있습니다. epoch은 전체 학습데이터 셋에 대해 한 번 학습을 완료한 상태를 뜻하며, batch는 나누어진 데이터 셋을 뜻 합니다. BGD를 파이썬으로 구현하면 다음과 같습니다. 먼저 필요한 라이브러리를 불러옵니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt 데이터 셋을 불러옵니..
[linux] 리눅스 쉘 스크립트 반복문 1. for~in 리눅스 쉘 스크립트에서 반복문은 for~in문이 있습니다. 변수에 각각의 값을 넣은 후 do 안에 있는 '반복할 문장'을 실행해 값의 개수만큼 반복을 실행합니다. virtual box에서 리눅스를 실행하고 터미널을 실행합니다. vi forin.sh를 실행해 vi 에디터를 열고 다음 명령어를 입력합니다. #!/bin/sh hap=0 for i in 1 2 3 4 5 6 7 8 9 10 do hap=`expr $hap + $i` done echo "1부터 10까지의 합: "$hap exit 0 3행은 i 변수에 1부터 10을 넣어 5행을 10번 실행한다는 뜻입니다. 5행은 hap에 i 변수의 값을 누적시킵니다. 다음 vi forin2.sh로 다음 명령어를 입력합니다. #!/bin/sh fo..
[파이썬] MLP-Backpropagation 1. Backpropagation(역전파 알고리즘) Artificial neural network의 layer와 neuron의 수가 많아지고, 입력과 출력의 수가 많아질 수록 gradient descent를 통해 최적의 w와 b를 찾기 위한 계산량이 매우 많아집니다. (가중치 개수 만큼의 cost function이 중복 계산되어야 함) Cost function은 w와 b로 구성되어 있으므로, 출력 layer로부터 입력 layer쪽으로(역방향), 순차적으로 cost function에 대한 편미분을 구하고, 해당 편미분 값을 이용해 w와 b 값을 갱신합니다. Backpropagation의 단계는 다음과 같습니다. Forward propagation(정방향)과정을 통해 input을 마지막 output laye..
[파이썬] Polynomial linear-regression 1. Polynomial linear-regression Polynomial linear-regression을 알아보기 전 Overfitting과 Underfitting에 대해 알아보겠습니다. 과적합(Overfitting)은 학습을 수행할 때 사용한 데이터 집합에만 매우 정확하게 일치하고, 학습데이터 외의 새로운 데이터에는 잘 들어맞지 않는 상태이며, 일반화가 제대로 되지 않았다는 것을 의미합니다. 과소적합(Underfitting)은 이와 반대로 학습이 지나치게 덜 이루어져 학습 데이터를 통해서도 좋은 결과를 보이지 못하는 상태입니다. Polynomial linear regression은 선형 관계에 가까운 독립변수와 종속변수에 대해서는 선형회귀 모델이 충분히 좋은 해답이 될 수 있으나, 두 변수의 관계..
[linux] 리눅스 원격 접속 서버 1. 텔넷 서버 리눅스에서 원격 접속을 하려면 리눅스 서버에 텔넷 서버를 설치하고 원격자 PC에는 텔넷 클라이언트 프로그램을 설치해야 합니다. 전통적인 원격 접속 방법인 텔넷은 보안에 취약하기 때문에 최근에는 보안 기능을 추가하여 사용합니다. 원격자의 PC(텔넷 클라이언트)에서는 리눅스 서버에 접속하면 서버에서 직접 텍스트 모드로 작업하는 것과 동일하게 작업이 가능합니다. 텔넷 서버를 구축하는 과정은 다음과 같습니다. 서버 1. 텔넷 서버 설치 2. 설정 파일 편집 3. 텔넷 전용 사용자 생성 4. 텔넷 서비스 가동 클라이언트 1. 클라이언트에서 접속 2. 방화벽 설정(포트 열기) 3. 텔넷 서비스 접속 리눅스에서 터미널을 열고 다음 명령어로 패키지를 설치합니다. sudo apt-get -y instal..
[파이썬] Perceptron Gradient Descent 1. Cost function 신경망에서의 학습은 최적의 weight와 bias값을 찾아가는 과정입니다. Cost function(비용함수)은 최적화된 가중치와 편향을 찾기 위한 기준이 되는 지표 함수입니다. 현재까지 진행된 학습의 상태를 지표로 나타내며, cost function을 가장 작은 값으로 만들어주는 것을 목표로 합니다. Cost function의 값은 신경망이 추정한 y 값(prediction)과 현재 입력 데이터에 대응되는 실제 target 값 사이의 오차를 나타냅니다. 일반적으로 Mean Squared Error(평균 제곱 오차)와 Cross Entropy Error(교차 엔트로피 오차)를 가장 많이 사용합니다. Classfication에서는 Cross Entropy Error를 주로 사..

728x90