일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- docker
- LV 0
- db
- 데이터베이스
- Java
- Linux
- 우분투
- 코딩테스트
- 깃
- 자료구조
- 자바
- ubuntu
- 파이썬
- Kubernetes
- mysql
- github
- DevOps
- programmers
- Ai
- 코테
- Python
- 알고리즘
- 리눅스
- 프로그래머스
- 정처기
- 인공지능
- git
- 쿠버네티스
- Lv 2
- 머신러닝
- Today
- Total
목록머신러닝 (5)
Myo-Kyeong Tech Blog
애드혹(ad-hoc approach) 접근 방식의 문제점 애드혹 (ad-hoc) 접근 방식 특정 문제를 해결하기 위해 임시적으로 취하는 방법으로 일회성 모델 개발이나 학습에 한해 적합 ML 프로젝트에서 "그때 그때 필요에 따라" 특징 생성 초기 단계나 작은 규모의 프로젝트에서는 효과적일 수 있지만, 조직이 성장하고 프로젝트가 복잡해짐에 따라 관리가 어려워지고 비효율적 개별 사용자나 팀이 만든 feature는 다른 팀이나 프로젝트에서 재사용하기 어려움 각 ML 프로젝트가 민감한 데이터 특징을 다르게 계산하면, 데이터 거버넌스 측면에서 문제가 생길 수 있음 예를 들어, 두 개의 다른 팀이 각각 고객의 신용 점수를 다른 방식으로 계산할 경우, 이 두 점수가 실제로 어떤 의미를 가지는지 일관성이 결여되어 신뢰할..
데이터 스케일링 ( Scaling ) 다양한 특성의 값을 일정한 범위 또는 표준에 맞게 조정하는 과정 특성 간의 비교를 가능하게 함 모델의 성능을 향상시키고, 계산의 수치적 안정성을 제공. 데이터 스케일링 ( Scaling ) 이 필요한 경우 특성의 단위가 다른 경우 경사 하강법을 사용한 모델 ( 예 : 선형 회귀, 로지스틱 회귀, 신경망 등) 거리 기반 알고리즘 ( 예 : K-NN, SVM ) 예를 들어, 집의 가격을 예측하는 모델을 만들려고 합니다. 특성으로는 집의 크기 (평방 미터), 방의 수(개수), 위치 (위도와 경도) 등이 있다면, 이 특성들은 모두 다른 단위와 범위를 가지고 있습니다. 집의 크기는 수백에서 수천, 방의 수는 1에서 10사이, 위치 좌표에 따라 수백에서 수천의 범위를 가질 수 ..
교차 검증 ( Cross Validation ) 이란? 교차 검증 ( Cross Validation ) 은 머신러닝 모델의 일반화 성능을 측정하는 통계적 방법입니다. 데이터를 여러 개의 부분집합 (또는 "fold")으로 나누고 각 부분집합을 차례로 테스트 데이터로 사용하고 나머지를 훈련 데이터로 사용하는 방법입니다. 교차 검증 ( Cross Validation ) 을 사용하는 이유 교차 검증을 사용하는 주요 목적은 모델의 과적합을 방지하고, 데이터를 최대한 효율적으로 활용하여 일반화 성능을 높이기 위해서 입니다. 교차 검증을 통해 얻은 여러 성능 지표들의 평균을 내어 모델의 성능을 추정하면, 학습 / 테스트 분할로 얻은 성능 추정보다 더 신뢰성이 높은 추정을 할 수 있습니다. K-Fold K-Fold 교..
Label Encoder Label Encoding은 문자 데이터를 숫자로 바꾸는 가장 기본적인 방법으로 각 유니크한 문자 데이터를 숫자 값으로 매핑하는 방법입니다. 예를 들어, Red, Blue, Green 3개의 색상이 있다고 있다고 가정해봅시다. Label Encoding을 적용하면 'Red'는 0, 'Blue'는 1, 'Green'는 2와 같은 숫자로 변환됩니다. ID 색상 1 Red 2 Blue 3 Green [Label Encoder] ID 색상 1 0 2 1 3 2 from sklearn.preprocessing import LabelEncoder #데이터 colors = ['Red', 'Blue', 'Green', 'Blue', 'Red'] # LabelEncoder 객체 생성 encode..
인공지능 개념 인공지능 ( Artifical Intelligence ) : 인간이 가진 지적 능력을 컴퓨터를 통해 구현한 기술 머신러닝 ( Marchine Learning ) : 컴퓨터 스스로 학습하여 알고리즘을 연구하고 구축하는 기술 딥러닝 ( Deep Learning ) : 인간의 뉴런과 비슷한 인공신경망을 통해 스스로 정보를 처리, 학습 할 수 있는 인공지능 기술 인공지능, 머신러닝, 딥러닝은 인공지능 > 머신러닝 > 딥러닝 의 포함관계로 설명될 수 있습니다. 머신러닝 VS 딥러닝 머신러닝과 딥러닝의 가장 큰 차이점은 사람의 개입 여부입니다. 머신러닝은 인간이 먼저 데이터를 처리하고, 사전에 정의된 알고리즘과 규칙을 적용하여 문제를 해결하는 방식입니다. 이 과정에서 인간이 데이터의 특징을 추출하며,..