일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 쿠버네티스
- Java
- 깃
- 코테
- git
- ubuntu
- 자바
- 자료구조
- Lv 2
- 파이썬
- Ai
- Kubernetes
- db
- DevOps
- 우분투
- 인공지능
- LV 0
- Linux
- mysql
- programmers
- Python
- 코딩테스트
- 머신러닝
- docker
- 알고리즘
- 리눅스
- 정처기
- 프로그래머스
- 데이터베이스
- github
Archives
- Today
- Total
목록hashed feature (1)
Myo-Kyeong Tech Blog
[Machine Learning] 머신러닝 디자인 패턴 : 특징 해시(Hashing Trick)
카테고리 특징과 관련해 발생 가능한 문제 상황 불완전 어휘(Incomplete Vocabulary) 모든 가능한 카테고리 값을 미리 알기 어려운 경우 ex ) 신규 사용자 ID, 새로운 상품 코드 등 모델 크기 증가(Cadinality) 카테고리 값이 많아질수록, 모델의 크기가 커져, 메모리 사용량과 계산 시간이 증가하는 문제 콜드 스타트(Cold Start) 새로운 카테고리 값이 등장했을 때, 해당 값을 처리할 수 있는 기존 학습된 모델이 없는 경우 특징 해시 카테고리형 변수를 고정된 크기의 벡터로 변환 각 카테고리 값을 해시 함수를 통해 특정 인덱스로 매핑하고, 해당 인덱스의 값을 업데이트하여 카테고리형 특징을 벡터로 표현 불안전 어휘, 카디널리티로 인한 모델 크기, 콜드 스타트 문제를 해결 해시 함..
MLOps
2024. 3. 31. 03:50