AI 모델이 사용하는 모든 데이터는 숫자로 표현되어이햔다. 텍스트, 오디오, 비디오 같은 비정형 데이터를 모두 -1과 1 사이의 숫자로 표현하는 방법을 벡터 임베딩이라고 한다. AI 모델은 단어 사이의 거리를 계산해서 가장 가까운 단어를 조합하는 방식을 사용한다. 각 단어를 수치화 하여 이 단어들을 다차원 공간에서 점으로 표현하면 문맥상 관련된 단어는 서로 가까운 벡터를 갖게된다. 이러한 표현은 AI 모델이 데이터의 유사점과 차이점을 이해하는데 도움이 된다.
'프로그래밍 > 단어장' 카테고리의 다른 글
파인 튜닝 관련 용어 (0) | 2025.01.09 |
---|---|
LLM의 뜻과 한계 (할루시네이션, 지식단절현상) (0) | 2025.01.08 |
버전(Version)과 리비전(Revision) (0) | 2024.12.26 |
수직 동기화(V-Sync), 화면 찢김, 스터터링, 삼중 버퍼링 (1) | 2024.12.22 |
크로미움(Chromium), 그리고 브라우저 엔진들 (0) | 2024.12.11 |