Large Language Model - 방대한 양의 데이터로 사전 학습된 초대형 딥 러닝 모델. 트랜스포머 모델이라고 하는 일종의 신경망을 기반으로 한다.
트랜스포머 모델
트랜스포머 모델은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망
예측할 수 없는 쿼리에 대해 대응 할 수 있고, 구조화되지 않은 질문이나 프롬프트에도 답변할 수 있다. 하지만 LLM은 수집하는 데이터만큼만 신뢰할 수 있는 정보를 제공하므로, 정확한 답변을 내놓을 수 없을때면 가짜 정보를 생성한다. 이를 "할루시네이션(Hallucination)"이라고 한다. 대표적으로 유명한 "세종대왕 맥북 던짐사건"짤이 있다. AI 모델은 확률을 사용하여 어떤 단어나 시각적 요소가 나타날지 '예측'하는데하므로 일부 미묘한 차이를 놓칠 수 있다. "오늘 날씨를 알려줘"같은 학습된 시기 이후의 정보제공을 요청하면 아예 정보를 제공하지 못하기도하는데 , 이를 지식 단절 현상이라고한다.
이러한 한계를 극복하고, LLM에 맥락을 알려주기 위해 검색증강생성(RAG)기법을 사용하기도 한다.
RAG
검색 증강 생성(Retrieval-Augmented Generation). 기존의 생성형 AI 모델에 리트리버를 통한 실시간 정보 검색능력을 결합한 접근 방식.
참고자료
https://www.cloudflare.com/ko-kr/learning/ai/what-is-large-language-model/
https://www.cloudflare.com/ko-kr/learning/ai/what-are-ai-hallucinations/
'프로그래밍 > 단어장' 카테고리의 다른 글
파인 튜닝 관련 용어 (0) | 2025.01.09 |
---|---|
벡터 임베딩(Vector Embedding) (0) | 2025.01.08 |
버전(Version)과 리비전(Revision) (0) | 2024.12.26 |
수직 동기화(V-Sync), 화면 찢김, 스터터링, 삼중 버퍼링 (1) | 2024.12.22 |
크로미움(Chromium), 그리고 브라우저 엔진들 (0) | 2024.12.11 |