LLM의 뜻과 한계 (할루시네이션, 지식단절현상)

프로그래밍/단어장

LLM의 뜻과 한계 (할루시네이션, 지식단절현상)

Lou Park 2025. 1. 8. 11:19

Large Language Model - 방대한 양의 데이터로 사전 학습된 초대형 딥 러닝 모델. 트랜스포머 모델이라고 하는 일종의 신경망을 기반으로 한다.

트랜스포머 모델
트랜스포머 모델은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망

예측할 수 없는 쿼리에 대해 대응 할 수 있고, 구조화되지 않은 질문이나 프롬프트에도 답변할 수 있다. 하지만 LLM은 수집하는 데이터만큼만 신뢰할 수 있는 정보를 제공하므로, 정확한 답변을 내놓을 수 없을때면 가짜 정보를 생성한다. 이를 "할루시네이션(Hallucination)"이라고 한다. 대표적으로 유명한 "세종대왕 맥북 던짐사건"짤이 있다. AI 모델은 확률을 사용하여 어떤 단어나 시각적 요소가 나타날지 '예측'하는데하므로 일부 미묘한 차이를 놓칠 수 있다. "오늘 날씨를 알려줘"같은 학습된 시기 이후의 정보제공을 요청하면 아예 정보를 제공하지 못하기도하는데 , 이를 지식 단절 현상이라고한다.

이러한 한계를 극복하고, LLM에 맥락을 알려주기 위해 검색증강생성(RAG)기법을 사용하기도 한다.

RAG
검색 증강 생성(Retrieval-Augmented Generation). 기존의 생성형 AI 모델에 리트리버를 통한 실시간 정보 검색능력을 결합한 접근 방식.

참고자료

https://www.cloudflare.com/ko-kr/learning/ai/what-is-large-language-model/
https://www.cloudflare.com/ko-kr/learning/ai/what-are-ai-hallucinations/

저작자표시 (새창열림)

'프로그래밍 > 단어장' 카테고리의 다른 글

파인 튜닝 관련 용어 (0)	2025.01.09
벡터 임베딩(Vector Embedding) (0)	2025.01.08
버전(Version)과 리비전(Revision) (0)	2024.12.26
수직 동기화(V-Sync), 화면 찢김, 스터터링, 삼중 버퍼링 (1)	2024.12.22
크로미움(Chromium), 그리고 브라우저 엔진들 (0)	2024.12.11

현재글LLM의 뜻과 한계 (할루시네이션, 지식단절현상)

지식은 점에서 선으로

Android, 강의, 프로그래밍, 안드로이드, 만들기, 코딩, 어플, 개발, kotlin, Python, 마인크래프트, Windows, 앱, JavaScript, minecraft, Linux, 서버, 마크, Server, Java,

Today :
Yesterday :

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

lou@blog $ _