프로그래밍/단어장

LLM의 뜻과 한계 (할루시네이션, 지식단절현상)

Lou Park 2025. 1. 8. 11:19

Large Language Model - 방대한 양의 데이터로 사전 학습된 초대형 딥 러닝 모델. 트랜스포머 모델이라고 하는 일종의 신경망을 기반으로 한다.

 

트랜스포머 모델
트랜스포머 모델은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망

 

예측할 수 없는 쿼리에 대해 대응 할 수 있고, 구조화되지 않은 질문이나 프롬프트에도 답변할 수 있다. 하지만 LLM은 수집하는 데이터만큼만 신뢰할 수 있는 정보를 제공하므로, 정확한 답변을 내놓을 수 없을때면 가짜 정보를 생성한다. 이를 "할루시네이션(Hallucination)"이라고 한다. 대표적으로 유명한 "세종대왕 맥북 던짐사건"짤이 있다. AI 모델은 확률을 사용하여 어떤 단어나 시각적 요소가 나타날지 '예측'하는데하므로 일부 미묘한 차이를 놓칠 수 있다. "오늘 날씨를 알려줘"같은 학습된 시기 이후의 정보제공을 요청하면 아예 정보를 제공하지 못하기도하는데 , 이를 지식 단절 현상이라고한다. 

이러한 한계를 극복하고, LLM에 맥락을 알려주기 위해 검색증강생성(RAG)기법을 사용하기도 한다. 

 

RAG
검색 증강 생성(Retrieval-Augmented Generation). 기존의 생성형 AI 모델에 리트리버를 통한 실시간 정보 검색능력을 결합한 접근 방식.

 

참고자료

https://www.cloudflare.com/ko-kr/learning/ai/what-is-large-language-model/
https://www.cloudflare.com/ko-kr/learning/ai/what-are-ai-hallucinations/