본문 바로가기

AI

(3)
RAG란 RAG LLM이 텍스트를 생성할 때 관련 정보를 찾아보고(retrieval), 그 정보를 활용하여 새로운 텍스트를 만드는(generation) 기술. DB나 인터넷 같은 정보의 원천에서 필요한 사실이나 데이터를 찾아, 그것을 기반으로 텍스트를 만드는 기술 RAG 구현 과정 정보 검색 질문 입력 사용자가 필요한 정보를 찾음 검색 검색 엔진이 해당 쿼리와 관련된 정보를 DB나 인터넷에서 search 유사도 검색 키워드 검색 사용자가 입력한 단어를 DB나 인터넷에서 직접 찾음 문맥을 파악x 단순히 키워드 존재 여부를 기준 → 관련 없는 결과를 보여주기도 함 시맨틱 검색 단어의 의미와 문맥을 이해하여 보다 관련성 높은 결과를 제공하는 기술 키워드 검색보다 훨씬 복잡 고도의 알고리즘과 자연어 처리 기술이 필요 랭..
LLM의 발전 & 오픈소스와 폐쇄형소스 출처 https://www.youtube.com/watch?v=XwlLeVhWCCc&list=PLQIgLu3Wf-q_Ne8vv-ZXuJ4mztHJaQb_v&index=2 위 강의를 기반으로 학습한 내용을 정리한 글입니다. LLM의 발전 양상 현재 NLP 모델은 대부분 Transformer 아키텍처 기반 모델의 용도에 따라 Transformer의 Encoder/Decoder를 개별 또는 통합 사용하는 추세 Encoder : 말을 이해 하는 데 초점 Decoder : 말을 잘 하는 데 초점 이러한 Decoder 중심의 빠른 발전이 이루어짐 Closed Source vs Open Source Closed Source 개발사 OpenAI Google 개발모델 GPT-3 GPT-3.5 GPT-4 PALM LaMD..
LangChain이란? 출처 https://www.youtube.com/watch?v=WWRCLzXxUgs&list=PLQIgLu3Wf-q_Ne8vv-ZXuJ4mztHJaQb_v 위 강의를 기반으로 학습한 내용을 정리한 글입니다. LangChain 언어 모델로 구동되는 애플리케이션을 개발하기 위한 프레임워크 언어 모델을 더 잘 활용할 수 있게 도와주는 도구 데이터인식 : 언어 모델을 다른 데이터 소스에 연결 에이전트 기능 : 언어 모델이 환경과 상호 작용할 수 있도록 함 LangChain 사용 이유 정보 접근 제한 : GPT-3.5 경우 2021년까지의 데이터를 학습하여, 2022년부터의 정보에 대해서는 답변 어려움 => Vectorstore 기반 정보 탐색 or Agent 활용한 검색 결합 토큰 제한 : GPT-3.5, GP..