언어모델
-
[챗봇] PDF QA 챗봇 개발하기 (1)카테고리 없음 2023. 4. 17. 00:28
목적 PDF 문서 내용을 기반으로 질의응답(QA)를 할 수 있는 인트라넷에서 사용가능한 챗봇 개발 준비물 python langchain openai api key 과정 1. PDF 에서 텍스트 추출하기 langchain에서 제공하는 pdf loader를 이용해 pdf에서 text를 추출한다. langchain에서는 다양한 방법을 제공하므로 각자 상황에 맞는 방법을 사용하도록 한다. (현재 글쓴이도 적절한 방법을 모색하고 있다.) from langchain.document_loaders import UnstructuredPDFLoader from langchain.text_splitter import RecursiveCharacterTextSplitter loader = UnstructuredPDFLoad..