본문 바로가기

Study notes13

Docker에 대하여 - (2) Docker build  컨테이너에서 할당한 포트 를 외부 네트워크 노출을 위해 호스트의 포트와 바인딩한다 .앞 (호스트 포트) : 뒤 (컨테이너 포트)docker run -dit -p 8000:80 nginxDockerfile : 명세서와 같다. 쿠버네티스에서의 YAMLdocker push : # 도커레지스트리docker run : # 호스트 도커 실행환경 도커파일 세부내용# 위에서 아래로 실행이 되는 Docker layerFROM python:3.11WORKDIR /codeCOPY ./requirements.txt /code/requirements.txt #현재 위치로 복사RUN pip install \ #실행 --no-cache-dir \ --upgrade \ -r /code/re.. 2024. 6. 13.
Docker에 대하여 - (1) 도커란?도커(Docker)는 리눅스 컨테이너에 여러 기능을 추가함으로써 애플리케이션을 컨테이너로서 더 쉽게 사용할 수 있게 만들어진 오픈 소스 프로젝트입니다. 가상머신의 장점과 단점가상머신은 완벽한 운영체제를 생성할 수 있다는 장점은 있지만 일반 호스트에 비해 성능 손실이 있으며, 수 기가바이트에 달하는 가상머신을 이미지를 애플리케이션으로 배포하기에는 부담스러운 단점이 있다.도커의 장점리눅스의 자체 기능인 chroot, 네임스페이스, cgroup을 사용하여 프로세스 단위의 격리 환경을 만들기 때문에 손실이 거의 없습니다. 컨테이너에 필요한 커널은 호스트의 커널을 공유하여 사용하고, 컨테이너 안에는 애플리케이션을 구동하는 데 필요한 라이브러리 및 실행 파일만 존재하기 때문에 컨테이너를 이미지로 만들었을 때.. 2024. 6. 13.
Vector DB의 Querying 검색방법(keyword, semantic, hybrid) 키워드 검색 (Keyword Search)속성 필터 (Attribute Filter)정의: 메타데이터를 기반으로 한 필터를 통해 자연어를 검색하는 방식입니다.장점:직관적이고 빠름: 구체적인 검색 요건에 맞춰 빠르게 결과를 제공합니다.고유명사 검색 시 정확: 명확하고 구체적인 키워드일 경우 높은 정확도를 보입니다.단점:유연성 부족: 검색 결과의 다양성과 유연성이 부족합니다.사용자의 검색 능력에 의존: 검색 품질이 사용자의 능력에 크게 좌우됩니다.스파스 벡터 검색 (Sparse Vector Search)정의: 문서 내 단어 은행을 기반으로 n-gram 벡터를 생성하여 검색을 수행합니다.장점:연관성 있는 문서 발췌 가능: 단어의 언급 빈도를 기반으로 관련 문서를 찾아냅니다.단점:유연성 부족: 텍스트의 의미를 .. 2024. 5. 8.
Vector DB의 Indexing 이란? Vector DB 인덱싱 개요 벡터 데이터베이스 인덱싱(Vector Database Indexing)은 고차원의 데이터를 효율적으로 관리하고 검색하기 위해 사용되는 기술입니다. 이 기술의 주된 목표는 검색 정확도와 검색 속도 사이의 최적의 균형(trade-off)을 찾는 것입니다. 인덱싱은 데이터를 구조화된 인덱스에 저장함으로써, 추후에 이루어지는 검색이 더 빠르고 정확하게 이루어질 수 있도록 합니다. 기술의 필요성 대용량의 데이터셋 내에서 특정 데이터를 빠르게 찾아내는 것은 매우 중요한 문제입니다. 특히, 이미지, 비디오, 오디오와 같은 멀티미디어 데이터들이나, 사용자의 선호도를 반영한 추천 시스템 등에서 사용되는 고차원 벡터들은 전통적인 데이터베이스 인덱스 기법으로는 효율적으로 관리하기 어렵습니다. .. 2024. 4. 23.