반응형 SMALL 전체 글181 AWS Athena 소개 사용자가 표준 SQL 구문을 사용하여 S3에서 데이터를 쿼리할 수 있는 Amazon에서 제공하는 서비스인 AWS Athena를 소개하려고 합니다. AWS는 클라우드 컴퓨팅 세계의 리더로 간주됩니다. Amazon에서는 온프레미스 아키텍처와 비교하여 워크로드를 실행하기 위한 비용 효율적인 솔루션과 경쟁력 있는 성능을 제공하는 거의 100개 이상의 서비스를 제공하고 있습니다. Amazon이 제공하는 서비스는 컴퓨팅, 스토리지, 데이터베이스, 분석, IoT, 보안 등 매우 다양합니다. Analytics 도메인에서 이러한 서비스의 인기 있는 영역 중 하나입니다. 이를 통해 고객은 비즈니스 결정에 대한 핵심 질문에 답하는 아키텍처를 구축할 수 있습니다. 표준 SQL 문을 사용하여 S3 버킷에 저장된 정적 데이터 검.. 2022. 5. 25. 쿠버네티스란? 원래 Google에서 설계하고 현재 Cloud Native Computing Foundation에서 유지 관리하는 Kubernetes(K8s라고도 함)는 소프트웨어 배포 자동화를 위한 오픈 소스 컨테이너 조정 시스템입니다. Kubernetes는 컨테이너화된 워크로드 및 서비스를 관리하는 데 매우 널리 사용되는 플랫폼입니다. Kubernetes 서비스, 지원 및 도구는 널리 사용 가능합니다. 가상화된 호스트 운영 체제 또는 커널인 컨테이너 그룹으로 애플리케이션을 구성하여 작동합니다. 컨테이너는 동일한 시스템의 다른 컨테이너에서 애플리케이션의 종속성을 격리합니다. 이 접근 방식은 리소스 활용도를 높이고 비용을 절감합니다. 자주 묻는 질문 쿠버네티스란? Kubernetes는 하드웨어 가상화보다 운영 체제 가상.. 2022. 5. 25. 클라우드 인프라 정의 클라우드 인프라란? 클라우드 인프라는 클라우드 컴퓨팅 모델 의 컴퓨팅 요구 사항을 지원하는 서버, 스토리지, 네트워킹, 가상화 소프트웨어, 서비스 및 관리 도구와 같은 하드웨어 및 소프트웨어 구성 요소를 말합니다 . 클라우드 인프라에는 애플리케이션 프로그래밍 인터페이스 와 API 지원 명령줄 또는 그래픽 인터페이스 를 통해 리소스와 서비스를 가상화하고 논리적으로 사용자에게 제공 하는 추상화 계층 도 포함됩니다. 클라우드 컴퓨팅에서 클라우드 인프라의 역할은 무엇입니까? 클라우드 인프라는 하드웨어 및 소프트웨어 구성 요소의 기능과 특징을 세분화하여 클라우드 컴퓨팅을 뒷받침합니다. 그런 다음 클라우드 서비스 제공자( 사설 클라우드 의 경우 정보 기술(IT) 부서)에서 이러한 가상화된 리소스를 호스팅하고 인터넷.. 2022. 5. 25. openSource MongoDB - CRUD 연산 - CRUD 란? Create / Read / Update / Delete 를 의미합니다. Document 를 JSON 형태로 전달하면서 2진 JSON인 BSON 코드로 저장합니다. - MongoDB의 주요기능 Index MongoDB는 일반적인 쿼리 밑 업데이트 성능을 향상시키기 위해 인덱스를 완벽하게 지원합니다. 인덱스는 애플리케이션에서 데이터 구조를 효율적으로 관리하면서 컬렉션의 일정 부분을 view로 저장하도록 지원합니다. 1) Index 를 사용하는 이유 Index는 DB 테이블에 대한 처리 속도를 높여주는 자료 구조로서, 저장딘 자료에 대한 빠른 조회가 가능해집니다. Index는 Key-Field 형태를 가지며, 스캔을 거치지 않고 원하는 문서의 주소로 바로 이동하게 합니다. Collectio.. 2022. 5. 25. New NoSQL & mongoDB - Sharding System ### Sharding System 이란? 1. Sharding 의 가장 큰 목적은 파티셔닝을 통한 데이터 분산 처리와 성능 향상을 위한 Load Balancing 입니다. 2. 또한, 빅 데이터의 효율적 관리와 백업 및 복구 전략 수립을 위한 솔루션이기도 합니다. ### Sharding의 목적 1. 데이터의 분산 저장 하나의 서버에 빅 데이터를 저장, 관리하는 것은 성능 저하 문제를 유발시킵니다. 따라서, 여러대의 서버를 통하 분산 처리했을 때 가장 이상적으로 작동할 수 있습니다. 2. 빠른 성능 분산 처리는 여러 개의 프로세스가 여러 개의 CPU를 통해 동시 작업을 수행했을 때 가장 이상적이라 볼 수 있습니다. 3. 데이터 백업과 복구 전략의 역할 하나의 서버에 빅 데이터를 저장, 관리했을 때 서버 .. 2022. 5. 25. New NoSQL & mongoDB - Replica & ReplicaSets ### Master & Slave 서버 빅 데이터의 안정한 저장과 관리 그리고 복구가 수행되기 위해서는 적절한 백업 솔루션이 필요합니다. 리프리카와 리프리카 셋 기능은 빅데이터의 백업을 통해 안정성을 보장하기 위한 솔루션 중 하나 입니다. 리프리카 기능을 위해서는 마스터 노트와 슬레이브 노드가 필요하며, 슬레이브 노드는 최소 3대 이상을 권장합니다. ### ReplicaSets 마스터 서버와 슬레이브 서버의 관계는 원본 데이터베이스에 대한 복제 본 데이터베이스에 동일한 데이터를 하나 더 저장해 두는 관계를 의미합니다. 그런데, 실시간으로 마스터 서버에 대한 복구 작업을 수행하는 거나 슬레이브 서버를 즉시 사용할 수 있는 것은 아닙니다. 이를 위한 기능이 리프리카셋 입니다. 리프리카셋에서 실시간으로 사용되.. 2022. 5. 25. openSource MongoDB - Introduction - MongoDB 란? 몽고DB는 NoSQL(Not only SQL) 데이터베이스로, JSON(JavaScript Object Notation) 형태의 데이터를 저장합니다. SQL을 지원하지 않기 때문에 Join 개념이 없고, 스키마는 유동적입니다. 여기서 유동적이라는 말은 몽고DB에서 저장하는 데이터 단위가 '다큐먼트'라는 것을 의미하는데, 이는 RDBMS에서 행 단위의 레코드라고 할 수 있습니다. 따라서 몽고DB의 다큐먼트 속성은 SQL처럼 정형화되어 있지 않고, 가변적이기 때문에 모든 문서 형태가 비정형 데이터를 저장하고 처리하는 데 적합합니다. 다큐먼트를 집합적으로 부를 때는 '컬렉션'이라 합니다. 컬렉션은 RDBMS에서 테이블 개념과 논리적으로 유사하지만, 데이터 구.. 2022. 5. 25. New NoSQL & mongoDB - Performance Tuning 운영 단계에서 사용자가 예기치 못하는 다양한 장애와 성능 저하 현상들이 발생하고 있는데 그 원인은 다음과 같이 매우 다양합니다. 1. Design Tuning 데이터베이스의 성능을 저하시키는 가장 큰 원인은 데이터를 저장하는 논리적 구조인 컬렉션에 대한 적절한 분석과 설계 작업이 수행되지 못했기 때문입니다. 이러한 컬렉션의 설계 문제로 인한 성능저하 원인과 문제점을 분석하고 대처하는 방법을 디자인 튜닝이라고 합니다. 1) 대용량 데이터의 INSERT가 발생하는 Collection의 경우 최초 Extent의 크기를 충분히 설계하여 Extent 증가 시 불필요한 성능 지연이 발생하지 않도록 생성해야 하며, 대용량 데이터의 Full Scan이 자주 발생하는 Collection의 경우에는 Extent가 큰 것이.. 2022. 5. 24. New NoSQL & mongoDB - Structure - Server Structre Process 영역 Memory 영역 File 영역 - Storage Engine Memory Mapping 엔진 (MMAP) 파일 시스템 기반의 이 엔진은 1.x, 2.x 까지 사용되었습니다. 초당 10만건 이상의 빅데이터에 대한 빠른 쓰기/읽기 작업을 수행한 후 분석, 통계 작업까지 효과적으로 수행할 수 있도록 최적화된 저장 엔진 입니다. 서버 장애 시 복구 작업이 가능한 Journal 로그도 제공합니다. Single CPU 기반의 프로세싱 위주로 처리되기 때문에 CPU 개수보다 충분한 크기의 메모리 자원이 더 요구됩니다. WiredTiger 저장엔진 이는 3.x 버전부터 제공되는 파일 시스템 기반의 저장 엔진입니다. 다수의 사용자가 트랜잭션 위주의 데이터를 처리하는데.. 2022. 5. 24. 이전 1 2 3 4 ··· 21 다음 반응형 LIST