Elastic Stack 학습 정리

시작하며

Elastic Stack(ELK Stack)은 ElasticSearch, Logstash, Beats, Kibana의 네 가지 오픈소스 도구로 구성되는 데이터 수집·저장·검색·시각화 플랫폼이다. 각 컴포넌트의 역할과 상호 연계 방식을 전체적으로 정리한다.

Elastic Stack 전체 구성

데이터 흐름

Elastic Stack의 전형적인 데이터 흐름은 다음과 같다.

데이터 소스 → Beats → (Logstash) → ElasticSearch → Kibana

Beats: 최전방에서 데이터를 수집하는 경량 에이전트
Logstash: 수집된 데이터를 전처리하고 변환하는 파이프라인 도구 (선택적)
ElasticSearch: 데이터를 색인하고 검색·집계 쿼리를 처리하는 분산 검색 엔진
Kibana: ElasticSearch 데이터를 시각화하고 탐색하는 웹 UI

각 컴포넌트 요약

컴포넌트	역할	주요 특징
ElasticSearch	검색·저장·집계	REST API, 역인덱싱, 분산 아키텍처
Logstash	데이터 전처리	input/filter/output 파이프라인
Beats	경량 데이터 수집	Go 기반, 다양한 환경 지원
Kibana	시각화·탐색	인덱스 패턴, Discover, Dashboard

학습 포인트

이 시리즈에서 다룬 주요 내용은 다음과 같다.

ElasticSearch 기초: 인덱스/도큐먼트 CRUD, 벌크 API, 매핑, 인덱스 템플릿, 분석기
ElasticSearch 집계: 메트릭 집계, 버킷 집계, 파이프라인 집계
Logstash: grok/dissect 필터, sincedb, 코덱, 다중 파이프라인
Beats: Filebeat 구조(input-harvester-spooler), 멀티라인, 모듈
Kibana: 인덱스 패턴, Discover, Visualize, Dashboard, Canvas
실전 예제: Kaggle CSV 적재, Twitter 데이터 수집과 한글 형태소 분석기 적용

정리하며

Elastic Stack은 로그 분석, 검색 서비스, 데이터 파이프라인 구축 등 다양한 목적으로 활용되는 성숙한 오픈소스 플랫폼이다. 단순한 도구 학습을 넘어 각 컴포넌트가 어떤 역할을 담당하고 어떻게 연계되는지 이해하는 것이 실무 활용의 핵심이다. 이 시리즈를 통해 Elastic Stack의 전체 흐름을 파악하고, 실제 데이터 파이프라인 설계에 응용해볼 수 있다.

Daily Record

탐색기

Elastic Stack 학습 정리

시작하며

Elastic Stack 전체 구성

데이터 흐름

각 컴포넌트 요약

학습 포인트

정리하며

최근 게시글

토스증권으로 이직, 그리고 회고

Home K8S Cluster etcd Panic Error

JVM SnapShot Cache 구현하기

DB Max Connection Error

Strimzi 로 kubernetes 에 kafka 배포하기

GCP - Professional Cloud Architect 후기

Obsidian 으로 블로그 포스팅 파이프라인 만들기

Kafka, ZooKeeper에서 KRaft로

Spark on Kubernetes 사용해보기

Spark on Kubernetes 알아보기

Feature Selection 기법 알아보기

Apache Hive 성능 개선 톺아보기 2탄

조금 이른 회고, 그리고 방향성

Apache Hive 성능 개선 톺아보기 1탄

WireGuard로 간편하게 VPN 환경 구성하기

빅데이터분석기사 취득기

Flutter 모바일 청첩장 제작기

Flutter 수익형 앱 개발 기초 수강 후기

JVM GC 알고리즘 개선기 - Parallel GC vs G1GC

Java 멀티스레딩, 병행성, 성능 최적화 강의 후기

그래프 뷰

목차