모니터링과 성능 튜닝 — Performance Schema와 sys 스키마

MySQL 서버가 느려졌을 때, 무엇이 문제인지 정확히 파악할 수 있는 도구가 있다면 어떨까요?

Performance Schema란

Performance Schema는 MySQL 서버 내부의 실행 상태를 실시간으로 수집하는 계측 프레임워크입니다.

SQL

-- Performance Schema 활성화 확인 (기본 ON)
SHOW VARIABLES LIKE 'performance_schema';

PLAINTEXT

수집하는 정보:
- 쿼리 실행 통계 (실행 횟수, 소요 시간, 행 수)
- 대기 이벤트 (락 대기, I/O 대기, 뮤텍스 대기)
- 메모리 사용량
- 스레드 상태
- 파일 I/O 통계
- 테이블 I/O 통계

데이터는 메모리에만 저장 되므로 서버 재시작 시 초기화됩니다. 디스크 I/O가 발생하지 않아 오버헤드가 낮습니다.

Performance Schema 핵심 테이블

쿼리 통계 — events_statements_summary_by_digest

가장 자주 사용하는 테이블입니다. 쿼리를 정규화(파라미터 제거)하여 유형별 통계를 제공합니다.

SQL

-- 가장 느린 쿼리 TOP 10
SELECT
    DIGEST_TEXT AS query,
    COUNT_STAR AS exec_count,
    ROUND(AVG_TIMER_WAIT / 1e9, 2) AS avg_ms,
    ROUND(SUM_TIMER_WAIT / 1e9, 2) AS total_ms,
    SUM_ROWS_EXAMINED AS rows_examined,
    SUM_ROWS_SENT AS rows_sent
FROM performance_schema.events_statements_summary_by_digest
ORDER BY AVG_TIMER_WAIT DESC
LIMIT 10;

SQL

-- 실행 횟수가 많은 쿼리 TOP 10
SELECT
    DIGEST_TEXT,
    COUNT_STAR AS exec_count,
    ROUND(SUM_TIMER_WAIT / 1e9, 2) AS total_ms
FROM performance_schema.events_statements_summary_by_digest
ORDER BY COUNT_STAR DESC
LIMIT 10;

대기 이벤트 — events_waits_summary_global_by_event_name

서버가 무엇을 기다리는지 보여줍니다.

SQL

-- 가장 많이 대기한 이벤트
SELECT
    EVENT_NAME,
    COUNT_STAR,
    ROUND(SUM_TIMER_WAIT / 1e9, 2) AS total_ms
FROM performance_schema.events_waits_summary_global_by_event_name
WHERE COUNT_STAR > 0
ORDER BY SUM_TIMER_WAIT DESC
LIMIT 10;

wait/io/file/innodb/innodb_data_file이 상위에 있으면 디스크 I/O가 병목이고, wait/synch/mutex/innodb/...가 상위에 있으면 내부 락 경합이 문제입니다.

테이블 I/O — table_io_waits_summary_by_table

테이블별 읽기/쓰기 빈도를 보여줍니다.

SQL

-- 가장 많이 접근되는 테이블
SELECT
    OBJECT_SCHEMA,
    OBJECT_NAME,
    COUNT_READ,
    COUNT_WRITE,
    COUNT_FETCH,
    COUNT_INSERT,
    COUNT_UPDATE,
    COUNT_DELETE
FROM performance_schema.table_io_waits_summary_by_table
WHERE OBJECT_SCHEMA NOT IN ('mysql', 'performance_schema', 'sys')
ORDER BY COUNT_READ + COUNT_WRITE DESC
LIMIT 10;

메모리 사용량

SQL

-- 컴포넌트별 메모리 사용량
SELECT
    EVENT_NAME,
    CURRENT_NUMBER_OF_BYTES_USED / 1024 / 1024 AS current_mb
FROM performance_schema.memory_summary_global_by_event_name
ORDER BY CURRENT_NUMBER_OF_BYTES_USED DESC
LIMIT 10;

sys 스키마 — 읽기 쉬운 뷰

sys 스키마는 Performance Schema의 데이터를 사람이 읽기 쉬운 형태로 요약한 뷰 모음입니다.

핵심 뷰

SQL

-- 가장 비용이 높은 쿼리
SELECT * FROM sys.statements_with_runtimes_in_95th_percentile LIMIT 10;

-- 풀 테이블 스캔이 발생하는 쿼리
SELECT * FROM sys.statements_with_full_table_scans LIMIT 10;

-- 임시 테이블을 사용하는 쿼리
SELECT * FROM sys.statements_with_temp_tables LIMIT 10;

-- 사용되지 않는 인덱스
SELECT * FROM sys.schema_unused_indexes;

-- 중복 인덱스
SELECT * FROM sys.schema_redundant_indexes;

-- 테이블별 통계
SELECT * FROM sys.schema_table_statistics;

-- 사용자별 연결 통계
SELECT * FROM sys.user_summary;

-- 현재 실행 중인 쿼리
SELECT * FROM sys.processlist WHERE command != 'Sleep';

-- I/O 가장 많은 파일
SELECT * FROM sys.io_global_by_file_by_bytes LIMIT 10;

-- 메모리 사용량 요약
SELECT * FROM sys.memory_global_total;

사용하지 않는 인덱스 찾기

SQL

-- 서버 시작 이후 한 번도 사용되지 않은 인덱스
SELECT
    object_schema AS db_name,
    object_name AS table_name,
    index_name
FROM sys.schema_unused_indexes
WHERE object_schema NOT IN ('mysql', 'sys', 'performance_schema');

불필요한 인덱스는 INSERT/UPDATE/DELETE 성능을 저하시키므로 제거를 고려합니다.

중복 인덱스 찾기

SQL

-- 다른 인덱스에 포함되는 중복 인덱스
SELECT * FROM sys.schema_redundant_indexes
WHERE table_schema NOT IN ('mysql', 'sys');

PLAINTEXT

예: INDEX(a)와 INDEX(a, b)가 있으면 INDEX(a)는 중복

InnoDB 상태 변수

SHOW ENGINE INNODB STATUS

SQL

SHOW ENGINE INNODB STATUS\G

핵심 섹션별 확인 포인트는 다음과 같습니다.

BUFFER POOL AND MEMORY:

PLAINTEXT

Buffer pool hit rate: 999 / 1000  ← 히트율 99.9%
Modified db pages: 1234           ← Dirty Page 수

ROW OPERATIONS:

PLAINTEXT

Number of rows inserted 12345, updated 6789, deleted 1234, read 99999

SEMAPHORES:

PLAINTEXT

-- 뮤텍스 대기가 많으면 내부 경합 문제
Mutex spin waits 12345, rounds 67890

핵심 상태 변수

SQL

-- 연결 관련
SHOW STATUS LIKE 'Threads%';
-- Threads_connected: 현재 연결 수
-- Threads_running: 현재 실행 중인 스레드 수
-- Threads_created: 생성된 총 스레드 수

-- Buffer Pool 관련
SHOW STATUS LIKE 'Innodb_buffer_pool%';
-- Innodb_buffer_pool_read_requests: 논리적 읽기 요청 수
-- Innodb_buffer_pool_reads: 디스크에서 읽은 횟수 (미스)

-- 임시 테이블 관련
SHOW STATUS LIKE 'Created_tmp%';
-- Created_tmp_tables: 메모리 임시 테이블 수
-- Created_tmp_disk_tables: 디스크 임시 테이블 수 (높으면 문제)

주요 성능 튜닝 파라미터

Buffer Pool

SQL

-- 전용 DB 서버: 전체 메모리의 50~80%
SET GLOBAL innodb_buffer_pool_size = 8 * 1024 * 1024 * 1024;  -- 8GB

-- 여러 인스턴스로 분리 (경합 감소)
-- innodb_buffer_pool_instances = 8  (my.cnf에서 설정)

정렬/조인 버퍼

SQL

-- 정렬 버퍼 (세션별)
SET GLOBAL sort_buffer_size = 4 * 1024 * 1024;  -- 4MB (기본 256KB)

-- 조인 버퍼 (세션별, 풀 스캔 조인 시 사용)
SET GLOBAL join_buffer_size = 4 * 1024 * 1024;  -- 4MB (기본 256KB)

이 값들은 세션별 로 할당되므로 너무 크게 설정하면 동시 연결이 많을 때 메모리 부족이 발생합니다.

PLAINTEXT

총 메모리 = innodb_buffer_pool_size
           + max_connections × (sort_buffer_size + join_buffer_size + ...)
           + 기타 전역 버퍼

로그 관련

SQL

-- Redo Log 크기 (MySQL 8.0.30+에서 동적 조절)
SET GLOBAL innodb_redo_log_capacity = 2 * 1024 * 1024 * 1024;  -- 2GB

-- Redo Log 플러시 빈도
-- 1: 매 커밋마다 (안전, 기본)
-- 2: 매 초마다 OS 버퍼에 (약간 위험)
-- 0: 매 초마다 (위험)
SHOW VARIABLES LIKE 'innodb_flush_log_at_trx_commit';

커넥션 풀 튜닝

SQL

-- 최대 연결 수
SHOW VARIABLES LIKE 'max_connections';  -- 기본 151

-- 현재 연결 수와 최대 동시 연결 수 확인
SHOW STATUS LIKE 'Threads_connected';
SHOW STATUS LIKE 'Max_used_connections';

**적정 max_connections 결정 **:

PLAINTEXT

max_connections을 무작정 올리면 안 됩니다.

각 연결이 사용하는 메모리:
- 스레드 스택: ~256KB
- sort_buffer, join_buffer: 쿼리 시 할당
- net_buffer: ~16KB

500 연결 × 1MB(추정) = 500MB 추가 메모리

대신:
1. 애플리케이션 커넥션 풀 크기를 적절히 설정 (보통 10~30)
2. 서버 수 × 풀 크기가 max_connections 이내인지 확인
3. Threads_running이 CPU 코어 수의 2~3배를 넘지 않도록 관리

모니터링 체크리스트

운영 환경에서 주기적으로 확인해야 하는 지표입니다.

즉시 확인이 필요한 지표

지표	정상 범위	확인 방법
Threads_running	CPU 코어 × 2 이하	`SHOW STATUS`
Buffer Pool 히트율	99% 이상	상태 변수 계산
Created_tmp_disk_tables 비율	5% 이하	`SHOW STATUS`
Seconds_Behind_Source	0~1초	`SHOW REPLICA STATUS`

주간 확인 지표

지표	확인 방법
사용하지 않는 인덱스	`sys.schema_unused_indexes`
중복 인덱스	`sys.schema_redundant_indexes`
풀 스캔 쿼리	`sys.statements_with_full_table_scans`
슬로우 쿼리 추세	`pt-query-digest`

외부 모니터링 도구 연동

Prometheus + Grafana

BASH

# mysqld_exporter 설치 (Prometheus 메트릭 수집)
# MySQL 메트릭을 Prometheus 형식으로 노출
mysqld_exporter --config.my-cnf=".my.cnf"

Grafana에서 MySQL 대시보드를 구성하면 시계열 차트로 추세를 확인할 수 있습니다.

핵심 대시보드 패널:

QPS (Queries Per Second) 추세
Threads_connected / Threads_running
Buffer Pool 히트율
디스크 I/O 추세
복제 지연

PMM (Percona Monitoring and Management)

Percona에서 제공하는 MySQL 전용 모니터링 솔루션입니다. Query Analytics, 슬로우 쿼리 분석 등을 웹 UI로 제공합니다.

주의할 점

max_connections를 무작정 올리면 메모리 부족이 발생한다

각 연결은 스레드 스택(~256KB), sort_buffer, join_buffer 등 메모리를 소비합니다. 500 연결 x 1MB = 500MB 추가 메모리입니다. 애플리케이션 커넥션 풀 크기를 적절히 설정하는 것이 먼저입니다.

sort_buffer_size, join_buffer_size는 세션별로 할당된다

전역 설정이 아니라 세션별로 할당되므로, 값을 크게 설정하면 동시 연결이 많을 때 메모리가 폭발합니다. max_connections x (sort_buffer_size + join_buffer_size + ...)를 계산해 봐야 합니다.

Performance Schema 데이터는 서버 재시작 시 사라진다

메모리 기반이므로 재시작하면 모든 수집 데이터가 초기화됩니다. 장기 추세 분석이 필요하면 Prometheus + Grafana 같은 외부 모니터링 도구를 연동해야 합니다.

정리

항목	설명
Performance Schema	MySQL 내부 실행 상태를 메모리에 수집하는 계측 프레임워크
sys 스키마	Performance Schema를 읽기 쉬운 뷰로 제공
핵심 즉시 지표	Threads_running, Buffer Pool 히트율, Created_tmp_disk_tables
주간 확인	미사용 인덱스, 중복 인덱스, 풀 스캔 쿼리
커넥션 튜닝	max_connections보다 애플리케이션 풀 크기 설정이 우선
외부 도구	Prometheus + Grafana, PMM으로 시계열 추세 파악