Chapter 08.01 디스크 읽기 방식 ~ 08.02 인덱스란?

컴퓨터 과학/[Study] Real MySQL 8.0

계란💕 2022. 12. 11. 21:45

컴퓨터에서 CPU나 메모리같은 주요 장치는 대부분 전자식 장치지만 하드 디스크 드라이브는 기계식 장치이다.
그래서 데이터베이스 서버에서는 항상 디스크 장치가 병목이 된다.
이런 HDD를 대체하기 위해 SSD가 많이 출시되고 있다.
- SSD는 기존 하드 디스크의 데이터 저장용 플래터(원판)을 제거하고 그 대신 플래시 메모리를 장착하고 있다.
- HDD처럼 원판을 회전시킬 필요가 없기 때문에 데이터를 빨리 읽고 쓸 수 있다.
- 컴퓨터의 메모리(D-RAM)보다는 느리지만 HDD보다 훨씬 빠르다.

랜덤 I/O: 하드 디스크 드라이브의 플래터(원판)을 돌려서 읽어야할 데이터가 저장된 위치로 디스크 헤더를 이동시킨 다음 데이터를 읽는것을 의미하는데 순차 I/O 또한 이 작업 과정이 같다.

인덱스를 역할별 구분

인덱스를 역할별로 구분하면 프라이머리 키(Primary Key)와 보조 키(세컨더리 인덱스, Secondary Key) 구분 가능하다.
프라이머리 키(Primary Key): 레코드를 대표하는 칼럼의 값으로 만들어진 인덱스를 의미한다. 식별자라고도 부른다. NULL, 중복 불가
세컨더리 인덱스(Secondary Key): 프라이머리 키를 제외한 나머지 모든 인덱스는 세컨더리 인덱스(Secondary Index)로 분류. 유니크 인덱스는 프라이머리 키와 성격이 비슷하고 프라이머리 키를 대체해서 사용 가능해서 대체 키(보조 키)라고도 한다

인덱스를 데이터 저장 방식 (알고리즘)별로 구분

B-Tree 인덱스와 Hash 인덱스로 구분한다.
- B-Tree 인덱스(Balanced index): 균형잡힌 트리
- Hash 인덱스
최근에는 Fractal-Tree인덱스나 로그 기반의 Merge-Tree 인덱스와 같은 알고리즘을 사용하는 DBMS도 개발중이다.
B-Tree 인덱스 알고리즘: 가장 일반적으로 사용되는 인덱스 알고리즘이다. 칼럼의 값을 변형하지 않고 원래의 값을 이용해서 인덱싱하는 알고리즘이다.
Hash 인덱스 알고리즘은 칼럼의 값으로 해시값을 계산해서 인덱싱하는 알고리즘으로 매우 빠른 검색을 지원한다. 하지만, 값을 변형해서 인덱싱하므로 전방(Prefix) 일치와 같이 값의 일부만 검색하거나 범위를 검색할 때는 해시 인덱스를 사용할 수 없음. 메모리 기반의 데이터베이스에서 많이 사용된다.

데이터의 중복 허용 여부로 구분

유니크 인덱스(Unique Index): 같은 값이 1개만 존재한다.
유니크하지 않은 인덱스(Non-Unique): 같은 값이 여러 개 존재할 수 있다.
인덱스의 유니크한지 아니지의 여부는 옵티마이저에게 중요한 문제이다.
- 동등 조건(Equal, =)로 검색하는 건 1개의 결과만 찾으면 더 이상 찾지 않아도 된다고 옵티마이저에게 알려주는 효과를 낸다.

출처 - 「Real MySQL 8.0 - 백은빈, 이성욱」 위키북스

Chapter 08.04 R-Tree 인덱스 ~ 08.05 전문 검색 인덱스 (0)	2022.12.29
Chapter 08.03 B-Tree 인덱스 (0)	2022.12.24
Chapter 05. 트랜잭션과 잠금 (0)	2022.12.08
Chapter 04.03 MyISAM 스토리지 엔진 아키텍처(architecture) ~ 04.04 MySQL 로그 파일 (0)	2022.12.06
Chapter 04.02 InnoDB 스토리지 엔진 아키텍처(architecture) (2)	2022.11.30

Java Backend Developer lan4250@naver.com https://github.com/goraneee

코드업, DB, GIT, Queue, SQL, dfs, 스프링, mysql, Java, dp, JPA, 제로베이스 스쿨, Stack, BFS, 백준, 자바, 알고리즘, 데이터베이스, 프로그래머스, 제로베이스 백엔드,

계란 블로그