어느 가을날의 전환점

ORACLE|Primary Key와 Unique Index의 성능 본문

Database/Oracle

ORACLE|Primary Key와 Unique Index의 성능

어느가을빛 2013. 3. 22. 10:00
Primary Key와 Unique Index의 차이

1. Primary Key는 Constraints이고, Unique Index는 인덱스이다.
2. Primary Key는 암묵적으로 Not Null Constraints를 갖는다.
3. Unique Index는 구성 컬럼에 Null 값을 인정한다고 가정 한다.

따라서, Select count(*) from tab1; 이라는 SQL은 tab1에 Primary Key가 없는 한 Table Full Scan을 할 것이다.
반대로 Constraints가 존재하는 경우 Index Fast Full Scan으로 작업할 것이다.

# 출처: http://blog.naver.com/s70097/70079596066


Unique Index란?
Unique Index로 컬럼이 잡혀 있으면 해당 컬럼에는 중복된 데이터가 들어가지 않는다. 
ndex로 잡혀있는 컬럼이 여러개라면 그 컬럼들의 합이 모두 유일해야만 하나의 레코드가 생성 가능하다.


Unique Index만 사용하여 PK를 정상적으로 생성하지 않으면 데이터 모델에 대한 파악이 힘들다. 뿐만 아니라 원래 PK로 설정되어야할 컬럼에 Null이 포함된 데이터가 있을 수도 있고 참조 무결성 제약 조건을 못 걸게 된다.


Primary Key와 Unique Index의 비교
 항목 Primary Key Unique Index 
 목적 Constraint + Index Index
 공통점 유일성 보장 유일성 보장
 참조 무결성 PK/FK에 의해 지정 가능 지정 불가능
 테이블당 개수 1개만 가능 여러 개 가능
 인덱스 생성 Unique Index 생성 Unique Index 생성
 역공학 적용시 PK 인식 가능 PK인식 불가능
 Null 허용 허용 안됨 허용됨


Unique Index만을 이용하였을때 장단점
장점
  • PK/FK가 존재하지 않아 DBA가 데이터베이스를 관리하기 쉽다.
  • 개발 시점에 데이터 제약이 없으므로 개발이 용이하다.
  • PK/FK를 이용하지 않기 때문에 성능이 좋아질 수도 있다.

단점

  • 데이터 무결성이 깨어질 수 있다.
  • 데이터 무결성이 깨어지기 때문에 데이터 전환 작업 시 데이터 정리 작업이 필요하다.
  • 데이터 모델과 테이블의 관계가 일치하지 않는다.
  • Unique Index는 한 테이블에 여러개 만들 수 있으므로 테이블만 보고 PK가 무엇인지 구분할 수 없다.

Primary Key 사용시의 장점

  • 전체 데이터 베이스에 대한 PK/FK관계를 설정할 수 있어 참조 무결성 제약 조건 지정이 가능하다.
  • 따라서 참조 무결성을 깨뜨리는 무결성 오류를 방지할 수 있다.
  • 유일성을 보장할 수 있다.
  • PK속성에 대해서 NULL을 허용하지 않는다.
  • 테이블에 한개의 PK만 허용이 되므로 향후 데이터베이스에서 역공학을 적용하여 데이터 모델을
    생성해도 정확하게 PK가 무엇인지 구분이 가능하다.
  • FK를 설정하지 않는다면 UI만을 사용하는 것에 비해 성능 저하가 나타나지 않는다.
  • FK를 사용해도 FK인덱스만 적절하게 설정해 준다면 염려할 만큼 과도한 성능저하 현상은 없다.



결론은 PK를 선택하여 사용하라는 것이다. 
Unique Index가 PK에 비해 장점이 있다면 개발과 유지보수에 약간의 편리함을 제공한다는 것이다.

데이터 모델링을 할때, 그리고 데이터 베이스를 구축할 떄는 
1순위 : 데이터무결성
2순위 : 데이터베이스 성능
3순위 : 데이터베이스 관리의 용이성
4순위 : 개발자 편의성
위의 4가지 기준에 의해 판단해야한다.

PK를 사용하지 않는다는 것은 1순위의 데이터의 무결성을 데이터베이스에 맡기지 않고 전적으로 애플리케이션에서 주관한다는 의미이다. 애플리케이션은 여러 개발자가 긴 시간동안 개발하면서 문제도 많이 생길 수 있고 변경도 있으므로 데이터 무결성을 100% 유지하기가 현실적으로 불가능하다.

업무의 흐름이 중요하고, 모아진 데이터에 대해 정확한 통계데이터를 산출하고자 하는 업무라면 데이터 무결성 유지가 관건이 된다.


성능저하 소문의 정체
PK/FK의 자체적인 문제보다 그것을 사용하는 방법을 제대로 몰랐다는 것이 문제였다. 최근에는 하드웨어의 성능도 빨라졌고 DBMS의 기능도 완별할 뿐만 아니라, 개발자들이 PK/FK를 설정할 때 관련된 인덱스를 생성하는 노하우를 알고 있으므로 성능저하 문제를 예방할 수 있다.


SAP ERP와 오라클 ERP의 Unique Index의 젹용은 왜?
가장 큰 이유는 ERP자체가 원소스 멀티 유즈(One source Multi Use)의 사상을 가지고 있기 때문이다.
PK가 절대적으로 고정되어 있으면 일부 유연성을 요구하는 사이트에서는 문제가 될 수있기 때문에, 비슷하지만 내부적으로 차이가 있는 비즈니스 모델을 수용하기 위해 고정적인 PK를 쓰기 보다는 각 엔티티타입에 Unique Index를 붙여 사용하는 것이다.

각 테이블간의 참조 무결성 제약조건은 DBMS프로시저나 내부 프로그램되어 있는 소스 코드를 통해 무결성을 유지시키는 역할을 하는 로직을 포함하고 있기 때문에 가능하다.


#출처: http://devbab.tistory.com/6


유니크인덱스와 PK의 차이점? 조회: 413 2004-03-26 
김윤선(covey02) 

PK와 유니크 인덱스의 차이점은 뭔가요? 

테이블에서 FK를 사용하지 않는다면 유닉스 인덱스 만으로도 가능한데.. 
굳이 PK를 잡는 이유는 뭔지 알고 싶습니다. 

테이블을 대표하는 것을 나타내기위해 PK를 쓴다는 말이 있는데... 
이건 유닉스 인덱스로 대치 할 수 없는건가요? 

PK와 유니크 인덱스 중 유니크인덱스로만 구성했을때 퍼포먼스가 더 빠르다고 하던데 맞는 말인지 알고 싶습니다. 맞다면 어떻게 해서 더 빠른지두 알고 싶습니다.





유니크인덱스와 PK의 차이점? 2004-03-26 
유기연(inyou2) 

PK와 유니크 인덱스는 비교 하기엔 좀 무리가 있다고 보는데요 
Table 생성시 PK에 자동적으로 유니크 인덱스가 생성 됩니다. 
일반적인 유저가 생성하는 인덱스는 유닉스 인덱스로 만들지 않는것이 
좋습니다. 
만일 PK없이 유저가 유니크 인덱스만 만들었다고 해도 PK를 대신할수는 없습니다. 
옵티마이져가 실행계획시 인덱스 안타고 FTS 하면 인덱스는 아무 소용이 없는거죠. 
인덱스와 키는 개념 자체가 틀린겁니다. 
테이블에서 FK를 사용 하지 않아도 PK는 필요합니다. 
이유를 말하자면 모델링 측면에서는 Relational 개념에 부합하는거겠고 
Database측면으로 보자면 옵티마이져가 
빠른 실행계획을 만드는데 도움이 되겠죠... 
굳이 따지자면 PK와 유니크키의 차이점을 물어 보시는듯 하는데요.. 
큰 차이점은 유니크키는 널 값을 허용 하는 겁니다. 
키가 될수 있는 후보 키가 유니크키고 그중 가장 값을 유일하게 구별해 주는 넘을 
PK라고 이해하시면 될듯 합니다. 
PK없이 유니크인덱스로만 구성했을때 퍼포먼스가 더 빠르냐는 문제점은 
당시 테이블의 데이타의 양 및 어떤 분포도를 가지냐에 따라 
사례에 따라 천차 만별 달라집니다. 
튜닝및 퍼포먼스 문제는 언제나 딱 잘라 절대적으로 말할수 없는 문제죠... 









유니크인덱스와 PK의 차이점? 2004-03-26 
김인호(yesino) 

안녕하세요.. 이노입니다. 


궁금해하시는 내용에 대한 답변은 예전 좀 다른 문제로 제가 답변을 올렸던 경우와 
유사한 듯 하여 그때 내용을 간략하게 다시 올리겠습니다. 

먼저 PK Index와 Unique Index의 차이는 간단하게 Nullable의 차이라고 하겠습니다. 
쉽게 말해서 PK Index라는 것은 Unique Index + Not Null을 의미합니다. -> 뒷부분에서 근본적으로 차이가 있다라고 설명합니다.
반대로 Unique Index는 인덱스가 걸리는 필드에 대해서도 Null을 허용하죠. 
즉, 특정 테이블의 컬럼에 대해 Unique 인덱스가 있다고 해서, 해당 필드에 Null 값을 
Insert 못하지는 않습니다. 하지만, PK Index가 설정되어 있다고 한다면 자동으로 
해당 필드에 대한 Not null 제약조건이 생기기 때문에 Null을 insert할 수 없죠. 

이러한 이유로 인해, SQL의 경우에 따라서는 Unique Index임에도 불구하고 Table 
Access를 하는 예도 있습니다. 해당 값이 Not Null임을 보장하지 못하기 때문이죠. 
따라서 SELECT문의 경우 때로는 오히려 Unique보다 PK가 아주 근소한 차이지만 더 
빠른 경우도 있습니다. 물론, INSERT의 경우 제약조건에 대한 체크로 인해 조금 더 
느릴(?)수도 있겠지요.. 

실제 테스트를 해봐도, 특정 field의 값에서 max값을 추출하고자 하는데 null이 포함되어 있으면 실제로 index search에서 찾은 값이 null인지 값을 가지고 있는지는 테이블을 뒤져봐야 알 수 있는 정보가 됩니다. -> 그래서 질문할 때 말했던, unique index가 더 빠르다는 것은 경우에 따라서 반대로 primary key 일때 더 빠를 수 있다. 겠네요 
그래서 PK Index인 경우에는 (null을 가진 필드가 없음을 보장해주기 때문에..)index 영역안에서 결과 값을 리턴해줄 수 있고, Unique의 경우에는 데이터 영역까지 가서 실제 값을 확인해봐야 하는 결과가 나옵니다. 
(이러한 경우도 Analyze나 테이블에 대한 정확한 통계가 있다면 그렇지 않을수도..) 


이상 짧은 제 소견이였습니다. 
원하시는 답변이 어느 정도 되셨는지 모르겠습니다. 


행복한 하루 되시기를~~


유니크인덱스와 PK의 차이점? 2004-03-27 
조시형(oraking) 

안녕하십니까? 엔코아 정보컨설팅에 근무하는 컨설턴트 조시형입니다. 

우선 Primary Key와 Unique Index의 차이점을 설명하는 것은 부적절하다는 말씀을 드리고 싶습니다. 둘간의 상관관계를 설명하는 것이 맞는 개념입니다. 많은 개발자들이 PK는 왠지 부하를 준다는 잘못된 선입견을 가지고 있고 따라서 PK 대신 Unique Index를 사용하는 것으로 알고 있는데 매우 그릇된 관행(?)이라고 생각합니다. 따라서 앞에서 다른 분들이 좋은 설명 많이 해 주셨지만 부연해서 설명을 드리도록 하겠습니다. 

Primary Key라고 하는 것은 논리적인 개념입니다. Primary Key는 해당 컬럼이 그 테이블의 식별자임을 나타내는 것으로서, 자신과 다른 레코드가 서로 다른 인스턴스임을 확인할 수 있게 해 주는 역할을 합니다. 즉, 해당 그 레코드의 존재자체인 것이지요. 
원래 사람이름이라는 것이 '나'와 다른 사람을 식별하기 위해 사용하는 것인데, 다른 사람과 중복될 수 있으므로 나를 식별할 수 있는 속성으로서 주민등록번호라는 것을 대신 사용합니다. 따라서 주민등록번호는 나와 별개가 아닌 나의 존재 그 자체입니다. 철학적으로는 맞지 않는 설명이겠지만 적어도 ‘데이터의 세계’에서는 그렇습니다. 

반면 PK constraint는 물리적인 개념입니다. "이 컬럼(들)은 다른 레코드와 구분짓는 식별자 역할을 하는 중요한 컬럼이므로 데이터는 중복을 허용해서는 안 되고(unique), null값을 허용해서도 안돼(not null)"라고 DB에게 정보를 주는 것입니다. primary key constraint를 설정하면 unique index와 not null constraint가 자동적으로 생성되는 이유도 여기에 있지요.  -> 스터디할때 primary key는 논리적인 개념이고 index는 실제로 눈에 보이는 물리적인 것이라고 했는데, 설명을 좀 틀린것 같습니다. Primary Key가 논리적인 개념이며, PK Constraint 와 not null 등의 제약조건과 unique index 들이 물리적인 개념이라고 하는게 맞겠군요. 
특히 인덱스는 PK 컬럼의 Unique성을 보장하기 위해 매우 필수적인 도구인데, 만약 인덱스 없이 해당 컬럼값이 중복되지 않도록 할 수 있는 방법을 생각해 보시기 바랍니다. 잘 떠오르지 않을 것입니다. 결론적으로 말씀드리면, 인덱스와 PK의 상관관계에 있어서 Unique이든 Non-Unique이든 Index라는 놈은 PK 컬럼의 Unique성을 보장하기 위해 사용하는 하나의 도구(Tool)에 지나지 않습니다. 
어떤 의미에서만 본다면, 어느 한 컬럼에 Not Null Constraint를 주고, 그 컬럼에 Unique Index를 생성하였다면 primary key와 다를 것이 하나도 없어 보입니다. 
하지만 primary key는 데이터베이스와 사용자 입장에서 매우 중요한 정보 역할을 하기 때문에 중요하다고 말씀드리고 싶습니다. 
앞서 말씀드렸듯이, 원래 primary key는 “이 컬럼(들)이 테이블의 식별자(identifier)이므로 중복을 허용해서는 안 되고, null값을 허용해서도 안 된다”라는 의미론적(semantic) 인 의미에서 정의하는 것이며, DBMS는 이를 효과적으로 처리하기 위해서 index를 자동생성해서 사용하고 not null constraint를 정의하는 것입니다. 
참고로 primary key를 위해서 반드시 unique index가 필요한 것은 아닙니다. non-unique index만 있더라도 새로운 값이 들어올 때 중복값이 있는지 체크하는 데에는 전혀 문제가 없으므로 기존에 이미 non-unique 인덱스가 정의되어 있는 상황이었다면 그 인덱스를 그대로 사용합니다. DW 시스템에서 대량의 데이터 로딩시 속도를 빠르게 하기 위해 PK Constraint를 일시적으로 Disable 시키는 경우가 있는데 이렇게 되면 Unique Index도 동시에 제거되므로 인덱스를 다시 생성해야 하는 부담이 생깁니다. 이러한 부담을 덜기 위해 의도적으로 non-unique index를 생성하는 경우가 있는데 이에 대해서는 더 깊이 언급하지 않겠습니다. -> 스터디할때 책에 나왔던 부분입니다. primary constraint key 를 생성하면 자동적으로 unique index가 생기는데, 주의할점은 primary constraint key를 해제할 때 unique index 도 자동적으로 삭제된다, 따라서 연기가능한 제약조건(맞나?) 등을 이용할 수 있다. 라는 부분이었습니다. 그때는 사람이 실수나, 다른 이유로 제약조건을 삭제할 때 인덱스까지 없어지므로 갑자기 느려지는 상황이 올 수 있다. 라고 말을 했었는데요, 그런 경우와 함께 DW 시스템 (OLAP) 에서 데이터 로딩 속도를 빠르게 하기 위해 PK Constraint 를 일시적으로 Disable 하는 경우가 있어서, 이것땜에 인덱스를 다시 생성하는 경우가 있다. 그래서 의도적으로 non-unique index 를 생성하는 경우가 있다.. 라고 하네요. 설명을 끝까지 하지 않아서 아쉽지만 어쨌든 공부한게 나왔네요
하여튼 primary key, foreign key, not null 등과 같은 integrity constraint 정보들은 plan을 생성하고, query rewrite(주로 DW에서 많이 사용되는 기능임)를 수행할 때, 그리고 기타 여러가지 용도로 데이터베이스에 의해 사용되어집니다. 
그리고 OLAP Tool과 같이 데이터베이스에 접근하는 여러 tool들이 동적으로 ad-hoc query를 생성할 때 이 정보들을 활용합니다. 
optimizer와 tool 입장에서 뿐만 아니라 데이터베이스를 사용하는 사용자 입장에서도 실제 document 역할을 하게 되므로 의미가 있습니다. ER Diagram을 보지 않고 data dictionary에 있는 정보만을 보고도 그 테이블의 식별자(Identifier)가 어떤 컬럼으로 구성되어 있는지 쉽게 확인할 수 있잖아요. 
이런 좋은 기능과 역할을 하는데도 불구하고 unique index와 not null 만을 정의해서 primary key 기능을 대신하도록 할 이유는 없지 않을까요? 
성능과 관련해서 말씀드리면, Not Null Constraint와 Unique 인덱스를 PK Constraint 대신 사용하는 것이 더 속도가 빠르다는 것은 전혀 근거없는 낭설에 불과합니다. 오히려 SQL 옵티마이저에게 더 많은 정보를 제공함으로써 더 좋은 실행계획을 만드는데 일조하게 되고 따라서 더 빨라지는 경우가 많겠지요...


#출처: http://blog.naver.com/soonhg/40033913881


Comments