[정보처리기사 실기 - 데이터베이스] 고급 데이터베이스 :: 소림사의 홍반장!

1. 분산 데이터베이스 (Distributed Database)

- 분산 데이터베이스는 논리적으로 같은 시스템에 속하지만 물리적으로는 컴퓨터 네트워크를 통해 분산되어 있는 데이터베이스이다.

 

(1) 분산 데이터베이스 시스템의 구성 요소

- 분산 처리기 : 자체적으로 처리 능력을 가지며 지리적으로 분산되어 있는 컴퓨터 시스템을 말한다.

- 분산 데이터베이스 : 지리적으로 분산되어 있는 데이터베이스로서 해당 지역의 특성에 맞게 데이터베이스가 구성

- 통신 네트워크 : 분산 처리기들을 통신망으로 연결하여 논리적으로 하나의 시스템처럼 작동할 수 있도록 하는 네트워크를 말한다.

 

(2) 분산 데이터베이스의 목표

- 위치 투명성 (Location Transparency) : 접근하려는 데이터베이스의 실제 위치를 알 필요 없이 단지 데이터베이스의 논리적인 명칭만으로 접근할 수 있다.

- 중복 투명성 (Replication Transparency) : 동일한 데이터가 여러 곳에 중복되어 있더라도 사용자는 마치 하나의 데이터만 존재하는 것처럼 사용할 수 있도, 시스템은 자동으로 여러 데이터에 대한 작업을 수행한다.

- 병행 투명성 (Concurrency Transparency) : 분산 데이터베이스와 관련된 다수의 트랜잭션들이 동시에 실행되더라도 그 트랜잭션들의 수행 결과는 서로 영향을 받지 않는다.

- 장애 투명성 (Failure Transparency) : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션은 항상 정확하게 수행횐다.

 

(3) 분산 데이터베이스의 장단점

장 점 

단 점 

지역 자치성이 높다.

데이터의 공유성이 향상된다.

분산 제어가 가능하다.

시스템 성능이 향상된다.

효율성 및 융통성이 높다.

신뢰성 및 가용성이 높다

점증적 시스템 용량 확장이 용이하다. 

DBMS가 수행할 기능이 복잡하다

데이터베이스 설계가 어렵다.

소프트웨어 개발 비용이 증가한다.

처리 비용이 증가한다.

잠재적 오류가 증가한다. 

 

 

 

2. 멀티미디어 데이터베이스(Multimedia Database)

- 멀티미디어 데이터베이스는 텍스트, 그래픽, 정지화상, 동영상, 음성 등이 복합적으로 구성된 데이터베이스이다.

 

(1) 멀티미디어 데이터베이스의 특성

- 데이터가 일반적으로 대용량이다.

- 정형화된 데이터가 아니고 검색 대상의 내용이 데이터의 중간에 있을 수 있으므로 미디어별로 별도의 검색 방법이 필요하다.

- 비정형 데이터이기 때문에 데이터의 구조가 복잡하고 관계를 구상하기가 어렵다.

 

(2) 멀티미디어 데이터베이스 구축 방법

- 파일 기반 기법 : 데이터의 동시접근이 어렵고 회복 기능 등의 지원이 빈약

- 관계형 데이터베이스 기반 기법 : LOB 데이터 타입 이용

- 객체 지향 데이터베이스 기반 기법 : 멀티미디어를 가장 잘 표현할 수 있는 기법

- 객체 관계형 데이터베이스 기반 기법 : LOB 데이터 타입, 사용자 정의 타입 이용

 

 

3. 주기억장치 데이터베이스

- 주기억장치 데이터베이스는 데이터베이스 전체를 주기억장치에 상주시킨 후 데이터베이스 연산을 수행하는 시스템으로, 디스크 입출력이 발생하지 않는다.

 

 

4. 데이터 웨어하우스 (Data Warehouse)

 

- 데이터 웨어하우스는 급증하는 다량의 데이터를 효과적으로 분석하여 정보화하고 이를 여러 계층의 사용자들이 효율적으로 사용할 수 있게 한 데이터베이스이다.

 

- 데이터 웨어하우스가 등장하게 된 배경은 전사적인 데이터 통합을 통한 정보의 효율적인 분석이 필요하게 되었고, 신속 정확한 의사결정으로 경쟁력을 확보하기 위하여 의사결정용 데이터베이스의 필요성이 대두되었기 때문이다.

 

- 데이터 웨어하우스에는 다양한 원본 데이터베이스로부터 정제되어 추출된 데이터만을 저장하고 필요한 인덱스를 생성한다. 이후, 데이터의 다차원 분석 도구로 데이터 웨어하우스를 분석하여 효율적인 의사결정에 필요한 자료를 얻는다.

 

- 데이터 웨어하우스의 장단점 

장 점  

단 점 

 높은 투자 수익률을 얻을 수 있다.

타사에 비하여 경쟁우위를 획득할 수 있다.

의사 결정자의 생산성을 향상시킬 수 있다.

기존 시스템과 명확한 역할 설정을 하지 못하면 업무의 혼란을 초래할 수 있다.

추출 기준에 맞지 않는 데이터의 입력, 갱신, 삭제가 발생하면 불일치 문제가 발생할 수 있다.

의사결정을 위한 충분한 데이터가 확보되지 않으면 정확한 결과를 도출할 수 없다.

과다한 자원을 사용하게 되고 유지 보수가 어렵다. 

 

 

 

5. 데이터 마트 (Data Mart)

 

- 데이터 마트는 전사적으로 구축된 데이터 웨어하우스로부터 특정 주제나 부서 중심으로 구축된 소규모 단일 주제의 데이터 웨어하우스를 말한다.

 

- 데이터 마트의 특징

- 전사적 데이터 웨어하우스의 데이터를 분석 요건에 적합한 구조로 재구성함

- 추세, 패턴 분석 및 데이터 접근이 용이한 요약 데이터로 구성되며, 필요 시 일부 상세 데이터 포함

- 다양한 질의나 요구를 충족하는 유연성과 접근성이 뛰어난 다차원 구조의 데이터

 

 

6. 데이터 마이닝 (Data Mining)

- 데이터 마이닝이란 데이터 웨어하우스에 저장된 데이터 집합에서 사용자의 요구에 따라 유용하고 가능성 있는 정보를 발견하기 위한 기법이다.

 

데이터 마이닝의 기법

(1) 연관(Associarion) : 대용량의 트랜잭션 데이터로부터 "A이면 B이다" 형식의 연관 관계를 발견하기 위한 방법.

(2) 연속(Sequence)

(3) 분류(Classification)

(4) 클러스터링(Clustering)

(5) 특성화(Characterization)

(6) 패턴 분석(Pattern Analysis)

(7) 경향 분석(Trend Analysis)

 

 

7. OLAP (Online Analytical Processing)

- 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석하여 의사결정에 활용하는 방식

- 데이터 웨어하우스나 데이터 마트와 같은 시스템과 상호 연관되는 정보 시스템

- OLAP의 종류

 구분

ROLAP 

MOLAP 

HOLAP 

기본구조 

관계형 데이터베이스 

다차원 데이터베이스 

다차원 데이터베이스

관계형 데이터베이스 

대용량 데이터 

원시 데이터 액세스 

분석기능 

구축시간 

6개월 이상 

3개월 내외 

3개월 내외 

핵심기술 

다차원 모델링 

다차원 데이터베이스 

다차원 데이터베이스

다차원 모델링 

적용 

전사적 데이터 웨어하우스 

데이터마트

EIS 

데이터마트

EIS 

 

 

 

8. OLTP (Online Transaction Processing)

- 온라인 업무 처리 형태의 하나로 네트워크 상의 여러 이용자가 실시간으로 데이터베이스의 데이터를 갱신하거나 검색하는 등의 단위 작업을 처리하는 방식

- 빠른 응답 시간을 요구하며, 개개의 레코드를 효율적으로 조회하고 수정할 수 있도록 정규화 되어 있다.

 

 

 

 

 

[참고] 2011 시나공 정보처리기사 실기 문제집

 

다른 카테고리의 글 목록

Dev. 관련자격증/정보처리기사 카테고리의 포스트를 톺아봅니다