정처기 실기 3-2. 물리 데이터 저장소 설계 / 3-3. 데이터베이스 기초 활용하기

1. 물리 데이터 모델링 설계

< 물리 데이터 모델링 개념 >

- 논리모델을 적용하고자 하는 기술에 맞도록 상세화해가는 과정

- 물리 데이터 모델링 변환 절차

개체를 테이블로 변환
속성을 컬럼으로 변환
UID를 기본키를 변환
관계를 외래키로 변환
컬러 유형과 길이 정의
반 정규화 수행

2. 물리 데이터 저장소 구성

< 테이블 제약조건 설계 >

- 참조무결성 제약조건 : 릴레이션과 릴레이션 사이에 대해 참조의 일관성을 보장하기 위한 조건

제한(Restricted) : 참조무결성 원칙을 위배하는 연산을 거절하는 옵션
연쇄(Cascade) : 참조되는 릴레이션에서 튜플을 삭제하고, 참조되는 릴레이션에서 이 튜플을 참조하는 튜플들도 함께 삭제하는 옵션
널 값(Nullify) : 참조되는 릴레이션에서 튜플을 삭제하고, 참조하는 릴레이션에서 해당 튜플을 참조하는 튜플들의 외래 키에 NULL 값을 넣는 옵션

< 인덱스 설계 >

- 인덱스 : 검색 연산의 최적화를 위해 데이터베이스 내 열에 대한 정보를 구성한 데이터구조

- 인덱스 컬럼 선정 : 분포도가 좋은 컬럼은 단독적으로 생성 / 자주 조합되어 사용하는 컬럼은 결합 인덱스로 생성 / 수정이 빈번하지 않은 컬럼을 선정

< 클러스터 설계 >

- 인덱스의 단점을 해결한 기법으로, 분포도가 넓을수록 오히려 유리

- 처리 범위가 넓어 문제가 발생하는 경우는 단일 테이블 클러스터링을 고려

- 조인이 많아 문제가 발생되는 경우는 다중 테이블 클러스터링을 고려

< 파티션 설계 >

- 파티션 종류 :

레인지 파티셔닝	연속적인 숫자나 날짜를 기준
해시 파티셔닝	파티션 키의 해시 함수 값에 의한 파티셔닝 기법
리스트 파티셔닝	특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능한 파티셔닝 기법
컴포지트 파티셔닝	레인지 파티셔닝, 해시 파티셔닝, 리스트 파티셔닝 중 2개 이상의 파티셔닝을 결합하는 파티셔닝 기법

- 장점 : 성능 향상 / 가용성 향상 / 백업 가능 / 경합 감소

1. 데이터베이스 종류

< 데이터베이스 >

- 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합

- 데이터 베이스 정의 : 통합된 데이터 / 저장된 데이터 / 운영 데이터 / 공용 데이터

- 데이터 베이스 특성 :

실시간 접근성	쿼리에 대하여 실시간 응답이 가능해야 함
계속적인 변화	새로운 데이터의 삽입, 삭제, 갱신으로 항상 최신의 데이터를 유지
동시 공용	다수의 사용자가 동시에 같은 내용의 데이터를 이용할 수 있어야 함
내용 참조	데이터 베이스에 있는 데이터를 참조할 때 사용자가 요구하는 데이터 내용으로 데이터를 찾음

- 데이터 베이스 종류 : 파일 시스템 / 관계형 데이터베이스 관리시스템(RDBMS) / 계층형 데이터베이스 관리시스템(HDBMS) / 네트워크 데이터베이스 관리시스템(NDBMS)

< DBSM >

- 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어

- DBMS 유형 :

Key-Value DBMS (키-값 DBMS)	키 기반 Get / Put / Delete 제공, 메모리 기반에서 성능 우선 시스템 및 빅데이터 처리 가능 DBMS
Column Family Data Store DBMS (컬럼 기반 데이터 저장 DBMS)	Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DBMS
Document DBMS (문서 저장 DBMS)	값의 데이터 타입이 문서라는 타입을 사용하는 DBMS
Graph DBMS (그래프 DBMS)	시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS

- DBMS 특징 : 데이터 무결성 / 데이터 일관성 / 데이터 보안성 / 데이터 회복성 / 데이터 효율성

< 데이터베이스 기술 트랜드 >

- 빅데이터 : 시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트 크기의 비정형 데이터

- 빅데이터 특성 : 데이터의 양(Volume) / 데이터의 다양성(Variety) / 데이터의 속도(Velocity)

- NoSQL : 데이터 저장에 고정된 테이블 스키마가 필요하지 ㅇ낳고 조인 연산을 사용할 수 없으며 수평적으로 확장이 가능한 DBMS

- NoSQL 특성 : BASE

Basically Available	얼마든지 데이터는 접근할 수 있어야 하는 속성
Soft-State	노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 전송된 정보를 통해 결정되는 속성
Eventually Consistenty	일정 시간이 지나면 데이터의 일관성이 유지되는 속성

- NoSQL 유형 : Key-Value Store / Column Family Data Store / Document Store / Graph Store

- 데이터 마이닝 : 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술

- 데이터 마이닝 주요 기법 :

분류 규칙	과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 이를 토대로 새로운 레코드의 결과 값을 예측하는 기법
연관 규칙	데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
연속 규칙	연관 규칙에 시간 관련 정보가 포함된 형태의 기법
데이터 군집화	대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업으로 작업의 특성이 분류규칙과 유사

'8. 자격증 > 8-1. 정보처리기사' 카테고리의 다른 글

정처기 실기 5-1. 인터페이스 설계 확인 / 5-2. 인터페이스 기능 구현 / 5-3. 인터페이스 구현 검증 (0)	2021.10.08
정처기 실기 4-1. 연계 데이터 구성 / 4-2. 연계 메커니즘 구성 / 4-3. 내외부 연계 모듈 구현 (0)	2021.10.07
정처시 실기 3-1. 논리 데이터 저장소 확인 (0)	2021.10.05
정처기 실기 2-2. UI 설계 (0)	2021.10.05
정처기 실기 2-1. UI 요구사항 확인 (0)	2021.10.05

1. 물리 데이터 모델링 설계

2. 물리 데이터 저장소 구성

1. 데이터베이스 종류

'8. 자격증 > 8-1. 정보처리기사' 카테고리의 다른 글

티스토리툴바