1. 물리 데이터 모델링 설계
< 물리 데이터 모델링 개념 >
- 논리모델을 적용하고자 하는 기술에 맞도록 상세화해가는 과정
- 물리 데이터 모델링 변환 절차
- 개체를 테이블로 변환
- 속성을 컬럼으로 변환
- UID를 기본키를 변환
- 관계를 외래키로 변환
- 컬러 유형과 길이 정의
- 반 정규화 수행
2. 물리 데이터 저장소 구성
< 테이블 제약조건 설계 >
- 참조무결성 제약조건 : 릴레이션과 릴레이션 사이에 대해 참조의 일관성을 보장하기 위한 조건
- 제한(Restricted) : 참조무결성 원칙을 위배하는 연산을 거절하는 옵션
- 연쇄(Cascade) : 참조되는 릴레이션에서 튜플을 삭제하고, 참조되는 릴레이션에서 이 튜플을 참조하는 튜플들도 함께 삭제하는 옵션
- 널 값(Nullify) : 참조되는 릴레이션에서 튜플을 삭제하고, 참조하는 릴레이션에서 해당 튜플을 참조하는 튜플들의 외래 키에 NULL 값을 넣는 옵션
< 인덱스 설계 >
- 인덱스 : 검색 연산의 최적화를 위해 데이터베이스 내 열에 대한 정보를 구성한 데이터구조
- 인덱스 컬럼 선정 : 분포도가 좋은 컬럼은 단독적으로 생성 / 자주 조합되어 사용하는 컬럼은 결합 인덱스로 생성 / 수정이 빈번하지 않은 컬럼을 선정
< 클러스터 설계 >
- 인덱스의 단점을 해결한 기법으로, 분포도가 넓을수록 오히려 유리
- 처리 범위가 넓어 문제가 발생하는 경우는 단일 테이블 클러스터링을 고려
- 조인이 많아 문제가 발생되는 경우는 다중 테이블 클러스터링을 고려
< 파티션 설계 >
- 파티션 종류 :
레인지 파티셔닝 | 연속적인 숫자나 날짜를 기준 |
해시 파티셔닝 | 파티션 키의 해시 함수 값에 의한 파티셔닝 기법 |
리스트 파티셔닝 | 특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능한 파티셔닝 기법 |
컴포지트 파티셔닝 | 레인지 파티셔닝, 해시 파티셔닝, 리스트 파티셔닝 중 2개 이상의 파티셔닝을 결합하는 파티셔닝 기법 |
- 장점 : 성능 향상 / 가용성 향상 / 백업 가능 / 경합 감소
1. 데이터베이스 종류
< 데이터베이스 >
- 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합
- 데이터 베이스 정의 : 통합된 데이터 / 저장된 데이터 / 운영 데이터 / 공용 데이터
- 데이터 베이스 특성 :
실시간 접근성 | 쿼리에 대하여 실시간 응답이 가능해야 함 |
계속적인 변화 | 새로운 데이터의 삽입, 삭제, 갱신으로 항상 최신의 데이터를 유지 |
동시 공용 | 다수의 사용자가 동시에 같은 내용의 데이터를 이용할 수 있어야 함 |
내용 참조 | 데이터 베이스에 있는 데이터를 참조할 때 사용자가 요구하는 데이터 내용으로 데이터를 찾음 |
- 데이터 베이스 종류 : 파일 시스템 / 관계형 데이터베이스 관리시스템(RDBMS) / 계층형 데이터베이스 관리시스템(HDBMS) / 네트워크 데이터베이스 관리시스템(NDBMS)
< DBSM >
- 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어
- DBMS 유형 :
Key-Value DBMS (키-값 DBMS) |
키 기반 Get / Put / Delete 제공, 메모리 기반에서 성능 우선 시스템 및 빅데이터 처리 가능 DBMS |
Column Family Data Store DBMS (컬럼 기반 데이터 저장 DBMS) |
Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DBMS |
Document DBMS (문서 저장 DBMS) |
값의 데이터 타입이 문서라는 타입을 사용하는 DBMS |
Graph DBMS (그래프 DBMS) |
시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS |
- DBMS 특징 : 데이터 무결성 / 데이터 일관성 / 데이터 보안성 / 데이터 회복성 / 데이터 효율성
< 데이터베이스 기술 트랜드 >
- 빅데이터 : 시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트 크기의 비정형 데이터
- 빅데이터 특성 : 데이터의 양(Volume) / 데이터의 다양성(Variety) / 데이터의 속도(Velocity)
- NoSQL : 데이터 저장에 고정된 테이블 스키마가 필요하지 ㅇ낳고 조인 연산을 사용할 수 없으며 수평적으로 확장이 가능한 DBMS
- NoSQL 특성 : BASE
Basically Available | 얼마든지 데이터는 접근할 수 있어야 하는 속성 |
Soft-State | 노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 전송된 정보를 통해 결정되는 속성 |
Eventually Consistenty | 일정 시간이 지나면 데이터의 일관성이 유지되는 속성 |
- NoSQL 유형 : Key-Value Store / Column Family Data Store / Document Store / Graph Store
- 데이터 마이닝 : 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술
- 데이터 마이닝 주요 기법 :
분류 규칙 | 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 이를 토대로 새로운 레코드의 결과 값을 예측하는 기법 |
연관 규칙 | 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법 |
연속 규칙 | 연관 규칙에 시간 관련 정보가 포함된 형태의 기법 |
데이터 군집화 | 대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업으로 작업의 특성이 분류규칙과 유사 |
'8. 자격증 > 8-1. 정보처리기사' 카테고리의 다른 글
정처기 실기 5-1. 인터페이스 설계 확인 / 5-2. 인터페이스 기능 구현 / 5-3. 인터페이스 구현 검증 (0) | 2021.10.08 |
---|---|
정처기 실기 4-1. 연계 데이터 구성 / 4-2. 연계 메커니즘 구성 / 4-3. 내외부 연계 모듈 구현 (0) | 2021.10.07 |
정처시 실기 3-1. 논리 데이터 저장소 확인 (0) | 2021.10.05 |
정처기 실기 2-2. UI 설계 (0) | 2021.10.05 |
정처기 실기 2-1. UI 요구사항 확인 (0) | 2021.10.05 |