728x90
728x90
데이터베이스 기술 트랜드
빅데이터(Big Data)
시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트 크기의 비정형 데이터
빅데이터의 특성
- 데이터의 양(Volume)
- 데이터의 다양성(Variety)
- 데이터의 속도(Velocity)
빅데이터 수집, 저장, 처리 기술
- 비정형/반정형 데이터 수집
- 정형 데이터 수집
- 분산데이터 저장/처리
- 분산데이터 베이스
빅데이터 분석, 실시간 처리 및 시각화를 위한 주요 기술
- 빅데이터 분석
- 빅데이터 실시간 처리
- 분산 코디네이션
- 분석 및 시각화
NoSQL
전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어
데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며 수평적으로 확장이 가능한 DBMS
NoSQL의 특성
- Basically Available : 언제든지 데이터는 접근할 수 있어야 하는 속성
- Soft-State : 노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 전송된 정보를 통해 결정되는 속성
- Eventually Consistency : 일정 시간이 지나면 데이터의 일관성이 유지되는 속성
NoSQL의 유형
- Key-Value Store
- Column Family Data Store
- Document Store
- Graph Store
데이터 마이닝(Data Mining)
대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술
대규모 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 기법
데이터마이닝 절차
- 목적 설정
- 데이터 준비
- 가공
- 마이닝 기법 적용
- 정보 검증
데이터마이닝 주요 기법
- 분류 규칙(Classification) : 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 이를 토대로 새로운 레코드의 결과 값을 예측하는 기법
- 연관 규칙(Association) : 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
- 연속 규칙(Sequence) : 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
- 데이터 군집화(Clustering) : 대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업으로 정보가 없는 상태에서 데이터를 분류하는 기법
728x90
반응형
'CS' 카테고리의 다른 글
트랜잭션 (0) | 2023.04.06 |
---|---|
연계 모듈 구현 환경 구성 및 개발 (0) | 2023.04.05 |
데이터베이스의 종류 (0) | 2023.04.05 |
물리 데이터 모델 설계 (0) | 2023.04.04 |
데이터 모델과 논리데이터 모델링 (0) | 2023.04.04 |
댓글