본문 바로가기
CS

데이터베이스 기술 트랜드

by Forsaken Developer 2023. 4. 5.
728x90
728x90

데이터베이스 기술 트랜드

빅데이터(Big Data)

시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트 크기의 비정형 데이터

빅데이터의 특성

  • 데이터의 양(Volume)
  • 데이터의 다양성(Variety)
  • 데이터의 속도(Velocity)

빅데이터 수집, 저장, 처리 기술

  • 비정형/반정형 데이터 수집
  • 정형 데이터 수집
  • 분산데이터 저장/처리
  • 분산데이터 베이스

빅데이터 분석, 실시간 처리 및 시각화를 위한 주요 기술

  • 빅데이터 분석
  • 빅데이터 실시간 처리
  • 분산 코디네이션
  • 분석 및 시각화

NoSQL

전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어

데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며 수평적으로 확장이 가능한 DBMS

NoSQL의 특성

  • Basically Available : 언제든지 데이터는 접근할 수 있어야 하는 속성
  • Soft-State : 노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 전송된 정보를 통해 결정되는 속성
  • Eventually Consistency : 일정 시간이 지나면 데이터의 일관성이 유지되는 속성

NoSQL의 유형

  • Key-Value Store
  • Column Family Data Store
  • Document Store
  • Graph Store

데이터 마이닝(Data Mining)

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술

대규모 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 기법

데이터마이닝 절차

  1. 목적 설정
  2. 데이터 준비
  3. 가공
  4. 마이닝 기법 적용
  5. 정보 검증

데이터마이닝 주요 기법

  • 분류 규칙(Classification) : 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 이를 토대로 새로운 레코드의 결과 값을 예측하는 기법
  • 연관 규칙(Association) : 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
  • 연속 규칙(Sequence) : 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
  • 데이터 군집화(Clustering) : 대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업으로 정보가 없는 상태에서 데이터를 분류하는 기법
728x90
반응형

'CS' 카테고리의 다른 글

트랜잭션  (0) 2023.04.06
연계 모듈 구현 환경 구성 및 개발  (0) 2023.04.05
데이터베이스의 종류  (0) 2023.04.05
물리 데이터 모델 설계  (0) 2023.04.04
데이터 모델과 논리데이터 모델링  (0) 2023.04.04

댓글