ChainSmoker’s Block

[하나하나DATABASE] 01. 데이터베이스의 기본 개념 - 1_3 본문

개인공부(WEB, Python, DB)/DATABASE

[하나하나DATABASE] 01. 데이터베이스의 기본 개념 - 1_3

ChainSmokers 2022. 7. 7. 14:43

[01. 데이터베이스의 기본 개념]

--03. 데이터와 데이터베이스

: 데이터베이스의 가장 중요한 목적은 데이터를 모아두는 것이다. 데이터과학, 빅데이터도 결국은 데이터를 수집하는 것에서부터 그 기술이 시작된다. 나에게 맞는 데이터르 ㄹ수집하기 위해서는 먼저 수집대상이 되는 데이터의 유형을 파악하고 있어야 한다. 그리고 유형별로 저장 및 처리 기술을 적합하게 선택하는 것이 중요하다. 일반적으로 데이터는 형태에 따라 정형데이터, 반정형데이터, 비정형데이터로 분류할 수 있다.

 

-1. 정형 데이터

: 정형 데이터는 구조화된 데이터로, 미리 정해진 구조에 따라 저장된 데이터를 말한다.

 

-2. 반정형 데이터

: 반정형 데이터는 구조에 따라 저장된 데이터이지만 정형 데이터와는 다르게 데이터 내용 안에 구조에 대한 설명이 함께 존재하는 데이터를 말한다. 데이터 내용에 대한 설명이나 구조를 파악하는 피싱과정이 필요하고, 보통 파일형태로 저장된다. HTML, XML, JSON문서나 웹 로그, 센서 데이터등이 반정형 데이터에 속한다.

 

-3. 비정형 데이터

: 정해진 구조가 없이 저장된 데이터를 말하며 소셜 데이터의 텍스트, 영상, 이미지, 워드나 PDF 문서와 같은 멀티미디어 데이터가 대표적인 예이다.

NOTE

: <XML 데이터베이스와 멀티미디어 데이터베이스>

앞서 살펴본 데이터베이스는 문자나 숫자로 구성된 정형 데이터를 담고 있는 보편적 데이터베이스로 오랜 역사만큼이나 반정형, 비정형 데이터 같은 다른 유형의 데이터를 위주로 저장하는 데이터베이스를 구축하기 위해 오랫동안 다양한 시도가 있어왔다. 대표적인 예시로는 XML 데이터베이스와 멀티미디어 데이터베이스가 있다.

*XML 전용 데이터베이스를 구성하는 경우엔 데이터 처리를 위해 XQuery라는 언어를 별도로 사용한다.

반응형