데이터는 구조화된 형태에 따라 분류할 수 있다.
수집한 데이터가 구조가 있는지, 구조에 대한 설명과 내용이 같이 있는지, 정해진 구조가 없는지에 대해 분류할 수 있다.
정형 데이터
정형 데이터는 내용이 미리 정해진 구조가 있는 데이터이다.
- 데이터 구조에 대한 설명과 데이터 내용은 별도로 유지된다.
엑셀의 스프레드시트, 관계 데이터베이스에서 테이블 등이 있다.
반정형 데이터
반정형 데이터는 구조에 따라 저장된 데이터지만, 내용 안에 구조에 대한 설명이 같이 있는 경우이다.
- 구조를 파악하는 파싱(parsing) 과정이 필요하다. 보통 파일 형태로 저장된다.
HTML, XML, JSON문서, 센서 데이터 등이 있다.
비정형 데이터
비정형 데이터는 정해진 구조가 없는 데이터이다.
SNS의 텍스트, 영상, 이미지, 음성 데이터 등이 있다.
'개발 > 데이터베이스(DB)' 카테고리의 다른 글
[데이터베이스] 데이터베이스 관리 시스템(DBMS)의 등장 배경 (0) | 2023.04.11 |
---|---|
[데이터베이스] 특성에 따른 데이터 분류 + 정성적 데이터, 정량적 데이터 (0) | 2023.04.11 |
[데이터베이스] 시스템(system)이란? 정보 시스템(information system)이란? (0) | 2023.04.11 |
[데이터베이스] 데이터(data)와 정보(information)의 차이는 무엇일까? (0) | 2023.04.11 |
[데이터베이스] 데이터베이스(Database)란? 쿼리(Query)란? (0) | 2023.04.10 |