카테고리 없음

내일배움캠프_QA/QC 아티클 스터디_양질의 데이터를 판별하는 5가지 방법:③ 관계형 데이터베이스인가?

iron-min 2025. 9. 25. 19:52

https://yozm.wishket.com/magazine/detail/1096/

 

양질의 데이터를 판별하는 5가지 방법 : 3 관계형 데이터베이스인가? | 요즘IT

보통 빅데이터의 특성을 이야기할 때 3V라는 단어를 언급하는 경우가 많습니다. Velocity(속도), Volume(양), Variety(다양성)까지 V로 시작하는 3가지 단어의 묶음입니다. 이때 Variety(다양성)이라는 단어

yozm.wishket.com

 

1. 아티클 요약 및 주요내용

⊙ 요약

관계형 데이터 베이스의 양식을 지켜야 양질의 데이터를 판단하고 이를 분석할 수 있다.

 

주요내용

관계형 데이터 베이스의 형식이 중요한이유, 관계형 데이터베이스의 형식

 

2. 핵심 개념 및 용어 정리

⊙ 핵심개념

1) 관계형 데이터 베이스의 형식이 중요한 이유: 보유한 다른 데이터와 유기적으로 연결하여 더  넓은 시야를 가질 수 있도록 데이터를 분석하려면 관계형 데이터베이스 양식을 따라야 합니다.

 

2) 관계형 데이터베이스 양식

키(KEY)의 존재 모든데이터에 키(KEY) 가 존재해야 데이터가 어떤 개인 혹은 상황을 의미하는지 파악할 수 있습니다.
데이터에 키가 없다면 다른 데이터  테이블과 결합을 하는 게 불가능합니다.
유일성, 무결성 양질의 데이터를 판별하기 위해 Key의 후보군을 찾고 키가 유일성과 무결성을 만족시키고 있는지 확인해야합니다.

 

⊙ 용어정리

관계형 데이터 베이스 : 데이터를 행(Row)과 열(Column)의 테이블 형태로 저장하여 서로 관계있는 데이터를 관리하는 방식.

키(KEY) : 데이터의 속성(열) 중 식별자로 이용 가능한 속성

유일성 : 하나의 키가 하나의 식별 값을 정확히 식별할 수 있어야 하는 조건

무결성 : 데이터에서 키값이 비어 있거나 중복되지 않아야 하는 조건