카테고리 없음
내일배움캠프_QA/QC 아티클 스터디_양질의 데이터를 판별하는 5가지 방법:③ 관계형 데이터베이스인가?
iron-min
2025. 9. 25. 19:52
https://yozm.wishket.com/magazine/detail/1096/
양질의 데이터를 판별하는 5가지 방법 : 3 관계형 데이터베이스인가? | 요즘IT
보통 빅데이터의 특성을 이야기할 때 3V라는 단어를 언급하는 경우가 많습니다. Velocity(속도), Volume(양), Variety(다양성)까지 V로 시작하는 3가지 단어의 묶음입니다. 이때 Variety(다양성)이라는 단어
yozm.wishket.com
1. 아티클 요약 및 주요내용
⊙ 요약
관계형 데이터 베이스의 양식을 지켜야 양질의 데이터를 판단하고 이를 분석할 수 있다.
⊙ 주요내용
관계형 데이터 베이스의 형식이 중요한이유, 관계형 데이터베이스의 형식
2. 핵심 개념 및 용어 정리
⊙ 핵심개념
1) 관계형 데이터 베이스의 형식이 중요한 이유: 보유한 다른 데이터와 유기적으로 연결하여 더 넓은 시야를 가질 수 있도록 데이터를 분석하려면 관계형 데이터베이스 양식을 따라야 합니다.
2) 관계형 데이터베이스 양식
| 키(KEY)의 존재 | 모든데이터에 키(KEY) 가 존재해야 데이터가 어떤 개인 혹은 상황을 의미하는지 파악할 수 있습니다. 데이터에 키가 없다면 다른 데이터 테이블과 결합을 하는 게 불가능합니다. |
| 유일성, 무결성 | 양질의 데이터를 판별하기 위해 Key의 후보군을 찾고 키가 유일성과 무결성을 만족시키고 있는지 확인해야합니다. |
⊙ 용어정리
관계형 데이터 베이스 : 데이터를 행(Row)과 열(Column)의 테이블 형태로 저장하여 서로 관계있는 데이터를 관리하는 방식.
키(KEY) : 데이터의 속성(열) 중 식별자로 이용 가능한 속성
유일성 : 하나의 키가 하나의 식별 값을 정확히 식별할 수 있어야 하는 조건
무결성 : 데이터에서 키값이 비어 있거나 중복되지 않아야 하는 조건