데이터베이스(쉬운코드)

1. 데이터베이스 입문

youbing 2024. 11. 11. 22:34
본 내용은 유튜버 쉬운코드의 강의 "데이터베이스"를 참고하여 작성하였습니다.

 

DB & DBMS & DB system

  • database(DB) : 전자적으로 저장되고 사용되는 관련있는 데이터들의 조직화된 집합
  • DBMS(db management systems) : 사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 SW 시스템
    • ex) PostgreSQL, MySQL, ORACLE, Microsoft SQL Server
    • DB를 정의하다보면 부가적인 데이터가 발생한다. → metadata
    • metadata : DB를 정의하거나 기술하는 data (catalog라고도 부름)
      • ex) 데이터 유형, 구조, 제약 조건, 보안, 저장,인덱스, 사용자 그룹 등
      • metadata 또한 DBMS를 통해 저장/관리됨.
  • DB system : DB + DBMS + 연관된 applications
    • 줄여서 database라고도 부름


data models

  • DB의 구조를 기술하는데 사용될 수 있는 개념들이 모인 집합
  • DB 구조를 추상화해서 표현할 수 있는 수단 제공
    • DB 구조 : 데이터 타입, 데이터 관계, 제약 사항 등
  • data model은 여러 종류가 있으며, 추상화 수준과 DB 구조화 방식이 조금씩 다르다.
  • DB에서 읽고 쓰기 위한 기본적인 동작들도 포함한다.

data models 분류

  • conceptual (or high-level) data models : 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이뤄진 모델
    • 추상화 수준이 가장 높음
    • 비즈니스 요구사항을 추상화하여 기술할 때 사용
    conceptual data models
  • logical (or representational) data models : 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화할 수 있는 개념들을 제공
    • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함.
    • 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델
    • 종류
      • relational data model : 표처럼 표현된 형식 - 가장 많이 사용
        relation data model
      • object data model
      • object-relational data model
  • physical (or low-level) data models : 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공
    • data format, data orderings, access path 등
      • access path : 데이터 검색을 빠르게 하기 위한 구조체 (ex) index

DB schema & state

  • DB schema : data model을 바탕으로 database의 구조를 기술한 것
    • schema는 DB를 설계할 때 정해지며, 한 번 정해진 후에는 자주 바뀌지 않는다.
  • DB state : 특정 시점에 DB에 있는 데이터
    • DB에 있는 실제 데이터는 꽤 자주 바뀔 수 있다.
    • snapshot 혹은 DB에 있는 현재 instances의 집합이라고도 한다.
  • three-schema architecture : DB system을 구축하는 architecture 중의 하나
    • user application으로부터 물리적인 DB를 분리시키는 목적
    • 세 가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다.
      • internal schemas at internal level : 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
        • data storage, date structure, access path 등 실체가 있는 내용 기술
      • external schemas (or user views) at external (or view) level : 특정 유저들이 필요로 하는 데이터만을 표현, 그외 알려줄 필요가 없는 데이터는 숨김.
        • logical data model을 통해 표현
      • conceptual schemas at conceptual level : 전체 DB에 대한 구조를 기술
        • 물리적인 저장 구조에 관한 내용은 숨김.
        • entities, data types, relationships, user operations, constraints에 집중
        • logical data model을 통해 기술

    • 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
    • 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않음.
    • 데이터가 존재하는 곳은 internal level
참고자료 - 스프링부트 강의 들을 때 이 세 단계를 나눠서 설계했음.(스프링부트 강의 중 필기한 내용)

DB language(DDL, DML, etc)

  • DDL(data definition language) : conceptual schema를 정의하기 위해 사용되는 언어
    • internal schema까지 정의할 수 있는 경우도 있음.
  • SDL(storage definition language) : internal schema를 정의하는 용도로 사용되는 언어
    • 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨.
  • VDL(view definition language) : external schema를 정의하기 위해 사용되는 언어
    • 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행
  • DML(data manipulation language) : DB에 있는 data를 활용하기 위한 언어
    • data 추가, 삭제, 수정, 검색 등의 기능을 제공하는 언어

통합된 언어

  • 오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하기보다는 통합된 언어로 존재
    • ex) SQL(relational database language)DB & DBMS & DB system