CS(39)
-
RDB와 NoSQL의 차이
RDB와 NoSQL의 차이 RDB 특징 기존의 테이블에 컬럼을 변경하고자 할 경우, 스키마를 변경해야줘야한다. 이미 기존에 대용량의 데이터가 저장된 경우에 스키마를 변경한다면, 상당히 위험 부담이 크다. → 유연한 확장성이 부족하다. 중복 제거를 위해 정규화를 진행함으로써, 데이터 중복을 최소화할 수 있지만, join을 함으로써 응답시간이 길어진다. → 복잡한 join은 Read성능을 하락시킨다. RDB는 기본적으로 한대의 컴퓨터에 저장한다. Read/Write요청이 매우 많아진다면, 기존 RDB를 저장한 서버는 부하가 많이 발생한다. 위 경우, scale up을 통해 DB 성능을 향상시킨다. (컴퓨터 자체를 성능 좋은 컴퓨터로 바꾼다는 의미임.) 혹은, 컴퓨터를 여러대 둔다.(scale-out) 그러나..
2024.02.23 -
인덱스 동작 방식과 clustered Index vs non-clustered Index (MYSQL기준)
인덱스란?인덱스는 DB에서 데이터를 조회할 때 결과를 빠르게 추출하도록 도와주는 ‘데이터베이스 개체’이다. 마치 사전의 ‘찾아보기’와 같은 역할을 한다고 생각하면 된다.장점적절한 인덱스를 생성하고 조회하면 조회 성능을 획기적으로 개선할 수 있다.단점인덱스는 대략 테이블 크기의 10%공간이 추가로 필요 (인덱스 페이지 때문)SELECT가 아닌 데이터의 변경작업(INSERT, UPDATE, DELETE)이 자주 일어나면 성능에 악영향→ 페이지 분할 작업 때문인덱스 종류인덱스의 종류는 크게 클러스터형 인덱스와 보조 인덱스로 나뉜다.클러스터형 인덱스 (Clustered Index)테이블당 1개만 존재할 수 있다.기본키로 지정된 컬럼은 자동으로 클러스터링 인덱스가 생성된다.실제 저장된 데이터와 같은 무리의 페이지..
2024.02.21 -
페이지교체와 프레임할당
페이지교체와 프레임할당 물리 메모리보다 더 큰 프로세스를 실행할 수 있지만, 그럼에도 물리 메모리의 크기는 한정되어있다. 그렇기 때문에 운영체제는, 기존에 적재된 불필요한 페이지를 선별해 보조기억장치로 내보내고(=페이지 교체알고리즘), 프로세스들에게 적절한 수의 프레임을 할당(=프레임할당)해야한다. 요구페이징 요구되는 페이지만 적재하는 기법으로, 아래 순서대로 실행된다. cpu가 특정 페이지에 접근하는 명령어를 실행한다. 해당 페이지가 현재 메모리에 있을경우(=유효비트가 1일경우), cpu는 페이지가 적재된 프레임에 접근한다. 해당 페이지가 현재 메모리에 없을경우(=유효비트가 0일경우), page fault 인터럽트가 발생한다. page fault처리루틴은 해당 페이지를 메모리로 적재하고 유효비트를 1로..
2024.02.09 -
페이징을 통한 가상 메모리 관리
페이징을 통한 가상 메모리 관리 연속 메모리 할당의 두가지 문제점 외부 단편화의 문제 (=프로세스를 할당하기 어려운 만큼 작은 빈 공간들로 인해 메모리가 낭비되는 현상) 물리 메모리보다 더 큰 프로세스 실행이 불가능하다. 가상메모리 관리 실행하고자 하는 프로세스를 일부만 메모리에 적재하여, 실제 물리메모리보다 더 큰 프로세스를 실행시키는 기술을 의미한다. 가상메모리관리를 해결하기 위한 기술로 페이징, 세그멘테이션 등이 있다. 페이징 외부 단편화가 발생했던 근본적인 문제는 각기 다른 크기의 프로세스가 메모리에 연속적으로 할당되었기 때문 페이징은 프로세스를 일정 크기로 자르고, 이를 메모리에 불연속적으로 할당한다. 즉, 페이징은 프로세스의 논리 주소공간(=cpu가 바라보는 주소공간)을 페이지라는 일정단위로 ..
2024.02.09 -
연속메모리 할당의 개념과 방식 이에 따른 문제점
연속메모리 할당의 개념과 방식 이에 따른 문제점 연속 메모리 할당 : 프로세스에 연속적으로 메모리공간을 할당하는 것을 의미 swapping (swap out, swap in, cf: 중기스케줄러) swapping 현재 사용되지 않는 프로세스들을 보조기억장치의 일부 영역으로 쫓아내고, 쫓아낸 빈 공간에 새 프로세스를 적재하는 것을 의미한다. 장점 여러 프로세스들이 요구하는 메모리 공간의 크기가 실제 RAM메모리의 크키보다 큰 경우에도, 동시에 실행 가능하다. swap영역의 크기는 free, top명령어로 확인가능하다. 연속 메모리 할당 3가지 방식 (cf: first-fit, best-fit, worst-fit) first-fit (=최초적합) 운영체제가 메모리 내의 빈 공간을 순서대로 검색하다가, 적재할..
2024.02.09 -
인덱스로 BTree계열이 자주 사용되는 이유
인덱스로 BTree계열이 자주 사용되는 이유 BTree, AVL Tree, Red-Black-Tree 시간복잡도 BTree Binary Search Tree(BST)를 일반화한 트리 Self-Balancing BST BST중에서 한쪽으로 치우치는 것이 있는데, 이를 보완하기 위해 스스로 규형을 잡는 트리인 AVL트리, RedBlackTree가 있다. 세개 모두 시간복잡도가 O(logN)인데 왜 굳이 BTree를 DB INDEX로 자주 쓰일까? 위를 이해하기 앞서, computer system을 이해할 필요가 있다. computer system computer system에는 총 3가지로 나눠서 설명할 수 있다. cpu 프로그램 코드가 실제로 실행되는 곳 main memory(RAM) 실행 중인 프로그램의..
2024.02.02