데이터 베이스 시스템과 파일 시스템
1) 데이터
사용되는 목적을 갖는 정보
컴퓨터 용어로서의 데이터는 컴퓨터에서 처리되는 정보의 단위라고 말할 수 있다. 결국 컴퓨터로 처리가 가능한 형태로 변형되어진 정보를 의미한다. 컴퓨터 용어로서의 데이터에 는 크게 입력 데이터와 출력 데이터로 구분된다.
데이터의 저장
• 입력 : 데이터를 컴퓨터가 읽을 수 있는 형태로 변환 기능
• 기억 : 입력 기능을 통하여 입력된 데이터를 저장시키는 기능
• 출력 : 처리된 결과를 프린터나 화면 등으로 이동시키는 기능
• 제어 : 입력, 출력, 기억 기능 등을 통제하는 기능
• 산술 및 논리연산 : 가감승제, 논리연산 등을 수행하는 기능
컴퓨터에서 데이터나 프로그램 등을 일시적으로 저장하는데 사용되는 부분을 주기억장 치라 부른다. 그러나 주기억장치는 처리에 필요한 모든 데이터나 프로그램을 한 번에 기억 할 수 있는 것은 아니며, 한정된 기억용량에 제약을 받는다. 여기에 대량의 데이터 혹은 당장 사용하지 않는 데이터는 주기억장치 이외의 장치에 저장하여야 할 필요가 있으며, 처리 에 필요한 데이터만을 주기억장치에 이동시켜 저장한 뒤 처리를 시작하게 된다. 주기억장 치 이외의 저장 장치를 보조기억장치, 또는 외부기억장치, 2차 기억장치라 부른다. 참고로 주기억장치는 내부기억장치, 1차 기억장치라 하며 우리가 흔히 말하는RAM 등이여기에 속 한다. 보조기억장치에는 자기테이프나 하드디스크, CD-ROM, SSD, USB와 같은 대용량 보조기억장치가 있다.
같은 목적으로 구분하여 묶어 놓은 데이터의 집합을 파일(File) 또는 데이터 셋(Data Set)이라 부른다. 그리고 파일로부터 데이터를 읽어 들이거나 파일에 데이터를 입력하는 처리는 사용자가 작성하는 프로그램의 처리순서에 의해 운영체제의 데이터 관리기능이 수행하게 된다.
2) 파일
파일의 구성
파일은 동일 목적의 데이터 집합체이며 컴퓨터에서 취급하는 파일은 컴퓨터로 처리하기 쉬운 형태로 저장되어 있다.
파일 내의 특정 레코드를 식별하기 위하여 사용하는 필드 또는 데이터 항목을 키 필드 (Key Field) 또는 키 항목(Key ltem)이라 부른다. 키 필드란 동일필드 내에 같은 데이터 값이 존재하지 않는 유일한 값을 가지는 필드로서 사원인사 파일인 경우에는 사원번호 필드 등 이 이에 속한다.
이와 같이 파일은 데이터의 집합체이므로 레코드의 구성요소인 필드의 선정 또는 키 필드 의 선정 등에 주의를 기울여야 한다.
파일의 처리
파일은 동일 목적의 데이터를 묶은 집합체이며 구성단위는 레코드이다. 특정 레코드의 정 보를 알고 싶을 때 그 레코드의 유일한 값을 갖는 데이터 필드인 키 필드를 사용해서 검색한다. 파일 처리는 레코드 단위로 처리 된다. 파일의 참조 또는 파일의 갱신 등은 하나의 레코드별로 처리가 된다.
• 검색(SELECT) : 레코드를 구성하는 데이터 필드의 값을 참조하는 기능
• 갱신(UPDATE) : 데이터 필드의 값이 변경되었을 때 레코드 단위로 데이터 필드의 값을 수정하는 기능
• 삽입(INSERT): 새로운 레코드가 발생하였을 때 파일에 새로운 레코드를 추가 입력하는
기능
• 삭제(DELETE) : 레코드를 파일에서 제거하여 삭제하는 기능
파일의 구성 방법
① 순차적 편성 파일
순차적 편성 파일 구성 방법은 파일을 구성하는 제일 간단하고 단순한 방법이다. 또한 파일 내에 레코드를 추출할 때에도 보관된 파일의 처음 레코드부터 순서대로 한 레코드씩 읽어서 원하는 레코드와 비교를 통해서 작업이 수행된다. 파일 구성이 순차적으로 구성된 파일을 순차적 편성 파일 구조라 부른다. 순차적으로 구성된 레코드들은 주어진 순서에 의 해 차례로 저장된다. 또한 순차적으로 구성된 레코드들은 처리를 위해 순차적으로 액세스 된다. 이 구조는 주로 입력 레코드를 한꺼번에 모아 보조기억장치의 파일에 저장된 레코드와 같은 순서로 분류하는 일괄처리 시스템에서 사용된다. 순차적 편성 파일은 순차적 액세스가 사용되기 때문에 신속한 레코드의 액세스가 요구되는 파일 처리 시스템에서는 잘 사 용 되지 않고 있다.
② 인덱스 된 순차 편성 파일
인덱스 된 순차 편성 파일 구성 방법은 색인(Index)되어진 전화번호부를 통해서 이름에 따 라 전화번호를 분류하여 보관하는 방법처럼 파일에 인덱스를 부가하여 파일을 구성하는 방법이다. 파일 내에 순차적 편성 파일 구성과 마찬가지로 레코드는 키에 따라 오름차순이나 내림차순으로 인덱스된 파일에 저장된다. 이 점에서 인덱스된 파일의 레코드는 순차적 편성 파일의 레코드와 유사하다. 그러나 인덱스된 파일 또한 인덱스를 포함하고 있다. 연속한 순번으로 정렬하지만 같은 파일 안에 레코드에 따라 색인을 만들어 두는 파일 구성 방법이다.
이 방법은 레코드를 처음부터 순차적으로 추출하는 방법도 가능하면서 동시에 색인을 사용하여 빠른 속도로 원하는 레코드만을 추출하는 것도 가능하다. 인덱스 된 순차적 파일 구성에 의하여 만들어진 파일을 색인된 순차편성파일 구조라 한다. 하나의 인덱스는 파일 이 생성될 때 항상 디스크에 저장되고, 파일의 레코드를 액세스할 때 반드시 디스크로부터 인출되어야 한다. 인테스를 사용하여 인덱스된 파일 내의 레코드들을 임의로 액세스 할 수 있다. 인테스는 한 레코드의 키와 상응하는 디스크 주소를 포함한다. 여기서 레코드의 키는 키 필드의 값이고, 상응하는 디스크 주소는 레코드가 위치한 디스크 내의 주소를 명시하고 있다.
③ 상대적 혹은 직접 편성 파일
직접 편성 파일 구조는 위에서 살펴본 순차적 편성 파일 구조나 인덱스된 순차 편성 파일 구조와 매우 다른 구성을 갖고 있다. 즉, 파일 내의 레코드는 각 레코드가 갖고 있는 키 항목 의 키 값에 어떠한 계산에 의해 얻어진 값의 장소에 레코드를 저장하는 방법이다.
'컴퓨터 구조' 카테고리의 다른 글
컴퓨터의 역사 그리고 미래의 컴퓨터 (0) | 2023.02.05 |
---|---|
데이터베이스의 특징 (0) | 2023.01.01 |
소프트웨어 - 프로그래밍 (0) | 2023.01.01 |
소프트웨어 - CPU 스케줄링 (0) | 2023.01.01 |
소프트웨어 - 운영체제의 목적 (0) | 2023.01.01 |
댓글