'리눅스/기본개념 및 용어' 카테고리의 글 목록 (2 Page) :: YJcode

리눅스에서는 mmap() 호출을 통해 프로세스의 가상 주소 공간에 새로운 메모리 매핑을 만들 수 있다.

이러한 매핑에는 두 가지 종류가 있다.

 

  • 파일 매핑 : 파일의 일부를 프로세스의 가상 메모리로 매핑한다. 매핑되면, 해당 메모리 영역을 통해 파일의 내용에 접근할 수 있다. 매핑된 페이지는 파일로부터 필요에 따라 자동으로 로드된다.
  • 익명 매핑 : 파일에 매핑되지 않고, 매핑된 페이지들이 0으로 초기화된다.

 

프로세스에 매핑된 메모리는 다른 프로세스와 공유가 가능하다. 메모리 공유는 여러 프로세스가 같은 파일 영역을 매핑하거나, fork()를 통해 새로운 프로세스가 생성될 때 자식 프로세스가 매핑을 그대로 물려받는 경우 발생할 수 있다.

 

둘 이상의 프로세스가 같은 페이지를 공유하면, 매핑이 공유인지, 비공개인지에 따라 공유된 페이지에서 다른 프로세스가 수정, 변경한 내용을 볼 수도 있다.

 

  • 공유 매핑의 경우, 다른 프로세스에서 변경된 사항이 현재 프로세스에서도 보이고, 실시간 반영된다.
  • 비공개 매핑의 경우, 다른 프로세스에서 변경된 사항이 보이지 않고, 실시간 반영또한 되지 않는다.

 

메모리 매핑은 실행 파일의 해당 세그먼트를 이용한 프로세스의 텍스트 세그먼트 초기화, 새로운 메모리 할당, 프로세스 간 통신, 파일 I/O 등 여러 용도로 사용될 수 있다.

프로세스는 쉽게 말하면 실행 중인 모든 각각의 프로그램을 말한다.

즉, 지금 이 페이지를 보고 있는 웹 브라우저 또한 커널 입장에서 보면 프로세스라고 볼 수 있다.

이러한 프로그램이 실행될 때는 커널이 프로그램의 정보를 정의한 바이너리 코드를 메모리에 올리고, 프로그램을 위한 변수 공간을 할당하고, 프로세스에 대한 정보를 담을 별도의 데이터 구조를 준비하게 된다.

 

커널이 보기에 이 프로세스들은 전부 자신이 관리하고 있는 컴퓨터 제원을 나눠서 할당하고, 관리해야 할 대상이 된다.

여기서 메모리나 CPU와 같이 무한정 제공되지 않는 한정된 자원의 경우, 커널은 처음에는 최소한의 자원만을 할당하고, 프로세스가 존재하는 동안 각각의 프로세스들이 요구하는 자원의 정도를 확인하고 적절하게 추가 배분하는 등 프로세스의 전체적인 조율을 하는 역할을 하게 된다. 이후 종료되는 프로세스가 있다면 할당하였던 자원을 반납받고, 필요로 하는 다른 프로세스에게 자원을 할당하거나 여유자원으로 가지고 있게 된다.

 

프로세스는 다음의 세그먼트로 구분할 수 있다.

 

  • 텍스트 : 프로세스의 정의,명령
  • 데이터 : 프로그램이 사용하는 정적 변수
  • 힙 : 프로그램이 사용하는 동적 변수(프로그램이 필요에 따라 추가적으로 변수 공간 할당을 요청하면 이곳에 할당)
  • 스택 : 함수의 호출, 반환에 따라 쌓이고, 줄어드는 메모리 영역

 

프로세스는 fork() 호출을 통해 새로운 프로세스를 만들 수 있다. 이때, 호출을 하는 프로세스를 부모 프로세스, 호출에 따라 새로이 생성되는 프로세스를 자식 프로세스라고 한다. 프로세스가 fork()를 호출하면 커널은 이 요청을 받아들여 부모 프로세스의 모든 것(변수, 현재 상태 등 모든 정보)들을 복사해서 새로운 프로세스를 만들어 내게 된다. 이렇게 새로 생성된 자식 프로세스는 생성이 끝난 후부터는 독립된 프로세스로서 부모 프로세스와는 다른 변수를 생성할 수도, 삭제할 수도, 별도의 독립된 함수를 실행할 수도 있게 된다. 혹은, execve() 호출을 통해 기존의 부모 프로세스로부터 물려받은 모든 세그먼트(텍스트, 데이터, 힙, 스택)들을 제거하고 완전히 새로운 코드에 따라 세그먼트를 구성할 수도 있다.

 

각각의 프로세스에는 고유한 ID(고유한 정수 - 다른 프로세스와 구분하기 위한 유일한 숫자)를 가지고 있다. 이를 PID라고 부르며, 마찬가지로 각각의 프로세스에는 자신을 생성한 부모 프로세스 또한 가지고 있다. 이것을 PPID라고 부른다.

 

프로세스는 보통 두 가지 방식으로 종료될 수 있다. _exit() 시스템 호출(or exit() 라이브러리 함수)을 통해 스스로 종료하기를 커널에게 요청하거나, 외부로부터 종료 시그널을 받아 종료되는 경우가 있다.

이때 두 가지 경우 모두 왜 종료하였는 지, 어떤 방식으로 종료되었는지를 알리는 종료 상태를 생성되는데, 프로세스가 스스로 종료하는 경우 종료 상태를 스스로 생성해서 반환하고, 외부에서 종료시키는 경우 외부에서 온 시그널이 어떤 종류의 시그널이냐에 따라 종료 상태가 결정된다.

이러한 종료 상태는 보통 0은 정상종료를 의미하고, 0이 아닌 모든 수를 비정상 종료, 즉 에러가 발생함에 따라 종료된 것을 뜻한다. 대부분의 쉘에서 마지막으로 실행된 프로그램의 종료 상태를 $?라는 쉘 변수를 통해서 얻을 수 있다.

 

각 프로세스는 다음과 같은 여러 사용자 ID(UID)와 그룹 ID(GID)가 관련되어 있다.

 

  • 실제 사용자 ID 와 실제 그룹 ID : 프로세스가 속한 사용자, 그룹. 새 프로세스는 이 정보를 부모로부터 물려받는다.
  • 유효 사용자 ID 와 유효 그룹 ID : 프로세스 간의 통신 객체와 같은 보호된 자원에 대한 접근권한을 결정하기 위해 쓰인다. 보통은 유효 ID와 실제 ID가 같지만, 특별한 경우 유효 ID를 바꾸게 되면, 프로세스가 다른 사용자나 그룹의 권한을 가질 수 있게 된다. 이러한 UID와 GID는 부모로부터 물려받게 된다.
  • 보조 그룹 ID : 프로세스가 속한 추가적인 그룹. 마찬가지로 부모로부터 물려받게 된다.

 

유닉스에서 특권 프로세스는 유효 사용자 ID가 0인(슈퍼유저)인 프로세스를 말한다. 이런 프로세스는 관리자 권한을 가지고, 커널이 적용하고 제한하는 대부분의 권한 제한에서 자유롭다. 이외의 프로세스는 비특권 프로세스라고 불리며, 커널이 강제하는 권한 제한을 적용받아, 해당 권한을 얻기 위해선 커널의 승인을 받아야 한다.

 

위의 내용들을 토대로 생각할 수 있지만 언급하자면, 특권 프로세스가 생성한(커널에게 생성을 요청한) 프로세스는 마찬가지로 특권 프로세스가 된다. 왜냐하면, 자식 프로세스는 부모로부터 유효 UID와 GID를 물려받기 때문이다.

비특권 프로세스가 특권 프로세스가 되는 방법은 set-user-ID 방식으로, 프로세스를 실행한 프로그램 파일의 사용자 ID가 그 프로세스의 유효 사용자 ID가 된다.

 

시스템을 부팅하면 커널은 /sbin/init 프로그램 파일을 실행하여 모든 프로세스의 부모 프로세스인 init 프로세스를 만든다. init 프로세스의 ID는 1이고, 언제나 슈퍼유저의 특권을 가지고 있다. init 프로세스는 어떠한 경우에도 종료시킬 수 없으며(그럴 일은 없겠지만 init프로세스가 종료되면 커널은 그 순간 동작을 멈추게 된다. 그렇기에 슈퍼유저 권한을 가지고 있더라도 강제로 종료시킬 수가 없다.) 커널이 종료되는 순간에만 같이 종료된다. init 프로세스는 주로 여러 프로세스를 생성하고, 정상 동작하는지에 대한 감시를 하게 된다.

 

데몬 프로세스는 많이들 들어보았을 것이다. 이 프로세스는 다른 프로세스와는 구별되는 몇 가지 특징이 있다.

 

  • 누군가가 강제로 종료시키지 않는 이상 커널이 부팅될 때부터 커널이 종료될 때까지 계속 존재하고 있다
  • 보통 백그라운드에서 실행되고 제어받는 대상이 아니다.
  • 다른 프로세스를 보조하거나, 다른 프로세스의 행위를 기록하는 일을 한다.(게임으로 치면 액티브 스킬이 아니라 패시브 스킬이라고 보면 된다.)

 

이러한 데몬 프로세스로 시스템 로그 메시지를 기록하는 syslogd, 우분투 리눅스에서 영어가 아닌 한글을 입력하기 위해 존재하는 iBus-hangul, 데이터베이스 서버 등이 있다.

 

각 프로세스는 환경 목록이라는 환경변수의 집합을 가지고 있다. 이 목록의 각 요소는 이름과 값의 쌍으로 이루어져 있고, fork()를 통해 새로운 프로세스가 만들어지면, 이 환경 목록을 그대로 복사해서 물려주게 된다.(사실은 이러한 과정이 있기 때문에 자식 프로세스가 부모프로세스로 부터 각종 정보를 물려받을 수 있는 것이다.) 이 환경목록 또한 execve() 함수를 통해 새로이 지정된 환경으로 대치하여 물려받을 수도 있다.

 

각 프로세스는 열람 중인 파일, 메모리, CPU 시간 등의 자원을 항상 소비한다. setrlimit() 호출을 하면 이러한 프로세스의 자원 사용에 상한선을 지정할 수 있다. 이러한 자원 한도는 연성한도 와 경성 한도의 쌍으로 이루어지는데, 연성 한도는 프로세스가 소비할 수 있는 자원의 한도, 경성 한도는 연성 한도를 조절할 수 있는 상한선을 말한다.

비특권 프로세스는 특정 자원의 연성 한도를 0부터 경성 한도까지의 범위에서 자유롭게 변경해서 사용할 수는 있으나, 경성 한도는 오직 낮출 수만 있고 올려 잡을 수는 없다. 즉, 경성 한도는 무조건 지켜져야 하는 외부에서 지정한 최대한도, 연성 한도는 자체적으로 조율이 가능한 내부 한도라고 볼 수 있다.

 

fork()를 통해 새로운 프로세스가 생성되면, 부모의 자원 한도 설정 또한 물려받게 된다.

 

쉘(shell)은 운영체제가 사용자의 명령을 읽고 해당하는 명령에 대한 동작을 할 수 있도록 하여 주는 일종의 통역사라고 보면 비교적 쉽게 이해가 될 것이다.

 

이중 몇 가지 유명한 셸이 있다.

 

  • shBourne shell : 현재 많이 쓰이는 쉘 중 가장 오래된 쉘이다. 흔히들 sh라고 표현하고 있으며, 유닉스 7의 표준 쉘이었다. 가장 초반에 나온 쉘이다 보니 다른 쉘에게 영향을 많이 준 쉘이기도 하며, 다른 쉘에서 기본적으로 사용하는 명령어와 공통되는 부분이 많다.
  • cshc shell : csh, 혹은 c쉘이라고많이 불리고, 이름 그대로 C언어와 상당히 유사한 부분이 많다. sh에 비해 유용한 기능이 많이 추가가 되었으며, BSD의 표준 쉘이었으나 모든 유닉스에서 C쉘을 사용한 것은 아니었기에 호환성은 좋지 못한 편이었다.
  • kshkorn shell : sh와 호환성을 유지하며 C쉘의 특징과 비슷한 부분이 많은 쉘이다.
  • bash shell : 현재 데비안 계열을 포함한 거의 대부분의 리눅스에서 사용 중인 현재로써 가장 대중적이고 널리 사용되고 있는 쉘이다. GNU 프로젝트 때 리눅스에 맞춰서 sh를 다시 구현한 쉘로, sh, csh, ksh 모두와 비슷한 대화형 기능이 있다.

 

이러한 쉘은 그냥 사용하면 사용자가 일일이 커널에게 명령을 내리는 불편함이 있기에 쉘 스크립트라는 것을 사용한다.

쉘 스크립트를 사용하면 한번에 한 개씩의 명령이 아니라, 여러 명령을 사용자가 원하는 대로 묶어두고, 원하는 시기에 적절히 자동으로 순차 실행이 되도록, 혹은 조건에 따라 실행이 되도록 할 수 있기 때문에 프로그래밍 언어와 같이 사용할 수 있게 된다.

 

예를 들면, 단순히 쉘만 사용하여 오후 4시경에 컴퓨터를 종료하겠다고 명령을 내리기 위해서는 현재시간을 보고, 오후 4시까지의 시간을 계산하여 그 시간 후에 종료하라고 명령을 내려야 한다.

하지만 쉘 스크립트를 사용한다면, 부트 시퀀스 마지막에 백그라운드로 실행되며, 주기적으로 시간을 체크하고 체크된 시간이 오후 4시를넘어가는 순간 컴퓨터를 종료하도록 스크립트를 작성하여 추가한다면 하나의 자동화를 구성하게 되는 것이다.

커널은 기본적으로 유저가 사용하기에 적절한 사용자 모드와, 커널을 직접 수정 혹은, 중요한 파일에 접근할 수 있는 커널 모드가 존재한다.

 

커널 모드에서는 모든 파일에 대한 접근이 가능하지만 사용자 모드에서는 제한된 권한을 가지고 허용된 파일만 보거나 쓸 수 있다.

 

굳이 사용자 모드를 별도로 두고 관리하는 이유는 무엇일까? 여러 이유가 있지만 아래에 2가지 대표적인 이유를 들겠다.

 

  • 보안 측면에서 권한을 제한하는 것은 정말 중요하다. 만약 컴퓨터를 부팅하고, 유저 인터페이스가 돌아가는 순간부터 모든 권한이 오픈되어 있다고 생각해보자. 해커들에게는 이보다 더한 천국이 있을 수가 없다. 왜냐하면, 모든 권한이 오픈되어 있다는 것은 달리 말하면 누군가가 원격이든, 직접적으로든, 특정 컴퓨터에 접근만 할 수 있다면, 바이러스를 여기저기 심어 두고, 중요한 개인정보를 아무 때나, 어디서나 뽑아가는 게 가능해지기 때문이다.
  • 건드리면 위험한 파일을 따로 관리할 수 있다. 커널 모드에서는 모든 파일에 대한 권한을, 유저 모드에서는 잘못 건드려서 망가져도 운영체제를 실행하는 데는 문제없는(ex. 부팅을 관장하는 부트로더와 같은 파일이 아닌 메모장과 같은 일반 파일) 파일들에 대한 접근만 허용한다면, 컴퓨터를 만질 때마다 차후 부팅이 실패할까 걱정할 필요가 없어진다. 잘못 건드리면 심각한 문제가 발생할 여지가 있는 파일 또는 프로그램에 대한 접근을 차단하여, 우발적인 시스템 손상을 방지하는 것이다.

 

리눅스뿐만 아니라 윈도우도 사실 이러한 모드의 구분을 하고 있다. windows10을 보면, 무엇인가 새로운 프로그램을 설치하려고 할 때 관리자 모드로 실행하겠냐고 묻는 대화 상자가 뜨는 것을 볼 수 있을 것이다.

이 또한 해당 프로그램 설치를 위해서 민감한 영역을 건드리고, 필요에 따라서 백그라운드로 프로그램을 실행하는 등 보안과 밀접하게 연관된 권한을 얻어야 한다는 이유에서 권한을 상승해서 커널 모드(관리자모드)로 프로그램을 설치하겠냐고 묻는 것이다.

게다가 지금에 와서는 윈도우나 리눅스 모드 멀티유저 환경을 제공하여 주고 있다.

한 컴퓨터에 여러 유저(계정)를 만들어 두고 각각의 계정으로 접속할 때 각기 다른 화면을 보여줌으로써 컴퓨터를 공유해서 사용하여야 하는 상황이 발생했을 때 조금 더 독립적인 환경을 구성할 수 있게 되는 것이다.

커널은 컴퓨터를 구동하는 핵심 운영체제를 의미하고 운영체제는 보통 2가지의 관점으로 쓰인다.

 

 

  • 컴퓨터 지원을 관리하는 핵심 소프트웨어와 인터프리터, GUI(그래픽 유저 인터페이스), 파일 유틸리티 시스템, 편집기 같은 기본적인 소프트웨어 도구를 아우르는 통합 패키지
  • CPU, RAM, 디바이스와 같은 컴퓨터의 하드웨어 자원을 관리하고 할당하는 핵심 소프트웨어

 

이중 보통은 핵심소프트웨어만을 커널로 보는 관점이 많은데 그 이유는 커널의 가장 큰 존재의의가 보다 효율적인 컴퓨터 하드웨어 자원의 관리를 통한 보다 편한 소프트웨어 구성, 보다편한 소프트웨어 사용, 그리고 한정된 자원에서 보다 확실하고 정확한 컴퓨터 하드웨어 자원을 관리할수 있는 관리자의 역할이기 때문이다.

 

커널은 기본적으로 몇가지의 작업을 수행하는 것이 보편적이다.

 

 

  • 메모리 관리 : 여러 프로세스를 동시에 구동하여야 하는 경우 커널은 이 프로세스들을 구동하기 위해 메모리를 할당하고 관리하여야 한다. 하지만 메모리의 하드웨어적 제원은 항상 제한되어 있고 이 제한된 메모리를 여러 프로세스에 동시에 할당하기에는 부족한 경우 커널이 적극 개입하여 메모리를 적절한 시기에 각각의 프로세스에 할당하여 준다.
  • 프로세스 스케줄링 : 리눅스는 선점형 멀티태스킹을 기반으로 하고있다. 그렇기 때문에 프로세스 들이 멀티태스킹을 할 때 커널이 프로세스에 대한 스케줄을 제어하지 않으면 각각의 프로세스에 대한 공정한, 효율적인 CPU 할당이 불가능하다. 그렇기에 커널은 메모리에 올라와 있는 프로세스에 대한 CPU사용 우선순위와 같은 스케줄을 관리한다.
  • 디바이스 드라이버 제공 : 컴퓨터는 본체 뿐만이 아니라 모니터, 키보드, 마우스와 같은 많은 외부장치가 부착되어 있다. 하지만 이들 외부장치는 각각의 고유한 사용방법이 있으며, 이러한 사용방법을 컴퓨터 본체가 모르고, 제공하기 않는다면 외부장치들은 사용할 수가 없게된다. 이러한 사용방법을 명시해놓은 표준화된 사용설명서(인터페이스)를 디바이스 드라이버라고 생각하면 좋다.(주의 : 여기서 말하는 사용설명서는 사용자가 아닌 컴퓨터를 위한 설명서이다.) 이러한 디바이스 드라이버를 제공하여 주는 것이 커널이고, 커널이 인식하지 못하는 디바이스의 경우는 유저가 직접 해당 디바이스의 드라이버를 설치하여 줌으로써 커널이 디바이스를 인지하고 제어할수 있도록 하여 준다.
  • 프로세스 생성, 종료 : 운영체제가 있는 컴퓨터 환경에서 메모리 관리나 프로세스 스케줄링을 커널이 직접 관장하고 있기 때문에 새로운 프로세스가 실행될 때, 해당 프로세스 입장에서는 메모리의 어느부분에 올라가야 다른 프로세스의 영역을 침범하지 않는지 알 수있는 방법이 없다. 마찬가지로 프로세스가 종료될때도 스스로가 종료가 되면 다른 프로세스에게 자신이 종료되었음을 알려줄 방법이 없다. 다른 프로세스를 실행할 프로세스가 살펴보고, 마찬가지로 종료직전 자신이 종료될 것을 다른 프로세스에게 알려주면 되지 않느냐고 생각할 수도 있지만 다른 프로세스들을 살펴볼수 있게 되면 보안에 치명적인 구멍이 생기게 되고, 종료될 것을 다른프로세스에게 종료직전 알려주고 미처 스스로 종료하기도 전에 다른 프로세스가 아직 종료되지 않은 메모리 영역을 침범하게 되면 비정상 동작을 하는 등의 치명적인 오류가 발생할 수도 있다. 그렇기 때문에 이러한 프로세스의 생성과 종료는 커널이 관장하여야 한다. 여기까지만 봐도 커널이 하는 역할은 사용자가 실제로 사용할 프로세스의 관리, 매니징 역할 이라는 것을 알 수 있다.
  • 파일 유틸리티 시스템 제공 : 우리가 흔히 알고있는 파일 탐색기에 해당한다. 이것은 특정 프로그램이 관여하는 것이 아니라 커널에서 자체적으로 제공한다. 만약 파일 시스템이 커널레벨이 아닌 유저레벨에서 관리된다면, 파일 시스템을 삭제하는 순간 해당 파일 시스템에서 관리하던 파일에 대한 노드정보 소실로 의도하지 않은 파일손상을 불러오거나, 여러 파일시스템을 설치하였을때 서로간에 동일한 파일구조를 보여줄 수 없는등의 문제가 발생할 수있다. 그렇기 때문에 파일 유틸리티 시스템은 커널에서 직접 관리(EX.파일 검색, 생성, 삭제, 수정 등의 기능 관리 및 제공)하고 있다.
  • 네트워크 : 컴퓨터에 없어서는 안될 것이 네트워크이다. 지금 이 글을 보고 있는 이라면 OSI 7계층은 들어 보았을 것이다. 이것을 만약 구현하고자 하는 프로그래머가 일일이 전부 구현하여야 한다면 어떻겠는가? 아마 간단한 프로그램 하나를 만들기 위해 엄청난 시간과 자원을 투자하여야 할 것이다. 그렇기에 보통 네트워크 통신을 구현할 때 프로그래머가 구현하는 부분은 사실상 이 OSI 7계층의 각각 계층에서 무엇을 어떻게 작업하여 어떤 정보를 보내줄지 설계해주는 것이 다이고, 물리적인, 혹은 LOW LEVEL에서의 논리적인 기능은 커널이 관장하는 경우가 대부분이다.이러한 구조를 이용하면 프로그래머는 정해진 규칙대로 사용법만 명시하여주고, 커널은 이미 정해진 방법을 기반으로 이를 대신 처리하여 주는 방식으로 통신을 하게 되며, 정형화된 통신이 가능해지므로 더욱 정확하고 간단한 프로그래밍이 가능하게 된다.
  • 시스템 호출 API 제공 : 프로세스 입장에서는 필요한 기능이나, 보안과 같은 문제 때문에 프로세스 자체적으로는 실행 할 수 없는 기능들이 있다. 대표적인 것이 디바이스 드라이버, 특정 파일 열람과 같은 것들이다. 이러한 것들은 직접적인 접근은 커널에서만 접근을 할 수 있는데, 프로세스가 해당 정보를 필요로 할때는 커널에게 이러한 정보가 필요하니 알려달라고 요청, 혹은 이러한 정보를 적용해야 하니 적용을 해달라고 요청하게 된다. 이럴 경우 커널은 해당 정보를 받은 후 권한과 같은 적정석을 검토 후 실행을 하게 된다. 여기서 컴퓨터는 사람과 달리 의미가 비슷하면 알아서 이해하는 것이 아니라 정확한 요청 형식이 있어야 한다. 이는 컴퓨터가 의미를 통한 의사전달이 아니라 데이터에 의한 의사전달이 이루어지기 때문에 요청 형식에 있어서 조금의 차이만 있어도 다른 의미로 해석을 하기 때문이다. 그래서 커널이 제공할 수있는 수행기능에 대한 인터페이스가 있어야 하는데 그것이 API이다. 시스템 호출 API가 있음으로 유저레벨 프로세스가 더욱 자세하고 효율적인 기능을 수행할 수 있게 되었다. 

 

위의 기능들은 리눅스관점에서의 기능이나 대부분의 커널들이 이와 비슷한 맥락으로 동작하므로 커널 그 자체의 기능이라고 봐도 무방할 것이다.

+ Recent posts