YJcode :: YJcode

리눅스에서는 mmap() 호출을 통해 프로세스의 가상 주소 공간에 새로운 메모리 매핑을 만들 수 있다.

이러한 매핑에는 두 가지 종류가 있다.

 

  • 파일 매핑 : 파일의 일부를 프로세스의 가상 메모리로 매핑한다. 매핑되면, 해당 메모리 영역을 통해 파일의 내용에 접근할 수 있다. 매핑된 페이지는 파일로부터 필요에 따라 자동으로 로드된다.
  • 익명 매핑 : 파일에 매핑되지 않고, 매핑된 페이지들이 0으로 초기화된다.

 

프로세스에 매핑된 메모리는 다른 프로세스와 공유가 가능하다. 메모리 공유는 여러 프로세스가 같은 파일 영역을 매핑하거나, fork()를 통해 새로운 프로세스가 생성될 때 자식 프로세스가 매핑을 그대로 물려받는 경우 발생할 수 있다.

 

둘 이상의 프로세스가 같은 페이지를 공유하면, 매핑이 공유인지, 비공개인지에 따라 공유된 페이지에서 다른 프로세스가 수정, 변경한 내용을 볼 수도 있다.

 

  • 공유 매핑의 경우, 다른 프로세스에서 변경된 사항이 현재 프로세스에서도 보이고, 실시간 반영된다.
  • 비공개 매핑의 경우, 다른 프로세스에서 변경된 사항이 보이지 않고, 실시간 반영또한 되지 않는다.

 

메모리 매핑은 실행 파일의 해당 세그먼트를 이용한 프로세스의 텍스트 세그먼트 초기화, 새로운 메모리 할당, 프로세스 간 통신, 파일 I/O 등 여러 용도로 사용될 수 있다.

프로세스는 쉽게 말하면 실행 중인 모든 각각의 프로그램을 말한다.

즉, 지금 이 페이지를 보고 있는 웹 브라우저 또한 커널 입장에서 보면 프로세스라고 볼 수 있다.

이러한 프로그램이 실행될 때는 커널이 프로그램의 정보를 정의한 바이너리 코드를 메모리에 올리고, 프로그램을 위한 변수 공간을 할당하고, 프로세스에 대한 정보를 담을 별도의 데이터 구조를 준비하게 된다.

 

커널이 보기에 이 프로세스들은 전부 자신이 관리하고 있는 컴퓨터 제원을 나눠서 할당하고, 관리해야 할 대상이 된다.

여기서 메모리나 CPU와 같이 무한정 제공되지 않는 한정된 자원의 경우, 커널은 처음에는 최소한의 자원만을 할당하고, 프로세스가 존재하는 동안 각각의 프로세스들이 요구하는 자원의 정도를 확인하고 적절하게 추가 배분하는 등 프로세스의 전체적인 조율을 하는 역할을 하게 된다. 이후 종료되는 프로세스가 있다면 할당하였던 자원을 반납받고, 필요로 하는 다른 프로세스에게 자원을 할당하거나 여유자원으로 가지고 있게 된다.

 

프로세스는 다음의 세그먼트로 구분할 수 있다.

 

  • 텍스트 : 프로세스의 정의,명령
  • 데이터 : 프로그램이 사용하는 정적 변수
  • 힙 : 프로그램이 사용하는 동적 변수(프로그램이 필요에 따라 추가적으로 변수 공간 할당을 요청하면 이곳에 할당)
  • 스택 : 함수의 호출, 반환에 따라 쌓이고, 줄어드는 메모리 영역

 

프로세스는 fork() 호출을 통해 새로운 프로세스를 만들 수 있다. 이때, 호출을 하는 프로세스를 부모 프로세스, 호출에 따라 새로이 생성되는 프로세스를 자식 프로세스라고 한다. 프로세스가 fork()를 호출하면 커널은 이 요청을 받아들여 부모 프로세스의 모든 것(변수, 현재 상태 등 모든 정보)들을 복사해서 새로운 프로세스를 만들어 내게 된다. 이렇게 새로 생성된 자식 프로세스는 생성이 끝난 후부터는 독립된 프로세스로서 부모 프로세스와는 다른 변수를 생성할 수도, 삭제할 수도, 별도의 독립된 함수를 실행할 수도 있게 된다. 혹은, execve() 호출을 통해 기존의 부모 프로세스로부터 물려받은 모든 세그먼트(텍스트, 데이터, 힙, 스택)들을 제거하고 완전히 새로운 코드에 따라 세그먼트를 구성할 수도 있다.

 

각각의 프로세스에는 고유한 ID(고유한 정수 - 다른 프로세스와 구분하기 위한 유일한 숫자)를 가지고 있다. 이를 PID라고 부르며, 마찬가지로 각각의 프로세스에는 자신을 생성한 부모 프로세스 또한 가지고 있다. 이것을 PPID라고 부른다.

 

프로세스는 보통 두 가지 방식으로 종료될 수 있다. _exit() 시스템 호출(or exit() 라이브러리 함수)을 통해 스스로 종료하기를 커널에게 요청하거나, 외부로부터 종료 시그널을 받아 종료되는 경우가 있다.

이때 두 가지 경우 모두 왜 종료하였는 지, 어떤 방식으로 종료되었는지를 알리는 종료 상태를 생성되는데, 프로세스가 스스로 종료하는 경우 종료 상태를 스스로 생성해서 반환하고, 외부에서 종료시키는 경우 외부에서 온 시그널이 어떤 종류의 시그널이냐에 따라 종료 상태가 결정된다.

이러한 종료 상태는 보통 0은 정상종료를 의미하고, 0이 아닌 모든 수를 비정상 종료, 즉 에러가 발생함에 따라 종료된 것을 뜻한다. 대부분의 쉘에서 마지막으로 실행된 프로그램의 종료 상태를 $?라는 쉘 변수를 통해서 얻을 수 있다.

 

각 프로세스는 다음과 같은 여러 사용자 ID(UID)와 그룹 ID(GID)가 관련되어 있다.

 

  • 실제 사용자 ID 와 실제 그룹 ID : 프로세스가 속한 사용자, 그룹. 새 프로세스는 이 정보를 부모로부터 물려받는다.
  • 유효 사용자 ID 와 유효 그룹 ID : 프로세스 간의 통신 객체와 같은 보호된 자원에 대한 접근권한을 결정하기 위해 쓰인다. 보통은 유효 ID와 실제 ID가 같지만, 특별한 경우 유효 ID를 바꾸게 되면, 프로세스가 다른 사용자나 그룹의 권한을 가질 수 있게 된다. 이러한 UID와 GID는 부모로부터 물려받게 된다.
  • 보조 그룹 ID : 프로세스가 속한 추가적인 그룹. 마찬가지로 부모로부터 물려받게 된다.

 

유닉스에서 특권 프로세스는 유효 사용자 ID가 0인(슈퍼유저)인 프로세스를 말한다. 이런 프로세스는 관리자 권한을 가지고, 커널이 적용하고 제한하는 대부분의 권한 제한에서 자유롭다. 이외의 프로세스는 비특권 프로세스라고 불리며, 커널이 강제하는 권한 제한을 적용받아, 해당 권한을 얻기 위해선 커널의 승인을 받아야 한다.

 

위의 내용들을 토대로 생각할 수 있지만 언급하자면, 특권 프로세스가 생성한(커널에게 생성을 요청한) 프로세스는 마찬가지로 특권 프로세스가 된다. 왜냐하면, 자식 프로세스는 부모로부터 유효 UID와 GID를 물려받기 때문이다.

비특권 프로세스가 특권 프로세스가 되는 방법은 set-user-ID 방식으로, 프로세스를 실행한 프로그램 파일의 사용자 ID가 그 프로세스의 유효 사용자 ID가 된다.

 

시스템을 부팅하면 커널은 /sbin/init 프로그램 파일을 실행하여 모든 프로세스의 부모 프로세스인 init 프로세스를 만든다. init 프로세스의 ID는 1이고, 언제나 슈퍼유저의 특권을 가지고 있다. init 프로세스는 어떠한 경우에도 종료시킬 수 없으며(그럴 일은 없겠지만 init프로세스가 종료되면 커널은 그 순간 동작을 멈추게 된다. 그렇기에 슈퍼유저 권한을 가지고 있더라도 강제로 종료시킬 수가 없다.) 커널이 종료되는 순간에만 같이 종료된다. init 프로세스는 주로 여러 프로세스를 생성하고, 정상 동작하는지에 대한 감시를 하게 된다.

 

데몬 프로세스는 많이들 들어보았을 것이다. 이 프로세스는 다른 프로세스와는 구별되는 몇 가지 특징이 있다.

 

  • 누군가가 강제로 종료시키지 않는 이상 커널이 부팅될 때부터 커널이 종료될 때까지 계속 존재하고 있다
  • 보통 백그라운드에서 실행되고 제어받는 대상이 아니다.
  • 다른 프로세스를 보조하거나, 다른 프로세스의 행위를 기록하는 일을 한다.(게임으로 치면 액티브 스킬이 아니라 패시브 스킬이라고 보면 된다.)

 

이러한 데몬 프로세스로 시스템 로그 메시지를 기록하는 syslogd, 우분투 리눅스에서 영어가 아닌 한글을 입력하기 위해 존재하는 iBus-hangul, 데이터베이스 서버 등이 있다.

 

각 프로세스는 환경 목록이라는 환경변수의 집합을 가지고 있다. 이 목록의 각 요소는 이름과 값의 쌍으로 이루어져 있고, fork()를 통해 새로운 프로세스가 만들어지면, 이 환경 목록을 그대로 복사해서 물려주게 된다.(사실은 이러한 과정이 있기 때문에 자식 프로세스가 부모프로세스로 부터 각종 정보를 물려받을 수 있는 것이다.) 이 환경목록 또한 execve() 함수를 통해 새로이 지정된 환경으로 대치하여 물려받을 수도 있다.

 

각 프로세스는 열람 중인 파일, 메모리, CPU 시간 등의 자원을 항상 소비한다. setrlimit() 호출을 하면 이러한 프로세스의 자원 사용에 상한선을 지정할 수 있다. 이러한 자원 한도는 연성한도 와 경성 한도의 쌍으로 이루어지는데, 연성 한도는 프로세스가 소비할 수 있는 자원의 한도, 경성 한도는 연성 한도를 조절할 수 있는 상한선을 말한다.

비특권 프로세스는 특정 자원의 연성 한도를 0부터 경성 한도까지의 범위에서 자유롭게 변경해서 사용할 수는 있으나, 경성 한도는 오직 낮출 수만 있고 올려 잡을 수는 없다. 즉, 경성 한도는 무조건 지켜져야 하는 외부에서 지정한 최대한도, 연성 한도는 자체적으로 조율이 가능한 내부 한도라고 볼 수 있다.

 

fork()를 통해 새로운 프로세스가 생성되면, 부모의 자원 한도 설정 또한 물려받게 된다.

 

쉘(shell)은 운영체제가 사용자의 명령을 읽고 해당하는 명령에 대한 동작을 할 수 있도록 하여 주는 일종의 통역사라고 보면 비교적 쉽게 이해가 될 것이다.

 

이중 몇 가지 유명한 셸이 있다.

 

  • shBourne shell : 현재 많이 쓰이는 쉘 중 가장 오래된 쉘이다. 흔히들 sh라고 표현하고 있으며, 유닉스 7의 표준 쉘이었다. 가장 초반에 나온 쉘이다 보니 다른 쉘에게 영향을 많이 준 쉘이기도 하며, 다른 쉘에서 기본적으로 사용하는 명령어와 공통되는 부분이 많다.
  • cshc shell : csh, 혹은 c쉘이라고많이 불리고, 이름 그대로 C언어와 상당히 유사한 부분이 많다. sh에 비해 유용한 기능이 많이 추가가 되었으며, BSD의 표준 쉘이었으나 모든 유닉스에서 C쉘을 사용한 것은 아니었기에 호환성은 좋지 못한 편이었다.
  • kshkorn shell : sh와 호환성을 유지하며 C쉘의 특징과 비슷한 부분이 많은 쉘이다.
  • bash shell : 현재 데비안 계열을 포함한 거의 대부분의 리눅스에서 사용 중인 현재로써 가장 대중적이고 널리 사용되고 있는 쉘이다. GNU 프로젝트 때 리눅스에 맞춰서 sh를 다시 구현한 쉘로, sh, csh, ksh 모두와 비슷한 대화형 기능이 있다.

 

이러한 쉘은 그냥 사용하면 사용자가 일일이 커널에게 명령을 내리는 불편함이 있기에 쉘 스크립트라는 것을 사용한다.

쉘 스크립트를 사용하면 한번에 한 개씩의 명령이 아니라, 여러 명령을 사용자가 원하는 대로 묶어두고, 원하는 시기에 적절히 자동으로 순차 실행이 되도록, 혹은 조건에 따라 실행이 되도록 할 수 있기 때문에 프로그래밍 언어와 같이 사용할 수 있게 된다.

 

예를 들면, 단순히 쉘만 사용하여 오후 4시경에 컴퓨터를 종료하겠다고 명령을 내리기 위해서는 현재시간을 보고, 오후 4시까지의 시간을 계산하여 그 시간 후에 종료하라고 명령을 내려야 한다.

하지만 쉘 스크립트를 사용한다면, 부트 시퀀스 마지막에 백그라운드로 실행되며, 주기적으로 시간을 체크하고 체크된 시간이 오후 4시를넘어가는 순간 컴퓨터를 종료하도록 스크립트를 작성하여 추가한다면 하나의 자동화를 구성하게 되는 것이다.

+ Recent posts