Создание процесса
Создание процесса
Как уже обсуждалось, в UNIX проведена четкая грань между программой и процессом. Каждый процесс в конкретный момент времени выполняет инструкции некоторой программы, которая может быть одной и той же для нескольких процессов.[39] Примером может служить командный интерпретатор, с которым одновременно работают несколько пользователей, таким образом инструкции программы shell выполняют несколько различных процессов. Такие процессы могут совместно использовать один сегмент кода в памяти, но в остальном они являются изолированными друг от друга и имеют собственные сегменты данных и стека.
В любой момент процесс может запустить другую программу и начать выполнять ее инструкции; такую операцию он может сделать несколько раз.
В операционной системе UNIX имеются отдельные системные вызовы для создания (порождения) процесса, и для запуска новой программы. Системный вызов fork(2) создает новый процесс, который является точной копией родителя. После возвращения из системного вызова оба процесса выполняют инструкции одной и той же программы и имеют одинаковые сегменты данных и стека.
Тем не менее между родительским и дочерним процессом имеется ряд различий:
? Дочернему процессу присваивается уникальный идентификатор PID, отличный от родительского.
? Соответственно и идентификатор родительского процесса PPID для родителя и потомка различны.
? Дочерний процесс получает собственную копию u-area и, в частности, собственные файловые дескрипторы, хотя он разделяет те же записи файловой таблицы.
? Для дочернего процесса очищаются все ожидающие доставки сигналы.
? Временная статистика выполнения процесса в режиме ядра и задачи для дочернего процесса обнуляется.
? Блокировки памяти и записей, установленные родительским процессом, потомком не наследуются.
Более подробно наследуемые характеристики представлены в табл. 3.4.
Таблица 3.4. Наследование установок при создании процесса и запуске программы
Атрибут Наследование потомком (fork(2)) Сохранение при запуске программы (exec(2)) Сегмент кода (text) Да, разделяемый Нет Сегмент данных (data) Да, копируется при записи (copy-on-write) Нет Окружение Да Возможно Аргументы Да Возможно Идентификатор пользователя UID Да Да Идентификатор группы GID Да Да Эффективный идентификатор пользователя EUID Да Да (Нет, при вызове setuid(2)) Эффективный идентификатор группы EGID Да Да (Нет, при вызове setgid(2)) ID процесса (PID) Нет Да ID группы процессов Да Да ID родительского процесса (PPID) Нет Да Приоритет nice number Да Да Права доступа к создаваемому файлу Да Да Ограничение на размер файла Да Да Сигналы, обрабатываемые по умолчанию Да Да Игнорируемые сигналы Да Да Перехватываемые сигналы Да Нет Файловые дескрипторы Да Да, если для файлового дескриптора не установлен флаг FD_CLOEXEC (например, с помощью fcntl(2)) Файловые указатели Да, разделяемые Да, если для файлового дескриптора не установлен флаг FD_CLOEXEC (например, с помощью fcntl(2))В общем случае вызов fork(2) выполняет следующие действия:
? Резервирует место в области свопинга для сегмента данных и стека процесса.
? Размещает новую запись proc в таблице процессов и присваивает процессу уникальный идентификатор PID.
? Инициализирует структуру proc (поля структуры proc подробно рассматривались в разделе "Структуры данных процесса").
? Размещает карты отображения, необходимые для трансляции адреса.
? Размещает u-area процесса и копирует ее содержимое с родительского.
? Создает соответствующие области процесса, часть из которых совпадает с родительскими.
? Инициализирует аппаратный контекст процесса, копируя его с родительского.
? Устанавливает в ноль возвращаемое дочернему процессу вызовом fork(2) значение.
? Устанавливает возвращаемое родительскому процессу вызовом fork(2) значение равным PID потомка.
? Помечает процесс готовым к запуску и помещает его в очередь на выполнение.
Системный вызов fork(2) в итоге создает для дочернего процесса отдельную копию адресного пространства родителя. Во многих случаях, вскоре после этого, дочерний процесс делает системный вызов exec(2) для запуска новой программы, при этом существующее адресное пространство уничтожается и создается новое. Таким образом создание фактической копии адресного пространства процесса, т.е. выделение оперативной памяти и создание соответствующих карт отображения, является неоправданным.
Для решения данной проблемы используются два подхода. Первый из них, предложенный в UNIX System V, называется "копирование при записи" (copy-on-write или COW). Суть этого подхода заключается в том, что сегменты данных и стека родительского процесса помечаются доступными только для чтения, а дочерний процесс, хотя и получает собственные карты отображения, разделяет эти сегменты с родительским. Другими словами, сразу после создания процесса и родитель и потомок адресуют одни и те же страницы физической памяти. Если какой-либо из двух процессов попытается модифицировать данные или стек, возникнет страничная ошибка, поскольку страница открыта только для чтения, а не для записи. При этом будет запущен обработчик ошибки ядра, который создаст для процесса копию этой страницы, доступную для записи. Таким образом, фактическому копированию подлежат только модифицируемые страницы, а не все адресное пространство процесса. Если дочерний процесс делает системный вызов exec(2) или вообще завершает свое выполнение, права доступа к страницам родителя, имеющим флаг COW, возвращаются к их прежним значениям (т.е. до создания дочернего процесса), а флаг COW очищается.
Другой подход используется в BSD UNIX. В этой версии системы был предложен новый системный вызов — vfork(2). Использование этого вызова имеет смысл, когда дочерний процесс сразу же выполняет вызов exec(2) и запускает новую программу. При вызове vfork(2) родительский процесс предоставляет свое адресное пространство дочернему и переходит в состояние сна, пока последний не вернет его обратно. Далее дочерний процесс выполняется в адресном пространстве родителя, пока не делает вызов exec(2) или exit(2), после чего ядро возвращает адресное пространство родителю и пробуждает его. С помощью vfork(2) можно добиться максимального быстродействия, т.к. в этом случае мы полностью избегаем копирования, даже для карт отображения. Вместо этого адресное пространство родительского процесса предоставляется потомку передачей нескольких аппаратных регистров, отвечающих за трансляцию адресов. Однако vfork(2) таит в себе потенциальную опасность, поскольку позволяет одному процессу использовать и даже модифицировать адресное пространство другого.
Для управления памятью процесса ядру необходимо соответствующим образом задать области. При этом структуры pregion дочернего процесса, соответствующие разделяемым областям, указывают на те же структуры region, что и для родителя. Для областей, совместное использование которых недопустимо, ядро размещает отдельные структуры region для дочернего процесса (изначально копируя их содержимое с родительского) и устанавливает соответствующие указатели. На рис. 3.15 представлена схема этих операций. Заметим, что совместная работа и дублирование областей являются отдельным механизмом, не связанным с рассмотренными выше подходами, для совместного использования адресного пространства, например COW. Так, после создания отдельной копии неразделяемой области она по-прежнему будет адресовать те же страницы памяти, что и соответствующая область родителя.
Рис. 3.15. Создание областей нового процесса
Данный текст является ознакомительным фрагментом.