Man page - clone2(2)

Packages contains this manual

Available languages:

en fr pl ja de

Manual

clone

NOM
BIBLIOTHÈQUE
SYNOPSIS
DESCRIPTION
La fonction enveloppe clone()
clone3()
Équivalence entre les paramùtres de clone() et de clone3()
Signal de fin de l’enfant
Le tableau set_tid
Le masque flags
VALEUR RENVOYÉE
ERREURS
VERSIONS
Différences entre bibliothÚque C et noyau
blackfin, m68k, et sparc
ia64
STANDARDS
HISTORIQUE
Linux 2.4 et antérieurs
NOTES
BOGUES
EXEMPLES
Source du programme
VOIR AUSSI
TRADUCTION

NOM

clone, __clone2, clone3 - Créer un processus enfant (child)

BIBLIOTHÈQUE

BibliothĂšque C standard ( libc , -lc )

SYNOPSIS

/* Prototype de la fonction enveloppe de la glibc */

#define _GNU_SOURCE
#include <sched.h>

int clone(int (* fn )(void *_Nullable), void * stack , int flags ,
void *_Nullable
arg , ... /* pid_t *_Nullable parent_tid ,
void *_Nullable
tls ,
pid_t *_Nullable
child_tid */ );

/* Pour le prototype de l’appel systùme clone() brut, voir REMARQUES */

#include <linux/sched.h> /* Définition de struct clone_args */
#include <sched.h>
/* Définition des constantes CLONE_* */
#include <sys/syscall.h>
/* Définition des constantes SYS_* */
#include <unistd.h>

long syscall(SYS_clone3, struct clone_args * cl_args , size_t size );

Remarque : La glibc ne fournit pas d’enveloppe pour clone3 () ; appelez-la en utilisant syscall (2).

DESCRIPTION

Ces appels systÚme créent un nouveau processus « enfant », de façon analogue à fork (2).

Contrairement Ă  fork (2), ces appels systĂšme offrent un contrĂŽle plus prĂ©cis du contexte d’exĂ©cution partagĂ© entre le processus appelant et son enfant. Par exemple, en utilisant ces appels systĂšme, l’appelant peut contrĂŽler si les deux processus partagent ou non l’espace d’adresse virtuel, la table des descripteurs de fichier et celle des gestionnaires de signal. Ces appels systĂšme permettent Ă©galement au nouveau processus enfant d’aller dans un namespaces (7) Ă  part.

Remarquez que dans cette page de manuel, le « processus appelant » correspond en principe au « processus parent ». Mais voir les descriptions de CLONE_PARENT et de CLONE_THREAD ci-dessous.

Cette page décrit les interfaces suivantes :

-

Cette page prĂ©sente Ă  la fois la fonction enveloppe clone () de la glibc et l’appel systĂšme sous-jacent sur lequel elle s’appuie. Le texte principal dĂ©crit la fonction enveloppe ; les diffĂ©rences avec l’appel systĂšme brut sont prĂ©cisĂ©es vers la fin de cette page.

-

Le nouvel appel systĂšme clone3 ().

Dans la suite de cette page, le terme « appel clone » est utilisé pour évoquer les détails applicables à toutes ces interfaces.

La fonction enveloppe clone()

Quand le processus enfant est créé par la fonction enveloppe clone (), il dĂ©bute son exĂ©cution par un appel Ă  la fonction vers laquelle pointe l’argument fn (cela est diffĂ©rent de fork (2), pour lequel l’exĂ©cution continue dans le processus enfant Ă  partir du moment de l’appel de fork (2)). L’argument arg est passĂ© comme argument de la fonction fn .

Quand la fonction fn ( arg ) renvoie, le processus enfant se termine. La valeur entiĂšre renvoyĂ©e par fn est utilisĂ©e comme code de retour du processus enfant. Ce dernier peut Ă©galement se terminer de maniĂšre explicite en invoquant la fonction exit (2) ou aprĂšs la rĂ©ception d’un signal fatal.

L’argument stack indique l’emplacement de la pile utilisĂ©e par le processus enfant. Comme les processus enfant et appelant peuvent partager de la mĂ©moire, il n’est gĂ©nĂ©ralement pas possible pour l’enfant d’utiliser la mĂȘme pile que son parent. Le processus appelant doit donc prĂ©parer un espace mĂ©moire pour stocker la pile de son enfant, et transmettre Ă  clone un pointeur sur cet emplacement. Les piles croissent vers le bas sur tous les processeurs implĂ©mentant Linux (sauf le HP PA), donc stack doit pointer sur la plus haute adresse de l’espace mĂ©moire prĂ©vu pour la pile du processus enfant. Remarquez que clone () ne fournit aucun moyen pour que l’appelant puisse informer le noyau de la taille de la zone de la pile.

Les paramÚtres restants de clone () sont décrits ci-dessous.

clone3()

L’appel systĂšme clone3 () fournit un sur-ensemble de la fonctionnalitĂ© de l’ancienne interface de clone (). Il offre Ă©galement un certain nombre d’amĂ©liorations de l’API dont : un espace pour des bits d’attributs supplĂ©mentaires, une sĂ©paration plus propre dans l’utilisation de plusieurs paramĂštres et la possibilitĂ© d’indiquer la taille de la zone de la pile de l’enfant.

Comme avec fork (2), clone3 () renvoie à la fois au parent et à l’enfant. Il renvoie 0 dans le processus enfant et il renvoie le PID de l’enfant dans le parent.

Le paramÚtre cl_args de clone3 () est une structure ayant la forme suivante :

struct clone_args {
u64 flags; /* Masque de bit d’attribut */
u64 pidfd; /* OĂč stocker le descripteur de fichier du PID
( int * ) */
u64 child_tid; /* OĂč stocker le TID enfant,
dans la mĂ©moire de l’enfant ( pid_t * ) */
u64 parent_tid; /* OĂč stocker le TID enfant,
dans la mémoire du parent ( pid_t * ) */
u64 exit_signal; /* Signal Ă  envoyer au parent quand
l’enfant se termine */
u64 stack; /* Pointeur vers l’octet le plus faible de la pile */
u64 stack_size; /* Taille de la pile */
u64 tls; /* Emplacement du nouveau TLS */
u64 set_tid; /* Pointeur vers un tableau pid_t
(depuis Linux 5.5) */
u64 set_tid_size; /* Nombre d’élĂ©ments dans set_tid
(depuis Linux 5.5) */
u64 cgroup; /* Descripteur de fichier du cgroup cible
de l’enfant (depuis Linux 5.7) */
};

Le paramĂštre size fourni Ă  clone3 () doit ĂȘtre initialisĂ© Ă  la taille de cette structure (l’existence du paramĂštre size autorise des extensions futures de la structure clone_args ).

La pile du processus enfant est indiquĂ©e avec cl_args.stack , qui pointe vers l’octet le plus faible de la zone de la pile, et avec cl_args.stack_size , qui indique la taille de la pile en octets. Si l’attribut CLONE_VM est indiquĂ© (voir ci-dessous), une pile doit ĂȘtre explicitement allouĂ©e et indiquĂ©e. Sinon, ces deux champs peuvent valoir NULL et 0 , ce qui amĂšne l’enfant Ă  utiliser la mĂȘme zone de pile que son parent (dans l’espace d’adressage virtuel de son propre enfant).

Les autres champs du paramÚtre cl_args sont abordés ci-dessous.

Équivalence entre les paramùtres de clone() et de clone3()

Contrairement Ă  l’ancienne interface clone (), oĂč les paramĂštres sont passĂ©s individuellement, ceux de la nouvelle interface clone3 () sont empaquetĂ©s dans la structure clone_args prĂ©sentĂ©e ci-dessus. Cette structure permet de passer un ensemble d’informations Ă  l’aide des arguments de clone ().

Le tableau suivant montre l’équivalence entre les paramĂštres de clone () et les champs du paramĂštre clone_args fournis Ă  clone3 () :

Image grohtml-3859657-1.png

Signal de fin de l’enfant

Quand le processus enfant se termine, un signal peut ĂȘtre envoyĂ© au parent. Le signal de fin est indiquĂ© dans l’octet de poids faible de flags ( clone ()) ou dans cl_args.exit_signal ( clone3 ()). Si ce signal est diffĂ©rent de SIGCHLD , le processus parent doit Ă©galement spĂ©cifier les options __WALL ou __WCLONE lorsqu’il attend la fin de l’enfant avec wait (2). Si aucun signal n’est indiquĂ© (donc zĂ©ro), le processus parent ne sera pas notifiĂ© de la terminaison de l’enfant.

Le tableau set_tid

Par dĂ©faut, le noyau choisit le PID sĂ©quentiel suivant pour le nouveau processus dans chacun des espaces de noms de PID oĂč il est prĂ©sent. Lors de la crĂ©ation d’un processus avec clone3 (), le tableau set_tid (depuis Linux 5.5) peut ĂȘtre utilisĂ© pour sĂ©lectionner des PID spĂ©cifiques pour le processus dans tout ou partie des espaces de noms oĂč il est prĂ©sent. Si le PID du processus nouvellement créé ne doit ĂȘtre positionnĂ© que dans l’espace de noms du processus actuel ou dans celui du PID nouvellement créé (si flags contient CLONE_NEWPID ), le premier Ă©lĂ©ment du tableau set_tid doit ĂȘtre le PID souhaitĂ© et set_tid_size doit valoir 1 .

Si le PID du processus nouvellement créé doit avoir une certaine valeur dans plusieurs espaces de noms de PID, le tableau set_tid peut avoir plusieurs entrĂ©es. La premiĂšre entrĂ©e dĂ©finit le PID de l’espace de noms le plus imbriquĂ©, puis chacune des entrĂ©es suivantes contient le PID de l’espace de noms supĂ©rieur correspondant. Le nombre d’espaces de noms de PID oĂč un PID doit ĂȘtre positionnĂ© est dĂ©fini par set_tid_size , qui ne peut pas ĂȘtre plus grand que le nombre d’espaces de noms de PID imbriquĂ©s.

Pour crĂ©er un processus dont les PID suivants s’inscrivent dans la hiĂ©rarchie de l’espace de noms de PID :

Image grohtml-3859657-2.png

Positionner le tableau sur :

set_tid[0] = 7;
set_tid[1] = 42;
set_tid[2] = 31496;
set_tid_size = 3;

Si seuls les PID des deux espaces de noms de PID les plus Ă  l’intĂ©rieur doivent ĂȘtre indiquĂ©s, positionnez le tableau sur :

set_tid[0] = 7;
set_tid[1] = 42;
set_tid_size = 2;

Le PID dans les espaces de noms de PID en dehors des deux espaces de noms les plus Ă  l’intĂ©rieur sera sĂ©lectionnĂ© de la mĂȘme maniĂšre qu’on sĂ©lectionne n’importe quel autre PID.

La fonctionnalitĂ© set_tid exige CAP_SYS_ADMIN ou (depuis Linux 5.9) CAP_CHECKPOINT_RESTORE dans tous les espaces de noms appartenant Ă  l’utilisateur des espaces de noms du processus cible.

Les appelants ne peuvent choisir qu’un PID supĂ©rieur Ă  1 dans un espace de noms de PID donnĂ© si un processus init (Ă  savoir un processus dont le PID est 1 ) existe dĂ©jĂ  dans cet espace de noms. Sinon, l’entrĂ©e du PID dans cet espace de noms de PID doit valoir 1 .

Le masque flags

Tant clone () que clone3 () permettent d’utiliser un masque de bit flags pour modifier leur comportement, et elles permettent Ă  l’appelant d’indiquer ce qui est partagĂ© entre le processus appelant et son enfant. Ce masque de bit – le paramĂštre flags de clone () ou le champ cl_args.flags passĂ© Ă  clone3 () – est dĂ©signĂ© comme le masque flags dans le reste de cette page.

Le masque flags est indiquĂ© comme un OU binaire de zĂ©ro ou plus des constantes ci-dessous. Sauf explicitement indiquĂ©s, ces attributs sont disponibles (et ont le mĂȘme effet) dans clone () et dans clone3 ().
CLONE_CHILD_CLEARTID
(depuis Linux 2.5.49)

Effacer (zĂ©ro) l’ID du thread enfant situĂ© lĂ  oĂč pointe child_tid ( clone ()) ou cl_args.child_tid ( clone3 ()) dans la mĂ©moire de l’enfant lorsqu’il se termine, et provoquer le rĂ©veil avec le futex Ă  cette adresse. L’adresse concernĂ©e peut ĂȘtre modifiĂ©e par l’appel systĂšme set_tid_address (2). Cela est utilisĂ© dans les bibliothĂšques de gestion de threads.

CLONE_CHILD_SETTID (depuis Linux 2.5.49)

Enregistrer l’ID du thread de l’enfant lĂ  oĂč pointe child_tid (( clone ()) ou cl_args.child_tid ( clone3 ()) dans la mĂ©moire de l’enfant. L’opĂ©ration d’enregistrement se termine avant que l’appel clone ne redonne le contrĂŽle Ă  l’espace utilisateur dans le processus enfant (remarquez que l’opĂ©ration d’enregistrement peut ne pas ĂȘtre terminĂ©e avant que l’appel clone ne renvoie au processus parent, ce qui sera pertinent si l’attribut CLONE_VM est Ă©galement utilisĂ©).

CLONE_CLEAR_SIGHAND (depuis Linux 5.5)

Par dĂ©faut, l’état des signaux du thread de l’enfant est le mĂȘme que celui du parent. Si cet attribut est positionnĂ©, tous les signaux gĂ©rĂ©s par le parent (et non dĂ©finis Ă  SIG_IGN ) sont rĂ©initialisĂ©s Ă  leur Ă©tat par dĂ©faut ( SIG_DFL ) dans l’enfant.

Indiquer cet attribut avec CLONE_SIGHAND n’a pas de sens et n’est pas autorisĂ©.

CLONE_DETACHED (historique)

Pendant un moment (pendant la sĂ©rie de versions au cours du dĂ©veloppement de Linux 2.5), il y a eu un attribut CLONE_DETACHED , avec lequel le parent ne recevait pas de signal quand l’enfant se terminait. Au final, l’effet de cet attribut a Ă©tĂ© inhibĂ© par l’attribut CLONE_THREAD et quand Linux 2.6.0 a Ă©tĂ© publiĂ©, cet attribut n’avait pas d’effet. À partir de Linux 2.6.2, il n’a plus Ă©tĂ© nĂ©cessaire de fournir cet attribut avec CLONE_THREAD .

Cet attribut est toujours dĂ©fini, mais il est gĂ©nĂ©ralement ignorĂ© lors d’un appel clone (). Toutefois, voir la description de CLONE_PIDFD pour certaines exceptions.

CLONE_FILES (depuis Linux 2.0)

Si l’attribut CLONE_FILES est positionnĂ©, le processus appelant et le processus enfant partagent la mĂȘme table de descripteurs de fichier. Tout descripteur créé par un processus est Ă©galement valable pour l’autre processus. De mĂȘme si un processus ferme un descripteur, ou modifie ses attributs (en utilisant l’opĂ©ration fcntl (2) F_SETFD ), l’autre processus en est aussi affectĂ©. Si un processus qui partage une table de descripteurs de fichier appelle execve (2), sa table est dupliquĂ©e (non partagĂ©e).

Si CLONE_FILES n’est pas positionnĂ©, le processus enfant hĂ©rite d’une copie des descripteurs de fichier ouverts par l’appelant au moment de l’appel clone (). Les opĂ©rations d’ouverture et de fermeture ou de modification d’attributs du descripteur de fichier subsĂ©quentes, effectuĂ©es par le processus appelant ou son enfant, ne concernent pas l’autre processus. Remarquez toutefois que les copies des descripteurs de fichier dans l’enfant sont associĂ©es aux mĂȘmes descriptions de fichiers ouverts que les descripteurs de fichier correspondants dans le processus appelant, partageant ainsi les attributs de position et d’états du fichier (consultez open (2)).

CLONE_FS (depuis Linux 2.0)

Si l’attribut CLONE_FS est positionnĂ©, le processus appelant et le processus enfant partagent les mĂȘmes informations concernant le systĂšme de fichiers. Cela inclut la racine du systĂšme de fichiers, le rĂ©pertoire de travail, et l’umask. Tout appel Ă  chroot (2), chdir (2) ou umask (2) effectuĂ© par un processus aura Ă©galement une influence sur l’autre processus.

Si CLONE_FS n’est pas positionnĂ©, le processus enfant travaille sur une copie des informations de l’appelant concernant le systĂšme de fichiers au moment de l’appel clone. Les appels Ă  chroot (2), chdir (2), umask (2) effectuĂ©s ensuite par un processus n’affectent pas l’autre processus.

CLONE_INTO_CGROUP (depuis Linux 5.7)

Par dĂ©faut, un processus enfant est mis dans le mĂȘme cgroup version 2 que son parent. L’attribut CLONE_INTO_CGROUP permet au processus enfant d’ĂȘtre créé dans un cgroup version 2 diffĂ©rent (remarquez que CLONE_INTO_CGROUP n’a d’effet que sur les cgroup version 2).

Pour mettre le processus enfant dans un cgroup diffĂ©rent, l’appelant indique CLONE_INTO_CGROUP dans cl_args.flags et passe un descripteur de fichier qui se rapporte Ă  un cgroup version 2 du champ cl_args.cgroup (le descripteur de fichier peut ĂȘtre obtenu en ouvrant un rĂ©pertoire cgroup v2, en utilisant l’attribut O_RDONLY ou O_PATH ). Remarquez que toutes les restrictions habituelles (dĂ©crites dans cgroups (7)) quant au positionnement d’un processus dans un cgroup version 2 s’appliquent.

Voici certains des cas d’utilisation possibles de CLONE_INTO_CGROUP :

-

CrĂ©er un processus dans un autre cgroup que celui du parent permet au gestionnaire de service de placer directement de nouveaux services dans des cgroup dĂ©diĂ©s. Cela Ă©limine les contraintes comptables qui existeraient si le processus enfant Ă©tait créé d’abord dans le mĂȘme cgroup que le parent puis dĂ©placĂ© dans un cgroup cible. De plus, la crĂ©ation d’un processus enfant directement dans un cgroup cible coĂ»te beaucoup moins cher que de dĂ©placer le processus enfant dans le cgroup cible aprĂšs l’avoir créé.

-

L’attribut CLONE_INTO_CGROUP permet Ă©galement la crĂ©ation de processus enfants gelĂ©s en les crĂ©ant dans un cgroup gelĂ© (voir cgroups (7) pour une description des contrĂŽleurs de gel).

-

Pour les applications threadĂ©es (voire mĂȘme les implĂ©mentations de thread qui utilisent des cgroup pour limiter les threads individuels), il est possible d’établir une couche de cgroup fixe avant de crĂ©er chaque thread directement dans son cgroup cible.

CLONE_IO (depuis Linux 2.6.25)

Si CLONE_IO est dĂ©fini, alors le nouveau processus partage un contexte d’entrĂ©es-sorties avec le processus appelant. Si cet attribut n’est pas dĂ©fini, alors (comme pour fork (2)) le nouveau processus a son propre contexte d’entrĂ©es-sorties.

Le contexte d’entrĂ©es-sorties correspond Ă  la visibilitĂ© que l’ordonnanceur de disques a des entrĂ©es-sorties (c’est-Ă -dire, ce que l’ordonnanceur d’entrĂ©es-sorties utilise pour modĂ©liser l’ordonnancement des entrĂ©es-sorties d’un processus). Si des processus partagent le mĂȘme contexte d’entrĂ©es-sorties, ils sont traitĂ©s comme un seul par l’ordonnanceur d’entrĂ©es-sorties. Par consĂ©quent, ils partagent le mĂȘme temps d’accĂšs aux disques. Pour certains ordonnanceurs d’entrĂ©es-sorties, si deux processus partagent un contexte d’entrĂ©es-sorties, ils seront autorisĂ©s Ă  intercaler leurs accĂšs disque. Si plusieurs threads utilisent des entrĂ©es-sorties pour le mĂȘme processus ( aio_read (3), par exemple), ils devraient utiliser CLONE_IO pour obtenir de meilleures performances d’entrĂ©es-sorties.

Si le noyau n’a pas Ă©tĂ© configurĂ© avec l’option CONFIG_BLOCK , cet attribut n’a aucun effet.

CLONE_NEWCGROUP (depuis Linux 4.6)

CrĂ©er le processus dans un nouvel espace de noms cgroup. Si cet attribut n’est pas invoquĂ©, alors (comme pour fork (2)) le processus est créé dans le mĂȘme espace de noms cgroup que le processus appelant.

Pour plus d’informations sur les espaces de noms cgroup, consultez cgroup_namespaces (7).

Seul un processus disposant de privilĂšges ( CAP_SYS_ADMIN ) peut utiliser CLONE_NEWCGROUP .

CLONE_NEWIPC (depuis Linux 2.6.19)

Si CLONE_NEWIPC est invoquĂ©, alors le processus est créé dans un nouvel espace de noms utilisateur IPC. Si cet attribut n’est pas invoquĂ©, alors (comme pour fork (2)) le processus est créé dans le mĂȘme espace de noms utilisateur IPC que le processus appelant.

Pour plus d’informations sur les espaces de noms IPC, reportez vous à ipc_namespaces (7).

Seul un processus disposant de privilĂšges ( CAP_SYS_ADMIN ) peut utiliser CLONE_NEWIPC . Cet attribut ne peut pas ĂȘtre employĂ© en association avec CLONE_SYSVSEM .

CLONE_NEWNET (depuis Linux 2.6.24)

(L’implĂ©mentation de cet attribut n’est complĂšte que depuis Linux 2.6.29.)

Si CLONE_NEWNET est invoquĂ©, alors le processus est créé dans un nouvel espace de noms rĂ©seau. Si cet attribut n’est pas invoquĂ©, alors (comme pour fork (2)) le processus est créé dans le mĂȘme espace de noms rĂ©seau que le processus appelant.

Pour plus d’informations sur les espaces de noms rĂ©seau, reportez vous Ă  network_namespaces (7).

Seul un processus disposant de privilĂšges ( CAP_SYS_ADMIN ) peut appeler CLONE_NEWNET .

CLONE_NEWNS (depuis Linux 2.4.19)

Si l’attribut CLONE_NEWNS est invoquĂ©, l’enfant clonĂ© dĂ©marre dans un nouvel espace de noms de montage, initialisĂ© avec une copie de l’espace de noms du parent. Si CLONE_NEWNS n’est pas invoquĂ©, alors l’enfant existe dans le mĂȘme espace de noms de montage que le parent.

Pour plus d’informations sur les espaces de noms de montage, consultez namespaces (7) et mount_namespaces (7).

Seul un processus disposant de privilĂšges ( CAP_SYS_ADMIN ) peut utiliser l’attribut CLONE_NEWNS . Il n’est pas possible de spĂ©cifier Ă  la fois CLONE_NEWNS et CLONE_FS pour le mĂȘme appel clone.

CLONE_NEWPID (depuis Linux 2.6.24)

Si CLONE_NEWPID est invoquĂ©, alors le processus est créé dans un nouvel espace de noms PID. Si cet attribut n’est pas invoquĂ©, alors (comme pour fork (2)) le processus est créé dans le mĂȘme espace de noms PID que le processus appelant.

Pour plus d’informations sur les espaces de noms PID, consultez namespaces (7) et pid_namespaces (7).

Seul un processus disposant de privilĂšges ( CAP_SYS_ADMIN ) peut utiliser CLONE_NEWPID . Cet attribut ne peut pas ĂȘtre employĂ© en association avec CLONE_THREAD .

CLONE_NEWUSER

(Cet attribut est apparu dans clone () pour la premiÚre fois dans Linux 2.6.23, les sémantiques actuelles de clone () ont été ajoutées dans Linux 3.5, et les derniers modules rendant les espaces de noms utilisateur complÚtement opérationnels sont apparus dans Linux 3.8.)

Si CLONE_NEWUSER est invoquĂ©, alors le processus est créé dans un nouvel espace de noms utilisateur. Si cet attribut n’est pas invoquĂ©, alors (comme pour fork (2)) le processus est créé dans le mĂȘme espace de noms utilisateur que le processus appelant.

Pour plus d’informations sur les espaces de noms utilisateur, consultez namespaces (7) et user_namespaces (7).

Avant Linux 3.8, les processus appelant devaient disposer de trois capacitĂ©s pour utiliser CLONE_NEWUSER : CAP_SYS_ADMIN , CAP_SETUID et CAP_SETGID . À partir de Linux 3.8, il n’est plus nĂ©cessaire de disposer de privilĂšges pour crĂ©er des espaces de noms utilisateur.

Cet attribut ne peut pas ĂȘtre utilisĂ© en association avec CLONE_THREAD ou avec CLONE_PARENT . Pour des raisons de sĂ©curitĂ©, CLONE_NEWUSER ne peut pas ĂȘtre utilisĂ© en association avec CLONE_FS .

CLONE_NEWUTS (depuis Linux 2.6.19)

Si CLONE_NEWUTS est dĂ©fini, crĂ©ez le processus dans un nouvel espace de noms UTS, dont les identifiants sont initialisĂ©s en dupliquant les identifiants de l’espace de noms UTS du processus appelant. Si cet attribut n’est pas dĂ©fini, alors (comme pour fork (2)) le processus est créé dans le mĂȘme espace de noms UTS que le processus appelant.

Pour obtenir plus d’informations sur les espaces de noms UTS, consultez namespaces (7).

Seul un processus disposant de privilĂšges ( CAP_SYS_ADMIN ) peut utiliser CLONE_NEWUTS .

CLONE_PARENT (depuis Linux 2.3.12)

Si CLONE_PARENT est prĂ©sent, le parent du nouvel enfant (comme il est indiquĂ© par getppid (2)) sera le mĂȘme que celui du processus appelant.

Si CLONE_PARENT n’est pas fourni, alors (comme pour fork (2)) le parent du processus enfant sera le processus appelant.

Remarquez que c’est le processus parent, tel qu’indiquĂ© par getppid (2), qui est notifiĂ© lors de la fin de l’enfant. Ainsi, si CLONE_PARENT est prĂ©sent, alors c’est le parent du processus appelant, et non ce dernier, qui sera notifiĂ©.

L’attribut CLONE_PARENT ne peut pas ĂȘtre utilisĂ© dans des appels clone par le processus d’initialisation global (PID 1 dans l’espace de noms PID initial) et par les processus initiaux dans les autres espaces de noms PID. Cette restriction empĂȘche la crĂ©ation d’arbres de processus Ă  plusieurs racines ou de zombies non rĂ©cupĂ©rables dans l’espace de noms PID initial.

CLONE_PARENT_SETTID (depuis Linux 2.5.49)

Enregistrer l’ID du thread enfant Ă  l’endroit vers lequel pointe parent_tid ( clone ()) ou cl_args.parent_tid ( clone3 ()) dans la mĂ©moire du parent (dans Linux 2.5.32-2.5.48 il y a un attribut CLONE_SETTID qui fait cela). L’opĂ©ration d’enregistrement s’achĂšve avant que l’opĂ©ration clone ne donne le contrĂŽle Ă  l’espace utilisateur.

CLONE_PID (de Linux 2.0 Ă  Linux 2.5.15)

Si l’attribut CLONE_PID est positionnĂ©, les processus appelant et enfant ont le mĂȘme numĂ©ro de processus. C’est bien pour bidouiller le systĂšme, mais autrement il n’est plus utilisĂ©. Depuis Linux 2.3.21, cet attribut ne peut ĂȘtre utilisĂ© que par le processus de dĂ©marrage du systĂšme (PID 0). Il a disparu dans Linux 2.5.16. Si bien que le noyau ignorait silencieusement le bit s’il Ă©tait indiquĂ© dans le masque flags . Bien plus tard, le mĂȘme bit a Ă©tĂ© recyclĂ© pour ĂȘtre utilisĂ© comme attribut de CLONE_PIDFD .

CLONE_PIDFD (depuis Linux 5.2)

Si cet attribut est indiquĂ©, un descripteur de fichier PID renvoyant au processus enfant est allouĂ© et placĂ© Ă  un endroit donnĂ© dans la mĂ©moire du parent. L’attribut close-on-exec est positionnĂ© sur ce nouveau descripteur de fichier. Les descripteurs de fichier PID peuvent ĂȘtre utilisĂ©s pour des objectifs dĂ©crits dans pidfd_open (2).

-

Quand on utilise clone3 (), le descripteur de fichier PID est placé à un endroit vers lequel pointe cl_args.pidfd .

-

Quand on utilise clone (), le descripteur de fichier PID est placĂ© Ă  un endroit vers lequel pointe parent_tid . Comme le paramĂštre parent_tid est utilisĂ© pour renvoyer le descripteur de fichier PID, CLONE_PIDFD ne peut pas ĂȘtre utilisĂ© avec CLONE_PARENT_SETTID lors d’un appel clone ().

Il n’est pas possible actuellement d’utiliser cet attribut avec CLONE_THREAD. Cela veut dire que le processus identifiĂ© par le descripteur de fichier PID sera toujours un leader dans le groupe de threads.

Si l’attribut obsolĂšte CLONE_DETACHED est indiquĂ© avec CLONE_PIDFD lors d’un appel Ă  clone (), une erreur est renvoyĂ©e. Une erreur se produit aussi si CLONE_DETACHED est spĂ©cifiĂ© lors d’un appel Ă  clone3 (). Ce comportement garantit que le bit qui correspond Ă  CLONE_DETACHED pourra ĂȘtre utilisĂ© Ă  l’avenir pour des fonctionnalitĂ©s supplĂ©mentaires du descripteur de fichier PID.

CLONE_PTRACE (depuis Linux 2.2)

Si l’attribut CLONE_PTRACE est positionnĂ© et si l’appelant est suivi par un dĂ©bogueur, alors l’enfant sera Ă©galement suivi (consultez ptrace (2)).

CLONE_SETTLS (depuis Linux 2.5.32)

Le descripteur TLS (Thread Local Storage) est positionné sur tls .

L’interprĂ©tation de tls et les effets qui en dĂ©coulent dĂ©pendent de l’architecture. Sur x86, tls est interprĂ©tĂ© comme une struct user_desc * (voir set_thread_area (2)). Sur x86-64, il s’agit de la nouvelle valeur Ă  positionner pour le registre de base %fs (voir le paramĂštre ARCH_SET_FS de arch_prctl (2)). Sur les architectures ayant un registre TLS dĂ©diĂ©, il s’agit de la nouvelle valeur de ce registre.

L’utilisation de cet attribut exige une connaissance dĂ©taillĂ©e et n’est gĂ©nĂ©ralement pas souhaitable, sauf dans l’implĂ©mentation de bibliothĂšques de gestion des threads.

CLONE_SIGHAND (depuis Linux 2.0)

Si l’attribut CLONE_SIGHAND est positionnĂ©, le processus appelant et le processus enfant partagent la mĂȘme table de gestionnaires de signaux. Si l’appelant, ou l’enfant, appelle sigaction (2) pour modifier le comportement associĂ© Ă  un signal, ce comportement est Ă©galement changĂ© pour l’autre processus. NĂ©anmoins, l’appelant et l’enfant ont toujours des masques de signaux distincts, et leurs ensembles de signaux bloquĂ©s sont indĂ©pendants. L’un des processus peut donc bloquer ou dĂ©bloquer un signal en utilisant sigprocmask (2) sans affecter l’autre processus.

Si CLONE_SIGHAND n’est pas utilisĂ©, le processus enfant hĂ©rite d’une copie des gestionnaires de signaux de l’appelant lors de l’invocation de clone (). Les appels Ă  sigaction (2) effectuĂ©s ensuite depuis l’un des processus n’ont pas d’effets sur l’autre processus.

Depuis Linux 2.6.0, le masque flags doit aussi inclure CLONE_VM si CLONE_SIGHAND est spécifié

CLONE_STOPPED (depuis Linux 2.6.0)

Si l’attribut CLONE_STOPPED est positionnĂ©, l’enfant est initialement stoppĂ© (comme s’il avait reçu le signal SIGSTOP ), et doit ĂȘtre relancĂ© en lui envoyant le signal SIGCONT .

Cet attribut a Ă©tĂ© rendu obsolĂšte par Linux 2.6.25, puis il a Ă©tĂ© supprimĂ© dans Linux 2.6.38. Depuis lors, le noyau l’ignore silencieusement sans erreur. À partir de Linux 4.6, le mĂȘme bit a Ă©tĂ© rĂ©utilisĂ© comme attribut de CLONE_NEWCGROUP .

CLONE_SYSVSEM (depuis Linux 2.5.10)

Si CLONE_SYSVSEM est positionnĂ©, l’enfant et le processus appelant partagent une mĂȘme liste de valeurs d’ajustement de sĂ©maphores System V (consultez semop (2)). Dans ce cas, cette liste regroupe toutes les valeurs semadj des processus partageant cette liste, et les modifications des sĂ©maphores sont effectuĂ©es seulement lorsque le dernier processus de la liste se termine (ou cesse de partager la liste en invoquant unshare (2)). Si cet attribut n’est pas utilisĂ©, l’enfant a une liste semadj sĂ©parĂ©e, initialement vide.

CLONE_THREAD (depuis Linux 2.4.0)

Si CLONE_THREAD est prĂ©sent, l’enfant est placĂ© dans le mĂȘme groupe de threads que le processus appelant. Afin de rendre l’explication de CLONE_THREAD plus lisible, le terme « thread » est utilisĂ© pour parler des processus dans un mĂȘme groupe de threads.

Les groupes de threads sont une fonctionnalitĂ© ajoutĂ©e dans Linux 2.4 pour gĂ©rer la notion POSIX d’ensemble de threads partageant un mĂȘme PID. En interne, ce PID partagĂ© est appelĂ© identifiant de groupe de threads (TGID). Depuis Linux 2.4, l’appel getpid (2) renvoie l’identifiant du groupe de threads de l’appelant.

Les threads dans un groupe peuvent ĂȘtre distinguĂ©s par leur identifiant de thread (TID, unique sur le systĂšme). Le TID d’un nouveau thread est disponible sous la forme du rĂ©sultat d’une fonction renvoyĂ© Ă  l’appelant et un thread peut obtenir son propre TID en utilisant gettid (2).

Quand clone est appelé sans positionner CLONE_THREAD , le nouveau thread est placé dans un nouveau groupe de threads dont le TGID est identique au TID du nouveau thread. Ce thread est le leader du nouveau groupe.

Un nouveau thread créé en utilisant CLONE_THREAD a le mĂȘme processus parent que le processus rĂ©alisant l’appel clone (de mĂȘme qu’avec CLONE_PARENT ), ainsi les appels Ă  getppid (2) renvoient la mĂȘme valeur Ă  tous les threads dans un mĂȘme groupe. Lorsqu’un thread créé avec CLONE_THREAD termine, le thread qui l’a créé ne reçoit pas le signal SIGCHLD (ou autre notification de terminaison) ; de mĂȘme, l’état d’un tel thread ne peut pas ĂȘtre obtenu par wait (2). Le thread est dit dĂ©tachĂ© .

Lorsque tous les threads d’un groupe de threads terminent, le processus parent du groupe reçoit un signal SIGCHLD (ou un autre indicateur de terminaison).

Si l’un des threads dans un groupe de threads appelle execve (2), tous les threads sauf le leader sont tuĂ©s, et le nouveau programme est exĂ©cutĂ© dans le leader du groupe de threads.

Si l’un des threads dans un groupe crĂ©e un enfant avec fork (2), n’importe lequel des threads du groupe peut utiliser wait (2) sur cet enfant.

Depuis Linux 2.5.35, le masque flags doit aussi inclure CLONE_SIGHAND si CLONE_THREAD est spécifié (et remarquez que depuis Linux 2.6.0, CLONE_SIGHAND a également besoin de CLONE_VM ).

Les gestions de signaux sont définies au niveau des processus : si un signal sans gestionnaire est reçu par un thread, il affectera (tuera, stoppera, relancera, ou sera ignoré par) tous les membres du groupe de threads.

Chaque thread a son propre masque de signal, tel que défini par sigprocmask (2).

Un signal peut ĂȘtre adressĂ© Ă  un processus ou Ă  un thread. S’il s’adresse Ă  un processus, il cible un groupe de threads (c’est-Ă -dire un TGID), et il est envoyĂ© Ă  un thread choisi arbitrairement parmi ceux ne bloquant pas les signaux. Un signal peut s’adresser Ă  un processus car il est gĂ©nĂ©rĂ© par le noyau pour d’autres raisons qu’une exception matĂ©rielle, ou parce qu’il a Ă©tĂ© envoyĂ© en utilisant kill (2) ou sigqueue (3). Si un signal s’adresse Ă  un thread, il cible (donc est envoyĂ©) Ă  un thread spĂ©cifique. Un signal peut s’adresser Ă  un thread du fait d’un envoi par tgkill (2) ou pthread_sigqueue (3), ou parce que le thread a exĂ©cutĂ© une instruction en langage machine qui a provoquĂ© une exception matĂ©rielle (comme un accĂšs non valable en mĂ©moire, provoquant SIGSEGV , ou une exception de virgule flottante provoquant un SIGFPE ).

Un appel à sigpending (2) renvoie un jeu de signaux qui réunit les signaux en attente adressés au processus et ceux en attente pour le thread appelant.

Si un signal adressĂ© Ă  un processus est envoyĂ© Ă  un groupe de threads, et si le groupe a installĂ© un gestionnaire pour ce signal, alors le gestionnaire sera exĂ©cutĂ© exactement dans un des membres du groupe de threads, choisi de façon arbitraire parmi ceux qui n’ont pas bloquĂ© ce signal. Si plusieurs threads dans un groupe attendent le mĂȘme signal en utilisant sigwaitinfo (2), le noyau choisira arbitrairement l’un d’entre eux pour recevoir le signal.

CLONE_UNTRACED (depuis Linux 2.5.46)

Si l’attribut CLONE_UNTRACED est positionnĂ©, alors un processus traçant le parent ne peut pas forcer CLONE_PTRACE pour cet enfant.

CLONE_VFORK (depuis Linux 2.2)

Si le bit CLONE_VFORK est actif, l’exĂ©cution du processus appelant est suspendue jusqu’à ce que l’enfant libĂšre ses ressources de mĂ©moire virtuelle par un appel execve (2) ou _exit (2) (comme avec vfork (2)).

Si CLONE_VFORK n’est pas indiquĂ©, alors les deux processus sont ordonnancĂ©s Ă  partir de la fin de l’appel, et l’application ne devrait pas considĂ©rer que l’ordre d’exĂ©cution est dĂ©terminĂ© dans un ordre particulier.

CLONE_VM (depuis Linux 2.0)

Si le bit CLONE_VM est actif, le processus appelant et le processus enfant s’exĂ©cutent dans le mĂȘme espace mĂ©moire. En particulier, les Ă©critures en mĂ©moire effectuĂ©es par l’un des processus sont visibles par l’autre. De mĂȘme toute projection en mĂ©moire, ou toute suppression de projection, effectuĂ©e avec mmap (2) ou munmap (2) par l’un des processus affectera Ă©galement l’autre processus.

Si CLONE_VM n’est pas actif, le processus enfant utilisera une copie distincte de l’espace mĂ©moire de l’appelant au moment de l’appel clone. Les Ă©critures ou les associations/dĂ©sassociations de fichiers en mĂ©moire effectuĂ©es par un processus n’affectent pas l’autre processus, comme cela se passe avec fork (2).

Si l’attribut CLONE_VM est indiquĂ© et si l’attribut CLONE_VFORK ne l’est pas, toute autre pile de signal mise en place par sigaltstack (2) sera vidĂ©e dans le processus enfant.

VALEUR RENVOYÉE

En cas de rĂ©ussite, le TID du processus enfant est renvoyĂ© dans le thread d’exĂ©cution de l’appelant. En cas d’échec, -1 est renvoyĂ© dans le contexte de l’appelant, aucun enfant n’est créé, et errno sera positionnĂ© pour indiquer l’erreur.

ERREURS

EACCES ( clone3 () seulement)

CLONE_INTO_CGROUP Ă©tait indiquĂ© dans cl_args.flags , mais les restrictions Ă  la mise en place d’un processus enfant dans un cgroup version 2 auquel se rapporte cl_args.cgroup (dĂ©crites dans cgroups (7)) ne sont pas respectĂ©es.

EAGAIN

Trop de processus en cours d’exĂ©cution. Consultez fork (2).

EBUSY ( clone3 () seulement)

CLONE_INTO_CGROUP Ă©tait indiquĂ© dans cl_args.flags , mais le descripteur de fichier indiquĂ© dans cl_args.cgroup se rapporte Ă  un cgroup version 2 oĂč un contrĂŽleur de domaine est activĂ©.

EEXIST ( clone3 () seulement)

Un (ou plusieurs) PID indiquĂ© dans le set_tid existe dĂ©jĂ  dans l’espace de noms PID correspondant.

EINVAL

Tant CLONE_SIGHAND que CLONE_CLEAR_SIGHAND ont été indiqués dans le masque flags .

EINVAL

CLONE_SIGHAND a été spécifié dans le masque flags , mais pas CLONE_VM (depuis Linux 2.6.0).

EINVAL

CLONE_THREAD a été spécifié dans le masque flags , mais pas CLONE_SIGHAND (depuis Linux 2.5.35).

EINVAL

CLONE_THREAD a Ă©tĂ© indiquĂ© dans le masque flags mais le processus actuel avait appelĂ© unshare (2) avec l’attribut CLONE_NEWPID ou il utilisait setns (2) pour se rĂ©associer Ă  l’espace de noms PID.

EINVAL

Tant CLONE_FS que CLONE_NEWNS ont été indiqués dans le masque flags .

EINVAL (depuis Linux 3.9)

Tant CLONE_NEWUSER que CLONE_FS ont été indiqués dans le masque flags .

EINVAL

Tant CLONE_NEWIPC que CLONE_SYSVSEM ont été indiqués dans le masque flags .

EINVAL

CLONE_NEWPID et CLONE_THREAD ou CLONE_PARENT , seuls ou ensemble,ont été indiqués dans le masque flags .

EINVAL

CLONE_NEWUSER et CLONE_THREAD ont été indiqués dans le masque flags .

EINVAL (depuis Linux 2.6.32)

CLONE_PARENT a Ă©tĂ© spĂ©cifiĂ© et l’appelant est un processus d’initialisation.

EINVAL

RenvoyĂ©e par l’enveloppe glibc de clone () quand fn ou stack valent NULL.

EINVAL

CLONE_NEWIPC a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , mais le noyau n’a pas Ă©tĂ© configurĂ© avec les options CONFIG_SYSVIPC et CONFIG_IPC_NS .

EINVAL

CLONE_NEWNET a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , mais le noyau n’a pas Ă©tĂ© configurĂ© avec l’option CONFIG_NET_NS .

EINVAL

CLONE_NEWPID a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , mais le noyau n’a pas Ă©tĂ© configurĂ© avec l’option CONFIG_PID_NS .

EINVAL

CLONE_NEWUSER a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , mais le noyau n’a pas Ă©tĂ© configurĂ© avec l’option CONFIG_USER_NS .

EINVAL

CLONE_NEWUTS a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , mais le noyau n’a pas Ă©tĂ© configurĂ© avec l’option CONFIG_UTS_NS .

EINVAL

stack n’est pas alignĂ©e sur une limite adaptĂ©e Ă  cette architecture. Par exemple, sur aarch64, stack doit ĂȘtre un multiple de 16.

EINVAL ( clone3 () seulement)

CLONE_DETACHED a été spécifié dans le masque flags .

EINVAL ( clone () seulement)

CLONE_PIDFD a été indiqué avec CLONE_DETACHED dans le masque flags .

EINVAL

CLONE_PIDFD a été indiqué avec CLONE_THREAD dans le masque flags .

EINVAL ( clone () seulement)

CLONE_PIDFD a été indiqué avec CLONE_PARENT_SETTID dans le masque flags .

EINVAL ( clone3 () seulement)

set_tid_size est supĂ©rieur au nombre de niveaux dans l’espace de noms PID.

EINVAL ( clone3 () seulement)

Un des PID indiquĂ© dans set_tid n’était pas valable.

EINVAL ( clone3 () seulement)

CLONE_THREAD ou CLONE_PARENT ont été spécifiés dans le masque flags , mais un signal a été spécifié dans exit_signal .

EINVAL (AArch64 seulement, Linux 4.6 et antérieur)

stack n’était pas alignĂ© sur une limite de 128 bits.

ENOMEM

Pas assez de mĂ©moire pour copier les parties du contexte du processus appelant qui doivent ĂȘtre dupliquĂ©es, ou pour allouer une structure de tĂąche pour le processus enfant.

ENOSPC (depuis Linux 3.7)

CLONE_NEWPID a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , et l’appel provoquerait un dĂ©passement de la limite du nombre maximal d’espaces de noms utilisateur imbriquĂ©s. Consultez pid_namespaces (7).

ENOSPC (depuis Linux 4.9 ; auparavant EUSERS )

CLONE_NEWUSER a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , et l’appel provoquerait un dĂ©passement de la limite du nombre maximal d’espaces de noms utilisateur imbriquĂ©s. Consultez user_namespaces (7).

De Linux 3.11 Ă  Linux 4.8, l’erreur indiquĂ©e dans ce cas Ă©tait EUSERS .

ENOSPC (depuis Linux 4.9)

Une des valeurs dans le masque flags indiquait de créer un nouvel espace de noms utilisateur, mais cela aurait provoqué un dépassement de la limite définie par le fichier correspondant dans /proc/sys/user . Pour plus de détails, voir namespaces (7).

EOPNOTSUPP ( clone3 () seulement)

CLONE_INTO_CGROUP Ă©tait indiquĂ© dans cl_args.flags , mais le descripteur de fichier indiquĂ© dans cl_args.cgroup se rapporte Ă  un cgroup version 2 dont l’état est domain invalid .

EPERM

CLONE_NEWCGROUP , CLONE_NEWIPC , CLONE_NEWNET , CLONE_NEWNS , CLONE_NEWPID ou CLONE_NEWUTS a été spécifié par un processus non privilégié (processus sans CAP_SYS_ADMIN ).

EPERM

CLONE_PID a Ă©tĂ© spĂ©cifiĂ© par un processus autre que le processus 0 (cette erreur n’arrive que sur Linux 2.5.15 et antĂ©rieurs).

EPERM

CLONE_NEWUSER a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , mais l’identifiant utilisateur effectif ou l’identifiant de groupe effectif de l’appelant n’a pas de correspondance dans l’espace de noms parent (consultez user_namespaces (7)).

EPERM (depuis Linux 3.9)

CLONE_NEWUSER a Ă©tĂ© spĂ©cifiĂ© dans le masque flags et l’appelant se trouve dans un environnement chroot (c’est-Ă -dire que le rĂ©pertoire racine de l’appelant ne correspond pas au rĂ©pertoire racine de l’espace de noms de montage dans lequel il se trouve).

EPERM ( clone3 () seulement)

set_tid_size Ă©tait supĂ©rieur Ă  zĂ©ro et l’appelant n’a pas la capacitĂ© CAP_SYS_ADMIN dans un ou plusieurs des espaces de noms utilisateur qui possĂšdent les espaces de noms PID correspondants.

ERESTARTNOINTR (depuis Linux 2.6.17)

L’appel systĂšme a Ă©tĂ© interrompu par un signal et va ĂȘtre redĂ©marrĂ© (cela n’est visible qu’à l’occasion d’un trace ()).

EUSERS (Linux 3.11 Ă  Linux 4.8)

CLONE_NEWUSER a Ă©tĂ© spĂ©cifiĂ© dans le masque flags , et l’appel provoquerait un dĂ©passement de la limite du nombre maximal d’espaces de noms utilisateur imbriquĂ©s. Voir le point sur l’erreur ENOSPC ci-dessus.

VERSIONS

La fonction enveloppe clone () de la glibc effectue des changements dans la mĂ©moire vers laquelle pointe stack (ce sont des changements nĂ©cessaires pour positionner correctement la pile pour l’enfant) avant de recourir Ă  l’appel systĂšme clone (). DĂšs lors, lorsque clone () est utilisĂ© pour crĂ©er des enfants de maniĂšre rĂ©cursive, n’utilisez pas le tampon servant Ă  la pile du parent en tant que pile de l’enfant.

Sur i386, clone () ne devrait pas ĂȘtre appelĂ© Ă  l’aide de vsyscall, mais directement en utilisant int $0x80 .

Différences entre bibliothÚque C et noyau

L’appel systĂšme clone brut ressemble plus Ă  fork (2), en ceci que l’exĂ©cution dans le processus enfant continue Ă  partir du point d’appel. À ce titre, les arguments fn et arg de la fonction enveloppe de clone () sont omis.

Contrairement Ă  l’enveloppe de la glibc, l’appel systĂšme brut clone () accepte NULL en paramĂštre de stack (et de mĂȘme, clone3 () permet Ă  cl_args.stack d’ĂȘtre NULL). Dans ce cas l’enfant utilise une copie de la pile du parent (la sĂ©mantique de copie-en-Ă©criture assure que l’enfant recevra une copie indĂ©pendante des pages de la pile dĂšs qu’un des deux processus la modifiera). Pour que cela fonctionne, il faut naturellement que CLONE_VM ne soit pas prĂ©sent (si l’enfant partage la mĂ©moire du parent du fait d’une utilisation de CLONE_VM , aucune duplication Ă  l’aide de la copie-en-Ă©criture ne se produit et il peut s’ensuivre probablement un grand chaos).

L’ordre des paramĂštres change aussi dans l’appel systĂšme brut et des variations existent dans les paramĂštres en fonction des architectures, comme indiquĂ© dans les paragraphes suivants.

L’interface de l’appel systùme brut sur des architectures x86-64 et quelques autres (dont sh, tile et alpha), est :

long clone(unsigned long flags , void * stack ,
int *
parent_tid , int * child_tid ,
unsigned long
tls );

Sur x86-32 et d’autres architectures classiques (dont score, ARM, ARM 64, PA-RISC, arc, Power PC, xtensa et MIPS), l’ordre des deux derniers paramĂštres est inversé :

long clone(unsigned long flags , void * stack ,
int *
parent_tid , unsigned long tls ,
int *
child_tid );

Sur les architectures cris et s390, l’ordre des deux premiers paramĂštres est inversé :

long clone(void * stack , unsigned long flags ,
int *
parent_tid , int * child_tid ,
unsigned long
tls );

Sur l’architecture microblaze, il existe un paramĂštre supplĂ©mentaire :

long clone(unsigned long flags , void * stack ,
int
stack_size , /* Taille de la pile */
int *
parent_tid , int * child_tid ,
unsigned long
tls );

blackfin, m68k, et sparc

Les conventions de passage des arguments sur blackfin, m68k et sparc sont différentes de celles décrites précédemment. Pour plus de détails, se référer aux sources du noyau (et de la glibc).

ia64

Sur ia64, une interface différente est utilisée :

int __clone2(int (* fn )(void *),
void *
stack_base , size_t stack_size ,
int
flags , void * arg , ...
/* pid_t *
parent_tid , struct user_desc * tls ,
pid_t *
child_tid */ );

Le prototype prĂ©sentĂ© ci-dessus vaut pour la fonction enveloppe de la glibc ; pour l’appel systĂšme lui-mĂȘme, il peut ĂȘtre dĂ©crit comme suit (il est identique au prototype clone () sur microblaze) :

long clone2(unsigned long flags , void * stack_base ,
int
stack_size , /* Taille de la pile */
int *
parent_tid , int * child_tid ,
unsigned long
tls );

__clone2 () fonctionne comme clone (), sauf que stack_base pointe sur la plus petite adresse de la pile de l’enfant et que stack_size indique la taille de la pile sur laquelle pointe stack_base .

STANDARDS

Linux.

HISTORIQUE

clone3 ()

Linux 5.3.

Linux 2.4 et antérieurs

Dans les sĂ©ries 2.4.x de Linux, CLONE_THREAD ne fait en gĂ©nĂ©ral pas du processus parent du nouveau thread un processus identique au parent du processus appelant. Cependant, de Linux 2.4.7 Ă  Linux 2.4.18, l’attribut CLONE_THREAD impliquait CLONE_PARENT (de mĂȘme que dans Linux 2.6.0 et supĂ©rieurs).

Sous Linux 2.4 et plus anciens, clone () ne prend pas les paramÚtres parent_tid , tls , et child_tid .

NOTES

Une utilisation de ces appels systĂšme consiste Ă  implĂ©menter des threads : un programme est scindĂ© en plusieurs lignes de contrĂŽle, s’exĂ©cutant simultanĂ©ment dans un espace mĂ©moire partagĂ©e.

L’appel systĂšme kcmp (2) peut ĂȘtre utilisĂ© pour vĂ©rifier si deux processus partagent des ressources, telles qu’une table de descripteurs de fichier, des opĂ©rations Annuler le sĂ©maphore sur System V, ou un espace d’adressage virtuel.

Les gestionnaires enregistrés en utilisant pthread_atfork (3) ne sont pas exécutés pendant un appel clone.

BOGUES

Les versions de la bibliothĂšque C GNU jusqu’à la 2.24 comprise contenaient une fonction enveloppe pour getpid (2) qui effectuait un cache des PID. Ce cache nĂ©cessitait une prise en charge par l’enveloppe de clone () de la glibc, mais des limites dans l’implĂ©mentation faisaient que le cache pouvait ne pas ĂȘtre Ă  jour sous certaines circonstances. En particulier, si un signal Ă©tait distribuĂ© Ă  un enfant juste aprĂšs l’appel Ă  clone (), alors un appel Ă  getpid (2) dans le gestionnaire de signaux du signal pouvait renvoyer le PID du processus appelant (le parent), si l’enveloppe de clone n’avait toujours pas eu le temps de mettre le cache de PID Ă  jour pour l’enfant. (Ce point ignore le cas oĂč l’enfant a Ă©tĂ© créé en utilisant CLONE_THREAD , quand getpid (2) doit renvoyer la mĂȘme valeur pour l’enfant et pour le processus qui a appelĂ© clone (), puisque l’appelant et l’enfant se trouvent dans le mĂȘme groupe de threads. Ce problĂšme de cache n’apparaĂźt pas non plus si le paramĂštre flags contient CLONE_VM .) Pour obtenir la vĂ©ritable valeur, il peut ĂȘtre nĂ©cessaire d’utiliser quelque chose comme ceci :

#include <syscall.h>
pid_t mypid;
mypid = syscall(SYS_getpid);

Suite Ă  un problĂšme de cache ancien, ainsi qu’à d’autres problĂšmes traitĂ©s dans getpid (2), la fonctionnalitĂ© de mise en cache du PID a Ă©tĂ© supprimĂ©e de la glibc 2.25.

EXEMPLES

Le programme suivant dĂ©crit l’usage de clone () dans le but de crĂ©er un processus enfant qui s’exĂ©cute dans un espace de noms UTS distinct. Le processus enfant change le nom d’hĂŽte (hostname) dans son propre espace UTS. Les processus parent et enfant affichent chacun le nom d’hĂŽte qui leur correspond, permettant ainsi de constater la diffĂ©rence des noms d’hĂŽtes dans leurs espaces de noms UTS respectifs. Pour un exemple d’utilisation de ce programme, consultez setns (2).

Dans le programme d’exemple, nous allouons la mĂ©moire qui doit ĂȘtre utilisĂ©e pour la pile de l’enfant en utilisant mmap (2) au lieu de malloc (3) pour les raisons suivantes :

-

mmap (2) alloue un bloc de mĂ©moire commençant Ă  la limite d’une page et qui est un multiple de la taille de la page. Cela est utile si on veut Ă©tablir une page de protection (avec PROT_NONE ) Ă  la fin de la pile en utilisant mprotect (2).

-

On peut indiquer l’attribut MAP_STACK pour demander une association adaptĂ©e Ă  une pile. Pour le moment, cet attribut n’est pas opĂ©rationnel sur Linux, mais il existe et a des effets sur d’autres systĂšmes, donc on doit l’inclure pour la portabilitĂ©.

Source du programme

#define _GNU_SOURCE
#include <err.h>
#include <sched.h>
#include <signal.h>
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/mman.h>
#include <sys/types.h>
#include <sys/utsname.h>
#include <sys/wait.h>
#include <unistd.h>
static int /* Commencer la fonction pour l’enfant clonĂ© */
childFunc(void *arg)
{
struct utsname uts;
/* Modifier le nom d’hîte dans l’espace de noms UTS de l’enfant. */
if (sethostname(arg, strlen(arg)) == -1)
err(EXIT_FAILURE, "sethostname");
/* RĂ©cupĂ©rer et afficher le nom d’hĂŽte. */
if (uname(&uts) == -1)
err(EXIT_FAILURE, "uname");
printf("uts.nodename dans l’enfant : %s\n", uts.nodename);
/* Rester en sommeil (fonction sleep) pour conserver l’espace
de noms ouvert pendant un moment. Cela permet de réaliser
quelques expĂ©rimentations — par exemple, un autre processus
pourrait rejoindre l’espace de noms. */
sleep(200);
return 0; /* Le processus enfant se termine Ă  ce moment */
}
#define STACK_SIZE (1024 * 1024) /* Taille de la pile pour
l’enfant clonĂ© */
int
main(int argc, char *argv[])
{
char *stack; /* Début du tampon de la pile */
char *stackTop; /* Fin du tampon de la pile */
pid_t pid;
struct utsname uts;
if (argc < 2) {
fprintf(stderr, "Utilisation : %s <nom_d_hĂŽte-enfant>\n", argv[0]);
exit(EXIT_SUCCESS);
}
/* Allouer la mémoire à utiliser pour la pile du processus enfant. */
stack = mmap(NULL, STACK_SIZE, PROT_READ | PROT_WRITE,
MAP_PRIVATE | MAP_ANONYMOUS | MAP_STACK, -1, 0);
if (stack == MAP_FAILED)
err(EXIT_FAILURE, "mmap");
stackTop = stack + STACK_SIZE; /* On suppose que la pile grandit vers
le bas */
/* Créer un processus enfant disposant de son propre
espace de noms UTS ; le processus enfant débute
son exécution dans childFunc(). */
pid = clone(childFunc, stackTop, CLONE_NEWUTS | SIGCHLD, argv[1]);
if (pid == -1)
err(EXIT_FAILURE, "clone");
printf("clone() a renvoyé %jd\n", (intmax_t) pid);
/* Le parent se retrouve ici */
sleep(1); /* Laisser le temps au processus enfant de
changer son nom d’hîte */
/* Afficher le nom d’hîte pour l’espace de noms UTS du processus parent.
Celui-ci sera diffĂ©rent du nom d’hĂŽte pour l’espace de noms UTS du
processus enfant. */
if (uname(&uts) == -1)
err(EXIT_FAILURE, "uname");
printf("uts.nodename dans le parent : %s\n", uts.nodename);
if (waitpid(pid, NULL, 0) == -1) /* Attendre le processus enfant */
err(EXIT_FAILURE, "waitpid");
printf("Fin du processus enfant\n");
exit(EXIT_SUCCESS);
}

VOIR AUSSI

fork (2), futex (2), getpid (2), gettid (2), kcmp (2), mmap (2), pidfd_open (2), set_thread_area (2), set_tid_address (2), setns (2), tkill (2), unshare (2), wait (2), capabilities (7), namespaces (7), pthreads (7)

TRADUCTION

La traduction française de cette page de manuel a été créée par Christophe Blaess <https://www.blaess.fr/christophe/>, Stéphan Rafin <stephan.rafin@laposte.net>, Thierry Vignaud <tvignaud@mandriva.com>, François Micaux, Alain Portal <aportal@univ-montp2.fr>, Jean-Philippe Guérard <fevrier@tigreraye.org>, Jean-Luc Coulon (f5ibh) <jean-luc.coulon@wanadoo.fr>, Julien Cristau <jcristau@debian.org>, Thomas Huriaux <thomas.huriaux@gmail.com>, Nicolas François <nicolas.francois@centraliens.net>, Florentin Duneau <fduneau@gmail.com>, Simon Paillard <simon.paillard@resel.enst-bretagne.fr>, Denis Barbier <barbier@debian.org>, David Prévot <david@tilapin.org>, Cédric Boutillier <cedric.boutillier@gmail.com>, Frédéric Hantrais <fhantrais@gmail.com> et Jean-Philippe MENGUAL <jpmengual@debian.org>

Cette traduction est une documentation libre ; veuillez vous reporter à la GNU General Public License version 3 concernant les conditions de copie et de distribution. Il n’y a aucune RESPONSABILITÉ LÉGALE.

Si vous découvrez un bogue dans la traduction de cette page de manuel, veuillez envoyer un message à debian-l10n-french@lists.debian.org .