Le proprietà dei processi

Il comando che permette di ottenere la lista dei processi attivi nel sistema e ps, il cui nome deriva da process status. Questo e uno dei comandi fondamentali presenti n dalle prime ver-sioni di Unix, per questo si sono accavallate anche diverse sintassi per le opzioni, derivate dalle varie versioni del comando che sono state realizzate nel tempo.

Il comando non richiede nessun argomento, e se eseguito su un terminale senza speci care nessuna opzione ps mostra l’elenco dei processi appartenenti all’utente che ha eseguito il comando attivi su quel terminale; avremo cioe qualcosa del tipo:

piccardi@hain:~/truedoc/corso$ ps

PID	TTY	TIME	CMD
10511	pts/2	00:00:00	bash
22461	pts/2	00:00:22	emacs
22746	pts/2	00:00:03	evince
22971	pts/2	00:00:00	ps

che mostra, nell’ultima colonna marcata CMD, come sul terminale siano presenti la shell, il co-mando ps stesso, piu l’editor ed il visualizzatore di PDF utilizzati per la realizzazione di questo testo. Tralasciamo per ora il signi cato delle altre colonne, ci torneremo fra poco. Specificando l’opzione \a” verranno visualizzati anche i processi lanciati da altri utenti, purche facenti riferimento ad un terminale, mentre con l’opzione \x” si visualizzano tutti i processi non associati ad un terminale, infine l’opzione \f” permette di mostrare la gerarchia dei processi.

La prima colonna dei precedenti esempi, marcata PID, mostra il cosiddetto process ID del processo.

Questo è il numero che il kernel utilizza per identificare univocamente ciascun processo; questo numero viene assegnato alla creazione del processo, ed è unico fintanto che il processo resta attivo. E questo il numero che si deve usare tutte le volte che si vuole fare riferimento ad uno speci co processo.

La seconda colonna, marcata TTY, mostra il nome del cosiddetto \terminale di controllo” del processo. Il concetto di \terminale di controllo” e alquanto complesso, per quanto ci interessa e su ciente dire che un processo \interattivo” e sempre associato ad un terminale di controllo che corrisponde appunto al terminale da cui il processo riceve i dati in ingresso (in genere dalla tastiera) e sul quale scrive il suo output (in genere lo schermo). I processi non interattivi (i cosiddetti demoni) che vengono usati per compiere una serie di compiti di servizio, come spedire la posta, eseguire lavori periodici, servire pagine web, ecc. dovendo essere attivi anche quando non c’e nessun utente collegato, lavorano invece come suol dirsi \in background” per cui non esiste un terminale di controllo ad essi associato e la colonna TTY riporta come valore \?“.

Per capire il significato del campo STAT occorrono alcune spiegazioni generali sull’architettura della gestione dei processi.

Come sistema multitasking Linux e in grado di eseguire piu processi contemporaneamente, in genere pero un processo, pur essendo attivo, non e assolutamente detto che sia anche in esecuzione. Il caso piu comune infatti e quello in cui il programma e in attesa di ricevere dati da una periferica; in tal caso il kernel pone il programma in stato di sleep e lo toglie dalla lista di quelli che hanno bisogno del processore (che sono identificati invece dallo stato runnable).

Stato	STAT	Descrizione

runnable	R	il processo e in esecuzione o e pronto ad essere eseguito (cioe
		e in attesa che gli venga assegnata la CPU).
sleep	S	il processo e in attesa di una risposta dal sistema, ma puo
		essere interrotto da un segnale.
uninterruptible sleep	D	il processo e in attesa di una risposta dal sistema (in genere
		per I/O), e non puo essere interrotto in nessuna circostanza.
stopped	T	il processo e stato fermato con un SIGSTOP, o e tracciato.
zombie	Z	il processo e terminato ma il suo stato di terminazione non e
		ancora stato letto dal padre.

Infine c’e lo stato di zombie, il cui significato puo essere compreso solo ritornando con maggiori dettagli sulla relazione fra processo padre e gli eventuali figli. La relazione padre/ figlio infatti e ben definita finche entrambi i processi sono attivi nel sistema, ma se uno dei due termina cosa accade?

Alla terminazione di un processo il kernel provvede ad una serie di compiti di pulizia; tutti i le aperti dal processo vengono chiusi, la memoria utilizzata viene liberata e con essa tutte le risorse occupate dal processo. Resta il problema di come noti care l’avvenuta conclusione del processo, ad esempio se questa e stata regolare o e stata dovuta ad un qualche errore, e il problema e a chi fare questa noti ca.

Dato che in un sistema Unix tutto viene fatto con i processi, la scelta e stata quella di assegnare al padre il compito di ricevere lo stato di uscita del glio e controllare se tutto e andato bene o c’e stato qualche errore. Quando un processo termina al padre viene inviato un apposito segnale che lo avvisa del fatto, e lui deve invocare una apposita system call per ricevere lo stato di uscita. Questo ad esempio e il meccanismo con cui la shell riceve lo stato di uscita dei comandi che si sono eseguiti.

Se questo non viene fatto il processo figlio si conclude comunque regolarmente e tutte le risorse che occupava nel sistema vengono rilasciate, resta allocata soltanto una voce nella tabella dei processi che contiene le informazioni per riportare lo stato di uscita.

Questo è quello che in gergo viene chiamato uno zombie, cioè un processo che non esiste più, perchè terminato, ma che mostra una voce con lo stato \Z” nella lista fornita da ps e che di nuovo non può essere terminato, per il semplice fatto che lo e già.

E pertanto compito di chi scrive programmi che creano processi gli curarsi della ricezione del loro stato di uscita, ed infatti i programmi ben scritti non presentano mai questo problema.

Di per se la presenza di uno zombie non e un grave problema, in quanto esso non occupa, a di erenza di un processo bloccato in stato \D“, nessuna risorsa nel sistema a parte la voce mantenuta nell’output di ps.

Pero la voce nella tabella dei processi resta occupata e pertanto se il numero degli zombie dovesse crescere in maniera eccessiva si puo rischiare di saturare quest’ultima, rendendo di fatto inutilizzabile il sistema, dato che non sar piu possibile creare nuovi processi. Ma a di erenza dei processi bloccati permanentemente in stato \D” per gli zombie e possibile risolvere il problema, e far s che essi siano terminati regolarmente, senza dover riavviare il sistema.

Le opzioni di visualizzazione di ps sono moltissime, e qui potremo prendere in esame solo le principali. Restando nell’ambito della sintassi BSD una delle piu usate e \u” che stampa una lista con le informazioni piu rilevanti riguardo l’utente che ha lanciato il programma. Altre opzioni sono \v” che stampa informazioni relative all’uso della memoria virtuale, e s che stampa informazioni sui segnali. In ne l’opzione \o” permette all’utente di speci care un suo formato, con l’uso di una serie di direttive %X, dove \X” indica quale proprieta del processo si vuole far comparire nella lista (secondo una tabella di valori riportata nella pagina di manuale).

Se invece si usa la sintassi SysV le opzioni piu usate sono -e, che permette di selezionare tutti i processi presenti, e -f che permette di avere una lista con piu informazioni; in tal caso infatti si avr come uscita del comando:

piccardi@anarres:~$ ps -ef
UID	PID	PPID	C STIME	TTY	TIME CMD
root	1	0	0	12:39	?	00:00:04 init [2]
root	2	0	0	12:39	?	00:00:00 [kthreadd]
root	3	2	0	12:39	?	00:00:00 [migration/0]
…
root	217	1	0	12:39	?	00:00:00 udevd –daemon
root	266	217	0	12:39	?	00:00:00 udevd –daemon
root	279	217	0	12:39	?	00:00:00 udevd –daemon
root	508	2	0	12:39	?	00:00:00 [kjournald]
root	724	1	0	12:39	?	00:00:00 /usr/sbin/rsyslogd -c4
root	773	1	0	12:39	?	00:00:00 /usr/sbin/acpid
daemon	786	1	0	12:39	?	00:00:00 /usr/sbin/atd
root	813	1	0	12:39	?	00:00:00 /usr/sbin/cron
101	1069	1	0	12:39	?	00:00:00 /usr/sbin/exim4 -bd -q30m
root	1087	1	0	12:39	tty1	00:00:00 /bin/login —
root	1088	1	0	12:39	tty2	00:00:00 /sbin/getty 38400 tty2
root	1089	1	0	12:39	tty3	00:00:00 /sbin/getty 38400 tty3
root	1090	1	0	12:39	tty4	00:00:00 /sbin/getty 38400 tty4
root	1091	1	0	12:39	tty5	00:00:00 /sbin/getty 38400 tty5
root	1092	1	0	12:39	tty6	00:00:00 /sbin/getty 38400 tty6
root	1093	1087	0	12:40	tty1	00:00:00 -bash
root	1148	1	0	12:40	?	00:00:00 /usr/sbin/sshd
root	1151	1148	0	12:40	?	00:00:00 sshd: piccardi [priv]

Anzitutto notiamo che la prima colonna, UID, riporta un nome utente. Ciascun processo infatti mantiene le informazioni riguardanti l’utente che ha lanciato il processo ed il gruppo cui questo appartiene, il kernel infatti identi ca ogni utente e gruppo presente nel sistema con dei numeri interi, detti rispettivamente user ID (UID) e group ID (GID) che poi vengono abbinati a dei nomi simbolici come quelli riportati dal comando.

Ogni processo in realtà mantiene diverse versioni di questi identificatori, ma i piu significativi sono i l’exective user ID ed l’exective group ID, che vengono utilizzati per il controllo di accesso. I nomi corrispondenti a questi identificatori sono quelli che corrispondono alla colonna UID (e ad una eventuale colonna GID) del comando, ma e possibile anche richiedere il real user ID e il real group ID, che identificano l’utente che ha lanciato il processo, che invece vengono identificati da sigle come RUSER e RGROUP, se indicati con il nome o con RUID e RGID se numerici.

La seconda colonna del nostro esempio riporta di nuovo il PID di ciascun processo, mentre la terza colonna, PPID, indica il parent process ID, ogni processo infatti mantiene il PID del padre, in modo da poter ricostruire agevolmente la genealogia dei processi. Questa ci permette anche, in caso di zombie, di identificare il processo responsabile della produzione degli stessi.

La quarta colonna, C, indica il valore medio, espresso come intero, della percentuale di utilizzo della CPU su tutta la vita del processo. La quinta colonna, STIME, indica invece il momento in cui il comando e stato lanciato. Le altre colonne sono analoghe a quelle gia viste in precedenza per la sintassi BSD. Un elenco delle principali informazioni relative ai processi che vengono riportate da ps sono elencate in tab. 1.11, indicate sempre in base al nome usato come intestazione della colonna che ne visualizza il valore. Per l’elenco completo di opzioni, informazioni e dati visualizzabili si puo fare riferimento alla pagina di manuale del comando, accessibile con man ps.

Infine ci sono alcune proprietà dei processi, non immediatamente visualizzabili con ps, che comunque sono importanti e vanno menzionate. Come accennato ogni processo ha una directory di lavoro rispetto alla quale risolve i pathname relativi; anche questa e una caratteristica del processo, che viene ereditata nella creazione di un processo glio. Bench questo possa sembrare strano a prima vista, lo stesso vale per la directory radice, ogni processo cioe porta con se, oltre alla directory di lavoro corrente, anche l’indicazione della directory che considera come radice, rispetto alla quale risolve i pathname assoluti. Questa directory puo essere cambiata con una apposita system call (chiamata chroot) ottenendo cos che il processo venga in un certo senso ristretto all’interno di una parte dell’albero dei file


	Proprieta	Descrizione

	PID	PID, process ID del processo.
	PPID	PPID, process ID del padre del processo.
	UID	e ective user ID del processo.
	GID	e ective group ID del processo.
	CMD	linea di comando con cui e stato lanciato il processo.
	STAT	stato del processo.
	NI	valore di nice del processo.
	TTY	terminale di controllo del processo.
	SID	SID, session ID del processo.
	PGID	PGID, process group ID del processo.
	%CPU	percentuale del tempo di CPU usato rispetto al tempo reale
		di esecuzione.
	%MEM	percentuale della memoria sica utilizzata dal processo.
	C	percentuale di CPU sulla media della vita del processo.
	START	orario dell’avvio del processo.
	TIME	tempo totale di CPU utilizzato dall’avvio del processo.
	USER	effective user ID del processo.
	RUSER	real user ID del processo.
	GROUP	effective group ID del processo.
	RGROUP	real group ID del processo.
	COMMAND	riga di comando con la quale si e avviato il processo.

Tabella 1.11: Le principali proprieta dei processi ed il nome della relativa colonna nella visualizzazione effettuata da ps.

Come si puo notare ps si limita a stampare la lista dei processi attivi al momento della sua esecuzione. Se si vuole tenere sotto controllo l’attivit del sistema non e pratico ripetere in continuazione l’esecuzione di ps. Per questo ci viene in aiuto il comando top, che stampa una lista di processi, aggiornandola automaticamente in maniera periodica.

Il comando opera normalmente in maniera interattiva, a meno di non averlo lanciato con l’opzione -b, che lo esegue in modalit batch, consentendo la redirezione dell’output; in tal caso di solito si usa anche l’opzione -n per speci care il numero di iterazioni volute. Il comando ristampa la lista ogni secondo, a meno di non aver impostato un intervallo diverso con l’opzione -d, che richiede un parametro nella forma ss.dd dove ss sono i secondi e dd i decimi di secondo. In ne l’opzione -p permette di osservare una lista di processi scelta dall’utente, che deve speci carli tramite una lista di PID. Per la lista completa delle opzioni si faccia riferimento al solito alla pagina di manuale, accessibile con man top. Quando opera in modalit interattiva il comando permette di inviare dei comandi da tastiera. I piu rilevanti sono \h” e \?” che mostrano un help in linea dei comandi disponibili, e \q” che termina il programma

– / 5

Grazie per aver votato!