Man page - gawk(1)
Packages contains this manual
Available languages:
en it pl jaManual
GAWK
NOMESINTASSI
README FIRST
DESCRIZIONE
PREFAZIONE
FORMATO DELLE OPZIONI
OPZIONI
ESECUZIONE DEL PROGRAMMA AWK
Directory nella riga di comando
VARIABILI, RECORD E CAMPI
Record
Campi
Valori separati da virgole
Variabili predefinite
Vettori
Spazi-dei-nomi
Notazione e conversione delle variabili
Costanti ottali ed esadecimali
Costanti di tipo stringa
Costanti di tipo Regexp
CRITERI DI RICERCA E AZIONI
Criteri di ricerca
Azioni
Operatori
Istruzioni di controllo
Istruzioni di I/O
Nomi di file speciali
Funzioni numeriche
Funzioni di stringa
Funzioni di tempo
Funzioni di manipolazione dei bit
Funzioni di tipo
Funzioni di internazionalizzazione
Funzioni con valori booleani
FUNZIONI DEFINITE DALLâUTENTE
CARICARE DINAMICAMENTE NUOVE FUNZIONI
SEGNALI
INTERNAZIONALIZZAZIONE
ESTENSIONI GNU
VARIABILI DâAMBIENTE
STATO DI USCITA
INFORMAZIONE SULLA VERSIONE
AUTORI
BUG REPORTS AND QUESTIONS
BUG
VEDERE ANCHE
ESEMPI
COPYING PERMISSIONS
TRADUZIONE
NOME
gawk - linguaggio per il riconoscimento e il trattamento di espressioni regolari
SINTASSI
gawk
[
opzioni in stile
POSIX
o
GNU
]
-f
file di programma
[
--
] file ...
gawk
[ opzioni in stile
POSIX
o
GNU
] [
--
]
testo del
programma
file ...
README FIRST
This manual page is provided as a courtesy. Please note that the One Source Of Truth for gawk is the Texinfo manual, available online in several formats at https://www.gnu.org/software/gawk/manual . It may also be installed in the Info subsystem on your system, and available therefore via the info (1) command.
In the case of any contradiction between the Texinfo manual and this man page, the manual should be considered to be authoritative.
DESCRIZIONE
Gawk è lâimplementazione nellâambito del Progetto GNU del linguaggio di programmazione AWK . Si attiene alla definizione del linguaggio descritta nello standard POSIX 1003.1. Questa versione è basata a sua volta sulla descrizione contenuta in The AWK Programming Language , di Aho, Kernighan e Weinberger. Gawk fornisce le funzionalitĂ aggiuntive presenti nella versione corrente di awk di Brian Kernighan e numerose estensioni specifiche di GNU .
La riga di comando contiene opzioni per gawk stesso, il testo del programma AWK (se non è stato fornito con le opzioni -f or --include ), e valori da rendere disponibili nelle variabili AWK predefinite ARGC e ARGV .
PREFAZIONE
Questa pagina di manuale è appositamente sintetica. Tutti i dettagli sono forniti in GAWK: Effective AWK Programming , dove si deve cercare per la descrizione completa di tutte le caratteristiche. Dove possibile vengono forniti i collegamenti alla versione in linea del manuale.
FORMATO DELLE OPZIONI
Le opzioni di Gawk possono essere sia nella tradizionale forma a una lettera di POSIX , sia nella forma estesa tipica di GNU . Le opzioni POSIX cominciano con un â-â singolo, quelle in forma lunga cominciano con â--â. Sono disponibili opzioni in forma lunga sia per le funzionalitĂ specifiche di GNU , sia per quelle previste da POSIX .
Le opzioni specifiche di gawk sono usate normalmente nella forma lunga. Gli argomenti delle opzioni in forma lunga possono essere uniti ad esse da un segno = , senza spazi, oppure sono indicati nel successivo argomento della riga di comando. Le opzioni lunghe possono essere abbreviate, sempre che lâabbreviazione rimanga univoca.
Additionally, every long option has a corresponding short option, so that the optionâs functionality may be used from within #! executable scripts.
OPZIONI
Gawk
accetta le seguenti opzioni. Le opzioni standard sono
elencate per prime, seguite dalle opzioni per le estensioni
gawk
, elencate nellâordine alfabetico delle
opzioni corte.
-f
file_di_programma
,
--file
file_di_programma
Legge il sorgente del programma AWK dal file file_di_programma , invece che dal primo argomento della riga di comando. Si possono specificare piĂš opzioni -f . I file letti come specificato da -f sono trattati come se iniziassero con la direttiva implicita @namespace "awk" .
-F fs , --field-separator fs
Usa fs come separatore di campo in input (il valore della variabile predefinita FS ).
-v var = val , --assign var = val
Assegna il valore val alla variabile var , prima che inizi lâesecuzione del programma. Questi valori delle variabili sono messi a disposizione della regola BEGIN di un programma AWK .
-b , --characters-as-bytes
Tratta tutti i dati in ingresso come caratteri di un singolo byte. Lâopzione --posix prevale su questa.
-c , --traditional
Viene eseguito in modalitĂ compatibile . In questa modalitĂ , gawk si comporta esattamente come awk di Brian Kernighan; non viene riconosciuta nessuna delle estensioni specifiche di GNU .
-C , --copyright
Stampa sullo standard output la versione sintetica del messaggio di informazione sul copyright GNU ed esce senza segnalare errori.
-d [ file ], --dump-variables [ = file ]
Stampa un lista ordinata di variabili globali, specificandone il tipo e il valore finale in file . Se file non viene specificato, gawk usa un file chiamato awkvars.out nella directory corrente.
-D [ file ], --debug [ = file ]
Abilita il debugging di
programmi
AWK
. Per default,
lâanalizzatore di errori [debugger] legge i comandi in
maniera interattiva dalla tastiera (standard input).
Lâargomento opzionale
file
specifica un file
contenente un elenco di comandi per il debugger da eseguire
in maniera non interattiva.
In questa modalitĂ dâesecuzione
gawk
carica il codice sorgente AWK e attende comandi di debug.
Gawk
può fare il debug solo di programmi AWK
il cui sorgente è stato indicato da
-f
o
--include
. Il debugger è documentato in
GAWK: Effective AWK Programming
; vedere
https://www.gnu.org/software/gawk/manual/html_node/Debugger.html#Debugger
.
-e testo_del_programma , --source testo_del_programma
Legge il sorgente del programma AWK dal file file_di_programma . Ogni argomento fornito con -e viene trattato come se iniziasse con la direttiva implicita @namespace "awk" .
-E file , --exec file
Similar to -f , however, this option is the last one processed. This should be used with #! scripts, particularly for CGI applications, to avoid passing in options or source code (!) on the command line from a URL. This option disables command-line variable assignments.
-g , --gen-pot
Esamina e analizza il programma AWK , e genera un file in formato GNU .pot (Portable Object Template) sullo standard output con elementi relativi a tutte le stringhe localizzabili nel programma. Il programma in sĂŠ non viene eseguito.
-h , --help
Scrive sullo standard output un riassunto abbastanza breve delle opzioni disponibili. In base agli GNU Coding Standards , queste opzioni provocano unâuscita immediata e senza segnalazione di errore.
-i include-file , --include include-file
Carica una libreria di sorgenti awk. Cerca la libreria usando la variabile dâambiente AWKPATH . Se la ricerca iniziale non va a buon fine, viene fatto un altro tentativo dopo aver aggiunto il suffisso .awk . Il file verrĂ caricato solo una volta (cioè vengono ignorati i duplicati), e il codice non costituisce il sorgente del programma principale. I file letti come specificato da --include sono trattati come se iniziassero con la direttiva implicita @namespace "awk" .
-I , --trace
Print the internal byte code names as they are executed when running the program. The trace is printed to standard error. Each âop codeâ is preceded by a + sign in the output.
-k , --csv
Abilita la gestione speciale CSV. Vedere Valori separati da virgole , sotto, per maggiori dettagli.
-l lib , --load lib
Carica unâestensione gawk dalla libreria condivisa lib . Cerca la libreria usando la variabile dâambiente AWKLIBPATH . Se la ricerca iniziale non va a buon fine, viene fatto un altro tentativo dopo aver aggiunto il suffisso della libreria condivisa predefinita per la piattaforma. La procedura di inizializzazione della libreria si suppone avere come nome dl_load() .
-L [ valore ], --lint [ = valore ]
Emette degli avvisi per costrutti che siano dubbi o non portabile su altre implementazione AWK . Vedere https://www.gnu.org/software/gawk/manual/html_node/Options.html#Options per la lista dei possibili valori di valore .
-M , --bignum
Force arbitrary precision arithmetic on numbers. This option has no effect if gawk is not compiled to use the GNU MPFR and GMP libraries. (In such a case, gawk issues a warning.)
NOTE: This feature is on parole . The primary gawk maintainer is no longer supporting it, although there is a member of the development team who is. If this situation changes, the feature will be removed from gawk .
-n , --non-decimal-data
Riconosce valori ottali ed esadecimali nei dati in input. Usare questâopzione con molta cautela!
-N , --use-lc-numeric
Impone a gawk di usare il carattere per il punto decimale della localizzazione durante lâinterpretazione dei dati in ingresso.
-o [ file ], --pretty-print [ = file ]
Stampa una versione formattata graziosamente del programma su file . Se non viene indicato un file , gawk usa un file di nome awkprof.out nella directory corrente. Questâopzione attiva anche lâopzione --no-optimize .
-O , --optimize
Disabilita le ottimizzazioni predefinite di gawk nella rappresentazione interna del programma. Questa opzione è attivata automaticamente.
-p [ prof-file ], --profile [ = prof-file ]
Inizia una sessione di "profiling", e invia i dati tracciati al file prof-file . Quello predefinito è awkprof.out nella directory corrente. Il profilo contiene il numero di esecuzioni di ogni istruzione sul margine sinistro e il conteggio delle chiamate di funzione per ogni funzione definita dallâutente. Gawk è piĂš lento in questa modalitĂ . Questâopzione attiva anche lâopzione --no-optimize .
-P , --posix
Questâopzione attiva la modalitĂ di compatibilitĂ e disabilita parecchie estensioni comuni.
-r , --re-interval
Abilita lâutilizzo di espressioni intervallo nella ricerca delle corrispondenze con espressioni regolari. Le espressioni intervallo sono abilitate automaticamente, ma questâopzione rimane per compatibilitĂ allâindietro.
-s , --no-optimize
Disabilita le ottimizzazioni predefinite di gawk nella rappresentazione interna del programma.
-S , --sandbox
Esegue gawk in modalitĂ "sandbox", disabilitando la funzione system() , la ridirezione dellâinput con getline , la ridirezione sullâoutput con print e printf , e il caricamento delle estensioni dinamiche. Lâesecuzione di comandi (tramite pipeline) è anchâessa disabilitata.
-t , --lint-old
Emette avvisi relativi a costrutti non portabili sulla versione originale di awk per UNIX .
-V , --version
Scrive le informazioni sulla versione per questa specifica copia di gawk sullo standard output. Questo è utile quando si segnalano errori. Come da GNU Coding Standards queste opzioni provocano unâuscita immediata e senza segnalazione di errore.
|
-- |
Signal the end of options. This is useful to allow further arguments to the AWK program itself to start with a â-â. |
In modalitĂ compatibile, qualsiasi altra opzione è contrassegnata come non valida e viene ignorata. Nellâuso normale, sempre che sia stato fornito il testo del programma, le opzioni sconosciute sono passate al programma AWK nel vettore ARGV per lâelaborazione.
Per compatibilitĂ con POSIX , si può usare lâopzione -W , seguita dal nome di unâopzione lunga.
ESECUZIONE DEL PROGRAMMA AWK
Un programma AWK consiste di una sequenza di direttive opzionali, istruzioni di tipo criterio-azione e definizioni di funzione opzionali.
@include
"
nome_del_file
"
@load "
nome_del_file
"
@namespace "
nome
"
criterio di ricerca
{
istruzioni di azione
}
function
nome
(
lista di
parametri
) {
istruzioni
}
Gawk prima legge il codice del programma dal/dai file_di_programma se specificato/i, dagli argomenti passati a --source , o dal primo argomento sulla riga di comando che non sia unâopzione. Le opzioni -f e --source possono essere usate piĂš volte nella riga di comando. Gawk legge il testo del programma come se tutti i file_di_programma e i testi sorgenti della riga di comando fossero concatenati.
Oltre a ciò, le righe che iniziano con @include possono essere usate per includere altri file sorgenti nel programma. Questo è equivalente allâuso dellâopzione --include .
Le righe che iniziano con @load possono essere usate per caricare funzioni di estensione nel programma. Questo è equivalente allâuso dellâopzione --load .
La variabile dâambiente AWKPATH specifica il percorso lungo il quale cercare i file sorgenti indicati con le opzioni -f e --include . Se questa variabile non esiste, il percorso predefinito è ".:/usr/local/share/awk" (la directory in questione può variare a seconda di come gawk è stato compilato e installato). Se un nome di file dato con lâopzione -f contiene un carattere â/â, non viene eseguita nessuna ricerca sul percorso.
La variabile dâambiente AWKLIBPATH specifica il percorso lungo il quale cercare i file sorgenti indicati con lâopzione --load . Se questa variabile non esiste, il percorso predefinito è "/usr/local/lib/gawk" (la directory in questione può variare a seconda di come gawk è stato compilato e installato).
Gawk esegue i programmi AWK nellâordine seguente. Per prima cosa, vengono effettuati tutti gli assegnamenti di variabile indicati dallâopzione -v . Successivamente, gawk compila il programma in un formato interno. Poi gawk esegue il codice nella regola/e BEGIN (se esistente/i), quindi procede con la lettura di ciascun file indicato nel vettore ARGV (fino a ARGV[ARGC-1] ). Se non ci sono file indicati nella riga di comando, gawk legge dallo standard input.
Se un nome di file nella riga di comando ha la forma var = val è trattato come un assegnamento di variabile. Alla variabile var sarà assegnato il valore val (questo accade dopo che ogni regola BEGIN è stata eseguita).
Se il valore di un particolare elemento di ARGV è la stringa vuota ( "" ), gawk lo salta.
For each input file, if a BEGINFILE rule exists, gawk executes the associated code before processing the contents of the file. Similarly, gawk executes the code associated with ENDFILE rules after processing the file.
Per ogni record in input, gawk controlla se câè corrispondenza con qualche criterio di ricerca specificato nel programma AWK . Per ogni criterio di ricerca a cui un record corrisponde, gawk esegue lâazione associata. I criteri di ricerca sono verificati nellâordine in cui appaiono nel programma.
Infine, dopo che sono esauriti i dati in input, gawk esegue il codice nelle regola/e END (se esistente/i).
Directory nella riga di comando
Secondo POSIX, i file indicati sulla riga di comando di awk devono essere file di testo. Se non lo sono il comportamento è âindefinitoâ. La maggior parte delle versioni di awk considerano una directory sulla riga di comando come un errore fatale.
Per gawk , una directory sulla riga di comando produce solo un messaggio di avvertimento, senza conseguenze. Se sono date le opzioni --posix o --traditional gawk ritorna a trattare le directory sulla riga di comando come errore fatale.
VARIABILI, RECORD E CAMPI
Le variabili di AWK sono dinamiche; iniziano a esistere la prima volta che vengono usate. I loro valori sono numeri in virgola mobile o stringhe o entrambe le cose a seconda di come sono usate. Inoltre, gawk consente di avere variabili di tipo "espressione regolare". AWK ha anche vettori monodimensionali; i vettori multidimensionali possono essere simulati. Gawk fornisce veri vettori di vettori. Al momento dellâesecuzione del programma sono impostate parecchie variabili predefinite; saranno descritte di volta in volta quando sarĂ necessario, ed elencate piĂš avanti.
Record
Normalmente i record sono separati dai caratteri a capo. Si può controllare come vengono separati i record assegnando valori alla variabile predefinita RS . Vedere https://www.gnu.org/software/gawk/manual/html_node/Records.html per i dettagli.
Campi
Man mano che ogni record di ingresso è letto, gawk lo spezza in campi usando il valore della variabile FS come separatore dei campi. Inoltre possono essere usate FIELDWIDTHS e FPAT per controllare la separazione dei campi. Vedere i dettagli a partire da https://www.gnu.org/software/gawk/manual/html_node/Fields.html .
Ogni campo nel record in input può essere individuato dalla sua posizione: $1 , $2 , e cosĂŹ via. $0 è lâintero record, compresi eventuali spazi bianchi iniziali e finali.
La variabile NF contiene il numero di campi nel record in input.
Riferimenti a campi inesistenti (cioè campi dopo $NF ) producono la stringa vuota. Tuttavia, lâassegnamento ad un campo inesistente (per esempio $(NF+2) = 5 ) provoca lâincremento del valore di NF , crea tutti i campi intermedi assegnando loro la stringa nulla, e fa sĂŹ che il valore di $0 sia ricalcolato utilizzando OFS per separare i campi. Riferimenti a campi con indice negativo producono un errore fatale. Il decremento di NF provoca la perdita dei campi di indice superiore al valore impostato, ed il ricalcolo di $0 , utilizzando OFS per separare i campi.
Lâassegnamento di un valore a un campo esistente provoca la ricostruzione dellâintero record quando si faccia riferimento a $0 . Analogamente, assegnare un valore a $0 provoca una nuova divisione del record, creando nuovi valori per i suoi campi.
Valori separati da virgole
When invoked with either the -k or the --csv option, gawk does not use regular record determination and field splitting as described above. Instead, records are terminated by unquoted newlines, and fields are separated by commas. Double-quotes may be used to enclose fields containing commas, newlines, or doubled double-quotes. See https://www.gnu.org/software/gawk/manual/html_node/Comma-Separated-Fields.html for more details.
Variabili predefinite
Gawk âs built-in variables are listed below. This list is purposely terse. For details, see https://www.gnu.org/software/gawk/manual/html_node/Built_002din-Variables .
|
ARGC |
Il numero di argomenti sulla riga di comando. |
||
|
ARGIND |
Lâindice in ARGV del file correntemente in elaborazione. |
||
|
ARGV |
Vettore degli argomenti della riga di comando. Il vettore è indicizzato da 0 ad ARGC - 1. |
||
|
BINMODE |
Sui sistemi non POSIX, indica lâutilizzo della modalitĂ ÂŤbinariaÂť per tutte le scritture e letture su file. Vedere https://www.gnu.org/software/gawk/manual/html_node/PC-Using.html per i dettagli. |
||
|
CONVFMT |
Il formato di conversione dei numeri, quello predefinito è "%.6g" . |
||
|
ENVIRON |
Un vettore contenente i valori dellâambiente corrente. Il vettore è indicizzato dalle variabili dâambiente, e ogni elemento è il valore di quella variabile. |
||
|
ERRNO |
Se ha luogo un errore di sistema durante una ridirezione per una getline , o durante una lettura fatta con getline , oppure in una close() , ERRNO viene impostato a una stringa che descrive lâerrore. Il valore è passibile di traduzione nelle localizzazioni diverse dallâinglese. |
||
|
FIELDWIDTHS |
Una lista di dimensioni di campo separate da spazi. Se impostato, gawk suddivide lâinput secondo campi di larghezza fissa, anzichĂŠ usare il valore della variabile FS come separatore di campo. Ogni larghezza di campo può opzionalmente essere preceduta da un valore, separato da una virgola, che specifica il numero di caratteri da saltare prima di posizionarsi allâinizio del campo. |
||
|
FILENAME |
Il nome del file di input corrente. Se non sono specificati file nella riga di comando, il valore di FILENAME è â-â. Tuttavia, FILENAME è indefinito allâinterno della regola BEGIN (a meno che non sia impostato da getline ). |
||
|
FNR |
Il numero di record corrente del file in input corrente. |
||
|
FPAT |
Unâespressione regolare che descrive il contenuto dei campi in un record. Se impostato, gawk suddivide lâinput in campi, dove i campi corrispondono allâespressione regolare, invece di usare il valore di FS come separatore di campo. |
||
|
FS |
Il separatore di campo, quello predefinito è uno spazio. Vedere https://www.gnu.org/software/gawk/manual/html_node/Field-Separators.html per i dettagli. |
||
|
FUNCTAB |
Un vettore i cui indici e i corrispondenti valori sono i nomi di tutte le funzioni definite dallâutente o funzioni di estensione presenti nel programma. NOTA : Si può non usare lâistruzione delete applicandola al vettore FUNCTAB . |
||
|
IGNORECASE |
Controlla le differenze tra maiuscole e minuscole in tutte le espressioni regolari e nelle operazioni su stringhe. Vedere https://www.gnu.org/software/gawk/manual/html_node/Case_002dsensitivity.html per i dettagli. |
||
|
LINT |
Offre un controllo dinamico dellâopzione --lint dallâinterno di un programma AWK . |
||
|
NF |
Il numero di campi nel record corrente. |
||
|
NR |
Il numero totale di record incontrati finora. |
||
|
OFMT |
Il formato dâuscita per i numeri, quello predefinito è "%.6g" . |
||
|
OFS |
Il separatore di campi in uscita, normalmente è uno spazio. |
||
|
ORS |
Il separatore di record in uscita, normalmente la sequenza di fine linea (" newline "). |
||
|
PREC |
La precisione di lavoro di numeri a virgola mobile con precisione arbitraria, 53 [bit] è il valore predefinito. |
||
|
PROCINFO |
Gli elementi di questo vettore forniscono lâaccesso alle informazioni sul programma AWK in esecuzione. Vedere https://www.gnu.org/software/gawk/manual/html_node/Auto_002dset per i dettagli. |
||
|
ROUNDMODE |
La modalità di arrotondamento da usare per operazioni sui numeri con precisione arbitraria, quella predefinita è "N" (IEEE-754 roundTiesToEven mode). Vedere https://www.gnu.org/software/gawk/manual/html_node/Setting-the-rounding-mode per i dettagli. |
||
|
RS |
Il separatore di record in input (se non specificato è "newline"). |
||
|
RT |
Il terminatore di record. Gawk pone RT uguale al testo in input che corrisponde al carattere o alla espressione regolare indicati in RS . |
||
|
RSTART |
La posizione del primo carattere della stringa trovata da match() ; oppure 0 se non ci sono corrispondenze. |
||
|
RLENGTH |
La lunghezza della stringa trovata da match() ; oppure -1 se non ci sono corrispondenze. |
||
|
SUBSEP |
La stringa usata per separare indici multipli negli elementi di un vettore, quella predefinita è "\034" . |
||
|
SYMTAB |
Un vettore i cui indici sono i nomi di tutte le variabili globali e vettori attualmente definiti nel programma. Non è possibile usare lâistruzione delete per il vettore SYMTAB e neppure impostare elementi il cui indice non sia un nome di variabile. |
||
|
TEXTDOMAIN |
Il dominio di testo del programma AWK ; usato per trovare le traduzioni localizzate delle stringhe del programma. |
Vettori
I vettori hanno per indice unâespressione tra parentesi quadre ( [ e ] ). Se lâespressione è formata da una lista di espressioni ( expr , expr ...) lâindice del vettore è una stringa ottenuta concatenando i valori (stringa) di ogni espressione, separati dal valore della variabile SUBSEP . Questa modalità è usata per simulare vettori multidimensionali. Per esempio:
i =
"A"; j = "B"; k = "C"
x[i, j, k] = "hello, world\n"
assegna la stringa "hello, world\n" allâelemento del vettore x che è indicizzato dalla stringa "A\034B\034C" . In AWK , tutti i vettori sono associativi, cioè indicizzati da valori di tipo stringa.
Lâoperatore speciale in può essere usato per controllare se un vettore contiene un certo valore come indice:
if (val in vettore) print vettore[val]
Se il vettore ha indici multipli, si usi (i, j) in vettore .
Il costrutto in può anche essere usato in un ciclo for per iterare su tutti gli elementi di un vettore. Comunque, il costrutto (i, j) in vettore funziona solo nelle verifiche, non nei cicli for .
Un elemento di un vettore può essere cancellato con lâistruzione delete . Lâistruzione delete può anche essere usata per cancellare lâintero contenuto di un vettore, basta specificare il nome del vettore stesso senza indici.
gawk supports true multidimensional arrays. It does not require that such arrays be ârectangularâ as in C or C++. See https://www.gnu.org/software/gawk/manual/html_node/Arrays for details.
Spazi-dei-nomi
Gawk fornisce una semplice funzionalitĂ , namespace , (spazio-dei-nomi) per ovviare al fatto che tutte le variabili in AWK sono globali.
Un nome qualificato consiste di due identificativi semplici, congiunti da una coppia di due punti ( :: ). Il primo dei due identificativi designa lo spazio-dei-nomi (namespace) mentre il secondo è il nome della variabile al suo interno. Tutti i nomi semplici (non qualificati) sono considerati come appartenenti allo spazio-dei-nomi âcorrenteâ; lo spazio-dei-nomi predefinito ha nome awk . Comunque, gli identificativi i cui nomi sono composti solo da lettere maiuscole, vengono sempre considerati come facenti parte dello spazio-dei-nomi awk , anche se lo spazio-dei-nomi corrente è diverso da quello predefinito.
Si può cambiare lo spazio-dei-nomi corrente tramite la direttiva @namespace " nome " .
I nomi delle funzioni interne predefinite standard non possono essere usati come nomi di uno spazio-dei-nomi. I nomi di ulteriori funzioni, fornite da gawk possono essere usati come nomi di uno spazio-dei-nomi o come semplici identificativi in altri spazi-dei-nomi. Per ulteriori dettagli, vedere https://www.gnu.org/software/gawk/manual/html_node/Namespaces.html#Namespaces .
Notazione e conversione delle variabili
Variables and fields may be (floating point) numbers, or strings, or both. They may also be regular expressions. How the value of a variable is interpreted depends upon its context. If used in a numeric expression, it will be treated as a number; if used as a string it will be treated as a string.
Per far trattare una variabile come numero, le si sommi zero; per ottenere che venga trattata come come stringa, le si concateni la stringa nulla.
Le variabili non inizializzate hanno sia il valore numerico zero che il valore di stringa "" (la stringa nulla, o vuota).
Quando una stringa deve essere convertita in un numero, la conversione è compiuta con strtod (3). I numeri sono convertiti a stringhe usando sprintf (3) col valore di CONVFMT come stringa di formato ed il valore numerico della variabile come argomento. Tuttavia, anche se tutti i numeri in AWK sono in virgola mobile ("float"), i valori privi di decimali sono sempre convertiti in numeri interi.
Gawk esegue i confronti nel modo seguente: Se due variabili sono numeriche, sono confrontate numericamente. Se una è numerica e lâaltra è una stringa interpretabile come âstringa numerica,â sono pure confrontate numericamente. Negli altri casi, gli eventuali valori numerici sono convertiti in stringhe, ed è eseguito un confronto tra stringhe. Ovviamente, due stringhe sono confrontate come stringhe.
Si noti che le costanti stringa, come "57" , non sono stringhe numeriche, ma solo costanti stringa. Lâidea di âstringa numericaâ si applica solo ai campi, allâinput di getline , a FILENAME , agli elementi di ARGV di ENVIRON , ed agli elementi di un vettore creato da split() o da patsplit() che abbiano le caratteristiche di una stringa numerica. Lâidea fondamentale è che i dati immessi dallâutente , e solo essi, se risultano essere numerici, saranno trattati come numeri.
Costanti ottali ed esadecimali
Nel codice sorgente del programma si possono usare costanti ottali ed esadecimali in stile C. Per esempio, il valore ottale 011 è uguale al decimale 9 , e il valore esadecimale 0x11 è uguale al decimale 17.
Costanti di tipo stringa
Le costanti stringa in AWK sono sequenze di caratteri racchiusi tra doppi apici (come "valore" ). Allâinterno delle stringhe, sono riconosciute alcune sequenze di protezione , come in in C. Vedere https://www.gnu.org/software/gawk/manual/html_node/Escape-Sequences per i dettagli.
Costanti di tipo Regexp
Una costante di tipo espressione regolare è una sequenza di caratteri racchiusa tra barre (come /valore/ ).
Le sequenze di protezione descritte sopra si possono usare anche allâinterno di espressioni regolari costanti (p.es., /[Â \t\f\n\r\v]/ corrisponde a tutti i caratteri non stampabili).
Gawk provides strongly typed regular expression constants. These are written with a leading @ symbol (like so: @/value/ ). Such constants may be assigned to scalars (variables, array elements) and passed to user-defined functions. Variables that have been so assigned have regular expression type.
CRITERI DI RICERCA E AZIONI
AWK è un linguaggio che procede per righe. Il criterio va a inizio riga, lâazione lo segue. Le istruzioni dellâazione sono racchiuse tra { e } . Sia il criterio che lâazione possono mancare ma, naturalmente, non entrambi. Se manca il criterio, lâazione è eseguita per ogni record in input. Omettere invece lâazione equivale a specificare
{ print }
ossia stampare lâintero record.
I commenti cominciano col carattere # , e continuano fino a fine riga. Si possono separare le istruzioni con righe vuote. Unâistruzione finisce normalmente alla fine della riga, a meno che non termini con una virgola, { , ? , : , && , o || . Anche le istruzioni in righe terminanti con do o else continuano automaticamente alla riga successiva. Negli altri casi, unâistruzione può continua sulla riga successiva se termina con â\â, nel qual caso il "newline" è ignorato. Comunque, un â\â che venga dopo un carattere # non è speciale.
Si possono scrivere piĂš istruzioni sulla stessa riga separandole con â;â. Questo si applica sia alle istruzioni allâinterno di unâazione (il caso piĂš comune), sia ai gruppi criterio-azione stessi.
Criteri di ricerca
I criteri di ricerca di AWK possono assumere le forme seguenti:
BEGIN
END
BEGINFILE
ENDFILE
/
regular expression
/
relational expression
pattern
&&
pattern
pattern
||
pattern
pattern
?
pattern
:
pattern
(
pattern
)
!
pattern
pattern1
,
pattern2
BEGIN e END sono due tipi speciali di criteri di ricerca, che non dipendono dai dati in input. Le azioni di tutti i criteri di ricerca BEGIN sono unite insieme, come se tutte le istruzioni fossero scritte in unâunica regola BEGIN , e sono eseguite prima che sia letto qualsiasi input. Allo stesso modo, tutte le regole END sono fuse insieme, ed eseguite dopo che tutti i dati in input sono terminati o dopo che si è incontrata lâistruzione exit . BEGIN e END non possono essere combinati con altri criteri in espressioni di ricerca. I criteri BEGIN e END devono necessariamente essere seguiti dallâindicazione di unâazione.
BEGINFILE and ENDFILE are additional special patterns whose actions are executed before reading the first record of each command-line input file and after reading the last record of each file. Inside the BEGINFILE rule, the value of ERRNO is the empty string if the file was opened successfully. Otherwise, there is some problem with the file and the code should use nextfile to skip it. If that is not done, gawk produces its usual fatal error for files that cannot be opened.
Per i criteri del tipo / espressione regolare / lâazione associata è eseguita per ogni record in input che corrisponde allâespressione regolare. Le espressioni regolari hanno la stessa forma di quelle di egrep (1). Vedere https://www.gnu.org/software/gawk/manual/html_node/Regexp.html per i dettagli sulle espressioni regolari.
In unâ espressione relazionale si può usare qualsiasi operatore definito nella sezione sulla azioni, piĂš avanti. Generalmente lâespressione relazionale è utilizzata per verificare se certi campi siano individuati da determinate espressioni regolari.
Gli operatori && , || e ! sono rispettivamente lâAND logico, lâOR logico e il NOT logico. Come i loro equivalenti del linguaggio C, sono valutati solo il numero di operandistrettamente necessario a decidere il risultato, a partire da quello piĂš a sinistra ("short-circuit evaluation"). Sono usati per combinare espressioni di ricerca piĂš semplici. Come nella maggior parte dei linguaggi, si possono usare parentesi per cambiare lâordine di valutazione.
Lâoperatore ?: è simile allo stesso operatore in C: se il primo criterio è vero, allora il criterio utilizzato per il test è il secondo, altrimenti è il terzo. Dei criteri secondo e terzo, ne è valutato sempre solo uno.
Unâespressione nella forma criterio1 , criterio2 è detta criterio intervallo . Essa individua tutti i record a partire da quello che ha corrispondenza con criterio1 , fino a quello che corrisponde a criterio2 , compreso. Non può essere combinata con alcunâaltra espressione.
Azioni
Le istruzioni di azione sono racchiuse tra parentesi graffe, { e } . Lâinsieme delle istruzioni di azione è formato dalle solite istruzioni di assegnamento, condizionali e iterative presenti nella maggior parte dei linguaggi. Gli operatori, le strutture di controllo e le istruzioni di input/output ricalcano quelli corrispondenti nel linguaggio C.
Operatori
Gli operatori di AWK , in ordine decrescente di precedenza, sono:
|
( ... ) |
Raggruppamento |
||
|
$ |
Riferimento a campi. |
||
|
++ -- |
Incremento e decremento, sia prefisso che suffisso. |
||
|
Ë |
Elevamento a potenza. |
||
|
+ - ! |
PiĂš e meno unari, e negazione logica. |
||
|
* / % |
Moltiplicazione, divisione e resto della divisione. |
||
|
+ - |
Addizione e sottrazione. |
||
|
space |
Concatenazione di stringhe. |
||
|
| |& |
I/O proveniente dallâoutput di comandi [pipe] per getline , print e printf . |
< > <= >= == !=
I normali operatori di relazione.
|
Ë !Ë |
Corrispondenza con espressione regolare, o sua negazione. |
||
|
in |
Controllo di appartenenza a un vettore. |
||
|
&& |
AND logico. |
||
|
|| |
OR logico. |
||
|
?: |
Lâespressione condizionale in stile C. Ha la forma espressione1 ? espressione2 : espressione3 . Se espressione1 è vera, il valore dellâespressione è espressione2 , altrimenti è espressione3 . Viene calcolata solo una delle due espressioni espressione2 e espressione3 . |
= += -= *= /= %= Ë=
Assegnamento. Sono permessi sia lâassegnamento assoluto ( var = valore ) che quello con operatore (le altre forme).
Istruzioni di controllo
Le istruzioni di controllo sono le seguenti:
if
(
condizione
)
istruzione
[
else
istruzione
]
while (
condizione
)
istruzione
do
istruzione
while (
condizione
)
for (
espressione1
;
espressione2
;
espressione3
)
istruzione
for (
var
in
vettore
)
istruzione
break
continue
delete
vettore
[
indice
]
delete
vettore
exit
[
espressione
]
{
istruzioni
}
switch (
espressione
) { case
valore
|
espressione_regolare
:
istruzione ...
[
default:
istruzione
]
}
Istruzioni di I/O
Le istruzioni di input/output sono le seguenti:
|
close( file [ , come ] ) |
Chiude un file, una pipe o un coprocesso. Il parametro facoltativo come dovrebbe essere usato solo per chiudere unâestremitĂ di una pipe bi-direzionale aperta con un coprocesso. Il valore devâessere una stringa, o "to" o "from" . |
||
|
getline |
Imposta $0 usando la successiva riga di input; imposta NF , NR , FNR , RT . |
||
|
getline < file |
Imposta $0 usando la successiva riga di file ; imposta NF , RT . |
||
|
getline variabile |
Imposta variabile dalla successiva riga di input; imposta NR , FNR , RT . |
getline variabile < file
Imposta variabile dalla successiva riga di file ; imposta RT .
comando | getline [ variabile ]
Esegue comando dirigendo lâoutput [del comando] o in $0 o in variabile , come sopra, e RT .
comando |& getline [ variabile ]
Esegue comando come un coprocesso dirigendo lâoutput [del comando] o in $0 o in variabile , come sopra, e RT . (Il comando può anche essere un socket. Vedere la sottosezione Nomi di file speciali , piĂš avanti.)
|
fflush( [ file ] ) |
Scarica il contenuto di tutti i buffer associati ai file o alle pipe aperti in scrittura file . Se file non è specificato o ha per valore la stringa nulla, lâoperazione è eseguita su tutti i file e le pipe aperti in scrittura. |
||
|
next |
Cessa lâelaborazione della riga di input corrente. Legge la successiva riga di input, e lâelaborazione ricomincia a partire dal primo criterio di ricerca del programma AWK . Se non ci sono piĂš righe in input, gawk esegue i comandi di ogni regola END , se presenti. |
||
|
nextfile |
Cessa lâelaborazione del file di input corrente. La prossima riga letta proverrĂ dal file di input successivo. Aggiorna FILENAME e ARGIND , reimposta FNR a 1, e lâelaborazione riprende dal primo criterio di ricerca del programma AWK . Se non ci sono piĂš righe in input, gawk esegue i comandi di ogni regola ENDFILE ed END , se presenti. |
||
|
|
Stampa il record corrente. Alla fine della riga in output viene aggiunto il valore della variabile ORS . |
print lista-espressioni
Stampa le espressioni indicate. Ogni espressione è separata dal valore della variabile OFS . La riga prodotta termina col valore della variabile ORS .
print lista-espressioni > file
Stampa le espressioni indicate su file . Ogni espressione è separata dal valore della variabile OFS . La riga prodotta termina col valore della variabile ORS .
printf fmt, lista-espressioni
Formatta e stampa.
printf fmt, lista-espressioni > file
Stampa secondo formato su file .
system( riga-di-comando )
Esegue il comando riga-di-comando e ne restituisce il valore dâuscita. (Può non essere disponibile sui sistemi non- POSIX ). Vedere https://www.gnu.org/software/gawk/manual/html_node/I_002fO-Functions.html#I_002fO-Functions per tutti i dettagli sul valore dâuscita.
Sono permessi
anche altri tipi di ridirezione in scrittura per
print
e
printf
.
print ... >>
file
Aggiunge lâoutput alla fine di file .
print ... | comando
Scrive su una pipe.
print ... |& comando
Invia dati a un coprocesso o a un socket. (Vedere anche la sottosezione Nomi di file speciali , piĂš avanti).
The getline function returns 1 on success, zero on end of file, and -1 on an error. If the errno (3) value indicates that the I/O operation may be retried, and PROCINFO[" input ", "RETRY"] is set, then -2 is returned instead of -1, and further calls to getline may be attempted. Upon an error, ERRNO is set to a string describing the problem.
NOTE : Failure in opening a two-way socket results in a non-fatal error being returned to the calling function. If using a pipe, coprocess, or socket to getline , or from print or printf within a loop, you must use close() to create new instances of the command or socket. AWK does not automatically close pipes, sockets, or coprocesses when they return EOF.
The AWK versions of the printf statement and sprintf() function are similar to those of C. For details, see https://www.gnu.org/software/gawk/manual/html_node/Printf.html .
Nomi di file speciali
Effettuando delle ridirezioni di print o printf in un file, o attraverso getline da un file, gawk riconosce internamente alcuni nomi di file speciali, che permettono di accedere a descrittori di file giĂ aperti ereditati dal processo genitore di gawk (la shell, solitamente). Questi nomi di file possono anche essere usati nella riga di comando per designare dei file di dati. I nomi di file sono:
|
- |
Lo standard input. |
|||
|
/dev/stdin |
Lo standard input. |
|||
|
/dev/stdout |
Lo standard output. |
|||
|
/dev/stderr |
Lo standard error in output. |
|||
|
/dev/fd/ n |
Il file associato al descrittore di file aperto n . |
I seguenti nomi
di file speciali si possono usare con lâoperatore
|&
di coprocesso per creare connessioni di rete
TCP/IP:
/inet/tcp/
lport
/
rhost
/
rport
/inet4/tcp/
lport
/
rhost
/
rport
/inet6/tcp/
lport
/
rhost
/
rport
File per una connessione TCP/IP su una porta locale lport verso un host remoto rhost sulla porta remota rport . Si usi la porta numero 0 Per permettere al sistema di scegliere una porta. Si usi /inet4 per richiedere una connessione IPv4, e /inet6 per richiedere una connessione IPv6. Specificando semplicemente /inet usa quello predefinito del sistema (molto probabilmente IPv4). Si può usare solo con lâoperatore bidirezionale di I/O |& .
/inet/udp/
lport
/
rhost
/
rport
/inet4/udp/
lport
/
rhost
/
rport
/inet6/udp/
lport
/
rhost
/
rport
Come sopra, ma usando porte UDP/IP invece che TCP/IP.
Funzioni numeriche
AWK ha le seguenti funzioni aritmetiche predefinite:
|
atan2( y , x ) |
Restituisce lâarcotangente di y/x in radianti. |
cos( espressione )
Restituisce il coseno di espressione , in radianti.
exp( espressione )
La funzione esponenziale.
int( espressione )
Troncamento a numero intero.
log( espressione )
Logaritmo a base naturale.
|
rand() |
Restituisce un numero casuale N , tra zero e uno, tale che 0 ⤠N < 1. |
sin( espressione )
Restituisce il seno di espressione , in radianti.
sqrt( espressione )
Restituisce la radice quadrata di espressione .
srand( [ espressione ] )
Usa espressione come nuovo seme per il generatore di numeri casuali. Se espressione non è indicata, sarà utilizzata il tempo corrente, misurato in secondi dal 1970. Il valore restituito è il valore precedente del seme.
Funzioni di stringa
Gawk
ha
le seguenti funzioni predefinite per le stringhe; i dettagli
sono forniti in
https://www.gnu.org/software/gawk/manual/html_node/String-Functions
.
asort(
s
[
,
d
[
,
come
]
]
)
Return the number of elements in the source array s . Sort the contents of s using gawk âs normal rules for comparing values, and replace the indices of the sorted values s with sequential integers starting with 1. If the optional destination array d is specified, first duplicate s into d , and then sort d , leaving the indices of the source array s unchanged. The optional string how controls the direction and the comparison mode. Valid values for how are described in https://www.gnu.org/software/gawk/manual/html_node/String-Functions.html#String-Functions . s and d are allowed to be the same array; this only makes sense when supplying the third argument as well.
asorti( s [ , d [ , come ] ] )
Restituisce il numero di elementi del vettore di partenza s . Il comportamento è lo stesso di asort() , con la differenza che lâordinamento è fatto usando gli indici del vettore, e non i valori. Fatto lâordinamento, il vettore è indicizzato numericamente, e i valori sono quelli degli indici di partenza. I valori originali sono persi; quindi va utilizzato un secondo vettore se si vuole conservare il vettore di partenza. Lo scopo della stringa facoltativa come è lo stesso descritto in precedenza per asort() . Anche qui, s e d possono specificare lo stesso vettore; la cosa ha senso solo nel caso si specifichi anche il terzo argomento.
|
gensub( r , s , h [ , t ] ) |
Cerca nella stringa obiettivo t corrispondenze con lâespressione regolare r . Se h è una stringa che inizia con g o G , tutte le corrispondenze con r sono sostituite con s . Altrimenti, h è un numero che indica la particolare corrispondenza con r che si vuole sostituire. Se t non è specificata, è usato $0 al suo posto. Allâinterno del testo di rimpiazzo s si può utilizzare la sequenza \ n , dove n è una cifra tra 1 e 9, per indicare la parte di testo che corrisponde alla n -esima sottoespressione tra parentesi. La sequenza \0 rappresenta tutto il testo corrispondente, e cosĂŹ pure il carattere & . A differenza di sub() e gsub() , la stringa modificata è restituita come risultato della funzione, e la stringa obiettivo originale resta inalterata . |
||
|
gsub( r , s [ , t ] ) |
Per ogni sottostringa conforme allâespressione regolare r nella stringa t , sostituisce la stringa s , e restituisce il numero di sostituzioni. Se t non è specificata, usa $0 . Una & nel testo di rimpiazzo è sostituita dal testo trovato corrispondente alla espressione regolare. Si usi \& per indicare il carattere & inteso letteralmente. (Va scritto come "\\&" ; vedere https://www.gnu.org/software/gawk/manual/html_node/Gory-Details.html#Gory-Details per una trattazione piĂš completa delle regole sullâuso della "e commerciale" (ampersand) e delle barre inverse nel testo di rimpiazzo di sub() , gsub() , e gensub() .) |
||
|
index( s , t ) |
Restituisce la posizione della stringa t allâinterno della stringa s , o zero se la stringa t non è presente. (Ciò implica che gli indici di una stringa di caratteri partono da 1.) |
||
|
length( [ s ] ) |
Restituisce la lunghezza della stringa s , oppure la lunghezza di $0 se s non è specificata. Se si fornisce come argomento un vettore, length() restituisce il numero di elementi del vettore. |
||
|
match( s , r [ , a ] ) |
Restituisce la posizione in s in cui ricorre lâespressione regolare r , oppure zero se r non è presente, e imposta i valori di RSTART e RLENGTH . Si noti che lâordine degli argomenti è lo stesso in uso per lâoperatore Ë : stringa Ë espressione-regolare . Vedere https://www.gnu.org/software/gawk/manual/html_node/String-Functions.html#String-Functions per una descrizione di come il vettore a sia riempito se indicato. |
patsplit( s , a [ , r [ , seps ] ] )
Suddivide la stringa s nel vettore a e il vettore dei separatori. seps nellâespressione regolare r , e restituisce il numero dei campi. I valori di ogni elemento [del vettore] sono le parti di s che corrispondono a r . Il valore di seps[ i ] è il separatore (che potrebbe anche essere la stringa nulla) individuato davanti a a[ i ] . Il valore di seps[0] è il separatore iniziale (che potrebbe anche essere la stringa nulla). Se r è omesso, FPAT viene usato al suo posto. I vettori a e seps sono svuotati allâinizio dellâoperazione. La suddivisione si comporta come la suddivisione in campi con FPAT .
split( s , a [ , r [ , seps ] ] )
Suddivide la stringa s nel vettore a e il vettore dei separatori seps nellâespressione regolare r , e restituisce il numero dei campi. Se r è omesso, FS viene usato al suo posto. I vettori a e seps sono svuotati allâinizio dellâoperazione. seps[ i ] è il separatore di campi che corrisponde a r tra a[ i ] e a[ i +1] . La separazione diventa la stessa della separazione dei campi.
sprintf( fmt , lista-espressioni )
Stampa lista-espressioni secondo quanto specificato dal formato fmt , e restituisce la stringa risultante.
|
strtonum( str ) |
Esamina str , e ne restituisce il valore numerico. Se str inizia con uno 0 , è considerato un numero ottale. Se str inizia con uno 0x o 0X , è considerato un numero esadecimale. Altrimenti, viene interpretato come numero decimale. |
||
|
sub( r , s [ , t ] ) |
Si comporta come gsub() , ma è sostituita solo la prima sottostringa trovata. Viene restituito zero oppure uno. |
||
|
substr( s , i [ , n ] ) |
Restituisce una sottostringa, lunga al massimo n -caratteri, di s a partire dalla posizione i . Se n è omesso, è usato il resto di s . |
||
|
tolower( str ) |
Restituisce una copia della stringa str , con tutti i caratteri maiuscoli in str tradotti nei minuscoli corrispondenti. I caratteri non alfabetici restano invariati. |
||
|
toupper( str ) |
Restituisce una copia della stringa str , con tutti i caratteri minuscoli di str tradotti nei maiuscoli corrispondenti. I caratteri non alfabetici restano invariati. |
Gawk gestisce i caratteri multi-byte. Ciò implica che index() , length() , substr() e match() lavorano in termini di caratteri, non di byte.
Funzioni di tempo
Gawk
provides the following functions for obtaining time stamps
and formatting them. Details are provided in
https://www.gnu.org/software/gawk/manual/html_node/Time-Functions
.
mktime(
datespec
[
,
utc-flag
]
)
Converte datespec in un orario nella stessa forma restituita da systime() , e restituisce il risultato. Se è presente utc-flag e non è zero e neppure nullo, viene assunto che lâorario sia nel fuso UTC; altrimenti è assunto che lâorario sia nel fuso locale. Se datespec non contiene sufficienti elementi o se lâorario risultante è inammissibile, mktime() restituisce -1. Vedere https://www.gnu.org/software/gawk/manual/html_node/Time-Functions.html#Time-Functions per i dettagli su datespec .
strftime( [ format [ , timestamp [ , utc-flag ]]] )
Formatta timestamp secondo quanto specificato in format . Se utc-flag è presente e diversa da zero o dalla stringa nulla, il risultato è in UTC [ora di Greenwich], altrimenti il risultato è nellâora locale. Il timestamp dovrebbe essere nella forma utilizzata da systime() . Se timestamp è omesso, sono utilizzate la data e lâora correnti. Se format è omesso, è assunto un formato equivalente a quello dellâoutput del comando date (1). Il formato predefinito è disponibile in PROCINFO["strftime"] . Vedere le specifiche per la funzione strftime() in ISO C per i formati di conversione che sono sicuramente disponibili.
|
systime() |
Restituisce lâora corrente come numero di secondi a partire da: (1970-01-01 00:00:00 UTC sui sistemi POSIX ). |
Funzioni di manipolazione dei bit
Gawk offre le seguenti funzioni di manipolazione dei bit. Sono realizzate dapprima convertendo valori in virgola mobile con precisione doppia in interi nel formato uintmax_t , eseguendo lâoperazione indicata, e poi convertendo il risultato nuovamente in virgola mobile. Passare valori negativi a queste funzioni causa un errore fatale.
Le funzioni sono:
|
and( v1 , v2 [, ...] ) |
Restituisce il risultato derivante dallâapplicazione della funzione booleana AND bit per bit ai valori degli argomenti della lista degli argomenti. Gli argomenti devono essere almeno due. |
||
|
compl( val ) |
Restituisce il complemento bit per bit di val . |
lshift( val , contatore )
Restituisce il valore di val , spostato a sinistra di contatore bit.
|
or( v1 , v2 [, ...] ) |
Restituisce il risultato dellâapplicare la funzione booleana OR bit per bit ai valori degli argomenti della lista degli argomenti. Gli argomenti devono essere almeno due. |
rshift( val , contatore )
Restituisce il valore di val , spostato a destra di contatore bit.
|
xor( v1 , v2 [, ...] ) |
Restituisce il risultato derivante dallâapplicazione della funzione booleana XOR bit per bit ai valori degli argomenti della lista degli argomenti. Gli argomenti devono essere almeno due. |
Funzioni di tipo
Le seguenti funzioni forniscono informazioni relative agli argomenti che vengono loro passati.
|
isarray( x ) |
Restituisce vero se x è un vettore, altrimenti falso. |
||
|
typeof( x ) |
Restituisce una stringa che indica il tipo di x . La stringa sarĂ una di queste: "array" , "number" , "regexp" , "string" , "strnum" , "unassigned" o "undefined" . |
Funzioni di internazionalizzazione
Le seguenti
funzioni possono essere usate allâinterno di un
programma AWK per tradurre stringhe in fase di esecuzione
del programma. Per informazioni piĂš complete, vedere
https://www.gnu.org/software/gawk/manual/html_node/I18N-Functions.html#I18N-Functions
.
bindtextdomain(
directory
[
,
dominio
]
)
Specifica la directory in cui
gawk
cerca i file
.gmo
, nel caso non si
trovino o non si possano mettere nelle directory
âstandardâ. Restituisce la directory a cui
dominio
è âcollegatoâ.
Il valore predefinito per
dominio
è il valore
della variabile
TEXTDOMAIN
. Se
directory
è impostato alla stringa nulla (
""
),
bindtextdomain()
restituisce il collegamento corrente
per il dato
dominio
.
dcgettext( stringa [ , dominio [ , categoria ]] )
Restituisce la traduzione della stringa nel dominio di testo dominio per la categoria di localizzazione categoria . Il valore predefinito per dominio è il valore corrente della variabile TEXTDOMAIN . Il valore predefinito per categoria è "LC_MESSAGES" .
dcngettext( stringa1 , stringa2 , numero [ , dominio [ , categoria ]] )
Restituisce la forma plurale in uso per numero nella traduzione di stringa1 e stringa2 nel dominio di testo dominio per la categoria di localizzazione categoria . Il valore predefinito per dominio è il valore corrente della variabile TEXTDOMAIN . Il valore predefinito per categoria è "LC_MESSAGES" .
Funzioni con valori booleani
Si possono
creare valori speciali di tipo booleano; vedere il manuale
per come funzionano e come mai esistono.
mkbool(
espressione
)
In base al valore booleano di espressione restituisce il valore vero o falso. Il valore vero ha valore numerico uno. Il valore falso ha valore numerico zero.
FUNZIONI DEFINITE DALLâUTENTE
Le funzioni in AWK sono definite in questo modo:
function nome ( lista-di-parametri ) { istruzioni }
Le funzioni vengono eseguite se chiamate dallâinterno di espressioni, presenti sia allâinterno di criteri di ricerca, che allâinterno di azioni. I parametri forniti al momento della chiamata sono sostituiti ai parametri formali dichiarati nella funzione. I vettori sono passati per riferimento, le altre variabili per valore.
Le variabili locali sono dichiarate come parametri in piĂš nella lista dei parametri formali. Per convenzione, si usa separare le variabili locali dai veri parametri con qualche spazio in piĂš nella lista. Per esempio:
function f(p, q, a, b) # a e b sono variabili locali { ... }
|
/abc/ |
{ ... ; f(1, 2) ; ... } |
La parentesi di sinistra che indica una chiamata deve seguire immediatamente il nome della funzione chiamata, senza spazi in mezzo. Questa restrizione non si applica alle funzioni predefinite elencate sopra.
Le funzioni possono chiamare a loro volta altre funzioni, e possono essere ricorsive. I parametri utilizzati come variabili locali sono inizializzati alla stringa nulla e al numero zero al momento dellâinvocazione.
Si usi return expr per restituire un valore da una funzione. Il valore di ritorno è indefinito se non si fornisce alcun valore, o se la funzione ritorna automaticamente dopo aver eseguito lâultima istruzione della funzione stessa, nella modalitĂ detta âfalling offâ.
Functions may be called indirectly. To do this, assign the name of the function to be called, as a string, to a variable. Then use the variable as if it were the name of a function, prefixed with an @ sign, like so:
|
function mia_funzione() { |
print "mia_funzione è stata chiamata" |
... } |
||||||||||
|
{ |
||||||||||||
|
... |
||||||||||||
|
the_func = "mia_funzione" |
@the_func() |
# chiamata tramite nome_funzione di mia_funzione |
... } |
Se è stata data lâopzione --lint , gawk avvertirĂ in caso di chiamate a funzioni indefinite al momento della valutazione sintattica del programma anzichĂŠ durante lâesecuzione. La chiamata di una funzione indefinita in fase di esecuzione è un errore fatale.
CARICARE DINAMICAMENTE NUOVE FUNZIONI
Si possono aggiungere dinamicamente nuove funzioni scritte in C o C++ allâinterprete gawk in esecuzione tramite lâistruzione @load . Una descrizione dettagliata non è possibile in questa pagina di manuale; vedere https://www.gnu.org/software/gawk/manual/html_node/Dynamic-Extensions.html#Dynamic-Extensions .
SEGNALI
Il profilo gawk riconosce due segnali. SIGUSR1 provoca la scrittura di un profilo e dello stack delle chiamate a funzione nel file di profilazione, che ha per nome awkprof.out , o qualsiasi nome sia stato fornito specificando lâopzione --profile . Poi lâesecuzione del programma prosegue regolarmente. SIGHUP chiede a gawk di scrivere il profilo e lo stack delle chiamate a funzione e di terminare lâesecuzione del programma.
INTERNAZIONALIZZAZIONE
String constants are sequences of characters enclosed in double quotes. In non-English speaking environments, it is possible to mark strings in the AWK program as requiring translation to the local natural language. Such strings are marked in the AWK program with a leading underscore (â_â). For example,
gawk âBEGIN { print "hello, world" }â
stampa sempre il messaggio hello, world . Ma,
gawk âBEGIN { print _"hello, world" }â
potrebbe scrivere salve, mondo in Italia. Vedere https://www.gnu.org/software/gawk/manual/html_node/Internationalization.html#Internationalization per i passi da seguire per produrre ed eseguire un programma AWK localizzabile.
ESTENSIONI GNU
Gawk ha fin troppe estensioni rispetto alla versione POSIX di awk . Esse sono descritte in https://www.gnu.org/software/gawk/manual/html_node/POSIX_002fGNU.html . Tutte le estensioni possono essere disabilitate invocando gawk con le opzioni --traditional o --posix .
VARIABILI DâAMBIENTE
La variabile dâambiente AWKPATH può essere usata per fornire una lista di directory che gawk esamina alla ricerca di file coi nomi indicati tramite le opzioni -f , --file , -i e --include , e tramite la direttiva @include . Se la ricerca iniziale non ha successo, una seconda ricerca è effettuata accodando .awk al nome del file indicato.
La variabile dâambiente AWKLIBPATH può essere usata per fornire una lista di directory che gawk esamina alla ricerca di file coi nomi indicati tramite le opzioni -l e --load .
The GAWK_PERSIST_FILE environment variable, if present, specifies a file to use as the backing store for persistent memory. See GAWK: Effective AWK Programming for the details.
La variabile dâambiente GAWK_READ_TIMEOUT può essere usata per specificare un tempo massimo in millisecondi per leggere input da un terminale, da una pipe o da una comunicazione bidirezionale, inclusi i socket.
For connection to a remote host via socket, GAWK_SOCK_RETRIES controls the number of retries, and GAWK_MSEC_SLEEP the interval between retries. The interval is in milliseconds. On systems that do not support usleep (3), the value is rounded up to an integral number of seconds.
Se la variabile POSIXLY_CORRECT esiste nellâambiente, gawk si comporta esattamente come se --posix fosse stato specificato sulla riga di comando. Se --lint è stato specificato, gawk emette un messaggio di avvertimento riguardo a questo.
STATO DI USCITA
Se lâistruzione exit è usata avendo come parametro un valore, gawk termina restituendo il valore numerico in questione.
Altrimenti, se non sono stati riscontrati problemi in fase di esecuzione, gawk termina con il valore della costante C EXIT_SUCCESS . Questo valore è normalmente zero.
In caso di errore, gawk termina con il valore della costante C EXIT_FAILURE . Questo valore è normalmente uno.
Se gawk termina a causa di un errore fatale, il valore restituito è 2. Su sistemi non-POSIX, questo valore può essere visualizzato come EXIT_FAILURE .
INFORMAZIONE SULLA VERSIONE
Questa pagina man documenta gawk , versione 5.3.
AUTORI
The original version of UNIX awk was designed and implemented by Alfred Aho, Peter Weinberger, and Brian Kernighan of Bell Laboratories. Ozan Yigit is the current maintainer. Brian Kernighan occasionally dabbles in its development.
Paul Rubin e Jay Fenlason, della Free Software Foundation, hanno scritto gawk , in modo che fosse compatibile con la versione originale di awk distribuita con la Settima Edizione di UNIX . John Woods ha contribuito con numerose correzioni di errori. David Trueman, con contribuzioni da Arnold Robbins, ha reso gawk compatibile con la nuova versione di UNIX awk . Arnold Robbins è il manutentore corrente.
Vedere GAWK: Effective AWK Programming per una lista completa di contributori a gawk e alla sua documentazione.
Vedere il file README nella distribuzione gawk per informazioni aggiornate riguardo ai manutentori e per sapere per quali sistemi operativi gawk è disponibile.
BUG REPORTS AND QUESTIONS
Se si trova un bug in gawk , usare il programma gawkbug (1) per segnalarlo.
Le istruzioni complete per segnalare un bus sono fornite in https://www.gnu.org/software/gawk/manual/html_node/Bugs.html . Per favore leggere attentamente e seguire le istruzioni date lĂŹ. Questo semplificherĂ sia la segnalazione che la risoluzione. Veramente.
On the other hand, if you have a question as to how to accomplish a particular task using awk or gawk , send an email to help-gawk@gnu.org with your request for help.
BUG
Lâopzione -F non è piĂš necessaria, vista la possibilitĂ di assegnare variabili nella riga di comando; viene mantenuta solo per compatibilitĂ allâindietro.
Questa pagina di manuale è troppo lunga; gawk ha troppe funzionalità .
VEDERE ANCHE
egrep (1), sed (1), gawkbug (1), printf (3) e strftime (3).
The AWK Programming Language , second edition, Alfred V. Aho, Brian W. Kernighan, Peter J. Weinberger, Addison-Wesley, 2023. ISBN 9-780138-269722.
GAWK: Effective AWK Programming , Edition 5.3, shipped with the gawk source. The current version of this document is available online at https://www.gnu.org/software/gawk/manual .
La documentazione di gettext GNU è disponibile online a: https://www.gnu.org/software/gettext .
ESEMPI
Stampa ed ordina i nomi di login di tutti gli utenti:
|
BEGIN |
{ FS = ":" } |
{ print $1 | "sort" } |
Conta le righe di un file:
|
{ nlines++ } |
END |
{ print nlines } |
Aggiunge il numero di riga allâinizio di ogni riga del file:
|
{ print FNR, $0 } |
Concatena e aggiunge numerazione (variazione sul tema):
|
{ print NR, $0 } |
Esegui un comando esterno per alcune linee di dati:
|
tail -f access_log | |
awk â/myhome.html/ { system("nmap " $1 ">> logdir/myhome.html") }â |
COPYING PERMISSIONS
Copyright Š 1989, 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2001, 2002, 2003, 2004, 2005, 2007, 2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021, 2022, 2023, 2024, 2025 Free Software Foundation, Inc.
Ă permesso stampare e distribuire copie letterali di questa pagina di manuale, a patto che il copyright e questa nota di autorizzazione siano conservate e presenti in ogni copia.
Ă permesso copiare e distribuire versioni modificate di questa pagina del manuale, sotto le condizioni poste per la copia letterale, a patto che lâintero lavoro derivato sia distribuito secondo permessi di stampa identici a questi.
Ă permesso copiare e distribuire traduzioni di questa pagina dimanuale in unâaltra lingua, sotto le condizioni poste sopra per leversioni modificate, salvo che questâinformazione suipermessi di copia e ristampa deve essere espressa in una traduzioneapprovata dalla Free Software Foundation.
TRADUZIONE
La traduzione italiana di questa pagina di manuale è stata creata da Giuseppe Guerrini <giusguerrini@racine.ra.it>, Antonio Giovanni Colombo <azc100@gmail.com>, Marco Curreli <marcocurreli@tiscali.it> e Giuseppe Sacco <eppesuig@debian.org>
Questa traduzione è documentazione libera; leggere la GNU General Public License Versione 3 o successiva per le condizioni di copyright. Non ci assumiamo alcuna responsabilità .
Per segnalare errori nella traduzione di questa pagina di manuale inviare un messaggio a pluto-ildp@lists.pluto.it .