Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Riassunto PROSODIA.Modelli e ricerca empirica di Patrizia Sorianello, Sintesi del corso di Linguistica Generale

Riassunto integrale del testo "Prosodia. Modelli e ricerca empirica" di Patrizia Sorianello (Carocci 2011)

Tipologia: Sintesi del corso

2014/2015

In vendita dal 12/09/2015

valentina.lillo.11
valentina.lillo.11 🇮🇹

4.6

(33)

59 documenti

1 / 41

Toggle sidebar

Spesso scaricati insieme


Documenti correlati


Anteprima parziale del testo

Scarica Riassunto PROSODIA.Modelli e ricerca empirica di Patrizia Sorianello e più Sintesi del corso in PDF di Linguistica Generale solo su Docsity! 1 PROSODIA: MODELLI E RICERCA EMPIRICA di P. Sorianello CAP. 1 - I FENOMENI PROSODICI 1.1 Premessa Verso la fine degli anni 70, la prosodia ha assunto un ruolo centrale all'interno della teoria linguistica che ha progressivamente abbandonato alcuni suoi principi, come la linearità della rappresentazione fonologica, adottando invece per la prima volta un approccio metrico e autosegmentale, dove la rappresentazione fonologica è articolata su più livelli paralleli e autonomi. Sempre a partire da questi anni, la ricerca prosodica e proseguita fino ad arrivare a costituire un nuovo settore, la fonologia dell'intonazione. l'analisi fonologica fonetica della prosodia si sono poi unite in un'unica prospettiva metodologica, favorendo la nascita di una nuova area di ricerca interdisciplinare, chiamata Laboratory Phonology. 1.2 Definizione di prosodia Con il termine "prosodia" si intendono una serie di fenomeni che hanno un dominio di applicazione più ampio rispetto a quello di un singolo segmento. Infatti, i fenomeni prosodici o soprasegmentali quali l'accento, il ritmo, il tono e l'intonazione, possono essere rappresentati idealmente come sovrapposti ai segmenti. Nel parlato, inoltre, un tratto prosodico risulta normalmente concomitante con l'articolazione di un suono, ma può essere prodotto anche in maniera isolata nelle fasi pre linguistiche, ad esempio nel comportamento dei neonati. Per molto tempo, gli elementi prosodici venivano considerati privi di uno statuto linguistico è per il loro carattere non discreto, soggetto cioè a variazioni graduali, sia per la presenza di funzioni espressive. Nel corso degli anni, però, questa tesi è stata confutata, in seguito ai risultati raggiunti dalla ricerca sperimentale che ha evidenziato come i tratti prosodici partecipino direttamente alla dinamica comunicativa in maniera distintiva e contrastiva. 1.3 La sillaba La sillaba organizza suoni essendo un’unità di valore fonetico oltre che prosodico. La sillaba è caratterizzata da una struttura gerarchica interna, ed è costituita da due elementi: 1) da un elemento vocalico obbligatorio, chiamato Apice o Nucleo (per esempio, le vocali delle prime sillabe in parole come o-ro, a-prire); 2) e dagli elementi consonantici opzionali definiti Attacco, quando precedono il nucleo (ad esempio, ta-ne, tra-ve, stra-ne) oppure Coda, quando invece seguono il nucleo (ad esempio al- ber-go, gat-to). La coda, però, non può essere composta da oltre tre elementi prosodici. L’italiano, in particolare, ammette in coda solo un elemento, mentre altre lingue ammettono un numero ben più alto di sillabe nella coda, come l’inglese. Il nucleo e la coda formano a loro volta la Rima. Esistono vari tipi di rime: sillabiche e metriche. Nelle poesie le rime coinvolgono solo nucleo e coda, non l’attacco. I lapsus linguae coinvolgono invece solo la rima sillabica e riguardano lo spostamento di una rima. Una sillaba, inoltre, può essere aperta quando termina per vocale, quindi è priva di coda (ad esempio ta-vo-lo), oppure chiusa quando, al contrario, termina con una consonante in coda (ad esempio cor-to, pen-na). In latino le sillabe si distinguevano anche in pesanti e leggere. La sillaba è pesante quando termina con una coda (quindi è chiusa) oppure quando il nucleo è costituito da una vocale lunga. La pesantezza della sillaba determina altresì un diverso posizionamento dell’accento. La combinazione delle consonanti intorno al nucleo non avviene in modo casuale, ma risponde a precise restrizioni fonotattiche e alle specifiche regole di sillabazione di una determinata lingua. 2 Quest’ultime rispondono a loro volta a una serie di principi universali di sonorità oltre che a specifici principi linguistici: in tal senso, dal momento che le vocali presentano il massimo grado di sonorità, costituiscono solitamente l'elemento attorno al quale si raggruppano i fonemi consonantici, il cui grado di sonorità risulta progressivamente minore man mano che ci si allontana dal nucleo vocalico. Sul piano fonologico, di conseguenza, l'inizio e la fine di una parola può essere costituito dall'attacco o dalla coda di una sillaba: in italiano, ad esempio, non esistono parole che iniziano con una sequenza consonantica come lf, mb. Questo tipo di sequenza può però comparire all'interno di una parola, come nel caso di gam-ba, el-fo. Per individuare i confini sillabici, in particolare, ci sono dei criteri da seguire: - Tutto ciò che non può apparire all’inizio di una parola non può apparire al confine di sillaba; - Gli elementi che fanno parte di una stessa sillaba si dicono tauto-sillabici; se invece appartengono a sillabe diverse si parla di elementi etero-sillabici. Anche una sequenza consonatica (m b) è da considerarsi etero-sillaba; - Se si ha di fronte una consonante geminata, cioè doppia, bisogna specificare se le due consonanti continue sono dello stesso tipo oppure no. Cvc.cv (car.ta) Cv.ccv (mi.tra) Confine di sillaba La tipologia di sillaba più diffusa è quella formata da una sola consonante, seguita da una vocale (CV); si tratta, peraltro, della prima struttura sillabica ad essere appresa dal bambino durante il processo di acquisizione linguistica. La complessità delle sillabe varia però da lingua a lingua. Vi sono, ad esempio, lingue, come quelle germaniche o l’olandese, il russo etc. che presentano strutture sillabiche più complesse. articolate. Il giapponese, al contrario, è una lingua estremamente semplice sul piano dell’articolazione sillabica, in quanto le parole sono sempre di tipo CV, senza alcuna coda. Nell’italiano, invece, circa il 60% delle sillabe ha una struttura semplice, del tipo CV; l'attacco, inoltre può essere semplice oppure ramificato, cioè composto da più consonanti. La coda, invece, può essere costituita solo da una consonante, tra r l n m, oltre al primo elemento di una consonante germinata, ad esempio por-to, col-po, cam-po, gat-to. Ci sono, però, delle eccezioni come la s impura, cioè la s seguita dalla consonante (sc, sbr, sti, etc.). A questo proposito, in italiano, in base alle regole tradizionali di scomposizione sillabica, ogni nesso formato dalla s più una consonante, posto all'interno di una parola, deve costituire l'attacco di una sillaba (ad esempio, vi-spo, te-sta, mo-sca). Tuttavia, da un punto di vista fonetico e fonologico, si può ragionevolmente ritenere che in questo contesto segmentale la s rappresenti la coda della sillaba piuttosto che l'attacco. In questo caso, quindi, gli stessi lessemi andranno sillabati come vis- po, tes-ta, mos-ca. La sequenza sC, quindi, sarebbe di tipo eterosillabico. 1.4 L'accento L'accento si tratta di un tratto prosodico posto in stretta correlazione con la sillaba, in quanto serve a porre in rilievo quest'ultima all'interno della parola. L’accento può essere fisso o libero; in italiano l’accento è libero in quanto può cadere in qualunque tipo di sillaba, così come l’inglese, il russo e lo spagnolo. Il turco, il polacco o l’ungherese, invece, hanno una struttura accentuale fissa in quanto l’accento cade sempre sull’ultima o sulla prima (l’ungherese). In queste lingue, l'accento ha un valore demarcativo svolge una funzione demarcativa, poiché permette di segnalare la fine di un morfema o di una parola. In italiano e nelle altre lingue ad accento libero, invece, l’accento è distintivo perché permette di opporre parole che hanno la stessa struttura sintattica ma un diverso accento (papa – papà). Le sillabe che cadono su di una vocale si dicono toniche o accentate (ta- 5 Queste due tipologie di toni sono inoltre alla base della dicotomia tra lingue tonali a registro e lingue tonali a profilo. Nel primo caso la distintività è determinata dal livello in cui si colloca l'elemento tonale realizzato; nelle lingue tonali a profilo, solitamente quelle orientali, invece, il tono non conserva un'altezza fissa, ma varia realizzando un movimento dinamico, per cui la realizzazione dei toni è condizionata dal contorno intonativo dell'intero enunciato. 1.7 L'intonazione L'intonazione consiste nell'andamento melodico di un testo, messaggio verbale o enunciato. È un fenomeno universale, presente in tutte le lingue, e multi-dimensionale, oltre che plurifunzionale poiché assorbe più funzioni linguistiche ed espressive. La sua funzione principale, comunque, consiste nel segmentare il parlato in gruppi di parole coerenti sul piano testuale. Ogni unità discreta prende il nome di unità intonativa o unità tonale. Quest'ultima è composta da un accento intonativo nucleare, da eventuali altri accenti ed è delimitata da una marca di confine. L'intonazione ha anche una funzione sintattica, in quanto indica la forza illocutiva dell'enunciato, distinguendo i tipi frasali assertivi da quelli non assertivi (domanda, ordine ecc.); ha poi funzione semantico-pragmatica in quanto contribuisce, all'interno dell'enunciato, a strutturare in termini informazionali il messaggio prodotto. L’intonazione ha infine una funzione paralinguistica che riguarda tutti quegli aspetti non linguistici che appartengono alla sfera dell’espressività e dell'emotività: mediante l’intonazione, quindi, codifichiamo anche le nostre emozioni e i nostri stati d’animo. Gli studi sull’intonazione sono però stati pochi, hanno avuto una evoluzione molto rallentata poiché lo studio di questo componente prosodico è difficoltoso. Tra gli aspetti più problematici che hanno rallentato lo studio dell’intonazione vi è la questione relativa alla sua natura, cioè capire se essa vada considerata continua o discreta. A questo proposito, l'intonazione è stata spesso considerata un fenomeno non avente interesse linguistico, in quanto per molto tempo si è creduto che le variazioni intonative fossero di natura continua e globale, quindi difficilmente categorizzabile all'interno di un sistema di opposizioni contrastive. Da questo dibattito, si sono poi formati due approcci teorici caratterizzati da una visione diametralmente opposta riguardo l'intonazione: da una parte l'approccio per configurazioni, riconducibile alla cosiddetta "tradizione inglese", dall'altra l'approccio per livelli, riconducibile alla "tradizione americana". Attualmente, comunque, prevale un atteggiamento di mediazione, in quanti è opinione diffusa che nel sistema intonativo di una lingua confluiscono sia fenomeni di natura globale, diffusi all'interno di tutta l'unità intonativa, come la declinazione e l'estensione tonale, sia fenomeni di natura locale, diffusi su poche sillabe, come l'accento o il confine intonativo. 1.8 L'allungamento finale L'allungamento prepausale è un fenomeno prosodico che determina conseguenze sulla struttura temporale del parlato e consiste in un allungamento temporale delle ultime sillabe di un enunciato. Solitamente, gli effetti dell'allungamento prepausale sono progressivi e si estendono da sinistra verso destra; si manifestano sull'ultima parola dell'enunciato e non solo sulla sillaba finale, mentre l'incremento temporale dei segmenti risulta essere tanto maggiore quanto più vicina è la loro posizione rispetto alla pausa o a un confine prosodico forte. Questo fenomeno svolge una funzione demarcativa in quanto contribuisce a segnalare percettivamente la fine di un’unità linguistica. Una questione molto dibattuta è quella relativa alle cause che danno origine a questo fenomeno. A questo proposito possiamo individuare tre ipotesi interpretative quali: il condizionamento fisiologico, il condizionamento sintattico e il condizionamento intonativo. Secondo la prima ipotesi, l'aumento temporale degli ultimi suoni di un'unità intonativa dipende da un generale rilassamento 6 del gesto articolatorio. Secondo l'ipotesi del condizionamento sintattico, formulata nell'ambito di modelli teorici cognitivi volti a prevedere, attraverso complesse formule matematiche, il grado di comprensione e allungamento sillabico iniziale e finale subìti dai suoni all'interno di un enunciato, l'applicazione di regole di allungamento temporale non è casuale, ma risponde alla struttura sintattica del parlato. Nella terza ipotesi formulata da Lyberg, infine, si sostiene l'esistenza di un rapporto causa-effetto tra l'allungamento prepausale e l'andamento intonativo: il primo sarebbe quindi un fenomeno prosodico subordinato, che dipende dalle variazioni intonative presenti alla fine di un enunciato. 1.9 Le pause e la velocità d'eloquio La pausa si tratta di un’interruzione momentanea dell'attività fonatoria. È possibile distinguere pause silenti, vuote, e pause non silenti o sonore. La pausa silente rappresenta un reale momento di silenzio all'interno della catena fonica; la pausa non silente, invece, è costituita da quei fenomeni di vocalizzazione o di prolungamento vocalico molto frequenti nel parlato spontaneo e che sono spesso legati a difficoltà di esecuzione linguistica. Le pause silenti hanno spesso una natura fisiologica, dipendono cioè dai ritmi della respirazione; altre, invece, hanno una funzione stilistica e sono usate deliberatamente per enfatizzare un argomento, oppure quando si cerca di attirare l'attenzione dell'interlocutore su ciò che viene detto. Infine vi sono pause di esitazione causate da problemi di macropianificazione linguistica. La pausa serve inoltre ad organizzare il parlato sul piano prosodico. Una serie di ricerche, infatti, ha dimostrato come la distribuzione delle pause sia legata alla strutturazione sintattica dell'enunciato, come risulta evidente nel caso del parlato letto. Nel parlato spontaneo, però, le pause dipendono non tanto dall'organizzazione sintattica quanto dall'organizzazione informativa del messaggio linguistico, di conseguenza tendono ad essere più numerose, di durata variabile e meno prevedibili. La distribuzione e la durata delle pause sono essenzialmente influenzate da due fattori: la lunghezza del costituente sintattico e il tempo di esecuzione. La velocità di eloquio (speech rate), in particolare, rappresenta l'indice di fluenza relativo al numero di fonemi e di sillabe prodotte in un’unità temporale. Questo indice è a sua volta influenzato da una serie di variabili come il contesto enunciativo della comunicazione, lo stile e l'intento comunicativo. La durata dell’eloquio, invece, è un indice che permette di differenziare lingue e generi di parlato diversi: ad esempio lo stile informale e trascurato è solitamente più veloce rispetto a uno stile formale e accurato. 1.10 Acustica dei fenomeni soprasegmentali I maggiori fenomeni soprasegmentali, quali la durata, l'intensità e l'altezza, interagiscono strettamente tra loro durante la realizzazione di un qualsiasi processo prosodico. La durata La durata si riferisce alla lunghezza temporale di un suono e viene misurata in secondi o millisecondi. La durata è una proprietà che vale per tutte le vocali e solo per le consonanti fricative, cioè quelli consonanti la cui articolazione richiede non una chiusura momentanea ma solo un restringimento del canale vocale, tale che la corrente d’aria passandovi produca un rumore simile a un fruscio (da cui appunto il nome). Ogni suono ha inoltre una durata intrinseca distintiva, per esempio le vocali alte i u sono più brevi della vocale bassa a, le consonanti fricative sono generalmente più lunghe di quelle occlusive, mentre le consonanti nasali e quelle affricate, cioè risultanti dalla fusione di un elemento occlusivo e di un elemento fricativo, sono a loro volta più lunghe delle fricative. In molte lingue la durata ha anche uno statuto fonologico: ad esempio nella lingua italiana, le consonanti brevi o scempie si oppongono a quelle lunghe, o geminate ([‘kasa] vs. [‘kassa], dove la consonante s in cassa ha una durata pari all’incirca al doppio della corrispettiva 7 consonante scempia in casa). In questo caso, però, si tratta di un allungamento fonetico e non di lunghezza fonologica. Se invece la vocale si trova in finale di parola (ad esempio libertà, caffè), il segmento tonico, pur essendo in sillaba aperta, risulta breve. Nel parlato spontaneo, però, la durata delle vocali non subisce il condizionamento della struttura sillabica. L'intensità L'intensità di un suono è determinata dall'ampiezza delle onde sonore emesse durante la fonazione. Per quanto riguarda il piano fisiologico, l'intensità è causata da una serie di fattori quali: la quantità di energia articolatoria, la pressione dell'aria proveniente dai polmoni e il grado di tensione delle pliche vocali. L'intensità di un suono viene normalmente misurata in decibel che, sul piano uditivo, fa riferimento al volume della voce. In genere, l'intensità media di una normale conversazione è pari a circa 60 dB. L’intensità, però, è anche il parametro acustico più soggetto a condizionamenti linguistici ed extralinguistici: infatti la presenza di rumori esterni o l'eccessiva vicinanza al microfono possono alterare il segnale audio finale. La frequenza fondamentale Sul piano fisiologico, il passaggio dell’aria all’interno del nostro organismo avviene attraverso la trachea e poi attraverso la glottide. Dal momento che il passaggio a livello della glottide è piuttosto stretto, la pressione glottidale aumenta, mentre l'aria fuoriesce più velocemente. Come conseguenza, le pliche vocali, cioè pieghe muscolari sottili ed elastiche, si accostano, dando origine a cicli di chiusura e apertura molto veloci. Quando le pliche vibrano produciamo dei suoni sonori, se non vibrano produciamo solo suono sordi. Il numero di cicli compiuti determina un valore referenziale che ha come unità di misura l’Hertz. L’indice fisico che deriva da questo processo va sotto il nome di frequenza fondamentale. Questo parametro riguarda il numero delle vibrazioni glottidali compiute in un secondo ed è convenzionalmente indicato con la sigla di F0 (F con zero). Questo valore è presente in tutti i suoni sonori, vocali e consonantici, mentre non è mai presente nei suoni sordi. La velocità attraverso cui le pliche vocali compiono questo processo determina il valore della frequenza fondamentale. I suoni che si collocano in bassa frequenza sono suoni alti o acuti, mentre quelli che si collocano in bassa frequenza vengono percepiti come suoni gravi. La successione dei valori dei cicli di apertura e chiusura determina quindi il contorno melodico dell’enunciato, ovvero un andamento di tipo curvilineo costituito da una serie di picchi e avallamenti. Le variazioni melodiche dipendono dalle condizioni vocali di un individuo, dalle condizioni anatomiche, dall’età e in primis dal sesso biologico. Infatti, nelle donne e soprattutto nei bambini le pliche vocali sono in grado di compiere cicli di apertura e di chiusura più veloci e nello stesso tempo più brevi, perché più piccole a livello anatomico. I bambini, in particolare, possiedono una laringe molto piccola; sia nei maschi che nelle femmine, le corde vocali fino all’età puberale sono infatti di 5 o 6mm. Dopodiché si ha la differenziazione di voce: nell’uomo le pliche vocali raggiungono in media 20-23mm di lunghezza, mentre nelle donne 17-18mm; nelle donne, quindi, le pliche vocali sono più corte di circa il 15%, mentre l’intera laringe è più piccola del 50%. La conseguenza è che le voci femminili sono più acute, mentre quelle maschili più gravi. Nell’uomo, in media, abbiamo un valore frequenziale compreso tra 80 e 160; nelle donne, invece, abbiamo un campo frequenziale più alto, da 160 fino a 350. I bambini, per via della laringe più piccola, hanno una voce che si colloca intorno ai 500 Hertz. Un'altra variabile è costituita da fattori microprosodici, ovvero variazioni acustiche non funzionali e involontarie dovute sia alla natura fonetica dei segmenti che al condizionamento segmentale. 10 minimo dell’ampiezza melodica di un enunciato o di una parte di esso. Può essere rappresentata in questo modo: Hertz T Lo spazio tonale è raggruppabile in una fascia media, bassa e alta. I fattori che incidono sull'estensione dello spazio melodico sono numerosi e di diverso tipo: il primo tra questo è legato al sesso e all’età del locutore: La voce maschile è compresa infatti in un range più basso, quella femminile, invece, è presente a livelli più alti. Il valore di f0 raggiunge poi livelli ancora più elevati nei bambini, attestandosi in media attorno ai 300 Hz. Altri fattori condizionanti sono quelli paralinguistici ed espressivi: il pitch range, infatti, risulta più ampio quando il locutore esprime un particolare stato d'animo nel proprio messaggio, come la rabbia o la sorpresa, mentre è più ristretto quando esprime altre emozioni, come la tristezza o la noia. Per quanto riguarda i punti che delimitano lo spazio frequenziale, il valore massimo di f0 può elevarsi in maniera consistente in alcuni contesti enunciativi; lo spostamento della frequenza fondamentale verso la zona inferiore dello spazio melodico, invece, è limitato perché vincolato alle potenzialità della voce umana, che non può abbassarsi al di sotto di un determinato limite frequenziale. Il punto minimo di f0 per ciascun parlante si attesta in media tra 10 e 30 hertz e avviene solitamente alla fine di un enunciato assertivo. L'escursione tonale è data dalla differenza aritmetica tra il valore massimo e il valore minimo in hertz. Dal momento che però la sensazione uditiva percepita in seguito a una variazione frequenziale cambia a seconda del livello in cui si colloca, escursione e livello tonale sono in realtà due componenti interdipendenti: ad esempio, volendo fare un confronto tra lo spazio intonativo dei maschi e quello delle femmine, solitamente il pitch range di un soggetto maschio è compreso tra 80 e 160 Hz, mentre quello di una donna da 160 e 320 Hz. In questo caso, la risposta percettiva trasmessa da questi intervalli frequenziali è la stessa sia per gli uomini che per le donne: infatti, convertendo in semitoni i valori espressi in hertz risulta che lo scarto tra i valori confrontati è di un'ottava, cioè 12 semitoni. 2.3 La declinazione Un'altra componente intonativa di natura globale, presente in tutte le lingue è la declinazione o, per usare la terminologia inglese, declination line. Questo fenomeno si ha quando la curva intonativa di un enunciato assertivo è caratterizzata da un andamento progressivamente discendente. Questo aspetto è stato identificato originariamente da Pike, nel ’45, e determina una serie di ripercussioni sull'interpretazione modale dell'enunciato, sulla percezione della prominenza e sulla percezione della categoria modale dell'unità; in molte lingue, infatti, la presenza di un andamento discendente contribuisce a differenziare sul piano formale la tipologia modale assertiva da quella interrogativa. Le frasi assertive, come quelle imperative ed esclamative, infatti, sono tipicamente realizzate con toni terminali discendenti, per cui vengono percepite come compiute. L’interrogazione, al contrario, è un atto linguistico finalizzato ad ottenere una richiesta, pertanto è un atto non completo, che presuppone continuità. Si tratta, però, di un fenomeno complesso in quanto è facile da osservare ma difficile da descrivere. Ci sono diversi modelli per spiegare la sua natura: modelli di natura fonetica e modelli di natura fisiologica. Secondo questi ultimi, l'abbassamento del contorno intonativo è dovuto a una maggiore rilassatezza articolatoria. Alla fine dell'enunciato, si riduce, cioè, la riserva d'aria che abbiamo a disposizione. La declinazione si apprezzerebbe, dunque, High Mid Low 11 all'interno di un gruppo di respiro. Gli altri modelli, invece, ritengono che il fenomeno della declinazione faccia parte di un meccanismo di controllo di tipo attivo, pur ammettendo la sua origine fisiologica. Quando gli studi sono progressivamente passati a forme di parlato spontanee, si è riscontrato come la declinazione non fosse così evidente. Se alla fine dell'enunciato non si realizza ciò che è identificato come minimo abbassamento significativo, l'enunciato non viene identificato come assertivo. In questo caso si realizza il plateau melodico, un tipo di contorno né alto né basso, tipico delle frasi interrotte e degli enunciati sospesi, che fa sì che l'enunciato non venga identificato né come assertivo né come interrogativo. Per rappresentare la declinazione intonativa sono inoltre state avanzate una serie di formule empiriche: non è però sempre possibile applicare per tutti gli enunciati un coefficiente matematico costante di declinazione, questo perché spesso la frequenza fondamentale si abbassa rapidamente nella prima parte dell'enunciato, mentre si mantiene stabile nella parte finale. In molti modelli formulati per la rappresentazione della declinazione sono postulati due nozioni teoriche fondamentali: la baseline e la topline, ovvero due linee ideali astratte che sono rispettivamente il risultato del congiungimento dei valori massimi e dei valori minimi di f0 presenti in una determinata curva intonativa. La declinazione causa il progressivo abbassamento dei valori massimi e minimi di frequenza fondamentale, così come la riduzione dello spazio tonale. Essa, però, non incide in egual modo sulla topline e sulla baseline; queste due componenti, infatti, non procedono in modo parallelo, poiché l'abbassamento della baseline è meno marcato rispetto a quello della topline. 2.4 I fenomeni di resetting Ogni volta che si realizza una declinazione, si verifica un terzo fenomeno intonativo: il resetting. Nel parlato, infatti, la declinazione può subire alcune variazioni dovute all'interruzione del flusso sonoro presente nell'atto locutorio. La curva di f0 si posiziona così su valori frequenziali di nuovo alti, determinando un nuovo andamento intonativo e dando origine appunto al fenomeno di resetting. Questo fenomeno accade solitamente all'inizio di un enunciato o di un'unità tonale, ma può accadere anche dopo una pausa interna all’enunciato. Il resetting è totale se il valore in hertz del punto più alto di f0 che ricorre sulla nuova unità è uguale o più alto in frequenza rispetto al picco più alto dell'unità precedente; è parziale, invece, se il nuovo contorno parte da valori frequenziale più bassi. A differenza degli altri due fenomeni considerati, il resetting è un fenomeno locale di natura demarcativa, perché segnala la fine di un gruppo di parole e l'inizio di un altro gruppo di parole. La presenza del resetting è determinata da tre fenomeni fortemente correlati tra loro: il primo di questi fa riferimento alla struttura dell'unità intonativa, il secondo alla natura intonativa e il terzo al confine dell’intonazione. Il primo punto di riferimento, in particolare, è costituito dal picco iniziale dell'unità prosodica (P1), una fase discendente che spesso si configura come un avvallamento di f0 (V), mentre il secondo punto è il picco di f0 presente all'inizio della seconda unità intonativa (P2); a questi si può poi aggiungere, eventualmente, anche un terzo punto, cioè un secondo avvallamento (V2). Secondo alcuni autori si ha un ripristino della curva melodica ogni qual volta una sillaba tonica ha una frequenza fondamentale uguale o superiore a quella della sillaba tonica precedente. Altri, invece, distinguono tre tipologie a seconda che: - la frequenza fondamentale del secondo picco sia più alta di quella del primo picco (peak to peak reset); - il valore in frequenza del secondo avvallamento sia più alto rispetto al primo (valley to valley reset); - sia il picco della seconda unità che il secondo avvallamento siano maggiori rispetto alle loro controparti precedenti. 12 Per quanto riguarda l'origine del resetting, esistono opinioni discordanti. Secondo un primo filone interpretativo, che fa capo a Lieberman, il resetting ha una natura fisiologica, pertanto questa posizione contrasta con la tesi formulata da Cooper e Sorensen nell'ambito delle teorie intonative a indirizzo cognitivo, secondo cui il fenomeno svolge una funzione linguistica. In base questa prospettiva, l'origine del resetting andrebbe ricercata all'interno dell’organizzazione sintattica del parlato. A questo proposito è stato formulato anche un algoritmo per calcolare la forza di un confine sintattico, prevedendo allo stesso tempo l'entità delle variazioni intonative che avvengono nel medesimo punto dell'enunciato in cui ricorre il confine: in particolare, più alto è l’indice di forza assegnato al confine, maggiore risulta la variazione intonativa. Questa linea interpretativa però è stata in seguito confutata; oggi, infatti, si esclude che il resetting si tratti di un processo retto unicamente dall’organizzazione sintattica del parlato, dal momento che intervengono anche fattori legati alla pragmatica. 2.5 La prominenza La prominenza è il grado di salienza, a livello percettivo, assegnato ad alcune sillabe oppure a determinate parole all'interno dell'enunciato. Si tratta di un evento linguistico locale relativo, in quanto un elemento può essere percepito come prominente del parlante-ascoltatore solo se viene messo a confronto con altri elementi contigui non prominenti. Un elemento prominente si realizza sul piano fonetico attraverso l'attivazione simultanea di più indici acustici quali: la frequenza fondamentale, la durata, l'intensità e l'escursione frequenziale. L'indice acustico che più di tutti determina la prominenza accentuale di una parola, però, varia a seconda delle lingue considerate: ad esempio nell'inglese il fattore percettivo principale che permette di individuare la prominenza è l'altezza, quindi la frequenza fondamentale, mentre nell'italiano la durata. La prominenza si tratta di un fenomeno complesso, non solo di tipo prosodico in quanto si realizza anche attraverso l'intervento della sintassi, della semantica e della pragmatica. La ricorrenza di una parola prominente è influenzata dalla dimensione testuale e informazionale del messaggio linguistico; esistono, in particolare diversi espedienti linguistici che possono intervenire nella messa in rilievo di una parola, quali: l'intonazione, l'utilizzo di particolari costrutti sintattici che alterano l'ordine tradizionale delle parole oppure l'utilizzo di alcuni elementi discorsivi focalizzanti (come proprio, solo, anche, addirittura). Nella focalizzazione di un elemento si distingue generalmente tra focus ampio o neutro e focus ristretto: nel primo caso, gli elementi che costituiscono l'enunciato non hanno una forma marcata né sul piano sintattico né su quello semantico, mentre l'informazione trasmessa appare completamente nuova: Luca è arrivato ieri  possibile risposta ad una domanda del tipo: Cosa è successo ieri? Nel secondo caso, invece, la focalizzazione è circoscritta solo alla parte dell'enunciato che trasmette l’informazione nuova o d’interesse: IERI è arrivato Luca  Ieri è arrivato LUCA La prominenza, in caso di focalizzazione, diventa inoltre il risultato dell'azione congiunta la sintassi, semantica e prosodia: E’ LUCA che è arrivato ieri (frase scissa)  LUCA, è arrivato ieri (topicalizzazione) Vi è poi un particolare tipo di focus, chiamato contrastivo, che si ha quando la prominenza serve a sottolineare un contrasto tra due elementi della frase, come ad esempio: E’ LUCA che è arrivato 15 4) Comportativi: adottano atteggiamenti e comportamenti sociali (ad esempio scusarsi, ringraziare, criticare, tollerare, augurare) 5) Espositivi: esprimono atti che favoriscono lo scambio conversazione (ad esempio asserire, negare, ammettere, obiettare) La frase assertiva ( o espositiva) è una sottoclasse della frase dichiarativa che serve ad esprimere un grado di verità rispetto a quanto detto nell'enunciato. A livello melodico, l'asserzione è caratterizzata solitamente da un profilo intonativo progressivamente discendente. Il tipo modale iussivo esprime invece una richiesta di azione, che può essere un ordine, un'istruzione o un'esortazione (ad esempio: Apri la porta!, Dimmi la verità!). In questo tipo di enunciati l’emittente occupa una posizione dominante rispetto al ricevente, mentre il profilo intonativo tende a una significativa e repentina discesa. Si usa invece un'intonazione ascendente per moderare la forza del comando e rendere più cortese la richiesta. Per quanto riguarda infine il tipo modale esclamativo, gli aspetti relativi all’intonazione sono stati finora poco esplorati probabilmente per via della funzione esercitata dall’esclamazione nella comunicazione verbale e alla sua realizzazione eterogenea sul versante prosodico. L'esclamazione, infatti, si tratta solitamente di una manifestazione transitoria di uno stato d'animo, nel parlato quindi la sua funzione è soprattutto di tipo espressivo piuttosto che informativo. Normalmente, comunque, il contorno intonativo delle frasi esclamative tende ad essere più alto rispetto a quello delle frasi assertive. Il tipo interrogativo L'interrogazione è un atto linguistico che serve ad esprimere una richiesta. Sul piano modale è possibile distinguere almeno due tipi di domanda: quella sincera e quella orientata. La domanda sincera presuppone ignoranza da parte di colui che la formula, quest'ultimo quindi non conosce la risposta. La domanda orientata, invece, esprime una probabilità soggettiva, colui che la formula, cioè, ha già una propria aspettativa riguardo la risposta che verrà fornita e che perciò ritiene più probabile. Questo tipo di domanda più che richiedere informazioni, richiede una conferma (ad esempio Sta piovendo, vero?), una ripetizione (Cosa hai detto?) o un ordine (Mi dai l'ombrello?). Fanno parte delle interrogative sincere le domande sì/no, le domande con alternativa e le domande wh-. Appartengono invece alle interrogative orientate le domande eco, le domande coda e quelle retoriche. Le domande sì/no, dette anche polari o totali, ammettono una risposta positiva o negativa. In alcune lingue, come ad esempio l'italiano, l'intonazione costituisce l'unico espediente per distinguere queste frasi interrogative da quelle assertive: E’ andato al cinema  E’ andato al cinema? Queste due frasi, pur essendo identiche dal punto di vista sintattico e morfologico, hanno un’intonazione diversa: nella frase assertiva è ha un andamento discendente, mentre in quella interrogativa ha un andamento finale ascendente. Il movimento ascendente, però, non si ha soltanto nelle parti finali dell’enunciato, ma, a seconda delle lingue, può interessare solamente l'ultima sillaba tonica oppure solo la sillaba tonica iniziale. Le domande parziali o aperte (wh-) sono quelle domande che contengono sempre un pronome interrogativo (chi, cosa, dove, come, quando, perchè) e richiedono una risposta ampia. Questo tipo di interrogativa manifesta un andamento discendente finale, simile per alcuni aspetti a quello della assertiva. In questo caso l'accentazione melodica dei pronomi interrogativi dipende dalla lunghezza della domanda, dal tipo di morfema interrogativo che la introduce e dalla posizione che quest'ultimo occupa all'interno della frase. Ad esempio se la frase è breve, l’intonazione presenta 16 un unico picco di f0, che spesso coincide con l'elemento interrogativo (Quando l’hai visto?); se invece la frase è lunga, la domanda avrà più di un accento intonativo, il primo posto generalmente sul verbo, mentre l'altro sull’ultima parola (Quando l’hai visto per l’ultima volta?). Le domande alternative o disgiuntive offrono per la risposta una scelta tra due elementi lessicali. In molte lingue, fra cui l’italiano, queste interrogative presentano un picco intonativo sul primo lessema, inoltre sono caratterizzate da un contorno finale discendente. Il secondo termine tra cui scegliere, invece, è meno saliente sul piano intonativo e spesso è completamente privo di accento (Sei partito in treno o in aereo?, Vuoi latte o caffè?). Le domande orientate sono molto varie sul piano sintattico e intonativo, non sono però del tutto autonome in quanto legate al contesto. Questo tipo di domanda anticipa le aspettative del parlante rispetto a quello che si dirà nella risposta. L'orientamento può essere ottenuto attraverso la negazione, l'utilizzo di alcuni introduttori oppure tramite domande coda (Non è ancora partito il treno?, Maria è molto malata). Un primo tipo di domanda orientata è la domanda coda che ricorre alla fine di un'asserzione per confermare o smentire il suo contenuto; occupa solitamente la parte finale dell'enunciato ed è caratterizzata da un'intonazione alta o ascendente. Le domande eco riprendono una parte dell'enunciato prodotto precedentemente, conferendo in questo modo alla domanda un senso di sorpresa o di comprensione incompleta, mentre l'intonazione è generalmente di tipo ascendente finale (Vai a comprare il gelato.  Il gelato?). Infine le domande retoriche non presuppongono una risposta da parte dell’interlocutore, in quanto quest'ultima è già nota o contenuta implicitamente nella domanda stessa. Non si tratta quindi di una vera e propria domanda, ma piuttosto di un'asserzione enfatica, per questo motivo presenta un'intonazione più neutra. Le funzioni informative L’unità tonale consiste in un raggruppamento di parole che esprime, in un determinato contesto oggettivo, una funzione informativa. L’unità informativa può avere una diversa estensione temporale, struttura sintattica e contorno intonativo. Considerando la prospettiva informazionale, è possibile distinguere il Tema e il Rema, due unità relative al piano illocutivo, e il Dato e Nuovo, unità relative al piano contestuale. L'informazione, in particolare, è Nuova quando non si può estrapolare anaforicamente nel testo; è Data, invece, quando può essere recuperata perché già menzionata o perché facente parte delle conoscenze condivise fra i partecipanti al discorso. Solitamente il Tema trasmette un contributo informativo più debole rispetto al Rema, inoltre presenta un'intonazione che lo sottomette a quest’ultimo. 2.8 Le funzioni paralinguistiche Stati d'animo, emozioni e attitudini L'intonazione presenta anche delle funzioni espressive o meglio paralinguistiche. Queste funzioni si riferiscono a variazioni intonative causate da un'emozione o da un atteggiamento, messi in atto degli esseri umani di fronte a determinate situazioni. Attraverso l'intonazione, infatti, il parlante trasmette al suo interlocutore informazioni sullo stato emotivo del proprio messaggio. Generalmente si distinguono due gruppi di emozioni che presentano un comportamento melodico speculare: nel primo gruppo rientrano la paura, la gioia, la sorpresa e la collera; in questo caso gli andamenti intonativi si estendono lungo le zone frequenziali più alte. Nel secondo gruppo rientrano invece la tristezza, il disgusto e la noia; queste emozioni, al contrario, sono caratterizzate dalla presenza di un contorno intonativo poco dinamico, generalmente situato a bassa frequenza. La classificazione delle emozioni si tratta però di un'operazione molto complessa. Sul piano intonativo, la difficoltà consiste nel fatto che ogni emozione non viene mai prodotta in maniera isolata, ma interagisce con il valore pragmatico dell'enunciato e con la sua struttura linguistica. 17 Uno stesso enunciato, appartenente a qualsiasi tipologia, avrà infatti un contorno melodico differente a seconda se viene pronunciato con impazienza, aggressività, insicurezza ecc. Altrettanto problematico è analizzare le funzioni paralinguistiche dell'intonazione: un primo problema è determinato dalla mancanza di un metalinguaggio che sia in grado di definire con chiarezza le diverse manifestazioni espressive di un enunciato. Un'altra questione invece è capire se le componenti espressive abbiano una natura discreta o continua. Questo problema è peraltro alla base di un'altra questione annosa, relativa al tipo di relazione che si instaura tra componenti linguistiche e paralinguistiche. A questo proposito è possibile distinguere due approcci teorici divergenti: secondo il primo approccio, definito della covarianza o del canale parallelo, l'intonazione linguistica e paralinguistica sono codificate in modo indipendente, quindi scorrono parallelamente su uno stesso materiale segmentale assieme ad indici acustici propri. I contorni intonativi di natura espressiva sarebbero quindi di tipo non discreto, diversi da quelli di natura linguistica. Il secondo approccio, definito per configurazioni o del canale unico, invece, ritiene che vi sia un’unica codifica, il cui risultato è costituito da un contorno melodico allo stesso tempo espressivo e linguistico. La qualità vocale La realizzazione delle emozioni sul piano fonetico è determinata dall'attivazione di una serie di parametri come l'escursione melodica, l'intensità, la durata e la qualità vocale. Quest'ultima rappresenta il risultato di una serie di tratti laringali e sopralaringali utilizzati per trasmettere specifici significati espressivi. Inoltre, al tempo stesso, fornisce informazioni sulle condizioni psicologiche, fisiche e in alcuni casi sociali del parlante. La qualità dell’emissione vocale può essere modificata anche dalla conformazione assunta dalla glottide durante la fonazione: in presenza di una fonazione normale, l'aria espirata, fluendo dai polmoni verso la bocca, incontra degli ostacoli, a cominciare da quello laringeo; la forma del canale fonatorio, assieme all'attivazione o meno del meccanismo laringeo, determina poi di volta in volta la qualità del suono emesso. Un altro fattore che può alterare la qualità della voce è inoltre rappresentato dalle conformazioni amodali che può assumere la glottide: questo si verifica nel caso in cui le pliche vocali assumono una posizione mista, in quanto non sono né interamente chiuse, né interamente aperte né completamente vibranti. Le tipologia amodali più ricorrenti sono il mormorio, il bisbiglio e la laringalizzazione. Nel mormorio, le pliche vocali vibrano debolmente nella loro parte anteriore, mentre l'aria fuoriesce in maniera abbondante a livello posteriore. Nel bisbiglio, invece, l’aria passa a livello posteriore attraverso uno stretto passaggio della glottide, causando un effetto di frizione, senza però vibrazione. Come risultato si ha quindi una voce rilassata a bassa intensità. Il bisbiglio inoltre coinvolge solamente i suoni sonori e si manifesta quando si parla a bassa voce. Infine nella laringalizzazione le pliche vocali vibrano solo anteriormente; la voce laringalizzata è quindi caratterizzata da un notevole abbassamento dell'altezza melodica, da qui la cosiddetta sensazione di “voce roca”: Nella comunicazione verbale, la fonazione amodale ha uno specifico ruolo paralinguistico nella produzione delle emozioni. In molte lingue, ad esempio, i suoni laringalizzati si riscontrano negli enunciati che esprimono noia, rassegnazione o depressione; la voce bisbigliata attribuisce al messaggio un tono confidenziale oppure trasmette apprensione, mentre la voce mormorata esprime intimità. Sul piano acustico, la qualità vocale amodale è caratterizzata dalla presenza di fenomeni di perturbazione prosodica. A questo proposito, i principali parametri considerati sono, oltre alla durata, all'intensità e alla f0, shimmer e jitter, ossia indici acustici che calcolano la percentuale di variazione dell'ampiezza e della frequenza tra cicli successivi. Un altro parametro è il cosiddetto Harmonic-to-Noise Ratio (HNR), ossia il rapporto tra segnale e rumore, e l'indice di 20 fa riferimento alla differenza di tono presente tra due sillabe adiacenti oppure all'estensione del movimento tonale realizzato. Il sistema di trascrizione dei toni, utilizzato dalla scuola britannica, è chiamato tonetic stress marks: in esso il contorno intonativo viene rappresentato attraverso una successione di punti più grandi e più piccoli, che sono posti rispettivamente in corrispondenza delle sillabe toniche e atone dell’enunciato. I punti sono presenti all'interno di due linee orizzontali e rappresentano lo spazio melodico. La sillaba scritta in maiuscolo rappresenta il nucleo, mentre il punto che la identifica indica il movimento tonale e la sua ampiezza. I modelli per livelli Secondo l'approccio per livelli della scuola americana, l'intonazione rappresenta invece una sequenza di unità discrete affiancata da giunture intonative. Il primo ad elaborare una metodologia di studio per questo approccio è stato Pike nel 1945, secondo il quale l'andamento melodico di un enunciato può essere formato da diversi contorni, scomponibili a loro volta in più parti funzionali. Gli elementi discreti individuati sono essenzialmente il contorno primario che si ha a partire da una sillaba tonica, e il precontorno, costituito dalle sillabe atone che precedono il contorno primario. Successivamente Trager e Smith hanno proseguito questa linea teorica, elaborando un sistema intonativo all'interno del quale sono presenti 4 accenti realizzati foneticamente sulla vocale: / ́ / (principale), / ᵔ / (secondario), / ` / (terziario) e / ᵕ / (debole o assente). I livelli tonali, descritti con i numeri / 1 2 3 4 / in esponente, sono anch’essi 4, ovvero: basso, medio-basso, medio-alto e alto. Le giunture intonative terminali, infine, sono 3: giuntura discendente (rappresentata con #), ascendente ( I I ) e sospensiva ( I ); a queste si aggiunge poi una giuntura interna (+). Ogni unità discreta ricorre solitamente all'inizio dell'enunciato, prima di un accento primario e di una giuntura terminale. Il livello tonale che ricorre con più frequenza all'inizio del contorno intonativo è 2, mentre il livello 1 si trova soprattutto alla fine del contorno. Per determinare il livello di un contorno è sufficiente considerare l'altezza tonale non dell'intera sillaba, ma solo di alcuni punti cruciali, ossia l'inizio e la fine del movimento intonativo. L'altezza di ogni livello tonale, però, è relativa, quindi la distanza tra i quattro livelli non è fissa, ma può variare all'interno del pitch range, a seconda del parlante o del contesto di riferimento. Questo significa che l'altezza di un livello non è determinata dal valore assoluto in Hertz presente una determinata dell'enunciato, ma dal rapporto relativo che stabilisce con gli altri livelli. 3.3 La teoria intonativa IPO La teoria intonativa IPO è stata formulata dai ricercatori olandesi di un istituto di Eindhoven e ha come obiettivo trovare una mediazione tra i principi postulati dai due metodi di analisi fonologico (astratto) e fonetico (concreto). Questa mediazione è resa possibile attraverso l'adozione di un metodo di analisi di tipo percettivo, che permette di unire il contorno intonativo, considerato una categoria astratta, con la curva di f0, che invece rappresenta la sua realizzazione in forma concreta. Questa teoria intonativa, quindi, anche se è fondamentalmente di tipo fonetico, tiene ugualmente conto del punto di vista dell'ascoltatore. La tesi di fondo di questa teoria è che il contorno intonativo è costituito da unità discrete che però non sono tutte funzionali alla dinamica verbale: in ogni curva vengono infatti valutate solo le unità minime che hanno prominenza percettiva, cioè i pitch movements. Questi movimenti tonali vengono identificati attraverso la stilizzazione e la standardizzazione della curva intonativa. Essi, in particolare, rappresentano l'unità minima di una curva di f0 e il loro movimento viene descritto attraverso alcune dimensioni percettive divise in categorie, a loro volta caratterizzate da una serie di aspetti, quali: la direzione (ascendente o discendente), l'allineamento del movimento rispetto alle sillabe dell'enunciato (che può essere anticipato, ritardato, molto ritardato), la velocità della variazione tonale (veloce o lenta) e l'escursione tonale della variazione (completa o parziale). La concatenazione dei movimenti 21 tonali determina inoltre una unità di livello superiore, chiamata configurazione tonale o pitch contour. È possibile distinguere, in particolare, tre tipi di configurazioni: la Radice, una configurazione obbligatoria e che può ricorrere una sola volta; il Prefisso, una configurazione opzionale e talvolta ricorsiva, che precede sempre la radice o un altro prefisso, e in ultimo il Suffisso, una configurazione anch'essa opzionale e che segue sempre la radice, che però non è ricorsiva. Le configurazioni tonali costituiscono l'insieme degli andamenti presenti in una lingua. Al livello gerarchico più alto si trovano gli intonation patterns, delle categorie astratte che comprendono un determinato numero di varianti intonative. Questo modello interpretativo mira in sostanza a convergere alcuni aspetti teorici considerati per molto tempo inconciliabili, come ad esempio l'approccio globale e atomistico la cui opposizione viene qui risolta attraverso la suddivisione della curva intonativa in unità discrete, o il passaggio dalla rappresentazione concreta dell'intonazione a quella astratta che si realizza attraverso la valutazione dei soli movimenti tonali distintivi. Allo stesso tempo la teoria intonativa IPO, privilegiando l'aspetto percettivo dell'intonazione e considerando i movimenti tonali come unità minime di descrizione, si avvicina al modello configurazionale; dal momento che però i movimenti tonali rappresentano le unità discrete mentre la curva di f0 l’input dal quale ricavare le informazioni percettive importanti, il modello olandese appare simile a quello americano. La teoria IPO assume comunque una posizione critica nei confronti di quest’ultimo approccio, poiché per realizzare le variazioni di f0 c'è bisogno di una certa quantità di tempo; l'impressione percettiva che se ne ricava, quindi, è quella di un movimento tonale e non di una variazione di livello. 3.4 Il modello INTSINT L’équipe francese del Laboratoire Parole et Langage dell’università di Aix-en-Provence si propone di delineare un modello teorico universale per l'analisi e la trascrizione dell'intonazione delle lingue naturali. In tal senso, a partire dagli anni 90 del Novecento, è stato sviluppato un sistema di notazione chiamato INTSINT (International Transcription System for Intonation) che rappresenta il corrispettivo prosodico del sistema di trascrizione segmentale IPA (International Phonetic Alphabet). INTSINT rappresenta in realtà solo il risultato finale di un modello teorico complesso articolato in più livelli di analisi: livello fisico, fonetico, fonologico superficiale e fonologico soggiacente. Il livello fisico ha portata universale, mentre quello fonetico funziona da interfaccia tra la rappresentazione fisica della melodia e la sua rappresentazione astratta; in questo livello, in particolare, si ha la stilizzazione matematica del contorno e la codifica attraverso il sistema INTSINT. Il livello fonologico superficiale è formato invece da un numero ristretto di categorie discrete significative che però è sufficiente a rappresentare l'intonazione delle lingue del mondo. Infine il livello fonologico soggiacente permette di individuare le rappresentazioni melodiche e le informazioni necessarie a garantire una corretta interpretazione linguistica dell'enunciato. Il sistema di trascrizione INTSINT Il modello intonativo olandese si articola in due processi fondamentali, la codifica e la sintesi, che vengono eseguiti da un lato attraverso il programma MES (Motiv Environment for speech), un algoritmo che contiene un sistema di stilizzazione automatico della curva di f0 chiamato MOMEL, e dall'altro attraverso il sistema di trascrizione INTSINT. L’algoritmo MOMEL sostituisce automaticamente il tracciato intonativo originario con una approssimazione matematica identica sul piano percettivo a quella di partenza. Nella nuova versione del contorno intonativo sono presenti sotto forma di punti (target points) soltanto le variazioni frequenziali che hanno pertinenza linguistica; l'andamento intonativo, invece, è dato dall'unione di questi punti mediante linee di transizione. Nella fase successiva il sistema di notazione INTSINT, vale a dire un insieme di 22 simboli utilizzato per indicare i punti prominenti della curva di f0, permette la sovrapposizione di specifiche marche di annotazione prosodica sul contorno stilizzato. Per indicare l'inizio e la fine dell'unità tonale si usano le parentesi quadre, al cui interno sono posti i punti di variazione, considerati sia globalmente (toni assoluti) sia localmente (toni relativi). I toni assoluti, in particolare, possono essere tre: 1) valore massimo dell'unità tonale T (Top = ) 2) valore minimo B (Bottom = ) 3) valore medio M (mid =>) che corrisponde al valore di attacco della curva intonativa. I toni relativi, invece, servono a definire in modo relazionale la posizione dei bersagli tonali rispetto a ciò che precede o segue, e sono: 1) H (Higher = ) che identifica un picco più alto del precedente 2) L (Lower = ), un bersaglio più basso del target precedente 3) S (Same = ), un bersaglio posto su un livello costante rispetto a ciò che precede. INTSINT comprende inoltre due toni iterativi, cioè che si ripetono, indicati con U (Upsteppd = < e D (Downstepped = >) e che sono usati rispettivamente per indicare bersagli più alti o più bassi rispetto a ciò che precede. Questa versione standard di INTSINT presenta alcune falle: in primo luogo, il sistema non è in grado di spiegare il fenomeno della declinazione e in seconda istanza non prevede la trascrizione dei fenomeni di resetting. Per ovviare a questi limiti, sono stati introdotti alcuni simboli speciali, ovvero: 1) la doppia parentesi quadra ]] che indica il riaggiustamento della curva intonativa riscontrabile all'inizio di una unità melodica 2) i simboli ]] e ]] che indicano un innalzamento o abbassamento ulteriore del contorno melodico. 3.5 Il modello autosegmentale e metrico (AM) Il modello autosegmentale metrico è stato inizialmente elaborato da Goldsmith per studiare e analizzare le lingue a toni dell'Africa, mentre è stato successivamente applicato all'analisi dell’intonazione anche in lingue non tonali. Il principale lavoro teorico autosegmentale che si pone in quest’ultima direzione è rappresentato dallo studio di Janet Pierrehumbert, risalente al 1980, nel quale i toni vengono rappresentati su un livello diverso e indipendente da quello segmentale. L'intonazione, cioè, è vista come l'interazione di tre diverse componenti fonologiche. La prima componente è la grammatica dei toni presenti in una lingua, la cui funzione è quella di produrre delle sequenze tonali che possono ricorrere nei vari contesti comunicativi. Le ultime due componenti, invece, sono la rappresentazione metrica del testo e un insieme di regole volte a specificare le modalità di interazione tra la melodia e il testo. Nella rappresentazione fonologica dell'intonazione, il contorno intonativo è inteso come una sequenza lineare di accenti intonativi, i Pitch Accents (PA), ovvero unità discrete di diversa altezza, allineate su un piano segmentale. In questo modello, inoltre, si individuano soltanto due livelli tonali: alto (H) e basso (L). I Pitch accents possono a loro volta produrre configurazioni statiche, cioè monotonali, o dinamiche, ossia bitonali; inoltre possono legarsi solo alle sillabe prominenti sul piano metrico. Oltre agli accenti intonativi, il modello AM individua anche toni di confine associati ai margini di un costituente intonativo. Questo costituente si può trattare del Sintagma intermedio o del Sintagma intonativo. Quest'ultimo è un'unità superiore in quanto può comprendere uno o più sintagmi intermedi. Gli accenti intonativi Il concetto di accento intonativo o pitch accent è stato introdotto per la prima volta nel 1958 da Bolinger e inteso da quest’ultimo come un'unità prosodica che aveva come compito quello di 25 questo caso il contorno intonativo è formato da due accenti intonativi: il primo, più prominente, posto sull’elemento interrogativo “perché”, mentre il secondo sul verbo; in base al principio posizionale, quest'ultimo accento dovrebbe essere considerato un tono nucleare. Sul piano pragmatico, però, non è così: l'ultima parola dell'enunciato, infatti, non è la più prominente e nemmeno quella che fornisce più informazioni. Se invece si riconosce che il tono nucleare, in questa frase, si ha in corrispondenza del termine “perché”, il secondo accento intonativo va considerato come un accento di tipo postnucleare, contraddicendo però in questo modo il principio relativo alla posizionalità. Data la possibilità di casi come questo, gli sviluppi più recenti della teoria autosegmentale hanno ammesso anche i toni postnucleari, che però hanno un ruolo secondario sia sul piano metrico che su quello semantico e pragmatico. L'allineamento tonale L’allineamento tonale è la sincronizzazione temporale tra il livello tonale e il livello segmentale. Nel modello autosegmentale, il concetto di allineamento tonale è molto importante in quanto permette di distinguere tra accenti intonativi e toni di confine e tra accenti mono e bitonali. Nei toni complessi, è associato alla sillaba prominente un solo elemento della sequenza, mentre l'altro bersaglio tonale è temporalmente associato alla sillaba atona precedente o seguente. Nella trascrizione, in questo caso, interviene l'asterisco, adiacente al primo o al secondo tono, che permette appunto di identificare il tono associato con la sillaba accentata. Per quanto riguarda gli accenti bitonali, la teoria autosegmentale postula che l’elemento non asteriscato deve trovarsi all’interno di uno spazio temporale fisso rispetto all'altro elemento della stessa sequenza. In questo modo è possibile garantire la distinzione tra toni semplici e complessi, così come tra l'elemento non asteriscato di alcuni toni complessi e la presenza di un accento di sintagma. L’allineamento tonale, però, rappresenta al tempo stesso un concetto controverso. Una prima questione riguarda l'identificazione dei criteri di associazione tra un accento intonativo e la sillaba prominente, che non sono sempre chiare sul piano fonologico. Gli accenti intonativi, infatti, quando sono realizzati foneticamente, contraddicono spesso le regole di associazione fonologica. Ad esempio, nelle sequenze bitonali di tipo L+H, entrambi i toni non sono allineati con la sillaba tonica: il movimento ascendente, infatti, inizia prima della sillaba accentata, mentre il picco di f0 si ha solo una vocale atona seguente, indipendentemente dal contesto segmentale in cui è collocato il tono. Per rimediare a questo genere di difficoltà una soluzione consiste nel dividere il tempo tonale in allineamento e associazione. L'allineamento si tratta di un elemento fonetico soggetto a variazioni continue, mentre l'associazione è una dimensione fonologica discreta. Secondo un'altra linea interpretativa è inoltre possibile distinguere due tipi di associazione: l'associazione primaria e l'associazione secondaria. La prima assegna gli elementi tonali, quali l'accento intonativo e i toni di confine, in base a specifici principi fonologici. Il tono nella sua interezza viene associato alla sillaba accentata, i bersagli che lo costituiscono, però, possono ricevere un'associazione secondaria ed essere sempre specificati a livello fonetico. Una questione su cui ci si è a lungo interrogati è quella relativa alle cause che determinano un diverso timing tonale: i primi studi effettuati in questa direzione consideravano il coordinamento temporale tra il tono e la sillaba accentuata dipendente dal contesto prosodico, sottolineando l'importanza di alcuni parametri quali la struttura ritmica e sillabica del testo (cioè la composizione segmentale, la durata e la struttura della sillaba), la velocità di eloquio e la struttura tonale dell'enunciato. I risultati ottenuti da questi studi, però, non hanno carattere univoco. Ad esempio, in inglese il cambiamento di velocità di eloquio non altera l'allineamento dei toni prenucleari ascendenti; in olandese, il timing dei toni prenucleare ascendenti è condizionato dalla durata della vocale, mentre nell'italiano parlato a Napoli la struttura della sillaba, aperta o chiusa, non influenza 26 il timing dell’accento intonativo. Una svolta negli studi sull’allineamento tonale si è avuta con la ricerca condotta in primis da Armaniti sul greco moderno, dove si è avanzata una nuova ipotesi: il timing tonale, cioè, non è più considerato un mero evento fonetico , ma come un evento di natura articolatoria, legato alla coordinazione dei gesti muscolari sopralaringali. Il riferimento alla natura articolatoria del fenomeno, però, da solo non basta comunque a spiegare perché in numerose lingue il bersaglio L del tono ascendente L+H* presenta un allineamento uniforme, mentre la sincronizzazione del bersaglio H cambia a seconda della lingua considerata. Recentemente Gussenhoven è intervenuto a proposito dell'allineamento, considerandolo come il risultato di una stretta associazione tra più fattori: effetti meccanici, volti a sincronizzare i gesti muscolari e il tempo disponibile per l'articolazione del movimento; effetti ergonomici, finalizzati a migliorare la qualità del segnale vocale ed effetti comunicativi, dove un diverso allineamento è usato spesso per conferire un specifico significato. L'allineamento è una dimensione intonativa importante anche sul piano percettivo. Ad esempio, in inglese il contorno ascendente-discendente-ascendente determina un significato espressivo diverso a seconda dell'allineamento dei bersagli tonali con la sillaba tonica. A questo proposito, Ladd ha introdotto la nozione di tratto binario, ipotizzando che ogni tono deve obbligatoriamente essere associato a una sillaba tonica, ma non necessariamente allineato a quest’ultima. L'escursione tonale Un'altra questione problematica, all'interno del modello intonativo autosegmentale riguarda la nozione di escursione tonale. Una prima controversia consiste nella natura continua o discreta del fenomeno. La linea interpretativa che fa capo a Pierrehumbert ritiene, in particolare, che l'escursione tonale abbia nel parlato una funzione meramente espressiva (enfatica o contrastiva). Per dimostrare questa tesi si assume che uno stesso contorno possa essere realizzato con un grado differente di escursione tonale, senza che il significato dell’enunciato venga per questo alterato. In quest'ottica, quindi, lo scaling, cioè l'escursione tonale su contorni locali, è considerato un evento progressivo, non distintivo, e che svolge una funzione paralinguistica. Questa posizione interpretativa si oppone a quella di Ladd secondo il quale le variazioni del pitch range possono essere di natura estrinseca o intrinseca (oppure, in altri termini, fonetica o fonologica). Le variazioni estrinseche riguardano le variazioni di escursione tonale non distintive, che dipendono dalle caratteristiche personali del parlante o dal contesto extralinguistico. Le variazioni intrinseche, invece, fanno riferimento alle variazioni distintive di altezza tonale, come per esempio la differenza tra tono alto e tono basso. Viene inoltre introdotta una nuova categoria dell’estensione tonale che si pone a livello intermedio tra i fattori estrinseci e quelli intrinseci e che quindi ha carattere ibrido: il cosiddetto downstep, un evento che causa l'abbassamento degli accenti intonativi alti che si succedono nell'enunciato. ToBI Uno dei più diffusi sistemi di trascrizione, oltre a INTSINT, è rappresentato, sul piano autosegmentale, dal sistema ToBI (Tone and Break Indices). Si tratta di un protocollo standardizzato per la costruzione prosodica nato agli inizi degli anni 90 che aveva come funzione quella di mettere a punto un sistema convenzionale che potesse essere applicato nella trascrizione degli eventi tonali di tutte le lingue del mondo. La versione standard di ToBI è formata da quattro livelli di trascrizione sincronizzati sul piano temporale sotto forma di onda dell'enunciato e di contorno di f0. Questi livelli sono: 1) livello ortografico, che riporta la trascrizione ortografica dell'enunciato considerato; 2) livello tonale, che indica i fenomeni intonativi rilevanti; 3) livello delle giunture, che indica il grado di disgiuntura (compreso tra 0 e 4) presente tra le parole 27 che formano l'enunciato; 4) livello misto, che indica la presenza di fenomeni paralinguistici come disfluenze, pause piene, respiro ecc. Tra questi è il livello tonale ad avere un ruolo preminente, in quanto in esso è contenuta la maggior parte delle informazioni di carattere intonativo. Nella trascrizione, si utilizzano una serie di diacritici per chiarire il dominio del tono (se accentuale o demarcativo) e la tipologia degli accenti intonativi (statici o dinamici), ovvero: - *, indica l'allineamento del tono con una sillaba tonica prominente, ad esempio H*; - +, indica che gli elementi congiunti appartengono allo stesso accento intonativo, ad esempio L+H*; - -, un diacritico che ricorre dopo un Accento di sintagma intermedio, ad esempio L- o H-; - %, indica la presenza di un tono di confine, ad esempio L% o H%; se il diacritico è posto prima del tono alto (%H), significa che un tono demarcativo particolarmente alto si ha all’inizio dell’unità tonale (la versione corrispettiva %L non è invece contemplata nel sistema ToBI). - !, segnala una compressione di frequenza del tono alto che segue il diacritico per via di una regola di downstep, ad esempio !H*. Il primo sistema ToBi è stato realizzato per l’inglese americano, sono però numerosi gli studi prosodici che hanno adottato questo sistema di trascrizione anche per altre lingue. Attualmente, ad esempio, questo sistema è stato applicato allo spagnolo, al tedesco, all’italiano, così come al giapponese, allo svedese e al coreano. 3.6 Modelli a componenti sovrapposte e modelli lineari Gli approcci teorici sull’intonazione più impiegati sono quelli fanno riferimento alla distinzione tra modelli intonativi non lineari, definiti a componenti sovrapposte, e modelli teorici di tipo lineare. Nei modelli intonativi non lineari un contorno di f0 è considerato un evento complesso, determinato dalla sovrapposizione di più componenti intonative, ognuna delle quali ha proprietà e dominio prosodico diversi, riconducibili ad una serie di categorie linguistiche o non linguistiche che si condizionano a vicenda. Nei modelli di tipo lineare, solitamente quelli autosegmentali, il contorno intonativo viene invece rappresentato in forma astratta e lineare; quest'ultimo, infatti, consiste in una sequenza ordinata di toni distintivi sul piano fonologico e determinati localmente. Ciò che differenzia questi due modelli, in particolare, è il valore funzionale assegnato a ciascuna componente intonativa. Ad esempio, un fattore che permette di distinguere i due modelli è la natura dell'accento intonativo: nei modelli non lineari, il pitch accent è considerato un'unità globale formata da una successione di movimenti, mentre nei modelli lineari è considerato come una sequenza monotonale o bitonale di toni discreti alti o bassi. Un altro fattore che permette di differenziare questi modelli è la relazione esistente tra l'intonazione e l'accento lessicale: nel modello lineare, la presenza dei Pitch accents è strettamente legata alla posizione degli accenti lessicali che ricorrono nel testo, infatti non è ammessa la presenza di componenti intonative separate dall’accento, a parte i toni di confine. Nei modelli non lineari, invece, il movimento locale di f0 associato a una sillaba accentata si tratta di un aspetto intonativo locale che si sovrappone al contorno globale della frequenza, modificando quest’ultima. 30 il livello intonativo medio è quello non marcato. L'estensione della tonìa dipende dal numero di sillabe presenti nell'enunciato: se vi sono più sillabe rispetto a quelle indicate sullo schema, l'andamento intonativo sarà graduale, se invece le sillabe sono di meno, si avrà una compressione del contorno. In italiano, in particolare, si distinguono 3 tonìe marcate (conclusiva, interrogativa e sospensiva) e una tonìa non marcata (continuativa): - conclusiva /./, in italiano è di tipo discendente ed è tipica delle asserzioni; - interrogativa /?/, ha una forma melodica non marcata di tipo ascendente ed è tipica delle domande, soprattutto di quelle polari. Non tutte le domande, però, hanno una tonìa interrogativa: ad esempio le domande aperte hanno una tonìa conclusiva; la loro pretonìa, invece, è sempre interrogativa, come in tutti i tipi domande. - sospensiva /;/, ha andamento melodico di tipo ascendente-discendente ed è tipica degli enunciati incompleti; - continuativa /,/, ha un andamento non marcato di tonalità media, ed è utilizzata soprattutto per segmentare il parlato in gruppi prosodici. La dimensione pragmatico-testuale La dimensione testuale e pragmatica del parlato è stata analizzata in maniera approfondita da De Dominicis, la cui ricerca ha come obiettivo indagare le influenze pragmatiche dei fenomeni intonativi. Il contesto pragmatico viene visto come l’insieme delle credenze e delle conoscenze che i partecipanti hanno all'interno del contesto comunicativo. La descrizione di un atto comunicativo può avvenire facendo riferimento a una serie di dimensioni quali: il locutore, l'interlocutore, l'espressione o contenuto dell'enunciato. Gli atti linguistici individuati in questa ricerca, in particolare, sono 8: la richiesta, la provocazione, l'ordine, la domanda totale, l'informazione, la valutazione, la rivelazione e la concessione di facoltatività. 4.5 Sintassi e intonazione Unità sintattiche e unità tonali Il rapporto tra interazione e sintassi è stato indagato da Voghera nel 1992. Questa indagine ha come obiettivo individuare le corrispondenze esistenti tra gruppi intonativi e unità sintattiche, mediante l'analisi fonetica di cinque registrazioni di parlato, diverse sul piano diafasico. Per ogni enunciato, in particolare, è stata individuata la presenza del tono e la posizione, all'interno di un gruppo tonale, della sillaba tonica, cioè della sillaba più prominente. Il contorno che si è riscontrato prevalentemente è quello di tipo discendente. Per quanto riguarda il dominio linguistico del gruppo tonale, generalmente il grado di coestensione tra frase e gruppo tonale risulta piuttosto basso. La suddivisione dei testi in proposizioni anziché in frasi ha inoltre determinato nuovi risultati: in particolare, oltre il 60% delle proposizioni non presenta l'estensione di un gruppo tonale e viceversa, inoltre il 70% dei gruppi tonali riscontrati non riproduce una proposizione. Sulla base di questi risultati, si deduce che né l'estensione della frase né quella della proposizione sono coincidenti con quella di un gruppo tonale. Una maggiore corrispondenza tra intonazione e sintassi si ha invece assumendo come riferimento il costituente di frase: in questo caso, infatti, la percentuale della coincidenza di estensione tra gruppo tonale e sintagma oscilla tra il 75 e il 95%. A determinare un diverso grado di equivalenza tra gruppo tonale e sintassi non è però il tipo di unità sintattica di volta in volta considerata, bensì la lunghezza temporale della stessa. Infatti, mentre la lunghezza del gruppo tonale è sostanzialmente costante, le unità sintattiche, invece, possono avere una lunghezza variabile: di conseguenza, minore è il numero di parole presenti all'interno di una unità sintattica, più alta sarà la probabilità che questa coincida con il gruppo tonale. I testi più informali, pertanto, sono quelli che presentano una maggiore equivalenza tra 31 sintassi e intonazione, poiché sono costituiti da frasi brevi e da un maggiore scambio verbale. Fenomeni di segmentazione e ordine delle parole I processi di segmentazione dell'enunciato, ovvero la dislocazione, il tema sospeso, la topicalizzazione e la frase scissa, hanno una natura ibrida nella quale struttura sintattica e pragmatica dell'enunciato si fondono determinando effetti anche sul piano intonativo. Il termine dislocazione richiama l'ordine lineare delle parole; si tratta però di un fenomeno che non ha soltanto natura sintattica, ma anche informativa e quindi prosodica. Quando la dislocazione è presente a sinistra, soprattutto nel caso del parlato, sposta in posizione iniziale di frasi un costituente, che in genere viene ripreso nel resto della frase attraverso un pronome clitico, cioè un pronome personale atono che presenta al contempo alcune proprietà di una parola indipendente e altre tipiche di un affisso; ad esempio: QUESTO LIBRO non l’avevo mai letto. In questo caso il costituente che viene spostato (solitamente l'oggetto), rappresenta il focus informativo, sul quale si intende richiamare l'attenzione dell'interlocutore. Sul piano melodico, invece, il costituente dislocato a sinistra presenta degli indici prosodici che servono a indicare la sua posizione marcata, come ad esempio un picco di frequenza sulla sillaba prominente. Se invece la dislocazione è presente a destra, in questo caso non vi è un vero proprio movimento sintattico, ma vi è piuttosto un pronome clitico che anticipa l'elemento postverbale, come nell'esempio: Non l’avevo mail letto QUESTO LIBRO. Il costituente dislocato a destra esprime sempre un'informazione data. Questo fenomeno è molto frequente nel parlato colloquiale, soprattutto nelle interrogative, come ad esempio: Lo vuoi IL LATTE? o L’hai letto QUESTO LIBRO? Alcune interrogative, generalmente quelle che iniziano con locuzioni del tipo lo sai che…, lo vedi che…, ecc., essendo molto frequenti nel parlato hanno ormai perso il loro valore originario di dislocazione; esse infatti più che sollecitare una risposta, richiamano piuttosto l'attenzione su ciò che verrà detto. Dal punto di vista prosodico, gli enunciati che hanno dislocazione a sinistra possono essere prodotti in una o in due unità intonative, mentre gli enunciati che hanno dislocazione a destra in un solo gruppo intonativo. Quando l'enunciato è diviso in due unità, il costituente dislocato sinistra è saliente sul piano intonativo. Al contrario, il costituente dislocato a destra è posizionato su un livello frequenziale più basso. Un particolare tipo di dislocazione si ha in presenza di un soggetto postverbale o postposto, come ad esempio: E’ arrivato MARCO. Questo fenomeno è stato indagato soltanto recentemente in maniera ancora limitata. Un primo lavoro in tal senso è stato svolto su un corpus di parlato toscano, a Pisa e a Siena, relativo a enunciati interrogativi. In entrambe le varietà toscane analizzate, i profili intonativi legati al soggetto postverbale sono essenzialmente due: un profilo maggioritario che copia l'andamento della domanda precedente ed è per questo motivo definito "parassitico" e un secondo profilo che presenta un andamento discendente-piatto. La distribuzione di questi contorni non avviene in modo casuale, ma è strettamente correlata alla struttura informativa dell'enunciato: in particolare, se il soggetto postverbale è inteso come informazione data, in questo caso il suo andamento sarà monotono; se invece l'interrogazione coinvolge sia il verbo che il soggetto, in questo caso il costituente postposto presenterà un contorno di domanda. Una seconda ricerca, sempre in quest'ambito, ha invece adottato un corpus di parlato spontaneo romano. Il fenomeno in questione è stato in questo caso distinto in due sottotipi: la costruzione verbale con soggetto legato 32 (ad esempio, Fra poco arriva MARCO) e la costruzione verbale con soggetto slegato (Capisce tutto ‘STO BAMBINO). Nel primo caso, verbo e soggetto sono sempre adiacenti, mentre nel secondo sono entrambi separati. Anche sul piano prosodico vi sono differenze tra i due casi: mentre il contorno del soggetto legato si inserisce in modo globale e continuo nell'andamento del verbo, il soggetto slegato, invece, è sempre separato dal verbo, inoltre il suo andamento melodico è piatto e privo di prominenza. 4.6 Gli studi autosegmentali La trascrizione ToBI In Italia, i primi studi autosegmentali hanno fatto la loro comparsa nel 1990 con la ricerca svolta da Avesani sulla declinazione intonativa. Egli, peraltro è stato anche il primo ad aver tentato una codifica prosodica dell'italiano attraverso il sistema ToBI, nel 1995. A partire da questo momento, lo studio relativo alla trascrizione ToBI dell'italiano è continuata senza interruzioni fino al 2005, quando sono state postulate le norme di etichettatura prosodica attraverso l'osservazione empirica di quattro varietà di italiano, ovvero l'italiano di Firenze, Napoli, Bari e Palermo. La codifica italiana del sistema ToBI non è però stata ancora ultimata, in quanto si basa su un numero molto limitato di varietà geografiche. Nella versione italiana del sistema ToBi sono stati individuati 5 livelli di disgiuntura tonale: - assenza di disgiuntura tra due elementi lessicali; - presenza di disgiuntura ritmica o tonale; - disgiuntura presente al confine di sintagma intermedio; - disgiuntura presente al confine di sintagma intonativo. Sul piano o tonale, si individuano due costituenti prosodici: il sintagma intermedio e il sintagma intonativo. L'accento di sintagma può essere alto (H-) o basso (L-) ed è presente soprattutto negli enunciati contenenti un elemento lessicale dislocato, ad esempio nelle domande coda. I toni di confine contemplati nell'inventario del sistema ToBI applicato l'italiano sono invece: - L%: tono di confine basso, tipico degli enunciati assertivi, imperativi, esclamativi e delle domande aperte; - H%: tono di confine alto, frequente nel contorno terminale dell'interrogativa sì/no in diverse varietà di italiano regionale; - %H: tono di confine alto che caratterizza il contorno iniziale delle frasi esclamative nell'italiano fiorentino. I diacritici previsti sono invece: - !, Indica la presenza di downstep; - ( ), segnala toni che hanno subito un troncamento tonale e che quindi non sono realizzati foneticamente; - n, accompagna la trascrizione dell'accento intonativo nucleare e serve a evidenziarne la posizione all'interno dell'unità tonale. L'interrogazione interrogativa La domanda sì/no La domanda sì/no è la tipologia modale più indagata negli studi prosodici di carattere autosegmentale. Nell'italiano settentrionale, in particolare, l'intonazione della domanda polare è generalmente di tipo discendente-ascendente, mentre l'accento nucleare è discendente. Nel parlato torinese, invece, il contorno intonativo è caratterizzato da un andamento di tipo 35 intonativa. Spesso, però, soprattutto nel parlato spontaneo, l'ultima sillaba tonica del sintagma intonativo ha un andamento monotono, non saliente sul piano percettivo o semantico; in questo caso gli elementi più prominenti possono invece ricorrere all'inizio o a metà dell'unità tonale. Al fine di stabilire dei criteri certi per l'identificazione del nucleo, è necessario prima di tutto ridefinire il concetto di prominenza. Una prima proposta distingue in tal senso tre tipi di salienza: salienza tonale, accentuale e metrica. Questi tre tipi di salienza possono essere contemporaneamente presenti sulla stessa sillaba oppure, come accade spesso nel parlato spontaneo, ricorrere su parole differenti. Più recentemente il concetto di prominenza è stato diviso in altri tre sottotipi: 1) prominenza funzionale o grammaticale: insieme degli aspetti acustici che indicano la tipologia modale dell'enunciato e che si realizzano solitamente alla fine della frase; 2) prominenza informativa o semantica: insieme delle variazioni salienti dal punto di vista percettivo, in primis lo scaling, che permette di identificare gli elementi focalizzati ricorrenti all'inizio o a metà dell'enunciato; 3) prominenza metrico-ritmica: insieme delle proprietà ritmiche e temporali caratteristiche di una varietà diatopica, su cui si realizza il contorno intonativo. Questi tre sottotipi possono realizzarsi sulla stessa parola oppure occupare posizioni distinte all'interno dell'enunciato. Se più tipi di prominenza si concentrano sulla stessa sillaba, in fase di trascrizione si aggiunge al PA un duplice asterisco (H**). 4.7 L'applicazione INTSINT INTSINT ha rappresentato il modello intonativo di riferimento per l'etichettatura prosodica del materiale linguistico relativo al progetto di ricerca IPAR (Italiano Parlato). Ad oggi, la ricerca più ampia effettuata in ambito italiano utilizzando il sistema di trascrizione INTSINT è quella svolta da Giordano sul parlato semispontaneo di Roma e di Perugia. In rapporto alla tipologia modale degli enunciati, la frase dichiarativa risulta caratterizzata, nella stragrande maggioranza dei casi, da confini bassi e da accenti intonativi discendenti; le interrogative polari, invece, da confini intonativi prevalentemente alti, soprattutto a Perugia, e da accenti intonative ascendenti. Per quanto riguarda l'estensione frequenziale, ovvero l'intervallo calcolato tra i toni assoluti alto e basso, il pitch range risulta ristretto nelle frasi dichiarative che fungono da risposta o da assenso, medio negli altri tipi di dichiarativa, nelle interrogative aperte e nelle interrogative sì/no, e ampio nelle sospensive. L'intonazione del contorno sospensivo, in particolare, è stata a sua volta oggetto di un’ulteriore ricerca sul parlato napoletano e pisano. In queste due varietà sono state individuate due varianti sospensive: una prima variante discendente-ascendente, dove il valore minimo si ha soprattutto sull'ultima sillaba accentata ed è seguito da una risalita finale, e una seconda variante ascendente, dove il massimo valore frequenziale si rinviene sull'ultima sillaba tonica. 4.8 Lo stato dell'arte In Italia la ricerca sugli studi intonativi si è notevolmente sviluppata a partire dagli anni 80. La letteratura in quest'ambito, però, non è ancora uniforme sia sul piano teorico che su quello metodologico. Finora gli approcci che hanno prodotto maggiori risultati sono stati quello fonetico sperimentale e quello fonologico autosegmentale. Sul versante fonetico, in particolare, gli studi sperimentali hanno permesso la comprensione di alcuni meccanismi di integrazione tra parametri uditivi diversi, ad esempio la relazione tra frequenza fondamentale e durata, così come le caratteristiche fonetiche dei contorni assertivi e interrogativi. L'approccio autosegmentale, invece, attraverso l'elaborazione dei sistemi di trascrizione fonologica e l'applicazione diverse sotto varietà di italiano, ha permesso di cogliere da un lato gli aspetti intonativi universali e dall'altro alcuni aspetti distintivi dell'intonazione legati alle diverse aree geografiche prese in esame. Alcuni settori di ricerca rimangono, però, ancora poco esplorati, a cominciare da quello relativo ai parametri sotto 36 linguistici. In particolare, sul piano diatopico, cioè quello legato al luogo e all'area geografica di riferimento, diverse realtà dialettali risultano completamente inesplorate, mentre sul piano diafasico, relativo alla capacità di variare registro linguistico a seconda delle necessita e delle situazioni comunicative, solo recentemente si sono cominciati ad analizzare stili elocutivi più liberi, come il parlato semispontaneo e spontaneo. 37 CAP. 5 - L'INTONAZIONE DI ALCUNE LINGUE STRANIERE 5.1 Premessa Negli ultimi anni sono stati condotti una serie di studi nel campo della prosodia su diverse lingue europee. Si tratta di studi diversi sul piano metodologico e teorico; a partire dagli anni 80, però, si è imposto come approccio di analisi privilegiato il modello AM. 5.2 L'intonazione dell'inglese standard Le ricerche compiute sull'intonazione della lingua inglese sono molto numerose, anche se non uniformi. Per classificare i toni nucleari della lingua inglese è necessario considerare tre fattori fondamentali: 1) il movimento che ha origine dal Nucleo: in base a questo criterio il contorno può essere discendente, ascendente o invariato; 2) il livello da cui ha inizio il movimento nucleare, cioè alto o basso; 3) il cambio di direzione tonale riscontrabile dopo il nucleo e che permette di produrre toni complessi, come ascendente-discendente o discendente-ascendente. Attraverso la combinazione di questi fattori è possibile produrre diversi tipi di toni. Per l'inglese, in particolare, si individuano in totale 7 toni, di cui 3 discendenti 3 ascendenti e uno costante, in particolare: - tono basso-discendente e alto-discendente, entrambi ricorrenti nelle frasi assertive, imperative nelle domande aperte e che esprimono rispettivamente distanza, disinteresse oppure coinvolgimento e interesse da parte del parlante; - tono ascendente-discendente, frequente nelle asserzioni, nelle esclamazioni e nelle domande eco con esclamazione; - tono basso-ascendente, tipico del registro stilistico formale e della lettura; - tono alto-ascendente, tipico delle domande eco e che esprime sorpresa e incredulità; - tono discendente-ascendente, presente nelle frasi dichiarative e che esprime riserva o contrasto; - tono di livello medio, tipico della sospensione. La prosodia dell'inglese, rispetto a quella di altre lingue europee, è caratterizzata da frequenti fenomeni di compressione e di troncamento tonale che coinvolgono, il più delle volte, toni complessi. Nell'inglese i fenomeni di compressione sono particolarmente frequenti negli enunciati monosillabici. Un altro fenomeno spesso indagato nella letteratura prosodica inglese riguarda la realizzazione di contorni stilizzati, ossia configurazioni melodiche stereotipate che hanno come obiettivo richiamare l'attenzione dell'interlocutore. Questi contorni, chiamati spoken chants o richiami, si riscontrano prima di tutto nel vocativo con funzione di appello, ma anche nelle formule di saluto e in alcune espressioni impiegate dagli adulti per rivolgersi ai bambini. Questi contorni sono caratterizzati da un allungamento significativo delle sillabe finali, mentre sul piano melodico sono formati da due livelli tonale, il secondo dei quali più basso del primo di circa 3 semitoni. Per quanto riguarda la tipologia modale, l'intonazione dell'inglese standard, corrispondente all'inglese sud orientale, presenta negli enunciati assertivi, negli imperativi e nelle domande aperte un andamento tipicamente discendente, mentre le domande sì/no e quelle eco sono caratterizzate da un contorno intonativo ascendente. Per quanto riguarda invece l'inglese parlato al di fuori dell'Europa, in Australia e in Nuova Zelanda si riscontra un andamento alto-ascendente e basso- ascendente. L'intonazione di alcune varietà d'inglese sub-standard Per quanto riguarda l'intonazione di alcune sottovarietà di inglese, alcune varietà settentrionali 40 ha una forma circonflessa ed è caratterizzata da un movimento ascendente-discendente che si realizza alla fine dell'enunciato. 5.5 L'intonazione del francese L'intonazione del francese è caratterizzata da una lunga tradizione di studi. Un'importante filone di ricerca si è recentemente sviluppato attorno al modello prosodico formulato da Hirst (1983), dove l'intonazione è vista come il risultato della successione gerarchica di più costituenti prosodici: il gruppo accentuale, caratterizzato da un contorno ascendente; l'unità tonale, formata da più gruppi accentuali e l'unità intonativa, caratterizzata da più gruppi tonali e da un andamento discendente. In francese, unità tonale e gruppo accentuale sono coestensivi, mentre i toni individuati sono tre: alto (H), basso (L) e downstep (D). Un altro modello prosodico sulla lingua francese è quello di Rossi: in esso l'intonazione è considerata una forma discontinua formata da morfemi intonativi chiamati intonemi. Questi ultimi sono: la continuazione maggiore (CT), la continuazione minore (ct), la conclusione maggiore (CC), la conclusione minore (cc), l'appellativo (APP) e il parentetico (PAR). Un ultimo modello, infine, è quello elaborato da Martin. Si tratta di un modello fono- sintattico, secondo il quale l'enunciato presenta una struttura sintattica e una struttura prosodica organizzate in modo gerarchico. Alcuni contorni intonativi Le frasi assertive e imperative del francese hanno un contorno terminale discendente. La frase iussiva o imperativa presenta però una serie di aspetti che la differenziano a livello percettivo dalla frase di tipo dichiarativo: nell'enunciato imperativo, infatti, il punto di attacco della curva intonativa è solitamente più alto, la discesa frequenziale è più marcata e veloce, mentre le ultime sillabe hanno spesso un andamento statico. Anche la domanda aperta wh- ha un andamento intonativo progressivamente discendente che raggiunge, come la frase assertiva, il limite inferiore del range frequenziale del parlante. Le domande sì/no e le domande eco, invece, hanno un contorno più alto in frequenza, inoltre sono caratterizzate da una risalita finale che si pone Sull'ultima sillaba dell'enunciato. L'intonazione del francese è inoltre influenzata da fattori socio-linguistici: ad esempio, considerando il piano diatopico, in alcune varietà francesi meridionali, il contorno finale si anche sulle sillabe atone finali, mentre nelle varietà settentrionali l’accento prominente è posto sulla prima sillaba della parola o sull'ultima sillaba. Gli studi autosegmentali In Francia sono poche le ricerche sull’intonazione della lingua francese basate su un approccio autosegmentale. Quest'ultime prevedono una gerarchia prosodica articolata in tre livelli. L'unità minima, in particolare, è composta da più parole e rappresenta il dominio dell'accento lessicale primario e secondario. L'unità accentuale è invece dominata sul piano gerarchico dal Sintagma intonativo intermedio che agevola l'interpretazione melodica di alcuni contesti sintattici complessi. Al vertice della gerarchia si trova infine il Sintagma intonativo. Un secondo indirizzo di ricerca, sempre di tipo autosegmentale, propone un paradigma dei toni accentuali, la cui rappresentazione prevede delle parentesi graffe che indicano i toni che possono essere presenti in un determinato contesto e delle parentesi tonde che invece indicano gli elementi opzionali. 5.6 Il progetto AMPER Gli studi sull’intonazione delle lingue romanze sono ancora piuttosto lacunosi. I risultati ottenuti, infatti, sono difficili da confrontare perché caratterizzati da una diversa metodologia di analisi e da un diverso sistema di rappresentazione prosodica. Per ovviare a queste lacune è stato avviato nel 2001 un progetto di ricerca internazionale, denominato AMPER, da parte del centro di dialettologia 41 dell'Università Stendhal di Grenoble. L'obiettivo principale di questo progetto è quello di formulare un sistema prosodico delle lingue romanze diffuse nel mondo: in particolare, è analizzata l'intonazione, soprattutto quella degli enunciati assertivi ed interrogativi, mentre la raccolta del materiale linguistico e la metodologia di analisi impiegata seguono uno standard prestabilito, comune a tutti i paesi partecipanti al progetto.
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved