Neural encoding of speech in newborns: voice pitch, formant structure and the effects of prenatal acoustic environment

Arenillas-Alcón, Sonia

Neural encoding of speech in newborns: voice pitch, formant structure and the effects of prenatal acoustic environment

Author

Arenillas-Alcón, Sonia

Director

Escera i Micó, Carles

Costa Faidella, Jordi

Tutor

Escera i Micó, Carles

Date of defense

2024-01-12

Pages

140 p.

Department/Institute

Universitat de Barcelona. Departament de Psicologia Clínica i Psicobiologia

Abstract

[eng] The process of language acquisition is a remarkable milestone in infant life observed across several cultures and populations, making oral language the most prevalent form of human communication. Regardless of cultural background or native language, infants show comparable developmental trajectories in acquiring language, suggesting a universal organic foundation for this ability. However, language acquisition is far from simple, as it involves the development of complex perceptual and cognitive abilities, linked to the maturation of the auditory system and the encoding of speech sounds. In this context, a well-developed ability to perceive and distinguish the phonemes that constitute the different languages serve as essential prerequisites for effective language acquisition and communication in infants. Therefore, assessing at birth the state of maturity of the abilities that will allow future language acquisition emerges as a primary aspect to study. The present thesis aimed at investigating the neural mechanisms underlying speech processing in neonates, as well as the potential effects of the prenatal acoustic environment on the development of these mechanisms. Studying speech encoding abilities in newborns poses challenges due to the neonates’ inability to provide overt responses. To overcome this, the frequency-following response (FFR) has emerged as a promising tool for exploring complex sound encoding. The FFR provides a noninvasive snapshot of sound processing in the brain and has proven potential to predict future language development. Additionally, the FFR appears to be well suited for the study of auditory plasticity, since it has been shown to be modulated by several factors both postnatally and prenatally, including context-dependent contingencies, different auditory experiences and short-term auditory training. To investigate speech encoding, researchers have employed various speech stimuli in FFR studies (e.g., consonant-vowel syllable /da/, different single vowels with rising pitch, Mandarin syllables following the four lexical tones). These stimuli allowed to explore easily the neural responses to the voice pitch (mainly the fundamental frequency, F0) in neonates, but do not allow to fully explore critical aspects of language encoding, such as how precisely the newborn brain encodes the temporal fine structure of auditory stimuli –particularly relevant to discriminate vowels. As a consequence, the extent to what neonates are able to encode the formant structure of speech sounds remains unclear. Thus, the first objective of the present doctoral thesis was to design a new speech stimulus that simultaneously assessed fundamental frequency and temporal fine structure, to explore the functional maturity of the neural mechanisms involved in encoding voice pitch contour and formant structure in newborns. We compared the FFRs recorded in a group of newborns and adults, and provided evidences on how newborns are able to encode voice pitch and formant structure at birth. We disclosed that newborns show a remarkable ability to encode the voice pitch of speech sounds with adult-like accuracy, and that they are able to encode the formant structure of the speech as well. Given the exceptional plasticity of the neural mechanisms generating the FFR and its potential as a biomarker for early identification of speech encoding impairments, external factors that might influence speech encoding at birth were considered. Neonatal speech encoding is shaped by several factors that can affect the development of the auditory system, not only perinatally or long after birth, but also during the pregnancy period, including for example prematurity, prenatal clinical conditions, or prenatal environmental factors. Thus, a critical question arises regarding the potential influence of the fetal environment, particularly the acoustic environment, on the newborn’s abilities to encode speech sounds. Consequently, the second and third studies of this thesis were focused on exploring the impact of prenatal music exposure and prenatal bilingualism environments, respectively, on the encoding of speech sounds at birth, by conducting FFR recordings in groups of newborns with different degrees of prenatal music and language exposure. The second study revealed that daily prenatal music exposure during the final trimester of pregnancy was linked to a stronger encoding of voice pitch at birth, suggesting that exposure to music during the prenatal period plays a facilitating role in tuning the infant's sensitivity to the fundamental frequency of human speech. The third study disclosed that newborns exposed to a monolingual prenatal environment during the final trimester of pregnancy exhibited a more accurate encoding of voice pitch and formant structure of speech sounds at birth. These findings were interpreted as the result of a less variable speech background in monolingually-exposed newborns, resulting in larger neural responses and more accurate encoding of voice pitch and formant structure at birth, while neonates bilinguallyexposed would show an enhanced sensitivity to a broader range of frequencies without exhibiting an especially strong response at any of them. Overall, the findings of the present thesis add significant value to the understanding of early language acquisition processes and highlight the importance of early acoustic experiences in shaping the development of auditory mechanisms. Further studies should continue to explore these acoustic environmental factors, as they hold large potential in designing early interventions for potential future speech and language disorders.

[cat] L'adquisició de la parla és una de les fites més destacades de les primeres etapes de la vida infantil, que es presenta de forma pareguda en diverses cultures i poblacions, fent del llenguatge oral la forma més freqüent de comunicació humana. Independentment de l'origen cultural o de la llengua nativa, els nadons mostren trajectòries de desenvolupament comparables en l'adquisició del llenguatge, el que suggereix una base orgànica universal per a aquesta capacitat. No obstant això, l'adquisició del llenguatge dista de ser un procés simple, ja que implica el desenvolupament d'habilitats perceptives i cognitives complexes, lligades a la maduració del sistema auditiu i a la codificació dels sons de la parla. En aquest context, una capacitat ben desenvolupada per percebre i distingir els fonemes que constitueixen les diferents llengües serveix com a requisit previ essencial per a l'adquisició i la comunicació eficaç del llenguatge en els nadons. Per tant, la valoració en el naixement de l'estat de maduresa de les capacitats que permetran l'adquisició futura de la llengua sorgeix com un aspecte primordial a estudiar. La present tesi té com a objectiu investigar els mecanismes neuronals subjacents al processament de la parla en nounats, així com els efectes potencials de l'entorn acústic prenatal en el desenvolupament d'aquests mecanismes. L'estudi de les habilitats de codificació de la parla en els nounats planteja reptes a causa de la incapacitat del nounat per proporcionar respostes obertes a requeriments dels qui fan la recerca. Per superar aquesta limitació, la resposta de seguiment de freqüència (RSF; FFR per les sigles en anglès) ha sorgit com una eina prometedora per explorar la codificació dels so complexos. La RSF proporciona una instantània no invasiva del processament del so al cervell i ha demostrat la seva capacitat per predir el desenvolupament futur del llenguatge. A més, la RSF sembla ser molt adequada per a l'estudi de la plasticitat auditiva, ja que s'ha trobat que està modulada per diversos factors tant en l'àmbit postnatal com prenatal, incloses les contingències dependents del context, diferents experiències auditives i un entrenament auditiu a curt termini. Per investigar la codificació de la parla, els investigadors han emprat diversos estímuls de parla en estudis RSF (per exemple, síl·laba consonant-vocal /da/, diferents vocals simples amb to creixent, síl·labes del Mandarí seguint els quatre tons lèxics). Aquests estímuls han permès explorar fàcilment en nounats les respostes neuronals al to de la veu (principalment la freqüència fonamental, F0), però no permeten explorar completament aspectes crítics de la codificació del llenguatge, com ara la precisió amb què el cervell nounat codifica l'estructura temporal fina d'estímuls auditius –especialment rellevants en la percepció del contingut vocàlic. Com a conseqüència, encara no està clar fins a quin punt els nounats són capaços de codificar l'estructura de formants dels sons de la parla. Així, el primer objectiu de la present tesi doctoral va ser dissenyar un nou estímul de la parla que avalués simultàniament la freqüència fonamental i l'estructura temporal fina, per explorar la maduresa funcional dels mecanismes neuronals implicats en la codificació del contorn de to de veu i l'estructura del formant en els nounats. Hem comparat els FFR enregistrats en un grup de nounats i adults i hem proporcionat evidències sobre com els nounats són capaços de codificar el to de la veu i l'estructura del formant al naixement. Vam trobar que els nounats mostren una capacitat notable per codificar el to de la veu dels sons de la parla amb una precisió semblant a l'adult, i que també són capaços de codificar l'estructura dels formants de la parla. Un cop demostrat el punt de maduresa d'aquests mecanismes neuronals, i donada l'excepcional plasticitat del RSF i el seu potencial com a biomarcador per a la identificació precoç de les alteracions de la codificació de la parla, es van considerar factors externs que podrien influir en la codificació de la parla en néixer. La codificació de la parla neonatal està configurada per diversos factors que poden afectar el desenvolupament del sistema auditiu, no només durant el període perinatal o molt després del part, sinó també durant el període de l'embaràs, com ara la prematuritat, les condicions clíniques prenatals o els factors ambientals prenatals. Així, es planteja una qüestió interessant sobre la influència potencial d'aquest entorn fetal, especialment l'entorn acústic, en les capacitats del nounat per codificar els sons de la parla. En conseqüència, el segon i el tercer estudi es van centrar a explorar l'impacte de l'exposició prenatal a la música i els entorns de bilingüisme prenatal, respectivament, en la codificació dels sons de la parla en néixer, mitjançant la realització d'enregistraments RSF en grups de nounats amb diferents graus d'exposició prenatal a la música i al llenguatge. El segon estudi va mostrar que l'exposició diària de música durant el darrer trimestre de l'embaràs estava relacionada amb una codificació més forta del to de la veu al naixement, cosa que suggereix que l'exposició a la música durant el període prenatal té un paper facilitador en l'ajust de la sensibilitat del nadó a la freqüència fonamental de la parla humana, contribuint, per tant, a fomentar el processament i l'adquisició primerenca del llenguatge. D'altra banda, el tercer estudi va revelar que els nounats exposats a un entorn prenatal monolingüe durant l'últim trimestre de l'embaràs presentaven una codificació més precisa del to de la veu i de l'estructura de formants dels sons de la parla en néixer. Aquestes troballes es van interpretar com el resultat d'un fons de parla menys variable per a la codificació en nadons exposats de manera monolingüe, donant lloc a respostes neuronals més grans i a una codificació més precisa del to de la veu i de l'estructura del formant en néixer, mentre que els nounats exposats a un entorn bilingüe mostrarien una sensibilitat millorada a una gamma més àmplia de freqüències sense mostrar una resposta especialment forta en cap d'elles. En general, els resultats de la present tesi afegeixen un valor significatiu a la comprensió dels processos d'adquisició primerenca del llenguatge i posen de manifest la importància de les experiències acústiques primerenques en la configuració del desenvolupament dels mecanismes auditius i probablement, de l'adquisició futura del llenguatge. Els estudis posteriors haurien de continuar explorant aquestes dinàmiques, ja que tenen un gran potencial per dissenyar intervencions primerenques per als trastorns de la parla i el llenguatge.

Keywords

Psicobiologia del desenvolupament; Psicobiología del desarrollo; Developmental psychobiology; Adquisició del llenguatge; Adquisición del lenguaje; Language acquisition

Subjects

159.9 - Psychology

Knowledge Area

Ciències de la Salut

Note

Programa de Doctorat en Biomedicina

Documents

This document contains embargoed files until 2025-01-12

Export

DIDL MARC MARC_CCUC METS OAI_DC ORE QDC RDF

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)

Departament de Psicologia Clínica i Psicobiologia [54]

Neural encoding of speech in newborns: voice pitch, formant structure and the effects of prenatal acoustic environment

Author

Director

Tutor

Date of defense

Pages

Share

Department/Institute

Abstract

Keywords

Subjects

Knowledge Area

Note

Documents

Export

Rights

This item appears in the following Collection(s)