English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁 > 技術(shù)文章 > 功能性超聲成像解碼聽覺層次之雪貂如何“屏蔽”背景噪聲

功能性超聲成像解碼聽覺層次之雪貂如何“屏蔽”背景噪聲

瀏覽次數(shù):231 發(fā)布日期:2025-7-23  來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負
功能性超聲成像解碼聽覺層次
在自然聲音場景中,根據(jù)聲音的平穩(wěn)性,可以把聲音分為背景聲音(background sounds)前景聲音(foreground sounds)。背景聲音被定義為平穩(wěn)性最高的聲音,其聲學(xué)統(tǒng)計特性在較長時間尺度上波動,更具可預(yù)測性,對提示突發(fā)事件的重要性較低。前景聲音被定義為平穩(wěn)性最低的聲音,屬于動態(tài)聲音,在較短時間尺度上波動,能隨時間傳遞新信息(如言語或發(fā)聲)。人類聽覺皮層存在背景不變性(即神經(jīng)元對背景聲音的響應(yīng)不隨背景變化而改變的特性)的層級梯度,但跨物種保守性及潛在神經(jīng)機制尚不明確。

2025年5月,巴黎高等師范學(xué)院認知研究系Yves Boubenec 教授團隊在eLife上發(fā)表了題名為“Hierarchical encoding of natural sounds mixtures in ferret auditory cortex”的研究論文。研究聚焦于兩個核心問題:一是背景不變性的層級組織原則是否跨物種保守,即人類聽覺皮層中從初級到非初級區(qū)域逐漸增強的背景不變性特征,是否在其他哺乳動物(如雪貂)中同樣存在;二是驅(qū)動這種背景不變性的神經(jīng)機制是什么,是由低階聲學(xué)特征調(diào)諧(如頻率、頻譜時間調(diào)制)主導(dǎo),還是依賴更高階的神經(jīng)計算,且這種機制是否在物種間存在差異。研究通過比較雪貂與人類聽覺皮層對自然聲音混合信號的處理,旨在揭示聽覺系統(tǒng)提取有效信號的通用原理與物種特異性機制。

 

研究亮點
1、首次在雪貂聽覺皮層發(fā)現(xiàn)背景不變性的層級梯度

與人類類似 —— 初級區(qū)域同時反映前景和背景聲音的貢獻,高階區(qū)域(次級、三級)的背景不變性顯著增強,驗證了該組織原則的跨物種部分保守性。
2、揭示雪貂的層級結(jié)構(gòu)可通過頻譜時間濾波器組模型解釋
主要依賴對低階聲學(xué)特征(如頻率、頻譜時間調(diào)制)的調(diào)諧,為低階機制驅(qū)動背景不變性提供了實證。
3、跨物種對比發(fā)現(xiàn)人類的背景不變性無法被頻譜時間濾波器組模型完全解釋
提示人類非初級聽覺皮層可能依賴高階聲學(xué)特征或額外神經(jīng)機制(如語音相關(guān)的高階編碼),為理解物種特異性聽覺處理差異提供了關(guān)鍵線索。

研究結(jié)果
雪貂聽覺皮層穩(wěn)定編碼聲音特征

研究采用功能性超聲成像技術(shù)(fUSI研究雪貂聽覺皮層對自然聲音流的處理機制。實驗設(shè)計了三類聲音刺激:前景音(非平穩(wěn))、背景音(平穩(wěn))及其混合音,通過計算聲音的時域平穩(wěn)性進行區(qū)分。研究發(fā)現(xiàn),聽覺皮層血流動力學(xué)響應(yīng)在初始瞬態(tài)反應(yīng)后能穩(wěn)定編碼聲音特征。單獨背景音引發(fā)的持續(xù)響應(yīng)強度低于前景音和混合音。通過分析響應(yīng)性體素的活動模式,證實了聽覺皮層能夠在聲音切換后2-4.8秒的時間窗內(nèi)穩(wěn)定表征不同聲音類別,展現(xiàn)了其對復(fù)雜聲景的層次化處理能力。

 
 1. 血流動力學(xué)活動反映對前景音和背景音的編碼
 
A)前景音(方形)和背景音(菱形)的平穩(wěn)性。(B)聲音呈現(xiàn)范式及示例耳蝸圖。我們按照圖示設(shè)計,將 9.6 秒的前景音片段(冷色)和背景音片段(暖色)連接起來,形成連續(xù)的聲音流。每個前景音(或背景音)流單獨呈現(xiàn),并與兩個不同的背景音(或前景音)流混合呈現(xiàn)。(C)我們使用功能性超聲成像技術(shù),在雪貂聽覺皮層的冠狀切片(藍色平面)中測量腦血容量(CBV)(黑色輪廓為雪貂聽覺皮層)。我們通過連續(xù)切片在幾天內(nèi)對整個聽覺皮層進行成像。(D)在不同條件下,聽覺皮層中與聲音變化同步的 CBV 平均變化(以安靜基線為基準進行標準化),對所有雪貂的數(shù)據(jù)進行平均。陰影區(qū)域表示不同聲音片段的均值標準誤。(E)每種條件下的重測交叉相關(guān)性。聲音兩次重復(fù)的體素反應(yīng)在不同滯后下的相關(guān)性。然后對所有有反應(yīng)的體素(ΔCBV > 2.5%)的結(jié)果矩陣進行平均。

雪貂聽覺皮層中背景音不變性的層次化組織
研究揭示了雪貂聽覺皮層對背景音處理的層次化組織特征。
通過fUSI,研究人員發(fā)現(xiàn)聽覺皮層不同區(qū)域?qū)β曇艋旌蠄鼍暗奶幚泶嬖陲@著差異。在初級聽覺皮層(MEG),神經(jīng)元對前景音和背景音的響應(yīng)差異不大;而在更高級的次級區(qū)(dPEG)和三級區(qū)(VP),神經(jīng)元表現(xiàn)出明顯的背景音不變性增強現(xiàn)象,即對混合音和單獨前景音的響應(yīng)模式更為相似。特別值得注意的是,這種背景音不變性呈現(xiàn)出明確的層次梯度:三級區(qū)VP的表現(xiàn)最優(yōu),其次是次級區(qū)dPEG,初級區(qū)MEG最弱。與此同時,前景音不變性則呈現(xiàn)相反趨勢,從初級區(qū)到高級區(qū)逐漸降低。這種雙向變化導(dǎo)致在非初級區(qū),背景音不變性顯著高于前景音不變性。這些發(fā)現(xiàn)不僅證實了聽覺系統(tǒng)層次化處理聲音場景的普遍原則,也為理解大腦如何從復(fù)雜聲學(xué)環(huán)境中提取關(guān)鍵信息提供了新的神經(jīng)機制解釋。

 
圖 2. 雪貂聽覺皮層中對背景音的不變性呈層級組織
 
(A)一個示例半球(雪貂 L)的平均反應(yīng)圖。反應(yīng)以相對于安靜時期基線活動的 CBV 百分比變化表示。對深度方向的值進行平均,得到聽覺皮層的表面視圖。(B)重測信度圖。在以下各圖中,僅顯示有可靠反應(yīng)的體素(至少在一種聲音類別中重測信度 > 0.3),圖中表面單元的透明度由納入平均的(可靠)體素數(shù)量決定。(C)基于解剖學(xué)標志的感興趣區(qū)域(ROIs)圖。箭頭指示圖 D 中所示的示例切片(橙色:初級;綠色:非初級示例)。(D)對單獨呈現(xiàn)和混合呈現(xiàn)的前景音的反應(yīng)。底部:示例體素(左:初級;右:非初級)對混合音和單獨呈現(xiàn)的前景音的反應(yīng)。每個點代表體素對每個前景音(x 軸)和混合音(y 軸)的時間平均反應(yīng),取兩次重復(fù)的平均值。r 表示皮爾遜相關(guān)系數(shù)值。頂部:圖中顯示不變性,定義為混合音和單獨呈現(xiàn)的前景音之間的噪聲校正相關(guān)性,示例體素所在切片的值疊加在代表基線 CBV 的解剖學(xué)圖像上。示例體素用白色方塊標記。(E)同一半球的背景不變性圖。(F)每個 ROI 的背景不變性量化結(jié)果。十字符號(+)表示跨動物的每個 ROI 所有體素的中值;疑珗A點表示每個動物的初級(MEG)和非初級(dPEG + VP)體素的中值。每個圓點的大小與計算中值所依據(jù)的體素數(shù)量成正比。較粗的線對應(yīng)示例雪貂 L。***:通過對每個動物體內(nèi)素的 ROI 標簽進行置換檢驗,比較動物間 ROI 對的平均背景不變性,p <= 0.001。(G-I)與 D-F 相同,但為前景不變性(比較混合音與單獨呈現(xiàn)的背景音)。AEG,前外 sylvian 回;MEG,內(nèi)側(cè)外 sylvian 回;dPEG,背側(cè)后外 sylvian 回;VP,腹側(cè)后聽覺區(qū)。

聽覺處理模型預(yù)測層次化差異
研究通過建立頻譜時域調(diào)制模型,系統(tǒng)揭示了雪貂聽覺皮層層次化處理聲音場景的神經(jīng)機制。
模型分析表明,前景音和背景音在時域調(diào)制特性上存在本質(zhì)差異:前景音主導(dǎo)低調(diào)制速率(<8Hz),而背景音集中于高速率區(qū)(>8Hz);跒V波器組模型和交叉驗證方法,研究發(fā)現(xiàn)不同聽覺皮層區(qū)域?qū)β晫W(xué)特征的調(diào)諧偏好呈現(xiàn)規(guī)律性變化:次級區(qū)dPEG偏好高頻和高頻譜調(diào)制,三級區(qū)VP則偏向低頻和中等調(diào)制參數(shù)。這些調(diào)諧差異直接影響了各區(qū)域的背景不變性表現(xiàn)——偏好低調(diào)制速率的體素表現(xiàn)出更強的背景不變性。值得注意的是,模型不僅能夠準確預(yù)測單個體素的響應(yīng)特性(背景不變性預(yù)測準確度r=0.65),還完整重現(xiàn)了從初級區(qū)到高級區(qū)的背景不變性遞增梯度(VP>dPEG>MEG)和前景不變性遞減梯度。這一發(fā)現(xiàn)證實,聽覺皮層通過區(qū)域特異的頻譜時域調(diào)諧機制,實現(xiàn)了對復(fù)雜聲景的層次化解析,其中低階聲學(xué)特征調(diào)諧差異足以解釋雪貂聽覺系統(tǒng)的大部分不變性特征。

 
圖 3. 簡單的頻譜時間調(diào)諧解釋背景不變性的空間組織
 
(A)兩階段濾波器組(即頻譜時間模型)的呈現(xiàn)。耳蝸圖(為示例前景音和背景音所示)通過一組頻譜時間調(diào)制濾波器進行卷積。(B)在頻譜時間調(diào)制空間中,前景音和背景音的能量,對所有頻率箱進行平均。(C)在完整的聲學(xué)特征空間(頻率時間調(diào)制頻譜調(diào)制)中,前景音和背景音之間的平均能量差異。(D)我們使用從 A 中呈現(xiàn)的頻譜時間模型得到的聲音特征,通過嶺回歸預(yù)測體素的時間平均反應(yīng)。因此,對于每個體素,我們獲得一組頻率和頻譜時間調(diào)制特征的權(quán)重,以及對所有聲音的交叉驗證預(yù)測反應(yīng)。(E)MEG 的平均模型權(quán)重。(F)基于擬合模型的偏好頻率、時間和頻譜調(diào)制圖。為計算每個特征的偏好值,我們對權(quán)重矩陣在其他兩個維度上進行邊緣化處理。(G)每個非初級區(qū)域(dPEG 和 VP)與初級區(qū)域(MEG)體素的權(quán)重平均差異。(H)每個 ROI 內(nèi)調(diào)諧至低(<8Hz)或高(>8Hz)時間調(diào)制率的體素的背景不變性(左)和前景不變性(右)。***:通過對每個動物體內(nèi)素的調(diào)諧進行置換檢驗,比較調(diào)諧至低速率和高速率的體素在動物間的平均背景不變性,p <= 0.001。
 
圖 4. 聽覺處理模型預(yù)測雪貂聽覺皮層的層級差異
 
與圖 2 相同,但使用來自頻譜時間模型的交叉驗證預(yù)測結(jié)果。(A)示例體素(左:初級;右:非初級)對混合音和單獨呈現(xiàn)的前景音的預(yù)測反應(yīng)。每個點代表體素對前景音(x 軸)和混合音(y 軸)的預(yù)測反應(yīng)。r 表示皮爾遜相關(guān)系數(shù)值。上方的圖顯示示例體素所在切片的預(yù)測不變性值,疊加在代表基線 CBV 的解剖學(xué)圖像上。示例體素用白色方塊標記。(B)預(yù)測的背景不變性圖,定義為對混合音和單獨呈現(xiàn)的前景音的預(yù)測反應(yīng)之間的相關(guān)性。(C)體素間預(yù)測的與測量的背景不變性的分箱散點圖。每條線對應(yīng)一只動物,使用 0.1 個測量不變性箱。(D)每個 ROI 的預(yù)測背景不變性。十字符號(+)表示跨動物的每個 ROI 所有體素的中值;疑珗A點表示每個動物的初級(MEG)和非初級(dPEG + VP)體素的中值。每個圓點的大小與計算中值所依據(jù)的體素數(shù)量成正比。較粗的線對應(yīng)示例雪貂 L。:p <= 0.05;**:通過對每個動物體內(nèi)素的 ROI 標簽進行置換檢驗,比較動物間 ROI 對的平均預(yù)測背景不變性,p <= 0.001。(E-H)與 A-D 相同,但為預(yù)測的前景不變性,即比較對混合音和單獨呈現(xiàn)的背景音的預(yù)測反應(yīng)。

背景音不變性的物種差異
通過跨物種比較,揭示了聽覺系統(tǒng)處理背景音不變的顯著物種差異。
雖然人類和雪貂的聽覺皮層都表現(xiàn)出從初級區(qū)到非初級區(qū)背景音不變性增強、前景音不變性減弱的層次化模式,但其神經(jīng)機制存在本質(zhì)區(qū)別。在雪貂中,簡單的頻譜時域調(diào)諧特征(如時域調(diào)制速率)足以解釋大部分不變性差異;而在人類聽覺皮層,同樣的模型僅能解釋約23%的背景音不變性變異,且完全無法預(yù)測前景音不變性特征(r=-0.17)。這種顯著的模型性能差距表明,人類聽覺系統(tǒng)可能進化出了更復(fù)雜的高階處理機制,特別是在非初級皮層區(qū)域,這些機制可能涉及對語音、音樂等復(fù)雜聲學(xué)特征的專門化處理。研究結(jié)果不僅證實了聽覺系統(tǒng)層次化處理的跨物種保守性,更揭示了人類特有的高級聽覺認知功能可能依賴于超越簡單聲學(xué)特征分析的神經(jīng)計算機制,為理解聽覺處理的進化提供了重要啟示。

 
圖 5. 頻譜時間模型難以預(yù)測人類的背景不變性
 
(A)我們使用一個類似實驗的數(shù)據(jù)集(Kell & McDermott, 2019)重復(fù)了我們的分析,該數(shù)據(jù)集測量人類聽覺皮層的 fMRI 反應(yīng)。我們比較了初級和非初級聽覺皮層的反應(yīng),如 Kell & McDermott(2019)所劃分。(B)示例體素(左:初級;右:非初級)對混合音和單獨呈現(xiàn)的前景音的反應(yīng)。每個點代表體素對前景音(x 軸)和混合音(y 軸)的反應(yīng),取重復(fù)測量的平均值。r 表示皮爾遜相關(guān)系數(shù)值。(C-D)每個 ROI 的背景不變性量化結(jié)果,包括測量的反應(yīng)(C)和來自頻譜時間模型的預(yù)測反應(yīng)(D)。十字符號(+)表示跨被試的每個 ROI 所有體素的中值;疑珗A點表示每個 ROI 和每個被試的中值。每個圓點的大小與計算中值所依據(jù)的(可靠)體素數(shù)量成正比。(E)體素間預(yù)測的與測量的背景不變性的分箱散點圖。每條線對應(yīng)一名被試,使用 0.1 個測量不變性箱。(F-I)與 B-E 相同,但為前景不變性,即比較對混合音和單獨呈現(xiàn)的背景音的預(yù)測反應(yīng)。

研究總結(jié)
該研究通過功能超聲成像(fUSI)技術(shù),揭示了雪貂聽覺皮層對自然聲音混合的分層編碼機制:從初級到高階區(qū)域,背景不變性逐漸增強。研究發(fā)現(xiàn),這種分層結(jié)構(gòu)可通過低頻聲學(xué)特征調(diào)諧解釋,但在人類聽覺皮層中需依賴更高階機制。這一成果不僅證實了跨物種聽覺處理的保守性原則,還揭示了人類聽覺系統(tǒng)的獨特性,為理解復(fù)雜聲景中的聲音分離提供了重要線索,對聽覺神經(jīng)科學(xué)和跨物種比較研究具有深遠意義。
 
參考文獻
Landemard Agnès, Bimbard Célian, Boubenec Yves (2025) Hierarchical encoding of natural sounds mixtures in ferret auditory cortex. eLife 14:RP106628. https://doi.org/10.7554/eLife.106628.1
 
想要獲取本篇文獻的老師同學(xué)們,可以拉到文末掃碼添加禮智小客服哦!

 
發(fā)布者:禮智生物科技有限公司
聯(lián)系電話:18260099904
E-mail:info@leads-tech.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com