免费论文-时空动力学表征连续说话和听力的频谱连通性分布
抽象
语音产生和感知是人类认知的基本过程,两者都依赖于复杂的处理机制,而这些机制仍然知之甚少。在这里,我们通过使用脑磁图(MEG)来研究这些过程,以全面映射大脑内区域大脑活动的连通性,以及在连续说话和聆听期间与语音包络的连接。我们的研究结果不仅揭示了两个过程的部分共享神经底物,而且还揭示了空间,延迟和频率的解离。运动和额叶区域的神经活动与δ带(1至3 Hz)的后续语音耦合,而θ范围内的耦合在说话过程中跟随颞区的语音。神经连接结果显示,在说话过程中,不同频段的自下而上和自上而下的信号分离。在这里,我们展示了用于自下而上和自上而下信令的特定频率连接通道支持连续说话和收听。这些发现进一步揭示了参与语音产生和感知的不同大脑区域之间的复杂相互作用。
数字
Fig 7Fig 8Fig 9图1图2图3Fig 4Fig 5Fig 6Fig 7Fig 8Fig 9图1图2图3
引文: Abbasi O, Steingr?ber N, Chalas N, Kluger DS, Gross J (2023) 时空动力学表征了连续说话和听力的频谱连通性特征。公共科学图书馆生物学21(7): e3002178. https://doi.org/10.1371/journal.pbio.3002178
收到: 6月 2023, 31;接受: 2023月 21, 2023;发表: <>月 <>, <>
版权所有: ? 2023 阿巴西等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 示例数据集和紧靠数字下方的数值可在 https://osf.io/9fq47/ 中找到。但是,原始数据受数据隐私法保护,无法广泛提供,但可以根据合理要求提供(受这些隐私法的约束)。本研究使用的代码可在 https://osf.io/9fq47/ 获得。
资金: 这项工作得到了明斯特医学院跨学科临床研究中心(IZKF)的支持,授权号Gro3/001/19(JG),EFRE,授权号EFRE-0400394(OA),德国研究基金会,授权号GR 2024/5-1;GR 2024/11-1;GR 2024/12 -1 (JG) 和 KL 3580/1-1 (DSK)。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。OA和NS由EFRE-0400394和GR 2024/5-1支付。DSK由KL 3580/1-1,GR 2024/12 -1和Gro3/001/19支付。
竞争利益: 提交人声明不存在相互竞争的利益。
缩写: 惩 教 署 交叉光谱密度;戴, 定向不对称指数;EF5, 离散傅里叶变换;脑电图 脑电图;肌电图, 肌 电 图;GLM, 一般线性模型;ICA, 独立成分分析;IFG, 额下回;LCMV, 线性约束最小方差;LSTG, 左颞上回;梅 格 脑磁图;米 互信息;SSP, 信号空间投影;STG, 颞上回;SVD, 奇异值分解
介绍
在流畅的对话中轮流进行通常非常高效和快速。在自然对话中,转弯之间的间隙分布在200毫秒时达到峰值,这令人惊讶,因为在启动的图片命名任务中生成一个单词大约需要600毫秒[1]。莱文森认为,这种效率只有在预测理解中才有可能,在对话者完成轮到他们之前计划语音产生。与预测类似,弗里斯顿和弗里斯将人类交流描述为两个动态系统,它们通过感官信息耦合,并通过最小化预测误差根据主动推理原理运行[2]。在这种沟通理论中,语音产生由说话人的预测处理模型控制,该模型允许例如根据本体感觉和听觉反馈调整语音音量、速度或发音。在听众的大脑中,听众的预测处理模型将生成有关即将到来的语音的时间和内容的预测,并且这些预测会不断更新并与传入的感官信息进行比较。该模型意味着预测处理参与言语感知和言语产生,因此,这两种认知过程的部分共享神经基质[2]。
与该模型一致,先前的研究表明,与被动倾听相比,自发语音引起的听觉诱发大脑活动减少[4-6]。自发语音允许说话者准确预测预期的听觉输入,用于抑制自身运动行为的预期感官后果(称为感觉衰减)。有趣的是,当说话者在其声学特性实时改变后听到自己的声音时,这种抑制就不存在了[7]。在这种情况下,扬声器听觉系统的声学感觉输入偏离了预测的输入。这种预测误差反映在听觉皮层活动中,类似于响应被动感知语音的活动。
然而,在人脑中,这些预测过程以不同的延迟运行[8,9]:本体感觉和其他感觉信息到达大脑的延迟由传导速度和与大脑的距离决定。内部处理也需要时间,执行纠正电机命令也需要时间。这些延迟可能需要对预测处理模型进行不连续的有节奏的操作。这种节律模式已经在视觉运动系统中得到证明。例如,从小脑-丘脑-皮质环内以约6-9Hz的速率调整缓慢的精密运动[9]。
同样,在语音产生中,首选频率也很明显。音节通常以每秒约5个的速度产生,这与语音包络的调制速率一致[10]。因此,这种典型的速率在对话者之间建立了一个沟通渠道,对话者可以期望以这种特定速率接收音节。这种对齐[3]有助于预测,因为它在说话者和听众的预测处理操作之间建立了时间耦合。
关于这些模型的神经基质,人脑的预测与脑节律有关[11,12]。脑节律是神经元活动的节律性波动,可通过EEG或MEG无创记录,并与注意力、知觉和记忆等认知过程有关[13,14]。更具体地说,视觉领域的研究表明,预测主要在低频段(alpha、beta)进行通信,而预测误差则以较高的伽马频率进行通信[15-17]。
在听觉领域,已经在连续的语音感知过程中研究了大脑节律。这些研究中的一个一致发现是,用MEG或EEG测量的频率特异性大脑活动在时间上与连续语音中的部分节律幅度变化(例如,调制速率)保持一致。这种对齐被认为是由语音波形中的声学边缘(例如元音能量的开始或峰值)引发的,这导致听觉皮层中正在进行的振荡的相位重置[18]。由于这种阶段重置,大脑活动将在时间上与语音中的准节奏结构保持一致。在脑电图数据中,这反映在语音包络与听觉皮层大脑活动之间存在显著的互相关或连贯性[19]。
由于低频脑节律代表潜在神经元群的周期性兴奋性变化[14,20],因此可以优先处理到达持续振荡最佳阶段(对应于高兴奋性)的刺激,而到达相反阶段(低兴奋性)的刺激甚至可能仍未被发现[21].因此,在连续语音处理的上下文中,对齐被认为会导致连续输入流的有节奏采样或离散化为段,从而为传入信息的预测服务,从而进一步处理。事实上,对于可理解和有人参与的语音,时间对齐似乎更强,正如我们的小组[19]以及其他小组[22-25]之前所显示的那样。我们之前的MEG研究[12]可以直接证实,与难以理解的语音相比,高阶大脑区域(左额下回和左侧运动区域)对听觉皮层的因果影响明显更强。综上所述,这些研究表明,大脑节律协调了与连续语音处理相关的预测过程。
这个相对较新的言脑耦合领域几乎完全专注于听众大脑中的语音处理,而在很大程度上忽略了说话者大脑中的语音产生。因此,生成语音-大脑夹带研究中使用的连续语音刺激的语音生产系统迄今为止尚未整合到连贯的方法和概念框架中。因此,我们对大脑频率特定动力学在语音产生中的作用及其与语音中准节奏成分的关系以及它与语音感知的区别知之甚少。在这里,我们使用言脑耦合的实验和分析方法来研究语音产生,并直接将其与语音感知进行比较。具体来说,对于语音 - 大脑耦合,我们指的是使用连续语音(而不是单个单词)和分析技术的实验范式,这些技术专门捕获大脑活动与有节奏的语音成分(例如,音节速率)的时间对齐。目的是解开语音生产的动态网络,重点关注它如何参与语音的准节奏成分 - 例如音节生产。
我们的研究建立在先前研究的基础上,该研究表明,语音产生由大脑区域的分布式网络支持,包括前额叶、运动、体感、听觉和联想区域[8,26-29]。我们对这个网络的了解很大程度上依赖于fMRI[30]和病变研究[31]。最近,侵入性[28,29,32]和非侵入性[26,33]电生理研究通过利用其优越的时间分辨率为该领域做出了贡献。然而,侵入性记录只能从患者选定的记录位点提供有限的空间覆盖范围。MEG / EEG可能会克服这一限制,但它遭受与运动和肌肉相关的信号污染。因此,到目前为止,无创电生理学研究主要集中在单个单词或音节的产生[4,5,34,35]或语音产生的准备阶段[27,36]。
到目前为止,只有极少数研究研究大脑频率特定动力学与语音产生之间的功能联系。Ruspantini及其同事[37]指导参与者以不同的频率执行音节重复任务。他们发现运动皮层的MEG活动和唇部肌肉的肌电图(EMG)活动之间存在显着的一致性,峰值约为2至3 Hz。虽然这项研究是基于无声的语音,但Alexandrou及其同事使用了自发产生的公开语音[38]。他们用肌电图记录肌肉活动,并依靠仔细的数据清理,包括独立成分分析(ICA)来去除与嘴部运动相关的伪影。最后,他们分析了实验任务(例如连续语音与音节重复的语音产生)之间特定频段的幅度差异。这种统计对比揭示了双侧颞叶、额叶和顶叶大脑区域的高频带调制(60 至 90 Hz)。这项研究很好地证明了用MEG研究自然语音产生的可行性。它还提供了进一步的证据,证明大脑振荡是大脑区域参与语音生产任务的敏感标志。
专门研究连续语音产生过程中的言脑耦合的研究更少。一项脑电图研究在超扫描实验中很好地证明了这种时间耦合,但没有量化言语伪影对结果的影响,也没有确定相关的大脑区域[39]。在一项后续研究中,同一组研究表明,在25ms的负滞后(即语音包络之前的EEG信号)下,自发语音的包络与说话人的EEG信号耦合最大[40]。对于听力,在大约100 ms处观察到最大耦合,与其他研究一致[19]。Bourguignon及其同事用MEG研究了阅读过程中的言脑耦合[41]。他们报告说,在对应于短语(<1 Hz),单词(2至4 Hz)和音节(4至8 Hz)的频率下,扬声器中存在显着的言脑耦合。
为了使用MEG / EEG方法研究语音产生,去除诱导的与语音相关的运动伪影至关重要。最近,我们表征了头部运动对语音生成过程中记录的MEG数据的影响[42]。在同一项研究中,我们还提出了一种基于回归分析和信号空间投影(SSP)的伪影抑制方法,以从记录的MEG数据中删除诱导的头部运动伪影,并使当前研究可行。
总之,目前的研究旨在通过解决以下问题来识别涉及连续说话和倾听的大脑网络,并探索与实验条件相关的神经相关性:
首先,在说话过程中,大脑活动在什么地方和什么频率与语音包络显着耦合?其次,在说话过程中,大脑活动在什么地方和什么频率导致或滞后语音包络?第三,口语和听力之间的言脑耦合有何不同?第四,大脑连接差异如何支持口语和听力之间的差异?
我们通过在口语和听力过程中录制MEG来解决这些问题。我们记录了30名参与者的MEG数据,他们回答了7个问题(每个问题60秒;说话条件),并听取了他们上一次演讲中自己声音的录音(听力条件;有关详细信息,请参阅方法)。我们使用多元延迟互信息(MI)对多锥度光谱估计进行了量化的言脑耦合,与其他各种方法相比,该估计已被证明具有较高的灵敏度和特异性[43,44]。我们分几个连续的步骤进行了分析。首先,我们描述了在连续语音过程中与语音包络显着耦合的大脑区域以及支持这种耦合的频率频谱。接下来,我们解离大脑活动与语音包络显着耦合的皮质区域,分别具有正滞后或负滞后。然后,我们转向说话和听力条件的统计比较,以确定皮质语音生产和感知网络的异同。我们的下一步是确定大脑网络和该网络中的定向连接,以支持听力和口语的认知操作。因此,我们使用多元格兰杰因果关系直接测试了语音产生和感知过程中自上而下和自下而上的信号的特定频率通信通道。我们的言脑耦合结果将语音包络之后的时间区域(在θ范围内)与语音包络之前的额叶和运动区域(在δ范围内)分开。此外,我们的连接结果表明,将电机等较高区域连接到上颞回(STG)的反馈信号代表预测并通过慢节奏(低于40 Hz)进行通信,而前馈信号(反向)可能代表预测误差,并通过更快的节奏(高于40 Hz)进行通信。
结果
我们分析的第一步是确定参与语音产生和感知的皮层网络。我们要注意的是,我们对语音产生和听力网络的描述特指言脑耦合,即我们描述了神经活动(在说话或倾听期间)与语音包络显着耦合的区域网络。我们的方法(除了分析频谱功率和格兰杰因果关系)对从事与语音包络不同步的说话或听力相关神经过程的其他大脑区域不敏感。
语音制作网络
我们的分析在具有230个区域的皮质包裹上进行[45]。对于每个宗地,对宗地中所有体素和所有3个源方向的波束形成器派生时间序列进行奇异值分解(SVD),并将3个最强分量用于多元MI分析[46],语音包络在变换到频域后(参见图1以及方法了解详情)。换句话说,每个包裹中的神经活动由解释大部分方差的 3 个时间序列表示,我们量化了与多变量 MI 的语音包络的同步程度。为了捕获语音之前或之后的神经过程,我们计算了语音包络和神经活动之间的52个等间距延迟的MI,范围从-1到1 s,频率在1 Hz到10 Hz之间。 请注意,我们专注于高达10 Hz的频率范围内的耦合,因为先前的研究表明,该范围内的语音包络频率对于理解很重要[47,48]。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. 方法管道。
(a)参与者(n = 30)回答了7个给定的问题(每个问题60秒;条件#1),并在录制MEG数据时收听了先前会议中自己声音的录音(条件#2)。从连续语音信号中提取幅度包络(见方法)。(b)从记录的MEG数据中删除了人工制品[42]。单个MRI用于估计每个参与者的源模型,这些模型值到模板体积网格。根据人类连接组项目的包裹,将皮质区域划分为230个解剖学包裹[45]。(c) 对每个包裹,提取估计的源时间序列,并对前3个SVD组件进行多锥度光谱分析。然后,我们估计了语音包络和所有 3 个时间序列 (I) 的复值频谱估计之间的 MI。接下来,使用块方法,我们将每个宗地的前 3 个 SVD 分量视为一个区块,并使用多元非参数格兰杰因果关系法 (mCG;II) [49]。最后,我们使用相关性分析(III)评估了定向连接性与言脑耦合之间是否存在关系。LSTG,左颞上回;脑磁图,脑磁图;MI,互通信息;SVD,奇异值分解。
https://doi.org/10.1371/journal.pbio.3002178.g001
图2显示了说话过程中言脑耦合的统计对比,与每个包裹和参与者的代理数据的95个百分位数相比。对每个频率和延迟进行了统计分析(并在这些维度上进行了FDR校正)。该图显示了每个有效宗地随时间和频率变化的有效 t 值之和。与语音包络的耦合可以在以听觉和运动区域为中心的扩展大脑区域网络中看到,并延伸到两个半球的下颞区、下额叶区和顶叶区。在已知支持言语产生的颞上和腹侧运动以及前运动区域观察到最大值[34,43,44](参见S1图,了解言语感知条件下的言脑耦合)。在开始对可以用MEG解析的动态神经模式进行更详细的分析之前,我们旨在评估MEG结果的定位准确性。与来自 neurosynth.org 的语音生成网络的自动fMRI荟萃分析进行综合比较,显示出与我们的结果非常吻合。事实上,我们的语音生产网络与神经合成器语音生产网络非常相似,并且明显优于神经合成语音感知网络,鉴于语音产生和语音感知网络的非常相似,这令人惊讶(见S2图)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 说话过程中的言脑耦合。
皮质图表示每个包裹中语音包络和大脑活动之间的多变量MI的组统计信息,与替代数据的第95个百分位数相比。颜色代码表示延迟和频率上所有有效 T 值的总和(FDR 在延迟(?1 到 1 秒)、频率(1 到 10 Hz)和包裹上校正)。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。MI,相互信息。
https://doi.org/10.1371/journal.pbio.3002178.g002
接下来,我们旨在区分在负滞后(大脑活动先于语音包络)时与语音包络耦合更强的大脑区域与在正滞后时耦合更强的区域(大脑活动遵循语音包络)。负滞后反映了运动/语音计划和运动命令激活发音器的过程,而正滞后反映了自我生成语音的感觉处理。超出初级运动皮层的负滞后耦合结果支持预测处理模型在预测运动程序和预期语音输出的感觉后果中的作用。相反,正滞后耦合可能表示由先前预期(预测)和实际听觉输入之间的不匹配定义的预测误差计算。
图3显示了正延迟和负延迟的显著t值之和之间的相对变化(图3A)。紫色表示与正滞后相比,负 t 值较高的区域,而红色表示正滞后的影响更强。我们的结果显示,额叶和运动皮层存在明显的时间梯度,其中与语音包络的耦合在语音后的负滞后到语音后的时间和颞顶区域更强。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 说话过程中不同大脑区域和频率箱的言脑耦合。
(a) 正延迟和负延迟的显著 t 值之和之间的相对变化。紫色表示与正滞后相比,负 t 值较高的区域,而绿色表示正滞后的影响更强。(b) 每个频率箱以及分别代表电机和时间区域的 L4 和 LSTG 宗地在正(绿色)和负(紫色)延迟上的平均有效 t 值的频谱。误差线表示标准误差平均值。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。LSTG,左颞上回。
https://doi.org/10.1371/journal.pbio.3002178.g003
到目前为止,分析只集中在与自我产生的语音包络同步的大脑区域的空间分布上。然而,图3A所示的语音-脑耦合可以由不同的频段支持。因此,我们计算了正(红色)和负(紫色)延迟、每个频率箱以及分别代表电机和时间区域的L_4和L_A5(图 3B)宗地的平均显著 t 值。结果表明,δ语音-脑耦合在负滞后(额叶和运动区域言语前的同步活动)占主导地位,而θ语音-脑耦合在正滞后(顶叶和颞区言语后的同步活动)占主导地位。
接下来,我们旨在通过绘制每个大脑区域的言脑耦合的最佳延迟来完善图 3 中显示的结果。该分析再次基于频率和延迟的统计图。我们计算了每个区域在每个延迟和频率下语音 - 大脑耦合与全局语音 - 大脑耦合(在所有大脑区域平均)的相对变化(见方法)。图4显示了滞后(在?1 s和1 s之间),其中跨频率平均的相对变化最大。选择这一程序是为了增强与一般总体概况的局部偏差,并且它清楚地将负滞后的额叶和运动区域与正滞后的大多数时间区域分开。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. 言脑耦合,用于说话过程中的不同延迟。
皮质图表示语音包络和大脑活动之间的延迟,其中两者之间的耦合是最大的。紫色表示负延迟(讲话前的大脑活动),绿色表示积极的延迟(说话后的大脑活动)。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.g004
口语与听力
在表征了说话的言脑耦合特征后,我们综合分析了说话和听力条件之间言脑耦合的异同。首先,为了量化相似性,我们计算了每个包裹和参与者的听力和口语条件的延迟MI(延迟范围从-1秒到1秒)的相关性。图5A显示了这些相关性在2 Hz(代表δ频段)和6 Hz(代表θ频段)处的组水平皮质图。在整个皮层中,在双侧颞上运动区和下运动区的δ带上,可以在多变量言语 - 脑MI依赖于延迟的条件之间的最高相似性。图5B还显示了所有包裹的滞后MI和频率为1至10 Hz的延迟的费舍尔Z变换相关性的平均值。这些结果证实,在2 Hz处发现条件之间的相似性最高。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图5. 比较说话和听力条件之间的言脑耦合。
(a) 三角洲 (2 Hz) 和θ (6 Hz) 处每个包裹的说话和听力之间的滞后 MI 相关性。颜色条说明了参与者之间费舍尔 Z 变换相关性的平均值。(b) 所有包裹的滞后MI和频率为1至10 Hz的延迟的费舍尔Z变换相关性的平均值。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。MI,相互信息。
https://doi.org/10.1371/journal.pbio.3002178.g005
谈到两种条件之间的差异,我们显示了几个结果,这些结果基于跨延迟(?1 s至1 s)和频率(1至10 Hz)的单一统计分析(口语与听力的相关样本t检验),同时校正频率,延迟和包裹的多重比较(参见方法)。结果,我们获得了每个包裹、频率和延迟的 t 值。首先,我们区分了与听力相比,在说话过程中(在所有延迟中)显示更强或更弱的言语-大脑耦合的大脑区域。图6显示了所有延迟和频率上显著的正(图6A)和负(图6B)t值的总和。说话时与语音包络的耦合明显更强,位于左右运动区以及左下额叶和颞上区。我们对眶额叶和前颞耦合的解释持谨慎态度,这可能是由于残留说话伪影(如下颌运动)造成的,因为这种耦合在最靠近关节的图谱包裹中最强。相比之下,在双侧听觉、额下、颞、(前)运动和颞顶区域观察到,与说话相比,听力期间的言脑耦合更强。比较图a和b似乎表明,与说话相比,说话的额叶区域左侧偏侧化更强,与说话相比,听力的颞叶皮层右侧化。因此,我们进行了统计分析,以检测口语和听力状况是否存在显着的言脑耦合偏侧化。我们的结果表明,说话条件没有明显的侧向化。然而,在聆听条件下,我们观察到右侧的耦合明显更强,与左侧颞区相比(见S3图)。此外,两张图(图6A和6B)都显示出一些重叠,特别是在运动皮层,颞上和额下区域。这不是一个矛盾,而只是表明在不同的延迟或频率下,同一解剖区域存在显着的负和正t值(在S2图中可以看到不同延迟(从-5到600ms)在delta(600 Hz)和θ(4 Hz)下说话与听力中的言脑耦合的更详细比较)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图6. 口语与听力中言脑耦合的统计比较。
(a)积极效果的统计对比(说>听)。(b) 负面影响的统计对比(口语<听力)。(c) 所有有效t值上平均的统计对比度的频率延迟曲线。(d) 5赫兹和0毫秒处t值的空间分布。请注意,在a和b的膨胀脑表面上仅绘制了有效t值的总和(p < 0.05)。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.g006
图6C确实支持这一点,它显示了通过对所有大脑区域的所有有效t值求平均值而获得的频率延迟图。该图说明了语音 - 大脑耦合的频谱延迟曲线,比较了说话和听力。一般来说,言脑耦合在负滞后(语音包络之前的大脑活动)时说话比听更强,在听力时比在正滞后说话更强。这是意料之中的,因为说话需要预先预测运动程序的预测过程,以及言语在负滞后发生的预期感官后果。同样,在说话过程中,来自初级运动皮层激活发音器的运动命令位于语音包络之前。此外,与被动聆听条件相比,自生成语音会导致听觉处理减弱[4,5]。这种反转(在0 ms之前和之后从正到负)在三角波段(1至3 Hz)中很突出。然而,在θ频段(约5 Hz)中可以看到最强的说话优势,在0毫秒之前出现负滞后。 图6D显示了5 Hz和0 ms处t值的空间图,并揭示了与(前)运动中听力相比,语音 - 大脑耦合在说话中的左侧化优势, 左额叶和颞脑区。由于θ频带对应于音节速率[10],因此该结果表明,与听力相比,这些区域中与音节相关的活动在说话中更精确地锁定在语音包络上。
口语和听力中的定向信息流
在建立了口语和听力中的多变量、特定频率的语音-大脑耦合后,我们接下来研究了连续说话和听力过程中预测处理模型的特征。具体来说,我们测试了在视觉中建立的预测编码模型,并分别假设在低频段与高频段中自上而下和自下而上的信号通信。为此,我们使用多元非参数格兰杰因果关系(mGC)计算了左颞上回(LSTG;S5图中描述)作为皮质语音网络中的中心节点与所有其他皮质包裹的连接性[15,49]。我们选择了多元格兰杰因果关系,首先,与我们的多元言脑耦合分析保持一致,其次,通过使用每个包裹活动的三维表示来获得更准确的连通性估计,与更传统的一维表示相比,捕获更多的信号方差。
计算STG和每个皮质包裹之间的mGC导致每对反射两个方向(A->B和B->A)的mGC光谱。接下来,我们计算了每对光谱的定向不对称指数(DAI)[2]。DAI是两个方向之间的相对差异,因此捕获了15个包裹之间mGC的主要方向(有关更多信息,请参见“方法”)。正 DAI 反映从一个宗地到 STG 的主要方向性,而负 DAI 反映相反的方向性(从 STG 到另一个宗地)。
首先,我们使用组统计来识别说话条件下特定频段的DAI值与零显着差异的大脑区域。我们对以下典型频段进行了组统计:δ(0至4 Hz),θ(4至8 Hz),α(8至12 Hz),β(12至30 Hz),伽马(30至60 Hz)和高伽马(60至90 Hz)。在图 7A 和 7B 中,颜色编码 t 值。紫色代表从STG到其他皮质包裹的信息流,绿色代表相反的方向。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图 7. 连通性分析。
(a) 在θ和高伽马频段的语音产生过程中,STG与其他皮质包裹之间的显着连接。使用基于聚类的排列测试来检测重要的连接模式。颜色代码 t 值。紫色代表从STG到其他皮质包裹的信息流,绿色代表相反的方向。(b) 在θ和高伽马频段的语音感知过程中,STG与其他皮质包裹之间的显着连接模式。分析和颜色编码对应于图a。 (c) θ波段说话和听力条件之间的连接模式比较。使用基于集群的排列测试来检测说话和听力条件之间所有皮质包裹与STG的显着连接差异。颜色代码 t 值。(d)左运动皮层和LSTG以及LP和LSTG之间的个体光谱分辨DAI。请注意,仅在膨胀的大脑表面上绘制了显着值(p < 0.05)。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。DAI,定向不对称指数;LP,左顶;LSTG,左颞上回;STG,颞上回。
https://doi.org/10.1371/journal.pbio.3002178.g007
聚类统计显示,在较低频段(例如θ)和较高伽马频率的相反方向上,从运动皮层(包括中央前回和上/中额回)与STG说话时具有显着的连通性(图7A)。这种惊人的反转表明,在不同频段的讲话过程中,自下而上和自上而下的信息流出现了分离。自上而下的信令主要在较低频段进行通信,而自下而上的信令依赖于高频频段(所有频段见S6图)。
与说话相比,聆听条件显示出总体相似的模式,包括θ和伽马频率之间的方向性反转(图7B)。然而,与说话相比,θ波段中的自上而下效应和伽马波段的自下而上效应在听力中都不太明显。通过直接比较口语和听力之间的 DAI 连接性来证实这一点。
图7C显示了θ带中这两种情况之间的显着连接差异,并说明了与听力相比,说话中额叶/运动皮层与STG的自上而下的信号明显更强,与说话相比,听力中STG与前颞叶皮层的耦合明显更强。有趣的是,我们的连接结果表明,在说话过程中,不同区域对LSTG的自上而下效应发生在不同的低频段(所有频段见S2图)。图7D表明,从运动皮层到STG的最强自上而下的连接发生在θ(7至4 Hz)和β(8至12 Hz)频率,而从左顶叶到STG的α频率(30至8 Hz)。最后,尽管在说话过程中,STG与高伽马波段的运动区域有更强的自下而上的连接(与听力相比,图13D),但没有观察到显着差异。
图7中,低频自上而下连接和高频频段自下而上连接的一般模式在多个连接中是一致的。因此,我们进行了专门的分析,并特别比较了低频范围(0至30 Hz)与高频范围(60至90 Hz)从皮质包裹到LSTG的连接模式。我们统计比较了说话和听力条件下低频范围内所有皮质包裹体与高频范围内的DAI值。正如我们根据图7所预期的那样,运动区域在说话条件中表现出最强的显着差异,证实了额叶和运动皮层在低频下与LSTG的连接,在高频下则相反(图8)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图8. 所有宗地与 LSTG 之间的低频与高频连接。
在口语(a)和听力(b)条件下,将频率范围0–30 Hz的DAI值与频率范围60–90 Hz的DAI值进行比较。颜色代码 t 值。紫色表示高频下较强的连接性,绿色表示低频下较强的连接性。请注意,仅在膨胀的大脑表面上绘制了显着值(p < 0.05)。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。DAI,定向不对称指数;LSTG,左颞上回。
https://doi.org/10.1371/journal.pbio.3002178.g008
最后,我们旨在将分析的两个主要部分联系起来,即言脑和脑-脑连接。具体来说,我们研究了从所有其他皮质包裹到STG的连接模式与语音-STG耦合之间的关系。因此,我们将参与者的自上而下的连接指数和MI值(在STG和语音之间)相关联。我们分别计算了每个包裹的相关性,以及说话和收听条件的不同频段的相关性。该分析显示,对于说话条件,双侧运动区和左额叶区域的自上而下的β连接与θ带(滞后2 ms)的语音-STG耦合之间存在显著的负相关关系(图130A;p < 9.0)。然而,在聆听条件下和05毫秒滞后的语音-STG耦合中都没有观察到这种相关性(图0B和9C)。此外,我们在θ频率范围(9 ms滞后)的每个频率箱中进行了自上而下的beta连接和语音-STG耦合之间的相关性分析,揭示了一个惊人的模式。对于低θ频率,自上而下的β连接与语音-STG耦合的负相关在顶叶和运动区域是显着的(图130D)。随着θ波段频率的增加,这种效应转移到额叶区域。这种转变在下额叶和中额叶区域最为明显,在这些区域,在低θ频率下不存在显着的簇,但在高θ频率中存在(而上额叶簇在很大程度上与频率无关)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图 9. 自上而下的气相色谱和MI之间的相关性分析。
(a) θ范围内的语音-STG 耦合(正滞后:130 ms)与说话条件下双侧运动区域和左额叶区域的自上而下的 beta 连接呈负相关。在听力条件(b)以及延迟为0毫秒的说话条件(c)中,这种效果基本上不存在。(d)在θ范围内的每个频率箱中,对自上而下的beta连接和语音-STG耦合进行了相关性分析。来自双侧运动区域的自上而下的β连接与下θ带(4-6 Hz:第一行和第二行)的语音-STG耦合呈负相关。然而,在左额叶区域的自上而下的β连接与高θ带(6-8 Hz:第三和第四行)的语音-STG耦合之间观察到这种相关性。(e) 源自双边运动区域的自上而下的低 β (12-20 Hz) 连接与低 theta 语音-STG 耦合呈负相关。然而,源自左额叶区域的自上而下的高β(20-30 Hz)连接与高θ波段的语音-STG耦合呈负相关。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。MI,互通信息;STG,颞上回。
https://doi.org/10.1371/journal.pbio.3002178.g009
最后,我们进一步将自上而下的连通性分为低贝塔波段和高β波段,以测试在说话条件下哪个频率范围更能参与运动-听觉区域的相互作用。我们分离这两个频率通道的主要目的是查看是否有一个不同的频率通道将电机连接到语音制作中的听觉区域。我们观察到,源自双侧运动区域的自上而下的低β(2至12 Hz)连接与低θ语音-STG耦合呈负相关(图20E,左图)。然而,源自左额叶区域的自上而下的β(9至20 Hz)连接与高θ波段的语音-STG耦合呈负相关(图30E,右图)。这些结果进一步支持了β带活动和连通性在运动皮层中的重要性[9,50]。由于先前的文献结果,我们的主要假设与β波段有关。然而,跨频段的探索性分析显示,θ范围内的语音-STG耦合与自上而下的δ以及主要来自左枕和顶叶区域的θ连接之间存在显着的负相关(见S51图)。
讨论
在这项研究中,我们旨在确定连续说话和倾听过程中预测过程的神经相关性。由于参与者听了自己以前制作的演讲,他们可能能够预测其内容的某些方面(尽管两次测量相隔几天)。尽管如此,我们还是选择了这种设计,因为这是保证在两种条件下使用相同的刺激材料的唯一方法,这样两种条件的差异就不会是由低水平刺激特征的差异引起的。首先,我们使用多元延迟MI对多锥度频谱估计进行语音-大脑耦合,这种方法最近被证明在模拟和真实数据上表现良好[43]。我们的研究结果揭示了以听觉区域为中心的扩展大脑区域网络与连续语音过程中的语音包络之间的显着耦合。这些耦合结果将语音时间包络之前的额叶和运动区域(在增量范围内)与语音包络之后的大部分时间区域(在θ范围内)分离。此外,在左右运动区以及左下额叶和颞上区,在说话(与听力相比)时,观察到θ范围言脑耦合明显更强。相比之下,在双侧听觉、额下、颞、(前)运动和颞顶区域观察到听力(与说话相比)期间更强的 delta 范围言脑耦合。此外,我们在语音产生和感知过程中使用多变量格兰杰因果关系在涉及区域内研究了有向耦合。有向耦合分析的结果表明,在说话过程中,电机区域与STG在较低频段(最高β)以及高伽马频率下相反方向的显着连接。值得注意的是,在说话条件下检测到的β范围自上而下的连接与θ波段LSTG内的言脑耦合呈负相关。
口语和听力中的言脑耦合
言脑耦合代表准节奏语音成分与促进语音处理的皮质神经活动的节奏调节的对齐[19]。由于先前的研究表明,低于10Hz的语音包络频率对理解很重要,因此在研究的第一部分中,我们专注于频率范围高达10 Hz的耦合[47,48]。我们在低于10 Hz的频率下观察到显着的言脑耦合,揭示了以双侧听觉区域为中心的大脑区域网络在语音产生和语音感知条件下的贡献。这种耦合既往已有几项研究报道[19,38,41,52,53]。在言语产生和感知中双侧观察到检测到的言脑耦合。这一发现与先前的研究一致,表明双侧皮质区域参与言语知觉[54]。Ghinst及其同事发现,LSTG和右幕上听觉皮层都以不同的频率跟踪语音包络[55]。Gross及其同事的另一项研究表明,语音包络的θ相位夹带在双侧听觉区域具有显著意义[19]。在Alexandrou及其同事关于言语产生和感知的报告中也观察到了相同的激活模式。具体来说,他们发现在语音产生过程中,功率调制发生在额中央,顶叶和颞顶区域。然而,言语知觉主要由颞顶皮质和颞皮质介导,右半球成分明显[38]。与以前的研究相反,他们证明言语感知和生产主要在右半球而不仅仅是左半球共享皮质表征。有趣的是,我们还发现,在双边上,两种情况下的下颞运动区和上颞运动区之间的相似性最大。这清楚地表明,这些领域以类似的方式进行口语和听力。此外,右半球更强的相似性可以支持右半球在两种模式下处理语音含义的假设[38]。
此外,我们发现语音产生过程中的潜在神经活动与语音感知期间的神经活动显着不同。与听力相比,我们观察到左右运动区域以及左下额叶和颞上区域之间的耦合更强。这些结果并不令人惊讶,因为语音产生需要对发音和发音进行精细的自愿控制[37,56]。在我们的研究(见S9图)以及早期研究中[38,56,57]中,广泛双侧运动区域的β带功率降低也表明运动区域积极参与语音产生。我们所做的进一步观察是,运动区域的言脑耦合在负滞后时更强,表明在说话条件下言语之前的同步活动。这种负滞后的耦合很可能表明涉及运动准备或参与控制语音发音器的运动信号的表示。运动区域观察到负滞后耦合的另一种解释可能是由于听觉反馈的处理[29]。此外,检测到超出初级运动皮层的负滞后耦合,支持在预期语音输出实际生成之前预测预期语音输出的感觉后果的概念[41,58-60]。此外,最近的另一项研究表明,与聆听相比,大声朗读时言脑耦合增加,这进一步证明大脑会产生自我产生语音的感觉运动表征[41]。由于这种内部监测系统,听觉皮层的皮质反应减弱,因为说话者可以在说出之前准确预测他们所说的话的感觉后果[4-6]。因此,较小的皮质反应可能与听觉皮层中较弱的言脑耦合有关。我们的实验结果支持这一假设,因为双侧听觉皮层中听力条件下的言脑耦合比说话条件下更强。
口语和听力中的定向信息流
我们的多变量连接分析首次确认了在健康参与者的非侵入性录音中连续说话和聆听期间自上而下和自下而上的信号的特定频率通信通道。我们的结果表明,在视觉领域已经证明的通过不同的频率信道实现预测编码在很大程度上推广到听觉运动领域的连续说话和听力。该模型假设沿着皮层层次结构的信号反映了不同的过程:反馈信号代表预测并通过慢节奏(低于40Hz)进行通信,而前馈信号代表预测误差,并通过较快的节奏(高于40Hz)进行通信[13,15–17,61]。
只有少数研究在听觉领域专门测试了这种模型,没有一项研究在连续说话期间进行了测试。此前,Fendolan及其同事在侵入性录音中展示了2例癫痫患者3个层次不同的听觉区域之间不同的前馈和反馈通信频率通道[62]。Sedley及其同事还利用癫痫患者听音调的侵入性录音表明,预测误差以伽马功率表示,而预测以较低频率的β功率表示[63]。在一项针对猴子的ECoG研究中也获得了类似的结果[64]。
我们的多变量连接结果显着地将这些报告扩展到无创记录,在我们的健康参与者中具有全脑覆盖,每个人都参与听力和口语任务。我们专注于与LSTG的定向连接,LSTG是听觉层次结构中的中心节点,用于从语音输入中提取有意义的语言信息[65],允许调查口语和听力期间的前馈和反馈处理。事实上,在口语和听力过程中,从额叶、顶叶和运动皮质到 LSTG 的多元格兰杰因果关系在 30 Hz 以下的频率下明显更强,而在 30 Hz 以上的频率下,相反方向明显更强。这种从低频段到高频段的方向性惊人逆转为上述视觉领域建立的结果提供了听觉领域的支持,即在特定频率通道中选择性地传输前馈和反馈信息。这些发现表明,与“预测编码”框架存在潜在的一致性,该框架会将自上而下的信号解释为预测,将自下而上的信号解释为预测误差。然而,在得出明确结论之前,必须谨慎行事,因为最近的研究引起了人们对自下而上和自上而下的信号通过不同的频率信道进行通信的想法的担忧[66-68]。因此,需要进一步调查以完全确定我们的结果与预测编码框架之间的兼容性程度。此外,还需要进一步的研究来阐明像我们这样具有自然任务的MEG的空间分辨率是否足以在听觉领域重建更详细的功能层次结构,其方式与先前基于强,高对比度刺激的视觉领域的演示一致[17]。
然而,有趣的是,在说话过程中,不同区域对LSTG的自上而下的效应发生在不同的低频段(图7D和S6)。运动皮层在θ(4 至 8 Hz)和 β(12 至 30 Hz)频率处显示最强的自上而下信号,在 delta (<4 Hz) 处显示左下额叶皮层,在 α 频率(8 至 13 Hz)处显示左顶叶皮层。来自运动皮层的θ带连接可能传达了与颞叶皮层说话期间音节(以θ速率产生的音节)的时间。事实上,在聆听过程中,当运动皮层不产生这些音节模式时,这种连接就会减少。相比之下,从运动皮层到LSTG的β波段信号在这两种条件下都同样强。这些信号以前与更新感官预测的过程有关,并且在各种听觉任务中观察到[63,64,69,70],包括连续的言语知觉[71]。我们的相关性结果(在下一节中详细讨论)还表明,自上而下的beta活动通过将语音相关信息传递到听觉区域与预测维护有关。对于伽马频率,DAI反转符号变为负,表明从STG到运动皮层的前馈信号在该频段中占主导地位(图7D)。与听力相比,运动和听觉区域之间的前馈和反馈信号在说话时更强,这表明当语音自我生成时,这两个系统的耦合更强。这与预测模型一致,因为自我生成的语音导致通过低频通道传达到听觉区域的预测感官输入的估计。反过来,听觉输入用于通过高伽马波段的前馈信号更新这些估计。然而,由于我们没有以导致预测特定变化的方式控制或修改我们的刺激材料,我们无法为我们报告的连通性分配更精确的计算角色。
从左顶叶皮层到 LSTG 的连接,非常相似的连接模式表明 gamma 频率下的前馈信号和低频的反馈信号。然而,与运动皮层相比,自上而下的效应使用不同的低频段,即阿尔法。重要的是,听觉系统中的阿尔法节律与注意力控制有关[72,73],并可能作为跨空间、时间和频率维度的感觉输入的多维过滤器[74]。我们的连接结果表明,早期听觉区域中的这些过滤器由顶叶皮层控制和调节,顶叶皮层在听觉和发音语音区域之间的界面上具有独特的解剖学和功能位置。事实上,已知顶叶区域支持感觉运动整合[75,76],在说话过程中代码预测感觉后果,并为早期听觉区域提供自上而下的信号[77]。说话过程中较强的自上而下效应可能表明对内部预测编码模型预测的听觉信号的选择性抑制。事实上,根据我们的连接结果,这种“感觉衰减”(另见下文小节)已被证明反映在α节律[78]中。
额下左回(IFG)对语言理解和产生至关重要,有助于语言预测模型的形成[79]。在一项TMS研究中,Ishkhhanyan及其同事在形容词名词产生任务中靶向左IFG的前部和后部,并证明了该区域对语法和句法正确的语音产生的重要性[79]。最近,Castellucci及其同事证明了IFG在演讲计划和准备中的重要作用[80]。Saur及其同事报道了左IFG与听觉皮层之间存在解剖学连接[81,82]。与运动和顶叶皮层类似,我们的结果表明,在语音产生过程中,IFG在高伽马波段接收来自LSTG的前馈信号。然而,另一个不同的频率通道用于反馈信号,即三角带(S3图)。从左IFG到三角洲频段早期听觉区域的低频自上而下信号对于听力的重要性已有论证[12,83]。应该注意的是,对于DAI,我们正在对比2个领域之间的2个有向连接性(参见方法部分),这使得我们的分析对不对称性特别敏感(即,一个方向明显强于相反方向),并且不能直接与研究单个方向的研究进行比较(例如,如Gross及其同事[12])。
总之,我们的连接结果符合预测编码理论,并表明定向频率特定调制在语音产生和感知的皮层信息处理中的重要作用。根据预测编码框架,预测是通过预测误差随时间线性累积来更新的,与预测误差相比,预测的变化较慢[17,62]。因此,预测误差信号需要使用比预测信号更高的频率信道进行通信,这与我们的发现一致。
语音生成中的感觉衰减
与外部生成的声音相比,自生成的声音在听觉皮层中表现出较小的皮层反应,因为它们的感觉后果可以准确预测(称为感觉衰减)[84]。言语也是如此:先前的研究表明,与被动倾听相比,自发语音导致听觉诱发的大脑活动减少[4-6]。我们通过表明言语 - 大脑耦合在说话时明显弱于听力时来扩展这些发现,尤其是在低频时。这与从感觉衰减文献和预测语音模型中得出的预测一致。根据该模型,用于语音产生的运动命令不仅发送到控制发音器的肌肉,而且还传达给推断出预期听觉输入的皮质区域。因此,在说话过程中,预期的感觉输入将在早期听觉区域衰减,导致听觉活动与(自我生成的)语音包络的耦合减少。
在我们之前的研究中,我们发现对自我产生的刺激的神经反应受到运动皮层中β带节律的调节[69]。此外,我们报告了β范围内的显着定向耦合,起源于运动皮质到双侧听觉区域。在目前的研究中,我们还测试了自上而下的连接是否直接影响语音信号的皮层跟踪。有趣的是,我们发现左侧听觉区域的θ范围语音 - 大脑耦合与源自运动区域的自上而下的beta连接之间存在负相关关系。这一发现与先前的研究一致,这些研究显示β活性在更新对即将到来的运动的感觉后果的预测中的作用[63,85]。在一项MEG研究中,Morillon及其同事还报道了从运动到听觉皮质的β自上而下的连接与时间预测直接相关[70]。有趣的是,我们的相关结果表明,语音-大脑耦合的衰减主要发生在低β范围(12至20 Hz)的自上而下的音频-运动连接中,主要发生在低θ带(4至6 Hz)。这些结果表明,低β节律在言语产生中运动和听觉区域之间的相互作用中的重要作用与先前引入低β活性作为听觉夹带时间预测的中心协调器的研究一致[86]。另一方面,根据先前的研究,最大语音调制落在低θ带(约4Hz)[10,87]。因此,低θ语音-脑耦合的减少及其与自上而下的低β连通性的负相关支持了我们关于反映感觉衰减现象的假设。
总之,使用多变量分析,我们揭示了整个皮层听力和口语之间语音跟踪的异同。我们表明,在说话过程中,大脑活动与听觉和运动区域的语音包络最紧密地对齐。我们的时间分辨MEG结果进一步表明,这种对齐在额叶和运动区域的语音包络之前,在听觉区域的语音包络之后。事实上,在额叶和运动区域,这种言语-大脑耦合在说话时比在听觉方面更强,而对于听觉区域则相反。检测初级运动皮层之外的负滞后耦合可能会支持预测处理模型在预测语音程序和感觉后果中的作用。更重要的是,我们的定向连通性分析表明,前馈信号主要在伽马频带内通信,而反馈信号使用低频信道,其频率取决于这些信号的皮层来源。这些发现与“预测编码”框架一致,该框架将自上而下的信号解释为预测,将自下而上的信号解释为预测误差。这种交流也受到任务的调节,使得额叶运动皮层的反馈在说话时比听时更强。此外,源自运动区域的自上而下的β连接与左听觉区域的θ范围言脑耦合之间的负相关支持了β活动在预测自我生成语音的感觉后果中的作用。
方法
道德声明
该研究得到了当地伦理委员会的批准,并根据《赫尔辛基宣言》(批准号:2018-066-f-S)进行。
参与者
我们从当地受试者库中招募了30名以德语为母语的受试者(15名男性,平均年龄25.1岁±2.8岁,范围为20至32岁)。在测量前获得事先书面知情同意,实验后参与者获得金钱补偿。
录音
同时记录脑磁图、肌电图和语音信号。所有采样频率为275,275 Hz的录音都使用了1全头传感器系统(OMEGA 200,VSM Medtech,温哥华,加拿大),但语音录音的采样率为44.1 kHz。音频数据是用麦克风捕获的,麦克风放置在距离参与者嘴巴155厘米的地方,以免通过麦克风本身造成任何伪影。触觉检查后放置三对肌电图表面电极,以找到正确的位置以捕获来自大舌分枝杆菌、圆匝肌分枝杆菌和大颧叶分枝杆菌的肌肉活动(确切位置参见Abbasi及其同事的图1[42])。每块肌肉使用一对电极,电极之间约1厘米。对记录的MEG和EMG数据应用了截止频率为300 Hz的低通在线滤波器。
范例
参与者被要求在执行给定任务时放松地坐着,并将眼睛集中在白色注视十字架上。这项研究包括3个独立的录音:(i)语音制作;(ii) 在感知被掩盖时产生语音;(三)言语知觉。对于语音制作录音,有7项公开言语试验。每个试验都由一个60秒的时间段组成,参与者回答一个给定的问题,例如“典型的周末对你来说是什么样子的?注视交叉的颜色从白色变为蓝色表示参与者应该发言的时间段的开始,结束的标志是颜色变化回白色。在第二次录音中,参与者被要求在听到白噪声时执行与第一次录音相同的任务,使他们无法听到自己的声音。这些问题与之前的录音不同,以防止重复和预制答案。为了避免情绪化的回答,选择了涵盖中性主题的问题(问题的完整列表:S1 表)。
在第三次录音环节,参与者聆听了自己声音的录音,这些录音被收集在第一次和第二次录音中。在本文中,仅使用了条件(i)和(iii)。
预处理和数据分析
在数据分析之前,对MEG数据进行目视检查。未检测到跳跃伪影或不良通道。应用离散傅里叶变换(DFT)滤波器从连续的MEG和EMG数据中消除50 Hz的线路噪声。此外,EMG数据在20 Hz下进行高通滤波并进行了整流。从放置在解剖标志(鼻道、左耳道和右耳道)的基准线圈中提取连续的头部位置和旋转。语音信号的宽带幅度包络是使用[88]中提出的方法计算的。通过带通滤波(三阶巴特沃兹滤波器)构建了100个10至000,1 Hz之间的对数间隔频段。然后,我们将每个频段的振幅包络计算为希尔伯特变换的绝对值,并将它们下采样至200,<> Hz。最后,我们对各个频段进行了平均,并使用计算出的宽带幅度包络进行所有进一步分析。
MEG、EMG、语音包络和头部运动信号被下采样至256 Hz,并被分割为60-s试验。在预处理和数据分析步骤中,Matlab R2020(The Mathworks,Natick,马萨诸塞州,美利坚合众国)中的定制脚本与基于Matlab的FieldTrip工具箱[89]结合使用,符合当前的MEG指南[90]。
伪影拒绝
为了去除与语音相关的伪影,我们使用了最近发表的研究中提出的管道[42]。简而言之,伪影抑制包括4个主要步骤:(i)通过使用回归分析将头部位置时间序列合并到一般线性模型(GLM)中,最初减少了与头部运动相关的伪影[91]。(ii)为了进一步去除残余伪影,使用SVD从MEG数据中估计包含语音相关伪影的空间子空间(分量)。(iii)通过目视检查和MI分析检测出人工成分,然后从单项试验数据中删除[92]。(iv) 最后,将所有剩余部件反向转换到传感器级别。
源本地化
对于源定位,我们使用迭代最近点算法将单个T1加权解剖MRI扫描与数字化的头部形状对齐。然后,我们对MRI扫描进行了分割,并生成了单壳体积导体模型[93],并使用它来创建正向模型。对于组分析,单个MRI被线性转换为Fieldtrip提供的MNI模板。接下来,使用线性约束最小方差(LCMV)算法计算5 mm网格上每个体素的时间序列。提取每个偶极子方向的时间序列,导致每个体素有 3 个时间序列。将缩小版的HCP脑图谱应用于源时序,以降低数据的维数,从而产生230个包裹[45]。最后,我们从该宗地中的所有偶极子中提取了时间序列SVD的前3个分量,解释了大部分方差。
互信息
对于每个包裹,对3个SVD分量进行多锥光谱分析,在2 s长窗口上进行+/? 2 Hz光谱平滑,重叠率为50%。然后,我们使用高斯Copula MI在语音包络和所有3个时间序列的复值频谱估计之间估计MI[46]。请注意,由于计算的多变量性质,这会导致宗地的单个 MI 值合并所有 3 个时间序列的信息。对每个包裹重复此计算,语音包络和神经活动之间的52个延迟范围(等间距)从-1到1 s。对于每个延迟,在计算多锥度频谱估计之前,执行语音包络相对于MEG信号的移动。此外,我们通过计算语音包络和源活动之间 500 个随机延迟的 MI(仅使用超过 3 秒的延迟)计算了反映在没有真正同步的情况下预期 MI 值的代理分布。我们使用 matlab 函数 circshift.m 实现了移位,并环绕了时间序列的边缘。
延迟估计
为了估计说话过程中言脑耦合的最佳滞后(图3),我们使用了将说话与代理数据的第95个百分位数进行比较得出的t值。t值是跨滞后(-1秒至1秒)和频率(1至10赫兹)计算的,p值经过FDR校正,用于跨滞后和频率的多次比较。首先,我们平均了大脑区域的t值,产生了跨滞后和频率的全局语音 - 大脑耦合签名。接下来,我们计算了每个大脑区域的t值与全局签名相比的相对变化,从而得出每个大脑区域在滞后和频率上的相对变化矩阵。最后,我们对不同频率的矩阵进行了平均,并确定了该平均相对变化最大的滞后。请注意,即使存在多个峰值,此过程也仅捕获与滞后中的全局峰值相对应的滞后。
连通性分析
我们使用多元非参数格兰杰因果关系方法(mCG)进行了连通性分析[49]。我们计算了mCG,以确定STG(HCP图谱中的LA5包裹)与每个皮质区域之间功能耦合的方向性,在语音产生和感知过程中,成对步骤。最初,源信号分为4 s的试验,重叠500 ms。我们将快速傅里叶变换与多锥体(2 Hz平滑)结合使用来计算试验的交叉光谱密度(CSD)矩阵。接下来,使用逐块方法,我们将每个宗地的前 3 个 SVD 组件视为一个区块,并估计了 STG 与其他宗地之间的连通性。最后,我们计算了由[15]定义的定向影响不对称指数(DAI),因此,给定频率的正DAI表示所选宗地在该频率下向STG传达前馈影响,负DAI表示反馈影响。请注意,对于连通性分析,我们使用采样率为 1,200 Hz 的 MEG 数据,没有缩减采样。
统计分析
我们使用基于非参数聚类的排列测试确定了说话和听力条件下显著的归一化MI值以及连接模式(DAI值)[94]。首先,我们估计了说话过程中言脑耦合的统计对比,与每个包裹和参与者的心肌梗死的第95个百分位数相比。其次,在组水平上,说话条件下的归一化MI值与听力条件下的MI值形成对比。使用相关样本t检验对每个频率(在1至10 Hz范围内)和延迟(在-1至1 s范围内,52个等间距延迟)进行统计分析。我们使用基于聚类的校正来考虑频率、延迟和宗地之间的多重比较。我们执行了 5,000 次排列,并将临界 alpha 值设置为 0.05。我们执行了相同的程序,以检测STG和其他皮质包裹在说话和听力条件下的显着连接性。
相关分析
我们使用基于非参数聚类的排列测试评估了所有宗地与 LSTG 的连接结果与语音-STG 耦合之间是否存在关系。首先,我们估计了每个宗地和频段的自上而下的连通性值。接下来,我们计算了每个频段的语音-STG耦合。使用在Fieldtrip的ft_statfun_correlationT函数中实现的Pearson方法对每个频段和宗地进行相关性分析。我们使用基于聚类的校正来考虑宗地之间的多重比较。我们对不同的频段重复分析。因此,我们的结果不会跨频率进行校正。我们执行了 5,000 次排列,并将临界 alpha 值设置为 0.05。
支持信息
参与者必须在第一次(语音制作)和第二次录音(带有掩蔽感知的语音制作)中回答的完整问题列表。
显示 1/10: pbio.3002178.s001.docx
跳到无花果共享导航
抱歉,我们无法预览此文件
1 / 10
下载
无花果分享
S1 表。 参与者必须在第一次(语音制作)和第二次录音(带有掩蔽感知的语音制作)中回答的完整问题列表。
https://doi.org/10.1371/journal.pbio.3002178.s001
(文档)
S1 图 听力状况的语音脑耦合结果。
皮质图表示每个包裹中语音包络和大脑活动之间的多变量MI的组统计信息,与替代数据的第95个百分位数相比。颜色代码表示延迟和频率上所有有效 T 值的总和(FDR 在延迟(?1 到 1 秒)、频率(1 到 10 Hz)和包裹上校正)。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s002
(文档)
S2 图 上图:使用搜索词“语音产生”的 neurosynth.org fMRI荟萃分析的统计图。
结果在空间上插入到我们研究中使用的HCP图谱中。颜色代码对应于 neurosynth.org 上记录的均匀性测试中的 z 值。下图:延迟相关性 (r1-r2)/(r1+r2) 的相对差异。R1是我们的语音生产网络与神经合成语音生成网络之间的相关性,R2是我们的语音生产网络与神经合成语音感知网络之间的相关性。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s003
(文档)
S3 图 听力状况的言脑耦合偏侧化。
这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s004
(文档)
S4 图 不同延迟([?2 5] ms)在δ(600 Hz)和θ(600 Hz)下说话与听力中的言脑耦合的统计比较。
颜色代码 t 值。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s005
(文档)
S5 图 左侧 STG 区域。
突出显示的黑色宗地描绘了代表 LSTG 区域的 HCP 地图集的L_A5宗地。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s006
(文档)
S6 图
在不同频段的语音产生(a)和聆听(b)期间,STG与其他皮质包裹之间的显着连接。使用基于聚类的排列检验来检测显著的连通性模式(p < 0.05)。颜色代码 t 值。紫色代表从STG到其他皮质包裹的信息流,绿色代表相反的方向。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s007
(文档)
S7 图 不同频段中说话和收听条件之间的连接模式比较。
采用聚类排列检验检测口语和听力条件之间所有皮质包裹与STG的显著连通性差异(p < 0.05)。颜色代码 t 值。请注意,由于我们比较了两种条件之间的不对称指数(DAI),因此从该皮质图解释方向性具有挑战性。为了更好地理解这些统计图,请参阅图 2D 和 S4 图中 STG 和 7 ROI 之间的光谱分辨 DAI。这个数字背后的数据可以在 https://osf.io/3fq9/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s008
(文档)
S8 图 自上而下的气相色谱和MI之间的相关性分析。
θ范围内的语音-STG耦合(正滞后:130 ms)与自上而下的δ(a)以及主要来自左枕和顶叶区域的θ(b)连接呈负相关。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s009
(文档)
S9 图 说话和听力条件之间的特定频率功率比较。
(a) 说话和听力之间频率特定功率的统计对比。对相关样本t检验的结果进行了跨包裹和频率(1–100 Hz)的FDR校正。所有有效频率的 t 值总和的颜色代码。请注意,我们使用单侧测试(口语<听力)来确保结果不会受到残留语音伪影的污染。(b) 说话(蓝色)和听力(红色)条件下所有重要宗地的平均功率谱密度。灰色面板描绘了 10–30 Hz 的频率范围。这个数字背后的数据可以在 https://osf.io/9fq47/ 中找到。
https://doi.org/10.1371/journal.pbio.3002178.s010
(文档)
引用
1.Levinson SC. 人类交流中的轮流——语言处理的起源和影响。趋势Cogn Sci(Regul Ed)。2016 20 月;1(6):14–26651245.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
2.弗里斯顿 KJ,弗里斯 CD。积极的推理,沟通和解释学。皮层。2015 68 月;129:43–25957007.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
3.皮克林MJ,加罗德·语言生产和理解的综合理论。行为脑科学 2013 36 月;4(329):47–23789620.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
4.Houde JF,Nagarajan SS,Sekihara K,Merzenich MM.演讲过程中听觉皮层的调节:MEG研究。J Cogn 神经科学。2002 15 月 14;8(1125):38–12495520.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
5.Curio G, Neuloh G, Numminen J, Jousm?ki V, Hari R. 说话改变了人类听觉皮层中的声音诱发活动。哼哼脑啦啦。2000 9 月;4(183):91–10770228.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
6.Tian X,Poeppel D.言语生产中自我监控和错误检测的动态:来自心理意象和MEG的证据。J Cogn 神经科学。2015 27 月;2(352):64–25061925.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
7.Houde JF, Nagarajan SS. 语音制作作为状态反馈控制。前面哼哼神经科学。2011 25 月 5;82:22046152.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
8.Hickok G. 语音产生的计算神经解剖学。国家修订版神经科学。2012 5 月 13;2(135):45–22218206.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
9.格罗斯 J, 蒂默曼 L, 库贾拉 J, 德克斯 M, 施密茨 F, 萨尔梅林 R, 等.人类间歇性运动控制的神经基础。美国国家科学院院刊 2002 19 月 99;4(2299):302–11854526.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
10.丁N, 帕特尔 AD, 陈 L, 巴特勒 H, 罗 C, 波佩尔 D. 语音和音乐中的时间调制.神经科学生物行为修订版 2017 十月;81(Pt B):181–7.密码:28212857
查看文章PubMed/NCBI谷歌学术搜索
11.阿纳尔·皮质振荡和感觉预测。趋势Cogn Sci(Regul Ed)。2012 16 月;7(390):8–22682813.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
12.Park H, Ince RAA, Schyns PG, Thut G, Gross J. 额叶自上而下的信号增加了听觉低频振荡与人类听众连续语音的耦合。当代生物学. 2015 15月 25;12(1649):53–26028433.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
13.王晓杰.认知中皮质节律的神经生理学和计算原理。生理学修订版 2010 90 月;3(1195):268–20664082.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
14.图特 G, 米尼乌西 C, 格罗斯 J.大脑中节律活动的功能重要性。当代生物学. 2012 21 月 22;16(658):R63–22917517.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
15.Bastos AM, Vezoli J, Bosman CA, Schoffelen J-M, Oostenveld R, Dowdall JR, et al.视觉区域通过不同的频率通道施加前馈和反馈影响。神经元。2015 21 月 85;2(390):401–25556836.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
16.格罗斯·让节奏引导您:皮质通信通道的非侵入性跟踪。神经元。2016 20 月 89;2(244):7–26796688.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
17.Michalareas G, Vezoli J, van Pelt S, Schoffelen J-M, Kennedy H, Fries P. α-β和γ节律在人类视觉皮质区域之间提供反馈和前馈影响。神经元。2016 20 月 89;2(384):97–26777277.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
18.Giraud A-L,Poeppel D.皮质振荡和语音处理:新兴计算原理和操作。纳特神经科学。2012 18 月 15;4(511):7–22426255.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
19.格罗斯 J, 豪根布姆 N, Thut G, Schyns P, Panzeri S, Belin P, et al.人脑中的语音节律和多路复用振荡感觉编码。公共科学图书馆生物学. 2013 31 月 11;12(1001752):e24391472.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
20.Schroeder CE,Lakatos P.低频神经元振荡作为感觉选择的工具。趋势神经科学。2009 32 月;1(9):18–19012975.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
21.布希 NA, 杜波依斯 J, 范鲁伦 R.正在进行的脑电图振荡阶段预测视觉感知。J 神经科学。2009 17 月 29;24(7869):76–19535598.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
22.丁婷, 西蒙·单声道和二分法聆听期间听觉皮层中连续语音的神经编码。J 神经生理学。2012 107 月;1(78):89–21975452.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
23.拉卡托斯 P, 穆萨基亚 G, 奥康内尔 MN, 法尔奇尔 AY, 贾维特 DC, 施罗德 CE.听觉选择性注意的时空光谱滤波机制.神经元。2013 20 月 77;4(750):61–23439126.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
24.皮尔JE,格罗斯J,戴维斯MH。在理解过程中,人类听觉皮层对语音的锁相反应得到增强。大脑皮层。2013 23 月;6(1378):87–22610394.pmid:<>
View ArticlePubMed/NCBIGoogle Scholar
25.Zion-Golumbic E, Schroeder CE. Attention modulates “speech-tracking” at a cocktail party. Trends Cogn Sci (Regul Ed). 2012 Jul;16(7):363–4.
View ArticleGoogle Scholar
26.加努什恰克·利,克里斯托弗斯·伊克,席勒·脑电图在语言生产研究中的应用:综述。前线心理. 2011 1月 2;208:21909333.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
27.Gehrig J, Wibral M, Arnold C, Kell CA. 建立语音生产网络:振荡如何促进侧向化信息路由。前线心理. 2012 6月 3;169:22685442.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
28.略伦斯 A, 特雷布雄 A, 列乔亚-肖维尔 C, 阿拉里奥 F-X.语言产生过程中大脑活动的颅内记录。前线心理. 2011 27月 2;375:22207857.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
29.奥兹克 M, 道尔 W, 德文斯基 O, 弗林克 A.皮层网络在人类语音产生过程中处理听觉错误信号以保持流畅性。公共科学图书馆生物学. 2022 3 月 20;2(3001493):e35113857.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
30.价格 CJ.语言剖析:对100年发表的2009项fMRI研究的回顾。Ann N Y Acad Sci. 2010 Mar;1191:62–88.密码:20392276
查看文章PubMed/NCBI谷歌学术搜索
31.Borovsky A,Saygin AP,Bates E,Dronkers N.病变与会话语音产生缺陷相关。神经心理学。2007 18 月 45;11(2525):33–17499317.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
32.Riès SK, Dhillon RK, Clarke A, King-Stephens D, Laxer KD, Weber PB, et al.皮质高频带活动揭示了语音生产中单词检索的时空动态。美国国家科学院院刊 2017 6 月 114;23(4530):E8–28533406.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
33.杨森 N, 梅吉 MV, 洛佩斯-佩雷斯 PJ, 巴伯哈.用脑电图和组ICA探索语音产生的时间动态。科学代表 2020 28 月 10;1(3667):32111868.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
34.Liljestr?m M,Kujala J,Stevenson C,Salmelin R.图片命名中语音开始之前语言网络的动态重构。哼哼脑啦啦。2015 36 月;3(1202):16–25413681.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
35.费尔斯 A, 米歇尔斯 A, 杜福尔 S, 斯特里克斯 K.同样的超快速并行大脑动力学支撑着语音的产生和感知。大脑皮层公社。2021 10 月 2;3(040):TGAB34296185.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
36.Saarinen T,Laaksonen H,Parviainen T,Salmelin R.言语和非言语嘴部运动的视觉运动产生的运动皮层动力学。大脑皮层。2006 16 月;2(212):22–15858159.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
37.鲁斯潘蒂尼一世, 沙里宁 T, 贝拉迪内利 P, 贾拉瓦 A, 帕尔维艾宁 T, 库亚拉 J, 等.皮质相干性被调谐为2-3 Hz的自发语音节奏。 J 神经科学。2012 14 月 32;11(3786):90–22423099.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
38.亚历山德鲁, 沙里宁 T, 梅凯拉 S, 库亚拉 J, 萨尔梅林 R.右半球在连接的自然语音产生和感知中突出显示。神经影像。2017 May 15;152:628–38.密码:28268122
查看文章PubMed/NCBI谷歌学术搜索
39.佩雷斯 A, 卡雷拉斯 M, 杜纳贝蒂亚 JA.脑对脑夹带:说话和听觉时的脑电图脑间同步。科学代表 2017 23 月 7;1(4190):28646190.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
40.佩雷斯 A, 戴维斯 MH, 因斯 RAA, 张 H, Fu Z, 拉马卡 M, 等.说话和听力时对语音包络的联合夹带不能完全解释脑对脑同步。2021 12 月 <>.
查看文章谷歌学术搜索
41.勃艮第M, 莫利纳罗N, 利扎拉祖M, 陶鲁S, Jousm?ki V, Lallier M, et al.新皮层活动跟踪大声朗读过程中自我产生语音的分层语言结构。神经影像。2020 1 月 216;116788:32348908.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
42.Abbasi O, Steingr?ber N, Gross J. 纠正由公开言语引起的MEG伪像。前神经科学。2021 8 月 15;682419:34168536.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
43.格罗斯 J, 克鲁格 DS, 阿巴西 O, 查拉斯 N, 施泰因格拉伯 N, 多贝 C, 等.用于脑外周分析的无定向频域连接措施的比较。神经影像。2021 15 月 245;118660:34715317。pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
44.Chalas N, Daube C, Kluger DS, Abbasi O, Nitsch R, Gross J. 语音包络跟踪的多变量分析揭示了听觉皮层以外的耦合。神经影像。2022 258 月;119395:35718023.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
45.Tait L, ?zkan A, Szul MJ, Zhang J. 具有高分辨率图谱的静息状态 MEG 的皮质源成像:方法评估。生物Rxiv。2020 14 月 <>.
查看文章谷歌学术搜索
46.Ince RAA, Giordano BL, Kayser C, Rousselet GA, Gross J, Schyns PG.基于通过高斯copula估计的互信息进行神经影像数据分析的统计框架。哼哼脑啦啦。2017 38 月;3(1541):73–27860095.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
47.丁婷, 西蒙·自适应时间编码导致语音的背景不敏感皮层表示。J 神经科学。2013 27 月 33;13(5728):35–23536086.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
48.艾略特TM,特尼森FE。语音清晰度的调制传递函数。公共科学图书馆计算生物学. 2009 6 月 5;3(1000302):e19266016.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
49.Schaum M, Pinzuti E, Sebastian A, Lieb K, Fries P, Mobascher A, et al.右额下回通过人体β波段振荡实现运动抑制控制。生命 2021 23 月 10;33755019.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
50.Park H,Ince RAA,Schyns PG,Thut G,Gross J.视听语音夹带期间的代表性相互作用:左后颞上回的冗余和左运动皮层的协同作用。公共科学图书馆生物学. 2018 6月 16;8(2006558):e30080855.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
51.Keitel A,Gross J,Kayser C.听觉和运动皮层中的感知相关语音跟踪反映了不同的语言特征。公共科学图书馆生物学. 2018 12 月 16;3(2004473):e29529019.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
52.Bourguignon M, De Tiège X, de Beeck MO, Ligot N, Paquier P, Van Bogaert P, et al.韵律措辞的节奏将听众的皮层与读者的声音相结合。哼哼脑啦啦。2013 34 月;2(314):26–22392861.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
53.Luo H, Poeppel D. 神经元反应的相位模式可靠地区分人类听觉皮层中的语音。神经元。2007 21 月 54;6(1001):10–17582338.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
54.Cogan GB, Thesen T, Carlson C, Doyle W, Devinsky O, Pesaran B. 言语的感觉运动转化发生在双边。自然界。2014 6 月 507;7490(94):8–24429520.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
55.Vander Ghinst M, Bourguignon M, Op de Beeck M, Wens V, Marty B, Hassid S, et al. 左上颞部回过与鸡尾酒会听觉场景中的出席演讲相结合。J 神经科学。2016 3 月 36;5(1596):606–26843641.密码:<>
View ArticlePubMed/NCBIGoogle Scholar
56.Simmonds AJ, Leech R, Collins C, Redjep O, Wise RJS. Sensory-motor integration during speech production localizes to both left and right plana temporale. J Neurosci. 2014 Sep 24;34(39):12963–72. pmid:25253845
View ArticlePubMed/NCBIGoogle Scholar
57.Piai V, Zheng X. 说话波:语言生产中的神经元振荡。爱思唯尔;2019.第265–302页。
58.希科克·语音处理的皮层组织:反馈控制和预测编码双流模型的上下文。J 公社不和谐。2012 45 月;6(393):402–22766458.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
59.侯德建峰, 常英.声音生产中反馈控制的基础皮质计算。Curr Opin Neurobiol.2015 33 月;174:81–25989242.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
60.佩雷斯 A, 戴维斯 MH, 因斯 RAA, 张 H, Fu Z, 拉马卡 M, 等.在说话、听力和自听过程中大脑夹带到语音包络上的时间。认识。2022 224 月;105051:35219954.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
61.阿纳尔 LH, 怀亚特五世, 吉罗 A-L.神经振荡中的转换反映了视听语音中产生的预测误差。纳特神经科学。2011 14 月;6(797):801–21552273.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
62.丰托兰 L, 莫里永 B, 列乔亚-肖维尔 C, 吉罗 A-L.频率特定活动对人类听觉皮层分层信息处理的贡献。纳特公社。2014 2 月 5;4694:25178489.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
63.塞德利 W, 甘德 PE, 库马尔 S, 科瓦奇 CK, 奥亚 H, 川崎 H, 等.感知推理的神经特征。生活。2016 7 月 5;11476:e26949254.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
64.Chao ZC, Takaura K, Wang L, Fujii N, Dehaene S. 灵长类动物大脑分层预测和预测误差的大规模皮质网络.神经元。2018 5 月 100;5(1252):1266–3.e30482692.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
65.易华刚, 伦纳德, 常英.颞上回中语音的编码。神经元。2019 19 月 102;6(1096):110–31220442.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
66.施耐德 M, 布罗吉尼 AC, 丹恩 B, 扎努 A, 乌兰 C, 谢沙德里 S, 等.一种通过基于连通性和振荡功率的通信实现区域间一致性的机制。神经元。2021 15 月 109;24(4050):4067–12.e34637706.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
67.Vinck M, Uran C, Spyropoulos G, Onorato I, Broggini AC, Schneider M, et al.大规模神经相互作用的原理。神经元。2023 5 月 111;7(987):1002–37023720.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
68.Ferro D, van Kempen J, Boyd M, Panzeri S, Thiele A. 猕猴V1和V4皮质层之间的定向信息交换及其选择性注意的调节。美国国家科学院院刊 2021 23 月 118;12(33723059).密码:<>
查看文章PubMed/NCBI谷歌学术搜索
69.Abbasi O,Gross J.β波段振荡在运动 - 听觉相互作用中起着至关重要的作用。哼哼脑啦啦。2020 15 月 41;3(656):65–31639252.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
70.Morillon B, Baillet S. 听觉注意中时间预测的运动起源。美国国家科学院院刊 2017 17 月 114;42(8913):E21–28973923.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
71.Park H,Thut G,Gross J.通过两个前置马达自上而下的通道预测自然语音夹带。郎科恩神经科学。2018 26 月 35;6(739):51–32939354.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
72.Strau? A, W?stmann M, Obleser J. 皮质α振荡作为听觉选择性抑制的工具。前面哼哼神经科学。2014 28 月 8;350:24904385.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
73.沃斯特曼 M, 林 S-J, 奥布莱瑟 J.人类对语音的神经阿尔法反应是注意力控制的代理。大脑皮层。2017 1 月 27;6(3307):17–28334352.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
74.拉卡托斯 P, 格罗斯 J, 图特 G.对神经元夹带作用的新统一描述。当代生物学. 2019 23月 29;18(890):R905–31550478.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
75.Moser D, Baker JM, Sanchez CE, Rorden C, Fridriksson J. 左顶叶音节的时间顺序处理。J 神经科学。2009 华侨城 7;29(40):12568–73.密码:19812331
查看文章PubMed/NCBI谷歌学术搜索
76.Hickok G,Houde J,Rong F.语音处理中的感觉运动集成:计算基础和神经组织。神经元。2011 10 月 69;3(407):22–21315253.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
77.两个大脑半球对时间和频谱语音反馈控制的差异贡献。纳特公社。2020 5 月 11;1(2839):32503986.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
78.曹林, 图特 G, 格罗斯·大脑振荡在预测自生成声音中的作用。神经影像。2017 15 月 147;895:903–27818209.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
79.伊什汉扬 B, 米歇尔·兰格 V, 博耶 K, 莫根森 J, 卡拉巴诺夫 A, 哈特维格森 G, 等.前额回和后额下回有助于语言生成过程中语法决定因素的实施。前心理. 2020 27月 11;685:32395113.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
80.卡斯特鲁奇 GA, 科瓦奇 CK, 霍华德·马, 格林利 JDW, 马龙.用于交互式语言使用的语音规划网络。自然界。2022 602 月;7895(117):22–34987226.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
81.Saur D, Kreher BW, Schnell S, Kümmerer D, Kellmeyer P, Vry M-S, et al.语言的腹侧和背侧通路。美国国家科学院院刊 2008 18 月 105;46(18035):40–19004769.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
82.图尔肯非盟,德龙克斯NF。语言理解网络的神经结构:来自病变和连接分析的收敛证据。前系统神经科学。2011 10 月 5;1:21347218.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
83.Cope TE, Sohoglu E, Sedley W, Patterson K, Jones PS, Wiggins J, et al.因果自上而下的正面对言语感知预测过程的贡献的证据。纳特公社。2017 18月 8;1(2154):29255275.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
84.Martikainen MH,Kaneko K,Hari R.抑制对人类听觉皮层中自我触发声音的反应。大脑皮层。2005 15 月;3(299):302–15238430.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
85.藤冈T,Trainor LJ,Large EW,Ross B.等时声音的内化时间表示为神经磁β振荡。J 神经科学。2012 1 月 32;5(1791):802–<>.
查看文章谷歌学术搜索
86.比奥E,科茨SA。下贝塔:多模态语音中时间预测的中心协调器。前面哼哼神经科学。2018 24 月 12;434:30405383.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
87.波佩尔D,阿萨尼奥·言语节律及其神经基础。国家修订版神经科学。2020 21 月;6(322):34–32376899.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
88.钱德拉塞卡兰 C, 特鲁巴诺娃 A, 斯蒂利塔诺 S, 卡普利耶 A, 加赞法尔 AA.视听语音的自然统计。公共科学图书馆计算生物学. 2009 17 月 5;7(1000436):e19609344.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
89.奥斯滕维尔德 R, 弗里斯 P, 马里斯 E, 肖菲伦 J-M.FieldTrip:用于对MEG,EEG和侵入性电生理数据进行高级分析的开源软件。Comput Intell Neurosci.2011;2011:156869.密码:21253357
View ArticlePubMed/NCBIGoogle Scholar
90.Gross J, Baillet S, Barnes GR, Henson RN, Hillebrand A, Jensen O, et al.进行和报告MEG研究的良好实践。神经影像。2013 15 月 65;349:63–23046981.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
91.Stolk A, Todorovic A, Schoffelen J-M, Oostenveld R. MEG 中用于头部运动补偿的在线和离线工具。神经影像。2013 68 月;39:48–23246857.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
92.Abbasi O,Hirschmann J,Schmitz G,Schnitzler A,Butz M.使用ICA和互信息从MEG数据中拒绝深部脑刺激伪影。J 神经科学方法。2016 1 月 268;131:41–27090949.pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
93.诺尔特·准静态近似中的磁铅场定理及其在实际体积导体脑磁图正向计算中的应用.物理医学生物学. 2003 21月 48;22(3637):52–14680264.密码:<>
查看文章PubMed/NCBI谷歌学术搜索
94.Maris E,Oostenveld R.EEG和MEG数据的非参数统计测试。J 神经科学方法。2007 15 月 164;1(177):90–17517438.密码:<>
查看文章PubMed/NCBI谷歌学术搜索