了解人脑如何跟踪发出的语音以执行流畅的语音生成-厦门畜牧期刊杂志论文发表
卡兰明子 ,丹尼尔·卡兰
出版日期: 2022年02月04日
对自己语音的听觉反馈用于监视和自适应控制流利的语音产生。PLOS Biology上的一项新研究使用皮质电图(ECoG)对语音人为延迟的听众进行了研究,确定了参与监测语音产生的区域。
数字
图1图1图1
引文: Callan A,Callan DE(2022)了解人脑如何跟踪发出的语音以执行流畅的语音生产。PLoS Biol 20(2):e3001533。https://doi.org/10.1371/journal.pbio.3001533
发表: 二月 4, 2022
版权所有: ? 2022卡兰,卡兰。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用,分发和复制,前提是注明原始作者和来源。
资金: 作者没有为这项工作获得任何具体资金。
相互竞争的利益: 作者宣布不存在相互竞争的利益。-厦门畜牧期刊杂志论文发表
缩写: DAF,延迟的听觉反馈;dPreCG,背侧中央回;ECoG,皮质电图;功能磁共振成像,功能性磁共振成像;IFG,下额叶回;PET,正电子发射断层扫描;后CG,后中央回;前肠绞线,前中央回;pSTG,后颞上回;SMG,上缘回;STG,上颞回;vPreCG,腹侧中央回
语音表达的主要目标是产生声音,使说话者能够有效地与听众沟通。为了实现这一目标,人们认为语音制作同时使用前馈和反馈控制系统。前馈系统根据先前学习的语音声音映射和与电机命令相关的预测听觉状态生成发音运动命令。相反,反馈系统根据发出的电机命令监视预测的语音声音与实际发生的语音声音之间的差异。当检测到不匹配时,会生成一个错误信号,用于修改电机命令以补偿差异。
听觉反馈对语音产生的重要性得到了许多使用改变听觉反馈的研究的支持。延迟听觉反馈(DAF)是改变听觉反馈的最著名方法之一。1950年,Lee报道了DAF对语音产生的影响[1]。通过耳机收听自己声音的轻微延迟样本(图1A)导致参与者说话缓慢;然而,如果他们试图保持正常的速度,就会发生以不希望的音节或摩擦音重复为特征的人为口吃。在这项研究之后,许多研究人员调查了DAF如何影响语音产生。众所周知,DAF会导致不讲道的人说话不流畅,但口吃的人说话更流利。DAF设备已经开发出来,以帮助口吃者变得更加流利。虽然DAF效应的行为方面变得越来越清晰,但潜在的神经回路仍然很大程度上是未知的。
缩略图 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 1. 与 DAF 相关的神经相关性和语音产生的皮层模型。
(A) DAF 任务的实验设置。(B)当每个区域对4种延迟条件的神经反应显着不同时,发散开始。早发以红色矩形绘制,晚发病以蓝色矩形绘制。相关回旋有黄色(STG),蓝色(SMG),绿色(PostCG),红色(PreCG)和粉红色(IFG)。(C)基于DIVA模型和Ozker研究的语音产生的皮层模型(改编自Guenther和Vladusich [8])。dPreCG是基于Ozker及其同事研究结果的反馈控制图的新成员。来自Ozker及其同事研究的与DAF(STG,SMG,vPreCG,dPreCG和IFG)有关的大脑区域在图中以蓝色显示。DAF,延迟的听觉反馈;dPreCG,背侧中央回;HG, Heschl gyrus;IFG,下额叶回;pIFG,后下额叶回;后CG,后中央回;前肠绞线,前中央回;pSTG,后颞上回;pSTS,后颞上沟;PT,颞叶平面;SMG,上缘回;STG,上颞回;vPMC,腹侧运动前皮层;vPreCG,腹侧中央前回。
https://doi.org/10.1371/journal.pbio.3001533.g001
既往使用功能性磁共振成像(fMRI)和正电子发射断层扫描(PET)进行的神经影像学研究发现,后颞上回(pSTG:听觉区)中的信号与DAF相关,并且对延迟反馈的长度敏感[2,3]。神经动力学的空间和时间特征对于更好地理解大脑机制都很重要。由于fMRI和PET的时间分辨率较低,因此需要获得更精确的时间动力学来解释DAF效应。Ozker及其同事通过使用具有高时间分辨率的皮质电图(ECoG)提供了新的见解[4]。他们记录了来自神经外科患者的ECoG信号。参与者听到自己的声音与4种不同的延迟类型之一(无延迟,50,100或200毫秒),同时他们正在大声朗读视觉呈现的刺激。总共使用了10个不同的3音节单词和6个不同的8个单词作为刺激。
行为结果证实,随着延迟反馈,发音持续时间增加,并且当人们说句子而不是孤立的单词时,伸长效应更大。通过使用对神经反应的无监督聚类分析,作者发现了2种反应模式。在主要位于指示听觉功能的上颞回(STG)的第一种模式中,神经反应在言语发作后开始,并且其振幅随着延迟反馈而显着增加。在主要位于指示运动功能的前中央回(PreCG)的第二种模式中,神经反应在言语发作之前就开始了,其振幅仅受阅读句子时延迟反馈的影响。
使用STG,边缘上回(SMG),腹侧中央前回(vPreCG),背前中央回(dPreCG),中央后回(PostCG)和下额叶回(IFG)的感兴趣区域进一步研究了DAF效应。STG,SMG和PostCG在感官中;vPreCG和dPreCG在电机中;IFG位于正面区域。所有区域在读句过程中都表现出对DAF的较大敏感性,但vPreCG、dPreCG和PostCG在读词过程中没有显示出显著差异。为了揭示对DAF的响应增强如何随时间变化,使用句子阅读条件分析了对4个延迟条件的神经反应显着不同的发散发生。结果显示了2个不同的时间范围:STG(80 ms),dPreCG(360 ms)和SMG(680 ms)的早期发作以及后CG(1.80 s),vPreCG(1.88 s)和IFG(2.3 s)的晚发性(图1B)。然而,由于铰接持续时间随着延迟而显着增加,DAF不仅导致听觉错误处理,还会导致更长的运动处理。早发和晚发可能分别表明效应的听觉和运动性质。在控制了关节持续时间后,DAF的响应增强在PostCG和vPreCG中消失了,表明它们的反应本质上是运动性的。基于这些结果,作者提出STG,dPreCG和SMG参与听觉反馈处理,并且当需要动态听觉反馈处理以产生更长的话语时,dPreCG是保持语音流畅性的关键区域。
Guenther及其同事基于他们的计算模型(称为DIVA)和神经影像学研究提出了一种全面的语音生成神经网络模型[5-9]。根据该模型,STG监测听觉误差,SMG监测躯体感觉误差。在这个模型中,将听觉错误转化为纠正性运动命令的反馈控制器位于右腹侧运动前皮层。这种右侧向化听觉反馈控制处理得到了许多影像学研究的支持,但这些研究仅研究了光谱扰动[10]。如果听觉反馈控制系统仅位于右半球,那么在Ozker的研究中就不会确定DAF的控制系统。在这项研究中,通过电极记录了15名患者的大脑活动数据(2名右半球,9名左半球和4名双侧半球覆盖)。有趣的是,一项fMRI研究调查了频谱(移位特征频率)和时间(音素伸长)扰动,发现右vPreCG参与频谱反馈控制,左vPreCG参与时间反馈控制[10]。Ozker的研究推进了我们对与时间反馈控制相关的神经相关性的知识。研究表明,听觉反馈控制器不仅位于PreCG的腹侧部分,还位于背侧部分。具体来说,他们的结果暗示dPreCG是在DAF下启动更长语音生成的关键区域。通过将Ozker的结果应用于DIVA,我们制作了模型的修改版本(图1C)。这些发现是使我们更接近更好地了解言语运动控制中涉及的潜在大脑机制的重要一步,这可能导致言语障碍治疗的进步。
引用
1.Lee BS. 延迟语音反馈的影响。J Acoust Soc Am. 1950;22:824–6.-厦门畜牧期刊杂志论文发表
查看文章谷歌学术搜索
2.Takaso H, Eisner F, Wise RJS, Scott SK.延迟听觉反馈对说话时颞叶活动的影响:正电子发射断层扫描研究。朗赫赫学报. 2010;53(2):226–36.下午:19948756
查看文章PubMed/NCBI谷歌学术搜索
3.Agnew ZK,McGettigan C,Banks B,Scott SK.组以及延迟听觉反馈期间语音生成网络中的个体变异性。2018;143(5):3009.Epub 格式 2018 6 月 3.pmid:29857719;PubMed Central PMCID: PMC5963950.
查看文章PubMed/NCBI谷歌学术搜索
4.Ozker M, Doyle W, Devinsky O, Flinker A.皮质网络在人类语音生成过程中处理听觉错误信号,以保持流畅性。PLoS Biol. 2022;20(2):e3001493。
查看文章谷歌学术搜索
5.Bohland JW, Bullock D, Guenther FH.用于执行简单语音序列的神经表示和机制。J Cogn Neurosci.2010;22(7):1504–29.Epub 格式 2009 7 月 9.pmid:19583476;PubMed Central PMCID: PMC2937837.
查看文章PubMed/NCBI谷歌学术搜索
6.Golfinopoulos E, Tourville JA, Guenther FH.大规模神经网络建模与功能性脑成像在言语运动控制中的整合。神经图像。2010;52(3):862–74.Epub 格式 2009 10 月 20.pmid:19837177;PubMed Central PMCID: PMC2891349.
查看文章PubMed/NCBI谷歌学术搜索
7.冈瑟 FH.言语的神经控制。马萨诸塞州剑桥:麻省理工学院出版社;2016.
8.Guenther FH, Vladusich T.语音习得和产生的神经理论。J 神经语言学。2012;25(5):408–22.Epub 格式 2012 6 月 20.pmid:22711978;PubMed Central PMCID: PMC3375605.
查看文章PubMed/NCBI谷歌学术搜索
9.Tourville JA, Guenther FH.DIVA模型:语音获取和产生的神经理论。朗科恩工艺。2011;26(7):952–81.Epub 格式 2011 1 月 1.pmid:23667281;PubMed Central PMCID: PMC3650855.
查看文章PubMed/NCBI谷歌学术搜索
10.Floegel M,Fuchs S,Kell CA.两个大脑半球对时间和光谱语音反馈控制的差异贡献。纳特公社。2020;11(1):2839.Epub 格式 2020 6 月 7.pmid:32503986;PubMed Central PMCID: PMC7275068.
查看文章PubMed/NCBI谷歌学术搜索-厦门畜牧期刊杂志论文发表