计算系统生物学中代谢网络建模的基于项目的学习课程-厦门畜牧期刊杂志论文发表
托马斯·索特 ,塔玛拉·宾特纳,阿里·基什克,卢阿纳普雷斯塔,苔茜·普罗哈斯卡,丹尼尔?吉尼亚德,曾倪,克劳迪娅?奇普里亚尼,巽他斯·阿尔沙德,托马斯?普法乌,帕特里夏·马丁斯·孔德,玛丽亚·皮雷斯·帕切科
出版日期: 2022年01月27日
抽象
基于项目的学习(PBL)是一种以学生为中心的动态教学方法,鼓励学生解决现实生活中的问题,同时培养参与度和批判性思维。在这里,我们报告了一门关于代谢网络建模的PBL课程,该课程已经在卢森堡大学的综合系统生物学硕士(MISB)中运行了数年。这个为期2周的全日制积木课程包括介绍基于约束的建模(CBM)的核心概念和方法,应用于玩具模型和大型网络,以及第1周的个别学生项目的准备,以及第2周这些项目的演示和执行。我们详细描述课程的时间表和内容,模范学生项目,并反思成果和经验教训。PBL需要学生和教师的充分参与,并提供有益的教学体验。所介绍的课程可以作为其他类似课程的榜样和灵感。
数字
Table 4Fig 4表 1图1图2Table 2Table 3Fig 3Table 4Fig 4表 1图1图2
引文: Sauter T, Bintener T, Kishk A, Presta L, Prohaska T, Guignard D, et al. (2022) 基于项目的计算系统生物学代谢网络建模学习课程。PLoS Comput Biol 18(1):e1009711。https://doi.org/10.1371/journal.pcbi.1009711
编辑 器: Patricia M. Palagi,SIB瑞士生物信息学研究所,瑞士
发表: 一月 27, 2022
版权所有: ? 2022 索特等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用,分发和复制,前提是注明原始作者和来源。
资金: 作者没有为这项工作获得任何具体资金。
相互竞争的利益: 作者宣布不存在相互竞争的利益。
介绍
与以教师为中心的教学相比,基于项目的学习(PBL)是一种以学生为中心的动态教学方法,鼓励学生在老师的帮助下自己学习和解决相关的现实问题。通常,在PBL中,学生从要解决的问题开始,并组织自己到各种活动中,应用已经在学科领域获得的知识和技术,即使目标可以更广泛。该项目通常是有时间限制的,并以有关已解决的问题的报告或口头介绍达到高潮。在此过程中,教学人员致力于试图建议和激励学生,而不是讲课。PBL的一个关键优势是学生充分参与学习过程,同时提高他们的沟通和协作技能[1,2]。
在计算生物学领域,实践课程和PBL活动被认为是学习和传播技能的最有效方式之一[3]。计算生物学中的PBL提供了面对现实世界科学挑战的机会,同时发展了编程,从数据库和文献中检索数据,数据分析和组学数据集成方面的相关技能。这些涉及可重复性的概念以及研究中的可查找,可访问,可互操作和可重用(FAIR)原则。学生早期接触这些主题是他们教育的附加值[4]。PBL的报告和演示阶段有助于学生进一步发展这些软技能,这些技能变得越来越重要。展示您的结果是发展引人入胜的演讲"艺术"的绝佳机会。无论是否实现了最初的项目目标,PBL方法成功的指标是学生培养积极思维的能力,包括确定项目的关键方面或优势,以及制定相关问题,得出生物学结论或预见可能发展的能力[5].老师的互动,头脑风暴和指导对这些学习目标做出了积极贡献。在课程中,教师和学生都需要这种不平凡的参与,这是他们成功的关键,因为它是知识获取的主导力量[6]。
尽管PBL具有巨大的好处,但它尚未常规地嵌入计算生物学的主流教育计划中。课程本身的准备工作并非易事。由于计算生物学课程通常非常异质,包括具有工程,生物学和计算机科学等不同背景的学生,因此设计一门保持所有学生参与度高的课程通常具有挑战性。然而,PBL是帮助他们进入这样一个多学科领域的简单方法,因为它允许他们单独定制学习过程。因此,在一个项目上工作可以加强以前的知识,但也会让学生接触到新的主题。这鼓励了合作,以有效地解决手头的问题。考虑到这一点,选择合适的项目与一个小组特别相关,因为它应该考虑所有学生的水平,适应个人学习风格和节奏的能力,以及他们满足项目要求的可能性[7]。
在本文中,我们描述了基于PBL的计算生物学课程的结构,该课程侧重于代谢网络建模。我们还反思我们的经验和可能的改进。这是基于卢森堡大学(http://misb.uni.lu)综合系统生物学硕士(MISB)的PBL课程ISB705:Advanced Systems Biology II作为PBL课程的4年经验。MISB是一个为期2年的课程,旨在教育新一代的跨学科科学家,他们可以通过应用生物信息学和网络方法来处理和分析大型生物数据集,同时了解潜在的生物学原理。120 ECTS课程结合了实验实验室和计算机科学培训,最多可容纳18名拥有生物科学,生物信息学或相关领域学士学位的学生。本文包括对上一个课程版本的详细说明以及过去3年(2019年,2020年和2021年)收集的统计数据。它由教师和学生共同撰写,因此,它包括了两者的反思。
方法
课程结构和内容
ISB705课程作为为期2周的全日制课程(上午9点至下午5点)运行,包括讲座,指导实践和PBL,详见时间表(表1)。除了课程内容的详细说明外,下面还给出了预期的学习成果(ILO)和各自的一致教学活动(TLA)。
缩略图 下载:-厦门畜牧期刊杂志论文发表
个人电脑幻灯片
巴新放大图片
断续器原始图像
表 1. 为期2周的课程安排。
https://doi.org/10.1371/journal.pcbi.1009711.t001
讲座(第1周)
ISB705 课程在第一周包括 2 个关于基于约束的建模 (CBM) 的上午讲座。第一讲旨在更新从前面的ISB701课程中获得的知识:系统生物学导论,更具体地说是第2章:"代谢建模",由T. Sauter和M. Albrecht撰写的课程讲义(准备中出版物),提供给每个学生。在ISB701课程中,学生学习了应用常微分方程和CBM的系统生物学和代谢建模的主要概念,以及如何在一张纸上解决小练习和问题。在ISB705课程中,学生必须解决类似的问题,但现在使用MATLAB和COBRA工具箱中的计算方法[8]。因此,本讲座的具体主题是线性代数,网络建模和MATLAB;MATLAB中的COBRA工具箱;重建代谢网络;化学计量矩阵的性质;磁通量平衡分析;和自动重建。第二讲将大规模建模和组学数据整合到代谢模型及其应用中,例如,通过基于网络的中型药物靶点预测来识别和靶向癌症特异性代谢[9]。这些讲座中还介绍了该课程的PBL概念。
实用 — 周一和周二(第 1 周)
前两天从关于COBRA工具箱的讲座[8]和使用小巧且易于遵循的玩具模型的教程开始(图1)。这使学生能够复习CBM的核心概念。之后,关于小模型的实践课程实际上展示了如何使用COBRA工具箱中的函数以及如何解释模型分析的结果。
缩略图 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 1. 周一分析的玩具代谢模型。
代谢物表示为框,反应被描绘成箭头。玩具网络包含3种代谢物(A,B和C)和5种反应(v1至v5)。
https://doi.org/10.1371/journal.pcbi.1009711.g001
星期一。
ILO:学生在 MATLAB 中学习 COBRA Toolbox V3 的基本用法。他们获得了CBM的概述,包括代谢网络重建,FBA及其应用。
TLA:动手演示和练习,师生互动。
根据导师提供的生化反应列表,要求学生创建2个小玩具模型(图1中给出的示例)。这些模型足够小(最多10个反应和6个代谢物),以确保学生可以轻松理解和复习CBM的核心概念。之后,他们使用COBRA函数回答与模型相关的基本问题,例如"给定物镜的最佳通量分布是多少?"或"该反应可以携带哪个通量范围?"。除此之外,他们还应用了FBA,通量变异性分析(FVA)和对模型进行随机抽样。他们比较和讨论每种方法获得的结果,并观察约束的添加如何影响求解空间。此外,学生学习如何计算最大增长率或进行计算机单基因缺失研究,以确定影响目标函数值的基因。
星期二。
ILO:学生将了解如何通过向模型添加约束来影响求解空间。他们熟悉给定中型型号上的COBRA方法。
TLA:动手演示和练习,师生互动。
学生使用中型模型,如叶绿体碳代谢模型[10](图2)和大肠杆菌核心代谢模型[11],并要求他们分别使用第一个和第二个模型研究2种不同的设置"白天与黑夜"和"正常氧与缺氧"。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 2. 周二分析的叶绿体碳代谢模型。
中型模型,其中代谢物表示为文本,反应表示为箭头。该模型改编自[10]。
https://doi.org/10.1371/journal.pcbi.1009711.g002
首先,他们调查E.大肠杆菌可以在没有氧气的情况下在不同的碳基质上生长,生长培养基和氧气可用性如何影响最大生长速率。此外,通过模拟缺氧,他们探索了生长培养基如何影响基因本质性。尽管模型仍然相对较小,但这些练习可以更深入地熟悉COBRA工具箱和代谢建模中常用的方法。
实用 — 周三和周四(第 1 周)
第三天和第四天致力于使用rFASTCORMICS重建和分析大型特定情境代谢模型[9],并使用交互式脚本进行量身定制的药物预测。在获得置信度 2 天后,现在将大型模型用作通用输入重建。
星期三。
ILO:学生学习如何从一般重建中提取特定于上下文的模型。他们了解自动重建和手动策展之间的区别。
TLA:动手演示和练习,师生互动。-厦门畜牧期刊杂志论文发表
下午,使用人类Recon3D模型[12]引导学生沿着模型重建过程进行,该模型包含10,600个反应,5,835个代谢物和2,248个基因,而这些反应在特定人类细胞中的存在取决于组织,细胞类型和其他上下文信息。具体来说,他们可以获得对输入模型结构,数据可视化和离散化,一致输入模型的构建,介质约束,特定于上下文的重建,基本基因的鉴定以及量身定制的药物预测的见解。应用的rFASTCORMICS [9]管道将在下面更详细地描述。
通过使用交互式 MATLAB 脚本,在此实践会话期间,系统会自动检查每个答案,并且学生会收到即时反馈,使他们能够按照自己的进度工作。此外,还包括一个提示函数,可帮助学生找到用于解决问题的正确方法和/或函数。导师可以在房间或在线获得进一步的帮助,具体取决于设置。
更详细地说,该脚本提示学生通过面对给定的任务来了解如何处理存储模型的结构变量:(i)如何访问结构变量中的每个字段;(ii) 每个字段中存储了多少和什么类型的元素,例如,字段rxns(用于反应)包含10,600个元素或条目;(iii)如何确定哪种反应属于给定途径(称为子系统);(iv) 哪个代谢物存在于哪个隔室中;或(v)哪些基因控制给定的反应。
此外,示例显示了基因 - 蛋白质 - 反应(GPR)规则如何在模型中编码。规则字段以及如何根据 GPR 规则映射反应的表达水平。
在下一步中,将讨论通量一致性和特定于上下文的模型的概念,学生将学习如何使用FAST一致性检查(FASTCC)算法[13]获得通量一致性网络,以及如何使用rFASTCORMICS重建特定于上下文的模型[9]。
该脚本指导学生完成药物再利用的候选预测过程。在这里,学生们在计算机单基因敲除中进行测试,以预测癌症特异性必需基因,并将结果与体外CRISPR高通量筛选进行比较。执行扩充检验(如超几何检验)以评估预测的质量。最后,预测的癌症特异性必需基因被用作药物靶标的替代物,并且从DrugBank[14]https://www.zotero.org/google-docs/?broken=BGKJfy 或另一个数据库中选择对这些基因具有抑制作用的药物作为再利用的潜在候选药物。
星期四。
ILO:学生可以概述FBA和代谢网络重建的可用方法和工具;他们学习如何应用rFASTCORMICS管道以及如何运行其他特定工具,并根据获得的结果获得生物学见解。
TLA:动手演示和练习,师生互动。
作为特定于上下文的模型构建的最终现实应用,使用癌症基因组图谱(TCGA)数据重建乳腺癌代谢模型并随后进行分析。从TCGA-BRCA数据集中随机选择乳腺癌和健康乳房的25个样本[15]。数据以每百万次映射读取(FPKM)的每千碱基转录本片段数获得。该示例旨在解释rFASTCORMICS管道[9],包括使用主成分分析(PCA)的异常值检测,离散化数据的健全性检查,比较特定于上下文的模型,例如,比较路径已被纳入/排除在重建(途径存在率)中,并在计算机单基因缺失中执行,每个都有各自的可视化数字。
PBL(主要是第2周)
ILO:学生应用在第1周学到的CBM技术。他们开发,运行和展示他们的项目想法。他们解决问题,解释结果,批判性思考,并提出可能的改进建议。
TLA:PBL包括实践课程,文献检索,演讲,头脑风暴,师生互动和学生互动。
该课程的PBL概念于第1周的星期一在CBM讲座中介绍,并在周三再次强调。除了一些关于PBL的一般性陈述外,还展示了成功推销和最终演讲的例子。
第二周的工作由3部分组成,每个部分都由导师陪同和支持。
(一) 星期一制定和介绍建立信任措施项目。
建议所有学生根据他们的研究兴趣,在代谢建模领域发展他们的项目想法。例如,这可以通过以已发表的研究论文为起点来完成。模型和组学数据库的提示是共享的。人们可以在BiGG模型[16],虚拟代谢人类(VMH)数据库(https://www.vmh.life)[17]和人类代谢图谱[18]等存储库中找到基因组规模的重建。这种通用重建已经可以用作模型,或者可以使用rFASTCORMICS管道[9]和RNA测序(RNA-seq)数据作为从Gene Expression Omnibus(GEO)[19]或其他表达数据存储库检索的输入,从它们构建特定于上下文的模型。其他数据类型的集成也是可能的。一种常用的策略是,采用符合学生兴趣的出版物来验证论文中的结果是否可以复制,然后找到原始论文中未考虑的新应用或问题。
与导师讨论研究主题,基础模型和数据集,以及制定的研究问题,并检查其可行性。导师在开发一个激励和有趣的项目方面发挥着关键作用,然后通过帮助解决主要的技术障碍来保持它。
(二) 项目执行时间为星期二至星期四。
每个学生都会在7到15分钟的演讲中展示他/她选择的项目,具体取决于学生的总数。之后,每个人都参与同行评审过程,教师和学生对每个演示文稿/想法进行评分。如果学生的平均成绩较高,最多比教师的平均水平高出1分(20分),则将其保留为演讲的成绩。此时,根据成绩进行排名,并且只选择执行阶段的顶级项目。然后将学生分成小组,并在接下来的3天内作为一个团队工作,每个小组在选定的项目上工作。建议每位可用的导师最多2个项目。周二,这些项目由团队合作阶段开始,团队讨论细节并与导师制定工作计划。在接下来的3个项目日中,每天至少举行1次团队会议。可以根据要求进行额外的咨询,但在这个阶段,导师需要在帮助和激励之间找到平衡,但让学生推动他们的项目并承担起责任。很多时候,学生在团队中处理不同的任务,因此使用拼图方法,有助于减少个人工作量,有利于学习,并减少教师的干预。
(三) 星期五介绍和讨论所获得的项目成果。
在最后一天,所有学生都被要求根据小组规模在10到15分钟的演讲中展示所做的工作,然后是5分钟的问答环节。允许在最终演示期间共享项目结果(数字),但介绍和讨论必须是团队每个成员的原创内容。
由于大多数项目不会完成,因此可以重点讨论和展望。对于每个演示者,评分由学生和教师共同完成。
为了进一步巩固已实现的学习成果,我们邀请学生与老师一起参与本教育论文的协作反思和写作。
作业
本课程有3个作业有助于学生的最终评分:
(i) 关于第1周指导实践的报告,其中必须解释和完成每项实践练习;
(ii)在第2周开始时描述项目的简短介绍(推介)。必须提供项目中要使用的目标,数据,模型和工作流程。学生由同龄人和导师进行评估;和
(iii) 在第2周结束时进行最终项目介绍。最终的演示需要包括获得的结果,对项目期间遇到的困难的讨论,解决方案策略以及对未来可能或必要的工作的展望。该演示文稿再次由学生和导师进行评估。
如表2所示,报告、推销和最终演示分别占总成绩的50%、10%和40%。这些百分比可能会根据实际工作负荷进行调整。为了给同伴评分,要求学生考虑演示的清晰度,工作的连贯性,以及想法的新颖性/创新性,项目的可行性/资源的可用性,主题相关性和演示风格。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
表 2. 课程作业标准和评估。
https://doi.org/10.1371/journal.pcbi.1009711.t002-厦门畜牧期刊杂志论文发表
独立学习时间
在时间表中计划了独立的学习时间,以允许学生撰写报告并进行文献和数据搜索,以定义一个连贯的项目。
软件
在课程开始之前,MATLAB(https://www.mathworks.com/products/matlab.html)与"统计和机器学习工具箱"和"曲线拟合工具箱"(可从官方MATLAB附加组件获得)一起安装在教学或学生的笔记本电脑上。
进一步需要的软件包括COBRA Toolbox V3(https://opencobra.github.io/cobratoolbox/stable)和RAVEN Toolbox(https://github.com/SysBioChalmers/RAVEN),rFASTCORMICS(https://github.com/sysbiolux/rFASTCORMICS)以及IBM cplex求解器(免费提供给学者,https://www.ibm.com/products/ilog-cplex-optimization-studio),RStudio(https://www.rstudio.com)和R-cran(https://cran.r-project.org)。
2020年和2021年夏季学期的课程以混合教学模式举行,一些学生在校园内参加,一些学生远程参加。Webex 2.0 用于与现场和非现场的学生和导师进行交流。为了便于学生和导师之间共享脚本和数据,每个学生都有一个 dropit 上的文件夹(卢森堡大学教职员工的文件夹共享 Web 应用程序,可在 https://dropit.uni.lu 获得),所有参与者都可以访问。
先验知识
学生应该熟悉基本的编程(最好是在MATLAB中)以及脚本和函数的执行。还需要对生物学和新陈代谢有一个基本的了解。
教育人员
我们已经成功地与多达20名学生和3名导师一起运行了这门课程。我们建议每个导师2个项目,并根据学生的最大人数对学生进行分组。因此,对于较大的班级,可以将学生安排在稍微大一点的小组中,以免压倒导师。此外,在较大的小组中,可以应用拼图方法,其中每个学生都可以运行项目的特定任务,从而导致更大的班级,但导师的参与较少,除非需要。
有用的资源
转录组学或基因表达数据(例如微阵列或RNA-seq数据)是使用rFASTCORMICS重建模型所必需的[9]。这些数据可以从公共存储库中检索,例如GEO(https://www.ncbi.nlm.nih.gov/geo[19])或ArrayExpress(https://www.ebi.ac.uk/arrayexpress[20])。也可以使用其他资源,例如TCGA联盟[21]提供的癌症患者数据或CCLE [22]数据库中的癌细胞系数据。
模型是从数据库和网站检索的,如BiGG模型(http://bigg.ucsd.edu[16]),人类代谢图谱(https://metabolicatlas.org/gems/repository[18])和VMH(https://www.vmh.life[17])。
Rcran和RStudio [23]及其众多的开源软件包允许预处理和清理数据,执行标识符转换或数据可视化。
工具箱,如COBRA Toolbox [8]和RAVEN Toolbox [24],包含MATLAB和/或python中可以使用的建模和分析脚本。导师提供了一些内部脚本,即修复模型问题或促进结果的可视化。诸如人类代谢图谱[18]和VMH数据库[17]之类的网站有助于在模型之间以及模型组件与数据(即介质组成)之间映射标识符。
此外,运行rFASTCORMICS [9]及其wiki页面的详细教程可以在我们的GitHub帐户上找到:https://github.com/sysbiolux/rFASTCORMICS。
结果
单独开发的PBL项目涵盖了广泛的目标,感兴趣的生物体,模型和数据集(表3),并通过代谢网络的CBM的应用而统一起来。项目包括各种不同的具体方法,如特定于上下文的网络重建,给定代谢功能的优化,FVA,通量采样,应用单基因和组合基因敲除的本质分析,约束生长培养基等。由于这些方法和各自的结果在课堂上进行了讨论,在PBL期间和学生小组内以及最终的演讲中,所有学生都对这些技术进行了基本的接触。最后的发言还对煤层气及其在不同研究领域的可能应用作了极好的总结。在为本文撰写项目摘要的可选期间,一些学生在他们的导师和课程主任的持续指导下,进一步浓缩了获得的结果和经验教训(见S1附录)。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
表 3. 2020年和2021年课程版本第2周PBL中选定的学生项目概述。
https://doi.org/10.1371/journal.pcbi.1009711.t003
为了与PBL的教育目标保持一致,该课程取得了各种学习成果。基于第1周对CBM方法核心概念的简要介绍,学生在第2周设法开发和执行了他们现实生活中的研究问题。在与导师的密切互动中,他们设法学习并应用了额外的CBM方法,并将这些和各自的结果展示给他们的同龄人。学生们以非常不同的速度前进。学习以量身定制的个性化方式进行。并非所有最初计划的目标都能实现,部分原因是计划过于雄心勃勃,还有不可预见的技术问题。但是,导师支持的对这些问题的讨论使学生能够理解观察到的问题,并在时间允许的情况下就如何继续该项目提出有意义的观点。在项目工作期间,导师的参与度通常很高,学生群体中出现了团队精神,导师也出现了团队精神。积极的沟通是关键,首先由导师发起,但学生越来越多地发起。许多学生非常投入,从不知所措转变为充满激情和承担项目所有权的阶段。这最终导致大多数非常好和引人入胜的最终项目演示。
课程的整体成功执行也反映在学生的评估中。在2018至2019学年,它是最受学生赞赏的,因为它与硕士课程中的其他课程相比获得了最高分(图3)。该统计数据基于表4,其中包含学生为评估所有课程而回答的问题,并嵌入了他们对2018年至2019年版高级系统生物学II课程的分数。总体而言,这种匿名课程评估大多给出了非常好的评分。学生各自的详细意见包含在以下讨论中,由教师和学生共同收集。从这些评论和表格中,可以看出学生真正欣赏了课程中使用的教学方法,教学人员的能力和动力,以及各方之间的互动。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 3. 2018至2019学年的学生课程评估分数。
高级系统生物学II课程(第7号,黄色)最受学生的赞赏。MISB,集成系统生物学硕士。
https://doi.org/10.1371/journal.pcbi.1009711.g003
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
表 4. 高级系统生物学II课程的评估表和结果,2018年至2019年版。-厦门畜牧期刊杂志论文发表
https://doi.org/10.1371/journal.pcbi.1009711.t004
有趣的是,与项目宣传(好/非常好/(非常)好)和最终项目演示((非常)好/非常好/非常好)的成绩相比,第1周指导实践报告的成绩(如图4A所示)略弱(一般/(非常)好/好),支持PBL积极影响其绩效以及采用的TLA非常符合计划的ILA的想法。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 4.
(A)每个评估方法的学生总体成绩:学生在最终项目中获得的最高分,这意味着PBL方法对他们的表现有很好的影响。(B)每个课程版本的学生成绩比较:图表显示了学生表现逐年提高的情况,我们认为,这也代表了教学质量的提高,包括课程的方法和内容。PBL,基于项目的学习。
https://doi.org/10.1371/journal.pcbi.1009711.g004
最后,在优秀/非常好/良好/公平/通过/未通过(未通过低于10/20)的定性量表上评估20至0(20是最高等级)的基本数字成绩,这在很大程度上代表了课程的成功。
此外,图4B中还显示了同期学生成绩的比较,见证了学生的成绩逐年提高,这也反映了教学/课程质量的提高。
讨论
经验教训:什么有效?
学生们提出了非常不同和有趣的项目想法,从长远来看,对于其中一些人来说,这些想法可以变成硕士论文项目。为了提出可行的想法,他们首先必须很好地理解CBM可以建模的内容以及建模所需的内容。与其他建模方法(如动力学建模)的区别越来越明显。学生需要自己搜索模型和各自的数据,并且必须决定在第1周学到的哪种方法可以应用于实现特定目标,以及这些方法是否随时可用,即在COBRA或Raven工具箱中。
学生必须积极地面对自己在设计项目时经常出现的问题,并且必须在导师的帮助下找到合适的答案。例如,这涉及资源的可得性和质量,以及不同工作包的时间安排和分享。在更经典的实践课程中,学生通常会遵循一个定义明确和优化的脚本和项目计划,这些脚本和计划不会留下太多的错误空间,也不一定会对不同的步骤进行更深入的思考。错误允许精确指出方法的不完全理解的概念和局限性,这些概念和局限性很容易在为期2周的课程的信息量中被忽视。学生获得了CBM的实践经验,并学习如何解决项目中出现的技术或科学问题。参与,积极思考,积极的氛围,称职的教学人员和足够的指导是学生特别欣赏的,正如2019年课程评估所显示的那样。另一方面,对于一些学生来说,高度参与是一把双刃剑,他们还宣称,项目阶段所需的模型和数据的可用性以及时间限制,是使课程在他们看来要求很高的原因(具体评论可以在表4中找到)。
最后,学生们必须两次展示他们的项目,一次在开始时作为推介,一次在最后展示和讨论获得的项目结果。因此,他们可以批判性地评估最初计划工作的可行性以及作为其项目基础的研究论文的假设和结果的有效性。对所获得结果的解释非常有趣,因为学生经常证明对他们的工作持批判性态度,但也对用作项目骨干的论文,数据或模型持批评态度。他们更好地理解了已发布的数据或模型并不总是具有良好的质量。因此,他们的项目向他们展示了质量控制和批判性思维的重要性。
吸取的教训:什么是具有挑战性的,哪些是可以加强的?
本课程的主要挑战是什么使它变得有趣。学生可以提出非常不同的想法,包括多种数据类型,模型,生物体和分析管道。因此,第一个挑战可能是所需的数据预处理。数据并不总是可用的格式,必须转换,例如,rFASTCOMRICS管道的计数转换为FPKM,或者质量可能较差。如果学生在第1周结束时已经对项目,各自需要的数据和模型有了具体的想法,那将是有用的。这将允许导师检查输入的质量,并在必要时准备一些预处理,以使学生能够更多地关注建模并避免在项目期间更改数据集。
将这些项目构建为黑客马拉松,学生将有一个目标要实现(例如,从先前确定的表达数据中识别已知的代谢必需基因)可能会有所帮助。此外,它可能有助于减少教师在实践中的工作量,并允许学生更好的团队合作。另一方面,在先前确定的数据和已知解决方案的情况下,它可能会限制学生的创造力。此外,黑客马拉松可能会提供一个机会,让学生使用代谢模型来解决问题,学生可以自由地探索不同的管道。
除了与主题多样性相关的挑战外,还需要考虑学生背景的异质性。有些学生的编程技能非常有限,而其他人过去已经使用过COBRA模型(例如,在他们以前的学习期间)。因此,通过整合的混合学习概念,例如,通过要求学生观看预先录制的课程并填写各自的作业,可以实现更好的学习成果。这将有助于启动课程的基本先决条件,例如MATLAB的入门水平和探索GEO的基本生物信息学技能等。此外,这可能是为大班授课的简单解决方案,因为它可能会减少教师的工作量。
尽管混合教学采用了技术解决方案,但2019年冠状病毒病(COVID-19)大流行使与学生的互动变得更加困难。远程指导学生进行这样的项目是很困难的,因为导师需要花时间与个别学生一起检查他们的代码,讨论项目的细节,并澄清某些疑问。当讲座远程进行时(在2020年夏季学期),这是在一对一的电话中完成的。特别是在第2周结束时,学生有时不得不等到导师可用,尽管Moodle学习平台上有可用的问答论坛,但如果需要对细节的快速回答,这可能会令人沮丧。此外,在同一物理教室中通过窃听其他讨论来学习的积极影响在在线环境中会降低。在2021年夏季学期采用混合教学环境使辅导和沟通变得更加容易,因为只有少数学生远程参加课程,并且可以与远程导师一起在小组中工作。然而,对于混合形式,同时在现场和在线处理讲座是相当困难的,因为需要不断确保在线学生可以看到董事会或在线学生可以听到观众提出的问题。课堂或 Webex 的声音必须静音,以便能够在小组中工作,并减少对其他项目讨论的干扰。这创建了2个独立的小组,远程导师和学生不一定收到所有指示和信息。
最后,关于课程作业和技术问题,将报告作为第1周指导实践的作业并不是最佳的,因为报告往往从一代传递到另一代,迫使导师定期更新和调整任务。此外,交互式 MATLAB 脚本还存在一些不可预见的小问题(第 1 周的周三和周四)。例如,它事先没有在运行macOS的机器上进行测试,这导致了一些问题,因为一些学生使用他们的私人Mac机器。此外,每台机器的运行方式略有不同,这可能会导致由于数值问题而略有不同的结果,并且必须更改一些预设的答案以适应获得的各种结果。由于允许学生使用他们的计算机进行他们的项目,这有时对导师来说可能是一个挑战,因为学生可能有不同的操作系统,有不同版本的所用软件,或者没有安装或工作所有工具箱,因为某些依赖关系已经过时。例如,问题的一个常见来源是过时的Java版本。因此,我们正在探索新的解决方案,例如,创建一个安装了所有必需工具的虚拟机,学生只需登录即可使用。
结论
本课程具有指导性实践与PBL相结合,是在系统生物学或计算生物学课程中教授代谢网络建模的绝佳方式。它允许学生在现实生活中的场景中工作并增强学习。这样的课程需要精心准备,并根据确切的课程内容以及学生和可用导师的数量进行调整。它需要并促进教师和学生的积极参与,总体上是一种非常有益的教学体验。
支持信息
2020年和2021年课程版本第2周PBL中所选学生项目的描述。-厦门畜牧期刊杂志论文发表
跳到无花果导航
1S1附录:详细的学生项目描述,如表 3.描述由每个起草学生在项目工作结束时作为学习过程的一部分,并且是只有由导师勉强编辑留下对水平和多样性的印象。P1:为马来酸盐设计一种合成途径大肠杆菌–苔茜·普罗哈斯卡介绍在科学和研究中,细菌是遗传研究的有用而强大的工具,因为,与真核生物相比,它们的基因组大小相对较小,这使得它更容易保持对所研究生物体的良好概述。最常研究的细菌之一是大肠杆菌(大肠杆菌),其基因组大小约为4000个基因,其大小为t人类基因组大约有30000个基因。这是最好的之一-研究地球上的生物因为它有良好的-表征生物化学和生理学。大肠杆菌用于生物医学研究,因为它更容易操纵其基因组而不会紊乱自然基因组及其功能(1)。它已成为代谢工程的流行候选者生产化学品,燃料,药品和药品。马来酸盐是一个重要的二羧酸,是用于合成的重要成分高分子材料如药品。2017年,一个研究小组首次成功修改了大肠杆菌通过引入一种新的合成途径来生产马来酸盐(2)。目的该项目旨在重现论文发布的结果2017年由Noda等人提出,设计了马来酸盐的合成途径(2)。我们的想法是选择一个大肠杆菌模型和引入所需的反应以重建代谢重塑大肠杆菌型。后添加新的合成途径,下一个步骤将是一个人可以优化的某个程度在不杀死细菌的情况下增加马来酸盐产生的途径。材料和方法第一步是选择一个大肠杆菌项目的模型。所用的名称大肠杆菌型号是iEC1344_C瓦ich可以从BIGG模型网站下载。选择后模型,下一步是添加所有需要的反应以创建修改大肠杆菌.这篇文章的想法是扩展唱诗班通路,以便最终大肠杆菌能p马来酸芸螈本身。要将反应正确添加到模型中,KEGG 数据库被使用。需要添加八种反应,以便大肠杆菌能够生产马来 酸。创建修改后的大肠杆菌模型,下一步是看一个人能走多远优化马来酸盐生产。在此过程中,生物质生产同时进行观察到,因为如果一个人想对生物体进行基因改造以产生新的分子新添加的反应一定不能减少寿命上限生物体的一致性。生物体应产生尽可能多的马来酸盐,但仍应产生一定量的马来酸盐
2生物量。最后的研究点是看是否优化了某些交换反应和如果这会影响马来酸盐生产uction.组件计数(原始型号)计数(修改后的模型)基因13441349代谢 产物19341941反应27262734S1表 1.基因数、代谢物和反应数E.大肠杆菌模型之前和之后添加所需的反应。结果第一步是创建一个在现实生活中可以生存的模型。添加所有对原版的新反应大肠杆菌模型,第一个需要解决的问题是一个人不能简单地把所有的流动都推向可怕的从那时起的马来酸盐的生物质产量将为零,这意味着模型无法生存。此问题可能通过两种解决方案来解决:优化马来酸盐和生物质生产或固定较低的生物量的极限。第一个解决方案是给予高生物质产量,但相当适度生产马来酸盐,这不会实现该项目的目标。这第二种解决方案是给予高马来酸盐产量,生物质产量仍然很高足够高,我s 为什么应用此解决方案。创建转基因大肠杆菌模型是寻找可以优化的进一步反应增加马来酸盐的产生。增加马来酸盐产品的第一个因素上将是氧气。增加生活环境中的氧气供应或过度表达所有产生氧气的反应-产品或主要产品会增加马来酸盐生产。添加更多的矿物质,如钾和钙在介质中将增加生物质产量,这将有助于延长生物质的生存时间大肠杆菌但不会直接影响马来酸盐的产生。最有趣的发现是优化磷酸盐(摄取)的交换反应恢复了生物质和同时产生马来酸盐。总结在这个项目中,人们可以看到,从理论上讲,修改基因组是可能的。的大肠杆菌使生物体能够产生必需的分子莱特不干扰生物体的功能。代谢模型显示生物体可以产生足够的马来酸盐,并且仍然能够为生命留出足够的能量-重要的生物质反应。此外,进一步的反应e 找到哪些可能是通过改善生长和生活环境进行优化大肠杆菌比如保留有氧环境中的细菌或通过添加喂养补充剂,如钾或磷进入细菌的培养基。总之,创建改进的代谢模型
下载
无花果
S1 附录。 2020年和2021年课程版本第2周PBL中所选学生项目的描述。
这些描述是由个别学生撰写的,作为学习过程的一部分。PBL,基于项目的学习。
https://doi.org/10.1371/journal.pcbi.1009711.s001
(英文)
确认
本文报告了PBL方法在高级系统生物学II(ISB705)课程中的应用。然而,这种方法已经在ISB705和ISB702(系统生物学实践,重点是信令网络建模)课程中开发了5年多。因此,我们要感谢卢森堡大学DLSM系系统生物学小组的所有前成员,他们没有参与本手稿的撰写,但确实通过他们在ISB702课程中的工作为这种教学方法的发展和成功做出了贡献。
引用
1.Helle L, Tynj?l? P, Olkinuora E. 基于项目的高等教育学习 - 理论,实践和橡胶弹弓。高教育 2006 512.2006;51(2):287–314.
查看文章谷歌学术搜索
2.Kokotsaki D,Menzies V,Wiggins A.基于项目的学习:文献综述。http://dx.doi.org/101177/1365480216659733。2016 7 月 20;19(3):267–77.
查看文章谷歌学术搜索
3.Via A, Rivas JD Las, Attwood TK, Landsman D, Brazas MD, Leunissen JAM, et al. 开发简短生物信息学培训课程的十条简单规则。PLoS 计算机生物学 2011 年 10 月;7(10):e1002245.pmid:22046119
查看文章PubMed/NCBI谷歌学术搜索
4.Wilkinson MD, Dumontier M, Aalbersberg IjJ, Appleton G, Axton M, Baak A, et al.科学数据管理和管理的FAIR指导原则。科学数据。2016 31.2016 3 月 15;3(1):1–9.下午:26978244
查看文章PubMed/NCBI谷歌学术搜索
5.Via A, Blicher T, Bongcam-Rudloff E, Brazas MD, Brooksbank C, Budd A, et al.生命科学家生物信息学培训的最佳实践。简要生物信息。2013 9 月 1;14(5):528–37.pmid:23803301
查看文章PubMed/NCBI谷歌学术搜索
6.Blumenfeld PC,Soloway E,Marx RW,Krajcik JS,Guzdial M,Palincsar A.激励基于项目的学习:维持实践,支持学习。https://doi.org/101080/0046152019919653139。2011 6 月 1;26(3–4):369–98.
查看文章谷歌学术搜索
7.埃默里LR,摩根SL。基于项目的学习在生物信息学培训中的应用。PLoS Comput Biol. 2017 8 月 1;13(8):e1005620.下午:28817584
查看文章PubMed/NCBI谷歌学术搜索
8.Heirendt L, Arreckx S, Pfau T, Mendoza SN, Richelle A, Heinken A, et al.使用 COBRA 工具箱 v.3.0 创建和分析基于生化约束的模型。Nat Protoc.2019 143.2019 2 月 20;14(3):639–702.下午:30787451
查看文章PubMed/NCBI谷歌学术搜索
9.Pacheco MP, Bintener T, Ternes D, Kulms D, Haan S, Letellier E, et al.通过基于网络的药物靶点预测来识别和靶向癌症特异性代谢。电子生物医学。2019 年 5 月 1 日;43:98–106.pmid:31126892
查看文章PubMed/NCBI谷歌学术搜索
10.Poolman MG,Fell DA,Raines CA.叶绿体基质中光合物代谢的基本模式分析。欧 J 生物化学.2003 2 月 1;270(3):430–9.pmid:12542693
查看文章PubMed/NCBI谷歌学术搜索
11.Orth JD, Thiele I, Palsson B?.什么是磁通量平衡分析?纳特生物技术。2010 3 月;28(3):245–8.下午:20212490
查看文章PubMed/NCBI谷歌学术搜索
12.Brunk E, Sahoo S, Zielinski DC, Altunkaya A, Dr?ger A, Mih N, et al.Recon3D可以实现人体新陈代谢中基因变异的三维视图。纳特生物技术。2018 363.2018 2 月 19;36(3):272–81.pmid:29457794
查看文章PubMed/NCBI谷歌学术搜索
13.Vlassis N,Pacheco MP,Sauter T.紧凑上下文特异性代谢网络模型的快速重建。PLoS计算生物学 2014 1月;10(1):1003424.pmid:24453953
查看文章PubMed/NCBI谷歌学术搜索
14.Wishart DS, Knox C, Guo AC, Cheng D, Shrivastava S, Tzur D, et al.DrugBank:毒品,毒品行动和毒品靶点的知识库。核酸研究 2008 Jan 1;36(suppl_1):D 901–6.
查看文章谷歌学术搜索
15.Rahman M,Jackson LK,Johnson WE,Li DY,Bild AH,Piccolo SR.癌症基因组图谱中RNA测序数据的替代预处理导致分析结果的改进。生物信息学。2015年11月15日;31[22]:3666–72.pmid:26209429
查看文章PubMed/NCBI谷歌学术搜索
16.King ZA, Lu J, Dr?ger A, Miller P, Federowicz S, Lerman JA, et al. BiGG Models: 一个用于集成、标准化和共享基因组规模模型的平台。核酸研究 2016 Jan 4;44(D1):D 515–22.pmid:26476456
查看文章PubMed/NCBI谷歌学术搜索
17.Noronha A, Modamio J, Jarosz Y, Guerard E, Sompairac N, Preciat G, et al.虚拟代谢人类数据库:将人类和肠道微生物组代谢与营养和疾病相结合。核酸研究 2019 Jan 8;47(D1):D 614–24.pmid:30371894
查看文章PubMed/NCBI谷歌学术搜索
18.Pornputtapong N,Nookaew I,Nielsen J.人类代谢图谱:人类代谢的在线资源。数据库。2015 1月 1;2015.下午:26209309
查看文章PubMed/NCBI谷歌学术搜索
19.克拉夫 E, 巴雷特 T.基因表达综合数据库。方法 Mol Biol. 2016;1418:93–110.pmid:27008011
查看文章PubMed/NCBI谷歌学术搜索
20.Sarkans U, Parkinson H, Lara GG, Oezcimen A, Sharma A, Abeygunawardena N, et al.ArrayExpress基因表达数据库:软件工程和实施视角。生物信息学。2005 4 月 15;21(8):1495–501.pmid:15564302
查看文章PubMed/NCBI谷歌学术搜索
21.WG.的TIP-CA联盟全基因组的泛癌分析。自然界。2020 2 月 6;578(7793):82.下午:32025007
查看文章PubMed/NCBI谷歌学术搜索
22.Ghandi M, Huang FW, Jané-Valbuena J, Kryukov G V, Lo CC, McDonald ER, et al.癌细胞系百科全书的下一代表征。自然界。2019 5697757.2019 5 月 8;569(7757):503–8.下午:31068700
查看文章PubMed/NCBI谷歌学术搜索
23.Allaire JJ. RStudio: Integrated Development Environment for R.
24.Wang H, Marci?auskas S, Sánchez BJ, Domenzain I, Hermansson D, Agren R, et al. RAVEN 2.0: 一种用于代谢网络重建的多功能工具箱和一个关于腔叶链霉菌的案例研究。PLoS Comput Biol. 2018 10月 1;14(10):e1006541.pmid:30335785
查看文章PubMed/NCBI谷歌学术搜索
25.Monk JM, Koza A, Campodonico MA, Machado D, Seoane JM, Palsson BO, et al. 多组学大肠杆菌物种变异的定量 将分子特征与菌株表型联系起来。细胞系统 2016 Sep 28;3(3):238–251.e12.pmid:27667363
查看文章PubMed/NCBI谷歌学术搜索
26.Magnúsdóttir S, Heinken A, Kutt L, Ravcheev DA, Bauer E, Noronha A, et al.为人类肠道微生物群的773个成员生成基因组规模的代谢重建。纳特生物技术。2016 351.2016 11 月 28;35(1):81–9.下午:27893703
查看文章PubMed/NCBI谷歌学术搜索
27.阿巴斯AR,鲍德温D,马云,欧阳W,格尼A,马丁F等人。计算机免疫应答(IRIS):从微阵列表达数据汇编中鉴定出的免疫特异性基因。基因免疫. 2005 64.2005 3 月 24;6(4):319–31.pmid:15789058
查看文章PubMed/NCBI谷歌学术搜索
28.Prots I,Skapenko A,Lipsky PE,Schulze-Koops H.开发诱导调节性T细胞的转录程序分析。普洛斯一号。2011;6(2):e16913.pmid:21347372
查看文章PubMed/NCBI谷歌学术搜索
29.Lund R,Aittokallio T,Nevalainen O,Lahesmaa R.在CD4 +淋巴细胞早期极化期间鉴定由IL-12,IL-4或TGF-β调节的新基因。J 免疫学.2003 11 月 15;171(10):5328–36.下午:14607935
查看文章PubMed/NCBI谷歌学术搜索-厦门畜牧期刊杂志论文发表
30.Bordbar A,Lewis NE,Schellenberger J,Palsson B,Jamshidi N.通过代谢重建深入了解人类肺泡巨噬细胞和结核分枝杆菌的相互作用。Mol Syst Biol. 2010;6.下午:20959820
查看文章PubMed/NCBI谷歌学术搜索
31.Sigurdsson MI,Jamshidi N,Steingrimsson E,Thiele I,Palsson BT.基于人类Recon 1的小鼠代谢的详细全基因组重建。BMC 系统生物学 2010 十月 19;4(1):1–13.pmid:20959003
查看文章PubMed/NCBI谷歌学术搜索
32.Aller S, Scott A, Sarkar-Tyson M, Soyer OS. 综合人病毒代谢化学计量模型可预测针对基孔肯雅热、登革热和寨卡病毒的基于宿主的抗病毒靶点。J R Soc 接口。2018 九月 1;15(146).pmid:30209043
查看文章PubMed/NCBI谷歌学术搜索
33.Yizhak K, Gaude E, Le Dévédec S, Waldman YY, Stein GY, van de Water B, et al.基于表型的细胞特异性代谢建模揭示了癌症的代谢责任。埃利夫。2014 年 11 月 21 日;3(11 月):1–23.下午:25415239
查看文章PubMed/NCBI谷歌学术搜索