一年的反思 ——给高中iGEMer的快速入门指南与工具速查表

前言

这是我打了一年iGEM后对整个项目的反思和总结,旨在总结相关经验和汇总使用过程中用到的工具和学到的经验。
工具列表与部分内容将会随着时间逐渐过时,本文章可能但不保证会在某些时间节点进行更新,敬请谅解。

你是否适合参加iGEM竞赛?

iGEM竞赛简单来说主要分为了实验,HP和软硬件三个主要的分支。
从正常来说,实验组所负责的贯穿了你的整个项目,从最初的选题,实验流程的设计和操作到最后的实验结果验证和分析,对于一个高中组的学生来说,这需要有较强的自我学习能力和对项目有充分的理解。除此以外,蛋白相关的实验失败的概率很高,而过程又会消耗很多的时间,如果对合成生物学,生物实验没有很高的热情,在这个过程中很容易把竞赛变成负担,在加入之前需要考虑好自己对这个学科的热情能否支撑自己走到最后。
软硬件组主要负责的是前期通过建模对实验和整体项目做出理论基础(蛋白结构,活性位点,化学键分析,传播模拟,代谢通路分析等),为特殊实验制作硬件以及相关软件,在实验结果和社会学影响上使用数学建模进行分析(SEIR,酶活标曲,影响力估计等),以及后续的wiki搭建,视频剪辑等等,当然,有些团队也会考虑美工等等。该组需要有一定的数学功底或学习能力,能够熟练的使用数据检索找到适合自己的模型。
HP组更多的注重在社会影响力,这需要你能有足够好的点子为普及科学教育,增强科学的包容性等多个方面做出贡献。此外,为了实现你的点子,你大概率也需要一定的社交能力等

快速入门指南:我要干什么?

选题

选题是一个团队的基础,作为一个纯血的高中队伍(没有大牛指导老师给你砸大量实验思路,没有商业团队的大量资金等),想要做出一定的基础性进展或者一些完全创新的东西可谓是难上加难,其主要困难在于精力,金钱和资源。因此,高中团队一般会围绕现有的蛋白进行优化,重组和进行一定的工程学上的通路组合以达到目的。
在选题时,可以首先考虑当下有什么想要做的,然后进而去思考现有的成果能否通过进一步的优化和研究达到我们希望的结果,并进一步明确选题,达到目标。打个比方,比如今年我想去做癌症相关的内容,那么我们可以去iGEM项目库中寻找之前团队的内容,并在其基础上进行进一步的优化。但事实上,作为一个高中团队,许多时候你会有很多好的想法但你所拥有的能力和资源不能支撑你完成实验,进而,你可以退而求其次,去思考引发癌症的疾病。例如,肝癌的常见病因有各种各样的肝炎,而最近AGA的指南中新增了NAFLD导致HCC风险上升并建议筛查,而Nature上恰好有新发布的人体肠胃微生物通过一种酶降解尼古丁降低NAFLD发病概率的文章,于是,我们可以将研究重点放在这种酶上,并对其进行优化。优化方面也有多种思路,比如通过突变活性位点增强酶活,通过各种技术增强表达效率,降低成本,以及增加表观修饰,使用营养缺陷型工程菌增强安全方面,加强应用可能,甚至可以将不同蛋白一起表达,一次性完成代谢通路,或者改变工程菌的内源的代谢通路,通过敲除不同的代谢通路完成对目的蛋白的过表达或者使用内源的蛋白完成整体的代谢通路等等。相关的可以参考往届的优秀项目,或是NCS及其子刊的一些相关进展。

建模

在明确目标后,首先需要通过建模的方式为实验提供理论基础,而不是盲目蛮干,在试验后也需要建模进行结果验证。以下提供一些基础的思路和建模的工具等等。

项目可行性,背景与用途

你的项目是否能解决实际问题?这是建模首要的一关。例如,对于一个传染病(虽然出于安全原因高中组大概率做不了),我们可以使用SEIR模型分析传播趋势和介入的影响。对于植物传染病,我们可以通过模拟的方式对一个地区的风力,气候等等环境因素进行建模,辅以感染机理的研究,以此计算出我们能在哪一步介入,以及介入能对其造成多大的影响。
在这里我无法推荐任何可能的思路或工具,这取决于你的项目本身。但去SCI上找一找你的项目(尤其是传染病,有供需问题等等)的有关论文或者先前的iGEM项目,看看他们是如何撰写背景的,然后深入的研究一下相关的模型(当然,如果你的数学建模能力比较厉害也可以选择自己抽象出一个模型),代入到你的条件中进行计算。

结构分析

对于一个较新的酶,当你需要对其进行优化或与其他蛋白结合形成通路时,一般需要先了解其结构以防止活性位点受到影响,或对活性位点进行分析以获得其化学键等相关特征,此外,获得蛋白结构也可以帮助你对整体蛋白稳定性进行分析,基于此可以对蛋白的热稳定性等一系列进行优化。
对于高中组来说,能够为实验提供理论基础的包括但不限于以下思路:

  1. 通过点突变分析酶活:首先,你需要获得蛋白与小分子结合的XRD结果图,并分析其活性残基,得到结果。当然,对于一些新酶来说,很有可能压根就没有相关数据,此时,可以使用SWISS-Model直接分析活性位点,或使用蛋白质结构预测和小分子对接的方式完成。具体方式写于最后的工具使用部分。
  2. 复合蛋白的可行性:其根本在于考虑复合蛋白的linker是否会影响活性位点的结构,同理,使用蛋白结构预测即可。如果不确定,使用小分子对接进行模拟也是很好的方式。

代谢通路相关

对于高中组的学生,在这里可以考虑的是蛋白或/和酶活反应的产物会不会对工程菌本身的代谢通路(尤其是全菌环境或表面展示一类)造成影响或有毒性,或细菌的一些内源蛋白不是我们想要的,并通过基因工程的方式对工程菌进行工作。当然,这里也可以加入一些安全性相关的因素:如使用营养缺陷型工程菌,采用自杀质粒将自杀开关加入细菌中等等。
此外,可以使用一些系统生物学工具对流平衡进行分析,以此为自己的代谢通路改变相关做出理论的基础。

质粒与生物组件本身

对于质粒本身,其包含了除目的片段以外我们所需的几乎一切获取目的蛋白所需要的东西,但这里面存在一定的可改动空间。例如,不同的启动子的表达能力不同,在有些特殊情况下,可能需要使用低表达量的启动子才能不影响工程菌本身。此外,不同的质粒纯化方式,表达位置有不同,例如在周质空间中表达的蛋白对二硫键的正确折叠有一定帮助,而Histag在某些时候结合并不良好,可能会降低纯化效率等等。这些问题在实验时发现,是可以通过查找文献甚至模拟的方式实现。

结果分析

对于高中组,结果一般通过荧光量,UV波峰偏移,HPLC等方式实现,一般来说,相关参数可以通过搜索文献的方式获得,自己造轮子则需要大量经验,可以通过学习他人的实验方式加之尝试或请教指导老师获得一些经验性参数的方式实现。
这里需要一些数学计算,完成从图像到定量、半定量的转化。

实验

在有理论基础后,制定试验方案是极为重要的。在考虑实验方案时,应考虑如何获得你们预想的目的蛋白,使用pcr技术获得整合好的质粒,并进行蛋白的表达与纯化,最后进行结果验证。在此过程中,野生型的复现最好遵循原论文的方法如质粒选择,纯化方法,酶活测定方式等等,对于构造的融合蛋白如果能选择相同的质粒可以减少纯化时所需的步骤和溶液等,但也可根据实际需求进行更换。对于酶活检测,一般的理论基础为米氏方程,因此,你需要比对的是控制蛋白量,底物浓度相同,比对产物或底物减少的速率(反应速率)计算出最终的米氏常数。在此过程中,你需要想好检测物是什么,你可以选择使用荧光蛋白间接测量,也可以使用UV,HPLC,LC-MS等通过制作标曲直接测量,对于融合蛋白你也可以选择使用中间产物进行测量。一般来说,由于UV的检测快成本低,优先可以尝试使用UV,但更多的情况下请遵循原论文。
此外,请记住,实验笔记是一个好习惯。

HP

HP的本质在于如何将你的项目向世界推广并让社会从中受益,这件事可以有许多的发散性思维,去看看别人的wiki,或许会有更好的想法。

Promotion Video, Presentation Video, wiki

顾名思义,第一个视频的目的是介绍你的项目并让别人对你的项目感兴趣。第二个视频则是更精细的讲解你干了什么,而wiki则相当于一个说明书,让别人理解你的项目,并能实现项目的复现,复用和后续优化。

常用工具与小技巧

相关工具知乎,哔哩哔哩都有很详细的教程,笔者打竞赛时也是摸索出来的,在此不再赘述。

各种奖项和要求的解释

请直接去iGEM官网评奖页面查找
请直接去官网

Parts, Basic Part & Composite Part

Parts的直译是生物原件,你可以把合成生物学产出的那个复合蛋白理解为一个电路,当遇到什么环境或物质的输入,可以通过它产生一个对应的输出。Basic part可以理解为电路里的电阻,电容等单个的元器件,这一个part对应的蛋白质有对应的作用,它可以是分解某些东西,也可以是在特定环境下产生毒性,也可以是碰到某个物质触发后续基因不被表达为蛋白质等等。Composite part则是一些basic part的组合,这可以产生一整条逻辑链路,并完成一些复杂的功能。

建模与实验设计相关

基因序列查找

原论文及其补充材料,NCBI都是好地方。

蛋白结构查找

RCSB数据库ncbi,如果你的蛋白没人做过核磁或者XRD,可以去AlphaFold数据库看看有没有别人模拟的结果。

蛋白质结构模拟

如果你找不到现成的数据:
AlphaFold v2的模拟准确度较高,Google colab版本可以免费使用,也可以去各个超算平台租算力来跑。
好用的教程指路:https://zhuanlan.zhihu.com/p/609120902
ps:你可以在教程输入序列那一步后直接在上面选择运行全部命令行,更加方便而且基本不会报错。

活性位点分析

核磁和XRD准确度最高,但如果你没钱或者不想点晶体,可以试试分子动力学模拟。当然,如果只需要静态结果我更推荐AutoDock-Vina,准确性还可以。

蛋白互作相关

蛋白互作可以采用GROMACS做模拟,或使用ChiPPI(本人没用过,不做保证,不过有其他团队推荐过)

蛋白质pdb,pse文件查看,出图

pymol,可以申请免费的学术许可证,教程网上也比较丰富。
YASARA,可以配合FoldX测量更多蛋白质参数。

蛋白性质分析

FoldX,配合YASARA更方便,热稳定性,loop等都可以分析

对接,建模结果分析

Proteins plus ,可以预测蛋白质与小分子的活性中心,活性残基以及相互作用,通过相互作用可以进一步的分析如何优化和加强,以及酶活终止方式和测量方式的选择。
Cytoscape可以辅助蛋白互作出图和可视化,也是个好东西。但我们的项目没怎么做蛋白互作,所以这个使用不深。

数学建模

MATLAB,永远的神…可以配合simulink做各种系统的仿真,数学建模和仿真都很好用(

Excel,返璞归真,做图表很方便

引物设计与质粒构建

这里不讲如何设计,教程随便找个知乎写的都比我好()
厂家提供的引物计算工具是首选,结合cg和Tm可以自己略作更改
SnapGene,真的好用,可以直接找到基因内的酶切位点方便筛选可用的酶切位点,设计引物时Tm的计算,CG%的计算也比较方便,并且可以通过模拟的方式直接模拟与质粒链接。可惜要付费()
mFold,用于DNA和RNA的二级结构预测,可以更改环境,出图也比较美观,也有在线的免费服务器。

系统生物学相关

COBRApy,用于计算模拟代谢通路
Cytoscape,可视化代谢网络图

实验相关

实验教程

优先使用生产商和试剂盒中的说明书,此外,B站,知乎,丁香园和搜索引擎是个好东西。

你不知道要怎么做?

搜索引擎搜索你要达成的操作,找相关的论文或者技术简介,寻找类似方案,理解他们,然后对照自己的项目修改

经验,经费,场地?

高中组的学生一般需要和外部实验室合作完成实验,这个时候实验室的学长学姐就是你重要的经验来源。PCR,纯化等等实验考验操作手法,试剂配比需要经验,因此请时常聊天交流学术内容,有意想不到的收获(而不是去实验室拍照炫耀以及加帅哥微信(恼))。
公共平台是个好地方,质粒转不进去?去公共平台搞个电转化,产物分不出来?公共平台荧光谱,光电谱,偶联检测,探针,成本低都试试。总之,公共平台的资源很丰富,多去问问合作实验室的师兄。

wiki&Video

wiki制作相关

Gitlab page给了你一个很好用的模板,readme中也提供了文档链接。一般来说,美化使用css即可,可以现在f12里加好,调试后再写入gitlab。此外,控制台请使用弹出窗口,响应式页面会受页面宽度影响。

使用markdown编辑器写wiki文章是个好习惯,可以引用igem upload中的图片,文字等。此外,直接导出html导出并给各个分级添加class即可完美嵌入页面,不需要手动加换行符和标题,表格兼容性也很好。

LaTex/MathML编辑器用于写公式

Gitlab page用vue还可以,此外建议好好改html界面,学html5和css不耗时间

使用iframe导入pdf格式的notebook可以防止出现外链引用导致不能过检测

让美工提供照片的时候提供拆分图层,要不然响应式不拆分要人命

Video相关

记得把intro视频算进正片时间,提前看好官网要求的项目横纵比,帧率,画质要求等

字母生成软件识别英文不一定准,可以考虑把稿子分好后使用讯飞之类的工具对时间码

提前上传,最后巨卡无比

勘误与修正

作为高中生,我很难做到100%正确的文章内容,但我会在获得新的知识后及时审查与修正相关内容。如您发现文章有需要修正,增加的内容,请您在本文章下回复或联系邮箱[email protected],感谢!

Special thanks to all members of BJEA-China 2023 and all iGEMers.

再见,希望不会忘记"等待,并满怀希望"
希望他能成为我在这个世界上留下的最后的东西