第一百零五章 生命禁区
果然,一切都充满“惊喜”。
迈过那道加大加宽的黄色屏蔽门后,映入眼帘的是四个红色大横幅,上面写着:
头上悬着三把剑:
如何逆转非编码区基因变异进程?
腺病毒究竟如何通过影响非编码rna影响植物?
倒计时2555天。
卢赫掐着指头算了算,2555天差不多是7年。
不是还有13年吗,怎么还缩水了呢?这可不是什么好消息。
满腹狐疑地经过那套熟悉的复杂流程,他来到了实验室内,明亮的灯光刺得他睁不开眼睛。
这些镶嵌在吊顶上的巨大灯管,散发着一种奇异的色彩。他很久没见到过如此通透的白色了。
适应了光线之后,他发现在一排空荡荡的生物安全柜前站着一个熟悉而陌生的身影,正抬头直视着头顶的灯管,看得很入神。
他悄悄走过去,绕到对方侧面,果然是一张熟悉的脸。
“你又挺过来了?可喜可贺啊。”他忍不住调侃道。即便在知道事情原委之后,他早已对曾经把他给折腾不轻的事情释然了,但面对眼前的枯槁小老头,还是没忍住。
对方没有回应他,依然抬头望着灯,自顾自地说:“看到这些纯白色的灯了吗?多么纯净的颜色。”
“日光灯谁没见过?汞蒸气产生紫外光,紫外光轰击荧光粉后的二级光子,就是纯净的白光。好看舒服但是费电,奢侈!”卢赫忍不住批判。
对方摇了摇头,“这可不是日光灯,而是节能led。蓝色自发光材料的催化过程被攻克了,全光谱led已经开始量产。即便维持能源现状,以后所有人也都能拥有灯光自由。”
卢赫不以为然地点了点头。他对这些并不感冒,心里满满都是对7年倒计时的疑惑,“门口的标语看到了吧,倒计时只有7年,为什么?”
对方把目光投在卢赫脸上,缓缓开口:“因为我从最后一次被编辑,到第一次发病,期间间隔了7年多。”
卢赫愣了一下,“我们的基因相似度大概还剩99.6%,你的现在是多少?”
“时间太久远,我无法考究到我的原始基因组,我目前的基因组和时间间隔最久的一次,相似度是99.2%。”
“呦呵,那海总您要保重啊,再过几个月,你和最初的你说不定就生殖隔离了!”
对方的脸上飘过一丝无奈,“我正好要找你,我们正在建立数据集,需要我尽可能多的基因组数据。2年前你跑到我公司揪下来的我的头发,还有没有?”
卢赫转了转眼珠,“没了,不过我可能还有测序结果,在我家里放着。”
“放哪里了,我让人去取一下。”对方语气惊喜。
“没必要。”卢赫回忆起往事,“我当初从你头发里提了三组基因,分别寄给三个公司测序,其中就有你们公司。你调下数据就行。”
“找过了,没有。可能大停电的时候,损失了。”
卢赫无奈道:“我能先问下你们目前是什么思路吗?你要搞机器学习?那种不可解释的黑箱,有用吗?”
对方点头认可,“没错,我们就是要做机器学习,而且是具备可解释性的小样本机器学习。至于你说的黑箱,就算有些方法是黑箱,但好用就行了。
你们之前用的crispr脱靶分析软件,其实就用了这种技术。那是巨硬亚洲研究院前几年的成果。
他们建立了一个大型的数据集,记录了与给定的向导rna有一项核苷酸不匹配的所有可能的标靶区域里发生的脱靶活动。
然后把数据喂给了一个两个隐藏层的神经网络,训练出了一个可以输出所有潜在脱靶位点的模型。这是一个生成模型,可以得到每个脱靶位点的概率,据此计算脱靶评分。”
“太普通了,这只是实现了一个二线工具,还有没有更惊艳的?”卢赫追问。
“有。
非同源末端连接机制还记得吧?剪刀剪完基因序列后,不管三七二十一直接把断裂的基因给粘起来。
这种方式并不常用,一般都是用同源模板修复。一方面是剪的时候可能剪了不止一个地方,粘的时候却可能只粘了其中一个。另一方面是细胞不乐意了直接就不粘了。
但有团队利用机器学习算法准确地预测到了细胞容易修复的基因位点,并用crispr和非同源末端连接治了病。
为了探索具有代表性的人类基因组序列的修复产物,他们设计了一千多个目标位点,特征是向导rna和靶标基因,标签是非同源末端连接最终起了修复作用位点。
数据喂给了一个看起来结构很复杂的模型,训练结果很是喜人,模型对11%的向导rna的修复位点的预测准确率在50%以上。
意味着这些向导rna和相应靶标基因所对应的疾病,可以用这种方式来治疗。
最终他们治愈了赫曼斯基普德拉克综合征,一种能凝血不足
和白化病的遗传病。体外测试的修复准确率高达94%。
这个够惊艳吗?”
卢赫连连点头,“够。这个思路不错,是不是可以用在你身上,