2024-10-22
分享到
2024年1月22日,《自然》杂志发布了2024年的最值得关注七大技术,其中最后一项技术
20年前,位于美国西雅图的华盛顿大学的大卫·贝克(David Baker)教授及其团队取得了一项重大突破:他们利用计算工具从零开始设计了一个全新的蛋白质。这个名为‘Top7’的蛋白按照预测的方式折叠,但它是惰性的,没有执行任何有意九游智能体育科技义的生物功能。如今,全新蛋白质设计已经发展成为一个实用的工具,用于生成定制的酶和其他蛋白质。“这是一个巨大的推动力,”与贝克团队合作设计基于蛋白质的疫苗和药物传递载体的华盛顿大学生物化学家尼尔·金说道,“一年半前还不可能的事情,现在你只需去做。”这一进展的许多原因归结于日益庞大的数据集,将蛋白质序列与结构相联系。但深度学习,一种人工智能(AI)形式,也变得至关重要。“基于序列”的策略使用了像ChatGPT这样的大型语言模型(LLMs),将蛋白质序列视为包含多肽‘词语’的文档。通过这些算法,研究人员可以识别出构建真实世界蛋白质的架构规律。“它们真的学到了隐藏的语法,”西班牙巴塞罗那分子生物学研究所的蛋白质生物化学家诺埃利亚·费鲁兹表示。2022年,她的团队开发了一个名为ProtGPT2的算法,该算法在实验室中生产时始终产生折叠稳定的合成蛋白质。费鲁兹还共同开发了一种名为ZymCTRL的工具,利用序列和功能数据设计天然酶家族的成员。
基于序列的方法可以在现有蛋白质特征的基础上构建和调整新的框架,但对于定制结构元素或功能的设计,例如以可预测方式结合特定目标的能力,它们的效果较差。而“基于结构”的方法更适用于这一点,2023年也取得了这类蛋白质设计算法的显著进展。其中一些最复杂的方法使用‘扩散’模型,这也是图像生成工具如DALL-E的基础。这些算法最初被训练用于从大量真实结构中去除计算机生成的噪音;通过学习区分真实的结构元素和噪音,它们获得了形成生物合理的、用户定义的结构的能力。
贝克实验室开发的RFdiffusion软件和马萨诸塞州桑默维尔Generate Biomedicines公司的Chroma工具利用了这一策略,取得了显著的效果。例如,贝克的团队正在使用RFdiffusion工程新型蛋白质,这些蛋白质可以与感兴趣的目标形成紧密的界面,产生“完美符合表面”的设计。RFdiffusion的新版本甚至允许设计师在计算上塑造蛋白质,使其围绕非蛋白质目标,如DNA、小分子,甚至金属离子。
随着可生成人工智能算法的公开化,制作逼真但完全虚构的图像、音频和视频变得越来越简单。尽管这为人们提供了有趣的娱乐选择,但在多场地发生的地缘政治冲突和即将到来的美国总统选举之际,武器化媒体操纵的机会也屡见不鲜。纽约布法罗大学的计算机科学家Siwei Lyu表示,他已经看到了与以色列-哈马斯冲突相关的许多人工智能生成的“深度伪造”图像和音频。这只是一场高风险的猫鼠游戏,人工智能用户制作欺骗性内容,而李思维和其他媒体取证专家努力检测和拦截它。解决方案之一是让生成人工智能的开发者在模型输出中嵌入隐藏信号,形成内容的水印。其他策略集中在内容本身。例如,某些篡改视频会用另一位公众人物的面部特征替换掉原有特征,新算法能够识别替换特征边界的痕迹。外耳的独特褶皱也可显示出面部和头部之间的不匹配,而牙齿的不规则性可显示出编辑口型同步视频的迹象,其中一个人的嘴巴被数字处理,说出主体未说过的内容。AI生成的照片也带来难题,且不断变化。2019年,那不勒斯弗雷德里科二世大学的媒体取证专家路易莎·维尔多利瓦(Luisa Verdoliva)协助开发了FaceForensics++,用于检测多个常用软件处理的脸部图像。但图像取证方法因主体和软件而异,通用性是一个挑战。“你不能有一个单一的通用检测器——这非常困难,”她说。
实施也面临挑战。美国国防高级研究计划局(DARPA)的语义取证(SemaFor)项目虽然开发了实用工具箱用于深度伪造分析,但主要社交媒体网站并未定期使用。增加对这类工具的访问或有助于推动采用,为此,Siwei Lyu的团队开发了DeepFake-O-Meter,这是一个集中的公共算法库,可以从不同角度分析视频内容以嗅探深度伪造内容。这些资源有助于解决问题,但对抗人工智能生成的虚假信息的战斗可能将持续多年。
值得一提的是,类似BrainGate的试验不仅仅是一例。在过去的几年里,各种研究表明,BCI技术对于帮助那些受到严重神经损伤的人恢复失去的技能、实现更大独立性方面取得了显著进展。这其中,对各种神经病症患者大脑功能的深入了解起到了关键作用。而机器学习驱动的分析方法则进一步加强了对电极放置和信号解读的认识。
除了在神经学领域的应用,研究人员还将基于人工智能的语言模型用于更快速地解释患者试图传达的信息。这种“大脑自动完成”的核心组成部分在不同研究中都得到了应用,取得了令人瞩目的成果。
总体而言,BCI技术的不断发展为那些面临严重残疾的患者带来了新的希望。而随着技术的演进,科学家们看到了将其应用于治疗中度认知障碍和心理健康状况的潜力。霍奇伯格教授认为,这种由脑-计算机接口启发的闭环神经调节系统可能对更广泛的人群产生巨大帮助。
尽管还有大量工作需要完成,但这些细胞图谱一旦完成,将为医学研究提供无价的资源。泰克曼预测,这些图谱将用于指导药物研发,而其他科学家则希望通过图谱了解细胞环境对疾病的影响。
2023年末,美英监管机构首次批准了CRISPR基因编辑疗法,用于治疗镰刀细胞病和依赖输血的β-地中海贫血,这标志着基因编辑正式迈入临床应用的新时代。CRISPR及其衍生技术通过使用短的可编程RNA将DNA切割酶(如Cas9)引导到特定的基因组位点。这些技术通常用于实验室中,用于关闭缺陷基因和引入小的序列变化。然而,精确地插入跨越数千个核苷酸的较大DNA序列是一项具有挑战性的任务。为解决这一问题,科学家们正在尝试不同的方法,以实现对缺陷基因关键部分的替换或插入完全功能的基因序列。在斯坦福大学的分子遗传学家Le Cong的研究团队中,科学家们正在研究一种称为单链退火蛋白(SSAPs)的病毒衍生分子,这种分子介导DNA的重组。通过将SSAPs与已禁用Cas9的CRISPR–Cas系统结合,研究人员成功实现了对人类基因组的精确定位插入长达2千碱基的DNA。
另一种方法利用了称为prime editing的CRISPR方法,引入短的“着陆垫”序列,选择性地招募酶,再将大DNA片段精确地剪接到基因组中。在麻省理工学院,研究人员首次描述了可编程靶向元素介导的prime editing(PASTE)方法,这种方法可以精确插入长达36千碱基的DNA。PASTE尤其有望在离体修改患者细胞方面发挥作用,而底层的prime-editing技术已经在进行临床研究。