1 X射線的產生
X射線本質上是電磁波,其波長范圍大致從0.01 nm 到 10 nm,與可見光(400—700 nm)不同,X 射線的短波長可以探測物質內部的精細結構,因此自從被倫琴發現以來就被用來觀測物質的內部結構。隨著人造 X射線光源的亮度和穩定性的提高,其應用范圍涵蓋物理、化學、生物、材料、醫學等諸多領域。X射線的產生機制也是基于其電磁波的本性,下面簡單比較一下電子射線管、同步輻射設施以及自由電子激光設施的原理和不同之處。
1.1 電子管
X射線最初是因真空管中陰極發出的某種射線遇到玻璃管壁發出熒光而被發現的(因為是未知的,故命名為 X射線;又因為倫琴最早發現這種現象,也被稱為倫琴射線,R?ntgen rays)。直至今日,電子管依然是產生 X 射線的最普遍的裝置,其包含陰極和陽極兩個電極,在真空或充氣室內工作,電子在其中以高速撞擊鎢靶,產生 X射線軔致輻射(帶電粒子與原子發生碰撞減速而產生的輻射)。電子管X射線源的最大問題是效率極低,其 99%的能量以熱能的形式耗散,并且要求焦點小、強度大,需要對陽極進行冷卻。為了降低焦斑的溫度,后來出現了旋轉陽極 X射線管和裝有控制柵極的 X射線管。但電子管裝置無法產生高強度、高偏振、相干性好的 X射線束,很大程度上局限了其在生物樣品或材料學中的衍射和散射成像的應用。
1.2 同步輻射
在高能物理的研究中,電子在加速器中達到相對論速度,接近光速運動的電子在電磁場中發生偏轉時,沿切向方向可以發出電磁輻射。這種電磁輻射的波長范圍可以通過控制電子速度和磁場強度進行調制,比如可以使發射的電磁輻射主要為 X射線波段等,這種電磁輻射被稱為同步輻射。同步輻射裝置一般架設在環形電子同步加速器中,能夠產出從遠紅外到 X射線波段的連續譜輻射光,并可以通過應用磁鐵陣列實現大范圍可調波長、高準直、高偏振性和高亮度的 X射線輸出。同步輻射設施插入件一般分為兩種:強磁場的扭擺器(wiggler),電子軌道扭曲大,曲率半徑小,可以提高同步輻射光子能量;相對弱磁場的波蕩器(undulator),電子軌道扭曲小,曲率半徑大,可以提高同步輻射的亮度和相干度。
目前同步輻射光源共經歷三代,第一代是高能物理實驗對撞機的兼用機,第二代是在同步輻射專用儲存環上建設的專用機,第三代是經過優化能產生高亮度準單色光的基于電子儲存環的專用機。現位于上海的同步輻射光源(SSRF)即屬于第三代同步輻射光源。利用 X射線同步輻射進行的生物大分子晶體學成像是一種非常成功的解析蛋白結構的方法,然而繁復的結晶過程卻限制了這種高品質的 X射線在解析復雜的生物分子復合體或者具有高度柔性的分子的結構研究方面的應用。為了能夠實現對微小晶體或單分子進行成像研究,且最大程度地減小輻射損傷(X射線的非彈性散射給樣品注入額外的能量會產生自由電子基,破壞分子結構)帶來的影響,一種新的成像模式逐漸發展起來,被稱為“損傷前探測法”,也就是利用超短的 X射線脈沖對樣品進行超飽和攻擊,把幾萬億的光子壓縮到幾飛秒的脈沖內發射到樣品上,在這么短的時間內,X射線的破壞作用不會完全展現出來,理論上可以突破傳統測量方法的極限。類似于武俠小說中極鋒利的寶劍,明明已經刺穿敵人,而敵人卻還不知道。自由電子激光就是我們在結構生物學探測中的神器。
1.3 自由電子激光
X射線自由電子激光(XFEL)亦被稱為“第四代光源”,其亮度更高,全相干,可調諧并且以超短脈沖形式發生。自由電子激光器由直線電子加速器、屏蔽裝置和扭擺器構成。為了產生自由電子激光,被加速至準光速的電子束通過周期性橫向磁場(扭擺器)產生擺動從而形成正弦狀路徑,電子因扭轉運動發射電磁輻射(圖1)。初始的電磁輻射是低能且不相干的。足夠長的扭擺器陣列使得電磁輻射與電子束產生長時間作用,在自放大自發輻射(SASE)模式下電子沿運動方向群聚成為尺寸接近光波波長的周期性束團。在此過程中,束團將自身動能轉化為光場能量,增大光場振幅直到飽和輸出,得到自由電子激光。自由電子激光的中心頻率取決于輸入電子能量和扭擺器參數,頻率帶寬取決于扭擺器的周期數。目前美國LCLS、歐洲European XFEL、日本SACLA以及瑞士SwissFEL都是基于自放大自發輻射原理的XFEL裝置。
圖 1 自由電子激光扭擺器原理。從加速器輸出的高能電子束輸入到扭擺器中,在SASE模式下工作,產生激光(圖片根據 European XFEL 資料修改,https: //www. xfel. eu/facility/overview/index_eng. html)
然而,在原生 SASE 模式下產生的 X 射線自由電子激光時間相干性較差,也即單色性不好;為了解決這個問題,需要輸入相干性較好的種子激光到電子束中(seeding),并結合諧波產生技術,輸出全相干的 X射線自由電子激光。常用的諧 波 產 生 技 術 包 括 高 增 益 諧 波 產 生 技 術(HGHG),回聲型諧波產生技術(EEHG)以及相位匯聚諧波增強技術(PEHG)。
目前最為先進的歐洲 XFEL 裝置,其輸出最短激光波長 0.05 nm,脈沖時長 10—100 fs,重復頻率 27 kHz,平均亮度達到 1025 photons/(s?mm2?mrad2?0.1%bandwidth)。位于美國的LCLS,輸出最短激光波長 0.15 nm,脈沖時長 20—120 fs,重復頻率 120 Hz,平均亮度為 1022 photons/(s?mm2?mrad2?0.1%bandwidth)。高重復頻率光脈沖和精細的探測設備導致實驗過程中產生巨大的數據流量,這給數據的傳輸、存儲和處理帶來了巨大的挑戰。
2 X射線自由電子激光的應用
2.1 自由電子激光的成像原理
XFEL 成像的物理原理是光子與物質中電子的相互作用導致樣品對 X射線激光的散射,而散射的強度分布函數則可以用來反推電子云的分布,也就是樣品的三維結構信息。
對于空間中某個取向的單顆粒來講,其成像過程是相干衍射成像,滿足光的遠場衍射(夫瑯禾費衍射)定律。探測器探測到的圖樣,是緊貼樣品后透射光波場的傅里葉變換強度;由衍射定律可知,空間分辨率決定于光子的最大散射角,也即越靠近探測器邊緣,其對應的空間頻率越高,同時信號也就越弱。
對于晶體樣品來講,晶格中規律排布的顆粒于某些方向上的散射在傳播過程中相干疊加,在探測器上形成布拉格衍射點,依據大量布拉格峰的位置和強度信息可以解析出樣品結構。晶體的衍射信號強度與晶體中電子數平方成正比,故一個邊長為10個立方體晶胞的晶體的衍射強度為單個晶胞散射強度的 100 萬倍,因此利用晶體衍射,即使非常小的晶體也可以有效地測量高分辨率數據。
2.2 損傷前探測
在生物大分子成像的起步階段,輻射損傷是限制分辨率極限的重要因素。雖然通過結晶或超低溫測量等手段有效地緩解了這一問題,但對于生物分子而言,X射線衍射成像的分辨率極限與輻射劑量成四次方反比關系,輻射損傷對于高頻信號的影響不可忽視。然而Neutze等人在2000年發表在《自然》上的論文中根據動力學模擬的結果提出超短強激光下可以實現損傷前探測的想法。這個猜想被興奮的科學家們在德國 DESY和美國 LCLS的自由電子激光設施開展的實驗證實。在這些實驗中,飛秒量級的超短 X射線脈沖都可以在樣品被完全電離前產生相干衍射圖像,極大地降低甚至避免了輻射損傷對成像的影響。
圖 2所示是 2006年 Chapman等人在 FLASH(位于德國漢堡的軟 X 射線設施)光源進行的首次損傷前探測試驗的裝置和結果。實驗采用了寬25 fs、波長32 nm,功率密度達4×1013W/cm2的軟 X射線,激光通過刻有圖案的氮化硅薄膜并在 CCD 探測器上成像。研究人員成功地得到了樣品損傷前和損傷后成像的數據,并展示了樣品受到輻射損傷的情況。
圖2 FLASH X射線相干衍射實驗和輻射損傷效應 (a)試驗裝置示意圖;(b)飛秒脈沖的相干衍射成像圖。為了讓強激光通過,數據中心部位是缺失的;(c)20 s后相似能量和時長的脈沖相干衍射成像圖,可以看出首次脈沖對樣品造成了輻射損傷;(d)根據(b)圖重建出來的樣品。
目前典型的利用 XFEL 方法解析結構的裝置主要由 XFEL產生設備、樣品注入器、快速讀取探測器和數據存儲及高性能計算機組成(圖3)。
圖3 利用XFEL進行“損傷前探測”。
樣品注入器有氣相注入和液流注入兩種,即通過氣體或液流將樣品顆粒加速、匯聚并噴射到真空室中與 X射線作用。為了降低真空中蒸騰降溫對樣品造成的影響,X光照射位點需十分接近噴嘴位置,樣品注入和光脈沖都可以持續進行,不需要中斷。氣相注射器將樣品匯聚到直徑幾十微米流速 100 m/s 量級的氣體束流內,在噴射過程中可以有效蒸騰樣品表面的水分雜質,一般用于單顆粒散射成像;缺點是 X光的樣品擊中率很低,目前 LCLS 使用的氣相注入器的平均擊中率在 1% 到 10% 之間。液相注射器束流最窄可低于800 nm,且流速只有 10 m/s量級,故擊中率相對較高,但會產生水的散射噪聲,一般用于信號強度較高的晶體衍射成像。
前文提到,XFEL 成像實驗產生的數據量是驚人的。目前一次實驗產生的原始數據高達 10—100 TB,而正在建設的 LCLS-II 和上海自由電子激光器預計將會產生每秒百 GB 量級的數據流,如此高密度的信息匯聚將對數據的傳輸、存儲和分析提出巨大的挑戰。然而,因為 X射線脈沖較低的擊中率,在海量的數據中,大部分數據實際沒有記錄有效信息。對于單顆粒成像,由于光束直徑在 0.1 μm到幾個微米的量級,比一般顆粒樣品直徑稍大,會產生大量多顆粒散射數據;樣品表面附著的雜質層(主要是水分子)也無法完全除去,無法避免非樣品的散射噪聲。同時,探測器故障也會導致很多數據報廢無法使用。
為了縮小數據量,首先要進行“命中篩選”(hit-finding),將記錄有效信息的圖樣保留下來。這個過程一般可以將原始數據減少 90%左右。在數據處理階段,則根據需要進一步進行甄選。另外,因為探測器得到的是二維強度圖樣,無相位信息,故三維結構的重建算法需要 3個步驟:數據挑選、三維重組和相位恢復。
一般來講,根據樣品狀態和實驗設置的不同,XFEL 結構學研究主要有兩種具體的方法,分別為單顆粒成像 (SPI)和串行晶體衍射成像(SFX),而這兩種方法都可以通過與對樣品激發裝置結合進行動力學研究。到目前為止,單顆粒成像仍然有巨大的挑戰,串行晶體學成像法已經較為成熟,具有時間分辨信息的動力學研究也已經取得重要成果。接下來將對這些應用和成果進行簡要總結介紹。
2.3 單顆粒成像(SPI)
傳統生物學成像手段都需要首先生長大分子晶體,這個過程十分困難,缺少足夠的科學指導,很大程度上是基于有限的經驗開展的一個藝術創作的過程。更重要的是,在晶體環境中,無法得到生理狀態下的蛋白分子結構,也局限了對生物分子動力學和功能的研究。由于 XFEL可以產生能夠與單個生物顆粒作用的高能窄脈沖,其單顆粒成像模式(Single Particle Imaging,SPI)就提供了這樣一種可能,即在不結晶的基礎上對單個樣品顆粒進行散射成像,利用全同的樣品顆粒,在不同的空間取向探測樣品結構信息,通過整合拼裝并且模型重構得到其在三維空間的電子密度分布,抓取生理環境下的結構特征。
SPI 的實驗樣品一般為體積較大的生物樣品或納米顆粒。生物樣品例如擬菌病毒、RDV 病毒、 PR772 病毒、 T4 噬菌體等,納米顆粒如nanorice、 納 米 啞 鈴 型 顆 粒 、 核 殼 異 構 體 等 。Seibert 等人進行的擬菌病毒 X 射線散射實驗是LCLS最早的實驗之一,它證實了單顆粒散射的可行性,并進一步表明使用過采樣數據可以有效進行二維相位恢復。對實驗散射數據進行 3D 重建的首次嘗試是 2015 年 Ekeberg 等人完成的,實驗樣品為直徑 0.45 μm 的擬菌病毒,重建使用了 198 張散射圖,得到 125 nm 的低分辨率結構,這與結構生物學領域關心的分辨率(比如原子分辨率)有很大的差距。
XFEL的全相干特性使得相干衍射成像(CDI)的技術可以應用到 SPI成像中來。對于理想球體的相干衍射理論計算表明,衍射圖樣的強度與空間頻率呈四次反比關系,這導致高頻信號與低頻信號相比十分微弱。如果只考慮泊松噪聲,類似冷凍電子顯微鏡中使用的平均方法可以有效提高信噪比;但真實情況中,附加噪聲如讀出噪聲、熱噪聲和漏光等,會在探測器上產生高于一個光子的噪音輸出,可以完全淹沒遠小于一個光子能量的高頻實驗信號。即使在包含 1013個光子、直徑僅為 0.1 μm 的窄 XFEL脈沖下,理論上也無法得到低于納米級別的高分辨率數據。對于高頻信號來講,其強度與入射光強和原子數成正比,所以使用較大的樣品顆粒更容易產生有效的實驗數據。
圖 4 展示了 PR772 病毒的單顆粒實驗散射圖。數據挑選是重建過程的第一步,即將有效的單顆粒散射成像從海量的、包含有背景散射和多顆粒散射的實驗數據中篩選出來。常用的方法一般是基于計算機視覺圖像處理的,例如流行嵌入法和神經網絡算法等。
圖 4 PR772病毒顆粒的單顆粒實驗成像圖 (a)為非單顆粒散射成像,需要除去;(b)為單顆粒散射成像,用以重建
由于在成像過程中樣品以自由狀態注入,空間取向角未知,故倒空間(傅里葉空間)三維重構的重點在于計算散射圖對應的空間取向。在全同顆粒的基本假設下,主要有3種方法。
其一為“共線法”。同一顆粒兩個不同方向的散射強度平面(投影的傅里葉變換強度)一定在倒空間中相交,且交線過中心點。這樣,當第3 個散射強度平面加入時,尋找它相對于前兩個平面的交線,可以固定 3個平面的相對空間取向。“共線法”雖然計算迅速,但噪聲對結果的影響很大,特別是高頻信號較弱時效果較差。第二種方法為迭代的極大似然法,代表為 2009年 Loh和 Elser發表的EMC算法。算法在給定的初始粗粒模型下,評估實驗數據與模型的不同角度投影之間的相似度,計算實驗數據屬于不同空間取向的概率,對模型進行迭代精細化。Ayyer 等人發布Dragonfly 軟件包,完成了對算法的程序實現。Ekeberg等人對 mimi病毒顆粒的三維重建工作即使用了 EMC算法。第三種方法為 Ourmazd等人提出的流形嵌入法。對于同一物體來講,越相鄰角度的投影總是越相似的,故可以利用所有散射數據計算它們的相似矩陣,通過特征值分解等方法將其映射到低維特征空間,與空間旋轉群在該空間的特征進行最小誤差擬合,得到每張圖片對應的空間取向角。當然,流行嵌入算法得到的特征向量也可用于對散射數據進行聚類。雖然這種方法有很多困難,包括空間角增量的映射效果、噪聲影響和較高的計算復雜度等,但仍然取得了一些有意義的結果。如圖 5 所示,2017 年Ourmazd等人使用擴散映射流型嵌入算法和 EMC算法處理 PR772病毒的單顆粒散射數據,得到了9 nm分辨率的三維電子密度結構,并且揭示了病毒在生理狀態下的連續構型變化。
圖5 單顆粒成像數據重建出的 PR772構型變化。
在 CDI成像中使用的基于投影的迭代算法可被用于單顆粒散射的相位恢復問題。算法的基本思想是將模型在實空間和倒空間之間不斷投影,同時施加支撐集等已知約束,使模型在倒空間的強度最大程度地逼近實驗得到的三維散射強度。常用的相位恢復算法已經在 Maia 等人開發的HAWK軟件包中被實現,其中最著名的是Fienup提出的混合輸入輸出算法(HIO)和 Marchesini提出的收縮算法(Shrinkwrap)。
單顆粒散射的重建工作是建立在樣品全同的假設之上,但一般來講實驗樣品的形狀無法達到高度均一,存在著尺寸差異和構型差異,例如Kassemeyer 等人在使用 nanorice 納米顆粒的散射數據進行分析時,找到并重建出兩個尺寸不同的三維模型。所以,在處理數據時有效地區分不同形狀顆粒的散射圖樣是十分必要的。對于一些已知結構信息的納米顆粒,利用精確的模擬數據與實驗數據進行對比,可以有效地分析實驗數據中顆粒尺寸的分布;而對于結構復雜的生物樣品,借助粗粒化的電子密度模型,也可以通過對比模擬與實驗數據在一定準確度下推算顆粒尺寸。
在單顆粒散射的基礎上應用關聯函數分析,可進行模型重構和優化。Kam提出的關聯函數定義為
C2(q, ?Φ) = ∫I(q,Φ)?I(q,Φ + ΔΦ)dΦ , (1)
其中, I(q,Φ) 為探測器探測到的散射譜在極坐標系的強度。對所有空間取向的 C2 函數進行平均后得到的平均關聯函數,包含著單粒子的結構信息,而且有效降低了高斯分布的 X光對信號的影響,提高信噪比。以平均關聯函數為目標函數,通過逆向蒙特卡羅采樣的方法可以迭代獲得實空間模型。近期 Kurta等人使用關聯函數法成功重建 PR772病毒的單顆粒模型,并將這一工作發表在《物理評論快報》。
目前,單顆粒成像法依然面臨著諸多問題和挑戰。其一是信號弱,尤其大散射角,也即高頻部分的信號,在目前 XFEL的亮度下還沒有辦法達到理想信噪比,故無法得到原子分辨率級別的結構;其次是樣品輸送困難和命中率低,且實驗裝置無法避免水等雜質的散射信號對樣品信號的干擾,導致實驗樣品浪費并產生大量的低質量數據。為了解決這些問題,LCLS 成立并領導了“單顆粒成像計劃”的國際合作組織(SPI-i),希望加速SPI技術在XFEL領域的發展。
2.4 串行晶體衍射成像(SFX)
在同步輻射光源進行的大分子晶體學成像(Macromolecular crystallography,MX)是結構生物學最成功的成像方法之一,至今 RCSB蛋白質數據庫(PDB)中有 89%的結構是使用 X 射線晶體衍射方法解析出的。然而,研究人員需要花費長達數年的時間去優化蛋白的結晶方案,以令其符合 MX實驗所需要的晶體標準。而且由于 MX的原理是使用單個晶體在不同角度受到反復長時間的輻照,輻射損傷限制了分辨率極限。XFEL 的發展使晶體學成像突破了上述限制,其高亮度和損傷前探測的特點使得對微小晶體進行衍射成像成為可能,同時,超短脈沖還可以用來進行高時間分辨的動力學研究。
串行晶體衍射成像(Serial Femtosecond Crystallography,SFX)使用直徑為亞微米到微米的晶體,晶體被裹挾在連續的液流中注入 XFEL 光路,不需要像傳統 MX 一樣對晶體角度進行測量。2011年Chapman等人首次報道了使用微晶進行 XFEL 衍射成像的嘗試,實驗在 LCLS 進行,使用尺寸 0.2—2 μm 的第一類光合作用系統蛋白復合物晶體樣本,在 10、70、200 fs 的 XFEL 脈沖下成像。實驗用X射線波長6.9 ?,單脈沖輻射劑量高達 3 GGy,最終得到 8 ?分辨率的重建結構。該 XFEL結構和傳統 X射線方法得到的結構有著很好的一致性;同時,通過比較不同脈沖長度下數據的衍射強度分布,研究人員在 200 fs 的數據中發現了明顯的輻射損傷。至今為止,SFX已經取得了諸多成果,例如2012年Boutet等人利用 LCLS的硬 X射線,得到了室溫條件下 1.9 ?的溶 菌 酶 結 構; 2015 年 Suga 等 人 利 用 日 本SACLA裝置解析出第二類光合作用系統蛋白復合物的1.9 ?結構等。
在傳統的 MX 成像的重建算法基礎上,SFX的數據重建比 SPI 要成熟得多,同樣需要 3 個步驟:命中篩選、三維強度整合和相位恢復。
晶體衍射數據的篩選過程相對簡單,即通過確定是否有明顯的布拉格衍射點來判斷數據是否為有效衍射數據。考慮到有效衍射可能來自多個不同空間取向的晶體,或未規則排列的低質量晶體,或不足以產生強信號的小晶體,我們需要進一步篩選,留下可重建的單晶衍射數據。常用的命中篩選軟件有Cheetah、CASS和cctbx.xfel等。
三維強度整合分為兩個步驟——指標化和方位強度積分。如圖 6所示,樣品顆粒在理想晶體中規則排布,但由于晶體尺寸有限(相對MX來講SFX晶體更小),其倒易點陣強度不是理想的 δ 函數,而是類似于單顆粒散射的衍射斑紋。故首先需要在二維衍射圖的每一個布拉格點周圍一定范圍內(ROI)對強度進行積分,并減去根據ROI之外的區域估計的背景噪聲,作為該點強度值。
圖6 平面晶體及其對應的倒易點陣示意圖
三維倒易點陣采用3個指標(h,k,l )作為位置索引,稱為米勒指標,而指標化就是將二維衍射圖的布拉格點映射到三維點陣上的過程。常用的指標化方法只基于布拉格點的位置信息,包括 MOSFLM 軟件包中實現的基于快速傅里葉分析的自動指標化算法和 REFIX 算法,以及 DirAx 半自動指標化算法。值得注意的是,當晶體的晶格對稱性高于空間對稱性時,只考慮布拉格點位置信息的指標化過程是存在歧義的,故必須引入對布拉格點強度的分析。一些算法已經可以處理這個問題,例如使用距離矩陣區分指標化結果的 BD 算法和基于極大似然思想的算法等。
SFX成像的過程實際是對三維倒易點陣布拉格點強度的采樣,每一張衍射圖只記錄了部分布拉格點的部分強度,因為對于每一個布拉格點來說,只有被 Ewald球壁覆蓋的強度才能被探測器探測(圖 6)。由于 XFEL的帶寬較窄,其對應的 Ewald球較薄,導致探測到的信息較少。故三維強度整合需要大量的從不同方位探測到的二維布拉格點,在成功指標化后,將相同指標的布拉格點強度累加,逼近真實的倒易點陣強度。這種方法稱為蒙特卡羅方位強度積分。
研究發現,有效的后期優化算法(post-refinement)可以減少蒙特卡羅方法所需的衍射圖數量,同時提高強度整合的準確性。所謂“后期優化”,即進一步精確每一個二維布拉格點所記錄的部分強度。例如 White 和 Sauter 等人通過對部分衍射構建幾何模型進行精細化,以及 Ginn等人提出的對束流面參數、晶格參數和晶格方位等變量進行迭代優化的方法等。
SFX的相位恢復方法有分子置換法(MR)、多波長反常衍射法(MAD)和形狀變換法等。最常用的方法為分子置換法,它使用與樣品結構相似的蛋白質作為參考模型,在此基礎上做微小調整,解析實驗樣品結構。由于 SFX使用的晶體較小,MR方法需要慎重處理晶體外黏附的水等雜質。多波長反常衍射法利用硒代甲硫氨酸替代樣品蛋白的甲硫氨酸,依據硒在不同束流能量下的反常散射對樣品結構因子產生的影響,求解相位問題。晶體樣品的衍射強度可以表示為
In(Δk)∝| F(Δk)|2|Sn(Δk)|2 , (2)
其中 F(Δk) 為與樣品結構相關的結構因子,形成布拉格點的有效強度信息;而 |Sn(Δk)|2 導致布拉格點周圍形成衍射斑紋,稱為形狀變化因子。如圖 7 所示,形狀變化法通過實驗數據推算|Sn(Δk)|2 ,據此恢復樣品的結構因子強度,并對其進行CDI成像中常用的直接相位恢復。
圖 7 形狀變化法相位恢復 (a)模擬數據,從左至右依次為:衍射圖樣、倒易晶格上的形狀變化(調制)函數和調制后得到的結構因子強度;(b)光系統 I的 SFX實驗數據,以相同的順序排列。
以上應用于分子結構解析的重建算法,已經在 CrystFEL、cctbx. xfel或者 Phenix等軟件中加以實現,極大地便利了科研人員的使用。相比于單顆粒成像來講,串行晶體衍射成像無論是在硬件還是算法上都正在不斷趨于成熟,相信在不久的將來,它將成為探索生物大分子高空間、高時間分辨率結構的有力工具。
2.5 時間分辨的動態研究
動態學研究是 XFEL 應用中最有希望產生可喜突破的分支,它極大地提高了實驗所能夠達到的時間分辨率極限。由于小晶體對于外界的刺激,例如光激發等,可以發生快速響應,一些樣品就可以作為研究其在受到激發后動態變化的理想材料。
在 SFX損傷前探測的基礎上,時間分辨成像可應用于可逆的以及不可逆的受激過程;而如果使用傳統的 MX方法,只能探測重復性好的可逆受激過程。基于SFX的時間分辨成像需要蒙特卡羅方法進行三維散射強度整合,而相位恢復和模型重構過程則使用分子置換法(MR),因為對于很多情況來說,使用的樣品基態模型是PDB數據庫中已有的蛋白結構。
利用 XFEL 進行時間分辨成像的最廣泛使用的技術是泵浦—探測技術,即在樣品注入器和XFEL 光路之間加入泵浦光,對注入真空室的樣品進行光激發,然后利用X射線成像(圖8)。對于連續注入樣品的串行晶體衍射來講,為了保證激發與成像過程的一致性,需要使用寬聚焦的泵浦光,并精確控制泵浦脈沖與 XFEL 脈沖的時間,以同時提高時間分辨率和受激發樣品成像的比例。同時,根據樣品顆粒的流速調整泵浦光與XFEL 光路之間的距離,可以控制樣品從被激發到成像之間的時間間距(以空間換時間),或者通過調整泵浦脈沖與探測脈沖之間的時間間隔(直接實現時間延時),都可以實現對樣品在激發后不同時間點的觀測。當泵浦光后于 XFEL發生時,可以探測樣品的未激發狀態(基態)。同時,由于樣品受激前后的衍射數據變化幅度有限,為了降低其他噪聲影響,需要額外的探測器探測入射光強度和能量展寬等參數,作為標準化依據。樣品流速、泵浦光參數和測量精度等因素共同影響著最終的實驗時間分辨率。
圖 8 泵浦—探測技術示意圖。
首個時間分辨的動態研究是2012年Aquila等人在第一類光合作用系統——鐵氧還原蛋白共晶體上進行的],研究人員揭示了晶體在被激發5 μs 和10 μs 后發生的變化,并分析了實驗結果與光誘導電子轉移導致的光合作用系統和鐵氧蛋白分離過程的一致性,但遺憾的是,這次嘗試未能解 析 出 可 支 撐 結 論 的 蛋 白 質 結 構 。 2014 年Schmidt 領導的國際合作項目給出了細菌藍光感光體光敏黃蛋白(PYP)的高空間、高時間分辨率結構,在10 ns 和1 μs 的時間尺度上揭示了PYP受到光激發后向反應中間產物轉變的過程中電子密度的變化,并將空間分辨率提升到 1.6 ?。2016 年,Schmidt 團隊把 PYP 動力學變化的時間分辨推進到 200 fs 以內,這是其他方法不能實現的。
除了泵浦—探測技術外,混合—注入技術也發展起來,用以研究不需要光激發、且反應周期通常較長的生物大分子配體結合問題。顧名思義,混合—注入技術即將受體蛋白晶體與配體混合后注入 XFEL光路,通過控制混合時間,達到時間分辨成像的目的。2016 年 Wang 等人使用混合—注入法對信使RNA核糖開關與腺嘌呤配體的結合過程進行了研究,在核糖開關的兩種不同構型下得到了相同的反應 10 s的中間結合狀態結構和反應10分鐘的最終結合狀態結構,并揭示了配體結合引起的核糖開關晶格結構的變化。作為對比,蛋白質數據庫中已知的核糖開關配體結合結構(PDB代碼4TZX)與實驗解得的最終狀態結構有著很好的一致性,證明了混合—注入 XFEL時間分辨成像方法的有效性。
3 總結與展望
從 2009年至今,XFEL在生物、物理和材料等領域得到了越來越廣泛的應用,取得了很多重要的成果,這既得益于光源設施的發展,也得益于高精度、高通量算法和軟件的開發。在結構生物學領域,XFEL 晶體成像方法發展迅速并且已經趨于成熟,利用其超短脈沖特性發展的高時空分辨率的動態成像研究也取得了許多突破性進展;然而,在單顆粒散射成像方面卻依然存在分辨率瓶頸。隨著能量更高、脈沖更短的歐洲XFEL設施和美國 LCLS-II等光源的建設和使用,新的實驗設備和數據分析方法的發展,我們將擁有無限可能,同時也面對很多挑戰。為了獲得更廣泛的應用和更精確的結果,未來 XFEL的技術突破將集中在這些方面:
(1)提高激光束流能量,同時盡可能降低輻射損傷,提高單顆粒散射的分辨率極限;
(2)控制樣品均一性。生物樣品具有一定的柔性,這是其實現功能的基礎,但是也為數據分析造成了一定困難。樣品均一性可以提高結構探測的精度,而必要的樣品制備和蛋白質工程的技術可以幫助把分子鎖定在某些穩定的形態;
(3)研發有效的樣品注入設備,提高命中率并減少樣品浪費。比如利用粘稠度高的載體(如LCP磷脂分子或者油脂)降低流速,或者把樣品固定在對 X射線透明的底物進行快速掃描,還有利用靜電排斥作用的方法產生樣品流等方法都比最早開發的液柱噴流法有一定優勢;
(4)設計高動態量程和快速記錄探測器。這對于發展單顆粒散射和晶體衍射都非常重要,目前的做法是使用雙探測器,并且調整為不同光電轉換率來增大數據測量范圍。將來的 XFEL產生的信號將以幾十萬赫茲的頻率出現,配套的探測設備也需要跟進;
(5)設計和開發對快速輸出的海量實驗數據進行篩選和壓縮的硬件和算法。海量數據的篩選越早完成就越有效率,可以降低對后續分析的計算壓力。歐洲 XFEL光源甚至計劃在探測器上就完成數據的初步篩選,這無疑是一個很好的出路;
(6)開發更精細快速的重建算法等。計算機技術的發展和超算機群的建設對于支持 XFEL數據處理至關重要,但是先進的軟件也必不可少。在圖像分析領域甚至圖形重構方面,需要開發新的算法和思路來發展更好的軟件。希望當前熱門的深度學習能夠提供很好的助力。
綜上,我們有足夠的理由相信,在生物分子結構研究中,XFEL 將繼續發揮其特點,提供大量的數據和有價值的信息,尤其是在具有時間信息的動力學研究方面,有獨一無二的優勢,能夠將實驗數據與基于物理模型的分子動力學模擬的結果整合起來,最終提供完整的分子電影,滿足科學家們的好奇心,并用于揭示生物分子的功能機理和對生物分子進行理性改造,造福人類。
先進阿秒激光設施建設示意圖亞洲首個國家重大科技基礎設施——先進阿秒激光設施在東莞啟動建設1月10日,位于東莞松山湖科學城的亞洲首個、國家重大科技基礎設施先進阿秒激光設施項目正式啟動建設。這一項目將布局......
第23屆全國分子光譜學學術會議和第五屆光譜年會上,11月30日下午在“熒光與發光光譜新方法、新技術”分會場中,多位專家學者就儀器研制、熒光探針、標記技術、機理等方面做出精彩報告。嶗山實驗室、山東師范大......
河圖洛書這一神秘圖案被喻為“宇宙魔方”,是遠古時代中國人按照星象排布時間、方向和季節的辨識系統,像陰陽八卦圖那樣探究著世界萬物的奧義。8日,上海交通大學宣布:以“洛書”命名的一臺超長多模式中子小角散射......
制出清潔氫氣的同時發現3D石墨烯(顯微鏡圖)。圖片來源:Lyten公司CAPist-L1材料呈現多孔的透氣結構。圖片來源:西湖大學從空氣中捕獲電力(藝術圖)。圖片來源:Thecooldown網站德國物......
2024慕尼黑華南激光展將于2024年10月14-16日于深圳國際會展中心(寶安新館)隆重舉辦。本屆展會順應2024年市場趨勢,推出主題觀展路線打卡活動,精心策劃了三條主題路線:1.醫療應用洞察2.3......
科技日報北京9月27日電 (記者張夢然)軌道角動量(OAM)單極子目前是理論物理學研究的重點,因為它為新興的軌道電子學帶來巨大的實際優勢。最近,科學家結合理論分析與瑞士光源(SLS)的實驗工......
根據9月23日發表于《自然-物理學》的一項研究,核爆炸產生的X射線沖擊波足以保護地球免遭小行星的撞擊。此類實驗尚屬首次。美國約翰斯·霍普金斯大學物理學家DawnGraninger表示,這項研究“為這一......
電子的運動速度極快,一秒鐘內就能繞地球好幾圈。美國亞利桑那大學團隊開發出一款世界上最快的阿秒顯微鏡,能做到抓拍運動電子的定格圖像。該顯微鏡將為物理學、化學、生物工程、材料科學等領域帶來突破。研究成果發......
科技日報北京8月20日電(記者劉霞)韓國科學家在二硒化鈀等固體材料內發現了一些“暗”電子,此前科學家借助光譜學分析材料特性時,沒有檢測到這些“漏網之魚”。這些“暗”電子的發現或有助更好地理解高溫超導體......
瑞士保羅謝勒研究所、洛桑聯邦理工學院、蘇黎世聯邦理工大學和美國南加州大學科學家合作,首次使用X射線,以4納米超高精度觀測了先進計算機微芯片的“內心”,創造了新的世界紀錄。研究團隊制作的高分辨率三維圖像......