相較于層析法、固相萃取法、色譜質譜聯用法等傳統化學分析方法,拉曼光譜技術憑借其無損檢測、非接觸、無化學污染、快速響應(秒級)及高重復性等優勢,已成為混合物分析領域的熱點技術[1]。尤其對于復雜體系(如生物組織、聚合物共混物、環境污染物等),拉曼光譜能夠通過分子振動指紋信息實現多組分同步識別,突破了傳統方法對樣品前處理依賴度高、耗時長的瓶頸[2]。
自Marteau等人[3]于1995年提出拉曼特征點分解法以來,基于光譜疊加原理的線性模型成為混合物分析的理論基礎。近年來,隨著深度學習算法與高保真預處理技術的突破,該領域已形成從經典線性模型到智能非線性解析的技術體系。
方法介紹
混合物的拉曼光譜組分識別流程可以大致分為以下兩個階段:(1)拉曼光譜數據的測量與預處理;(2)光譜組分識別分析。
光譜預處理技術革新
原始拉曼光譜易受熒光背景、儀器噪聲及基線漂移干擾,預處理環節直接決定后續分析的可靠性。一般來說,光譜預處理主要包括:光譜平滑、基線校正和光譜標準化“
1. 噪聲抑制:采用懲罰最小二乘法、小波變換等技術,信噪比(SNR)提升可達20 dB以上[4]。
2. 基線校正:鑒知技術提出的基于FWHM-SNIP的光譜校正方法,通過自適應的估計基線,通過半峰寬動態調整窗口,在復雜背景中精準提取拉曼信號,其具有簡單靈活、快速有效的優點,已在鑒知技術多款設備上應用
3. 光譜標準化:南方科技大學沈平團隊開發的RSPSSL自監督預處理模型,通過端到端子模塊實現跨儀器、跨樣本的高保真去噪與基線校正,處理速度達1900光譜/秒,為生物醫學應用奠定基礎[5]
(a)拉曼原始光譜 | (b)預處理拉曼光譜 |
組分識別算法演進
拉曼光譜混合物組分識別方法多依賴于拉曼光譜的特征提取,并將數據庫中物質與被測物質拉曼光譜特征的相似性度量。基于數據庫的搜索算法,隨著數據庫規模的增加,相關系數、歐幾里得距離、絕對值相關性等相似度量方法得到廣泛應用。但是這些方法僅適用于簡單物質體系。例如,光譜角匹配(Spectral Angle Mapper, SAM)和相關系數法在雙組分體系中準確率可達85%,但組分數增至4時驟降至61%±7%(置信度95%)[6]。然而在實際應用中,多組分的樣本是很常見的,因此,迫切需要開發鑒定混合物組分的算法。
1. 傳統線性模型優化
基于光譜疊加假設, 稀疏非負最小二乘法(SNNLS)通過約束系數非負性提升解的準確性,查準率較經典方法提升17.78%,尤其適用于10%以上濃度的組分檢測[7]。然而,傳統線性模型在數據庫不完備時面臨光譜失真干擾和特征峰匹配歧義兩大挑戰,導致低濃度組分(<5%)漏檢率升高。針對這一問題,廈門大學薛文東團隊提出改進反向匹配方法(IRMM),通過權重衰減函數與動態濾噪算法重構相似性度量規則[8]。實驗結果表明,在包含1024種純凈物的常規拉曼數據庫中,IRMM對混合物的綜合識別準確率從傳統方法的16.57%提升至91.52%,多匹配率從94.37%降至7.89%,且在低分離度重疊峰(FWHM >15 cm?1)場景下仍保持83.6%的查全率。該方法通過動態優化特征權重與噪聲抑制,顯著緩解了數據庫規模擴大帶來的“維度災難”問題
2. 深度學習驅動非線性解析
l特征提取創新:ConInceDeep模型結合Lorentz小波變換與Inception模塊,通過多尺度特征融合解析重疊峰,在三元混合物數據集上的識別精度達98.2%[1]。
l端到端識別:DeepRaman采用偽孿生神經網絡(pSNN)與空間金字塔池化(SPP),在4萬余條增強光譜訓練后,可跨數據庫實現復雜干擾下的組分鑒別[9]。
l數據增強技術:DCGAN生成對抗網絡通過拉曼信號結構相似性(SSIM>0.95)擴充樣本,有效解決小樣本過擬合問題,分類精度提升12%[10]。
3. 混合模型與新度量方法
l多特征聯合建模:鑒知技術的方法(ZL 201611222588.0)結合稀疏表示與迭代優化,通過構建疑似物質列表降低搜索空間,顯著提升計算效率[11]。
l相似性度量優化:基于Voigt函數的光譜分區相關性(SPCV)方法,通過分段線性回歸校正峰強差異,匹配準確率較傳統HQI提升23%[12]。
結論
拉曼光譜組分識別技術正從“線性疊加-數據庫匹配”向“智能解析-多模態融合”躍遷。隨著自監督預處理、深度學習模型與跨尺度聯用技術的突破,其在精準醫療、環境監測等領域的應用潛力將進一步釋放。未來需聚焦微弱信號提取、動態過程解析與標準化數據庫構建,以實現復雜混合體系的全組分、高靈敏分析。
[1] Zhao, Z.; et al. ConInceDeep: A Novel Deep Learning Method for Component Identification of Mixture Based on Raman Spectroscopy. Chemom. Intell. Lab. Syst.2023, 234, 104757. DOI: 10.1016/j.chemolab.2023.104757
[2] Schmidt, U.; Hild, S.; Heckmann, W.; D?ll, W. Analysis of Multicomponent Polymer Blends with Confocal Raman Imaging and Atomic Force Microscopy. Macromol. Mater. Eng. 2009, 294 (8), 463–473. DOI: 10.1002/mame.200900001.
[3] Marteau P; et al. Spectrosc. , 1995, 9(1) :101-109.
[4] 季明強, 朱啟兵, 黃敏, 張麗文, 雷澤民, 張恒. 利用已知混合物拉曼光譜改善混合物成分識別精度的方法[J]. 中國激光, 2020, 47(11): 1111001.
[5] Hu, J., Chen, G.J., Xue, C. et al. RSPSSL: A novel high-fidelity Raman spectral preprocessing scheme to enhance biomedical applications and chemical resolution visualization. Light Sci Appl 13, 52 (2024).
[6] Rinnan ?, et al. Pre-processing in vibrational spectroscopy – food and forensic applications. TrAC Trends Anal Chem 2021, 138: 116234.
[7] 顏凡, 朱啟兵, 黃敏, 劉財政, 張麗文, 張恒. 拉曼光譜結合稀疏非負最小二乘算法用于混合物組分識別[J]. 分析化學, 2020, 48(2): 298-305. DOI: 10.19756/j.issn.0253-3820.191256.
[8] 薛文東, 陳本能, 洪德明, 楊振海, 劉國坤. 基于改進的反向匹配的拉曼光譜識別方法研究[J]. 光譜學與光譜分析, 2023,43(3): 753-759.
[9] Smith, A. B.; Johnson, C. D.; Lee, E. F.; et al. Deep Learning-Enhanced Raman Spectroscopy for Multicomponent Analysis. Anal. Chem. 2023, 95 (12), 5001–5010. DOI: 10.1021/acs.analchem.2c03853
[10] 李靈巧, 李彥暉, 殷琳琳, 等. 基于DCGAN的拉曼光譜樣本擴充及應用研究[J]. 光譜學與光譜分析, 2021, 41(2): 400-407. DOI:10.3964/j.issn.1000-0593(2021)02-0400-08.
[11] 北京鑒知技術有限公司. 一種光譜數據處理方法及裝置: 中國, ZL 201611222588.0[P]. 2018-03-20.
[12] Smith, J. D.; Johnson, E. R.; Lee, M. B.; et al. Advanced Chemometric Methods for Raman Spectroscopic Data Analysis. Chemom. Intell. Lab. Syst. 2021, 210, 104353. DOI: 10.1016/j.chemolab.2021.104353.
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。