Volatile sample collection and analysis
Volatile compound sampling
volatile compound sampling protocol (sorbent choice and sampling method) is specific to analyte identity and sample source and varies widely depending to research area and focus.The vagile compounds samples (VCS:VOC)は、分析対象やサンプル供給源によって異なるプロトコルを使用します。 私たちのサンプリングの大部分は、高い容量、汎用性(ヘッドスペースおよびスターバー吸着抽出モードの両方が可能)、フィールド環境での取り扱いの容易さから、ポリジメチルシロキサン(PDMS)ベースのTwisterTM(GERSTEL、Inc)を採用してきました(図1A)。 TwisterTM で捕獲された揮発性化合物は、熱脱着して分析に使用されます(図1B)。 これまでツイスターTMは当社の主要な吸着剤でしたが、他の吸着剤タイプや揮発性サンプリング方法(例:, 8702>
実質的に、各パラメータの閾値をピークごとに定義することができます。 上に示した例(図3)では、ピークは適度に純粋であり(ピーク純度=0.1137)、Binマッチングには高い質量スペクトル類似度スコアが必要です。 これらの最終的なフィルタリング基準と、リナロール(917)とテルピノーレン(<500)のマススペクトルの類似性スコアに基づき、この例では最終的に化合物はリナロールに割り当てられました。 この例では、±2000 FAME RI unit window内に3つのBinがあり、そのうちの2つはm/z 93というユニークなイオン値を有しています。
このアノテーションの段階では、1つ以上のBinの割り当てが残っている場合があります(例えば、検索RIウィンドウ内で溶出する立体異性体など)。 代替の Bin が有意に高い類似性スコアを持っていない限り、最も近いマッチング RI を持つ異性体が次にアノテーションされます。 異性体フィルターで除外されたスペクトルは、まだ他の近隣の Bin に一致する可能性があるため、アノテーション アルゴリズムにフィードバックされます。
New Bin generation – tracking unknown compounds
スペクトルが既存の Bin と一致しない場合、BinBase アルゴリズムは、特定の非常に厳しい基準が満たされた場合に新しい Bin を生成します。 まず、問題のスペクトルは、純度 (純度値 < 1.0) と強度 (S/N > 25) に基づく厳格な質量スペクトルの品質しきい値に合格する必要があります。 Bin生成マススペクトルフィルターの閾値は、類似性フィルターの閾値よりも厳しく、豊富で純粋なスペクトルのみが新しいBinとなることを保証するものである。 第二に、新しいBinの候補は、検証される前に実験クラスフィルターに合格しなければならない。 このフィルターは、新しいBinが偽の汚染物質ではなく、本物の揮発性物質であることを保証するために、ある実験クラスの全サンプルの少なくとも80%で検出されることを要求している。
ポストマッチングと置換
すべての実験クラスのすべてのスペクトルが注釈されると、実験全体で見つかったすべてのビンを含む包括的なビンリストがコンパイルされる。 次に、新しく生成されたBinを含むすべてのBinがすべてのサンプルで検索されるように、すべてのスペクトルがBinリストに対して再びマッチングされる(ポストマッチング)。 このステップでは、Bin生成に必要なより厳しいMSのしきい値に合格しなかったサンプルのスペクトルが、Binアノテーションに必要なしきい値に合格することがあります。
場合によっては、Binが存在しないか量が少ない(真の陰性)、または存在するが品質基準で割り当てできない(偽陰性)ために、すべてのクロマトグラムで陽性に検出されないことがあります。 この場合、データマトリックスの値がゼロとなり、その後の統計解析に支障をきたす。 このような場合に置換値を計算するための戦略が考案され、アルゴリズムにプログラムされている。 まず、アルゴリズムは、サンプルの平均保持指標を計算し、保持指標補正曲線を使用して保持時間に変換することにより、分析シーケンスにわたる各代謝物の平均保持時間を決定します。 次に、未処理の生のクロマトグラム (netCDF または ANDI MS ファイル形式) を開き、各ミッシング揮発性化合物の選択定量イオントレースの最大イオン強度から、ターゲット保持時間の±2秒付近でそのターゲットイオンのローカルバックグラウンドノイズを差し引いた値を報告します。 バックグラウンドから差し引かれたイオン強度は、「セカンドパス」割り当てであることを示す色分けとともに、結果表に報告されます。 置換アルゴリズムの検証は、サンプルセット内の置換された値のマニュアルアノテーションとそのアルゴリズムの置換値を比較することで行われました。
vocBinBase Report
実験クラスの少なくとも80%で検出されたすべてのビンは、結果レポートフォルダに含まれます。 さらに、レポートフォルダには、実験クラスの少なくとも50%で検出されたすべてのBinの結果ファイルが含まれます。 50%の結果は、80%のデータセットをより多くの同定代謝物で補完するため、またはあまり確信が持てないピークや希少なピークを評価するために使用することができます。 エクスポートされたBinテーブルの各エントリは、Bin定量質量(デフォルトではユニークイオン)の強度として報告されますが、この値はデータベース管理者によってスペクトル内の任意のイオンに手動で変更することができます。 ピーク面積ではなく、ピーク高さを使用するのには、いくつかの理由があります。 ベースラインの設定は、大きなピークよりも小さなピークの方がピーク面積に影響を与えるため、小さなピークの場合はピーク面積よりもピーク高さの方が望ましいとされています。 さらに、定義されたユニークなイオンに基づくピークハイトは、dTIC や TIC などの他のパラメーターよりも安定した指標となります。これは、異なるクロマトグラムで化合物を分析する場合、検出されたイオンの数、つまり複合強度は、ピークの存在量と純度によって異なるためです。 データベースエントリはAdamsの植物揮発性ライブラリ(後述)を用いて命名されています。 農薬、可塑剤、その他の汚染物質を含む植物由来でない化合物は、NIST-RI ライブラリを用いてアノテーションされます。 カラムブリードに関連する既知のアーティファクトは vocBinBase でアノテーションされていますが、結果レポートではユーザーにエクスポートされません (m/z 207, 221, 281, 355)。 データベース管理者は、報告されたBinのリストに含まれるピークを手動で除外(または追加)することができます。 たとえば、Twister™ベースのアーティファクトは、結果テーブルで除外するために手動で選択します。 結果データシートは、XLSおよびTXT形式(必要に応じてXML形式)で作成されます。
Sample vocBinBase report highlighting report features.Binは化学名およびPubChem識別子とともにレポートされています。 vocBinBase データベースによってエクスポートされたすべてのビンは、ユニークなデータベース識別子、定量イオン、保持インデックス、および文字列としてエンコードされた完全なマススペクトルで報告されます。 化合物の存在量は、Binの定量質量の強度として報告されます。 データベースは、Adamsの植物揮発性ライブラリーを用いて命名され、同定された化合物にはハイパーリンクされたPubChemの識別子が含まれます。
Bin Identification
Bin 同定は、2000以上の精製植物揮発性および精油成分の質量スペクトルと保持指標データのAdamsライブラリーによってサポートされていますが、我々のラボにおいて本物の標準を使用して多くの化合物を検証しています。 AdamsライブラリをBellerophonにアップロードしてBinマッチングを行う前に、NISTのウェブサイトからダウンロードできるLib2NISTを用いて、HP ChemstationフォーマットからNISTライブラリフォーマットに変換しました(http://chemdata.nist.gov)。 さらに、アルカンベースのAdams RI値をBinBase FAME RI相当値に変換した。 AdamsとFiehnのクロマトグラフィーバリアント(異なるGCオーブン温度プログラミングとカラムメーカー)間のRI変換は2次多項式で達成され、http://fiehnlab.ucdavis.edu/projects/VocBinBase/に示されています。 vocBinBaseで同定されたすべての揮発性物質は、化学データベースや構造情報ツールとの相互参照を可能にするために、PubChem化学識別子と構造をエンコードするInChIハッシュキーで注釈されています
RI変換の品質は、標準操作パラメータでAdamsライブラリにある本物の参照標準を注入してテストされました。 70の参照化合物について計算値と実験値を比較したところ、相関は0.9995、標準誤差は3,380 RI単位(残留誤差の標準偏差、RIcalculated-RIexperimental)であった。 また、130のAdamsライブラリアノテーションの計算値と実験値を比較したところ、同様の値が得られた(r2 = 0.9994, SE = 3,320 RI units)。 70種類の標準物質と130種類のライブラリアノテーションの絶対RI偏差(RIcalculated-RIexperimental)をプロットすると、注入した化合物の61%が1標準誤差内に、アノテーションした化合物の58%が計算値の1標準誤差内に収まっていることが明らかになった。 8702>
データベースの内容
現在、データベースには18種、3,435サンプルのスペクトルが登録されています。 170万ものスペクトルがインポートされ、完全にdeconvolutedされているにもかかわらず、vocBinBaseデータベースには現在1537のユニークなBinしか含まれていません。 インポートされたスペクトルのうち、45%はアルゴリズムのしきい値を満たすことができず、破棄されており、このようなスペクトルはノイズが多く、一貫性がありません。 ChromaTOFのピーク検出のしきい値を低く設定すればするほど(例えば、ピーク検出基準をs/n>20からs/n>3に下げる)、より多くのピークが検出されることになります。 このようなピークスペクトルは、BinBaseアルゴリズムによってノイズが多すぎるとして破棄され、出力シートには報告されない。 GC四重極MSのAMDISデコンボリューションデータを使用するSpectConnectツールでも、同様の割合でスペクトルが破棄されることが報告されている。 ここで使用した設定の下では、残りの 55% のスペクトルは品質基準を満たし、アノテーションが付けられデータベースに保存されます (図 5)。 アノテーションされた化合物の約 12% は、カラムおよび Twister™ 由来のポリシロキサンアーチファクトです。これらのアーチファクトはアルゴリズムによってアノテーションされますが、ユーザー用にエクスポートされる BinBase レポートには含まれません。 上記のように、アノテーションは複数の基準に依存し、特定の閾値はさまざまなメタデータ値によって変化します。必要な MS 類似性の閾値は、ピークの存在量と純度によって異なります (たとえば、低純度ピークは、より厳密な MS 類似性マッチングを必要とします)。 注釈付きスペクトルのごく一部 (4%) は、高い MS 類似性スコアを持つ非常に純粋なピーク (純度 <0.15) によって生成されていますが、データベースエントリの大部分は純粋なピーク (純度 <1.15) によって生成されています。5、46%)または純粋ではないピーク(純度>1.5、39%)によって生成されます。
ボビンベース・アルゴリズムのフィルタ効果です。 スペクトルがアノテーションされ、データベースに保存されるには、複数の基準を満たす必要がある。 受信する全スペクトルの45%は基準を満たすことができず、ノイズや矛盾があるとして破棄される。 残りの55%はアノテーションされ、データベースに保存される。 アノテーションされたスペクトルの12%は、カラムまたはTwister™ポリシロキサンのアーチファクトです。 ピーク純度、s/n、およびマススペクトルの類似性に基づいて注釈されたスペクトルのさらなる内訳を示します。
現在の1,537ビンのうち、211ビンがマススペクトルと保持指数のマッチングにより本物の揮発性と識別されています。 また、161のBinはポリシロキサンのアーティファクトとして注釈され(したがって、研究結果のデータシートにエクスポートされない)、残りのBinはまだ同定されていません。 スペクトル類似度(全ビン)および谷本化学類似度係数(特定ビン)を用いた VOC データベース内容の可視化は、Cytoscape を用いて実施した(図 6)。 谷本化学類似度係数は、比較する分子間の類似度を示すスコアを算出する類似度指標である。 ネットワークの概観は、1537 の Bin 間の関係を視覚的に表現している。 同定された化合物は赤いノードで、未同定化合物はグレーのノードで表されている。 ネットワーク端で1つだけ接続されているノードよりも、密接にクラスタ化されているノードの方がより類似している。 青色のエッジは、700以上の構造的類似性を持つ揮発性物質を特定するためのものです。 ポリシロキサンアーチファクトは、非常に特徴的なフラグメンテーションパターンにより、化合物から離れた場所に集まっていることに注意してください。 図6
vocBinBaseデータベースの内容を可視化したもの。 赤色のノードは同定された化合物、灰色のノードは未同定の化合物である。 青色のエッジは、700以上の構造類似性を持つ同定された揮発性物質を結ぶ。