English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術(shù)文章 > 臨床代謝組學研究常見問題(一)

臨床代謝組學研究常見問題(一)

瀏覽次數(shù):3206 發(fā)布日期:2017-7-12  來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責任自負

分享一些我們舉辦完第一期微信公開課——臨床代謝組學研究策略后,所收集到的常見問題,供大家學習和參考。

Q:如何設(shè)置驗證集和測試集?

A:按我理解你想問的問題是:training set訓練集和test set測試集的設(shè)置問題。我們做分析化學、生物化學或者分子生物學的初學者通常會混淆這幾個數(shù)據(jù)集概念,通常是我們中文翻譯產(chǎn)生的歧義。

機器學習中,數(shù)據(jù)通常分為三類:Training Set訓練集,Validation Set驗證集,和Test Set測試集。B.D. Ripley在他的‘Pattern Recognition and Neural Networks’ Cambridge University Press, 1996, ISBN 0-521-46086-7 書中做了如下定義和分類。

訓練集Training Set: A set of examples used for learning, which is to fit the parameters [i.e., weights] of the classifier. 訓練模型或模型參數(shù)調(diào)試

驗證集Validation Set: A set of examples used to tune the parameters [i.e., architecture, not weights] of a classifier, for example to choose the number of hidden units in a neural network. 模型或參數(shù)的優(yōu)化及確定

測試集Test Set: A set of examples used only to assess the performance [generalization] of a fully specified classifier. 純粹測試已建立模型的預(yù)測能力

那么比較理想的分類的百分比是,我建議大人群的隊列研究(樣本量比較大,如 >100以上)

 

推薦1

推薦2

訓練集Training Set

≥50

60

驗證集Validation Set

25

20

測試集Test Set

25

20

 

現(xiàn)實情況一般受樣本量大小限制,從而演變成這樣

數(shù)據(jù)集

推薦1

推薦2

推薦3

訓練集+驗證集Training Set+ Validation Set

60

70

80

測試集Test Set

40

30

20

 

而代謝組學研究中,樣本量極少的實驗,如細胞實驗、動物實驗的代謝組學數(shù)據(jù),也會看到不嚴謹的做法(往往也被接受)是:

數(shù)據(jù)集

 

 

訓練集+驗證集Training Set+ Validation Set

All

LOOCV: Leave One Out CV

K-fold CV (SIMCA:1/7-fold CV)

Bootstrap

測試集Test Set

N/A

 

Q:細胞樣品如何收集?使用不含EDTA的胰酶還是用刮刀收集?二者哪個更好?

A:細胞樣本我們發(fā)現(xiàn)貼壁的細胞用刮刀的方式檢測的代謝物種類比較多,但是重復(fù)性取決于細胞的種類和實驗人員本身的技術(shù)水平。所以我們實驗室在大規(guī)模收集細胞樣本的時候通常采用消化的方法。

 

Q:檢測的樣本是血漿嗎?血漿中小分子大分子物質(zhì)都很多,小分子的檢測會受到大分子的干擾嗎?

A:您好,代謝組學可以用血漿、血清、DBS等等。在檢測之前,我們必須采用高比例的有機溶劑進行蛋白沉淀和代謝物的提取。大分子的小肽和蛋白會發(fā)生化學變性,離心沉淀或采用過濾的方式去除蛋白,從而避免大分子物質(zhì)對內(nèi)源性小分子代謝物產(chǎn)生干擾。蛋白沉淀及代謝物提取方法需經(jīng)過方法學優(yōu)化及考察,否則也會大大影響小分子物質(zhì)的提取效率。

 

Q:請問麥特繪譜對呼出氣代謝組學研究有涉及嗎?

A:有的。這項研究在慢性阻塞性肺疾病COPD的研究中比較成熟,我們在肺癌、胃癌等疾病研究中已經(jīng)做過了一些探索。

 

Q:組合的判斷能介紹一下嗎?

A:差異代謝物組合的判斷是需要技巧的,并不是說數(shù)學上統(tǒng)計出來p<0.05的top的組合就可以了,不懂生物學和醫(yī)學的專門研究模型的一直在這么做。組合的優(yōu)化一定是統(tǒng)計模型+代謝通道兩者兼顧再優(yōu)化的結(jié)果,是“代謝組學驅(qū)動下的分子生物學機制研究”。

 

Q:標準血清在基于液質(zhì)的代謝組學研究中也一樣適用嗎?

A:NIST SRM1950是美國標準品物質(zhì)研究所提供的,我們用這份標本實現(xiàn)了在不同國家、不同實驗室、不同儀器設(shè)備、不同時間采集的數(shù)據(jù)矯正,保證我們兩國(中美)四地(上海、杭州、北卡、夏威夷)產(chǎn)生的數(shù)據(jù)的整合。我們定量代謝組學的平臺用這份樣本作為獨立外部質(zhì)控。所以,不管是氣質(zhì)還是液質(zhì)平臺,這份標本都適用,并且是未來實現(xiàn)全球代謝組學數(shù)據(jù)統(tǒng)一的唯一機會。

 

想了解更多臨床代謝組學的知識嗎?

麥特繪譜 臨床代謝組學全國巡講技術(shù)交流會 免費申請啦!

還等什么 快來報名吧!

點擊下載申請表

發(fā)布者:麥特繪譜生物科技(上海)有限公司
聯(lián)系電話:400 867 2686
E-mail:marketing@metaboprofile.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com