Strana 2 z 3
Dosiahnuté výsledky
V rámci pracovného balíka WP6 Statistical Algorithms boli navrhnuté niektoré základné metódy a algoritmy na štatistickú analýzu vydychovaných plynov meraných pomocou PTR-MS.
V prostredí Matlab bol vytvorený programový balík (toolbox) na štatistickú analýzu koncentrácie prchavých organických zložiek vo vydychovanom vzduchu na detekciu pacientov s rakovinou pľúc, na základe meraní pomocou PTR-MS (proton-transfer-reaction mass spectrometry). Tento systém je vhodný aj pre analýzy meraní na bunkových a bakteriálnych kultúrach, ako aj pre analýzu vydychovaných plynov meraných pomocou SIFT-MS (selected-ion-flow-tube mass spectrometry). Súčasná verzia programového balíka obsahuje tieto časti:
-
Funkcie na prípravu štandardného dátového formátu a na manipuláciu s dátami, vrátane interfejsu na získavanie dát z tzv. GES databázy (t.j. dátovej štruktúry meraných koncentrácií vydychovaných plynov pomocou PTR-MS, ktorá sa toho času používa na Medical University of Innsbruck, Austria). Táto časť umožňuje robiť pre-filtráciu dát a aplikovanie ďalších reštrikcií na merané zložky dychu, ako napr. obmedzenia vyhľadom na vek, pohlavie a fajčiarske návyky subjektov - potenciálnych pacientov.
-
Funkcie pre vykonanie základných popisných štatistických analýz, vrátane testovania normality rozdelenia, porovnávania empirických a fitovaných normálnych resp. log-normálnych rozdelení, výpočet konfidenčných intervalov pre rozdiel dvoch normálnych rozdelení a pre rozdiel a podiel stredných hodnôt dvoch log-normálnych rozdelení, mnohorozmerné testy rovnosti stredných hodnôt a mnohorozmernú analýzu rozptylu - MANOVA.
-
Klasifikačné algoritmy pre klasifikáciu do dvoch a viacerých skupín (napr. do skupiny pacientov a zdravých dobrovoľníkov). Do balíka boli zahrnuté tieto klasifikačné procedúry:
- Klasifikátor založený na lineárnej resp. kvadratickej diskriminačnej analýze;
- Neparametrický klasifikátor založený na vážených poradiach;
- Klasifikátor založený na metóde Support Vector Machines;
- Klasifikátor založený na metóde Partial Least Squares;
- Klasifikátory pre merania s chýbajúcimi údajmi: Klasifikátor váženého hlasovania a klasifikátor založený na klasifikačných stromoch.
Vytvorený programový balík je distribuovaný ako Bamod Statistical Toolbox, ktorý je k dispozícii v súčasnej dobe pre riešiteľov projektu BAMOD.
S využitím tohto programového nástroja boli analyzované merania PTR-MS z predbežnej klinickej štúdie, ktorá pozostávala z meraní konentrácií 12 vybratých zložiek dychu, vyjadrených na PTR-MS pomocou m/z hodnôt (mass-to-charge ratios),menovite, m/z 'm31', 'm33', 'm42', 'm59', 'm63', 'm69', 'm73', 'm79', 'm93', 'm107', 'm108', a 'm115', meraných v jednotkách ppb (particles-per-bilion).
Podrobne boli analyzované špecifické podskupiny pacientov a zdravých dobrovoľníkov s prihliadnutím na vek, pohlavie a fajčiarské návyky subjektov (pozri ilustračný obrázok).
Obrázok: Krabicové diagramy (box plots) koncentrácií prchavých organických látok (merania v ppb po logaritmickej transformácii so základom 10) vydychovaného (e) a nadychovaného (i) plynu pre skupinu zdravých dobrovoľníkov (c) a pacientov s rakovinou pľúc (p).Preskúmaná bola závislosť koncentrácie niektorých prchavých látok (izoprén, metanol, acetón) v dychu na charakteristikách ako vek a pohlavie s cieľom popísať bežné hodnoty pre zdravú populáciu.
Ďalšie výsledky:
Navrhnutý bol nový pravdepodobnostný model na určenie koncentrácie prchavej organickej látky na základe merania pomocou spektrometra typu PTR-MS. Za predpokladu Poissonoveho rozdelenia registrovaných iónov v spektrometri ide v princípe o pravdepodobnostný model podielu dvoch nezávislých Poissonových náhodných premenných. Vhodnosť tohto modelu bola testovaná na základe vyhodnotenia rozsiahlých experimentálnych dát z meraní koncentrácie prchavých organických látok v dychu zdravého dobrovoľníka pomocou PTR-MS, získaných počas pobytu S. Štolca v Medical University Innsbruck.
Publikovaný bol článok o vzťahu koncentrácie izoprénu v dychu a vekom, BMI, cholesterolom a pohlavím u zdravej populácie. Výsledky mali prispieť k objasneniu normálnej fyziológie izoprénu.
Do tlače bol zaslaný rukopis článku skúmajúci vzťah medzi koncentráciou acetónu v dychu a vekom, BMI a pohlavím u zdravej populácie. Výsledky mali prispieť k objasneniu normálnej fyziológie acetónu.
Pokračoval výskum štatistických metód na určenie konfidenčných intervalov pre podiel a rozdiel koncentrácii medzi dvomi populáciami pozorovaných subjektov (napr. zdraví dobrovoľníci a skupina pacientov s rakovinou pľúc, resp. skupina fajčiarov a nefajčiarov).
Porovnávali sme efektívnosť klasifikačných metód na diskrimináciu dvoch populácii na základe meraných koncentrácii prchavých organických látok v dychu (Fisherova lineárna diskriminačná analýza, dopredné neurónové siete a metóda oporných bodov). Navrhli sme robustnú metódu oporných bodov, ktorá má lepšie vlastnosti v prípade dát zaťažených ďalšou neistotou.
Rozpracovali sme metódy a pre výpočet ROC krivky a Youdenovho indexu s prislúchajúcimi bodovými asymptotickými konfidenčnými intervalmi pomocou vyhladených odhadov distribučných funkcií dvoch pozorovaných skupín. Pripravené boli algoritmy na automatickú detekciu vhodných zložiek dychu na klasifikáciu do dvoch tried (populácií) určených podľa voliteľných kritérií (napr. pohlavie, veková skupina, prostredie, fajčiarske chovanie, atď.).
Realizované boli algoritmy (implementované v rámci programového balíka BAMOD Statistical Toolbox) na určenie optimálnych prahových hodnôt klasifikátorov na diskrimináciu pacient s rakovinou od zdravej populácie na základe trénovacích dát získaných v priebehu riešenia projektu na Medical University Innsbruck, Austria.
|