I sidste klumme så vi, at anden-ordens kalibrering kan foretages vha. Rank Annihilation Factor Analysis. Sådan startede det, men i dag anvendes andre metoder og især PARAFAC.
Artiklen har været bragt i Dansk Kemi nr. 6/7, 2013 og kan læses uden illustrationer, strukturer og ligninger herunder. Se relaterede artikler nederst på siden.
Af Rasmus Bro, Søren Balling Engelsen, Institut for Fødevarevidenskab, Københavns Universitet og Lars Nørgaard, FOSS
Som beskrevet i sidste klumme (Dansk Kemi, 94(4), 2013), så kan Rank Annihilation Factor Analysis (RAFA) anvendes til at kvantificere, hvor meget analyt, der er i en ukendt prøve. Det gøres ved at se, hvor meget af en ren prøves signal man skal trække fra den målte prøve, før rangen går ned med én. På den måde kan man kvantificere kendte stoffer i ukendte prøver, selv hvis de har ukendte interferenser. Det er ikke muligt med traditionel eller kemometrisk kalibrering. I denne klumme ser vi på en lidt mere automatiseret og praktisk måde at lave anden-ordens kalibrering på.
Automatiseret rank annihilation
Bruce Kowalski var en af pionererne indenfor kemometrien og hans gruppe i Seattle var i høj grad førende indenfor anden-ordens kalibrering. Omkring 1985 udvikledes en automatiseret RAFA, som blev kaldt Generalized Rank Annihilation Method (GRAM) [1]. Den var baseret på, at man kunne tage målingen af en referenceprøve; en matrix og målingen af en ukendt prøve; en anden matrix. Disse to matricer kunne opstilles i et såkaldt generaliseret egenværdi-problem [2]. Det kan vises at løse samme problem som RAFA, men uden at man behøver at iterere for at finde ud af, hvornår rangen af ens prøvematrix falder med én. Man må dog beslutte, hvad det totale antal komponenter i prøvematricen er, og det er langt fra ukompliceret.
GRAM var et meget stort fremskridt, der var baseret på blot to målinger; en prøve med kendt koncentration af analyt og den ukendte prøve. GRAM blev sidenhen udviklet til at kunne håndtere mange prøver [3], og på det tidspunkt (omkring 1990) blev det klart, at man i virkeligheden havde udviklet en metode, der var stort set identisk med den psykometriske metode PARAFAC [4] fra 1970 (Dansk Kemi, 92(11), 2011).
PARAFAC til anden-ordens kalibrering
Hvordan fungerer anden-ordens kalibrering vha. PARAFAC? Det er faktisk relativt simpelt, og de fleste ingredienser har vi allerede beskrevet. I de tidligere klummer (Dansk Kemi, 92(12) 2011 og Dansk Kemi, 93(1-2) 2012) forklarede vi, hvordan en PARAFAC-model af et fluorescens-datasæt giver estimater af de underliggende emissions- og eksitationsspektre. Dvs. at PARAFAC-modellen adskiller målinger af blandinger og giver de rene spektre. Vha. disse spektre kan vi identificere analytterne.
I figur 1 er vist et komplet kalibreringssæt (prøven øverst til venstre) og tre prøver, hvor vi ønsker at bestemme tryptofans koncentration.
Ud over de fire eksitations-emissions-landskaber, så er det eneste vi ved, at koncentrationen af tryptofan er 2.67 µM i den kendte prøve.
Trin 1: Beregn PARAFAC-model
Første trin i at bestemme koncentrationen er at beregne en passende PARAFAC-model. Vha. de værktøjer vi tidligere har diskuteret (Dansk Kemi, 93(1-2), 2012) finder vi, at tre PARAFAC-komponenter er passende. Det antyder, at prøverne i alt indeholder tre fluoroforer, som vi kan måle. Hver komponent er beskrevet ved en PARAFAC-emissionsloading og en PARAFAC-eksitationsloading. Dvs. et estimeret emissions- og eksitationsspektrum (figur 2).
Trin 2: Identificer tryptofan-komponent
Som udgangspunkt er nummereringen af komponenterne arbitrær, men hvis man er bekendt med analytternes fluorescensegenskaber, kan man benytte disse estimerede spektre til at identificere hver af de tre PARAFAC-komponenter. Dvs. at i stedet for blot at have komponent 1, 2 og 3, kan vi navngive disse. Det undlader vi i dette tilfælde og i stedet identificeres tryptofan på anden vis. Ud over estimerede spektre får vi også en score-matrix, som er vist nedenfor.
Der er et sæt score-værdier for hver prøve og én sådan for hver komponent. F.eks. kan vi se, at hvis vi tager emissionsloading nummer et og eksitationsloading nummer et og ganger dem sammen til et fluorescenslandskab, så skal dette landskab ganges med 27834 for at vise komponent ets bidrag til modellen af den første prøve. Score-værdien er altså ”koncentrationen” af denne komponent, men i en form for arbitrær skala.
Prøve nummer et er den kendte kalibreringsprøve, der kun indeholder tryptofan. Række et i scorematricen viser, at komponent to og tre er omtrent nul (5 og -8) sammenlignet med komponent et. Dette kan vi bruge til at identificere at komponent et må svare til tryptofan (figur 4).
Med tryptofan identificeret og med viden om at koncentrationen af tryptofan er 2.67 µM i kalibreringsprøven, prøve et, kan vi nu simpelthen skalere score et, således at prøve nummer et har den rette værdi (figur 5)
Hermed har vi prædikteret koncentrationen af tryptofan i de tre ukendte prøver uden at have kendskab til hvilke øvrige kemiske analytter, der bidrager med overlappende signaler. Vi kan sammenligne prædiktionerne i figur 5 med de konkrete koncentrationer, der blev brugt til at lave prøverne: [0.00 µM, 1.58 µM, 0.88 µM]. Som man kan se, er prædiktionerne ganske tæt på de korrekte værdier.
Outro
Anden-ordens kalibrering foretages oftest vha. PARAFAC og vi har i denne klumme vist, hvordan dette kan gøres samt hvilke elementer, der indgår i kalibreringen. Flere detaljer kan findes i litteraturen [5].
Referencer
E. Sanchez, B. R. Kowalski. Generalized rank annihilation factor analysis. Analytical Chemistry. 58:496-499, 1986.
G. H. Golub, C. F. van Loan. Matrix computations, Baltimore:The John Hopkins University Press, 1989.
E. Sanchez, B. R. Kowalski. Tensorial resolution: a direct trilinear decomposition. Journal of Chemometrics. 4:29-45, 1990.
R. A. Harshman. Foundations of the PARAFAC procedure: Models and conditions for an ‘explanatory’ multi-modal factor analysis. UCLA working papers in phonetics 16:1-84, 1970.
Å Rinnan, J. Riu, R. Bro. Multi-way prediction in the presence of uncalibrated interferents. Journal of Chemometrics. 21:76-86, 2007.
Figur 1. Eksempel på kalibreringssæt og prædiktionssæt. Prøven øverst til venstre er kalibreringsprøven. Vi ved at denne er ren tryptofan, og vi ved at koncentrationen er 2.67 µM.
Figur 2. Estimerede loadings fra en PARAFAC-model.
Figur 3. Score-matrix fra en tre-komponent PARAFAC-model af fire prøver.
Figur 4. Score-matrix fra en PARAFAC-model med tryptofan identificeret.
Figur 5. Score-matrix fra en PARAFAC-model skaleret til korrekt tryptofan-koncentration i kalibreringsprøve.