Et helt og aldeles centralt element i Bayesisanske net er håndteringen af usikkerhed. Derfor er det også helt centralt i ”En Sang for Bayes” at synge usikkerheden ud, hvilket et analogt kor giver gode muligheder for.
Vi har givet Professor i Machine Intelligence AAU, Finn V. Jensen, mulighed for at forklare hvad usikkerhed er og hvordan vi kan ræsonnere om forhold i verden, på trods af, at vores viden er behæftet med usikkerhed. Og Finn V. Jensen er bayesianer og det betyder, at den type viden, som man skal kunne modellere i et bayesiansk net også kan være subjektiv!
Denne 4 sider lange posting forefindes osse som printervenlig acrobatfil her!
Ræsonnement under usikkerhed
Vi foretager alle ræsonnement under usikkerhed flere gange dagligt. Når vi foretager os noget, har vi visse forventninger til konsekvenserne heraf, men vi kan ikke være sikre. Når vi observerer noget, forsøger vi at slutte os til, hvad der kan ligge bag.
Eksempel
Din bil kan ikke starte om morgenen. Det kan skyldes, at benzinen er blevet stjålet i løbet af natten, det kan være, at batteriet er dødt, det kan skyldes fugtige tændrør. Der er endnu flere muligheder. I stedet for med det samme at tilkalde vejhjælp, vil man forsøge selv at udbedre fejlen. Er man systematisk, vil man forsøge at tænke sig frem til de mest trolige årsager og eventuelt udbedre dem først.
Sandsynligheder
Ordet sandsynligt bliver brugt i dagligsproget om noget, der kan være tilfældet, men ikke med bestemthed.
Det er også et videnskabeligt udtryk, der har en meget præcis betydning. Et udsagn, som ”Benzinen blev stjålet i nat” er enten sandt eller falsk. Hvis jeg ikke ved det, kan jeg udtrykke min tiltro ved at give det et tal mellem 0 og 1. Det tal kaldes en sandsynlighed. Hvis jeg er sikker på, at udsagnet er sandt giver jeg det sandsynligheden 1, og hvis det med bestemthed er falsk, giver jeg det sandsynligheden 0. Jo større min tiltro, jo større sandsynlighed giver jeg udsagnet.
Sandsynligheder er subjektive; man finder dem ikke ude i verden, som man finder egern, penge, e-mails, og jeg kan i princippet give sandsynligheder til udsagn lige som det passer mig. Videnskabeligt set kræver vi dog, at de mennesker, der tilordner sandsynligheder er rationelle. Det betyder, at der er nogle regler for, hvorledes man bør tilordne sandsynligheder. Hvis man for eksempel har givet sandsynligheden 0.2 til at trække et es fra en bunke kort og 0.3 til at trække en konge, så skal man give udfaldet ”Es eller Konge” sandsynligheden 0.5.
Reglerne skal ikke nævnes her, men de er af en sådan art, at det virker indlysende, at hvis man vil ræsonnere rationelt, må man følge dem. Det betyder, at selvom sandsynligheder er rent subjektive udsagn, så vil rationelle personer meningsfuldt kunne diskutere sig frem til enighed om bestemte sandsynligheder.
Det skal nævnes, at der er to sandsynlighedsteoretiske skoler. Den ovenfor nævnte er den subjektivistiske. Den anden er den frekventistiske, hvor basis for sandsynligheder er optælling og beregning af frekvenser. Det er den skole, de fleste er stødt på i skoleundervisningen.
Betinget sandsynlighed
Alle udsagn om sandsynligheder er baseret på en kontekst. Udsagnet ”Sandsynligheden for at slå en sekser med en terning er 1/6” har en uudtalt forsætning om, at terningen er symmetrisk, og at kastet foretages tilstrækkeligt højt. Udsagnet skulle egentlig være ”Under forudsætning af, at terningen er symmetrisk og kastet er tilstrækkeligt højt, er sandsynligheden for en sekser 1/6”.
Ethvert udsagn om sandsynligheder er altså baseret på, hvad man i øvrigt ved. Disse sandsynligheder kaldes betingede sandsynligheder og har den generelle form
”Givet hændelsen A er sandsynligheden p for hændelsen B”
Notationen er P(B | A) = p. Det bør understreges, at P(B| A) = p ikke betyder, at hver gang A er sand, så sandsynligheden for B p. Det betyder, når A er sand, og al min øvrige viden er irrelevant, så er sandsynligheden for B p.
Kausalitet
Et meget vigtigt instrument til ræsonnement under usikkerhed er at tænke i årsag og virkning. Dette kaldes kausalitet. Influenza er en sygdom, der er kendt for sine symptomer, men selve sygdommen er symptomernes årsag, nemlig en virus. Har jeg symptomerne, vil jeg normalt antage, at jeg har influenza. Men det er ikke sikkert. Andre sygdomme kan forårsage de samme symptomer. Det kan være vigtigt for mig at udelukke for eksempel meningitis, og jeg vil derfor lede efter tilstedeværelse eller fraværd af symptomer, der ikke deles af begge sygdomme.
Den samme årsag har ikke altid de samme virkninger. En infektion af influenzavirus slår forskelligt ud hos forskellige mennesker. I stedet må man tale om, at influenza med en vis sandsynlighed giver hovedpine, ledsmerter, høj feber, etc. En hævning af tobaksafgiften med 20% vil med en vis sandsynlighed give et provenu til staten på 2-3 milliarder kr.
Udtrykt formelt kan udsagnet være P(Hovedpine | Influenza) = 0.8
Man kan hævde, at når der er denne usikkerhed på virkningerne af en årsag, så skyldes det manglende viden. Hvis man vidste alt om nutiden, ville man kunne forudsige fremtiden. Denne diskussion skal ikke tages op her. Vi kan blot konstatere, at vi aldrig ved nok om nutiden til at kunne forudsige fremtiden, og derfor har vi brug for metoder til at foretage fornuftige ræsonnementer under usikkerhed.
A priori forventning og fordomme
Gennem livet samler gør vi os erfaringer, der lægger sig i (under)bevidstheden som forventninger. For eksempel, når jeg kører frem for rødt lys, forventer jeg, at de krydsende biler holder tilbage og er egentlig ikke særlig forsigtig med at checke, at de faktisk gør det. Det ville jeg derimod være i Lagos.
Vi kan ikke handle i verden uden disse forventninger, og når vi står i en konkret situation, vil de specifikke observationer sammen med vore underbevidste forventninger, få os at til at handle på bestemte måder.
Hvis du hører en rumlen, og glassene klirrer i skabet, forventer du, at det skyldes en lastbil udenfor, og du ville gå hen til skabet for at sikre glassene. Jordskælv kommer slet ikke frem i bevidstheden. I Los Angeles, ville du nok i stedet kaste dig ind under bordet.
Sådanne a priori forventninger er uomgængelige og nødvendige, hvis vi overhovedet skal kunne begå os. I nogle situationer, vil man kalde det fordomme. ”Chefen, han …”; ”Round up the usual suspects”. Uanset hvor forargede man kan blive over udsagn og handlinger, der udspringer af ubekræftede forventninger, så skal man forstå, at disse er nødvendige og et resultat af opsamlede erfaringer.
Bayes’ formel
Gennem erfaring opsamles stabil information om forholdet mellem årsag og virkning, for eksempel P(Hovedpine| Influenza) og P(Hovedpine| Meningitis). Denne information bruges i specifikke situationer, hvor man observerer symptomerne og vil slutte sig til de bagved liggende årsager. Det kaldes abduktion. Dette baglæns ræsonnement kan som ovenfor beskrevet ikke foretages uden brug af a priori forventninger. Da influenza er meget mere almindeligt end meningitis, vil man ikke køre det store meningitisforsvar i stilling blot på grund en hovedpine. Denne inddragelse af a priori forventninger formuleres matematisk i den berømte Bayes’ formel:
P(B| A) = P(A| B)P(B)/P(A)
Dette er ikke stedet at forklare eller argumentere for denne formel, men den er det matematiske grundlag for rationelt ræsonnement under usikkerhed.