Why – Hvorfor?

Den korte forklaring er indeholdt i denne historie: I 1988 under min speciale skrivning, fortalte min vejleder, Professor Lars Mathiassen til en flok af måbende hovedfagsstuderende, at folk omkring ham forventede at han havde læst alle de bøger og forskningsartikler, som der var udgivet indenfor hans forskningsfelt, System udvikling. Det var ingenlunde tilfældet sagde Lars. Det var en tidslig og fysisk umulighed. Derimod blev han tvunget til at læse artikler og bøger i hierarkier: overskrifter, indholdsfortegnelser, abstrakts og kapitel overskrifter. På et tidspunkt hvor mottoet “You cant judge a book by looking at its cover”. Det var dengang voldsomt provokerende, men 6 år efter brød internettet igennem og den omvendte nyhedstrekant blev introduceret.
Tekster blev siden noget helt andet.  Teksterne er populariseret – nogen vil sige for meget.

Human videnskaberne blev beriget med 3 empiriformer, som overvejende er kvantitative. De har potentialet til at ændre humanistisk individ og organisationsforskning og de har potentialet til at udvikle meget kraftfulde individualiserede mobile kognitive støtte systemer. Indenfor mit eget felt, autismebehandling og forskning, kan behandlingen blive radikalt mere effektivt, kan blive kvalificeret i og med tiltags effekt kan dokumenteres. Mere præcise diagnosebilleder, hvor udgangspunktet ikke alene er observation af cognition og adfærd, men også registreringer af kroppen bliver en del af billedet. Men udfordringen er de mange tal, som de nye empiriformer producerer.  Vi taler ikke længere om talrækker på 10-15 datasæt, men 10-15 Gigabyte eller tetrabyte med datasæt.
Her er der brug for en radikal anden  matematik. Og der er brug for en matematik, som respekterer humanioras særegne træk.

  1. Det ideografiske – at individer og situationer er unikke. Men samtidigt skal matematikken ikke udelukke at erfaringer/data kan sammenlignes.
  2. Viden ikke kun er repræsenteret i statistiske sammenhænge, men eksperters(læs praktikeres) viden og indsigt kan indgå i den statistiske model.
  3. Matematikken er forståelig – på flere abstraktionsniveauer. Et krav til gengivelsen af kvalitative data anvendt i humanvidenskaben er at de skal være genkendelige for den kompetente læser og et tilsvarende krav må rejses overfor matematikken.
  4. Matematikken vil ikke kun være en “efterproces”, som kommer efter den kvalitative analyse af et felt, hvor hypoteserne opstilles og undersøges for første gang. Matematikken skal understøtte explorative studier og ikke kun understøtte positivistisk hypotese aftestning.
  5. Sidst men ikke mindst skal matematikken understøtte en interaktiv afsøgende arbejdsgang og ikke kun være en  black box konstrueret af statistikere, som leverer et resultat.

Disse egenskaber har Bayesianske net i større eller mindre udstrækning. Derfor var populariseringen af bayesianske net vigtige.  En popularisering, som gør det muligt i få ord og billeder at illustrere grundideer i bayesianske net. På denne her blog har jeg bevidst ikke lagt referencer ud, men de findes selvfølgelig. Forespørg eller bed om en diskussion.

venligst

Morten

Udgivet i Om musikken | Skriv en kommentar

BREAKING NEWS

Udsendelsen om En sang for Bayes kommer på DR2 den 13. november kl. 13.30. Hvis I ikke har mulighed for at se den, så skriv til DR, og bed dem om en genudsendelse 🙂

Kh

Kristian

Udgivet i Om musikken | Skriv en kommentar

En sang for Bayes på DR2

For nylig blev Morten og jeg interviewet til et program om En sang for Bayes. Vi blev placeret i en blød Chesterfield lænestol, og med en enkel og effektiv kulisse, som Tina Hare og holdet havde bygget til formålet. Så sad vi ellers der og udbredte os om projektet og baggrunden for det, ud fra nogle spørgsmål, som Susanne H. Knudsen havde lavet til os på forhånd. Jeg tror, det gik ganske godt med det hele.
Det er meningen, at programmet skal sendes inden så længe på DR2. Vi glæder os, og opdaterer naturligvis siden, når vi ved, hvornår det bliver sendt.

Udgivet i om koncerten, Om musikken, Om processen | Skriv en kommentar

Dagen derpå….

Hej alle!


efter en veloverstået koncert har vi nu fået hænderne ned igen og hen til tastaturet. Vi er meget glade og afventer med spænding på anmeldernes vurdering af koncerten. Vi bringer anmeldelser af musikforsker Anders Bonde, og Anders Læsø Madsen, direktør i Hugin   imorgen tirsdag. Vi arbejder også på at få nogle billeder og nogle optagelser ud af Medialab, som har optaget koncerten til en dokumentar om En sang for Bayes, som skal vises på DR2, forhåbentlig i løbet af foråret.

Mens musikken kværner i hovedet – især vender Markov Machine tilbage i mit hoved.

Vi ved endnu ikke hvornår dokumentaren kommer på DR, men skriv til os, så sender vi en besked når der sker noget nyt – hvad enten det drejer sig om dokumentaren, eller om at vi får mulighed for at vise uddrag fra koncerten her på vores blog.

venligst

Morten

Udgivet i Om musikken | 2 kommentarer

Og hvad vil vi så med En sang for Bayes?

Nogen gange gør man bare noget, fordi det kunne være sjovt. Men der er faktisk flere perspektiver ved En sang for Bayes, der rækker ud over selve koncerten:

1. Musikalske perspektiver: Bayesianske net giver nogle nye muligheder for interaktion mellem sangere, publikum og komponist. Inddragelsen af publikum er ikke ny, men måden, det sker på, er.

2. Perspektiver for bayes-miljøet: Det handler mest om at udbrede kendskabet til bayesianske net. Det fine program HUGIN er et generisk program til at håndtere bayesianske net. Det kan bruges til at understøtte beslutningsdannelse i mange forskellige sammenhænge, og det fortjener større udbredelse.

3. Kommercielle perspektiver. I fremtiden vil man sætte sensorer på sig, når man spiller et computerspil eller ser en film. Det vil være oplagt at lade sensordata påvirke, hvordan musikken til spillet eller filmen, bliver afspillet, så man får en oplevelse, der er skræddersyet til ens personlige sindstilstand. En sang for Bayes afsøger nogle af de måder, dette kunne finde sted på.

Hvis du har en interesse i et af disse tre felter, så kom til vores koncert 27. februar.

Udgivet i Om musikken | Skriv en kommentar

Wisdom of Crowds

I 1905 besøgte videnskabsmanden Francis Galton et marked. Galton, der var fætter til Darwin, var meget optaget af geniet, og så ned på pøbelen og pøbelens viden. På markedet var der en gættekonkurrence, hvor man skulle gætte vægten af en okse. Der var knap 800 deltagere, og ingen gættede vægten rigtigt. Galton, som altid var nysgerrig og klar til at lave nye eksperimenter, tog de 800 gæt og fandt gennemsnittet af dem. Det viste sig, at dette gennemsnit var blot 1 pund fra den vægt, som oksen vejede. Dette er nok det første eksempel på det, James Surowiecki  sidenhen kaldte for Wisdom of Crowds – at mængden samlet besidder en større viden end eksperter.

En anden måde at anvende wisdom of crowds på, er ved at bruge en række forskellige mennesker, hvor nogle er eksperter på forskellige områder, og andre ikke er.  I 1968 sank en amerikansk u-båd, USS Scorpion, ud på Atlanterhavet, hvor ethvert signal fra den forsvandt. Båden var væk.


John Piña Craven - a researcher in Bayesian search theory and the recovery of lost objects at seaEn statistiker, John Piña Craven blev sat til at finde USS Scorpion, og det, han gjorde var at indsamle viden fra så mange forskellige kilder som muligt – fra en navigatør, fra radiotelegrafisten, der modtog de seneste signaler fra båden, fra en maskinmester, fra en kaptajn osv. Ud fra alle disse kilder beregnede statistikeren hvor u-båden befandt sig med størst sandsynlighed, og man fandt den igen, ganske tæt ved der, hvor den efter beregningen skulle være.

Om John Piña Craven brugte bayesianske net til sine beregninger vides ikke. Men det kunne han have gjort, for bayesianske net er meget egnede til at håndtere den slags data.

Men nu til musikken: Jeg har lavet et stykke, der illustrerer wisdom of crowds. Hver sanger har fået besked på at lave en lille melodi i en bestemt toneart. Til næste prøve indsamler jeg disse melodier, og når jeg så kommer hjem er det meningen at jeg lægger alle melodierne sammen, og ud fra, hvilke toner, der er mest hyppige for hvert taktslag (eller halve eller kvarte taktslag, alt efter, hvad der er passende), opstår der en ny melodi. En melodi, som man kan sige er et udtryk for wisdom of crowds hvad koret angår.

Udgivet i Om matematikken, Om musikken | Tagget , , | Skriv en kommentar

Bayes net = gule lapper?

Gule lapper bruger vi tit & ofte til at håndtere vores for dårligt dimensionerede Gule lapper - huskesedlerkorttidshukommelse.

Vi kan ikke huske 2-4 ting, som vi skal kunne genkalde 5 minutter efter, hvorfor vi skriver det ned på gule lapper, som en udvidelse af hukommelsen.

Bayesianske net kan kompensere for tilsvarende kognitive mangler. Blot når det gælder evnen til at ræsonnere inden for områder, hvor der er mange betingede sandsynligheder på spil.

En virkelig case – pensionsrådgivning
Den anden dag havde jeg møde med min bankrådgiver ang mine pensioner.

Det er en venlig og ikke særlig sælgende rådgiver, så vi fik igen en god dialog omkring min pension.

Der er meget at snakke om fordi der er mange forhold, som kan tages med i betragtningen, når en pensionsopsparing skal skrues sammen.

Eksempelvis

  • Hvilke ønsker har jeg til pensionens niveau og hvornår vil jeg pensioneres?
  • Hvilke forventninger har jeg til de makroøkonomiske betingelser de næste 10-20 år?
  • Hvilke forventninger har jeg til min egen økonomiske indtjening de næste 10-20 år?
  • Har jeg en interesse i at bruge tid på at pleje min pensionsportefølje?

Der er flere og det bliver “pensionsportefølje management” ikke lettere at forstå.

Der er tale om betingede sandsynligheder, hvor spørgsmålet er

Hvilken investeringsstrategi skal jeg vælge, givet at jeg har visse forventninger til den makroøkonomiske udvikling, min egen privatøkonomi og min egen interesse i at bruge tid på at forvalte min pensionsportefølje?

Bare sætningens længde indikerer at det her er komplekst.

Formelt formuleret er spørgsmålet opskrevet

P(Investeringsstrategi | Makroøkonomisk udvikling, privatøkonomi udvikling, interesse i portefølge varetagelse)

Fordi det er komplekst underviser en bankrådgiver gerne i emnet og nu om dage skal kunden også underskrive en erklæring om at han/hun har modtaget kvalificeret rådgivning. Endvidere kan banken tilbyde en “tunnel”, en række spørgsmål, som man besvarer og så drager programmet investeringsstrategien ud af svarerne.

Det bayesianske alternativ er et net, hvor kunden kan undersøge, hvilken vægt forskellige faktorer spiller for rådet om investeringsstrategi ved at tildele faktorerne forskellige værdier.

Hermed kan kunden selv gennemskue faktorernes betydning og forstå, hvilke faktorers, som der virker hvorledes.

Investeringsstrategi modelleret i et bayesiansk net

Således kan bankkunden være bedre klædt på til sådanne beslutninger.

Dette eksempel kan afprøves på Song.bayesian.net – her!(sitet er på engelsk!)

Udgivet i Om matematikken, Om musikken | 1 kommentar

Popmodernisme?

Hvordan skal vi beskrive musikken til en sang for Bayes? Anders Bonde, som er musikforsker, har gjort opmærksom på, at måden, musikken bliver til på, kan give mindelser om modernistiske komponister som Ligeti og til en vis grad Per Nørgård: At man henter inspiration i den matematiske verden, og skaber musik ud fra denne inspiration.

Imidlertid er stilideomet (den sound og de genrer, den musikalske stil lægger sig op ad), rytmisk pop/rock. Så måske skal vi kalde En sang for Bayes for popmodernisme? Det skal forstås positivt: Som komponist vil jeg gerne have at min musik er tilgængelig for de fleste, og samtidig kan jeg godt lide nogle af de idealer, som modernismens komponister har udbredt.

Et af de afgørende spørgsmål, som jeg har måttet stille mig er, hvem der skal sidde for bordenden – er det komponisten eller er det matematikken? Ligetis holdning var, at det skal komponisten selvfølgelig, alt andet vil være barnligt. Det er en holdning, jeg deler – for mig er skabelse af musik en kreativ proces, hvor man hele tiden har fokus på at det, man laver, føles rigtigt. Hvis man giver køb på det, giver man også køb på sin kunstneriske integritet.

I en sang for Bayes er der alligevel elementer, der er uden for min kontrol – sangere, publikum, Morten Aagaard m.fl. er inviteret med i den kreative proces, og noget af kompositionsprocessen bliver først afsluttet til selve koncerten, hvor publikum får mulighed for at påvirke musikken i nogle af numrene.

Så vi løber en reel risiko for at miste den kunstneriske glød i indsatsen for at være bayesianske. Omvendt kan usikkerheden også komme til at betyde et kor, der er endnu mere på mærkerne end de ellers ville være.

Godt nytår fra komponisten!

 

Udgivet i Om musikken | Skriv en kommentar

Ræsonnement under usikkerhed

Et helt og aldeles centralt element i Bayesisanske net er håndteringen af usikkerhed. Derfor er det også helt centralt  i ”En Sang for Bayes” at synge usikkerheden ud, hvilket et analogt kor giver gode muligheder for.

Vi har givet Professor i Machine Intelligence AAU, Finn V. Jensen, mulighed for at forklare hvad usikkerhed er og hvordan vi kan ræsonnere om forhold i verden, på trods af, at vores viden er behæftet med usikkerhed. Og Finn V. Jensen er bayesianer og det betyder, at den type viden, som man skal kunne modellere i et bayesiansk net også kan være subjektiv!
Denne 4 sider lange posting forefindes osse som printervenlig acrobatfil  her!

Ræsonnement under usikkerhed
 Vi foretager alle ræsonnement under usikkerhed flere gange dagligt. Når vi foretager os noget, har vi visse forventninger til konsekvenserne heraf, men vi kan ikke være sikre. Når vi observerer noget, forsøger vi at slutte os til, hvad der kan ligge bag.

Link to Finn V. Jensens homepage

Eksempel
Din bil kan ikke starte om morgenen. Det kan skyldes, at benzinen er blevet stjålet i løbet af natten, det kan være, at batteriet er dødt, det kan skyldes fugtige tændrør. Der er endnu flere muligheder. I stedet for med det samme at tilkalde vejhjælp, vil man forsøge selv at udbedre fejlen. Er man systematisk, vil man forsøge at tænke sig frem til de mest trolige årsager og eventuelt udbedre dem først.

Sandsynligheder
Ordet sandsynligt bliver brugt i dagligsproget om noget, der kan være tilfældet, men ikke med bestemthed.

Det er også et videnskabeligt udtryk, der har en meget præcis betydning. Et udsagn, som ”Benzinen blev stjålet i nat” er enten sandt eller falsk. Hvis jeg ikke ved det, kan jeg udtrykke min tiltro ved at give det et tal mellem 0 og 1. Det tal kaldes en sandsynlighed. Hvis jeg er sikker på, at udsagnet er sandt giver jeg det sandsynligheden 1, og hvis det med bestemthed er falsk, giver jeg det sandsynligheden 0. Jo større min tiltro, jo større sandsynlighed giver jeg udsagnet.

Sandsynligheder er subjektive; man finder dem ikke ude i verden, som man finder egern, penge, e-mails, og jeg kan i princippet give sandsynligheder til udsagn lige som det passer mig. Videnskabeligt set kræver vi dog, at de mennesker, der tilordner sandsynligheder er rationelle. Det betyder, at der er nogle regler for, hvorledes man bør tilordne sandsynligheder. Hvis man for eksempel har givet sandsynligheden 0.2 til at trække et es fra en bunke kort og 0.3 til at trække en konge, så skal man give udfaldet ”Es eller Konge” sandsynligheden 0.5.

Reglerne skal ikke nævnes her, men de er af en sådan art, at det virker indlysende, at hvis man vil ræsonnere rationelt, må man følge dem. Det betyder, at selvom sandsynligheder er rent subjektive udsagn, så vil rationelle personer meningsfuldt kunne diskutere sig frem til enighed om bestemte sandsynligheder.

Det skal nævnes, at der er to sandsynlighedsteoretiske skoler. Den ovenfor nævnte er den subjektivistiske. Den anden er den frekventistiske, hvor basis for sandsynligheder er optælling og beregning af frekvenser. Det er den skole, de fleste er stødt på i skoleundervisningen.

Betinget sandsynlighed
Alle udsagn om sandsynligheder er baseret på en kontekst. Udsagnet ”Sandsynligheden for at slå en sekser med en terning er 1/6” har en uudtalt forsætning om, at terningen er symmetrisk, og at kastet foretages tilstrækkeligt højt. Udsagnet skulle egentlig være ”Under forudsætning af, at terningen er symmetrisk og kastet er tilstrækkeligt højt, er sandsynligheden for en sekser 1/6”.

Ethvert udsagn om sandsynligheder er altså baseret på, hvad man i øvrigt ved. Disse sandsynligheder kaldes betingede sandsynligheder og har den generelle form

”Givet hændelsen A er sandsynligheden p for hændelsen B”

Notationen er P(B | A) = p. Det bør understreges, at P(B| A) = p ikke betyder, at hver gang A er sand, så sandsynligheden for B p. Det betyder, når A er sand, og al min øvrige viden er irrelevant, så er sandsynligheden for B p.

Kausalitet
Et meget vigtigt instrument til ræsonnement under usikkerhed er at tænke i årsag og virkning. Dette kaldes kausalitet. Influenza er en sygdom, der er kendt for sine symptomer, men selve sygdommen er symptomernes årsag, nemlig en virus. Har jeg symptomerne, vil jeg normalt antage, at jeg har influenza. Men det er ikke sikkert. Andre sygdomme kan forårsage de samme symptomer. Det kan være vigtigt for mig at udelukke for eksempel meningitis, og jeg vil derfor lede efter tilstedeværelse eller fraværd af symptomer, der ikke deles af begge sygdomme.

Den samme årsag har ikke altid de samme virkninger. En infektion af influenzavirus slår forskelligt ud hos forskellige mennesker. I stedet må man tale om, at influenza med en vis sandsynlighed giver hovedpine, ledsmerter, høj feber, etc. En hævning af tobaksafgiften med 20% vil med en vis sandsynlighed give et provenu til staten på 2-3 milliarder kr.

Udtrykt formelt kan udsagnet være P(Hovedpine | Influenza) = 0.8

Man kan hævde, at når der er denne usikkerhed på virkningerne af en årsag, så skyldes det manglende viden. Hvis man vidste alt om nutiden, ville man kunne forudsige fremtiden. Denne diskussion skal ikke tages op her. Vi kan blot konstatere, at vi aldrig ved nok om nutiden til at kunne forudsige fremtiden, og derfor har vi brug for metoder til at foretage fornuftige ræsonnementer under usikkerhed.

A priori forventning og fordomme
Gennem livet samler gør vi os erfaringer, der lægger sig i (under)bevidstheden som forventninger.  For eksempel, når jeg kører frem for rødt lys, forventer jeg, at de krydsende biler holder tilbage og er egentlig ikke særlig forsigtig med at checke, at de faktisk gør det. Det ville jeg derimod være i Lagos.

Vi kan ikke handle i verden uden disse forventninger, og når vi står i en konkret situation, vil de specifikke observationer sammen med vore underbevidste forventninger, få os at til at handle på bestemte måder.

Hvis du hører en rumlen, og glassene klirrer i skabet, forventer du, at det skyldes en lastbil udenfor, og du ville gå hen til skabet for at sikre glassene. Jordskælv kommer slet ikke frem i bevidstheden. I Los Angeles, ville du nok i stedet kaste dig ind under bordet.

Sådanne a priori forventninger er uomgængelige og nødvendige, hvis vi overhovedet skal kunne begå os. I nogle situationer, vil man kalde det fordomme. ”Chefen, han …”;  ”Round up the usual suspects”. Uanset hvor forargede man kan blive over udsagn og handlinger, der udspringer af ubekræftede forventninger, så skal man forstå, at disse er nødvendige og et resultat af opsamlede erfaringer.

Bayes’ formel
Gennem erfaring opsamles stabil information om forholdet mellem årsag og virkning, for eksempel P(Hovedpine| Influenza) og P(Hovedpine| Meningitis). Denne information bruges i specifikke situationer, hvor man observerer symptomerne og vil slutte sig til de bagved liggende årsager. Det kaldes abduktion. Dette baglæns ræsonnement kan som ovenfor beskrevet ikke foretages uden brug af a priori forventninger. Da influenza er meget mere almindeligt end meningitis, vil man ikke køre det store meningitisforsvar i stilling blot på grund en hovedpine. Denne inddragelse af a priori forventninger formuleres matematisk i den berømte Bayes’ formel:

P(B| A) = P(A| B)P(B)/P(A)

Dette er ikke stedet at forklare eller argumentere for denne formel, men den er det matematiske grundlag for rationelt ræsonnement under usikkerhed.

 

Udgivet i Om matematikken | Skriv en kommentar

Musik og interaktivitet

Nu er jeg som komponist for alvor kommet på arbejde. Normalt laver man et stykke musik, som så opføres af nogle musikere. Men i En sang for Bayes vil vi bruge bayesianske net som en måde at strukturere musikken på. Og det stiller nogle andre krav, for det, der for alvor gør det interessant er, hvis man kan lade noget af det, de bayesianske net gør, foregå til selve koncerten. Det vil sige, at de Bayesianske net skaber rum for interaktivitet.

Indtil videre har vi besluttet, at to former for interaktivitet skal finde sted på koncerten:

1. Der bliver en form for spørge-undersøgelse, som publikum kan besvare via deres smartphone, og via laptops, vi forhåbentlig kan skaffe, hvor resultatet vil påvirke musikken.

2. Der bliver et nummer, hvor udvalgte publikummer kommer på scenen og får lov at styre korsangerne.

En af de parametre, som der bliver skruet på, er musikkens kompleksitet. Med et kor, der kan synge 11 forskellige stemmer, vil det være muligt at lave et bayesiansk net, der bestemmer, hvilke og hvor mange stemmer, der skal synges på et givent tidspunkt. Jeg kan som komponist “frede” nogle stemmer, på den måde, at de bliver obligatoriske (f.eks. en melodistemme). Jeg kan også lade nogle stemmer være meget sandsynlige, mens andre stemmer er mindre sandsynlige. Eller lade en stemme trigge af en bestemt begivenhed.

Hvis I kommer til koncerten (som man nu kan købe billetter til), så kan I se, hvordan det kommer til at foregå.

Udgivet i Om musikken | Skriv en kommentar