Den här artikeln borde du ha läst för länge sedan.
I skolan, till exempel.
Det är dags att du slutar oroa dig och börjar älska siffror.
Det var en samling individer där Milton Friedman, den blivande Nobelpristagaren i ekonomi, oftast var den fjärde smartaste personen i rummet. Den smartaste var för det mesta Abraham Wald, en judisk matematiker som nazisterna jagat ut ur Europa.
The Statistical Research Group (SRG) var ett program som samlade USA:s bästa statistiker för att hjälpa till under andra världskriget. Ungefär som Manhattanprojektet, med den skillnaden att vapnen de byggde var ekvationer, inte sprängmedel.
Militären kom till SRG och Abraham Wald med ett problem:
De ville inte att deras stridsplan skulle bli nedskjutna av fienden så de bepansrade dem. Men pansar gör att planen blir tyngre, svårare att manövrera och slukar mer bränsle. De behövde hitta den perfekta medelvägen. Pansar på rätt ställen.
Han hade helt enkelt – om än via en rad matematiska ekvationer – ställt sig frågan: ”Var är de saknade kulhålen?
Militären hade data över var alla amerikanska flygplan som kommit tillbaka från strid blivit träffade. Det fanns till exempel betydligt fler kulhål i bränsletanken än i motorn. Officerarna såg möjligheten att koncentrera bepansringen till de ställen där planen träffades mest, och de frågade Wald: ”Hur mycket pansar behöver vi?”
Svaret de fick, hade de inte väntat sig.
Abraham Wald sa: ”Pansaret ska inte sitta där kulhålen finns. Det ska sitta där de inte finns, runt motorn.”
Han hade helt enkelt – om än via en rad matematiska ekvationer – ställt sig frågan: ”Var är de saknade kulhålen? De som hade funnits vid motorn om samtliga kulhål varit jämnt spridda över flygplanen?”
Svaret var att de saknade kulhålen fanns på de saknade planen. Anledningen till att flygplanen kom tillbaka med få kulhål vid motorn var att de plan som träffades i motorn inte kom tillbaka alls.
Jordan Ellenberg är professor i matematik vid Wisconsin-Madison-universitetet i USA. Berättelsen om Abraham Wald är från hans bok ”How not to be wrong – The power of mathematical thinking”.
Det är den historia han skulle ha börjat den allra första mattelektionen med om han undervisade i grundskolan eller gymnasiet. En historia som visar vad matematik egentligen handlar om.
– Livet blir rikare med matematik. Precis som alla andra lärare vill jag att så många som möjligt har tillgång till den kunskap och den världsbild jag ägnat mitt liv åt att studera, säger Jordan Ellenberg.
Men det Wald gjorde var väl bara sunt förnuft? Ja, precis. Den preussiske militärteoretikern Carl von Clausewitz myntade uttrycket ”matematik är bara en förlängning av det sunda förnuftet med andra medel”.
Världens ekonomi blir allt mer uppbyggd av matematik. Program, algoritmer och matematiska metoder styr gigantiska ekonomiska modeller. När det fungerar är det på gränsen till poesi, men när någon fuskar kommer alltid matematiken tillbaka och rycker bort mattan under våra fötter.
Ta statistik, till exempel. Ofta presenteras statistik som en linjär ökning eller minskning, som i slutändan kommer att leda till någon form av katastrof. Detta förekommer relativt regelbundet i media, men händer faktiskt också inom forskningen.
Amerikanska medier hakade förstås på och varnade för ”den överviktiga apokalypsen”
Vi vill gärna räkna på data med hjälp av så kallad multipel linjär regression. Jordan Ellenberg kallar det för statistikens skruvmejsel, ett väldigt enkelt och användbart verktyg. Men om du använder den fel kan den plötsligt förvandlas till en sticksåg i din hand.
Sanningen är nämligen ofta att det som presenteras linjärt, i verkligheten existerar i form av en kurva – den så kallade Lafferkurvan.
Håll ut, det är inte så krångligt som det låter. Det är sunt förnuft med andra medel. Vi tar ett exempel från Ellenbergs bok på hur det kan se ut:
För fyra år sedan presenterade den amerikanska vetenskapliga journalen Obesity nya rön som visar att alla(!) amerikaner kommer att vara överviktiga år 2048. Amerikanska medier hakade förstås på och varnade för ”den överviktiga apokalypsen”.
Statistiken byggde på data från en stor regelbunden hälsoundersökning, och det råder ingen tvekan om att amerikanerna blir tyngre. Under tidigt 70-tal var mindre än hälften överviktiga (BMI över 25). År 2008 var siffran närmare 75 procent. Ritar man upp ökningen som en linje så korsar den 100-procentsstrecket år 2048.
Problemet är bara att man inte kan räkna så, för då skulle otroliga 109 procent av amerikanerna vara överviktiga år 2060. Linjen är inte en linje.
En graf över en ökande proportion böjer sig mer och mer ju närmare den kommer 100 procent, och planar sakta ut och når aldrig 100 procent. Ju fler överviktiga, desto färre smala människor finns det kvar att ”omvandla”. De smala finns därför alltid kvar.
Och mycket riktigt, bara fyra år senare visade hälsoundersökningen att ökningen redan börjat bromsa in.
Det blir noll poäng på matteprovet för Youfa Wang, den professor i epidemiologi som stod bakom rapporten.
Men rapporten innehöll fler matematiska missar. Forskarna delade upp statistiken i bland annat etnicitet och kön och fastslog att svarta mäns övervikt ökade bara hälften så snabbt som för övriga befolkningen. Ta fram din statistiska skruvmejsel, och voilà: inte förrän år 2095 kommer alla svarta amerikanska män att vara överviktiga.
2048 är endast 80 procent av dem överviktiga. Ni ser problemet? Om alla amerikaner är överviktiga år 2048, var är då de 20 procenten svarta män som inte ska vara det? Utomlands?
Det blir noll poäng på matteprovet för Youfa Wang, den professor i epidemiologi som stod bakom rapporten.
”Filosofer och forskare är för dåliga på matte. Utan denna kunskap har de helt enkelt inte nycklarna för att förstå världen”, som den prisbelönta franske matematikern Cedric Villani säger. Det finns ingen knapp på miniräknaren som visar hur amerikanernas övervikt kommer att utvecklas. Det handlar om att ställa rätt frågor, göra rätt analys – därefter plockar man fram miniräknaren.
Att dela ett tal med ett annat är bara en beräkning. Att lista ut vilket tal som ska delas med vilket – det är matematik. Eller som matematikern Hannah Fry säger i sitt TED-tal från 2014:
”Ekvationer är inte bara ’saker´. De är en röst som berättar om naturens otroliga rikedom och den förbluffande enkelhet som finns i de mönster som vrider sig, tänjs ut och utvecklas runtomkring oss – från hur världen fungerar till hur vi beter oss.”
– Dålig statistik är ett problem, speciellt i dag när vi kan göra dataanalys snabbt och upprepade gånger. Men jag tror också att det är ett problem som forskarvärlden kan hantera relativt väl, säger Jordan Ellenberg.
Vilket Ellenberg är inne på, har matematik blivit ännu viktigare än tidigare. Den följde med ut i rampljuset när dataprogrammeringen exploderade under 80-talet och en oproportionerligt liten del av befolkningen uppfann nya sätt att tillfredsställa våra grundläggande mänskliga behov (boka flyg, skicka brev, döda zombier).
Datasystemen som programmerarna byggde styr i dag den globala ekonomiska infrastrukturen, som Paul Ford skriver i sitt epos till artikel ”What is code” i Bloomberg Businessweek:
”Om programmerarna inte styr världen, så styr de sakerna som styr världen.” Han fortsätter: ”Den största kommersiella insikten teknikindustrin bidragit till är att om du kontrollerar en digital miljö så kan du förändra marknaden. Du kan förändra hur människor gör saker, hur de lyssnar på musik, ser på film och tar del av marknadsföring. Människor som jobbar på teknikföretag förväntas ta en idé, multiplicera den med några miljoner människor – och generera ett antal miljarder dollar.”
Direktörer för stora företag befinner sig allt oftare i möten med 30-åringar med laptop i knät som behöver miljoner till en ny webbarkitektur. Digitala projekt med osäkra deadlines. All den planering, struktur och tydlighet som genomsyrat företaget – och vd:ns – affärer genom åren förändras på ett ögonblick när allt digitaliseras och marknaden förändras.
Men datorer och mjukvara skapar inte magi av sig själva. Datorer är ganska dumma, hur mycket vi än vill hylla alla nya algoritmer där ute. Vi människor måste fortfarande anstränga oss för att få ordning på all data.
Men sanningen är att 10 procent innebär enorma pengar för Netflix – och det visade sig också ta tre år innan någon vann tävlingen.
År 2006 utlyste Netflix en tävling. Vem som helst hade chansen att vinna en miljon dollar om de lyckades skriva en algoritm som, bättre än Netflix egen, kunde rekommendera filmer till kunderna baserat på deras preferenser. Kravet var att algoritmen var tio procent bättre, vilket verkar lite för en miljon dollar.
Men sanningen är att tio procent innebär enorma pengar för Netflix – och det visade sig också ta tre år innan någon vann tävlingen. Först när flera tävlande team slog samman sina uträkningar lyckades de precis nå upp till 10-procentsstrecket.
(Netflix använde dock aldrig algoritmen, de hade vid det laget inlett övergången från att skicka dvd-filmer med posten till dagens digitala Netflixtjänst.)
– Jag tror att det största misstaget är att tro att statistiska algoritmer är ”magiska”. Det är de inte. De är digitala verktyg precis som alla andra, med sina styrkor och begränsningar.
– Du kan till exempel inte veta vilka filmer människor kommer att gilla bara genom att vända dig till data. Vad du kan göra är att stegvis öka träffsäkerheten i dina prognoser, och denna ökning ger direkt ekonomisk vinning. Du behöver inte utöva magi för att tjäna pengar, säger Jordan Ellenberg.
Linda Liukas är programmerare, författare, illustratör och Digital champion of Finland. Digital champions är EU:s ambassadörer för digitalisering, utsedda av sina respektive länder (Sverige representeras av Jan Gulliksen, skolchef för KTH).
Hon har också skapat den internationella rörelsen Rails Girls, där unga kvinnor lär sig att programmera, och är aktuell i Sverige med programmeringsbarnboken ”Hej Ruby” (som kom till via en Kickstarterkampanj som inbringade över tre miljoner kronor).
Hon kommer från en familj där ”alla andra höll på med avancerad matematik”, men hon tyckte att det var tråkigt att ägna sig åt siffror:
– Jag ville vara på den sida av världen där saker hände, där det var färgsprakande och roligt, säger Linda Liukas.
Ironiskt nog hoppade hon på en utbildning inom programmering. Sådana utgår ofta från väldigt abstrakta idéer, som hur man skriver ett program som beräknar roten av de tjugo första primtalen. De hoppar över mycket av det roliga.
– Men som vuxen har jag börjat se skönheten i siffror. Programmering gör matematiken verklig och användbar. Du kan testa och vrida på abstrakta saker.
Dagens unga växer upp i en värld där datorer och programmering är en stor del av det vardagliga livet.
– Därför är det viktigt att uppmuntra unga att utforska tekniken och visa att ett datortangentbord är ett verktyg för att uppfinna, bygga och skapa.
Finland kommer att ha med programmering i den nya läroplanen 2016, vilket Linda Liukas tycker är underbart. Hon tror inte att alla kommer att bli kodare, men förmågan att tala och strukturera sitt tänkande så att en dator förstår tror hon är en oerhört viktig framtida kompetens:
– Den viktigaste lärdomen jag fått av dator- och systemvetenskapen är att alla de stora problemen bara är små problem som fastnat i varandra. ✪
3 exempel – när siffror och statistik kan lura oss.
1. Dubbelt av lite är fortfarande lite
År 1995 meddelade UK Committee on Safety of Medicines (CSM) vårdpersonal i England att vissa sorters p-piller dubblade risken att drabbas av en elakartad blodpropp. I uttalandet sades också att alla piller var säkra för de allra flesta kvinnor och att ingen borde sluta ta p-piller utan att rådfråga sin doktor. Men sådana detaljer är lätta att missa när rubriken lyder ”Piller dödar”. Folk blev livrädda och många slutade med, eller bytte, p-piller vilket ledde till 26 000 fler graviditeter och 13 600 fler aborter.
Problemet var bara att sådana blodproppar är väldigt sällsynta. Man bedömer att risken är 1 på 7 000 att drabbas. Den dubbla risken innebar alltså att endast 2 av 7 000 riskerade att drabbas.
2. Aktiemäklaren som såg framtiden
Berättelsen (sann eller inte, åsikterna går isär) lyder: En man fick ett nyhetsbrev från en aktiemäklare i Baltimore med ett tips om att en viss aktie skulle öka i värde. Och precis som mäklaren förutspått ökade aktiens värde. Nästa vecka fick mannen ett nytt nyhetsbrev från mäklaren. Denna gång förutspådde han att en viss aktie skulle tappa i värde – och han hade rätt igen. Under tio veckor fick mannen tio korrekta tips från mäklaren. Sedan följde ett erbjudande om att anlita aktiemäklaren för en ansenlig summa. Men det var det ju värt, mäklaren var uppenbarligen extremt skicklig.
Men, från aktiemäklarens håll såg historien ut så här: Den där första veckan var inte mannen den enda mottagaren av mäklarens nyhetsbrev. Mäklaren skickade 10 240 stycken. Men de skilde sig åt. Hälften förutspådde att aktien skulle gå upp, hälften att den skulle gå ner. De 5 120 stycken som fick brevet med fel prognos hörde aldrig av mäklaren igen. Men övriga fick ett nytt tips nästa vecka. Hälften av breven sa det ena, hälften det andra. Efter det återstod fortfarande 2 560 personer. Och så vidare. Efter tio veckor fanns det tio personer som fått tio korrekta tips i rad från detta obestridliga geni till aktiemäklare. Och de var med största sannolikhet beredda att satsa mycket pengar på honom.
3. När slöseri är bra
Vi läser ofta om myndigheter som slösat med skattebetalarnas pengar. Ett exempel är från Wall Street Journals Washington Wire blog, 24 juni 2013: ”Social Security Agency (SSA) betalade ut 31 miljoner dollar i bidrag till personer som visade sig vara avlidna. SSA har dessutom informationen om att de är avlidna i sin databas och bör ha känt till det”.
Hur kan vi tillåta att sådant förekommer? Svaret är enkelt: det kostar att eliminera slöseri. Bloggaren och matematikern Nicholas Beaudrot noterade att 31 miljoner dollar motsvarar 0,004 procent av alla bidrag SSA betalar ut årligen. Myndigheten är alltså redan väldigt duktig på att veta vilka som lever och vilka som är döda. Att få bort de sista 0,004 procenten kan kosta mer än det smakar. Vi ska inte fråga oss ”Varför slösar vi med skattebetalarnas pengar?” utan snarare ”Vilken är den rätta andel av skattebetalarnas pengar som vi bör slösa?”.
EN KORTARE VERSION PUBLICERAD I BEHIND THE SCENES #1/2016