2015. november 6., péntek

Hogyan teszteljük a szifiliszt?

- Tábornok elvtárs! Szerjózsa elkapta a szifiliszt.
- Szerjózsát kitüntetni, szifiliszt agyonlőni.

A fent említett tábornok elvtárs nem tudta, amit mi mindannyian tudunk, - ha más honnan nem is Ady Endre kapcsán már hallottunk róla - hogy a szifilisz egy fertőző nemi betegség. 
Egy kanadai tanulmány szerint a második világháborúban mindegyik félnek jelentős emberveszteségekkel kellett számolnia a nemi betegségek miatt. A teljes Európába áthajózott katonai létszámból 18615 szifiliszt diagnosztizáltak.

Manapság már egy okostelefon- kiegészítő negyedóra alatt egy csepp vérből kimutatja a szifiliszt, ráadásul a kütyü nem kerül többe, mint 9200Ft. Ám a második világháború idején még csak laboratóriumi tesztelés volt elérhető. Egy laboratóriumi diagnosztikai rendszer 5 millió Ft. Tehát koránt sem volt egyszerű, sem olcsó "mulatság". 


A szifiliszt vérmintákból tesztelik, az eljárás költséges volt, így célunk minél kevesebb tesztből kideríteni a hadsereg összes tagjáról, hogy fertőzött-e. A szifilisz gyakorisága az USAban p=0,000154 a CDC adatai szerint. Tehát 100000 főből körülbelül 15,4 szifiliszes. Az alapötlet nem más, mint hogy öntsük össze pár ember vérét. Az összeöntött vért teszteljük, ha az negatív, akkor egyetlen egy ember sem volt szifiliszes, ha pozitív a teszt, akkor legalább egy ember beteg. Utóbbi esetben tovább kell tesztelni, újabb vérvétel következik, majd kevesebb ember vérét öntjük össze. A kérdés tehát az, hogy hány fős csoportokat kell alkotnunk - azaz hány ember vérét kell összeöntsük, hogy a lehető legkevesebb tesztet kelljen elvégeznünk.
Eleinte (mivel mégiscsak egy hadseregről van szó) legyen 100000-nél több tesztelendő alanyunk.
Legyen N a hadsereg létszáma, és x az egyes csoportok létszáma. Tehát N/x csoportunk van. Legyen továbbá p a valószínűsége annak, hogy egy adott személy szifiliszes, tehát a szifilisz gyakorisága. Fent említettem, hogy ez Amerikában kb 0,000154.
Ekkor (1p)x          a valószínűsége, hogy egy x fős csoport tesztje negatív lesz, azaz mindenki egészséges. Tehát  1(1p)x   a valószínűsége, hogy pozitív. Ekkor újabb csoportokra kell bontanunk. A pozitív mintájú csoportok várható száma  Nx(1(1p)x)
Az összes teszt tehát: Nx(1+(1(1p)x)x)

Innen láthatjuk, hogy a minimum (amit keresünk) N-től nem fog függni az optimális x-ünk, p helyére pedig beírhatjuk 0,0145-öt. Wolframalpha segítségévéel megkaptuk, hogy 81 fős csoportok az optimálisak. Ebben az esetben kell elvégezni a legkevesebb tesztet.

A fenti esetben feltételeztük, hogy ha kapunk egy pozitív eredményt, utána minden tagot egyesével letesztelünk. Pedig 81 főt ennél hatékonyabb módon is tudunk tesztelni... A legkevesebb tesztre akkor van szükségünk, ha mindig felezzük a csapatot. Feltételezzük, hogy 81 főből csak egy szifiliszes van, mivel annak, hogy kettő legyen nagyon kicsi a valószínűsége. Tehát ha két csoportra osztjuk, akkor a szifiliszes az egyikben vagy a másikban lesz. A legrosszabb esetben először a 41, majd a 21, 11, 6 fős csoportban van. Utána mindkét csoport 3 fős lesz, majd rossz esetben a 2 fős csoportba kerül, és a maradék két főt egyesével leteszteljük. Tehát 7 teszt elegendő 81 fő letesztelésére, az más kérdés, hogy szegény szifiliszes betegtől az egész procedúra alatt 8-szor vettek vért...


  

2015. február 16., hétfő

Mi az a Turing gép?

 "Mintha egy agyat építenénk" 
Nyilatkozta Alan Turing. Elképzelhetőnek tartotta, hogy a jövőben (az ezredfordulóig bezárólag) mesterséges intelligenciát hozzunk világra. AI-t, amely átmenne a Turing-teszten. Mi az a Turing teszt?Mikor tekinthető értelmesnek egy gép? Tudnak-e a gépek gondolkodni?

"Három ember játssza a játékot: egy férfi (A), egy nő (B) és egy kérdező (C), aki bármilyen nemű lehet" - írta Alan Turing. "A kérdező olyan szobában tartózkodik, amely el van választva a másik kettőtől. A játék célja a kérdező számára az, hogy megállapítsa, a másik kettő közül melyik a férfi és melyik a nő. Hogy a hangszín se segíthesse, a válaszokat írásban, vagy még jobb, ha gépírással adják meg. Most kérdezzük meg: Mi történik, ha A szerepét egy gép veszi át? Vajon a kérdező ugyanolyan gyakran fog rosszul dönteni, ha a játékot így játsszák, mint akkor, ha a játék egy férfi és egy nő között zajlik? E kérdések helyettesítik az eredeti kérdésünket: tudnak-e a gépek gondolkodni?""A század végére a szavak használata és a tanult emberek véleménye annyira meg fog változni, hogy anélkül beszélhetünk majd a gépi gondolkodásról, hogy mások ezzel vitába szállnának"

Ezek a mondatok több, mint 50 éve hangoztak el Turing szájából. Nézzük meg mi lett azóta, ám ehhez szükséges tudnunk mi is az a Turing gép.

Tulajdonképpen egy automatát, egyszerű számítógépmodellt képzelt el, amely három részből - belső állapotból: memóriából és utasításkészletből, érzékelő fejből, illetve négyzetekre osztott, elméletileg végtelen bemenő (input) szalagból - állna. A bemeneti jelek rendeltetését szabályok határozzák meg, majd a gép újabb jeleket (azaz számokba kódolt, standardizált utasításokat) ír a szalagra. Ha a szalag elegendő hosszúságú, bármi kiszámolható; az összes (jól-meghatározott) feladat, egyetlen (a szükséges programokkal ellátott) géppel.

Melyik az a gép, ami átment a Turing-teszten? Azaz a fent említett teszten minimum a szakértők 30%-a nem tudja eldönteni, hogy melyik válaszoló a számítógép. A történelem során először a Readingi Egyetem 2014-ben, Londonban tartott eseményén egy magát  Eugene Goostmannak, egy 13 éves ukrán kisfiúnak kiadó program győzte meg sikeresen a szakemberek 33 százalékát arról, hogy emberrel beszélgetnek. Az egyetem közleménye szerint a Turing-tesztet elsőként teljesítő programot az Egyesült Államokban élő orosz Vladimir Veselov és az Oroszországban élő ukrán Eugene Demchenko fejlesztették. Ugyanez a chatrobot 2012-ben már nagyon közel járt az áttöréshez, de akkor a szükséges 30 helyett csak a bírálók 29 százalékát sikerült “átvernie”.

források:
http://index.hu/tech/cyberia/turing/
http://hvg.hu/tudomany/20140608_mesterseges_intelligencia_turing_teszt

2015. január 24., szombat

"Mi a fene az a mérték?" avagy mértékelmélet óvodásoknak 2.

Tegnap átvettük a mértékelmélethez tartozó alap definíciókat. Ma ezt felhasználva megnézzük mi is az a valószínűség.

Nem akarok senkit se elkeseríteni, de a valószínűség = mérték. Egy kis extrával. A valószínűség csak 0 és 1 közötti számot vehet fel, és az eseménytér valószínűsége 1.
A - itt is egy σ-algebra
Tehát ugyanaz a definíció , mint a valószínűségi változónak, csak n-dimenziós térbe képezünk, hiszen a vektorváltozót úgy tudjuk a legegyszerűbben elképzelni, ha egy n hosszú vektorként képzeljük el, ehhez viszont n dimenzióra van szükségünk.


Tehát korrekten: valószínűség = 1-re normált mérték.



A fenti táblázat leírja a valószínűségszámítás alap fogalmait mértékelméleti alapon. A valószínűségi változó úgy érzem egy kis magyarázatra szorul. Azt már tudjuk, hogy mi az a Borel mérhető halmaz (lásd 1 rész), de mi fán terem a Borel mérhető függvény?

Def:  X: Ω -> R függvény valószínűségi változó, ha {ω: X(ω) ϵ Bϵ A minden Borel halmazra.

ω - elemi esemény, mivel Ω eleme (nem véletlenül ugyanaz a betű). 
X(ω) - Az X függvény felvett értéke ω helyen

Tehát a valószínűségi változó lényegében olyan jelenségek matematikai megfogalmazására, modellezésére alkalmas, melyek véletlentől függő értéket vesznek fel. Ilyen lehet például egy kockadobás eredménye, egy folyó vízállása vagy az utcán szembe jövő emberek testmagassága.

Valószínűségi vektorváltozó: X: Ω -> R^n függvény valószínűségi vektorváltozó, ha Borel mérhető. 

Állítás: X pontosan akkor valószínűségi vektorváltozó, ha a koordinátái valószínűségi változók.

Legyen B Borel halmaz. X eloszlása : P{ω: X(ω) ϵ B}.

Eloszlásfüggvény: Fx(z)=P(x<z) . ( A < koordinátánként értendő)

Az eloszlásfüggvény tehát minden z valós számhoz hozzárendeli, annak a valószínűségét, hogy a valószínűségi változó ennél kisebb értéket vesz fel.
Az eloszlásfüggvény segítségével sok alapvető jelentőségű valószínűség-számítási fogalmat lehet definiálni. Ilyen például a sűrűségfüggvény, illetve a várható érték.

A sűrűségfüggvény precíz meghatározásához viszont szükségünk van a Radon-Nikodym derivált fogalmára. 


Tegye fel a kezét, aki érti! Én nem. Gondoltam meg keresem majd, hogy hogyan számoljuk ki és minden világos lesz. Itt kell hogy elkeserítsek mindenkit, hiszen nem ismert explicit módszer a Radon-Nikodym derivált kiszámolására az általános esetben. Majd a későbbiekben látunk pár speciális esetben kiszámolási módot.

Sűrűségfüggvény:

A fenti Radon-Nikodym derivált a sűrűségfüggvény általánosításánál játszik majd fontos szerepet. Őt nevezzük általánosított sűrűségfüggvénynek, hiszen sűrűségfüggvény csak abszolút folytonos esetben létezik. A Radon-Nikodym derivált nem más, mint a mérték szerinti integrál.

                                                                                                                                  Folyt. köv.



"Mi a fene az a mérték?" avagy mértékelmélet óvodásoknak 1.

"Inni csak mértékkel és tartózkodással szabad. Mérték a vödör, tartózkodás az asztal alatt."


A fenti kép a hagyományos válasz erre a kérdésre. Azaz Legyen X tetszőleges halmaz, M az X részhalmazaiból álló σ-algebra és µ az M-n értelmezett nemnegatív σ-additív halmazfüggvény. Ekkor az (X, M, µ) hármast métréktérnek nevezzük, és az M halmaz elemeit mérhető halmazoknak nevezzük.  
De ez alapján nekem számtalan sok kérdésem van. Mi az a σ-algebra? Hogy képzeljek el egy halmazsorozatot? Meg úgy egyáltalán mivaaan?



Kezdjük egy kicsit másképp:

A mérték egy függvény, ami egy adott halmaz részhalmaihoz egy számot rendel. Ez már kicsit szebben hangzik. Tehát a mértékelmélet arról szól, hogy halmazokhoz rendelünk számokat.
Ilyen például a távolság. Ahol a halmazunk elemei a pontok, a részhalmazok valahány pont kiválasztva, és a mérték 2 pont közti távolság, tehát egy szám. 


Fenti tudásunkon felbátorodva, fussunk neki a formálisabb definíciónak!

Ω  = alaphalmaz, melynek elemei az elemi események
A = az események σ-algebrája
Borel-mérhető halmaz = az összes értelmes halmaz, amit el lehet képzelni, tehát olyan halmazok, amik intervallumok rendszeréből a szokásos műveletekkel előállíthatók. Például egy Borel-halmaz a valós számok halmaza is. 

Már csak a 
σ-algebrával és a σ-additivitással vagyok adós és máris érthető a mérték formális definíciója is.

σ-additívnak nevezünk egy halmazfüggvényt, ha értelmezési tartományába tartozó diszjunkt halmazok megszámlálható unióján is értelmezve van, és az itt felvett érték megegyezik az uniót alkotó halmazokon felvett értékeinek összegével.
Vegyük észre, hogy ez a területfogalom általánosítása. Fontos megjegyeznünk, hogy a meghatározásban nem hagyható el a diszjunkt szó. Mivel ha nem üres két halmaz metszete, akkor az uniójuk mértéke nem egyezik meg a mértékeik összegével. Lásd: szitaformula.Az unió elemszámára ugyanis a következő képlet teljesül:

|A \cup B|= |A|+|B|-|A\cap B|
A kivonást azért kell elvégezni, mert a metszet elemeire vonatkozóan az összeszámolásban |A| + |B| összegben kétszer végeztük el. Most képzeljünk az elemszámok helyére mindenhova mértéket. [ Lehet, hogy az elemszám is mérték? ;) ]
A σ-algebra Ω-n, ha

  • egyszerű halmaztestet képez (tehát algebra)
    Ω eleme A-nak
    - nem üres- zárt az elemei véges családjainak uniójára, metszetére, különbségére
  • elemei megszámlálhatóan végtelen sok tagú egyesítésre zárt

Most nyugodtan tekintsünk vissza az eredetileg bemásolt ijesztő képre. És lássuk be, hogy lehetne ennél rosszabb is a helyzet...

Ám ne aggódjatok a rosszabb rész majd holnap következik! Amikor ugyanis bevezetjük a valószínűségszámítás alapfogalmait MÉRTÉKelméleti alapon.