Rendszámtan

A minap  kaptam egy figyelemreméltó feladatot. Egészen pontosan nem is én kaptam, hanem egyik kollégám spec. matekos osztályba járó gimnazista leánya, és hozzám csak mint az érdekes feladatok lelkes fogyasztójához jutott el a dolog. Maga a feladvány egyszerű (legalábbis, gimnazista eszközökkel megoldható), és a következőképpen hangzik:

"Egy nagy, forgalmas úton haladó járműveket figyelve teljesen találomra felírom néhány - mondjuk húsz - autó rendszámát. Adjunk becslést eme húsz rendszám alapján, hogy hol tart országos szinten a rendszámok kiosztása!". Read More »

Post a Comment

Az elvarázsolt véletlen erdő

Egyszer volt, hol nem volt, volt egyszer egy véletlen erdő… Kezdhetnénk mesénket, amennyiben az valóban csak egy mese lenne. A véletlen erdők története azonban ettől jóval több. De kezdjünk mindent szépen a legelején!

Bizonyára sokan használták már osztályozási és/vagy előrejelzési feladat elvégzéséhez a közel fél évszádos múlttal büszkélkedő döntési fa technikát, amely definíció szerint logikai értéket eredményező következtetési szabályok hierarchikus sorozatának ábrázolási módja. Az érdekesebbnél érdekesebb algoritmusokat alapvetően a Gini-indexet használó CART, a χ2-tesztre építő CHAID és az entrópiát alkalmazó ID3 családokba sorolhatjuk.

Függetlenül azonban a vágóismérvek és vágási pontok meghatározására használt módszertantól, a különböző fatípusok közös tulajdonsága, hogy a tanító állomány tartalmában bekövetkezett bárminemű módosítás még változatlan növesztési és vágási opciók mellett is eltérő eredményre vezethet. És éppen ez az a sajátosság, amire egy viszonylag fiatal technika, a véletlen erdők módszere (random forest) alapozza nagyszerűségét.

Read More »

Post a Comment

Képpé formált adatok

Az elemzéssel feltárt információk megjelenítése a technológia, az üzlet és a vizuális kultúra izgalmas határterülete, ahol az innováció elképesztő ütemben zajlik. Szeretnék bemutatni néhány gondolatébresztő forrást.

Malac a metróban

Bemelegítésként íme a térinformatika klasszikusa: a londoni metróhálózat térképének evolúciója. Az eredeti térképet, ami forradalmian áttekinthető módon ábrázolt a város sűrű metróhálózatát, a villamosmérnök Harry Beck tervezte 1933-ban. A Beck elképzelése nyomán elkészült a metrótérkép azóta is inspirációt ad a vizuális tervezőknek.

Itt megtekinthető Beck eredeti térképe, a ma használt áttekintő térkép és ehhez képest a valódi fizikai térkép.

Egy másik oldalon animált formában követhető, hogyan változott a Temze nyomvonala a metrótérképeken - miközben a folyó a valóságban természetesen a helyén maradt. Read More »

Post a Comment

Mikroszimuláció: innováció a gazdaságpolitikai döntés-előkészítésben

A SAS-ban pár éve elindítottunk egy Üzleti analitika reggeli sorozatot, melynek keretében az üzleti analitika egy-egy területét járjuk körbe. A sorozat az idei évben is folytatódik, és ennek első állomásaként kimondottan a közszféra szereplői részére szerveztünk egy rendezvényt, ami a gazdaságpolitikai döntéselőkészítésben sokszor alkalmazott mikroszimulációs módszertan bemutatására koncentrált. Magyarországon több intézmény foglalkozik mikroszimulációs modellezéssel, ezért is tartottuk fontosnak, hogy legalább egy rendezvény erejéig vendégül lássuk a téma szakértőit.

Míg az üzleti életben rengeteg példát találunk analitikai felhasználásra, addig a közszférában ez a fajta gondolkodásmód talán még gyerekcipőben jár. Analytics for Government címmel jelent meg nemrég egy SAS-os tanulmány, amely a Nagy-Britanniában már bevett alkalmazásokat szedte össze. Read More »

Post a Comment

Mínusz huszonöt?

Riadó, riadó! Fél méteres friss hó a hétvégén!...Nem, mégsem! Maximum 20 centiméternyi csapadék várható, az elmaradt hómennyiség helyett azonban némi viharos szélre számíthatunk – hallhattuk mindezt rövid idő leforgása alatt a hét első felében.

Mint ahogy arról korábbi bejegyzésünkben írtunk, az előrejelzésekhez felhasznált légkörmodell-jóslatok egy szubjektív elem miatt még stabil légkörállapot mellett is hibával lehetnek terheltek. Sőt, az instabilitás – amikor a légkör dinamikája leginkább egy hegyére állított ceruzához hasonlítható – egyszerűen lerombolja az egyoldalú prognózisok pontosságát.

Mégis mit tehetünk az előrejelzések használhatóságának fenntartása érdekében? A választ az együttes előrejelzések módszere (ensemble technika) adja meg. A módszertan nevének csengése azonnal olyan érzést kelthet bennünk, mintha virágszálak csokorba szedésének gondolatával, az egyes elemek varázsának ötvözésével kacérkodnánk. És valóban, érzéseink nem csalnak. A képletes csokorkötés pedig két formában ölthet testet, melyet az ensemble technika két ága, a multi-modell és a multi-analízis aspektusok hivatottak képviselni.

Read More »

Post a Comment

Maja matek

Mint azt valószínűleg már mindenki hallotta, 2012. december 21-ével megint vége lesz a világnak. Szerencsére azonban a szokásos apokalipszis (lásd például: „a kétezres év katasztrófája”) helyett ezúttal sokkal emelkedettebb változásra, egyfajta spirituális felemelkedésre számíthatunk – legalábbis így értékelik a helyzetet a világvége-diskurzust meghatározó new age filozófiák.

No de mi is áll a jóslat hátterében? A maja naptárról van szó, amelynek 2012-re vonatkozó predikciója világhírre tett szert.

A közép-amerikai maja nép (melynek leszármazottai a mai napig élnek, a maják ugyanis azon nagyon kevés őshonos népcsoport közé tartoznak, akik többé-kevésbé átvészelték az európai hódítást) fejlett matematikát művelt. Húszas számrendszert használtak; a „nulla” fogalmának egyik legkorábbi alkalmazása is majákhoz kötődik a matematika-történetben. Naptáruk is a húszas számrendszeren, illetve – természetesen —csillagászati megfigyeléseken alapult.

2012. december 21-e csillagászatilag kitüntetett dátum: az éves téli napforduló napja, amikor az északi féltekén a legalacsonyabbra emelkedik a Nap. Ez időben a Nap a Földről tekintve együttállásba kerül a Tejúttal is. A Tejút 10-20 fok szélességben látszik az égbolton, a Nap pozíciója valójában évről-évre folyamatosan elmozdul hozzá képest; 700-1400 év telik el, amíg a Nap a Tejút egyik széléről a másikra vándorol. Mostanság a közepénél jár, vagyis ezekben az években lépi  át „galaktikus egyenlítőt” – ez utóbbi emléleti fogalom, a Nap és a galaxisunk feltétezett középpontja közötti egyenes.

Ugyanezen a napon, 2012. december 21-én ér véget a maják „hosszú számítás” nevű naptárának legnagyobb ciklusa: 12.19.19.17.19 után 13.0.0.0.0-t fogunk írni. (A naptár második helyiértéke 18-as számrendszerben ketyeg, a többi húszasban.) Avagy 0.0.0.0.0-t, amennyiben figyelembe vesszük azt a maja hagyományt, mely szerint 13 „baktun” leteltével teljesen új világciklus kezdődik. Hogy miért pont i.e.  3114 augusztus 11-én kezdődött a maja naptár, az ma már kevéssé megfejthető, de valószínű, hogy a virágkorát i.sz. 350-900 között élő maja kultúra éppen a 2012. december 21-i galaktikus együtállásra előre tekintve határozta meg időszámításának kezdetét.

Mindezzel  persze csak a felszínét kapargatjuk annak a témának, ami a könyvek százait, weblapok ezreit inspirálja világszerte. És mit csinálnak eközben a maják? Tapachula város főterén már felállították azt a két és fél méter magas digitális órát, ami 13 baktunig számolja vissza az időt. Mi is várnak tőle? A turizmus fellendülését.

Boldog új évet kívánunk minden kedves olvasónknak!

Post a Comment

A szablyák metrikája

December 8-án volt a magyarországi bemutatója Bennett Miller legújabb filmjének, a Pénzcsináló-nak (Moneyball). A főszerepet Brad Pitt játssza, de a szereplők között feltűnik majd Philip Seymour Hoffmann és Jonah Hill is. A film Michael Lewis 2003-ban kiadott, azonos című könyvén alapul, ami talán minden idők legnagyobb hatású sportkönyve.

Miért beszélünk erről ezen a blogon?

Leginkább azért, mert kevés érdekesebb interpretációját tudom elképzelni az analitika gyakorlatban történő alkalmazásának. Azt eddig is tudtuk, hogy a hagyományos iparágak (pénzintézetek, telekommunikáció, kiskereskedelem) már évtizedek óta használnak  analitikus módszereket (statisztikát, adatbányászatot, előrejelzéseket). Egy viszonylag új trend azonban ezen módszerek kiterjesztése kevésbé konvencionális területekre. Ilyen többek között maga a sport (ipar) is, amely lényegében a Moneyball megjelenése után figyelt fel az analitikára (egy ideje rendszeres konferenciát is tartanak sport analitika témában).

Read More »

Post a Comment

Kis pénz, nagy baseball?

Ma debütál a magyar mozikban Bennett Miller új filmje, a Pénzcsináló (Moneyball), főszerepben: Brad Pitt.

Az IMDB-n 8 pontot szerzett a film (http://www.imdb.com/title/tt1210166/), ami igen élvezetes mozit sejtet.

De hogyan kerül a csizma az asztalra? Íme, a film ajánlója:

"Van, aki képtelen lemondani a győzelemről. Billy Beane (Brad Pitt) fiatal korában azt hitte, a baseball szupersztárja lesz, ám a pályán nem tudott felnőni az elvárásokhoz. Nem fordult el a sporttól, most az oaklandi csapatot vezeti - ám kevés pénzből gazdálkodik, és a tehetséges játékosait mind elszipkázzák a többet ajánló, nagyobb egyesületek. Még szerencse, hogy nem a pályán dől el minden. Billy összeismerkedik egy fiatal matematikussal (Jonah Hill), akinek van egy vad elmélete: hatalmas adatbázisa és néhány statisztikai program segítségével meg tudja jósolni, kik azok a játékosok, akik nem kellenek senkinek, olcsók, mégis sikert hozhatnak. A furcsa páros belevág a kockázatos kalandba. Olyanokat szerződtetnek, akikről mindenki lemondott, akik már maguk sem hisznek a győzelemben. A közönség nevet, a csapat vezetői lázadnak, a játékosok nem hiszik el, hogy mi történik velük.  Valami azonban megváltozik a pályán, és az már baseball történelem."
Read More »

Post a Comment

Időjárás, előrejelzés

Az időjárás jövőbeni ismeretében rejlő lehetőség felismerése többször forradalmi módszerek kidolgozására sarkallta az emberiséget. Alábbi írásunkkal Vissy Károly, a magyar média-meteorológia megteremtőjének, a szakmáját közérthető és hasznosítható kinccsé alakító meteorológus ikonikus személyének emléke előtt kívánunk tisztelegni.

Már rég elfeledett korok hősei is olyan megfigyeléseket tudhattak magukénak, melyek alapján az időjárás bizonyos ultrarövid távú körülményeit könnyedén előreláthatták. Ezek a tapasztalati úton kialakult logikai szabályok többnyire egyetlen kiváltó ok alapján próbáltak képet alkotni a várható viszonyokról, de a jövő tényleges megismerésére alkalmatlanok voltak.

Read More »

Post a Comment

Mi kerül az asztalra?

A 2004-es paprikabotrányt, majd a 2007-es guargumi-ügyet követően a média 2011-ben újabb élelmiszer-fertőzésekkel sokkolt minket. A németországi dioxinos sertések hallatán bizonyára még ma is sokak étvágya elmegy egy gőzölgő flekken láttán, de jó tudnunk: félelemre semmi ok. Lassan egy évtizeddel ezelőtt ugyanis a tagállamok azonnali értesítését szolgáló, úgynevezett RASFF (Rapid Alert System for Food and Feed) gyorsvészjelző rendszer került kiépítésre, mely jelentősen megkönnyíti az ilyen jellegű információk Közösségen belüli torzítatlan áramlását. De a figyelemfelhívás, – majd esetleg – az adminisztratív intézkedések és kereskedelmi korlátozások önmagukban csupán tüneti kezelést jelenthetnek. Okokat, illetve lehetséges következményeket egyaránt szükséges vizsgálni.

Read More »

Post a Comment
  • A blog

    Üzleti analitika és üzleti intelligencia: olyan kulcsfogalmak, amelyek meghatározóak sokunk szakmai életében. Felhasználók, matematikai-statisztikai elemzők, informatikai támogatók vagyunk. Ezt a blogot a SAS Magyarország munkatársai szerkesztik, azért, hogy fórumot teremtsenek az analitikus szakmai közösségnek.
  • Iratkozzon fel!

    Adja meg email-címét:

    Other subscription options

  • Archívum

  • SAS Magyarország