Tumblelog by Soup.io
Newer posts are loading.
You are at the newest post.
Click here to check if anything new just came in.

August 01 2012

Magyar közösségi slágerlista az Artisjus-nak

Ahogy erről az Index is beszámolt, a Youtube és a Facebook adatai alapján zenei slágerlistát készítettünk a 3G Multimédiával az Artisjus zenei jogvédő egyesület számára. A rangsort a Zene Ünnepe alkalmából a Dal+Szerző magazinban publikálták, ahol negyedévente frissülnek majd a toplista eredményei.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

July 27 2012

Infografika Meetoff

Július 19-én a Dohány utcai Bazaar-ban zajlott az első magyar Infografika Meetoff. Rövid előadásunkban Balázssal a Tableau-val szerzett dashboard prototipizálási tapasztalatunkról beszéltünk az Information is Beautiful verseny kapcsán.

Kicsit polemizáltunk arról, hogy mennyire bulvár a hasonnevű könyv, amelyből a szervezők egy példányt ki is sorsoltak - annak mindenesetre örülünk, hogy magyar nyelven is hozzáférhető.

A versenyben igen hasznos volt a Tableau gyors prototipizálási képessége, a papírra skiccelt dashboard mind az 5 prototípus irányával ki tudtuk próbálni, hogy mennyire releváns válaszokat tudunk alapvető kérdéseinkre adni. Igyekeztünk actionable nézeteket kidolgozni és így sikerült végül valami egészen másra használni a Tableau-t, mint amire készült, egy egészen webes alkalmazásra hajazó vizualizáció lett a végeredmény. Nem tudtuk eldönteni, hogy a rendelkezésre bocsátott adatforrás figyelmetlenségből vagy szándékosan volt hibás és koszos, mindenesetre más forrásokból (Boxofficemojo és Wikipedia) újabb oszlopokkal dúsítottuk. (Kéménybe korommal: emlékeztessük magunkat mindig, hogy akármilyen kis projekten is dolgozunk, igen hasznos lehet valamilyen elsődleges kulcs, amelynek segítségével akár már az adatforrások lezárta után is tudunk még oszlopokat injektálni, joinolni a tábláinkba.) Az alkalmazássá alakítás igazi hekkeléssé fajult, logika került a táblába, és kapcsolóoszlopok miatt az eredetileg körülbelül 700*17-es tábla 33869*41-es lett. Úgy sejtettük, hogy a verseny nyertesei inkább szépek lesznek, mint okosak - ez a sejtésünk be is igazolódott -, mi azonban erőforrás hiányában csak a végén húztunk be egy dizájnert a projektbe, ebben még biztosan javulnunk kell.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

April 17 2012

Review: Drew Conway & John Myles White: Machine Learning for Hackers (O’Reilly Media)

As I consider myself a hacker rather than a coder I was delighted to find a title aimed for directly at me as "for Hackers". The topic of machine learning is both generally hot and personally interesting to me as I try to mangle recommendation approaches in the music domain and just finished with all worthwhile heuristics-based methods. I thought that this book could provide me with a good entry and could be a newer, more up-to-date approach than the classic Programming Collective Intelligence by Toby Segaran. Nonetheless I was a bit surprised to realize that the hackers' language should be R instead of Python - so this meant that the book would also serve me as an intro to R. As learning R is also on my long to-do list, I was hoping that I could kill two birds with one stone.

The book has a solid structure, the first quarter is covering basic statistics showcasing the capabilities of R. Typical starter exercises of ML are well versed: Bayesian spam filtering, weighting schemes for ranking, regression, overfitting and optimization is explained and demonstrated with a down-to-earth and hands-on approach. The authors also touch some of the more complex topics: principal components analysis, multidimensional scaling and the k-nearest neighbours algorithm are introduced with real world data. I was really delighted to see a longer chapter dedicated to social graph analysis and I totally give kudos for the inclusion of Gephi, the powerful open source graph visualization and manipulation software that I also enjoy using more and more.

The authors come from a social science background and although this book seems to be avoiding 'programming' or providing code that could be incorporated in a runtime environment, I believe the goal they set, to provide machine learning tools for tinkering, has been reached with great success. It's short, concise and not scary at all. Check for yourself at O'Reilly.

Score: 5 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

March 29 2012

The Blockbuster Meter

Krich Balázzsal közös verejtékkel, dataeast.co fedőnéven neveztünk az Information Is Beautiful moziversenyére ezzel a Tableau dashboard-dal. Ez egy mezei 41 oszlopos, 33869 soros adattábla realtime interface-szel. Próbáld ki!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A nevezés végül shorlistre került, a Tableau örömére is, és az Indexre elkészítettük a magyar nyelvű változatot.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Older posts are this way If this message doesn't go away, click anywhere on the page to continue loading posts.
Could not load more posts
Maybe Soup is currently being updated? I'll try again automatically in a few seconds...
Just a second, loading more posts...
You've reached the end.

Don't be the product, buy the product!

Schweinderl