Tumblelog by Soup.io
Newer posts are loading.
You are at the newest post.
Click here to check if anything new just came in.

May 08 2013

Review: Python for Data Analysis (O’Reilly Media)

Mea culpa, but I was waiting for THE Pandas book given its author. I believed that pandas deserve a good intro book with decently built examples and learning curve, but I was wrong. This book is a very uneven kind of batched together webreference chapters. Most of the material is not meant for beginners sometimes even can get kind of scary. No pun intended, it smells like good intent, bad execution for me. As a starter Chapter 2 contained non-working code snippets while Chapter 3 exposed such inner workings that could confuse readers. Why is this here, I mean all editors went on strike? Truth to be told the 2nd edition fixed some of the most annoying bugs. Strictly appendix stuff is edited in as the main course. Handle with care — I will stick to pandas tutorials presented in IPython notebooks.

Check for yourself at O'Reilly.

Score: 3 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

April 03 2013

ELŐADÁS: Extract Transform Load in Python

Faludi Bence előadása a Springfresh Django Meetup-on a CEU Microdata projekt Python-os ETL eszközétől, a mETL-ről (ejtsd: metil).

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

February 08 2013

ELŐADÁS: Big Data - Over The Hype

Január 23-án előadtam a Superweek konferencián, kösz Bánónak a hangért, nyilván a helyszínen merült le a hangfelvevőm.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

January 18 2013

PyData 2012

A PyData szuperniche konferencia a javából a Python és az adatbindzsi metszetében. Tűéles előadások és tutorialok, alább a három kedvenc, de érdemes kotorászni a Vimeo csatornán.

Egy tanulság egy harminc perces videó helyett: NLP - don't do it. Do IR.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

December 12 2012

Geo pályamű a Hubway Data Challenge-re

boston_tumblr_1359141173.jpg_600x288

Krich Balázzsal neveztünk a Hubway Data Challenge-re, de a döntőbe nem jutottunk be pályaművünkkel.

Tanulságok:

  • a Tilemill-lel elképesztő részleteiben kidolgozható egy térkép, csak idő kérdése - persze az segít, ha tudjuk, mit szeretnénk csinálni,
  • a feliratok a térképek elválaszthatatlan részei,
  • a domborzati térkép nem vagy varia, Amerikában a USGS NED tudja a legnagyobb felbontást, a világ többi részén a szintén ingyenes japán ASTER-t érdemes használni,
  • ha az adataid geokódolva vannak és időpecsét is van rajtuk, akkor CartoDB Torque-kal se perc alatt animálhatod ket. (Tipp: azért egy kis Google Directions API varázslat kellett hozzá.)

Összességében jó kis gyorstalpaló volt ez az új generációs digitális térképészetben. Nehéz az MIT nyomába eredni, érdemes megnézni a többi nevezést is.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

November 29 2012

"Postal address cleaning in the Networks Project" előadás a Data Science Meetup Novemberen

Nyéki Gábor tartotta a Data Science Meetup November-en a CEU Networks projekt első geek prezijét az adattisztításra épített irányított aciklikus gráf feldolgozónkról, a TARR-ról (Test and Rule Registry).

Interjúk a projekt vezetőivel, Szeidl Ádámmal és Koren Miklóssal.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

November 16 2012

Dashboard pályázat

Kicsit rövid a jelentkezési határidő - ma -, és a tízezer forintos adminisztrációs díj kicsit sok, de érdemes ráfeküdni. Részletek itt, válogatás a pályázat anyagaiból ott. (A rendezvényen rövid haknit követtem el, ami a hullámzó net miatt inkább bábozás volt - a végső és valódi Tableau-s Foursquare dashboarddal még mindig adós vagyok.)

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

August 27 2012

Former social darling Diaspora* intends to transform into a ‘community-run’ project
2012 08 27 11h00 31 520x245 photo

Diaspora*, the crowdfunded social network, hailed as a potential ‘Facebook killer’ when born, is making the transition to a ‘community-led’ project, it announced today.

The team recently released an image remixing and sharing tool, Makr.io, which was born out of an itch that they found while using Diaspora*, but felt wasn’t a perfect enough fit to bake into the social product itself. Makr.io is not being released to the Diaspora* community; the team intends to keep leading its development.

TNW spoke with Diaspora*’s co-founder Maxwell Salzberg about the move to cede control of the social tool to its community. He explained that it is not a complete stepping down of the founding team – they intend to help guide the project, but as normal members of its community, and not as overlords of any sort. It’s time to let its constituent users and active developers take the reins, in his view.

The following is the released quote from the team, concerning the transition:

“We are proud of what Diaspora has become. As a Free Software social project, we have an obligation to take this project further, for the good of the community that revolves around it. Putting the decisions for the project’s future in the hands of the community is one of the highest benefits of any FOSS project, and we’d like to bring this benefit to our users and developers.”

Diapora* recently opened sign ups for the JoinDiaspora* pod, so if you never managed to give the social tool a chance, you can now.

Sean Tilley, Diaspora*’s community manager will oversee the transition, which will take time. Diaspora* describes the change-over as ‘gradual.’

The simple remark to make here is that Diaspora* failed in its bid to build a social network to rival Facebook and provide a viable alternative to the giant. That’s true to an extent, but Salzberg made it plain that Diaspora* has its own active userbase. TNW wrote in 2010 that Diaspora* is too complex for the everyman to use, but that doesn’t mean that a technical crowd couldn’t fall in love with it. For the technically-mind and privacy-conscious, Diaspora* could be just the ticket for years to come.

So, the Diaspora* project, what was to be a summer’s work, eventually grew into something that is loved by some. And those fans and users will soon have control of its destiny. Failure? Only if you want to take the most cynical view.

Top Image Credit: Robert Judge

August 11 2012

Review: Strata Conference Santa Clara 2012: Complete Video Compilation (O’Reilly Media)

I'm not a big fan of conferences although I've attended some, even presented at some in the international e-learning circuit. Strata, however always make me consider applying for a US visa - hint: Strata is just hitting London this October. Videos from Strata 2011 was already featured in this blog as they condensed such wit and knowledge with good presentation that I believe it's a must to consume them for any serious data nerd. This video product is not perfect - see my struggle with talking head videos before -, yes, in general it would make more sense to show the overhead projection in a big and the talking head in a small crop, but the Strata 2012 video compilation is actually more than you can handle and I'm not just talking about the 106 hours equaling gigabytes of MP4 movies. Yes, if you lurk around Youtube, you can find some of the best presentations out there, for free, but this product also contains the materials of the workshops that you definitely shouldn't miss. Please find below three of my favourite presentations from Avinash Kaushnik, Ben Goldacre and Jeremy Howard.

Check for yourself at O'Reilly.

Score: 5 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

August 01 2012

Magyar közösségi slágerlista az Artisjus-nak

Ahogy erről az Index is beszámolt, a Youtube és a Facebook adatai alapján zenei slágerlistát készítettünk a 3G Multimédiával az Artisjus zenei jogvédő egyesület számára. A rangsort a Zene Ünnepe alkalmából a Dal+Szerző magazinban publikálták, ahol negyedévente frissülnek majd a toplista eredményei.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

July 27 2012

Infografika Meetoff

Július 19-én a Dohány utcai Bazaar-ban zajlott az első magyar Infografika Meetoff. Rövid előadásunkban Balázssal a Tableau-val szerzett dashboard prototipizálási tapasztalatunkról beszéltünk az Information is Beautiful verseny kapcsán.

Kicsit polemizáltunk arról, hogy mennyire bulvár a hasonnevű könyv, amelyből a szervezők egy példányt ki is sorsoltak - annak mindenesetre örülünk, hogy magyar nyelven is hozzáférhető.

A versenyben igen hasznos volt a Tableau gyors prototipizálási képessége, a papírra skiccelt dashboard mind az 5 prototípus irányával ki tudtuk próbálni, hogy mennyire releváns válaszokat tudunk alapvető kérdéseinkre adni. Igyekeztünk actionable nézeteket kidolgozni és így sikerült végül valami egészen másra használni a Tableau-t, mint amire készült, egy egészen webes alkalmazásra hajazó vizualizáció lett a végeredmény. Nem tudtuk eldönteni, hogy a rendelkezésre bocsátott adatforrás figyelmetlenségből vagy szándékosan volt hibás és koszos, mindenesetre más forrásokból (Boxofficemojo és Wikipedia) újabb oszlopokkal dúsítottuk. (Kéménybe korommal: emlékeztessük magunkat mindig, hogy akármilyen kis projekten is dolgozunk, igen hasznos lehet valamilyen elsődleges kulcs, amelynek segítségével akár már az adatforrások lezárta után is tudunk még oszlopokat injektálni, joinolni a tábláinkba.) Az alkalmazássá alakítás igazi hekkeléssé fajult, logika került a táblába, és kapcsolóoszlopok miatt az eredetileg körülbelül 700*17-es tábla 33869*41-es lett. Úgy sejtettük, hogy a verseny nyertesei inkább szépek lesznek, mint okosak - ez a sejtésünk be is igazolódott -, mi azonban erőforrás hiányában csak a végén húztunk be egy dizájnert a projektbe, ebben még biztosan javulnunk kell.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

June 24 2012

Review: C.J. Date's Database Design and Relational Theory: Normal Forms and All That Jazz Master Class (O’Reilly Media)

It should be my mistake. Once I was interested in a serious look on database design, second I was really curious what could O'Reilly Media do with the "talking head" courseware genre. Boy, was I disappointed. As I started watching I immediately found myself in the Eighties watching BBC in some Wales humdrum town. Expect nodding heads around the table, I can't reflect responsibly on the content as I fell asleep immediately. I believe this is not a proper choice of media for this topic.

Check for yourself at O'Reilly.

Score: 1 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Diagramtípus

407776_10150605459166079_188816435_n_1340549475.jpg_427x463

Kicsit skizoid a viszonyom a treemap-ekkel, mindig izgattak, hasznosnak tartom őket, de a legtöbbször nehezen értelmezhetőek. Még januárban csináltam Excelben a fenti ábrát, ha még egy dimenziót sikerülne érthetően belegyömöszölni, elégedett lennék.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

April 17 2012

Review: Drew Conway & John Myles White: Machine Learning for Hackers (O’Reilly Media)

As I consider myself a hacker rather than a coder I was delighted to find a title aimed for directly at me as "for Hackers". The topic of machine learning is both generally hot and personally interesting to me as I try to mangle recommendation approaches in the music domain and just finished with all worthwhile heuristics-based methods. I thought that this book could provide me with a good entry and could be a newer, more up-to-date approach than the classic Programming Collective Intelligence by Toby Segaran. Nonetheless I was a bit surprised to realize that the hackers' language should be R instead of Python - so this meant that the book would also serve me as an intro to R. As learning R is also on my long to-do list, I was hoping that I could kill two birds with one stone.

The book has a solid structure, the first quarter is covering basic statistics showcasing the capabilities of R. Typical starter exercises of ML are well versed: Bayesian spam filtering, weighting schemes for ranking, regression, overfitting and optimization is explained and demonstrated with a down-to-earth and hands-on approach. The authors also touch some of the more complex topics: principal components analysis, multidimensional scaling and the k-nearest neighbours algorithm are introduced with real world data. I was really delighted to see a longer chapter dedicated to social graph analysis and I totally give kudos for the inclusion of Gephi, the powerful open source graph visualization and manipulation software that I also enjoy using more and more.

The authors come from a social science background and although this book seems to be avoiding 'programming' or providing code that could be incorporated in a runtime environment, I believe the goal they set, to provide machine learning tools for tinkering, has been reached with great success. It's short, concise and not scary at all. Check for yourself at O'Reilly.

Score: 5 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

March 29 2012

The Blockbuster Meter

Krich Balázzsal közös verejtékkel, dataeast.co fedőnéven neveztünk az Information Is Beautiful moziversenyére ezzel a Tableau dashboard-dal. Ez egy mezei 41 oszlopos, 33869 soros adattábla realtime interface-szel. Próbáld ki!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A nevezés végül shorlistre került, a Tableau örömére is, és az Indexre elkészítettük a magyar nyelvű változatot.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

February 20 2012

Review: William E. Shotts Jr.: The Linux Command Line – A Complete Introduction (O’Reilly Media)

I approached this book as an aging hacker who started out network computing on DEC VAX and VMS, but spent more than a dozen years in Windows-close business environments, and now gets back to its roots with a programming habit turning serious. My UNIX experience got rusty during the years, and I was surprised to find a complete generation of programmers operating without a slight knowledge of the command line. I wanted to get a practical grasp again to make my day-to-day data crunching toolset wider with all the command line can provide me with – not least compell the youngsters who cannot help themselves starting out with a new JAVA class to solve any problem.

The book is well-written, perhaps a bit too verbose, but it’s easily accessible even for beginners. However, I’m not totally sure how it should be consumed as I found it a bit middle-of-the-road, too detailed for a reference book, but not covering all the razorsharp workhorse approach of UNIX commands. In my case, text cruncing related basics, such as grep or regex is just slightly touched, you can’t even find the word ’greedy’ in the whole book. The back cover states that the target audience of the book is someone who already uses Linux with a GUI, but now wants to look under the hood.

I’m not totally sure that this journey will amaze and show the real strength in the engines, but for me, it’s a keeper, I’ll definitely skim it to refresh my memories building my new Linux coding workstation. Check for yourself at O'Reilly.

Score: 4 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

January 22 2012

Lokáció alapú közösségi tevékenységek turisztikai hatása Magyarországon - prezentáció

A héten bemutattam és egyben meg is védtem szakdolgozatom a főiskola szakdolgozatversenyén. Igyekszem mihamarabb megosztani a teljes anyagot, az adatokat és a kódot is.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

December 20 2011

Lokáció alapú közösségi tevékenységek turisztikai hatása Magyarországon

Nem is értem, miért használ még bárki Scribd-et, hisz jóféle spammer oldal lett. A teljes szakdolgozatomnak is jó gazdája az Issuu.

 

 

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

November 15 2011

October 12 2011

Strata konferencia csemegék

Tavasszal ismét Strata, a 2011-es konferencia számomra legtanulságosabb videói az alábbiak voltak.

Naomi Robbins "Communicating Data Clearly" tutorialja (pdf) azonnal klasszikussá vált.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

Older posts are this way If this message doesn't go away, click anywhere on the page to continue loading posts.
Could not load more posts
Maybe Soup is currently being updated? I'll try again automatically in a few seconds...
Just a second, loading more posts...
You've reached the end.