Tumblelog by Soup.io
Newer posts are loading.
You are at the newest post.
Click here to check if anything new just came in.

December 28 2013

Review: Agile Data Science (O’Reilly Media)

You could say I'm a sucker for bashing, but hell no, was I just curious.

Agile is something of an overused buzzword now and it seems to be the case now. Agile here equals with just installing a dozen frameworks after each other and skim another programming or markup language in a row spiced with some algos and stats. You gonna be exposed to SQL, NoSQL, Python, Avro, Pig, Flask, Bootstrap, Jinja, D3.js, nvd3.js, MongoDB, ElasticSearch, GitHub, dotCloud, S3, Elastic Mapreduce, Google Analytics, Mortar Data, ElasticSearch, Wonderdog, TF-IDF and Naive Bayes, all in 178 pages.

Thinking positively this is the quickest possible intro for a workflow with all typical phases, although weapons of choice seem arbitrary, never a why, never a pro or a con nor any alternatives. If you're lazy to understand the landscape and want a pre-cooked menu that you can cook, but can't change the recipes, go for it.

Check for yourself at O'Reilly.

Score: 2 of 5.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Review: Agile Data Science (O’Reilly Media)

You could say I'm a sucker for bashing, but hell no, was I just curious.

Agile is something of an overused buzzword now and it seems to be the case now. Agile here equals with just installing a dozen frameworks after each other and skim another programming or markup language in a row spiced with some algos and stats. You gonna be exposed to SQL, NoSQL, Python, Avro, Pig, Flask, Bootstrap, Jinja, D3.js, nvd3.js, MongoDB, ElasticSearch, GitHub, dotCloud, S3, Elastic Mapreduce, Google Analytics, Mortar Data, ElasticSearch, Wonderdog, TF-IDF and Naive Bayes, all in 178 pages.

Thinking positively this is the quickest possible intro for a workflow with all typical phases, although weapons of choice seem arbitrary, never a why, never a pro or a con nor any alternatives. If you're lazy to understand the landscape and want a pre-cooked menu that you can cook, but can't change the recipes, go for it.

Check for yourself at O'Reilly.

Score: 2 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

May 08 2013

Review: Python for Data Analysis (O’Reilly Media)

Mea culpa, but I was waiting for THE Pandas book given its author. I believed that pandas deserve a good intro book with decently built examples and learning curve, but I was wrong. This book is a very uneven kind of batched together webreference chapters. Most of the material is not meant for beginners sometimes even can get kind of scary. No pun intended, it smells like good intent, bad execution for me. As a starter Chapter 2 contained non-working code snippets while Chapter 3 exposed such inner workings that could confuse readers. Why is this here, I mean all editors went on strike? Truth to be told the 2nd edition fixed some of the most annoying bugs. Strictly appendix stuff is edited in as the main course. Handle with care — I will stick to pandas tutorials presented in IPython notebooks.

Check for yourself at O'Reilly.

Score: 3 of 5.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Review: Python for Data Analysis (O’Reilly Media)

Mea culpa, but I was waiting for THE Pandas book given its author. I believed that pandas deserve a good intro book with decently built examples and learning curve, but I was wrong. This book is a very uneven kind of batched together webreference chapters. Most of the material is not meant for beginners sometimes even can get kind of scary. No pun intended, it smells like good intent, bad execution for me. As a starter Chapter 2 contained non-working code snippets while Chapter 3 exposed such inner workings that could confuse readers. Why is this here, I mean all editors went on strike? Truth to be told the 2nd edition fixed some of the most annoying bugs. Strictly appendix stuff is edited in as the main course. Handle with care — I will stick to pandas tutorials presented in IPython notebooks.

Check for yourself at O'Reilly.

Score: 3 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

April 03 2013

ELŐADÁS: Extract Transform Load in Python

Faludi Bence előadása a Springfresh Django Meetup-on a CEU Microdata projekt Python-os ETL eszközétől, a mETL-ről (ejtsd: metil).

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

ELŐADÁS: Extract Transform Load in Python

Faludi Bence előadása a Springfresh Django Meetup-on a CEU Microdata projekt Python-os ETL eszközétől, a mETL-ről (ejtsd: metil).

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

February 08 2013

ELŐADÁS: Big Data - Over The Hype

Január 23-án előadtam a Superweek konferencián, kösz Bánónak a hangért, nyilván a helyszínen merült le a hangfelvevőm.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

ELŐADÁS: Big Data - Over The Hype

Január 23-án előadtam a Superweek konferencián, kösz Bánónak a hangért, nyilván a helyszínen merült le a hangfelvevőm.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

January 18 2013

PyData 2012

A PyData szuperniche konferencia a javából a Python és az adatbindzsi metszetében. Tűéles előadások és tutorialok, alább a három kedvenc, de érdemes kotorászni a Vimeo csatornán.

Egy tanulság egy harminc perces videó helyett: NLP - don't do it. Do IR.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

PyData 2012

A PyData szuperniche konferencia a javából a Python és az adatbindzsi metszetében. Tűéles előadások és tutorialok, alább a három kedvenc, de érdemes kotorászni a Vimeo csatornán.

Egy tanulság egy harminc perces videó helyett: NLP - don't do it. Do IR.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

December 12 2012

Geo pályamű a Hubway Data Challenge-re

boston_tumblr_1359141173.jpg_600x288

Krich Balázzsal neveztünk a Hubway Data Challenge-re, de a döntőbe nem jutottunk be pályaművünkkel.

Tanulságok:

  • a Tilemill-lel elképesztő részleteiben kidolgozható egy térkép, csak idő kérdése - persze az segít, ha tudjuk, mit szeretnénk csinálni,
  • a feliratok a térképek elválaszthatatlan részei,
  • a domborzati térkép nem vagy varia, Amerikában a USGS NED tudja a legnagyobb felbontást, a világ többi részén a szintén ingyenes japán ASTER-t érdemes használni,
  • ha az adataid geokódolva vannak és időpecsét is van rajtuk, akkor CartoDB Torque-kal se perc alatt animálhatod őket. (Tipp: azért egy kis Google Directions API varázslat kellett hozzá.)

Összességében jó kis gyorstalpaló volt ez az új generációs digitális térképészetben. Nehéz az MIT nyomába eredni, érdemes megnézni a többi nevezést is.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Geo pályamű a Hubway Data Challenge-re

boston_tumblr_1359141173.jpg_600x288

Krich Balázzsal neveztünk a Hubway Data Challenge-re, de a döntőbe nem jutottunk be pályaművünkkel.

Tanulságok:

  • a Tilemill-lel elképesztő részleteiben kidolgozható egy térkép, csak idő kérdése - persze az segít, ha tudjuk, mit szeretnénk csinálni,
  • a feliratok a térképek elválaszthatatlan részei,
  • a domborzati térkép nem vagy varia, Amerikában a USGS NED tudja a legnagyobb felbontást, a világ többi részén a szintén ingyenes japán ASTER-t érdemes használni,
  • ha az adataid geokódolva vannak és időpecsét is van rajtuk, akkor CartoDB Torque-kal se perc alatt animálhatod ket. (Tipp: azért egy kis Google Directions API varázslat kellett hozzá.)

Összességében jó kis gyorstalpaló volt ez az új generációs digitális térképészetben. Nehéz az MIT nyomába eredni, érdemes megnézni a többi nevezést is.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

November 29 2012

"Postal address cleaning in the Networks Project" előadás a Data Science Meetup Novemberen

Nyéki Gábor tartotta a Data Science Meetup November-en a CEU Networks projekt első geek prezijét az adattisztításra épített irányított aciklikus gráf feldolgozónkról, a TARR-ról (Test and Rule Registry).

Interjúk a projekt vezetőivel, Szeidl Ádámmal és Koren Miklóssal.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

"Postal address cleaning in the Networks Project" előadás a Data Science Meetup Novemberen

Nyéki Gábor tartotta a Data Science Meetup November-en a CEU Networks projekt első geek prezijét az adattisztításra épített irányított aciklikus gráf feldolgozónkról, a TARR-ról (Test and Rule Registry).

Interjúk a projekt vezetőivel, Szeidl Ádámmal és Koren Miklóssal.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

November 16 2012

Dashboard pályázat

Kicsit rövid a jelentkezési határidő - ma -, és a tízezer forintos adminisztrációs díj kicsit sok, de érdemes ráfeküdni. Részletek itt, válogatás a pályázat anyagaiból ott. (A rendezvényen rövid haknit követtem el, ami a hullámzó net miatt inkább bábozás volt - a végső és valódi Tableau-s Foursquare dashboarddal még mindig adós vagyok.)

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Dashboard pályázat

Kicsit rövid a jelentkezési határidő - ma -, és a tízezer forintos adminisztrációs díj kicsit sok, de érdemes ráfeküdni. Részletek itt, válogatás a pályázat anyagaiból ott. (A rendezvényen rövid haknit követtem el, ami a hullámzó net miatt inkább bábozás volt - a végső és valódi Tableau-s Foursquare dashboarddal még mindig adós vagyok.)

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

August 27 2012

Former social darling Diaspora* intends to transform into a ‘community-run’ project
2012 08 27 11h00 31 520x245 photo

Diaspora*, the crowdfunded social network, hailed as a potential ‘Facebook killer’ when born, is making the transition to a ‘community-led’ project, it announced today.

The team recently released an image remixing and sharing tool, Makr.io, which was born out of an itch that they found while using Diaspora*, but felt wasn’t a perfect enough fit to bake into the social product itself. Makr.io is not being released to the Diaspora* community; the team intends to keep leading its development.

TNW spoke with Diaspora*’s co-founder Maxwell Salzberg about the move to cede control of the social tool to its community. He explained that it is not a complete stepping down of the founding team – they intend to help guide the project, but as normal members of its community, and not as overlords of any sort. It’s time to let its constituent users and active developers take the reins, in his view.

The following is the released quote from the team, concerning the transition:

“We are proud of what Diaspora has become. As a Free Software social project, we have an obligation to take this project further, for the good of the community that revolves around it. Putting the decisions for the project’s future in the hands of the community is one of the highest benefits of any FOSS project, and we’d like to bring this benefit to our users and developers.”

Diapora* recently opened sign ups for the JoinDiaspora* pod, so if you never managed to give the social tool a chance, you can now.

Sean Tilley, Diaspora*’s community manager will oversee the transition, which will take time. Diaspora* describes the change-over as ‘gradual.’

The simple remark to make here is that Diaspora* failed in its bid to build a social network to rival Facebook and provide a viable alternative to the giant. That’s true to an extent, but Salzberg made it plain that Diaspora* has its own active userbase. TNW wrote in 2010 that Diaspora* is too complex for the everyman to use, but that doesn’t mean that a technical crowd couldn’t fall in love with it. For the technically-mind and privacy-conscious, Diaspora* could be just the ticket for years to come.

So, the Diaspora* project, what was to be a summer’s work, eventually grew into something that is loved by some. And those fans and users will soon have control of its destiny. Failure? Only if you want to take the most cynical view.

Top Image Credit: Robert Judge

August 11 2012

Review: Strata Conference Santa Clara 2012: Complete Video Compilation (O’Reilly Media)

I'm not a big fan of conferences although I've attended some, even presented at some in the international e-learning circuit. Strata, however always make me consider applying for a US visa - hint: Strata is just hitting London this October. Videos from Strata 2011 was already featured in this blog as they condensed such wit and knowledge with good presentation that I believe it's a must to consume them for any serious data nerd. This video product is not perfect - see my struggle with talking head videos before -, yes, in general it would make more sense to show the overhead projection in a big and the talking head in a small crop, but the Strata 2012 video compilation is actually more than you can handle and I'm not just talking about the 106 hours equaling gigabytes of MP4 movies. Yes, if you lurk around Youtube, you can find some of the best presentations out there, for free, but this product also contains the materials of the workshops that you definitely shouldn't miss. Please find below three of my favourite presentations from Avinash Kaushnik, Ben Goldacre and Jeremy Howard.

Check for yourself at O'Reilly.

Score: 5 of 5.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Review: Strata Conference Santa Clara 2012: Complete Video Compilation (O’Reilly Media)

I'm not a big fan of conferences although I've attended some, even presented at some in the international e-learning circuit. Strata, however always make me consider applying for a US visa - hint: Strata is just hitting London this October. Videos from Strata 2011 was already featured in this blog as they condensed such wit and knowledge with good presentation that I believe it's a must to consume them for any serious data nerd. This video product is not perfect - see my struggle with talking head videos before -, yes, in general it would make more sense to show the overhead projection in a big and the talking head in a small crop, but the Strata 2012 video compilation is actually more than you can handle and I'm not just talking about the 106 hours equaling gigabytes of MP4 movies. Yes, if you lurk around Youtube, you can find some of the best presentations out there, for free, but this product also contains the materials of the workshops that you definitely shouldn't miss. Please find below three of my favourite presentations from Avinash Kaushnik, Ben Goldacre and Jeremy Howard.

Check for yourself at O'Reilly.

Score: 5 of 5.

Megosztom Facebookon! Megosztom iWiWen! Megosztom Twitteren! Megosztom Google Buzzon! Megosztom Google Readeren! Megosztom Tumblren!

August 01 2012

Magyar közösségi slágerlista az Artisjus-nak

Ahogy erről az Index is beszámolt, a Youtube és a Facebook adatai alapján zenei slágerlistát készítettünk a 3G Multimédiával az Artisjus zenei jogvédő egyesület számára. A rangsort a Zene Ünnepe alkalmából a Dal+Szerző magazinban publikálták, ahol negyedévente frissülnek majd a toplista eredményei.

Megosztom Facebookon! Megosztom Twitteren! Megosztom Tumblren!

Older posts are this way If this message doesn't go away, click anywhere on the page to continue loading posts.
Could not load more posts
Maybe Soup is currently being updated? I'll try again automatically in a few seconds...
Just a second, loading more posts...
You've reached the end.

Don't be the product, buy the product!

Schweinderl