10 alata za bolji rad i efikasnost data novinara (II)

10 alata za bolji rad i efikasnost data novinara (II)

U prvom delu članka autor je govorio o: 1.spreadsheetu, 2. SQL-u, 3. alatima za čišćenje podataka, 4. alatima za vizualizciju i 5. softverima za mapiranje podataka.

6. Programski jezici
 
Odaberite jezik, kupite knjigu, rešite problem. Ako naučite da programirate to će brzo proširiti vaš opseg delovanja kao data novinara: Vlasti neće da vam daju podatke iz baze na svom sajtu? Skrejpujte ih. Ne uspevate da dobijete podatke u formatu koji vam treba koristeći postojeće alate? Napravite sopstveni. Opijajuća je moć u tome da postanete ne samo korisnik, već i kreator softvera. 
 
Nije toliko bitno koji jezik odaberete, iako izgleda da su Python i Ruby trenutno najomiljeniji među novinarima. Ako neko koga znate već radi sa Perl-om ili PHP-om i voljan je da vam pomognete da počnete da učite, možda je to vaš početak. Kao i sa prirodnim jezicima, kada naučite jedan, učenje drugog je lakše, a naučiti kako da mislite kao programer je daleko važnije nego naučiti određenu sintaksu. (Takođe, trend-seteri na ovom polju će možda koristiti nešto sasvim drugo dok vi naučite jezik koji je sada popularan.)
 
Ako hoćete da počnete sa web skrejpingom [engl. web scraping], pogledajte odličan vodič za skrejping koji je napravila ProPublica. ScraperWiki je još jedan način da se bacite u vatru i učite na primerima. Learn to Program je odličan uvod u programerske koncepte koji koristi Ruby kao ciljni jezik. 
 
7. Web framework
 
Bilo da sami pravite alate za sebe ili kreirate aplikacije koje će ići u svet, ako programirate za Web trebaće vam Web framework: Django za Python, Rails for Ruby, symfony za PHP, Catalyst za Perl, pa odaberite.
 
Framework će pomoći da izbegnete dosadan, repetititivan posao, da naučite najbolju praksu, da se organizujete i olakšaće saradnju sa drugima. Ima mnogo framework-a koji se instaliraju jednim klikom, što može da olakša početničke muke. Pogledajte, na primer, Bitnami Django i Rubystacks.
 
U procesu pravljenja nekog alata za Web, naučićete podosta HTML-a i CSS-a. Ali sve ukazuje na sve veću važnost JavaScripta u svim sferama razvoja Weba. Ako hoćete da vaša Web aplikacija liči više na desktop aplikaciju, naučite nešto JavaScripta, pogotovo biblioteke kao što je jQuery.
 
8. Fleksibilni editor
 
Da biste pisali programerski kod, potreban vam je editor za kod. To znači editor koji vam ne ubacuje pametne, fensi karaktere u tekst (kao što to radi Microsoft Word), a trebalo bi da dodaje neke korisne elemente kao što je bojenje sintakse određenog jezika, što će vam pomoći da lako identifikujete ključne reči i druge elemente jezika dok kucate. 
 
Nema sigurnijeg načina da zapodenete prepirku među programerima nego da pitate koji je editor za kod najbolji. TextMate (za Mac) je dobra komercijalna opcija. A Notepad++ (za Windows) je dobra besplatna opcija. Takođe postoje i opcije otvorenog koda koje se mogu prilagođavati do beskonačnosti: VIM i Emacs. Međutim, sa svakom od njih budite spremni da iskusite krivu učenja. U nekom trenutku će neki Java programer sugerisati da vam treba puno Okruženje za integrisani razvoj (Integrated Development Environment). Ako vam neko pomaže da učite programiranje, prihvatite njegov ili njen editor i naučite svaku prečicu ili trik za konfiguraciju koji možete. Editor je najličniji od svih alata i u onom koji odaberete treba da se osećate kao kod kuće. 
 
9. Kontrola revizije
 
Nikad ne pravite greške? Nikad ne želite da sarađujete sa nekim na projektima? Onda vam možda ne treba kontrola revizije. Ali je vredi koristiti kao elegantan način čuvanja backup-a, isprobavanja novih stvari na privremenim verzijama fajlova ili spajanja sopstvenog rada sa radom drugih. Možda ćete najlakše da naučite kontrolu revizije ako koristite Github. Takođe možete lokalno da instalirate Git ili Subversion
 
10. Alati za analizu dokumenata
 
Verovatno najuzbudljiviji deo razvoja data novinarstva danas je nastojanje da se veliki setovi dokumenata tretiraju kao podaci. DocumentCloud ima lak interfejs koji oslobađa stega koje sa sobom nosi PDF format i omogućava pretragu kroz mnoštvo dokumenata, kao i ekstrahovanje onoga što vas zanima. 
 
Jigsaw je desktop softver koji je koristan za snalaženje u relativno velikim setovima dokumenata. U nekom trenutku ćete možda hteti da se pozabavite potencijalom u kompjuterskoj lingvistici koji imaju paketi kao što su Python’s Natural Language Tool Kit ili Stanford CoreNLP. A zato što su novinari tek zagrebali po površini ove discipline, novi alati koji tretiraju dokumente kao podatke stalno se pojavljuju.  
 
--------------------------------------------------------------------------
Članak je objavljen na sajtu Poynter.org 10.10.2011. pod nazivom 10 tools that can help data journalists do better work, be more efficient, a njegovo dalje preuzimanje i objavljivanje podleže isključivo uslovima preuzimanja sadržaja koji su navedeni na ovom sajtu.