Feeds:
Entrades
Comentaris

Posts Tagged ‘dades’

Joan Soler, director de l'Arxiu Històric de Terrassa. (Font: CCCB. Miquel Taverna)

Joan Soler, director de l’Arxiu Històric de Terrassa. (Font: Flickr CCCB. Autor: Miquel Taverna)

Vaig tenir l’oportunitat de conèixer al director de l’Arxiu Històric de Terrassa (AHT)Joan Soler, el passat més d’abril, a les II Jornades de Periodisme de Dades i Open Data (JPD14), celebrades a Barcelona el passat mes d’abril.

En el seu discurs va esmentar l’arxivística de les dades i em vaig quedar encuriosida per saber alguna cosa més del tema. Al cap d’uns mesos, vam quedar de nou per seguir parlant del tema.

L’actual AHT, creat el 1932, està en el seu procés més fort de digitalització. Joan Soler explica que només a la web es pot trobar documentació antiga, en format PDF, des del 1400 i fins al 1994. Físicament no pot quantificar el nombre de documents en paper que conté l’Arxiu però són uns 5.500 metres de prestatges. D’aquests, digitalitzats més de 340 mil documents. La xifra sembla enorme però segons Soler només estan en el començament de la conversió del paper al digital.

Ple de l'Ajuntament de Terrassa amb caràcter extraordinari tras la mort de Francisco Franco (Font: Web de l'Arxiu Històric de Terrassa. 20/11/1975)

Ple de l’Ajuntament de Terrassa amb caràcter extraordinari tras la mort de Francisco Franco (Font: Web de l’Arxiu Històric de Terrassa. 20/11/1975)

Tens algun referent de l’arxivística de dades?
Estem en una fase molt iniciàtica del problema. Hem d’anar cap a una arxivística de dades perquè la professió va una mica lenta.

Per què el planteja com un problema i per què van molt lents?
Perquè tenim molt clar que hi ha un repte i una responsabilitat molt gran en la gestió de documents electrònics i bases de dades però ens falta recorregut. Les iniciatives que surten des de la professió són puntuals, estan en fase laboratori, per anar a provar. Anem amb el fre de mà posat perquè hi ha molts pocs recursos.

Per què és complicada la gestió de documents electrònics?
Pels volums, perquè no ho pots controlar tot. D’altra banda, s’està generant molt de soroll.

Què vol dir ‘soroll’?
Documentació en excés, no necessària. Hi ha la creença que un cop passes a la fase digital, no tens problemes d’espai i això provoca que s’estiguin generant més documents digitals que en paper. En molts casos, es fa una còpia de tot el que ja tenim. Estem duplicant la feina més que resoldre-la. Tot allò que s’ha volgut fer de cara a millorar l’eficiència administrativa i de les empreses, és bona voluntat però no és real. El que proposen els arxivers és determinar i seleccionar els documents que són realment útils i eliminar el soroll.

S’hauran de crear nous criteris per establir el què és i el què no és realment útil
Sí, i també eines que permetin seleccionar tot el sobrer i facin més eficients els repositoris als servidors.

Doncs es planteja una etapa de transició molt emocionant 
Ho és i també té una tasca titànica.

La Història ha demostrat que el paper es conserva però els formats digitals, per l’obsolescència dels lectors, es perden. No us espanta aquest fet ara que esteu digitalitzant tot l’antic?
Anem a un ritme frenètic de migració constant de formats i d’aplicacions que permetin continuar llegint-los o visionar-los.

En costos, això deu ser immens..
Insostenible. Et posaré un exemple: tinc pergamins del segle X. El pergamí no és només paper sinó també pell d’animal tractada perquè s’hi pugui escriure a sobre. Han durat 1.000 anys. És un suport bo per a la preservació. Abans hi havia el papir. Tot el papir de l’Àfrica abans del S.X s’ha conservat pel clima sec. Però tot el que va haver-hi fins a Europa es va perdre. El papir no va suportar la prova del temps. Es diu que als segles VIII o IX la gent era analfabeta perquè no ens consten documents: Però no és cert, va ser un problema de preservació de documents. En canvi, tot el que es va poder passar a pergamí es va conservar.

Em recorda al llibre d’Umberto Eco, ‘El nom de la rosa’, amb aquells monjos que copiaven llibres..
Exacte. Ara tenim un problema semblant. Eco parla d’una nova Edat Mitjana de la preservació. Tenim el mateix problema que llavors.

 El paper reciclat és ecològic i es fa servir molt al moment actual, però és paper reutilitzat. Què quedarà d’aquests documents?
Res. Són fatal per a la conservació.

Internet recupera molt poc ja de la seva primera dècada de vida, les URLs es perden i amb elles tot el que s’ha escrit en pàgines web. Quin paper poden jugar els arxivers en aquest sentit?
El nostre col·lectiu professional ja s’ha dedicat a resoldre aquest assumpte en el món analògic. Ara hem de ser capaços de proposar polítiques per garantir aquesta preservació també en el digital.

Quin és el pas més urgent a fer en l’arxivística de les dades?
A mi m’agradaria extreure dades significatives dels documents manuscrits o digitalitzats, passar-los a bases de dades, i a partir d’aquí fer estudis, càlculs o visualitzacions de coneixement.

I per què no ho fan?
És un procés molt innovador que s’està provant en molts pocs llocs encara. A Catalunya el fa el Centre de la Visió per Computador (CVC) de la Universitat Autònoma. El que sí fem des de l’Arxiu Històric de Terrassa és formació a estudiants perquè entenguin bé la documentació antiga i sàpiguen veure la informació significativa que es podria extreure de manera automatitzada.

P: Encara que no es pugui fer per ara…
El CVC ha aplicat tecnologia de reconeixement de caràcters sobre documentació escrita, han extret aquests caràcters i els han passat a bases de dades obertes, que després qualsevol se les pot descarregar. Així, a la visió clàssica del treball dels arxius se li suma un coneixement tecnològic que poca gent té ara. Aquest ha de ser el camí cap a la transició digital moderna. Altrament, els arxius històrics acaben sent museus de paper, cementiris o espais de contemplació.

——————————-

Recomanat:
Archivos, contexto y datos. El potencial de los archivos en las II Jornadas de Periodismo de datos y Open Data“, por Joan Soler.
Interessant reflexió entorn de les dades, al Big Data, i a les simbiosis que pot haver-hi entre periodistes i arxivers. Si volen treballar amb dades, totes dues professions es necessiten.

 

Anuncis

Read Full Post »

Deixo aquí els vídeos que va enregistrar el CCCB amb motiu de la IV Sessió de Periodisme de Dades que va organitzar la OKFN-Spain en col·laboració amb l’equip del CCCBLab, el passat 16 de desembre.

Per tancar l’any, vam tenir dos convidats de luxe que ens van ensenyar molt.

De la banda dels continguts, estava l’editor multimedia del The New York Times, l’Aron Pilhofer, que dirigeix un equip de desenes de periodistes, programadors, experts en xarxes socials i marquèting online. Durant la seva intervenció, va parlar de multimèdia, però també de dades, de com interactuar amb les audiències i de com gaudir del periodisme amb totes les eines digitals i possiblitats que tenim actualment al nostre abast.

Aquesta és una mini entrevista que l’equip del CCCBLab li va fer.

I aquí la presentació que va fer durant la sessió:

I ara ve el taller d’scraping que el programador Michael Bauer ens va oferir durant una hora llarga. Amb ell podem entendre de quina manera funcionen les pàgines HTML i com portar les dades a un full de càlcul per treballar amb elles.

Tots dos es van oferir a respondre dubtes i consultes i van deixar les seves dades de contacte.

La propera cita de Periodisme de Dades al CCCB, anoteu… serà el 22 de gener del 2014.

¡Ens veiem!

Read Full Post »

bg-bodyTornem a tenir sessió de periodisme de dades al CCCB.

Aquestes trobades són organitzades pel capítol espanyol de l’Open Knowledge Foundation i, a partir d’ara, també amb el recolzament de l’Ajuntament de Barcelona. Així que el primer que fem és preparar una sessió monogràfica per conèixer, de primera mà, el camí fet per part de l’administració local en transparència i accés de la informació.

Ara fa més de dos anys, l’Ajuntament de Barcelona va iniciar el projecte Open Data Barcelona per posar a l’abast de tothom les dades administratives generades en l’activitat municipal. En Sergio Jerez, director de Mobile, eGovernment&Data, ens donarà més informació al respecte. L’Open Data Barcelona forma part de l’estratègia d’Open Government de l’Ajuntament, que ens explicarà en Carles Agustí, Comissionat Municipal de Participació Ciutadana i Associacionisme.

Després d’aquestes explicacions per posar-nos en context, passarem a la part més pràctica.

En Lluís Sanz, director d’Informació de Base i Cartografia, de l’Institut Municipal d’Informàtica i Isaac Aparicio, responsable de Gestió de la Informació de Base a l’IMI mostraran de quina manera treballar amb les dasdes que hi ha en obert en els diferents portals de l’administració local. 

La sessió també vol propiciar el debat i la crítica cap a les dades que tenim actualment per treballar. Així que aquesta és una oportunitat per saber els criteris alhora d’obrir unes determinades dades i no altres i també per preguntar de quina manera els ciutadans (periodistes o no) podem sol·licitar que es publiquin nous fitxers.

DIA: Divendres 22 de novembre de 2013

HORA: De 16.30 a 19.30

LLOC: Centre de Cultura Contemporània de Barcelona. C/Montalegre, 6.

Ens veiem!

Pd: Us deixo aquí els vídeos de la Sessió II, on Eli Vivas i Francisco Moya van explicar el projecte Fuga2.

I el taller de Google Fusion Tables que va impartir l’Eduard Martin-Borregón.

CCCB LAB // Periodisme Dades. Sessió de treball (II). Projecte Fuga2 (VO Es) from CCCB on Vimeo.


CCCB LAB // Periodisme Dades. Sessió de treball (II). Taller de Google Fusion Tables (VO Es) from CCCB on Vimeo.

Read Full Post »

Després d’anys seguint el fil del periodisme de dades, d’escoltar exemples i parlar amb els protagonistes que actualment l’estan fent, el periodista i professor de documentació Javier Guallart em va proposar escriure un article entre els dos, per tal de posar ordre a les idees que ja teníem acumulades i donar forma a tot el que ha passat fins ara en aquesta disciplina.

La proposta de publicació va arribar de la revista Ítem, dedicada a la biblioteconomia i documentació. Tot i que ja fa uns mesos que es pot llegir aquest article en format paper, encara no l’havia passat al meu blog.

Per la seva extensió, he considerat oportú publicar-lo en dues parts.

Aquí va la primera. En breu, la resta.

————————————————————————————————-
(Article publicat a Item, revista de biblioteconomia i documentació. Dossier/p. 22-36.
Escrit conjuntament amb el Javier Guallar, professor de documentació i comunicació a la UB, URL i UOC)

En els darrers anys sona cada cop més en els mitjans de comunicació i entre els periodistes i altres professionals de la informació l’expressió «data journalism» o «periodisme de dades», i probablement es pugui considerar la tendència més rellevant en el sector dels mitjans digitals en els anys 2011-121.

Malgrat que l’així anomenat «periodisme de dades» s’ha estès considerablement en poc temps a països com els EUA (per exemple, a capçaleres com The New York Times o Los Angeles Times), el Regne Unit (amb el cas emblemàtic de The Guardian) o diversos països d’América Llatina (els diaris La Nación a Argentina i a Costa Rica són un bon exemple), el moviment ha tingut fins ara escassa presència en els mitjans catalans i espanyols.

The Data Journalism Handbook El 2013 pot ser l’any del seu definitiu enlairament a Espanya. Alguns indicadors d’aquesta afirmació són l’aparició del primer programa de televisió que assumeix plenament aquesta tendència, El objetivo, de la periodista Ana Pastor, o l’èxit de participació de les I Jornades de Periodisme de Dades i Open Data (#jpd13), celebrades a Barcelona i Madrid (del 24 al 26 de maig del 2013) i organitzades per les periodistes Mar Cabra i Karma Peiró (coautora d’aquest article) amb el suport de l’Open Knowledge Foundation.

Tot i que l’expressió «periodisme de dades» està en boca de molts professionals i ha començat a arribar al gran públic, hi ha molts dubtes, desconeixement i imprecisions sobre el seu abast i significació.

«Vivim en un món digital, on gairebé qualsevol fet pot ser descrit amb números: la carrera professional, 300.000 documents confidencials, les persones que formen el teu cercle d’amics; fotos, vídeo i àudio; assassinats, malalties, vots polítics, corrupció i mentides, etc.», es diu al manual The Data Journalism Handbook, escrit de manera col·laborativa per periodistes de diversos països.

El periodisme de dades es presenta en aquests moments per als periodistes com una gran oportunitat per injectar qualitat a la professió, perduda en la majoria de mitjans a causa de l’acceleració de la informació i de la retallada de personal a les redaccions per la crisi econòmica.

D’altra banda, des del sector professional de la documentació –al qual es dirigeix particularment aquest article publicat a la revista Ítem– s’ha generat també força interès per l’oportunitat professional que pugui representar, alhora que inseguretat per l’abast de la pròpia participació. Des d’aquest àmbit sovint es pregunta: Què és el periodisme de dades?, Té relació amb la documentació periodística? Hi tenen un paper a jugar els documentalistes?

Definició i característiques

Segons Flores i Salinas, el periodisme de dades «consiste en usar herramientas estadísticas y de visualización para contar mejor las viejas historias y descubrir nuevas historias que contar».

Nosaltres proposem la següent definició: “Periodisme de dades és l’especialitat o pràctica del periodisme que utilitza com a matèria primera i fonamental les dades (i no altres fonts d’informació), per tal de crear productes informatius diversos, com ara: articles amb dades, infografies o visualitzacions interactives amb dades i conjunts de dades en obert”.

L’èmfasi de la definició està –clarament– en el terme «dades». Aquestes són la font i l’origen de la informació que es publica i són també les protagonistes destacades del producte informatiu que s’ofereix al lector. La pròpia varietat d’aquests productes és en si una altra característica del fenomen.

(més…)

Read Full Post »

"Sessió del 'Big Data' al BDigital Congress

“Sessió del ‘Big Data’ al BDigital Congress

El passat 13 de juny, vaig tenir l’oportunitat d’estar en una trobada a porta tancada amb els directius de grans companyies tecnològiques d’Espanya a més dels responsables d’innovació d’administracions catalanes com la Generalitat i l’Ajuntment de la ciutat.

Estàvem allà reunits per l’organització del Congrés BDigital, aquest any dedicat al ‘Big Data’, que es va celebrar en el Caixaforum de Barcelona.

Els representants de firmes com Fujitsu, Telefónica, Indra, HP o IBM– per citar només uns quants– tenien el repte de donar-li voltes al concepte ‘Big data’ i explicar quina era la motivació de la seva empresa en aquest terreny

Es va parlar de dades i de com aquestes, que cada vegada es mouen més ràpidament d’un lloc a l’altre del planeta, faciliten els serveis, la creació de productes, negocis o plans de futur a pacients, ciutadans, clients, estudiants, inversors, emprenedors, etc.

Però abans d’arribar a aquest nivell de la conversa, va caldre contextualitzar el terme ‘Big Data’. “No significa gens si no tenim clar a on aplicar-ho” va apuntar Núria Oliver, la directora de I+D de Telefónica.

El moderador, Maurici Garcia de BDigital, va recordar que durant el congrés s’havia parlat de les tres ‘Vs del Big Data’, és a dir, velocitat, varietat i volum. Però els representants de les principals companyies tecnològiques del país van jugar a afegir-ne d’altres.  ‘Valor’ (pensar en la vàlua de la informació), ‘Veracitat’ (importantíssim contrastar les dades) i ‘Vuelco’ (en castellà! acció de tombar o canviar de mentalitat).

(més…)

Read Full Post »

(Notícia publicada al 324.cat)

Tuderechoasaber.es està inspirada en les exitoses iniciatives britàniques com WhatDoTheyKnow.com, de la comunitat ciutadana mySociety. Altres semblants existeixen al Brasil, Alemanya, Xile o Kosovo. A la Unió Europea funciona AsktheEU.

Per sol·licitar dades a alguna administració (nacional, autonòmica o local), només cal adreçar-se a la web Tuderechoasaber i omplir un formulari. Els promotors s’encarreguen d’enviar un correu-e a l’administració pertinent. La resposta ha d’arribar abans de tres mesos des de la consulta.

“Totes les consultes queden públiques en aquesta web de manera que les preguntes a la mateixa oficina o administració no es dupliquin”, expliquen els promotors de la idea a la web.

La web es va presentar fa unes setmanes, però dijous 22 de març, es va obrir públicament. En unes hores ja ha reunit 101 sol·licituds de petició d’informació a diferents ministeris i ajuntaments. Es vol saber, per exemple, la despesa pública invertida en la missió a l’Afganistan, el sou dels càrrecs públics o el llistat de factures impagades als ajuntaments espanyols.

Tuderechoasaber és un projecte finançat per Crowdfunding (molts aporten petites quantitats econòmiques), a través de Goteo.org, una xarxa social de finançament col·lectiu.

Read Full Post »

(article publicat al 324.cat)

La majoria dels països europeus tenen una llei d’accés a la informació pública que obliga les administracions a facilitar les dades que demanen els ciutadans. A Espanya encara no existeix aquesta norma, malgrat haver estat reclamada en repetides ocasions durant els vuit anys de govern socialista.

“Si els espanyols ens atorguen la seva confiança el 20 de novembre, en els primers 100 dies de govern, Espanya tindrà una llei per la transparència, bon govern i accés a la informació pública que ja està redactada”, va dir Mariano Rajoy quan encara no era president del govern espanyol.

Ara la plataforma ciutadana Tu Derecho a Saber recorda amb un marcador ben gran que, a data del 5 de març, només resten 22 dies perquè el PP compleixi la seva paraula.

“Amb aquesta plataforma volem pressionar perquè s’aprovi la llei de transparència però també que es faci pública abans, perquè els ciutadans puguem revisar-la prèviament”, explica Victòria Anderica, impulsora de Tu Derecho a Saber i coordinadora de projectes d’Access Info Europe, una ONG que vetlla pel dret de la informació pública a Europa.

A la part tècnica del projecte hi ha David Cabo, vicepresident del blog Pro Bono Público i creador de Donde Van Mis Impuestos, una web basada en la visualització de dades públiques.

(més…)

Read Full Post »

« Newer Posts