Bij de Directie Wetenschapsbeleid van het ministerie van OCW was Peter Schröder coördinator wetenschappelijk informatiebeleid. Momenteel adviseert hij de Directie van Data Archiving and Networked Services (DANS), het instituut van de Koninklijke Nederlandse Akademie van Wetenschappen voor datadiensten van de sociale wetenschappen en de humaniora.
Zie: http://www.dans.knaw.nl/content/contact/medewerkers/peter-schroeder
Bij OCW ontwikkelde hij onderzoekstimuleringsprogramma’s als Stedelijke Netwerken (stedelijk onderzoek), Informatietechnologie en Recht en Bodemarchief in Behoud en Ontwikkeling (archeologie). In het licht van de groeiende strategische betekenis van ICT en databanken in wetenschappelijk onderzoek richtte hij zich steeds meer op de problematiek van de beschikbaarheid en toegankelijkheid van onderzoeksdata. Daarbij komt het aan op een zorgvuldige regeling van privacybescherming en intellectueel eigendom. Hij stond aan de wieg van de huidige gedragscodes voor het gebruik van persoonsgegevens in databanken voor sociaal-wetenschappelijk onderzoek. In internationaal verband speelde hij een hoofdrol bij het tot stand komen van de Principles and Guidelines for Access to Research data from Public Funding van de Organisatie voor Economische Samenwerking en Ontwikkeling (OESO).
(zie:HTTP://WWW.OECD.ORG/DATAOECD/9/61/38500813.PDF ) Voor inlichtingen over beleidsadvies aan instellingen van onderzoek en de infrastructurele ondersteuning daarvan kan contact worden opgenomen opnemen via info@peterschroderatb.nl
---- Hieronder volgen enkele recente teksten en verwijzingen naar artikelen over wetenschapsbeleid en wetenschappelijk informatiebeleid waarin zijn beleidsvisie te vinden is.
1. Gelijk in wetenschap en beleid: hebben en krijgen
2. Promoting Access to Public Research Data for Scientific, Economic,and Social
Development
3. An International Framework to Promote Access to Data
4. Cherishing the Memory of Science: Towards International
Guidelines for Access to Research Data from Public Funding
5. Digital research data from public funding as the floating capital of international
scientific co-operation
6. Towards international guidelines for access to research data from public funding
7. Possible Downsides to Data Sharing in our Research Commons
8. Open Data for Global Science
----
1. Gelijk in wetenschap en beleid: hebben en krijgen *) Wat bedoelt de schrijver?
Wetenschap
Wetenschap begint met een vraag in de orde van: ‘Als A, dan B?’.
Menige variant van een wetenschappelijk antwoord daarop, een uitspraak uiteenlopend van ‘ja’, via ‘een beetje’ tot ‘nee’ is mogelijk. De eerste prijs gaat naar het antwoord dat het forum van deskundige collega’s weet te overtuigen. Het forum is het tijdruimtelijke gezelschap van de ‘reuzen’ van Newton op de schouders van wie geleerden een staanplaats kunnen veroveren. Het forum toetst de gebruikte methoden en het antwoord (impliciet/expliciet) op een samenhangend programma van de criteria precisie, systematiek, reikwijdte en relevantie . Wie het beste antwoord geeft heeft gelijk.
Wetenschappelijk onderzoek is gericht op krachtige variabelen. De knapste berekening, redenering maakt de meeste kans om te worden uitverkoren door het forum. Het antwoord kan nuttig zijn of niet. Van een tastbaar resultaat zal meestal geen sprake zijn. De uitspraak ‘Als A, dan B’ zal maar een beperkte kring mensen in beroering brengen. Vertaald in termen als Oerknal, Tamiflu of Kernafval kan soms de voorpagina worden gehaald. Op de lange termijn hebben de verzamelde antwoorden meestal een maatschappelijk nut.
Soms wordt in wetenschap niet erg diep ingegaan op de mogelijkheid dat een vraag niet wetenschappelijk onderzoekbaar is. Dan wordt wel eens vergeten dat er geen wetenschappelijk gelijk te halen valt.
Beleid van de regering
Beleid begint met een iets andere vraag, ongeveer: ‘Als A, wat dan?’
Er is sprake van wenselijke antwoorden en politieke doeleinden. Maar het discours richt zich vooral op de methoden, de maatregelen. Gepastheid van beleidsmaatregelen, uiteenlopend van ‘niets’ tot ‘oorlog’, wordt bepaald door ‘de politiek’: de vertegenwoordigers van Koning/Kanonnen, Kerk, Arbeid en Kapitaal, ondersteund door Kennis. De eerste prijs gaat ook hier naar het antwoord dat een forum, in dit geval van kabinet en volksvertegenwoordigers (de kiezers, soms eerder de televisiekijkers) weet te overtuigen. Maatregelen worden in beginsel getoetst op een samenhangend programma van de punten legitimiteit, effectiviteit, efficiëntie en opportuniteit. De maatregelen zijn gericht op manipuleerbare variabelen. De maatregel die het beste past in de heersende politieke consensus wordt uitverkoren. Hier geldt dan: wie gelijk krijgt heeft gelijk. In tijden van vrede zal de financiële begroting een programmatische hoofdrol spelen, boven een bepaald niveau van welvaart zal welzijn de beslissing kleuren. Politieke maatregelen zijn gericht op een doelgroep, maar daarnaast liefst ook via de voorpagina van de krant op een breder publiek. Op de lange termijn spreekt uit de verzamelde antwoorden een maatschappelijke consensus. Wie ondanks een aanvankelijk politiek gelijk zijn beleidsdoel niet weet te bereiken loopt de kans achteraf alsnog ongelijk te krijgen.
Soms wordt in de politiek niet erg diep ingegaan op de vraag of het mogelijk is het gewenste politieke doel met beleidsmaatregelen naderbij te brengen. Een beleidsmaatregel kan sterk lijken op het vanaf de wal besturen van een maatschappelijk proces dat een eigen koers vaart.
Wetenschapsbeleid
Het wetenschappelijk domein is net zo onbegrensd als het universum waarin we leven. Het politieke domein functioneert dankzij de beperkingen van maatschappelijke maakbaarheid.
Wetenschapsbeleid kan worden gezien als een deel van het kennisbeleid (vroeger aangeduid als cultuurbeleid - cultuur in de brede, sociologische betekenis van het woord) van de regering waarmee het publieke domein van Onderwijs, Cultuur en Wetenschap wordt ondersteund . Particulieren, bedrijven, middenveld en overheden leveren allen een bijdrage aan het publieke domein van OCW, de regering is verantwoordelijk voor het functioneren van het stelsel. De regering garandeert daartoe in ieder geval een minimumniveau van het aanbod aan Onderwijs, Cultuur en Wetenschap. Het onder verantwoordelijkheid van de regering door het stelsel verzorgde aanbod wordt getoetst aan de criteria van kwaliteit, pluriformiteit, toegankelijkheid en stabiliteit - in hun onderlinge samenhang.
In het politieke discours bestaat soms de neiging een zeer zwaar accent te leggen op één van de criteria. Bij onderwijs lijkt het dan vooral te draaien om toegankelijkheid, bij cultuur om pluriformiteit en bij wetenschap om kwaliteit (stabiliteit wordt zelden expliciet opgevoerd).
Kwaliteit
Zo kan het er op lijken dat het politieke en het wetenschappelijke forum eensgezind een stelsel op de been houden gericht op maximale kwaliteit van het aanbod: hoe hoger de kwaliteit, des te succesvoller het wetenschapsbeleid. Vragen over de wenselijke omvang van het aanbod, mogelijke keuzen binnen het aanbod, maatschappelijke vraag en nut: ze lijken vaak ondergeschikt aan de allesoverheersende vraag naar kwaliteit. Kwaliteit lijkt voor de argeloze leek (denk aan de gevolgen van een verkeersbeleid of een landbouwbeleid waarin alleen de kwaliteit van de productie maatgevend is: hoogwaardige wegen van niks naar nergens, bergen prachtige meirapen die niemand lust) eerder een voorwaarde dan een doel. Als het gaat om door buitenstaanders moeilijk te doorgronden wetenschap gelden andere regels. Daarbij is het aardige dat de regering zich niet bevoegd acht (staatswetenschap!) om wetenschap op kwaliteit te toetsen: dat wordt met genoegen overgelaten aan het wetenschappelijk forum. Zo laat de regering de wetenschappers liefst zelf hun onderzoeksorganisaties besturen: in een organisatievorm die kan gaan doen denken aan arbeiderszelfbestuur regeren de knapste koppen. De politieke bemoeienis beperkt zich tot het totaal van de begroting.
Premie op uitzonderlijkheid
Kwaliteit is een ingewikkeld en contextafhankelijk verzamelbegrip. Als het over bruggen of fietsen gaat zal deugdelijkheid overheersend zijn, maar vaak zal het etiket ook iets betekenen van uitzonderlijkheid. Als het gaat om wetenschappelijke kwaliteit bestaat er een min of meer expliciete consensus tussen wetenschappers en beleidsmakers: kwaliteit wordt gemeten aan artikelen in ‘toptijdschriften’ (culminerend in de Nobelprijs) en kwaliteit betekent vooral Nieuw! Wetenschappers zijn op weg naar nieuwe vondsten.
Met een vérziende blik is de kans om nieuwe verbanden aan het licht te brengen groter. Dat kan ‘tunnelvisie’ worden genoemd en sluit aan bij de volkswijsheid dat een wetenschapper ‘steeds méér weet over steeds minder’. Wetenschappers doen nieuwe en uitzonderlijke vondsten in een stelsel waarin competitie heerst: wetenschappers weten het beter dan gewone mensen maar vooral beter dan de collega’s. Het cliché wil dat wetenschappers eigenwijze individualisten zijn die alleen onder bedreiging van een stomp voorwerp tot samenwerking te bewegen zijn. Individualistische competitie op weg naar nieuwe records, dat betekent al gauw bezuinigen op gemeenschappelijke belangen: het onderhoud van eerdere verworvenheden en de infrastructuur van instrumentele voorzieningen, de duurzaamheid van het stelsel.
Tussen wetenschap en politiek
Overtuigd van het grote belang van kwaliteit zien wetenschappers hun wetenschappelijk gelijk soms als een variant van een maatschappelijk recht: het juiste diploma plus kwalitatief goede onderzoeksresultaten worden gezien als een voldoende voorwaarde voor een subsidie of een dienstverband van staatswege. De dichter die door zichzelf en zijn collega’s gezien wordt als toptalent, zal niet altijd verbaasd zijn als de burgerlijke belastingbetaler nog niet rijp is voor zijn prachtige poëzie. Het wetenschappelijk toptalent kan er vaak moeilijker aan wennen dat het na zijn gelijk bij het wetenschappelijk forum, het gelijk nu ook bij een politiek forum moet gaan halen.
Ook wetenschappelijk toptalent zal duidelijk moeten maken hoe belangrijk zijn werk voor de maatschappij zal zijn. Ook Einstein heeft niet alleen collega’s, maar ook managers, ambtenaren en politici weten te overtuigen van de betekenis van zijn knappe maar onbegrijpelijke sommen. Belangrijk voor een maatschappij die niet bij voorbaat onder de indruk is van een artikel in Science of Nature, maar wel op zijn hoede is voor dierenbeulerij en Frankenstein Food. Toch ook weer en maatschappij die niet kinderachtig is als het gaat om het betalen van dure telescopen om zwevende zaken als Zwarte Gaten mee te bekijken.
Kortom: om knappe sommen te kunnen maken moeten ook knappe wetenschappers net als iedereen eerst aan de taaie onderhandelingstafel hun maatschappelijk gelijk halen. Wetenschapsbeleid is er om aan de politieke onderhandelingstafel te komen tot maatschappelijke successen.
Duurzaamheid en stabiliteit
Aan de onderhandelingstafel heeft het in opdracht van ’de politiek’ geformuleerde ‘voorwaardenscheppende’ wetenschapsbeleid een taak als behartiger van niet alleen maatschappelijke, maar ook van wetenschappelijk belangen. Wetenschapsbeleid heeft misschien weinig recht van spreken als het gaat om het beoordelen van de kwaliteit van wetenschappelijke ontdekkingen, maar wordt geacht beter dan individuele onderzoekers te kunnen beoordelen hoe het staat met de kwaliteit, en dan vooral de deugdelijkheid van het landelijk stelsel. Denk aan de verantwoordelijkheid voor de duurzaamheid en stabiliteit van het stelsel; het bekostigingssysteem, de arbeidsvoorwaarden, de opbouw van de formatie en vooral de voorzieiningen, de instrumenten, laboratoria, computers, bibliotheken en databanken. Is het allemaal verstandig georganiseerd? Moeten onderzoekers zich niet behelpen met aftandse spullen? Besteden onze toptalenten niet teveel tijd aan doe-het-zelf geklus dat door niet-wetenschappelijk personeel zou moeten worden opgeknapt?
Zoals gezegd bestaat er onder onderzoekers vaak de neiging de blik te beperken tot het sensationele nieuws dat verwacht wordt van het lopende eigen project. Zorg voor consolidatie, verspreiding, onderhoud en verdere planning van het stelsel waarin het eigen project kan gedijen komt dan terecht bij het wetenschapsbeleid.
Insitutionele optiek
Hier is het beleid dan de betweter tegenover een cliëntèle van betweters die per definitie een betere bestemming weet voor de beschikbare middelen. Beleid met een enigszins pedagogische taak: liever geen ‘inspraak van alle geledingen op alle niveaus’, maar aan de andere kant toch wel zien en horen met welke zaken ’het veld’ en de maatschappij bediend moeten worden. Luisteren naar wetenschap en politiek voor het organiseren van bestuurlijk vermogen van zelfstandige instellingen.
Wetenschappelijke organisaties zijn geen gewone organisaties. Maar net zoals de meeste moderne organisaties wordt vandaag ook het wetenschapsbestel steeds omvangrijker en ingewikkelder en daarmee steeds duurder. Verdergaande internationalisering en informatisering versterken de vergroting van schaal en reikwijdte. Dat vraagt tussen en binnen de organisaties van het wetenschapsbestel meer aandacht (‘serendipiteit’ of niet) voor saaie en taaie zaken als beleid, bestuur en onderhoud.
Om kans te maken op wetenschappelijk gelijk en success zullen wetenschappelijke instellingen uitgebreider om zich heen moeten kijken. Ze zullen de maatschappelijke en wetenschappelijke omgeving beter in beeld moeten krijgen in ruimte en tijd. De organisaties zullen de landkaart van ‘het veld’ dat bestreken wordt in orde moeten brengen voor de Tom Tom om op stap te gaan aan de hand van een verder uitgewerkte onderzoeksagenda: Waar willen we op welke termijn heen en wat hebben we daar voor nodig? .
Het beste van twee werelden
Wetenschapsbeleid staat in dienst van spannende expedities door het wetenschappelijk reuzengebergte. Maar vaak zal deze rol doen denken aan die van de inspecteur die de voor het schoolreisje klaarstaande bus onder de ogen van de joelende klas uitgebreid aan een veiligheidsinspectie onderwerpt. Wetenschapsbeleid hoort de monteur te zijn die weet dat de bus veilig moet kunnen rijden, ook morgen, hij hoort de penningmeester te zijn die weet dat ook morgen de economie nog niet is verdampt. Misschien op korte termijn iets van een pretbederver, hopelijk een beschermengel op de langere termijn. Zo brengt wetenschapsbeleid de betrokkenen vaak een behoudende, zo niet remmende boodschap.
Politiek en wetenschap leven op dynamiek, Nieuws! Politiek en wetenschap vinden elkaar in een voorliefde voor zichtbare successen op afzienbare termijn: duurzaamheid riekt aan de achterkant naar het nieuws uit oude kranten en aan de voorkant naar de actualiteit van het toekomstige verzorgingstehuis. Weg met bureaucratische overlast en bemoeizieke managers!
Als partij verantwoordelijk voor de langere termijn en het bredere perspectief staat het wetenschapsbeleid dan niet alleen tegenover zijn wetenschappelijke cliëntèle, maar ook tegenover zijn politieke opdrachtgever. Gebeten door de hond én de kat.
Die positie scherpt het verstand. Ook voor wetenschapsbeleid geldt: tegenspraak brengt ons verder. Tegenspraak in dienst van de kwaliteit, pluriformiteit, toegankelijkheid en stabiliteit van het wetenschapsbestel.
*) Inleiding gehouden op het OCW symposium Wetenschapsbeleid en Informatiebeleid december 2005.
---- 2. Promoting Access to Public Research Data for Scientific, Economic and Social Development P Arzberger,1* P Schroeder,2 A Beaulieu,3 G Bowker,4 K Casey,1 L Laaksonen,5 D Moorman,6, P Uhlir,7 P Wouters Data Science Journal, Volume 3, 29 November 2004 135
http://www.jstage.jst.go.jp/article/dsj/3/0/135/_pdf
---- 3. An International Framework to Promote Access to Data in: POLICY FORUM, SCIENCE AND GOVERNMENT Peter Arzberger,1* Peter Schroeder,2 Anne Beaulieu,3 Geof Bowker,1 Kathleen Casey,1 Leif Laaksonen,4 David Moorman,5 Paul Uhlir,6 Paul Wouters3
(abstract)
The emergence of an global cyberinfrastructure is rapidly increasing the ability of scientists to produce, manage, and use data, leading to new understanding and modes of scientific inquiry that depend on broader data access. As research becomes increasingly global, data intensive, and multifaceted, it is imperative to address national and international data access and sharing issues systematically in a policy arena that transcends national jurisdictions. The authors of this Policy Forum summarize key findings of an international group that studied these issues on behalf of the OECD, and argue that an international framework of principles and guidelines for data access is needed to better realize this potential. They provide a framework for locating and analyzing where improvements can be made in data access regimes, and highlight several topics that require further examination to better inform future policies.
4. Cherishing the Memory of Science: Towards International Guidelines for Access to Research Data from Public Funding Peter Schröder
Sir Isaac Newton hit the nail on the head when writing in 1676 : "If I have seen further it is by standing on the shoulders of giants". Only after a serious search through the data, information and knowledge generated by the long standing international community of scientists, a scientist will be able to observe, analyze and discover natural phenomena "on his own" (and qualify for the Nobel prize). To be able to climb the shoulders of the scientific giants of Newton's time, access to a limited corpus of written sources, letters, journals and books in libraries and archives was sufficient. Finding your scientific way in the expanding universe of our contemporary global science system requires capacities and facilities of quite another order. Since the brain capacity of researchers has not increased, climbing the ladder to the shoulders of science's giants now calls for access to ever more extensive and complex ICT facilities : giant databases, mega repositories of scientific journals, colossal archives and the contiously expanding Internet to connect researchers with information.
The recent jumps in scales and scope of these facilities is bringing dramatic changes to the way our global science system operates. Digitisation has become an essential part of the scientific process and the management of research. To sum these changes up in a simplified manner: Yesterday's scientists studied Nature, but today's scientists study digital data. Digital data on Nature to be sure.
Yesterday Sir Isaac Newton did not need more than a pencil and a pad to process his observational data into the ground breaking scientific laws we know him by.
But today the next step in physics demands a Large Hadron Collider that will produce 12 to 14 Petabytes of digital data per year, the full capacity of about 16 million CD ROM's, to be analysed by some 6.000 researchers, scattered around the world, but tightly knit by the Grid computer-network of our global science system.
In this way use of ICT has made collections of scientific data in many respects comparable to musical scores: to be used time and again for a diversity of performances by a diversity of artists for the different audiences of society. Optimum access to research data should enable researchers from all over the world to compose the full score for our knowledge based international society.
Consequently, access to the gold mine of research data has become quickly a major issue in international science policy and research management. The traditional exchange arrangements between scientific colleagues no longer suffice to guarantee the necessary openness of access to digital data resources. Optimum access requires formal agreements on the conditions of access on the national and international levels.
The main task of establishing an adequate regulatory framework lies within the research community: the national research councils, institutes and funding agencies. But the general principles to build data access regimes should be a responsibility of governments. Considering the international dimensions of the scientific effort in general and of access to data in particular, national data access regimes will only work when closely connected to international agreements.
At the meeting at ministerial level of OECD's Committee for Scientific and Technological Policy on January 30, 2004, the ministers responsible for science policy endorsed a Declaration on Access to Research data from Public Funding including a draft set of principles and Guidelines. The Declaration will be an important step towards further international scientific co-operation.
19th International CODATA Conference; Berlin 2004, World Summit on the Information Society (WSIS) http://www.codata.org/04conf/abstracts/WSIS/Schr%F6der-CherishingtheMemoryofScience.htm
----
5. Digital research data from public funding as the floating capital of international scientific co-operation
Peter Schröder Yesterday’s scientists studied nature, Today’s scientists study digital data
1. History
Science once was about scientists creating knowledge by researching nature. As time passed science grew in size and complexity and became a more co-operative and cumulative affair. Science developed a Global Science System involving larger teams of scientists (human resources) using larger instrumental facilities (capital goods) to study aspects of nature (data) in order to disseminate knowledge (product).
Scientific knowledge differs from other forms of knowledge in its higher level of precision, more systematic structure and broader scope. As the information to be processed is more precise and systematically structured, the impact of the use of Information and Communication Technologies (ICT) on productivity will be greater. No real wonder that the use of ICT has dramatically increased the productivity and quality of science.
2. Death of international distance
The use of ICT also has spectacularly broadened the scale and scope of science. In this way ICT have enlarged the potential for international co-operation and scientific globalisation enormously. No need to be far sighted to see the current and future benefits of ICT for international communication amongst the extensive networks of human resources, international remote access to the expensive instrumental capital goods of science and international dissemination of the published knowledge. Science always has been an international endeavour, global use of ICT has much enhanced this character,
3. Digital advantages
But there is more. Science embracing ICT puts a substantial premium on aspects of research and parts of research trajectories that can be digitised. The resulting developments have enhanced the importance of digital research data and made them into a far more autonomous factor in scientific research. Research data can be defined as the factual records (numerical scores, textual records, images and sounds) used as sources for scientific research. In the now almost forgotten non-digital context, use of most research data was limited largely to specific projects and their researchers. Outside this circle data-access first and foremost fulfilled an indispensable part in the (peer review) validation of research results. The US National Institutes of Health states: “Final research data comprise the recorded factual material commonly accepted in the scientific community as necessary to validate research findings “.
4. Data as a third stream of capital
In the non-digital environment, research data could be classified as partly human resources and partly knowledge. For one part ‘personalised’ between the ears of the researcher, inaccessible to the non-initiated, for the other part available in publications of research results. Digitisation characterised by automated collection and processing of standard records, made the data category more independent from specific research and researchers. Once collected, the same set of standardised digital research data now could be used by a variety of researchers from different institutes, disciplines and nations, at the times and places convenient to the individual users for an unlimited period of time. In a growing number of cases the collection and exploitation of data has been outsourced to specialist institutes. Alongside human capital and the instrumental capital goods, digital research data are developing into a third stream of scientific capital.
5. An inexpensive starting capital
Once collected and safely deposited, research data in principle can be put to use all over the global science system. And in principle at negligible additional cost once the prospective users dispose of the necessary ICT infrastructure. In this way, sharing of digital research data opens up substantial new vistas for international scientific co-operation. Co-operation requires agreement on many complicated and sensitive matters. Costs of the participation of the human resources and the availability of facilities (capital) weigh heavily on the decision making process. Expectations of a reasonable return on substantial investments will play a more decisive role as costs are more substantial. Co-operation starting with “data sharing” arrangements certainly can have the advantage of relatively small initial costs involved. Multiple use of (available or future) research data can mean a simpler start as it enables an incremental approach that lends itself to flexibility in participation and scaling of projects and programs.
6. Digital value increases by its use
Starting with the data could simplify co-operative arrangements because the value of the data in principle will only increase by making them available for multiple uses.
Data in principle are wear-proof and the more they are used by more researchers, the more results they will produce. After all the ultimate goal of the parties investing in the collection and storage of research data is to get as much knowledge (end product) as possible out of their investments in data resources. In the context of publicly financed science the investor does not have to worry even if total strangers are using ‘his’ data: the results will be publicly available. The more data value you spread around, the more knowledge value you will get in return.
7. Data, information and knowledge
To more than one listener/reader this may sound like some overgrown dotcom wisdom. The principle may be correct, but it will not come as a surprise that there can exist a certain discrepancy between the current research practice and the principles that will characterise the future international digital research environment. Financial barriers, somehow related to intellectual property rights (IPR) often are named as the culprits that obstruct the open access that seems the logical condition to the optimum exploitation of research data.
Some clarification of scope and concepts might help. In the research practise it is often hard to draw the line between “raw”, primary data, further structured information and the final knowledge of scientific findings. One man’s data are another man’s knowledge. And of course the output from one research project can be used as data input for another.
8. Data as non intellectual public property
Sticking to the far end of the continuum, “raw” data are to be taken as routinely, often automated collected scores representing the first round of putting scientific order in the natural universe being studied. There will be not much originality or creativity involved, the effort will be primarily directed at precision and reliability of samples being drawn from nature and society to be studied further. From this factual perspective research data do not qualify for protection as intellectual property under copyright or author’s rights legislation – once published, data are in the Public Domain and should be openly available for public use. Of course, except for legitimate restrictions like national security and privacy, these data are meant to be available for use in international co-operative research. Although the collection of raw data may be very expensive, the market value of research data usually will be rather limited. It will not come as a surprise that the bulk of research data can be considered a Public Good, publicly funded and used primarily in publicly funded research.
9. Access to publicly funded databases
As the primary data get processed and put in databases, the software added for storage and retrieval represents value protected under intellectual property law. In a growing number of cases a database producer can claim sui generis intellectual property rights to the database, even if the database content does not qualify for such protection. As in the case of publicly funded research data the database producer usually will be a publicly funded institute bound to legal obligations comparable to these of the US Freedom of Information Act, there should be no reason why the database should not be openly accessible to anyone interested. Surely the exploitation of scientific databases requires solid funding arrangements. Further value adding by private parties from industry, rightly protected under IPR, can make its own contribution to a vital research data market.
The costs involved in value adding and additional services should be passed on to the research budget of its users. But considering the premium of network effects, rigid recovery of the initial costs of data collection often will not be a big help to a sensible exploitation.
10. Openness as a condition to validation
Further along the trajectory of scientific research the data will be further analysed and modelled in the process of scientific research ‘proper’. Here the contribution of creativity and originality will be growing and will end up in the research findings that, within the framework of funding conditions and employment, can be attributed to individual scientists entitled to intellectual property rights relevant also to access and uses by other parties. However, the cornerstone of scientific validation consists of review by peers (not necessarily limited to those reviewing articles for scientific journals). Peer review requires the possibility of re-analysis of the data used so publication and public access to those data will be the normal condition.
11. Funding of open access
In many cases sharing of research data traditionally meant access without payment. Use of ICT has brought the cost of distribution of research data to about zero - another argument for free access in this way. But on the other hand the volume of data sharing in the past was underdeveloped and digitisation has brought a research environment that in many aspects is completely new. ICT facilitated collection, processing, dissemination and sustainable archiving of large research data sets requires large, increasing investments and someone has to pick up the tab for this. So optimum openness will not be absolutely free, but will need solid funding policies.
To realise fully the emerging potential of open access to digital research data for international scientific research, apart from funding questions, quite some other policy questions need to be answered.
Voorstudie OECD/CSTP Conferentie in Tokyo 2003
----
6. Towards international guidelines for access to research data from public funding Peter Schröder, in: Paul F. Uhlir and Julie M. Esanu (rapp.): Strategies for preservation and open access to scientific data in China, Summary of a workshop in Beijing, Washington, The National Academies Press, 2006.
http://cart.nap.edu/cart/deliver.cgi?record_id=11710&type=pdf_chapter
7. Possible Downsides to Data Sharing in our Research Conmmons, Peter Schröder (abstract) Large-scale data policies easily may have unplanned effects of ‘’homogeneity” on the available data supply. A narrowing of the scope of the data supply tailored to established research paradigms could limit the opportunities for unconventional, but also adventurous, new research directions with the risk of slowing down scientific progress. A systematic assessment of data portfolios not only on the aspects of quality, accessibility and sustainability, but diversity as well, could help to diminish this risk.
Pastoral reality
The idea of a Commons for scientific data and information should be a very realistic one. After all, scientists in many ways make up a real community already and chat with each other at their global village greens anyway. And then again, they do not have to be afraid of the overgrazing of the Commons pasture because they live on air, not thin air, but air made up of of wear-proof ideas. When ideas are your core business, you can afford to act idealistic.
Newton reminded us of the debt scientists owe to the virtual community of their predecessor giants worldwide. Robert K. Merton explained in detail how our scientific heritage has flowered as the result of cumulative, communal processes. In this processes sharing of data and information has been more or less standard practice.
So in their own self-sufficient way, Science Commons should be able exist in the midst of even a big bad outside world, uncorrupted by greedy capitalist exploitation.
Efficiency
Data sharing may have this anarcho-idealistic ring but will be in most cases also the most practical and efficient arrangement for the exploitation of data resources. Communal open access to research data in principle does not have much to fear from the customs and habits of a hostile, profit seeking business world - as long as taxpayers are prepared to foot the bill for an efficient management of resources.
Of course I am speaking of the main outline, the general principle. Scientists should know the vast differences between theoretical and empirical evidence/between the ideal world and everyday practice. Other speakers will explain the serious practical obstacles to efficient data sharing. Still others will highlight the threats posed by business organizations accompanied by armies of lawyers trying to hijack communal intellectual property out of the Public Domain.
The enemy within
I will not speak about the outside threats to the benefits of data sharing, but of the risks as a result from sensible communal data policies and data management from within. The risks originating in the community and the scientific process itself. At this moment these risks are of a rather academic, theoretical order and are dwarfed by the current practical problems. Still it is worth the trouble to look in a Common sense way into these inherent risks.
Openness and monopolies
First truism: The community that inhabits the Science Commons is made up of individual scientists that may have ideas and interest that may conflict with those of the community. Scientists are part of a community system, but at the same time ambitious individuals as well. They can act as a Common flock of opinionated humans.
As individuals they are after recognition of their important contributions to the Progress of Science and eventually the Nobel Prize. So the scientific process may have alternating phases of communalism and competition, of open sharing and of monopolies of data, information and knowledge. It is good to realize that not only greedy capitalist businessmen but also scientists can be keen at information monopolies. And this goes for individuals, groups as well as organizations.
Homogenization of thought
Aspects of the inherent tension between communal effort and individual credits are exemplified in the concept of the Matthew Effect, a concept we can safely attribute to the abovementioned Robert K. Merton (for SCI purposes not to be confused with the other Robert Mertons). We could look at the Matthew Effect in terms of personal glory, but should also remember that personal names are very useful, if not indispensable, as frames of reference that put order into complex information systems as science. Not only a Google search works very good on personal names.
At this place the interesting thing about the Matthew Effect is not the possible unfair credit given to only one individual but its reference to the large company of nameless others that practice their research under the same scientific paradigm, to use the concept of Thomas S. Kuhn. If we look at the Big Names of the scientific Giants as labels of the names of scientific schools, the Matthew Effect refers to processes of homogenization in scientific thinking we often overlook.
Paradigmatic uniformity
We should realize that today a powerful body of assumptions shared by a majority of the community will have more impact on the direction of scientific developments than the inspiration and creativity of individual geniuses.
It is the balancing act between individual and social influence again. To simplify things: the reigning scientific paradigms pervade the whole science system. They are the air the community breathes. That much for the conceptual side of it. But there is also the socio-organizational side. Researchers, reviewers, research managers, research policy makers, publishers: they all tend to dance to more or less the same favorite tunes. And in the end there is the economic side: it will not always be easy to get the right stamps of approval for grant applications that drift too far from the successful main roads.
Blind organizational processes
It will be quite a challenge to imagine decision making in research policies and research management that will not favor established scientific customs and traditions. Not only Adam Smith’s invisible hand, but also Henry Ford’s car paint color options are at work. An efficient organized science system tends to promote a homogeneous output.
At the same time we know that in the end scientific progress is impossible without revolutionary paradigm shifts brought about by deviant ideas of outsiders. Science cannot work without controversial ideas and opinions. The way the science system operates tends to limit the indispensable diversity of the research field. Large scale sharing of research data can easily enhance this tendency.
Data as an autonomous force
The most obvious advantages of improved data access and data sharing will be an increase in quality and productivity of research. But decision making on large scale investments in data collection and management can also put further limits on the diversity of research resources. Research data have been undistinguished parts of the research pathway for most of the history of science. In a pre-industrial environment data were considered to constitute an inextricably part of (specific) research trajectories, usually useless in another context. Since then research has moved continuously into into organizations characterized by division of labor, increasing scales and volumes and digitization along more industrial lines. Large scale collection of digital data made it possible to use datasets for more different purposes of more different researchers at different times and places. In this context data are emerging as a separate autonomous entity, more and more accommodated in separate specialized (divisions of) organizations.
Safe consensus
Generally speaking, data collection, processing, management, dissemination and archiving are increasingly becoming a routine business of specialized research supporting entities. Data policies and data management have become more important to get scientific results and at the same time the production of databases has become less eligible for scientific and/or proprietary exclusivity.
Limits to the research budgets combined with the broad consensus required by more complex processes of decision making from large constituencies will easily result in predictable safe outcomes of concerning data supply. Chances are that this will favor predominantly ‘Common denominator’ specified data supply - and in the end to a loss of diversity in the available data sources. When your data proposal differs from the consensus of the current orthodoxy it will be hard to get the right data for your research.
Protecting diversity
If not counteracted by mechanisms that increase the opportunities for data diversity, large scale data collection will easily promote large scale content monopolies in the data supply. Without procedural interventions, efficient large scale data management will reinforce the position of the ’Normal’, Middle Of the Road type of research. It could easily diminish the opportunities for deviant research pathways and on the long run will slow down scientific progress.
Public Domain criteria
In The Netherlands the government varies the responsibilities for the Public Domain in Education, Culture and Science. The actual governance of Educational, Cultural and scientific affairs is the responsibility of autonomous parties. The government guarantees a minimum supply of it and supports this with a generous amount of public funding. The minimum level funded by the government is measured against the criteria of Quality (assessed by the professional forum), Accessibility (within reach of every citizen), Sustainability (dependable, durable supply) and last but not least: Diversity (offering citizens alternative choices).
These four criteria nicely fit the Public Domain in general and especially the Public Domain of scientific information. Consequently they characterize important qualities of Creative Commons, the Science Commons and the emerging Research Data Commons. When looking for ways to counteract possible downsides of data sharing these criteria should be kept in mind.
More than quality
I mentioned the role of specialized data organizations, autonomous data agencies or data divisions of larger research institutes that is growing in importance. These specialized data organizations may be in the right position to turn the liability of increasing homogeneity into the asset of systematic policies to guarantee a decent level of diversity in the data supply. At the moment these organizations may have their hands full of other urgent problems but one cannot start early enough to take care of future diversity.
In the current priority setting processes, data policies are predominantly assessed on the criterion of scientific Quality of the output. Most researchers will agree on the importance of the quality of data and consensus on the assessment of quality will not be that hard to reach. Assessing data policies against the criterion of Accessibility will not be that controversial either. The assessment of data policies against the requirements of Sustainability will not always be easy as appreciating the value of this will require a long term view that often seems to harm direct benefits.
Creating a balanced Agenda for Research Data
Assessment that systematically meets the criterion of Diversity could pose paradoxical demands on reviewers, but reality probably will turn out easier. Evaluating proposals for data collection for purposes that in everyday research practice one would consider meaningless, or worse: heresy or quackery, is not everybody’s job. Although even the most deviant cases could make intriguing intellectual exercises.
The main point however will be that the competent review boards will not judge Diversity on the basis of individual applications, but on the basis of coherent data programs that cover the demand of larger aggregates in and between disciplines for longer periods of time. Such integrated data programs would make it possible to give minority demand a place in balanced data supply based on an adequate overview of current research and expectations for the future. Supported by sensible, concise protocols, the review on this criterion could really be an important contribution to better access and sharing of research data.
Science Commons, co-operating with the National Academies and national funding agencies could make a start with the development a Research Data Agenda: an Agenda to come to grips with an adequate demand and supply of research data that meet the criteria not only of Quality, Accessibility and Sustainability, but also of Diversity, last but not least.
*) Inleiding gehouden op de Commons of Science Conference, Washington 3 & 4 October 2006, ook verschenen in Data Science Journal, Volume 6, Open Data Issue, 17 June 2007 als POSSIBLE DOWNSIDES TO DATA SHARING IN THE RESEARCH COMMONS: ASSETS AND LIABILITIES, OPPORTUNITIES AND RISKS
http://www.jstage.jst.go.jp/article/dsj/6/0/OD67/_pdf
---
8. OPEN DATA FOR GLOBAL SCIENCE
Paul F. Uhlir and Peter Schröder
Data Science Journal, Volume 6, Open Data Issue, 17 June 2007
Zie: http://www.jstage.jst.go.jp/article/dsj/6/0/OD36/_pdf
Also in : Brian Fitzgerald (ed.) Legal Framework for e-Research: Realising the potential, Sydney University Press, Sydney 2008
http://eprints.qut.edu.au/14439/1/14439.pdf
----