Alaryhmän jäsenet

Reeta, Samu, Veera

Päämäärä

Kuvata metadatasuositukseen DSpacen embargo-kenttien toiminta.

Ongelmia

Samun kuvaus (JULKUn kokous 12.3.24)

DSpacessa ensimmäisessä embargo-toteutuksessa on ollut (oletusasetuksilla, joita Kansalliskirjasto on käyttänyt) tieto embargosta kentissä dc.embargo.terms- ja dc.embargo.lift-kentissä, joista jälkimmäinen poistuu siinä vaiheessa, kun embargo laukeaa. Molemmissa kentissä on ollut sama päivän tarkkuudella annettu ISO 8601 arvo. Tämä metadatan avulla asetettu embargo on toiminut vanhoissa versioissa vain syöttövaiheessa. Uudemmissa DSpace-versioissa mutkikkuutta on lisännyt se, että embargo on voitu asettaa myös suoraan tiedostotasolla, ilman metadatakentän kautta ohjailua. Lisäksi Kansalliskirjastolla on ollut käytössä pikaembargo parilla asiakkaalla, jossa embargoa ohjaava kenttä on ollut asiakkaan_nimiavaruus.embargo.date.

Kuvausluonnostelma

dc.embargo.terms

Embargon määrittämisessä käytetty kenttä, joka on Kansalliskirjaston julkaisuarkistoissa käytössä DSpace-alustan versioon 5 asti. Vaikka 5-versiossa voi määritellä embargon vaihtoehtoisesti tiedostojen policyitä muokkaamalla, asiakkaiden tulee siinäkin tapauksessa lisätä tieto embargosta tähän kenttään metadatan yhdenmukaisuuden vuoksi.  DSpace luo kentän automaattisesti tiedoston tallennushetkellä (ISO-8601-formaatissa), jos embargo on syötetty syöttölomakkeen avulla. Kentän arvo on embargon laukeamispäivä. Embargo on tietuekohtainen eli koskee kaikkia tiedostoja.

dc.embargo.lift

Embargon määrittämisessä käytetty kenttä, joka on käytössä DSpace-alustan versiossa 5. DSpace luo kentän automaattisesti tiedoston tallennushetkellä, jos tietue on syötetty syöttölomakkeen avulla. Rest-rajapinnan kautta aineistoa syötettäessä asiakkaita on pyydetty lisäämään myös tämä kenttä. Kentän arvo on embargon laukeamispäivä (ISO-8601-formaatissa). Kenttä poistuu siinä vaiheessa, kun embargo laukeaa ja aineisto on vapaasti saatavissa. Embargo on tietuekohtainen eli koskee kaikkia tiedostoja. Huom! Jos embargoa hallitaan policyjen avulla, embargo on saattanut laueta, vaikka dc.embargo.lift-kenttä on yhä olemassa.

[asiakkaan nimiavaruus].embargo.date

Embargon määrittämisessä käytetty kenttä, joka on käytössä Kansalliskirjaston toteuttamissa julkaisuarkistoissa DSpace-alustan versiossa 5.  Vaihtoehto dc.embargo.terms- ja dc.embargo.lift-kentille. Tämä on Kansalliskirjaston toteuttama kenttä minuutin tarkkuudella laukeavan embargon mahdollistamiseksi (ns. pikaembargo). Vaihtoehto dc.embargo.terms- ja dc.embargo.lift-kentille, molempia ei esiinny samanaikaisesti. Kentän arvo on embargon laukeamishetki minuutin tarkkuudella (ISO-8601-formaatissa). Tämä Kansalliskirjaston toteutus on vaatinut erillisen sopimuksen ja sen toimintatapa on hyvin erilainen kuin Dspacen muut embargo-toteutukset.

Kokous to 16.5. klo 13-14

Paikalla: Veera, Samu, Reeta

Asialista


  1. Kuvausluonnostelmien viimeistely (yllä)
    1. Embargo tulee muuttumaan versiossa 7 ja etenkin versiossa 8. Keskitytään nyt nykytilan kuvaamiseen.
    2. Suositukseen 'disclaimer', että tämä tulee muuttumaan. ← JULKU-ryhmän ideointia kaivataan
  2. Samun uusi versio, vielä viimeistelemätön (sisältää tietoa tulevista versioista):

    1. DSpacessa on ollut teknisistä syistä embargo-merkintä kentässä dc.embargo.terms- ja dc.embargo.lift-kentissä, joista jälkimmäinen poistuu siinä vaiheessa, kun embargo laukeaa. Metadatan avulla asetettua embargoa voi ohjata vain syöttövaiheessa. Eli syöttövaiheessa dc.embargo.terms-kenttään annettu arvo asetuu tiedostoille embargon laukeamisajakohdaksi tiedostojen policyihin siinä kohtaa, kun tiedosto syötetään ensimmäisen kerran. Tämän jälkeen jo julkaistun tietueen dc.embargo.terms-kentän muokkaaminen ei enää vaikuta Dspacen asettamaan embargo-aikaa tiedostoille. Ainoa tapa muuttaa julkaistun tietueen embargoa on muokata tietueen tiedostojen policyja joko käyttöliittymän, tai Rest-rajapinnan kautta. Tällöin on vaarana se, että embargon muokkaamisessa jää dc.embargo.terms-metadatan arvo päivittämättä vastaavasti.

      Oma ongelmakenttänsä on useamman tiedoston tietueet, jossa esim. yhdellä tiedostolla on embargo. Koska dc-kentät ovat yhteisiä kaikille tietueessa oleville tiedostoille, ei ole ollut merkintätapaa sille, mitä tiedostoa / tiedostoja embargo koskee.

      Uudemmissa DSpace-versioissa embargo on voitu asettaa myös suoraan tiedostotasolla, ilman siis, että metadatassa olisi tietoa embargosta. Lisäksi Kansalliskirjastolla on ollut käytössä pikaembargo parilla asiakkaalla, jossa embargoa ohjaava kenttä on ollut asiakkaan_nimiavaruus.embargo.date.

      Dspace 8:ssa on mahdollista saada OAI-rajapintaan tieto embargosta, mutta tämän toteutus ei ole vielä tarkemmin tiedossa.

  3. On määriteltävä kenttä, jota käytetään jatkossa (DSpace-versio 8) embargon merkitsemiseksi. Kenttä on aluksi tietuetasoinen.
    1. Veera tekee Finnalle JIRAn aiheesta, yhteistyötä Samu - Finnan tekninen
    2. HELDAssa on käytössä dc.date.embargoedUntil
      1. Heldasta todettu 5/2023 eli juuri ennen DSPace 7:ään siirtymistä:
        • "Tein Heldaa varten qdc_finna -siirtoformaattiin seuraavat muutokset:
          • Embargon päättymispäivä haetaan metadatakentästä dc.date.embargoedUntil kentän dc.embargo.lift sijaan.
          • Tiedostojen latauslinkeissä olleet localhostiin viittaavat hostnamet on korvattu testi-Heldan oikealla hostnamella. Tämä johtuu siitä, miten testi-Helda on konfiguroitu, jotta sen backendiä voisi käyttää helposti lokaalejen kehitysympäristöjen frontendistä.
          • Tieto julkaisun embargosta ei välity tässä siirtoformaatissa, jos julkaisulla ei ole tiedostoja. Tämä vaikuttaa E-thesiksestä ja Tuhatista siirrettyihin embargollisiin tietueisiin, koska niissä tiedosto siirretään Heldaan vasta embargon päätyttyä. Tämä ongelma on myös nykyisessä tuotanto-Heldassa."