Information for libraries

  • na webu

Nacházíte se zde: Úvod Pro přispívající knihovny Jak přispívat do SK ČR Dodávání dat Konvence pro pojmenování souborů

Konvence pro pojmenování souborů

Od 1.1.2017 přijímá SK ČR pouze záznamy v kódování UTF-8.

Soubory záznamů pro souborný katalog musí striktně dodržovat konvenci v pojmenování, jinak nemohou být přijaty. Pojmenování souboru neodpovídající použitému kódování diakritiky nebo datovému formátu by sice již nyní měly odchytit  kontrolní programy, ale i nezpracovaný soubor znamená pro dodavatele i správce zbytečnou práci navíc.  Není žádoucí provádět konverzi kódování na straně dodavatele - záznamy zasílejte v originálním kódování.

Když  knihovna (většinou se změnou systému) změní kódování nebo formát, před zasláním první dávky "po novu" by měla tuto změnu správci nahlásit a poslat vzorek.

Jméno souboru pro standardní import plnohodnotných záznamů musí mít strukturu aaa000kk.ddd_xxx.
Pro jiné situace (viz dále) následuje za podtržítkem upřesnění: _z/_o/_d/_r?.
Použít lze pouze malá písmena, číslice a podtržítka.

  • prvních 6 znaků (aaa000) = sigla instituce - malými písmeny
  • znaky 7 a 8 před extenzí (kk) = použitá znaková sadu (kódování diakritiky)

  • uc Unicode UTF-8

     

    Pro záznamy v UTF-8 plati určitá omezení - některé znaky UTF-8 nejsou povolené:

    - kontrolní znaky (U+007F - U+009F)

    - "pevná" mezera (U+00A0)

    - kombinující diakritická znaménka (U+0300 - U+036F) - povolené jsou pouze kombinované znaky (tj. písmeno s diakritikou jako jeden znak), např. písmeno "è" pouze jako znak U+00E8, ne jako kombinace znaků U+0065 a U+0300 (čárka nad vlevo)

    -  všeobecná interpunkční znaménka (U+2000 - U+206F)

    Celý seznam nepovolených znaků najdete zde

    Ukázku nežádoucího stavu najdete zde

     

     

    • první tři znaky extenze (ddd) = formát dat, datová struktura
    mal MARC21 - exportní soubor Aleph500
    mis
    MARC21 - ISO 2709
    mar MARC21 řádkový*
    uis UNIMARC - ISO 2709
    rum UNIMARC řádkový*

     

    • Další znaky extenze za podtržítkem se liší podle toho, zda jde o zaslání nových standardních záznamů, retrokonverzi nebo opakované zaslání záznamů k opravě.

      (xxx je zde použito jako zástupný znak pro vlastní pojmenování konkrétního souboru, r[1-9] znamená, že za písmenem r následuje číslo vyjadřující váhu)

    _xxx nové záznamy standardní kvality
    běžný přírůstek,
    záznamy odpovídající přidělené váze
    _xxx_r[1-9] nové záznamy horší kvality
    retrokonverze či zběžná rekatalogizace = záznamy, které mají dostat nižší váhu
    (lze posílat po dohodě se správcem po analýze záznamů a přidělení váhy)
    _xxx_z již dříve přijaté záznamy k opravě
    celého záznamu
    záznamy, které již byly do SKC přijaty dříve, ale dodavatel má zájem na jejich výměně za kvalitnější (budou mít nyní vyšší váhu)
    _xxx_o již dříve přijaté záznamy k opravě údajů v poli 910
    záznamy, kde od původního přijetí záznamu do SKC došlo ke změnám v poli 910, takže je třeba tyto údaje aktualizovat
    (též odpisy)

     

    Vlastní pojmenování souboru (xxx) by mělo být krátké, ale výstižné (např. datum RRMMDD, RRMM, MMDD, zkratka+poř.č. ap.). Může v případě nutnosti obsahovat uvnitř další podtržítko, ale za ním nesmí následovat pouze jediný znak (zejména ne z,o,d, které odlišují opravované záznamy, a také ne p,m,i,x, které systém používá k odlišování pomocných souborů v průběhu zpracování) a kombinace r+jednomístná číslice (používá se pro retrokonverzi).

     

    Příklady pojmenování souborů:

    boa001uc.mal_0611p
    nebo
    boa001uc.mal_0611_per
    sigla BOA001
    utf-8, MARC21- Aleph500
    záznamy periodik/seriálů za listopad 2006
    (knihovna zvolila posílání periodik v samostatném souboru; pozor, za podtržítkem nesmí následovat samostatné "p")
    aba001uc.mal_vrc_15
    sigla ABA001
    utf-8, MARC21- Aleph500
    standardní záznamy, česká produkce po věcné revizi, poř.č. souboru 15
    ola001uc.mal_0609_z
    sigla OLA001
    utf-8, MARC21- Aleph500
    opravené záznamy za září 2006

     

    *Ukázka řádkového MARC formátu (příklad Unimarc, neúplný záznam):

    LAB    -----nam 22----- i 450
    001    kpw61206
    005    20061002151243.0
    100    $a20040806d2003       0czey0103 ba
    200 1  $aNejvýznamnějsí postavy v historii světa$f[překlad Tadeusz W. Schmidt]
    010    $a80-7237-925-9$b(váz.)
    702  1 $aSchmidt$bTadeus W.
    210    $aPraha$cSvojtka & Co.$d2003
    215    $a48 s.

    Upozornění: oddělovačem řádků (každého pole) musí být znak "LF" nebo "CR/LF" (nikoli pouze "CR"). Prostor pro nepoužité indikátory musí být vyplněn mezerami.

     

    Dotazy:

    Eva Svobodová
    Radovan Záhořík

    18.04.2017
    Hledej
    Multivyhledávač
    Klíčové slovo
    Název
    Autor
    « listopad 2017 »
    listopad
    PoÚtStČtSoNe
    12345
    6789101112
    13141516171819
    20212223242526
    27282930
    Anketa

    Co z níže uvedeného využíváte v záznamech v SK ČR nejčastěji?

    zobrazení na mapě
    propojení do katalogu knihovny
    citace
    obálky a obsahy
    plné texty
    spinner
    Total Votes: 54