Git Product home page Git Product logo

datagov-cz / otevrene-formalni-normy Goto Github PK

View Code? Open in Web Editor NEW
17.0 9.0 13.0 13.51 MB

V tomto repozitáři jsou otevřené formální normy pro otevřená data v ČR a sbíráme zde na ně další požadavky. Tento repozitář je udržován v rámci projektu OPZ č. CZ.03.4.74/0.0/0.0/15_025/0013983.

Home Page: https://ofn.gov.cz

HTML 94.10% CSS 0.66% JavaScript 1.14% XSLT 2.89% Shell 0.22% Bikeshed 1.00%
opendata standards czech czech-republic json-ld-11 csv xml xsd-schema json-schema turtle

otevrene-formalni-normy's Introduction

Otevřené formální normy

V tomto repozitáři pracujeme na otevřených formálních normách pro otevřená data v ČR a sbíráme na ně požadavky. Prohlédněte si jejich aktuální seznam. Pokud máte dotaz či návrh na změnu, nebo návrh nové OFN, založte issue.

Tento repozitář je udržován v rámci projektu OPZ č. CZ.03.4.74/0.0/0.0/15_025/0013983. Evropská unie - Evropský sociální fond - Operační program Zaměstnanost

otevrene-formalni-normy's People

Contributors

charta77 avatar dvoriik avatar gitter-badger avatar jakubklimek avatar jirkamarekbrno avatar martinnec avatar martinvita avatar michal-josef-spacek avatar michalmed avatar michalskop avatar prixladi avatar psiotwo avatar spalrobert avatar tmeinlschmidt avatar trusinas avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

otevrene-formalni-normy's Issues

Prostorová data: Bod a Multipoint

Sekce 2.2.1 Bod obsahuje i komentář k Multipoint. Buďto je třeba sekci rozpadnout na 2, nebo ji pojmenovat Bod a Multipoint (Vícebod se asi neřiká co :)) a uvést příklad multipointu.

Adresy - přidat kontextové příklady

Příklady v OFN Adresy jsou vytržené z kontextu - je to jen samotná adresa. To je dobré pro získání přehledu o tom, co za položky adresa má. Takhle se ale typicky v datech nevyskytuje. Je tedy třeba uvést příklady toho, jak to vypadá, když se vyskytuje v kontextu jiných dat (lze vypůjčit data z úředních desek, nebo vymyslet jiný kontext).

Faktury: Ujasnit, k čemu se vztahuje měna

U položky měna není jasné, k čemu se vztahuje. Některé položky jsou totiž bez měny, některé v CZK. Může tedy být měn více? Neměla by mít každá položka částky svoji měnu?

Faktura:

  • částka_bez_dph, částka_s_dph, částka_uhrazená - v popisku mají v Kč.
  • sleva_bez_dph nemá měnu uvedenu

Položka:

  • částka_bez_dph_czk_jednotka, sazba_dph - v CZK
  • částka_bez_dph_czk_celkem, sleva_bez_dph_celkem - měna neuvedena

Úřední desky: date vs. dateTime

Jedná se o položky:
zveřejněno, sejmuto, vytvořeno
kde jsem navrhoval string proto, aby bylo možné zaznamenat různé situace:

  • někdo má k dispozici jen datum (ruční publikace na úřední desce)
  • někdo má k dispozici datum i čas (a to ještě může být různě přesně)

Pokud by tam měl být jiný datový typ, tak jsem pro date, protože např. u zveřejnění někdy v průběhu dne 25.6.2018 uvádět třeba 2018-06-25T00:00:00 nebo 2018-06-25T23:59:59 by bylo vymýšlení si dat. Akorát se tím ale naopak ztratí kus informace u těch, kteří ten čas k dispozici mají.

Tady prostě chybí datový typ iso 8601 ( https://en.wikipedia.org/wiki/ISO_8601 ), protože šedé jsou datové typy a zelený strom iso 8601

v XSD to lze řešit pomocí:

<xs:simpleType name="dateOrDateTime">
    <xs:union memberTypes="xs:date xs:dateTime" />
</xs:simpleType>

ale v JSON schema to neni

Prostorová data: SRS v příkladech

Příklad GML v sekci 2.2.2 a příklad GML v sekci 2.2.3 mají nekonzistentně uveden SRS, jednou jako

<gml:Curve srsName="urn:ogc:def:crs:EPSG::5514" srsDimension="2">

a jednou jako

<gml:Polygon gml:id="CPX.2384051101" srsName="EPSG:4326" srsDimension="2">

Toto je potřeba buď sjednotit, nebo do specifikace napsat, že oba zápisy jsou možné.

Položky rozpočtu - jen u vybraných organizací

Zjistil jsem, že některé naše podřízené organizace neúčtují položky rozpočtu, cituji:

Jsme jiný typ organizace než je ministerstvo, jsme příspěvková organizace a naše účetnictví je vedeno v odlišné struktuře v souladu s vyhláškou 410/2009 Sb. Naše náklady a výnosy jsou vedeny na základě směrné účtové osnovy dle přílohy 7 této vyhlášky.

Takže od příspěvkových organizací bychom mohli dostávat členění dle směrné účetní osnovy. Toto bude potřeba asi zanést do specifikace standardu faktur.

Úřední desky: Upravit geoinformaci dle standardů

V aktuální verzi je u subjektů oznámení geosložka. Ta je nyní namodelována přesně podle špatné praxe na našem webu. Mělo by to být v souladu se otevřenou formální normou (OFN) pro geodata od @MichalMed. Zřejmě to bude znamenat toto:

Prostorová data: Linky uvnitř dokumentu

Na více místech dokumentu jsou zmíněny pojmy vysvětlené v jiné části dokumentu. U nich by čtenář očekával link na místo, kde je pojem definován. Ten tam ale často není, je nutno přidat.

Příklad: WGS84, JSON, GML:
image

Úřední desky: Modelování

V úředních deskách je stále několik nejasností na konceptuální úrovni. Zkusil jsem si to namodelovat a ten diagram vychází trochu jinak

  1. Specifikace hovoří o oznámení na úřední desce, ale aktuálně tam ta úřední deska vůbec není reprezetována. Přidal jsem ji. Měla by ale mít své URL, ne?
  2. Provozovatel je provozovatelem té úřední desky, nikoliv toho oznámení.
  3. Oznámení patří na úřední desku.
  4. Organizací je dle doku myšlen provozovatel. Tedy je to třída Organizace, ale v rolích provozovatel (úřední desky), autor a subjekt oznámení. Čili položka v datech by se pak neměla jmenovat organizace, ale provozovatel, ne?
  5. Agenda je samostatný objekt, která má mít svůj název.
  6. Je třeba ještě pořešit ty kardinality. Úřední deska má jednoho provozovatele, může mít provozovatel více desek?
  7. Oznámení má jednoho autora nebo více?
  8. Organizace má jednu adresu nebo více?
  9. Subjekt má jedno umístění nebo více?
  10. Umístění subjektu je jeho sídlo, provozovna, nebo místo práce...?

Moje schéma je spíše podklad k diskuzi:

uredni deska - jakl

Úprava standardu pro publikaci faktur

Navrhuji upravit standard formátu daňových dokladů ze stránky https://opendata.gov.cz/datova-sada:faktury , a to tak, že:

  1. Export bude rozdělen do dvou souborů
    a) CSV soubor s informacemi o faktuře (dodavatel, odběratel, datumy, apod.)
    b) CSV soubor s položkami faktur

  2. Upravit názvy pojmenování mezi "příjemce" a "plátce" tak, aby bylo zřejmé, která strana je která.
    Ideální by bylo využít slov "dodavatel" a "plátce", jelikož příjemce může být interpretován jako příjemce faktury/služby. Trochu jsem se nad tím pozastavoval. Nízká priorita.

  3. Ke kapitolám rozpočtu přidat nějaký odkaz, který by vysvětlil, co to kapitola rozpočtu je a kde jsou definované. Jako neznalec státní správy jsem to ze začátku nevěděl, že to vychází ze zákona nebo vyhlášky. Trochu by to usnadnilo orientaci nově příchozím.

Cílem prvního navrhovaného bodu je umožnit export položky rozpočtu k jednotlivým řádkům faktur, protože na jedné faktuře se mohou objevit položky s rozdílnými položkami rozpočtu.
Úprava nám pomůže v kategorizaci výdajů.

nejasnost v READ.ME

"Jejich seznam je ve vzorových publikačních plánech." Očekával bych odkaz na "seznam" připravovaných formálních norem, nikoliv na pojem "publikační plán". Je-li obsažen unitř některého z plánů, bude prakticky nedohledatelný.

Faktury: konzistence s DPH a bez DPH

Položky s DPH a bez DPH jsou nekonzistentní. Někde je obojí, někde jen jedno, je třeba zkontrolovat a vysvětlit kde je co a proč.

Faktura:

  • částka_bez_dph, částka_s_dph
  • částka_uhrazená - čili s DPH?
  • částka_bez_dph_czk - a s dph tedy v kč není
  • sleva_bez_dph - a není s dph

Položka:

  • částka_bez_dph_czk_jednotka a chybí s DPH
  • částka_bez_dph_czk_celkem a chybí s DPH
  • sleva_bez_dph_celkem a chybí s DPH

Struktura adresy

Je třeba vytvořit standard pro reprezentaci adresy. V Úředních deskách byl popsán 3x, pro organizaci, autora a subjekt. Mělo by stačit adresu popsat samostatným dokumentem, a v Úředních deskách na příkladu popsat, jak se struktura zanořuje, pro JSON, XML i CSV.

RPP: Chybné odkazy (reportovány Respecem)

Viz https://data.gov.cz/otevřené-formální-normy/registr-práv-a-povinností/převod-úkonů-v-rámci-působnosti/draft/

Found linkless <a> element with text "CHYBA: I/O error reported by XML parser processing https://xn--slovnk-7va.gov.cz/sparql?default-graph-uri=https%3A%2F%2Fslovn%C3%ADk.gov.cz%2Fisvs&query=define%20sql%3Adescribe-mode%20%22CBD%22%20%20DESCRIBE%20%3CCHYBA%3A%20An%20empty%20sequence%20is%20not%20allowed%20as%20the%20first%20argument%20of%20gen%3AgenerujHodnotuVlastnostiPrvkuSIRIVS%C3%A9mantick%C3%A9mSlovn%C3%ADkuPojm%C5%AF%28%29%20V%20s%C3%A9mantick%C3%A9m%20slovn%C3%ADku%20pojm%C5%AF%20odpov%C3%ADd%C3%A1%20prvek%20typu%20%2C%20jeho%C5%BE%20definici%20se%20nepoda%C5%99ilo%20na%C4%8D%C3%ADst.%3E&output=application%2Frdf%2Bxml: Server returned HTTP response code: 400 for URL: https://xn--slovnk-7va.gov.cz/sparql?default-graph-uri=https%3A%2F%2Fslovn%C3%ADk.gov.cz%2Fisvs&query=define%20sql%3Adescribe-mode%20%22CBD%22%20%20DESCRIBE%20%3CCHYBA%3A%20An%20empty%20sequence%20is%20not%20allowed%20as%20the%20first%20argument%20of%20gen%3AgenerujHodnotuVlastnostiPrvkuSIRIVS%C3%A9mantick%C3%A9mSlovn%C3%ADkuPojm%C5%AF%28%29%20V%20s%C3%A9mantick%C3%A9m%20slovn%C3%ADku%20pojm%C5%AF%20odpov%C3%ADd%C3%A1%20prvek%20typu%20%2C%20jeho%C5%BE%20definici%20se%20nepoda%C5%99ilo%20na%C4%8D%C3%ADst.%3E&output=application%2Frdf%2Bxml(Server returned HTTP response code: 400 for URL: https://xn--slovnk-7va.gov.cz/sparql?default-graph-uri=https%3A%2F%2Fslovn%C3%ADk.gov.cz%2Fisvs&query=define%20sql%3Adescribe-mode%20%22CBD%22%20%20DESCRIBE%20%3CCHYBA%3A%20An%20empty%20sequence%20is%20not%20allowed%20as%20the%20first%20argument%20of%20gen%3AgenerujHodnotuVlastnostiPrvkuSIRIVS%C3%A9mantick%C3%A9mSlovn%C3%ADkuPojm%C5%AF%28%29%20V%20s%C3%A9mantick%C3%A9m%20slovn%C3%ADku%20pojm%C5%AF%20odpov%C3%ADd%C3%A1%20prvek%20typu%20%2C%20jeho%C5%BE%20definici%20se%20nepoda%C5%99ilo%20na%C4%8D%C3%ADst.%3E&output=application%2Frdf%2Bxml) V sémantickém slovníku pojmů odpovídá prvek typu CHYBA: An empty sequence is not allowed as the first argument of gen:generujHodnotuVlastnostiPrvkuSIRIVSémantickémSlovníkuPojmů() V sémantickém slovníku pojmů odpovídá prvek typu , jehož definici se nepodařilo načíst., jehož definici se nepodařilo načíst." but no matching <dfn>.
Found linkless <a> element with text "CHYBA: Document has been marked not available: https://xn--slovnk-7va.gov.cz/sparql?default-graph-uri=https%3A%2F%2Fslovn%C3%ADk.gov.cz%2Fisvs&query=define%20sql%3Adescribe-mode%20%22CBD%22%20%20DESCRIBE%20%3CCHYBA%3A%20An%20empty%20sequence%20is%20not%20allowed%20as%20the%20first%20argument%20of%20gen%3AgenerujHodnotuVlastnostiPrvkuSIRIVS%C3%A9mantick%C3%A9mSlovn%C3%ADkuPojm%C5%AF%28%29%20V%20s%C3%A9mantick%C3%A9m%20slovn%C3%ADku%20pojm%C5%AF%20odpov%C3%ADd%C3%A1%20prvek%20typu%20%2C%20jeho%C5%BE%20definici%20se%20nepoda%C5%99ilo%20na%C4%8D%C3%ADst.%3E&output=application%2Frdf%2Bxml V sémantickém slovníku pojmů odpovídá prvek typu CHYBA: An empty sequence is not allowed as the first argument of gen:generujHodnotuVlastnostiPrvkuSIRIVSémantickémSlovníkuPojmů() V sémantickém slovníku pojmů odpovídá prvek typu , jehož definici se nepodařilo načíst., jehož definici se nepodařilo načíst." but no matching <dfn>.

Prostorová data: ESRI Shapefile

Sekce 4.5: ESRI Shapefile.
Není uveden příklad. Je to proto, že je tento formát binární? Pak by to mělo být ve specifikaci uvedeno.

Je uvedeno, že uchovává informace ve více souborech. Hodila by se přesnější specifikace, pokud souborů není neomezeně. Pokud ano, pak aspoň typově - co je to za soubory, jak je to děleno, musí něco splňovat? Adresářovou strukturu? Pojmenování?

Prostorová data: 6.2 - restrukturovat

Sekce 6 má špatnou strukturu. 6.1 a 6.2 jsou definice služeb WFS a WCS a pak následují 3 odstavce až do sekce 7, které spadají (ale spadat nemají) do sekce 6.2. Sekci 6 je tedy třeba přestrukturovat.

K definicím služeb WFS a WCS je třeba přidat příklady běžících služeb v ČR.

Úřední desky: Úvod

V porovnání s jinými specifikacemi, jako např. DCAT, chybí v Úředních deskách úvodní text - co to je, kde se to používá, pro koho je to určeno, atd. Je třeba ho přidat.

Prostorová data: Přidat příklady souřadnicových systémů

V sekci 3 jsou jednotlivé souřadnicové systémy. Bylo by dobré je ilustrovat - například zvolit nějaký jeden bod, a uvést jeho souřadnice v různých systémech, ve WKT i GML, ideálně doplněné o odkazy do nějakých webových zobrazovátek, které je umí, pokud existují.

Zvážit zda do Abstraktu psát info o generování

Zvážit, zda v abstraktu říkat, že je dokument generován (Tento dokument je strojově generován ze schématu JSON-LD reprezentace a z dokumentace prvků v sémantickém slovníku pojmů veřejné správy ČR.). Info je to zajímavé spíše koncepčně, než pro čtenáře dokumentu.

Prostorová data: Metadata a (Geo)DCAT-AP

Tohle je trochu dlouhodobější problém, ale když se v sekci 7 mluví o metadatech, je třeba také popsat, jak lze otevřená geodata dostat do NKOD. Z krátkodobého hlediska by tam mělo být že je třeba je popsat DCAT-AP v1.1 (ještě nemáme odkaz na specifikaci API, ale bude). Dále je třeba na zvolených českých typových geodatech ověřit a popsat cestu do NKOD přes GeoDCAT-AP.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.