etalab / guides.etalab.gouv.fr Goto Github PK

View Code? Open in Web Editor NEW

22.0 22.0 38.0 31.07 MB

Les guides d'Etalab : bonnes pratiques relatives aux données, algorithmes et codes sources

Home Page: https://guides.etalab.gouv.fr

License: Other

JavaScript 62.58% Vue 26.23% Stylus 11.19%

best-practices datagouvfr documentation government

guides.etalab.gouv.fr's Introduction

📚 Les guides d'Etalab 📚

Guides d'Etalab

Ce dépôt contient plusieurs guides rédigés par Etalab ainsi que le code utilisé pour fournir un site web présentant ces guides.

Ajouter un guide

Pour ajouter un guide, il suffit d'ajouter un répertoire à la racine du dépôt. Ce répertoire doit contenir un fichier README.md. Le titre de ce fichier définit le titre du guide.

Pour ajouter des chapitres au guide, il suffit d'ajouter des fichiers .md dans le répertoire précédemment créé, par exemple 0-introduction.md. Les titres de ces fichiers définissent les titres des chapitres.

Les chapitres apparaissent par ordre alphabétique dans les menus de navigation. Il est donc conseillé de préfixer le nom de fichier de chaque chapitre par son numéro, par exemple 0-introduction.md, 1-chapitre-1.md...

La page d'accueil et les menus de navigation sont générés automatiquement.

Il est recommandé d'utiliser un permalink dans chaque fichier de chapitre afin d'obtenir des URLs propres et stables même en cas de re-numérotation de chapitres, par exemple pour qualite/1-preparer-le-jeu-de-donnees.md :

---
permalink: /qualite/preparer-le-jeu-de-donnees
---

Par convention, les images des guides sont stockées dans un répertoire images dans le répertoire de chaque guide.

Développement local

Dans la majorité des cas, l'utilisation de GitHub par le biais de son interface web vous suffira. Vous pouvez directement éditer le contenu des guides par le biais de pull-requests et profiter d'une prévisualisation ensuite.

Si nécessaire, voici comment faire tourner ce projet localement :

npm install
npm run dev
open http://localhost:8080

Licence

Le contenu de ce dépôt est publié sous 2 licences.

Le contenu des guides est publié sous licence Ouverte 2.0 ;
Le code nécessaire à la publication web de ces guides est sous licence MIT.

2019 DINSIC, Etalab.

guides.etalab.gouv.fr's People

Contributors

Stargazers

Watchers

guides.etalab.gouv.fr's Issues

Référence à un article de la Loi Lemaire à revoir dans le guide sur l'ouverture du code

Bonjour,
La section cadre juridique du guide sur l'ouverture des codes sources fait référence à un l'article 46, II, 4 de la loi pour une République numérique.
Le texte de loi auquel on fait référence contient un article 46 qui ne semble pas avoir de lien direct avec le sujet évoqué. Par ailleurs c'est article ne contient pas d'alinéas II, 4.
Est-ce qu'il n'y a pas une erreur ?
Bien cordialement
FB

Image non utilisée

L'image suivante est présente dans le guide juridique mais non utilisée.

Faut-il la mettre quelque part ? La supprimer ?

Augmenter la taille de la police par défaut

Je trouve que la police par défaut est vraiment peu lisible. Est-ce possible de l'augmenter ?

Deux liens pas bons / cassés dans le guide des algorithmes publics

Dans section "les algos publics" https://guides.etalab.gouv.fr/algorithmes/guide/#les-algorithmes-publics-enjeux-et-obligations le lien vers le guide sur l'ouverture des codes sources renvoie vers sa version sur github, ce qui peut être perturbant pour un non informaticien, j'imagine que l'idée est de renvoyer vers le guide sur le site etalab : https://guides.etalab.gouv.fr/logiciels/
Dans section "comment contribuer" https://guides.etalab.gouv.fr/algorithmes/guide/#comment-contribuer le lien "version éditable" vers le guide sur github n'est pas bon.

Changer d'hébergeur

Vercel (Zeit) a changé de modèle et il n'y a plus de plan gratuit pour les organisations (cf mail ci-dessous). Ils n'ont pas encore menacé de couper mais ça pourrait arriver rapidement.

Je vois deux solutions :

GitHub pages
dokku

Your Vercel team, Etalab, is on a "free" plan, which makes you an early adopter!

Companies often cut features to force upgrades from their early adopters, but we'd rather entice upgrades through better features and performance (and a steep discount)! After all, we appreciate early adopters and can afford to help non-commercial projects ship through us.

So, if your company might benefit from an Enterprise plan, now is the time to discuss! Vercel Enterprise plans get the full benefit of our Edge Network, advanced security, and priority support (including Next.js support).

Again, we will steeply discount the price in for upgrades made in June/July so you can experience Vercel the way it was meant to be!

Let me know - cheers!

Droits pour Soizic

Peux-tu donner les droits d'écriture à @soizicpenicaud sur ce dépôt ?

Ajouter explications sur les séparateurs et Table Schema

(J'ai hésité sur le lieu pour avoir cette discussion, au final ici me paraît le plus adapté. En effet, les guides Etalab ont vocation à mon avis à faire référence en la matière et s'appliquer de façon canonique aux différents projets et produits *.data.gouv.fr)

Les séparateurs dans les fichiers tabulaires sont un sujet de désaccords récurrent. Pourtant, pour les producteurs de données, les séparateurs ne devraient avoir aucune espèce d'importance. Par exemple, l'utilisation des schémas Table Schema permet justement de supprimer certaines de ces préoccupations qui sont autant de frictions à l'ouverture des données.

La conversation qui a lieu depuis le 28 avril sur la page de la Base nationale consolidée des lieux de covoiturage illustre bien les différents problèmes.

Premièrement, il y a à la base l'éternel débat du point-virgule contre la virgule et la croyance qu'il y aurait un "standard CSV" à respecter. Il serait possible sur ce point de compléter le guide d'Etalab afin de casser les idées reçues sur le CSV. Les utilisateurs pourraient ainsi s'y référer.

Deuxièmement, le plus important pour moi serait d'expliquer que les séparateurs n'ont la plupart du temps pas d'importance. En particulier, documenter le fait que la spécification Table Schema n’a aucune notion de séparateur puisqu'on travaille sur des données tabulaires et pas que des CSV. En clair, un fichier sera valide s'il respecte le schéma, quel que soit le séparateur utilisé et même quel que soit son format tant qu'il est supporté (.csv, .xlsx, .xls, .ods...).

La documentation du SCDL, avec ses "recommandations pour le formatage des fichiers" rédigées par OpenDataFrance, entretient également cette confusion. Nous allons tâcher d'y remédier : https://git.opendatafrance.net/scdl/documentation/-/issues/12, mais je pense que ça sera plus facile de convaincre OpenDataFrance si Etalab montre la voie.

Enfin, il faudrait enlever toutes les mentions de séparateurs dans la documentation des schémas, en l'occurence celle du schéma des lieux de covoiturage. Pour clarifier encore davantage, il faudrait préciser que les producteurs peuvent choisir le séparateur (et le format tabulaire) qu'ils préférent.

Qu'en pensez-vous ? @geoffreyaldebert @abulte @fchabouis

Rename to guides.etalab.gouv.fr

Cf https://github.com/etalab/code.etalab.gouv.fr/issues/78

Un lien cassé dans Liste de ressources/Outils et méthodologies

Bonjour,
Merci pour ce guide, très utile.
Dans Liste de ressources/Outils et méthodologies, le lien 🇫🇷 "Guide des algorithmes publics à l'usage des administrations", Etalab, mars 2019 est cassé.
D'après le titre, on se demande s'il ne s'agit pas d'une référence circulaire (une référence au guide dans le guide);
Bonne soirée,
Florent Bédécarrats (Nantes Métropole)

Erreur 404 sur la génération PDF d'un des guides

404 sur la génération PDF du Guide "Préparer les données à l'ouverture et la circulation" : https://guides.etalab.gouv.fr/pdf/guide-qualite.pdf

Doc - Partie API Géo Etalab au sens large (sur guides)

Définition du NER dans le lexique - guide annotation

Salut @KimMontalibet ,

Dans la définition NER du lexique du guide d'annotation, il me semble que la tâche d’attribuer des catégories type "verbe", "adjectif" ou "adverbe" est plutôt la tâche du PoS tagging (laquelle, côté machine learning, est en effet très similaire au NER).

Reconnaissance d'entités nommées

La reconnaissance d'entités nommées, ou Named Entity Recognition (NER) en anglais, est une tâche d'apprentissage supervisée où les données d'entrées sont chacun des mots d'un document et le label qu'on leur attribue est une catégorie sémantique à laquelle il se rattache : par exemple « verbe », « adjectif » ou « adverbe » dans un cas général et « nom », « prénom », « adresse », « date » pour une tâche de pseudonymisation.

Indiquer liste fermée de licences

Tu n'indiques pas qu'il existe seulement quelques licences habilitées et qu'il faut donc choisir dans la liste. Peut-être rappeler ça et mettre un lien vers la page https://www.data.gouv.fr/fr/licences ?

Originally posted by @AntoineAugusti in #34

Vérifier utilisation d'emploi du mot latin

Ça ne facilite pas la compréhension l'emploi de ce terme latin

Originally posted by @AntoineAugusti in #34

Algorithmes : ajouter lien dernier webinaire

Merci @soizicpenicaud et @schignard pour l'organisation du webinaire sur la transparence des algorithmes.

Je vous suggère de faire figurer ce lien dans votre guide

API Geo - doc API découpage administrative

Dire "Données" plutôt que "Jeux de données"

La page https://guides.etalab.gouv.fr/accueil.html donne accès à deux guides contenant "Jeux de données" dans leur titre.

Quels jeux de données doivent être publiés en open data ?
Comment publier des jeux de données sur data.gouv.fr ?

Ces deux guides portent sur les données administratives en général et l'expression "jeux de données" désigne plutôt des données classiques, tabulaires.

Il est souvent difficile de faire comprendre que des "données textuelles" relèvent bien des données administratives à publier en open data. Je suggère simplement de dire "données" à la place de "jeux de données". Si c'est OK pour vous, je fais la PR.

Problème avec le build Vercel

Lors de ma PR, #192, j'ai eu cette erreur lors du build https://vercel.com/etlb/guides.etalab.gouv.fr/Bhxt8HKsvqvBrTVTSBjTc7TCnwSn qui m'indique que la version de Node utilisée n'est plus supportée lors du build Vercel https://vercel.com/docs/concepts/functions/serverless-functions/runtimes/node-js#node.js-version

Je suis passé en choisissant dans package.json "engines": { "node": ">12 <=18" } mais cela m'a planté (https://vercel.com/etlb/guides.etalab.gouv.fr/4ZUMgKB13NBG66roSUZ2FK63zRWX#L55-L70) du fait de vercel/next.js#30296

La solution court terme à part faire une MAJ webpack est de passer par le choix de "engines": {"node": ">12 <17"}? C'est ce que j'ai fait dans ma PR. Je ne sais pas s'il y a une façon plus élégante de faire, sachant que je n'ai pas la main sur l'environnement d'exécution de Vercel pour par exemple jouer sur NODE_OPTIONS qui peut jouer sur le bon fonctionnement du build selon les remontées liées au bug webpack mentionné

API Geo - doc adresse

Related to #148

Déplacer la "liste des algorithmes publiés" du guide des algorithmes publics vers celui des codes sources

Le guide des algorithmes publics contient une liste tenue à jour par @bzg sur les algorithmes publiés (CNAF, calculateur du code des impôts, etc.).

Je crains que la localisation de cette page à cet endroit là (dans le guide des algorithmes) contribue à entretenir une certaine confusion dans l'esprit de nos publics qui ont déjà parfois tendance à mélanger les différentes obligations issues de la Loi pour une République numérique.

Ce guide traite des obligations de transparence des algorithmes, qui est un principe distinct (et tout à fait complémentaire) de celui de publication des codes-sources. Dans un cas on doit fournir des informations aux personnes concernées (droit à l'explication du fonctionnement et des résultats d'un algorithme), dans l'autre on doit publier un code-source.

Je propose deux choses:

que l'on déplace cette liste dans le guide des codes-sources (ou à tout le moins qu'elle ne figure plus à l'endroit où elle est actuellement),
qu'on rajoute clairement et explicitement dans le guide des algorithmes publics que d'autres ressources sont disponibles, dont le guide sur la publication des codes sources

suppression du terme "Tiers" dans le paragraphe d'intruction du guide qualité

A la fin du paragraphe d'intro du guide qualité je supprimerai le terme "tiers".

"Des lignes directrices sont proposées afin de faciliter la prise en main, le croisement et l’exploitation des jeux de données par de le plus grand nombre d’acteurs tiers."

Dead Link sur le guide logiciels

Sur le guide "Codes sources" et sur la page https://guides.etalab.gouv.fr/logiciels/#maintenance-de-ce-document-et-contributions

Il est fait mention d'un lien vers des issues github qui n'est pas actif : https://github.com/etalab/ouverture-des-codes-sources-publics/issues/new

@bzg

CI cassée au niveau de la génération des PDF: les mises à jour ne sont plus déployées

Hello! En poussant quelques commits ce matin, la CI ne publie plus.

Voir https://github.com/etalab/guides.etalab.gouv.fr/runs/6744125724?check_suite_focus=true

Quelqu'un a une idée de ce qui peut coincer?

Ajouter un fichier CONTRIBUTING.md

Le fichier pourra expliquer la façon de contribuer, notamment qu'il faut passer par des PR.

Local deployment instructions fail

Hello, I try to clone and to run yarn install but was bitten by this:

00h00m00s 0/0: : ERROR: [Errno 2] No such file or directory: 'install'

Is it on my side or is there something missing in the instructions?

Erreur de lien dans le guide "Expliquer les algorithmes publics"

Bonjour,

Je pense qu'il y a une erreur de renvoi dans le guide Expliquer les algorithmes publics

guides.etalab.gouv.fr/algorithmes/0-guide.md

Line 85 in 72e8f8f

 * **Les obligations liées à l'ouverture des codes sources** (voir le [guide d'Etalab sur l'ouverture des codes sources de logiciels](https://guides.etalab.gouv.fr/algorithmes/)) ; 

Le lien devrait plutôt renvoyer vers https://guides.etalab.gouv.fr/logiciels/#a-qui-s-adresse-ce-guide

poke @pedevineau @KimMontalibet

J'ai pas fait la PR, j'attends votre validation.

Retours utilisateurs

Hello,
Afin de récolter le plus de retours possibles sur le guide, serait-il possible de proposer un form ou un module de commentaire pour les lecteurs ?
La solution de github fonctionne bien, mais elle reste une grosse barrière à l'entrée. Surtout si on garde en tête que les lecteurs des guides pourront être des agents administratifs qui n'ont pas forcément de compétences techniques ou de connaissance de github.

Dites-moi ce que vous en pensez !

Changement config.js

Je m'entraine à faire évoluer config.js du VuePress avec l'ajout du guide datagouv. Une fois que les md de datagouv seront à la racine de datagouv, est-ce que ca ressemblerait à ca ?

sidebar = {
'/qualite/': [
'',
'0-introduction',
'1-preparer-le-jeu-de-donnees',
'2-documenter-les-donnees',
'3-elements-organisationnels',
],
'/datagouv/': [
'',
'0-introduction',
'1-creer-un-compte-utilisateur',
'2-creer-ou-rejoindre-une-organisation',
'3-publier-un-jeu-de-donnees',
'4-animer-la-communaute-de-reutilisateurs',
],
// add other guides here, like this:
// '/dummy/': [
// '',
// 'dummy-child',
// 'dummy-child-dir/dummy-child-dir-child'
// ]
}

module.exports = {
title: 'guides.etalab.gouv.fr',
description: 'Les guides d'Etalab',
themeConfig: {
sidebar: sidebar,
sidebarDepth: 1,
logo: '/images/logo-marianne.svg',
// lastUpdated: 'Dernière mise à jour',
repo: 'etalab/guides',
editLinks: true,
editLinkText: 'Proposer des modifications sur cette page'
},
locales: {'/': {lang: 'fr-FR'}},
dest: 'public',
head: [
['link', { rel: 'icon', href: '/images/favicon.png' }],
],
markdown: {
toc: { includeLevel: [2, 3, 4, 5] }
}
}

Permettre téléchargement PDF du guide reuse

Si j'ai bien compris je dois modifier : https://github.com/etalab/guides.etalab.gouv.fr/blob/3066f8825891376f5bc215843c946b931ca9c487/.github/workflows/ci.yml
?
cc @abulte

Lister les standards existants

WGS 84, code INSEE, code SIREN etc.

S'inspirer également de CSV Detective

Originally posted by @mathildehg in #49

API Geo - doc Tuiles vectorielles

Ajout d'une licence

Il faudrait une licence sur ce dépôt à terme.

Je pense qu'il en faut 2 : une pour le peu de code et l'autre pour le contenu du guide.

D'instinct, je dirais MIT / LO.

Vous avez la même lecture ?
Comment raisonnablement bien spécifier 2 licences différentes dans un même dépôt ?

Mise en cohérence du guide "qualite / 3-documenter-les-donnees" et du guide "producteurs-schemas"

Dans la construction d'un jeu de données, le guide "qualite / 3-documenter-les-donnees" fait référence à une étape de "description du modèle de données" préalable à celle de documentation d'un schéma de données (mais ne fait pas le lien explicitement avec le guide "producteurs-schemas").

Réciproquement, le guide "producteurs-schemas" ne fait pas référence à l'étape préalable de construction du modèle de données précisée dans le guide "qualite / 3-documenter-les-donnees".

Mon avis :

l'étape modèle de données me parait fondamentale car c'est à cette étape que l'on formalise les dépendances qui existent entre données (la notion de modèle de données est générale et ne se limite pas une approche multi-fichiers). C'est aussi un bon outil pour échanger et se comprendre. Les dépendances identifiées dans le modèle de données peuvent ensuite être formalisées dans le schéma de données et vérifiées dans la phase de production des données (cf proposition de méthodologie.
Les deux guides se recouvrent en partie, mais sans maintenir la cohérence entre les deux, ce qui brouille le message.
Plusieurs solutions sont possibles :
- fusionner les deux (ce qui revient à intégrer le guide "producteurs-schemas" dans le guide "qualite / 3-documenter-les-donnees"
- maintenir deux guides mais séparer les concepts : Ne garder dans le premier que la démarche, le processus et la méthodologie générale (en réintégrant notamment le phasage décrit dans le guide "producteurs-schemas") et dans le second que ce qui est spécifique de l'outil "schéma" (principe, mise en œuvre, gestion/suivi). Cette approche permettrait également d'ajouter au fur et à mesure des évolutions des outils, par exemple un outil "modèle de données", un outil "métadonnées", un outil "score qualité", un outil "représentation multi-fichiers"...