Modifier

Pour mémoire, une page rédigée en 2017 https://openmarches.frama.wiki/ et publiée sur le forum Etalab.

Un sujet sur lequelle je prévoir d'avancer en 2019, en ce qui concerne les marchés publics du domaine transport - mobilité. Frama.wiki ayant fermé en 2021, voici le texte de cette page :

''Vers une archive ouverte des documents de marchés publics?''

Contexte

  • ouverture des données des marchés publics : démarche portée par Etalab avec les Collectivités, s’appuyant sur des standards internationaux, elle porte sur les avis de marchés ; parallèlement le BOAMP a publié sous Licence Ouverte ses avis de marché et d’attribution

  • évolutions de la loi CADA : les documents publics sont réutilisables et republiables librement Objectif :

  • moissonner les documents de consultation des entreprises (DCE) des appels d’offre de marchés

  • créer un site d’archives permettant d’y accéder librement

  • enrichir progressivement cette archive

Usages attendus

  • aujourd’hui des sociétés commerciales font ce travail de moissonnage et classement des appels d’offre et proposent des services pour y accéder, essentiellement pour les fournisseurs, les entreprises qui répondent aux appels d’offre.

  • l’usage des données publiques d’avis de consultations est plutôt de produire des indicateurs sur la dépense publique et éventuellement de détecter certaines irrégularités (lutte contre la corruption)

  • l’usage attendu ici est les acheteurs publics eux-mêmes, en leur permettant d’améliorer leurs pratiques d’achat en capitalisant sur les DCE les plus aboutis dans un domaine métier particulier, et par ailleurs de permettre aux usagers/citoyens (associations, etc.) d’accéder à des documents techniques détaillés sur tel ou tel projet. Les chercheurs travaillant sur la gestion publique peuvent trouver dans une telle archive un matériau utile pour de nombreux travaux. Par ailleurs, les entreprises (consultants, prestataires, start-ups, industriels…) peuvent aussi bénéficier d’une telle archive ouverte, notamment pour proposer de nouveaux services aux collectivités.

Cette archive permettrait d'accéder à un DCE après la fin de la consultation, lorsqu'il n'est plus disponible sur la place de marché, et à la limite, le principal intérêt de l'archive ouverte n'est pas de permettre d'accéder au DCE pendant la consultation proprement dite. 3 étapes de traitement?

Le projet pourrait comprendre 3 étapes successives de traitement des documents :

-1- collecter

-2- classer et publier

-2- enrichir et annoter

Techniquement, le contexte est favorable aussi : de manière générale, de la disponibilité de serveurs peu coûteux pour stocker et traiter

1) d’outils de moissonnage (web scraping) open source (ex. en python : scrapy, selenium, requests/bs4)

2) de logiciels de gestion d’archives ouvertes (ex. d-space, invenio…)

3) d’outils open source de text mining (cf. exemples)

Dans le domaine de la recherche et de la science ouverte, des archives ouvertes de plusieurs centaines de milliers de documents existent depuis des années, le domaine a acquis une bonne maturité. On se propose de transposer ce type d’activités à la gestion des documents publics.

A terme, si le projet fonctionne et suscite un intérêt et un financement suffisant à son fonctionnement, il est bien sûr envisageable de compléter les documents archivés et de les relier entre eux : associations entre avis de marché et DCE, et surtout livrables produits dans le cadre des marchés (études en particulier, pour les marchés de service, qui sont également des documents administratifs au sens de la loi)

Comment commencer?

Quoiqu’il en soit il faut commencer. On peut se limiter au départ à un territoire, et/ou à un domaine, comme les transports. On peut se répartir la tâche à plusieurs, l’archive doit être conçue pour fonctionner de manière distribuée.

Pour la récupération des DCE, il y a 2 grands scénarios :

  • demander (et obtenir) de la part d’un acheteur public l’accès aux DCE

  • récupérer ces DCE sur la plateforme d’achat de la collectivités

Et ce, pour toutes les collectivités et établissements en France, en commençant par les plus importantes. Heureusement, il y a un nombre beaucoup plus limité de logiciels de plateforme d’achat. Par ailleurs, beaucoup de plates-formes permettent de récupérer les DCE anonynement, ce qui rend faisable l’écriture de scripts pour les récupérer. Certaines on mis un captcha (ex. région PACA) interdisant à un robot de récupérer les DCE. un bon point de départ : scraper-place

scraper-place

scraper-place est un logiciel écrit en python par Michel Blancard, de l'association l'ouvre-boite : https://ouvre-boite.org/

il permet de récupérer chaque jour (dans une base postgreSQL) les DCE de marchés publics publiés sur la place de l'Etat marches-publics-gouv.fr l'idée est ensuite, sur la base des DCE téléchargés (et republiés ici : ) d'avoir les références des marchés afin de pouvoir demander aux acheteurs publics également les livrables produits dans le cadre de ces marchés (rapports d'étude, etc.)

il est bien documenté et s'installe facilement : https://betterplace.info/

https://github.com/michelbl/scraper-place/blob/master/fetch.py

C'est clairement une très bonne base de départ pour aller plus loin!

en 2022

Betterplace est toujours opérationnel et compte 100 000 DCE moissonnés sur la place de marché de l'état !

J'ai pu mettre en place pour France Mobilités une archive ouverte ciblée sur le seul domaine mobilités (avec 7000 DCE)