FAQ (Foire aux questions)

Vous trouverez ici des réponses aux questions qui nous sont les plus fréquemment posées. Si vous ne trouvez pas de solution à votre question, nous vous conseillons d'effectuer une recherche à partir du champ "Search" situé en haut à gauche de la documentation. Si, malgré cela, vous n'obtenez toujours pas d'explication, nous vous invitons à nous contacter à l'adresse api-users@listes.istex.fr.

Qu'est-ce que le format Mods ?

Il s'agit d'un type de format XML spécialisé pour les métadonnées documentaires. Produit par la "Libray of Congress", il est un standard de fait dans ce domaine.
Pour plus d'informations sur ce format, veuillez consulter le site officiel, plus particulièrement les User Guidelines.

Qu'entend-t-on par identification avec basic-auth ?

Cela correspond au mode d'authentification nomade de l'API, basé sur l'annuaire LDAP de l'INIST et la mise en oeuvre de l'authentification basique du protocole HTTP (RFC 2617). Pour plus de détails, consulter le paragraphe dédié ou encre la page Wikipédia correspondante.

Je n'arrive pas à me connecter à l'API, l'accès m'est refusé !

Si vous sollicitez une ressource et que le serveur vous retourne un code 403 (« Accès refusé »), c'est que l'adresse IP avec laquelle vous tentez de l'obtenir n'est pas reconnue et qu'aucun autre mode d'accès n'a permis de vous authentifier.
Si vous pensiez pouvoir légitimement accéder aux ressources visées, il peut être utile de vérifier que l'adresse IP de votre machine est bien autorisée par l'API.

Pour toute demande de support technique concernant un problèmes d'accès, merci d'envoyer un e-mail à l'adresse : api-users@listes.istex.fr.

Usage documentaire Vs. Usage recherche ?

Vous trouvez certaines fonctionnalités de l'API étranges ? Vous vous demandez à quoi peuvent bien servir certaines informations (qualityIndicators, par exemple) ? La réponse est certainement due au fait que l'API doit faire face à de nombreux besoins différents.

C'est ce qu'on pourrait appeler la problématiques des usages

On distingue aujourd'hui deux grands usages : orienté documentaire et orienté recherche.

  1. Le premier correspond à l'usage classique d'un étudiant ou d'un chercheur qui a besoin de se documenter dans le cadre de ses travaux.
  2. Le second usage vise à utiliser tout ou partie des corpus ISTEX comme matière première pour alimenter des travaux de recherche.

À quoi servent les "indicateurs de qualité" ?

Une des raisons d'être d'ISTEX est de pouvoir irriguer des travaux de recherche en tant que fournisseur de matière première. Sans cette particularité, le projet n'existerait sûrement pas aujourd'hui.

Quand un chercheur souhaite extraire un sous-corpus d'ISTEX, il a besoin de pouvoir travailler sur des textes de "qualité" suffisante. Cette notion de "qualité", même si elle est subjective, est souvent liée au texte contenu dans les fichiers PDF, ou encore à la présence de certaines métadonnées (résumé, mots-clés, etc.)

Les indications de type qualityIndicators sont un début de réponse à cette problématique.

Un exemple concret d'utilisation est de pouvoir récupérer des fichiers PDF contenant réellement du texte, et pas uniquement des images (utile dans le traitement du langage). La requête suivante va renvoyer tous les documents dont le fichier PDF contient au moins 2000 mots.

https://api.istex.fr/document/?q=* AND qualityIndicators.pdfWordCount:[2000 TO *]