samedi 26 avril 2014

Téléchargez le contenu de Gallica en haute résolution

Suite à mon article Diffusez le contenu culturel grâce à Dezoomify permettant de récupérer le contenu des collections parisiennes en haute résolution, voici un billet pour faire la même chose sur le fonds ancien de Gallica.

Exemple : Si vous souhaitez récupérer la planche située à l'adresse http://gallica.bnf.fr/ark:/12148/bpt6k64486603/f62.image

http://gallica.bnf.fr/ark:/12148/bpt6k64486603/f62.image

Récupérez l'identifiant du livre et le numéro de page pour former l'url suivante :

http://toolserver.org/~kolossos/image/gallica.php?height=8000&width=8000&zoom=6&path=http://gallica.bnf.fr/proxy?method=R%26ark=bpt6k64486603.f62 

Puis vous devez modifier les paramètres height et width jusqu'à ne plus avoir de numéros en-dessous et à droite de l'image (les paramètres height et width sont inversés, height=largeur et width=hauteur). Tâtonnez jusqu'à trouver les bons paramètres. Il doit y avoir une méthode plus intelligente, mais je ne la connais pas.


Dernière étape : sauvegardez l'image. Vous devez faire une copie d'écran. Vous pouvez par exemple utiliser l'extension Firefox Pearl Crescent Page Saver.


[Mise à jour 1] Il faut un logiciel qui puisse capturer toute la page, y compris la partie non visible. Et sauvegarder le tout au format jpg.

4 commentaires:

  1. S'il faut faire une capture d'écran au final, cela n'a rien d'une image "haute résolution". A vérifier mais la qualité de l'image ainsi récupérée risque même d'être inférieure au jpeg pleine taille de Gallica (1492x1054 : http://gallica.bnf.fr/ark:/12148/bpt6k64486603/f62.highres). Avec la méthode présentée dans votre billet, on obtient peut-être une image de plus grande dimension que celle-ci, mais certainement pas de meilleure résolution, nuance...
    De plus, le maximum que l'on puisse obtenir ne peut pas dépasser les dimensions de l'image délivrée par le serveur pour la fonction de zoom de Gallica, en l'occurrence 5253x3605 pour cette image. Le mieux que l'on pourrait faire sera d'avoir un programme recomposant les tuiles d'images pour former une nouvelle image jpg en sortie (ce qui éviterait de passer par une copie d'écran).
    Qu'on se le dise : il n'est pas possible de récupérer les "vraies" images haute résolution de Gallica (à moins de cracker le serveur...).

    RépondreSupprimer
  2. Merci pour ces précisions. Il existe de nombreux scripts (généralement en python) qui assemblent les tuiles et sauvegarde le tout en jpg, mais ils ne sont pas à la portée de tous.

    RépondreSupprimer
  3. Salutations, un mien ami était confronté ce soir au problème de la récupération d'images HD sur gallica. Du coup, je lui ai pondu un script en bash (ligne de commande linux pour ceux qui ne connaissent pas), utilisable sous windows via cygwin. Le script récupère les images et les assemble tout seul comme un grand et est disponible ici : https://gitorious.org/gallica-downloader/gallica-downloader/source/master:

    RépondreSupprimer
    Réponses
    1. Bonjour à tous ,

      dépuis quelques temps il y à un groos problème avec les images grand format , car , contrairement à avant , l' image ressort à mosaique et à pièces démultipliées ; voir mon lien : https://tools.wmflabs.org/zoomable-images/gallica.php?height=8000&width=8000&zoom=6&path=http://gallica.bnf.fr/proxy?method=R%26ark=btv1b8410679s.f1&l=3&r=0,0,256,256 . Quelqu' un aurait une explication et si oui , comment faire à récupérer correctement l' image qui nous intéresse ?
      Merci d' avance pour votre aide ; en attendant , je vous souhaite une excellente journée . Cordialement .

      Supprimer