Réutilisez le contenu de la banque d'images du CRCV
Après mon post expliquant comment récupérer du contenu des sites utilisant zoomify, Starus me signale la banque d'images du Centre de recherche du château de Versailles. Ce site regorge de contenus intéressants, mais ne permet pas au lecteur de sauvegarder facilement les fichiers.
J'ai trouvé trois cas de figures : les images, les livres anciens et les manuscrits.
Premier cas : récupérer une image JPEG
Affichez l'image en plein écran, puis cliquez sur zoom.
Ce qui nous intéresse se trouve dans l'url. Copiez le nom de l'image (en rouge) :
http://www.banqueimages.crcv.fr/2011/zoom.aspx?copyright=%C2%A9%20Ch%C3%A2teau%20de%20Versailles&image=JPEG+-+S+07\M5020_IG_127_00430.jpg
Les fichiers JPEG sont accessibles directement à l'adresse suivante :
http://www.banqueimages.crcv.fr/imageproxy.asp?filename=nom du fichier.jpg&server=10.0.10.10&port=49882
Pour certaines images, le numéro du port change :
http://www.banqueimages.crcv.fr/imageproxy.asp?filename=\SAC_0001_C_1\LEC\POS\M5020SA_20310_P_P.jpg&server=10.0.10.10&port=29882
Deuxième cas : les livres anciens
Accessibles par le moteur de recherche : Domaines / Livres anciens. Lorsque vous feuilletez un livre, l'identifiant est indiqué dans la colonne de droite.
Les livre sont accessibles à l'adresse suivante :
http://www.banqueimages.crcv.fr/pdf/identifiant du livre.PDF
Exemple :
http://www.banqueimages.crcv.fr/pdf/ALV1780.PDF
Troisième cas : les manuscrits
Je n'ai pas trouvé de solution pour récupérer les manuscrits en pdf. Vous pouvez tout de même récupérer le livre image par image en utilisant la méthode présentée dans le premier cas.
J'ai trouvé trois cas de figures : les images, les livres anciens et les manuscrits.
Premier cas : récupérer une image JPEG
Affichez l'image en plein écran, puis cliquez sur zoom.
Ce qui nous intéresse se trouve dans l'url. Copiez le nom de l'image (en rouge) :
http://www.banqueimages.crcv.fr/2011/zoom.aspx?copyright=%C2%A9%20Ch%C3%A2teau%20de%20Versailles&image=JPEG+-+S+07\M5020_IG_127_00430.jpg
Les fichiers JPEG sont accessibles directement à l'adresse suivante :
http://www.banqueimages.crcv.fr/imageproxy.asp?filename=nom du fichier.jpg&server=10.0.10.10&port=49882
Pour certaines images, le numéro du port change :
http://www.banqueimages.crcv.fr/imageproxy.asp?filename=\SAC_0001_C_1\LEC\POS\M5020SA_20310_P_P.jpg&server=10.0.10.10&port=29882
Deuxième cas : les livres anciens
Accessibles par le moteur de recherche : Domaines / Livres anciens. Lorsque vous feuilletez un livre, l'identifiant est indiqué dans la colonne de droite.
Les livre sont accessibles à l'adresse suivante :
http://www.banqueimages.crcv.fr/pdf/identifiant du livre.PDF
Exemple :
http://www.banqueimages.crcv.fr/pdf/ALV1780.PDF
Troisième cas : les manuscrits
Je n'ai pas trouvé de solution pour récupérer les manuscrits en pdf. Vous pouvez tout de même récupérer le livre image par image en utilisant la méthode présentée dans le premier cas.
Excellente procédure, merci beaucoup, j'ai cherché un moment pour pouvoir récupérer ces images.
RépondreSupprimer