|
| |
| |
Ny metadata standard undervejs |
| Automatisk copyright kontrol |
| |
En ny metode til at forhindre rovdrift overfor nyhedssites er undervejs. Metoden har til formål at hindre søgemaskinernes høst-robotter i at stjæle indhold fra tjenester, der ikke ønsker at blive indekseret. Indtil for nylig har søgemaskinernes høst-robotter ellers respekteret beskeder sendt via Robots Exclusion Standard eller robots.txt. Robots.txt består i sin enkelhed af en fil ved navn robots.txt, der ligger i roden f.eks. http://biblis.db.dk/robots.txt. Typisk indeholder filen følgende besked:
# Be nice # User-agent: * Disallow: /
Denne besked får robotterne til at undlade at indeksere websitet. Samme metode kan bruges til at holde dem borte fra enkelte grene af eller navngivne filer på sitet. Imidlertid fungerer metoden kun, hvis robotterne respekterer beskeden.
I løbet af de sidste par år har Google imidlertid haft retsligt bøvl for at hente nyheder fra Agence France-Presse og Associated Press uden tilladelse. I kølvandet på dette, er den nye teknik ACAP (Automated Content Access Protocol) blevet udviklet. Hvordan den nøjagtig kommer til at fungere, er ikke endelig fastlagt, men der udføres forsøg i Storbritannien blandt andet i samarbejde med British Library.
Den nye standard Automated Content Access Protocol vil bevirke en større fleksibilitet og en bedre respekt for copyright. Det vil formodentlig også betyde, at brugerne vil få adgang til mere materiale, fordi datasikkerheden vil være bedre for udbyderen. |
Washington Post: Publishers Seeking Web Controls
http://www.washingtonpost.com/wp-dyn/content/article/2007/11/29/AR2007112902207.html
|
Answers: Automated Content Access Protocol
http://www.answers.com/Automated%20Content%20Access%20Protocol
|
Hjemmeside for Automated Content Access Protocol
http://www.the-acap.org/faqs.php
|
| KMA |
| |
| Redigeret 04-12-2007 |
|