Metadata
“Metadata zijn gegevens die de karakteristieken van bepaalde gegevens beschrijven. Het zijn dus eigenlijk data over data. De metadata bij een bepaald document (de gegevens) kunnen bijvoorbeeld zijn: de auteur, de datum van schrijven, de uitgever, het aantal pagina’s en de taal waarin de gegevens zijn opgesteld. Het expliciet opslaan van metadata bij de data waar het betrekking op heeft, heeft als voordeel dat de data makkelijker gevonden kan worden. Zo kan men in een zoekmachine die gebruikmaakt van metadata bijvoorbeeld direct zoeken naar documenten geschreven door een bepaalde auteur. Met full text-zoeken, dus zonder gebruik te maken van metadata, is dit moeilijker doordat ieder document waarin de naam van de auteur voorkomt gevonden wordt. Dit kunnen er veel meer zijn dan de documenten die daadwerkelijk door de persoon geschreven zijn.
Het nadeel van werken met metadata is dat metadata moet worden toegevoegd aan alle gegevens (documenten). Soms is dit eenvoudig automatisch te doen (zoals het bepalen van het aantal pagina’s), maar vaak vereist dit werk dat nog niet goed zonder menselijke interventie uit te voeren is, zoals het extraheren van de naam van de auteur uit een tekstdocument, of het toewijzen van bepaalde trefwoorden.”