Documenten indexeren

Documenten indexeren betekent het toekennen van kenmerken aan documenten die de inhoud weergeven. Het is een van de kernfuncties binnen document en record management systemen. Immers, zonder kenmerken is het onmogelijk om een document weer terug te vinden.

Het proces van documenten indexeren staat ook bekend onder de naam documentindexatie.

Automatiseren documentindexatie

Toegekende documentkenmerken worden documentindexwaarden genoemd. Andere omschrijvingen die worden toegepast zijn tags of labels. Documentindexwaarden vallen onder de metadata, samen met de technische kenmerken die document en record managent systemen aan documenten toekennen.

Documenten kunnen op verschillende manieren worden geïndexeerd. In de meest eenvoudige vorm gebeurt dit handmatig, maar er zijn heel veel mogelijkheden om het indexeerproces te automatiseren:

  • Voor gescande documenten wordt bijvoorbeeld gebruik gemaakt van herkenningstechnieken, zoals barcodeherkenning, Optical Character Recognition (OCR) en Quick Response (QR)-code herkenning. Deze technieken lezen gegevens van gescande documenten af en leggen deze automatisch vast als documentkenmerken.
  • In geval van digitale documenten wordt vaak automatische indexextractie toegepast. De kenmerken worden uit de inhoud, de bestandnamen of uit begeleidende indexbestanden gehaald en vastgelegd.

Efficiënt documenten indexeren

Het gebruik van de juiste indexwaarden kan in een goed document en record management systeem worden bewaakt door de volgende technieken:

  • Vaste waardenlijsten/trefwoordenlijst/bibliotheekfuncties: per index wordt vooraf bepaald welke waarden zijn toegestaan. Deze waarden worden in een overzicht getoond dat een gebruiker kan raadplegen. Dergelijke overzichten voorkomen dat gebruikers voor hetzelfde kenmerk verschillende woorden gebruiken.
  • Validatie: documentindexen kunnen van eigenschappen worden voorzien die afdwingen dat de juiste gegevens worden ingevoerd, bijvoorbeeld een datum, numeriek of alfanumeriek veld.
  • Gekoppelde indexen: de waarden van verschillende documentindexen worden gekoppeld, waardoor alleen relevante kenmerken kunnen worden ingevuld.
  • Verrijking: op basis van een ingevoerde documentindexwaarde worden automatisch additionele kenmerken opgehaald en bij een document vastgelegd. Bijvoorbeeld: bij het invoeren van een klantnummer wordt automatisch ook de klantnaam opgehaald en vastgelegd. Hiervoor wordt vaak gebruik gemaakt van koppelingen met externe systemen.

Documenten indexeren kan ook op basis van de volledige inhoud. In dat geval kunnen documenten Full Text gezocht en doorzocht worden op ieder woord en getal dat erin voorkomt.

Flexibele zoekresultaten

In de presentatie van de zoekresultaten binnen document en record management systemen, spelen documentindexen ook een belangrijke rol. De kenmerken kunnen gebruikt worden om een structuur te creëren. In tegenstelling tot de Windows Verkenner kan deze structuur flexibel zijn. Verschillende gebruikers kunnen op basis van dezelfde kenmerken documenten in verschillende perspectieven plaatsen.

Documentindexwaarden bewaken processen

Tot slot kunnen documentindexwaarden een belangrijke rol spelen in het bewaken van processen. De aanwezigheid of juist afwezigheid van bepaalde documenten kan automatisch geconstateerd worden. Zodra een datumkenmerk van een document verloopt kunnen automatisch notificaties worden gegenereerd, zodat de verantwoordelijke medewerker(s) actie kunnen ondernemen.

Neem gerust vrijblijvend contact met ons op voor meer informatie over documenten indexeren met platform Xtendis.