Docenten Marktplaats

Voor Docenten Marktplaats heeft Blue Architect tooling ontwikkelt voor het spideren van scholen-websites. Bijna 1500 sites worden in minder dan 30 minuten voorzien van een fingerprint om te detecteren of er nieuw vacature-aanbod is op de betreffende site. Indien mogelijk produceert het systeem een lijst met url’s naar de unieke vacatures. Voor het proces van het online zetten van de vacatures is een text-parser geimplementeerd welke vanuit HTML en PDF titels, paragrafen en opsommingen omzet naar HTML.

Tevens zijn diverse dashboard en testsuites ontwikkelt voor het controleren van de spiders, textparsing en of vacatures nog online staan.

Project info

Klantnaam Docenten Marktplaats
Website docentenmarktplaats.nl
Project start 2020
Project eind
Activiteiten projectmanagement / consultancy
hosting
Software stack python / Django
data mining
text processing algoritmes
regular expressions
api endpoints
crons