Dann will ich die Gesamtidee mal etwas genauer darlegen.
Das Projekt war als Blacklist-System geplant, welches vordergründig auf Websites ausgelegt war. Es sollten mehrere Merkmale unterstützt werden, die als Prüfmerkmale verwendbar sind.
Im Bereich Websites wären das:
1. die IP-Adresse
2. die Browser-Useragents
3. (unter Vorbehalt) die Referrer
Aufgrund dessen, dass bei dem Projekt, wo ich damals mitgearbeitet habe, gewisse Probleme aufgekommen sind, und unter anderem der Wunsch war, nicht alle Sperrmerkmale, sondern nur gewisse Merkmale einzusetzen, hätte das System vollkommen umgearbeitet worden.
Ebenfalls wurde überlegt, die Last auf mehrere Systeme zu verteilen, so dass die Datenbasis von mehreren Stellen abgefragt werden konnte.
Daraus entstanden war eine Idee bei mir, das ganze in der Form eine Remote Blacklist zu implementieren, wobei die Einträge jeweils mit einer TTL ausgeliefert werden, um gewisse Caching-Mechanismen nutzen zu können. Dabei war dann die Möglichkeit, die Datenbasis natürlich auch an anderer Stelle einsetzen zu können.
Aufgrund der Möglichkeiten, die entsprechenden Daten möglichst genau zu kategorisieren, kann man natürlich nur gewisse Teile des Datensatzes benutzen.
Einziges Problem daran wäre der Start, da das ganze auf User-Meldungen beruht, und somit zum Start die Datenbasis entsprechend klein ist. Somit müsste man bereits zum Start eine gewisse Nutzerbasis haben, um wenigstens einen Datenbestand zu generieren, der bereits gewisse Sicherheit bietet.