NEUHEIT gezeigt auf der CeBIT 2016 Halle 11, Stand F59/6

Textinhaltsbasierte Auto-Klassifizierungs-Engine "d-Class" für IT-Security

  • Die Geschäftsleitung legt die unterschiedliche Wichtigkeit der gespeicherten und zukünftigen textbasierten Geschäftsdokumente-Kategorien fest
  • Die IT-Security Spezialisten heften in einem IRM-System die unterschiedlichen Wichtigkeits-Etiketten an die Textdokumente
  • WIR aber erledigen das Schwierigste und bestimmen zuvor vollautomatisch, welches die unterschiedlich wichtigen Textdokumente im Gesamtbestand eigentlich sind

Das innovative Konzept für IT-Security IRM (Information Rights Management) schützt Dateien, indem Schutzinformationen (Berechtigungen) dort direkt angeheftet sind. Dazu muss bekannt sein, welches Textdokument (zumeist mit nicht-sprechendem Namen) im Gesamtbestand wie wichtig ist. Deshalb öffnen wir den fraglichen Text (*.txt) und auto-klassifizieren diesen nach vorgegebenen Klassen und in höchster Qualität. Diese Klassenkennungen sind dann das Maß für die zuzuweisenden Schutzinformationen. Ein Vertrag ist beispielsweise vertraulicher als eine Pressemeldung. Angesichts der Fülle existierender geschäftlicher Textdokumente muss deren inhaltsbasierte Bestimmung nach Textklassen - die Klassifizierung - vollautomatisch erfolgen. Und diese Auto-Klassifizierung muss hochqualitativ sein, sonst drohen Informationslücken oder gar manuelle Nacharbeit.

Das Festlegen der verschiedenen Wichtigkeiten von textbasierten Informationen (aufgrund der vordefinierten Textklassen-Bezeichnungen oder nach den Kategorien Vertraulich, Firmenvertraulich, Geheim, Persönlich, Öffentlich etc.) ist eine Unternehmeraufgabe. Das Anheften von Klasseninformations- und Berechtigungs-Tags ist "state-of-the-art" bei Microsoft® Active Directory / Azure AD. Das inhaltliche Autoklassifizieren der Inhalte von Textdateien war jedoch bislang ein enormer Stolperstein, den wir nun wegräumen. Regelbasiertes Klassifizieren war hier gestern. Die "d-Class" Auto-Klassifizierungs-Technologie von DocStream® verwendet eine sehr große, weitestgehend repräsentative Anzahl von Dokumenten-Originaltexten je Klasse zum Training der Textklassen. Die automatische Merkmalsbildung ermittelt eine Vielzahl an Textobjekten aus ein- oder mehrseitigen Dokumententexten und die anschließende Auto-Klassifizierung in Hyperebenen (SVM) steht für höchste Qualität. Diese Auto-Klassifizierungs-Engine können Sie auch zusätzlich zu Ihren bisherigen Verfahren einsetzen („Voting“).

Erstes Produkt auf dieser Technologiebasis ist die Autoklassifizierungs-Engine "d-Class PA" zum Filtern von 32 Personalaktenklassen + der Klasse SONSTIGES aus hunderttausenden an  Personalakten-Texten pro Stunde in höchster Güte (aber auch einsetzbar für jeden Mittelständler). Diese Engine zur Integration in Lösungen ist fix und fertig vortrainiert und kann ohne Spezialwissen auf Mausklick verwendet werden.

Welche Dokumenten-/ Daten-/ Textklassen benötigen Sie stattdessen?

Automatisierte inhaltliche Klassifizierung von Textdateien Ihrer Wahl ist die zentrale Basisfunktion für viele Anwendungen

  • IT-Security Rights Management-Lösungen (IRM)
  • Microsoft Server On-premise Active Directory
  • Microsoft Azure RMS Active Directory (Cloud Service)
  • Microsoft Sharepoint
  • Cloud-Auslagerung von Datenbeständen oder zur Dateien-Auswahl für Verschlüsselung
  • DMS/ECM Compliance, Information-Governance (automatische Identifikation von inhaltsbasier­ten archivierungspflichtigen Dateien), Posteingangsverarbeitung
  • Records Management
  • Personalaktenklassen
  • Storage-Markt Datenpflege, um nicht länger benötigte Dateien löschen und um Dateien auf andere Medien auslagern zu können

Unsere „d-Class“ textbasierte Autoklassifizierungstechnologie funktioniert anschaulich beschrieben wie eine Lupe, die Sie über einen Text halten und damit die Klassenkennung des Textes vollautomatisch angezeigt bekommen. Und dies mit einer Geschwindigkeit von ca. 10 Textdateien pro Sekunde. Weiteres auch hier 

Die Art der Dokumenten-/ Daten-/ Textklassen und die darauf anzuwendenden Rechte bestimmen Sie. Unser Auto-Klassifikations-Tool ermittelt die Daten-/Textinhalte für Ihre Textklassen. Die von uns automatisch klassifizierten Inhalte der Dokumenten-/ Daten-/ Textklassen sind die Anwendungsgrundlage beispielsweise für

  • Sensible Dokumente / Textinformationen, die geschützt werden müssen
  • Wichtige Textinformationen, die prioritär archiviert werden müssen
  • Passive Textdateien, die wenig gebraucht werden
  • Überflüssige Textdateien, die gelöscht werden könnten

Wir realisieren Ihre Projekte durch Pre-Processing Ihrer Textdokumente inkl. Trainieren unserer Autoklassifizierungs-Engines und liefern Ihnen die Angaben der zu schützenden Dateien sowie unsere hoch qualitativen fix- und fertigen Autoklassifizierungs-Engines (API) für die zukünftig anfallenden Dateien gemäß Ihren Klassenvorgaben. Und dafür übernehmen wir selbst die Qualitätsverantwortung, hier gibt es also kein kundenspezifisches Training, Für kundenspezifische, ergänzende Zusatzklassen bieten wir ein selbst trainierbares Zusatzverfahren.

Unsere Engines sind verfügbar als Nutzungslizenzen für on-premise Verwendung oder für Services (beides als pay per use-Modell)