Interview: Künstliche Intelligenz in der Technischen Dokumentation, Teil 1

plusmeta GmbH von

Menschliche Hand und Roboterhand bilden ein Herz

Schon heutzutage ist Künstliche Intelligenz in der Technischen Dokumentation verbreitet. Zum Beispiel dann, wenn es um die Vergabe von Metadaten geht. Aber was hat es mit Künstlicher Intelligenz genau auf sich und welche Methoden werden in Technischen Redaktionen schon eingesetzt? Diese Fragen haben Fabienne Lange und Eva-Maria Meier in einem Interview mit Susanne Meier von Quanos Content Solutions im Rahmen der tekom-Jahrestagung beantwortet.

Interview Teil 1: Künstliche Intelligenz und Technische Dokumentation

Frau Lange, Frau Meier, der Begriff „Künstliche Intelligenz“ ist in aller Munde. Können Sie uns erklären, was es mit Künstlicher Intelligenz genau auf sich hat und ob das mehr ist als nur ein momentaner Trend?

Eva-Maria Meier: Künstliche Intelligenz (KI) ist ein Teilgebiet der Informatik, das versucht menschliches Denken und Handeln zu imitieren. Den Begriff klar zu definieren ist schwierig, da die Grenzen zwischen KI und komplexen Algorithmen schwimmend sind. Wir verfolgen ein pragmatisches Verständnis von Künstlicher Intelligenz. Das bedeutet, wir nehmen an, dass es sich um Künstliche Intelligenz handelt „wenn das Ergebnis, das eine Software liefert, intelligent wirkt“.

Das Forschungsfeld gibt es schon sehr lange. Einige Methoden wurden bereits in den frühen 80er-Jahren entwickelt. In den letzten Jahren bekommt das Thema Aufschwung, weil durch größere Rechnerleistung und Cloud-Architekturen mehr Leistung für wenig Geld verfügbar ist. Dadurch können komplexe Modelle verarbeitet werden und Fortschritte erzielt werden.

In der Technischen Kommunikation ist Künstliche Intelligenz seit ca. 2 Jahren ein echtes Trendthema. Das liegt wahrscheinlich auch daran, dass immer mehr Softwareprodukte auf KI setzen.

Würden Sie sagen, dass die Menschen grundsätzlich offen für Künstliche Intelligenz sind oder begegnen sie dieser eher mit einer gewissen Skepsis?

Fabienne Lange: Die meisten Menschen haben in ihrem Alltag bewusst oder unbewusst bereits Kontakt zu KI-Anwendungen. Beispiele dafür sind z.B. Empfehlungen in Streaming-Diensten, Sprachassistenten wie Alexa und Siri, Kontrollmechanismen in Social Media Plattformen, Mail-Spamfilter und Maschinelles Übersetzen.

Im Umfeld der Technischen Kommunikation ist das Thema noch nicht ganz so alltäglich. Hier erleben wir in unserem Arbeitsalltag in erster Linie großes Interesse und Neugier. Allerdings sind wir auch schon mit der Sorge konfrontiert worden, dass Technische Redakteur:innen durch KI-Anwendungen ersetzt werden könnten. Diese Gefahr sehen wir allerdings aus mehreren Gründen nicht. Trotzdem gibt es - wie bei jeder neuartigen Technologie - Menschen, die Künstlicher Intelligenz skeptisch gegenüberstehen.

Die Angst vor der KI, die die Weltherrschaft übernimmt, können wir aber nehmen: Die heutigen Formen Künstlicher Intelligenz können nur das tun, wofür sie erstellt und trainiert wurden. Dabei sollen sie immer eine Unterstützung sein. Ein Werkzeug, das Menschen hilft und aufwendige Arbeiten reduziert.

Es gibt ja unterschiedliche Arten von Künstlicher Intelligenz. Welche Arten gibt es denn, und was bewirken sie?

Eva-Maria Meier: Welche Arten man unterscheidet, hängt von der Perspektive ab. Bei unserem pragmatischen KI-Verständnis unterscheidet man im Wesentlichen zwei Hauptfelder: Die regelbasierten Verfahren und das Machine Learning.

Bei den regelbasierten Verfahren werden Regeln zur Lösung von Problemstellungen programmiert nach dem Muster: Wenn Fall „x“ eintritt, tue „y“. Die Regeln sind kombinierbar und so können komplexe Systeme entstehen, die einen intelligent wirkenden Output liefern. Regelbasierte Verfahren umfassen auch Mustererkennung in Texten über Reguläre Ausdrücke und das Auswerten von Knowledge Graphen.

Anders als bei den regelbasierten Verfahren wird beim Machine Learning der Lösungsweg nicht vorgegeben. Hier lernt die KI aus statistischen Werten und Erfahrungen. Bei der Programmierung werden lediglich die Problemstellung und die Rahmenbedingungen sowie die Information, wie gelernt wird, mitgegeben. All diese Infos stecken in einem Modell. Vielleicht kommen wir darauf später noch einmal zu sprechen.

In den Medien ist in der Regel von Deep Learning die Rede, wenn es um Künstliche Intelligenz geht. Das ist ein Teilgebiet des Machine Learning. Hier werden komplexe Modelle mit vielen Schichten bestehend aus vielen vernetzen Entscheidungspunkten (Neuronen) aufgebaut. Im Prinzip versucht man dabei, das menschliche Gehirn nachzubauen, um komplexe Aufgabenstellungen wie Bilderkennung lösen zu können.

Damit die vielen Schichten gebildet werden können, sind sehr viele Trainingsdaten erforderlich. Hier haben beispielsweise Unternehmen wie Google mit allgemeinen Aufgabestellungen einen großen Vorteil, da sie z. B. alle Bilder aus ihren Online-Cloud-Lösungen zum Training einsetzen können.
Welche Kriterien die Künstliche Intelligenz zur Entscheidungsfindung heranzieht ist nicht einsehbar. Die Netze sind wie eine Blackbox.

Wolke, in der die beiden KI-Formen regelbasierte Verfahren und Machine Learning in jeweils eigenem Kreis dargestellt sind. Im Machine Learning Kreis ist zudem ein weiterer Kreis Deep Learning zu sehen, da Deep Learning zum Machine Learning dazu zählt.

Eine weitere Unterteilungsmöglichkeit für KI ist das „Format“ der zu verarbeitenden Daten. Dann unterscheidet man z. B. zwischen Bilderkennung sowie -klassifikation und Natural Language Processing. Beim Natural Language Processing geht es um das Verstehen und Generieren natürlicher Sprache.

Ein wichtiges Thema in der Technischen Dokumentation ist die Metadatenvergabe. Dort bringt Künstliche Intelligenz mittlerweile eine deutliche Arbeitserleichterung für die Technischen Redakteure. Können Sie erklären, wie die Metadatenvergabe mittels der sogenannten regelbasierten Verfahren funktioniert?

Fabienne Lange: Simpel ausgedrückt wird bei den regelbasierten Verfahren anhand vordefinierter Regeln entschieden, welche Metadaten vergeben werden. In den meisten Fällen wird dabei ein Text mit einer vordefinierten Werteliste abgeglichen. Wenn also beispielsweise ein bestimmtes Wort in einem Text gefunden wird, das in der Werteliste vorhanden ist, dann könnte dieses Wort als Metadatum vergeben werden. Tatsächlich ist die regelbasierte Vergabe aber deutlich komplexer. Hier werden verschiedene Regeln mit Suchmustern kombiniert, die eine genaue Metadatenvorhersage ermöglichen.

So ist unter anderem relevant, wo im Text das Wort gefunden wurde, ob das Wort selbst oder ein Indikator (bspw. ein Synonym) gefunden wurde und ob es sich um einen exakten Treffer oder ein Fuzzy Match handelt. In den meisten Fällen gibt es dabei dann auch mehrere Treffer im Text und die KI entscheidet anhand weiterer Regeln, welcher Treffer am wahrscheinlichsten ist, oder ob sogar mehrere Treffer vorgeschlagen werden.

Darstellung eines Dokuments, aus dem bestimmte Worte ausgelesen und mit Punkten versehen wurden.

Zudem können mithilfe von Wissensnetzen Abhängigkeiten zwischen Metadaten definiert werden oder sogar ganze Produktmodelle als Metadatennetz angelegt werden. Auch diese Wissensnetze können dann regelbasiert ausgewertet werden: Wenn ein bestimmter Wert “A” als Metadatum vergeben wurde, dann vergib auch Wert “B”.

Ein einfaches Beispiel dafür sind die Metadaten „Produkt“ und „Hersteller“. Über ein kleines Produktmodell kann hier ausgedrückt werden, wer das Produkt hergestellt hat. Wird dann das Produkt (z.B. “T3-B”) im Text gefunden, kann auch der Hersteller (z.B. “PI-Fan AG”) als Metadatum mitvergeben werden.

Darstellung eines Wissensnetzes, aus dem bestimmte Metadaten auf Grundlage der Vernetzung ausgelesen werden.

Der große Vorteil dieser regelbasierten Verfahren ist es, dass kein aufwendiges Training erforderlich ist. Mithilfe eines bestimmten Standard-Regelsatzes können die meisten Metadaten vorhergesagt werden. Passt etwas nicht, kann man die Regeln ganz einfach justieren. Am besten funktioniert das bei allen Metadaten, die in irgendeiner Form aus dem Text herausgelesen werden können, wie beispielsweise Produktbezeichnungen, Seriennummern, Baugruppen und Tätigkeiten.

Auch Machine Learning kann bei der Metadatenvergabe unterstützen. Wie funktioniert das genau?

Eva-Maria Meier: Beim Machine Learning benötigen wir immer – wie eingangs schon erwähnt –ein Modell als Basis. Das Modell muss dabei genau für die zu lösende Aufgabe trainiert sein, z. B. zum Erkennen der Dokumentart von PDF-Dateien.

Bei plusmeta arbeiten wir für die Inhaltsklassifikation mit “Überwachtem Lernen”. Beim “Überwachten Lernen” füttern wird die Künstliche Intelligenz mit gelabelten Beispieldokumenten. Wir benötigen dabei für jeden Wert eine kritische Menge an Beispielen aus der die KI lernen kann die Werte zu unterscheiden.

Training eines ML-Modells.

Die KI extrahiert dafür Merkmale. Diese werden gewichtet und fließen in das Modell ein. Welche Merkmale extrahiert werden, wird über einen Algorithmus bestimmt. Die Gewichtung ist dagegen eine veränderbare Stellschraube. Im Modell sind die charakteristischen Punkte für jeden Metadatenwert hinterlegt und in Form eines Vektors gespeichert.

Zeigen wir der KI anschließend unklassifizierte Texte, läuft dieselbe Merkmalsextraktion ab und die KI vergleicht, zu welcher Dokumentart die gefundenen Merkmale am besten passen. Liegt der Vektor des neuen Dokuments z. B. nahe am typischen „Bedienungsanleitungsvektor“, wird dieser Wert vorhergesagt. Die KI ist dabei immer nur so gut, wie das Modell aus dem Training. Es ist also besonders wichtig, die KI mit sehr gut klassifizierten Beispielen zu trainieren.

Trotzdem kann die KI auch mal falsch liegen. Im Feld erreichen wir bei sehr guten Modellen eine Genauigkeit von ca. 92%. Die Ergebnisse müssen daher immer noch einmal von Menschen geprüft werden. Liegt die KI falsch, kann ein Nachtraining mit der Korrektur angestoßen werden. Am besten arbeiten Künstliche Intelligenz und Technische Redakteur:innen also Hand in Hand!

Frau Meier, Frau Lange, vielen Dank für diesen ersten Teil des Gesprächs!

Teil 2 des Interviews folgt bald!

Einsatzmöglichkeiten von Künstlicher Intelligenz sowie Chancen und Grenzen besprechen wir im zweiten Teil dieser Blogserie. Der zweite Teil des Interviews wird im Blog von Quanos veröffentlicht.

Du willst mehr über die Künstliche Intelligenz von plusmeta erfahren oder hast noch eine Frage? Dann schreib uns eine Mail an hallo@plusmeta.de oder besuche unsere Website.

Frohe Weihnachten!

Leon Schiele von

Frohe Weihnachten!

Wir wünschen fröhliche Weihnachten! Die Zeit der Besinnlichkeit rückt immer näher und der Arbeitsalltag entschleunigt sich langsam. Die Termine werden weniger und wir freuen uns auf die Zeit mit unseren Liebsten. Wir wünschen allen Kunden und Partnern ein fröhliches, erholsames und vor allem ein gesundes Fest.

Dankeschön

Auf diesem Weg wollen wir uns bei allen Kunden und Partnern für die großartige Zusammenarbeit im letzten Jahr bedanken. Wir freuen uns darauf, mit frisch getankten Kräften in das Jahr 2022 zu starten.

Ein großes Dankeschön gilt natürlich auch unseren Mitarbeitern. Trotz der nicht immer einfachen Umstände arbeiten sie unermüdlich und setzen alles daran, die plusmeta Plattform für unsere Kunden kontinuierlich zu verbessern. Auch euch wünschen wir ein fröhliches Fest und eine besinnliche Weihnachtszeit.

Keine Karten für den guten Zweck

Auch dieses Jahr werden wir auf den Versand von Weihnachtskarten verzichten. Stattdessen spenden wir das Geld wieder an die KlinikClowns. Gerade in Zeiten wie diesen ist deren Arbeit wichtiger und schwieriger denn je. Sie wollen auch spenden? Auf der Website der KlinikClowns finden sie alle nötigen Informationen.

KlinikClows e.V.

Wir sind umgezogen!

Leon Schiele von

Bild unserer Mooswand

Seit unserer Gründung vor 2 ½ Jahren war die Gartenstraße in Karlsruhe unser Zuhause. Doch nach weiterem Zuwachs mussten wir uns langsam eingestehen: Es wird zu eng. Wir brauchen ein Büro, in dem wir uns verwirklichen und weiterwachsen können. Damit Du einen Einblick hinter die Kulissen bekommst, habe ich den Umzug für Dich schriftlich und in Bildern festgehalten. Sei gespannt!

Du fragst Dich, wohin wir gezogen sind?

Am 01.11.2021 haben wir unser neues Domizil bezogen: Ein 144 qm großes Büro in der Kaiserstraße 235 im Herzen von Karlsruhe. Nicht nur die Quadratmeterzahl unseres Büros hat sich vergrößert. Auch die Anzahl der Räume hat sich deutlich erhöht. Damit ist endlich genügend Platz und unser Team kann weiterwachsen. Auch neue Mitarbeiter finden hier noch genug Platz.

Einfach war der Umzug nicht. Viel Planung, Schleppen und Aufbauen prägten die letzten Wochen. Doch dank unseres motivierten Teams war das kein Problem.

Das neue Büro

Größer, zentraler, individueller. So kann man unser neues Büro gut in drei Worten beschreiben.

Größer musste es sein, da wir durch viel Zuwachs auch mehr Arbeitsplätze brauchen. Neben acht festen Arbeitsplätzen haben wir nun einen eigenen Videoarbeitsraum. Hier können wir einzelne Videokonferenzen oder Online-Schulungen abhalten. Er kann aber auch als normaler Arbeitsplatz genutzt werden. Ein Pausen-Bereich und ein eigener Konferenzraum dürfen nicht fehlen.

Zentraler, weil es nicht viel zentraler geht. Mitten in der Einkaufsstraße von Karlsruhe, bei der Postgalerie. Kulinarisch gesehen bietet die Kaiserstraße viele Möglichkeiten. Anfänglich waren wir noch traurig über den Verlust unseres Bäckers und Burger Food Trucks des Vertrauens. Die Tränen waren jedoch schnell weggewischt, als wir merkten, wie viele Optionen wir für die Mittagspause am neuen Standort haben.

Individueller, weil wir die Möglichkeit hatten, von Grund auf neu zu starten. Von der Wahl der Möbel bis hin zur Deko wurde beinahe alles neu angeschafft. Höhenverstellbare Schreibtische und neue Stühle sorgen für ergonomisches Arbeiten. Auch Pflanzen durften nicht fehlen. Gemeinsam mit neuen Bildern erzeugen sie eine wohnliche Atmosphäre. Ein weiteres Highlight: eine extra angefertigte Mooswand.

Du bist jetzt neugierig auf unser Büro? Dann ließ schnell weiter. Am Ende des Blogbeitrags geben wir Dir einen kleinen Rundgang durch unser neues Büro.

Neue Farbe fürs neue Büro

Farbe darf für ein gemütliches Arbeitsumfeld nicht fehlen. Deshalb war für uns der erste logische Schritt, dem Büro Farbe zu verleihen. Da wir die Gestaltung des neuen Büros selbst in die Hand nehmen wollten, griffen wir selbst zum Farbpinsel. Abkleben, abdecken, streichen: Wäre doch gelacht, wenn wir das nicht schaffen!

An zwei aufeinanderfolgenden Tagen fand die Aktion statt. Außer einem Mitarbeiter in „Bereitschaft am Telefon und Rechner” packten alle fleißig mit an.

Am ersten Tag wurde viel Vorarbeit geleistet und noch mehr weiß gestrichen. Die Farben „erhabenes Agavengrün“ und „inspirierendes Horizontblau” kamen am nächsten Tag an die Wand.

Geschafft! Nach zwei anstrengenden, aber doch spaßigen Tagen, war das Büro am Abend fertig gestrichen und wir konnten das erste gemeinsame Feierabendbier im neuen Büro genießen.

plusmeta Mitarbeiter beim Streichen

Der Chef beim Streichen

plusmeta Team beim Feierabendbier

Aus Alt mach Neu

Nachdem alle Wände wieder gut aussahen, ging es an den Boden. Diese Arbeit gaben wir lieber in die Hände eines Profis. Der Boden wurde abgeschliffen und frisch eingeölt. Dann hieß es erstmal warten.

Nach ein paar Tagen war das Büro wieder begehbar und wir konnten mit dem Hauptumzug starten.

Der Umzug

Zuerst wurden die ganzen Bildschirme und Verkabelungen abgebaut. Danach galt es, alles transportsicher zu verpacken und in den angemieteten Transporter zu schaffen. Dank vielen helfenden Händen schafften wir das gesamte Inventar innerhalb von wenigen Stunden an unseren neuen Standort. Dabei unterstützte uns auch das gesamte ICMS-Team, mit dem wir uns zuvor das Büro teilten.

Am nächsten Morgen wurden die Möbel zur neuen Adresse geliefert. Diese mussten erstmal nach oben geschafft werden, was eine ganzschön schweißtreibende Arbeit war. Beim Aufbau legten wir ein starkes Tempo an den Start und schafften es, an einem Tag alles fertig aufzubauen. Am darauffolgenden Arbeitstag konnte jeder seinen neuen Arbeitsplatz beziehen und einrichten. Kleinere Dinge gab es trotzdem noch zu tun. Deko aufstellen, Pflanzen beschaffen, Bilder und Whiteboards aufhängen. Viel Kleinkram der viel ausmacht.

Mittlerweile ist alles fertig und wir haben uns in unserem neuen Büro eingelebt. Mit dem Ergebnis sind wir mehr als zufrieden.

Das alte Büro wird ausgeräumt

Inventar aus dem alten Büro

Mitarbeiter beim Aufbauen der Möbel

Mitarbeiter trinken ein Feierabendbier am Konferenztisch

Kleiner Rundgang gefällig?

Der Ursprung und die Heimat unseres Unternehmens ist und bleibt Karlsruhe. Deshalb wurden alle Räume nach Plätzen in Karlsruhe benannt: Wir beginnen auf dem Flur direkt am Eingangsbereich. Hier landet der erste Blick direkt auf unserer exklusive plusmeta-Mooswand. Als Erinnerung an unseren ursprünglichen Standort, ergatterte Jan auf dem Flohmarkt ein altes Straßenschild der Lessingstraße. Es schmückt nun unseren Flur. Gehen wir weiter in die einzelnen Räume:

Konferenzraum – Schlossplatz

Ein guter Konferenzraum ist wichtig. Daily, Weekly und andere Absprachen werden meist im Konferenzraum abgehalten. Ein großer Fernseher und eine große Konferenz-Kamera gehören zur Grundausstattung. Der höhenverstellbare Konferenztisch bietet die Möglichkeit, Meetings im Stehen oder Sitzen abzuhalten. Durch Kamera und Fernseher lassen sich Remote-Teilnehmer super zuschalten.

Mitarbeiter beim Workshop im Konferenzraum

Team-Büro – Ludwigsplatz

Das Team-Büro ist der größte Raum an unserem neuen Standort. 6 Mitarbeiter finden an 3 „Schreibtisch-Inseln“ Platz. Natürlich kann auch hier an jedem Schreibtisch im Stehen oder im Sitzen gearbeitet werden. Eine große Besprechungsecke ist hier auch zu finden. Sie wird auch für die gemeinsamen Mittagspausen genutzt. Viele Pflanzen, Bilder und andere Dekorationen sorgen für den gewissen Wohlfühlfaktor.

Bild des Team-Büros

Verwaltungsbüro – Gutenbergplatz

Das „Chef-Büro“. Hier sitzen alle, die mit Organisation, Verwaltung und Geschäftsführung zu tun haben. In einer Ecke des Raumes findet sich noch eine weitere Besprechungsecke. Sie wird hauptsächlich für kleinere, interne Absprachen genutzt.

Bild des Verwaltungsbüros

Videoarbeitsraum – Lidellplatz

Ein wichtiges Online-Meeting, ein Vortrag oder eine Schulung? Genau dafür ist unser neuer Videoarbeitsraum gedacht.

In unserem alten Büro kam es öfters zu Terminkonflikten bei der Buchung des Konferenzraums. Dadurch mussten einige Meetings im Team-Büro abgehalten werden. Die Geräuschkulisse und das übliche Treiben in einem größeren Büroraum sind aber nicht immer optimal für Online-Termine. Da wir viele Online-Termine haben, ist es uns sehr wichtig, einen idealen Raum dafür zu haben.

Der Videoarbeitsraum hat zwei komplett eingerichtete Arbeitsplätze mit jeweils einer Kamera und einem Ringlicht für bessere Beleuchtung. Gedacht ist dieser Raum auch für Remote-Mitarbeiter, die im Büro vorbeischauen. Sie können den Lidellplatz als Arbeitsplatz nutzen.

Bild unseres Videoraums

Küche

In der Küche steht – wie könnte es anders sein – der Kaffee im Vordergrund. Eine Filtermaschine für den schnellen Koffein-Kick zwischendurch und eine Siebträgermaschine für Hobby-Baristas. Natürlich beinhaltet die Küche auch andere Dinge als nur eine Kaffeemaschine. Ein Kühlschrank zum Lagern des Mittagessens, eine Mikrowelle, Herdplatten und viele andere nützliche Gadgets fürs leibliche Wohl sind hier zu finden. Auch kleine Snacks stehen hier immer bereit.

Bild unserer Küche

Kicker-Ecke – Wildparkstadion

Mit unserem neuen Büro wurde unser lang ersehnter Wunsch einer Kicker-Ecke wahr. Egal ob ein Turnier in der Pause oder eine kleine Runde, um den Kopf wieder frei zu spielen, der Kicker ist nicht mehr wegzudenken. Auch unsere Mitarbeiterspinde sind in der Kicker-Ecke gut aufgehoben. In diesen Spind hat jeder die Möglichkeit seine privaten Dinge abzulegen. Läuft man im Büro beispielsweise lieber mit Hausschuhen umher, kann man dort seine Straßen-Schuhe lagern.

Bild unserer Kicker-Ecke

Wie Du bestimmt bereits gemerkt hast, ist unser Büro für die Zusammenarbeit in einem hybriden Team ausgelegt. Verschiedene Gadgets wie Ringlichter oder eine Konferenz-Kamera machen eine Mischung aus Büroalltag und Remote-Arbeiten möglich. Du willst mehr über die Zusammenarbeit von Homeoffice und Büro erfahren? Dann schau doch mal bei unserem Blog-Artikel zum Thema vorbei: Büro oder doch lieber Homeoffice? So sieht unser neuer Büro-Alltag aus.

Dir brennen noch weitere Fragen zu unserem neuen Büro unter den Nägeln? Oder Du hast Interesse an unserer plusmeta-Plattform? Dann freuen wir uns über Deine Nachricht an: hallo@plusmeta.de

Deep Learning in plusmeta - Das Forschungsprojekt DEEEP

Eva-Maria Meier von

Teaserbild Deeep

DEEEP steht für „Deep-Learning-Erweiterung der plusmeta-Plattform für die Erkennung und Extraktion von Produktwissen“. Dank einer Landesförderung können wir dieses neue Forschungsprojekt angehen. Unseren Forschungsgegenstand und die Ziele des Projekts stellen wir Ihnen in diesem Blogbeitrag vor.

KI made in BW

Mit dem Innovationswettbewerb „KI made in BW“ fördert das Land Baden-Württemberg kleine und mittelständische Unternehmen, die Künstliche Intelligenz einsetzen und gibt dem Technologiestandort Baden-Württemberg damit ordentlich Auftrieb. Wir freuen uns, dass wir mit plusmeta und unserem Vorhaben überzeugen konnten. Im Juli haben wir davon schon kurz berichtet.

Die Grafik zeigt das Logo des Wirtschaftsministeriums Baden-Württemberg.

Die Förderung gibt uns die Möglichkeit, neue KI-Methoden zu implementieren. Im „Geschäftsalltag“ fallen Projekte mit derartigen Innovationssprüngen in der Regel Zeitdruck und Budgetgrenzen zum Opfer.

Jetzt haben wir die Chance richtig in das Thema einzutauchen und aktuelle Forschungsergebnisse einzubringen. Natürlich bleiben wir dabei immer praxisverbunden und denken Anwendungsmöglichkeiten für unsere Kunden mit. Dementsprechend startet unser Projekt auch mit einer Anforderungsanalyse.

Worum geht es im Forschungsprojekt? - Datenbasis für Industrie 4.0 schaffen

Die Technische Dokumentation zu Produkten enthält wichtige Informationen für die sichere und effiziente Anwendung, Pflege und Wartung. Heute sind diese Informationen in der Regel nur für Menschen lesbar in Prosatexten versteckt. Dem gegenüber steht die Herausforderung, dass sämtliche Industrie-4.0-Szenarien auf der Verfügbarkeit maschinell verarbeitbarer Informationen und Produktdaten basieren.

Dokumente werden von der KI analysiert und das Wissen wird automatisiert extrahiert. Dadurch kann es maschinenlesbar bereitgestellt und in modernen Anwendungen genutzt werden.

Das Anreichern mit maschinenlesbaren Informationen (Metadaten) bei der Erstellung ist in vielen Bereichen noch nicht angekommen. Die manuelle Nachbearbeitung von Bestandsdaten ist wirtschaftlich oft nicht tragbar. plusmeta bietet heute schon verschiedene Methoden, diese Aufgabe automatisiert mit KI-Unterstützung zu bewerkstelligen. Mit den im Rahmen von DEEEP geplanten Entwicklungen, wird die Datenaufbereitung mit Metadaten noch effizienter und funktional erweitert.

Die plusmeta-KI-Methoden werden um die KI-Methode Deep Learning erweitert.

Innovation: Deep Learning für die Technische Kommunikation

DEEEP erweitert das Portfolio der KI-Methoden um „Deep Learning“. Deep Learning ist eine junge Disziplin innerhalb des Machine Learnings. Dabei werden dem menschlichen Gehirn nachempfundene neuronalen Netze aufgebaut. Deep Learning eröffnet für plusmeta die Möglichkeit, zentrale neue Features mit deutlichen Verbesserungen einzuführen.

In der Technischen Kommunikation findet Deep Learning für die Klassifikation von Inhalten bisher nur in Forschungskontexten Einsatz. Mit der plusmeta-Erweiterung wird Deep Learning auch für Praktiker zugänglich.

Mit dem Vorhaben werden drei Ziele verfolt. Der Initialaufwand soll gesenkt werden, Bilder sollen verarbeitet werden können und Vorhersagengenauigkeit soll gesteigert werden.

Initialisierungsaufwände senken

Wer aktuell Machine Learning in plusmeta nutzen möchte, trainiert zunächst manuell ein Machine-Learning-Modell. Für jeden vorherzusagenden Wert ist dabei eine kritische Menge an händisch klassifizierten Dokumenten nötig. Bei Deep Learning können wir auf vortrainierten Modellen aufsetzen und auch unüberwachte Trainingsmethoden integrieren. Beispielsweise sind für die Datenexploration Verfahren denkbar, die ohne Vortraining auskommen (Clustering). Außerdem ist durch die Kombination verschiedener KI-Methoden ein Vorschlagswesen für zuweisbare Metadaten denkbar.

Verarbeitbare Medien erweitern

Mit Deep Learning Modellen können neben Texten weitere Medien analysiert werden. plusmeta soll zukünftig in der Lage sein, Bilder zu interpretieren und zu klassifizieren. Ziel ist es, unterscheiden zu können, um welche Grafikart es sich handelt. Zeigt das Dokument einen Elektroschaltplan, eine isometrische Produktansicht oder einen Hydraulikplan?

Vorhersagegenauigkeit steigern

Deep Learning ermöglicht ein tiefergehendes Verständnis der Inhalte. Die Erwartung liegt daher nahe, dass mit Deep Learning die Klassifikation noch zielsicherer funktioniert. Auch kundenübergreifend nutzbare Modelle sind dabei denkbar.

Synergie aus Forschung und Praxis

Unsere Ziele können wir nur erreichen, wenn wir ausreichend Trainings- und Testdaten haben. Die besten Ergebnisse erzielen wir sicher, wenn wir direkt mit realistischen Industriedaten arbeiten.

Unternehmen, deren Daten wir im Forschungsprojekt nutzen dürfen, bekommen bereits in einem frühen Stadium Einblicke in unsere Forschungsergebnisse. plusmeta-Kunden, die eine Datenpartnerschaft mit uns eingehen, dürfen Entwicklungen, die im Rahmen des Projekts entstehen, vor allen anderen testen und einsetzen.

Sie sind neugierig geworden? Dann schreiben Sie uns eine E-Mail an hallo@plusmeta.de!

6 Expertenfragen zur VDI 2770

Eva-Maria Meier von

FAQ zur VDI 2770

Die VDI-Richtlinie 2770 liefert einen Standard für den digitalen Informations­austausch in der Prozess­industrie. Nachdem wir Ihnen im ersten Teil unserer Blogserie die Basics gezeigt haben, beantworten wir im zweiten Teil tiefergehende, komplexere Fragen. Diese Fragen sind uns begegnet, wenn wir in Kundenprojekten tiefer in die automatisierte Paketerstellung eingetaucht sind.

Eckpfeiler der VDI 2770 in Kürze

Wenn Sie den genauen Aufbau von VDI 2770 noch nicht kennen, empfehlen wir Ihnen den ersten Teil unserer Blogserie. Für Eilige fassen wir die wichtigsten Punkte hier kurz zusammen:

  • Die VDI-Richtlinie 2770 beschreibt ein Containerformat und ein Metadatenmodell zur Klassifizierung von Dokumenten.
  • Die Dokumentationscontainer beinhalten neben Dokumentcontainern die sogenannten Hauptdokumente als Inhaltsübersicht und zur Aufnahme der entsprechenden Metadaten.
  • Die Dokumentcontainer klammern die Metadaten-Datei, das Dokument selbst und optionale weitere Formatvarianten.
  • Um einen gezielten Informationszugriff zu ermöglichen, ist die Einordnung in eine von 12 Dokumentkategorien und das Herstellen eines eindeutigen Produktbezugs bindend.
  • Die Metadaten auf Dokument- und Dokumentationscontainer-Ebene werden in XML-Dateien gespeichert.
  • Die Container können verschachtelt sein. Die Verschachtelung erfolgt analog zum Produktaufbau.

Ein VDI-2770-Dokumentationscontainer, der 2 Dokumentcontainern und das Hauptdokumenten als PDF/A und XML enthält.

Das Informationsmodell der VDI 2770 – alle Metadaten im Überblick

Steigt man tiefer in das Thema „VDI 2770“ ein und fokussiert die automatisierte Erstellung, drehen sich die zu beantwortenden Fragen in der Regel um die Details des Datenmodells. Welche Metadaten gehören an welches Element? Welche Metadaten sind optional? Fast alle Expertenfragen beschäftigen sich mit dem VDI-2770-Informationsmodell. Die folgende Grafik gibt Ihnen vorab schonmal einen Überblick.

Visualisierung des VDI-2770-Informationsmodells in Anlehnung an die UML-Grafik in der Richtlinie VDI 2770 auf Seite 59

Wie sind mehrsprachige Dokumente und Sprachvarianten von Dokumenten zu behandeln?

International agierende Unternehmen verwalten ihre Produktinformationen in der Regel in mehreren Sprachen oder haben mindestens die Anforderung, sie in unterschiedlichsten Sprachen auszuliefern. VDI 2770-Pakete bilden die Sprach­abhängigkeit der Dokumente in einem entsprechenden Pflichtmetadatum ab.

Die Sprache muss für jede Dokumentversion angegeben werden. Wenn innerhalb eines Dokuments Inhalte in unterschiedlichen Sprachen vorkommen, sind alle enthaltenen Sprachen für das Dokument anzugeben. [vgl. VDI 2770, S.26]

Wenn für jede Sprache ein eigenes Dokument vorhanden ist, müssen die Metadaten vollständig für jedes Dokument (bzw. Dokumentversion) übergeben werden. Das Hauptdokument enthält in diesem Fall pro Sprachvariante eine Zeile. Das Hauptdokument selbst kann ebenfalls in mehreren Sprachen vorliegen.

Beispiel-Hauptdokument mit 5 Dokumenten. Ein Dokument enthält Inhalte in Deutsch, Englisch und Französisch. Ein anderes Dokument gibt es in jeweils einer Versionen für jede Sprachen

Übersetzungen von Dokumenten können leicht zugeordnet werden, wenn diese bidirektional über eine Beziehung (DocumentRelationship) verknüpft sind. Für die Typisierung der Beziehung gibt es die Werte „TranslationOf“ und „Affecting“.

Wie geht die VDI 2770 mit Dokumentversionen um?

Vielleicht ist Ihnen die Dokumentversion bereits im Hauptdokument in der Abbildung ins Auge gestochen. Das Datenmodell der VDI 2770 kennt neben Dokumenten auch Dokumentversionen.

Die klassifizierenden Metadaten wie die Dokumentart werden auf der Dokument-Ebene vergeben. Für jedes Dokument muss mindestens eine Dokumentversion vorhanden sein. An der Dokumentversion hängt die tatsächlich physische Datei (DigitalFile). Darüber hinaus werden folgende Metadaten an der Dokumentversion vergeben: [vgl. VDI 2770, S. 25 f.]

  • Sprache (Language)
  • Dokumentbeschreibung (DocumentDescription)
    Die Dokument­be­schrei­bung besteht aus dem Titel (Title), Schlagwörtern (KeyWords) und einer Zusammenfassung (Summary)
  • Status (LifeCycleStatus)
    Der Status kann „InReview“ oder „Released“ sein. Übergeben werden sollen die Dokumente allerdings alle im Status „Released“.
  • Seitenzahl (NumberOfPages)
  • Beteiligte Partein bzw. Organisation inkl. ihrer Rolle (Party mit Role und Organization)
  • Dokumentbeziehung (DocumentRelationship mit Type)

Wie gibt man Equipment-Id und Technische Plätze in VDI-2770-Paketen an?

Wenn Sie Berührungspunkte mit der Wartungsplanung im Anlagenbau haben, sind Ihnen die Begriffe Equipment und Technischer Platz bestimmt bekannt, denn die Begriffe stammen aus dem in der Branche weiterverbreiteten Softwaretool SAP Plant Maintenance.

Ein Equipment ist „ein individueller, körperlicher Gegenstand, der eigenständig instandzuhalten ist. Es kann in eine technische Anlage oder einen Anlagenteil eingebaut sein.“ [Quelle: SAP Help ]. Beispiele für Equipments sind Produktions­mittel, Transportmittel, Prüf- und Messmittel, Fertigungshilfsmittel, Gebäude oder PCs.

Technischer Platz bezeichnet eine „organisatorische Einheit der Logistik, die die instandzuhaltenden Objekte eines Unternehmens nach funktionalen, prozess­orientierten oder räumlichen Gesichtspunkten gliedert. Ein Technischer Platz repräsentiert den Ort, an dem eine Instandhaltungsmaßname durchzuführen ist.“ [Quelle: SAP Help ]

Die VDI 2770 enthält für Equipments und den Technischen Platz keine eindeutige Stelle. Es gibt zwar auf der Ebene des ReferencedObject zwei durch die Richtlinie vorgesehene Felder, allerdings sind die Begriffe in der Norm nicht eindeutig definiert und haben die Anforderungen aus der Praxis bisher nicht erfüllt.

Details des VDI-2770-Informatiosmodells zur Angabe des ReferencesObjects

In unseren bisherigen Projekten war die EquipmentId der instanzielle Produktbezug. Dieser kann aber nur über die ObjectId Validierungskonform abgebildet werden. Um die Werte nicht mehrfach als ObjectId und als EquipmentId eingeben zu müssen, fiel die Entscheidung darauf, einen eigenen RefType für die EquipmentId einzuführen.

Der RefType gibt an, um welchen Indentifikatortyp es sich handelt. Die Richtlinie nennt einige RefType als Beispiele, z. B. Bestellnummer, ID des Produkttyps oder ID nach DIN SPEC 91406. Die Liste ist keine geschlossene Liste (Enumeration) und kann erweitert werden [Quelle: VDI 2770, S. 59].

Für den Technischen Platz wurden ebenso verfahren, da auch dieser für bestimmte Dokumente den eineindeutigen Produktbezug darstellt.

Informationsmodell für den Produktbezug eines Hauptdokuments

Was sind Prüfsummen und wozu sind sie gut?

Mithilfe von Prüfsummen lässt sich die Integrität von Informationen überwachen. Dabei wird für die Daten eine Prüfsumme errechnet. Wird der Inhalt verändert, verändert sich auch die Prüfsumme. Vergleicht man die Werte z. B. vor und nach dem Hoch- oder Herunterladen, kann man Veränderungen feststellen. Identische Inhalte führen zu identischen Prüfsummen.

Sowohl für die Dokumentcontainer als auch für die Dokumentationscontainer können Prüfsummen berechnet werden [Quelle: VDI 2770, S. 33]. Ob unter­schiedliche Pakete identische Dokumentcontainer enthalten oder ein Dokument­container nachträglich verändert wurde, lässt sich so einfach anhand der Prüfsummen ermitteln. Die Angabe der Prüfsummen ist optional.

Prüfsummen für Dokumentationscontainer und Dokumentcontainer

Die errechneten Prüfsummen können logischerweise nicht gleichzeitig Inhalt des Pakets sein. Die Prüfsummen sind separat zu übermitteln. In welcher Form? Dazu sind laut Richtlinie Abstimmung zwischen Sender und Empfänger (also zwischen Lieferanten und Kunden) zu treffen.

PDF als obligatorische Dateiformat – aber welches genau?

Neben Fragen zum Metadatenmodell gibt es auch immer wieder Nachfragen zu den erlaubten Dateiformaten. Um einen dauerhaften, digitalen Zugriff, sprich Darstellbarkeit und Durchsuchbarkeit der Dokumente zu gewährleisten, schreibt die VDI 2770 vor, dass alle Dokumente mindestens im PDF/A-Format vorliegen müssen.

Aber PDF/A ist nicht gleich PDF/A. Es gibt unterschiedliche Versionen dieses für die Langzeitarchivierung konzipierten Formats. Die Anforderungen des Standards sind in der folgenden Tabelle gelistet. Priorität 1 ist die empfohlene und zu bevorzugende Version. [Quelle: VDI 2770, S.30 f]

Priorität PDF-Formate Erläuterung
1 PDF/A-2a,
PDF/A-3a
PDF/A-2 und PDF/A-3 basieren auf PDF 1.7, das als ISO 32000-1 normativ festgelegt ist.
2 PDF/A-1a Das Dateiformat von PDF/A-1 basiert auf PDF 1.4, welches nicht genormt ist. Das PDF/A-1-Dateiformat unterstützt keine Transparenz bei Bildern, was zur Folge hat, dass transparente Hintergründe schwarz dargestellt werden und somit die Anforderung der korrekten Darstellung gegebenenfalls nicht erfüllt wird.
Ausnahme für Zeugnisse, Zertifikate, Bescheinigungen (Kategorie 02-04) PDF/A-1b, PDF/A-2b, PDF/A-2u, PDF/A-3b, PDF/A-3u Dokumenten mit der Dokumentkategorie 02-04 Zeugnisse, Zertifikate, Bescheinigungen sind häufig eingescannte Papierdokumente. Die Inhalte sollten trotzdem durchsuchbar sein. Ggf. über separat bereitgestellten Text.
Verboten Containerfunktion von PDF/A-2 und PDF/A-3 Nicht verwenden!

Und wie erstellt man die Formate? In den gängigen Office- und DTP-Programmen können bei der PDF-Produktion unterschiedliche Optionen ausgewählt werden. Für Inhalte aus Content-Management-Systemen muss die Transformation entsprechend in der Publikationsstrecke berücksichtig werden. Tools zur Erzeugung von VDI-2770-Paketen, wie die plusmeta-Plattform, können die Konvertierung in das korrekte PDF/A-Format ebenfalls automatisch vornehmen.

Wie kann man konforme Pakete automatisiert erstellen?

Die richtigen Pakete zu packen kann von Hand ganz schön aufwendig sein. Zum Glück gibt es Tools wie plusmeta! In plusmeta unterstützt Sie Künstliche Intelligenz bei der Vergabe der richtigen Metadaten und die Pakete werden automatisiert generiert.

Wie Sie in plusmeta mit KI-Unterstützung im Handumdrehen erstellen, zeigen wir Ihnen im dritten Teil unserer Blogserie. Wenn Sie den nächsten Blogartikel nicht abwarten wollen, zeigen wir Ihnen plusmeta und die automatisiere VDI-2770-Paketgenerierung auch gerne vorab schon in einer unverbindlichen Demo.

Wir haben Ihre Frage zur VDI 2770 nicht beantwortet? Schreiben Sie uns eine E-Mail an hallo@plusmeta.de!