Skillbyte Podcast #1: Künstliche Intelligenz - Funktionsweise und Anwendungsbeispiele aus der Praxis
Willkommen zum Skillbyte-Podcast! Skillbyte ist Ihr Partner für digitale Exzellenz.
In diesem Podcast geht es um das Thema: Künstliche Intelligenz - Funktionsweisen und Anwendungsbeispiele aus der Praxis.
// Inhalt //
01:51 -> Definition: Was ist künstliche Intelligenz überhaupt?
15:20 -> KI: Wie trennt man zwischen Hype und praktischer Anwendbarkeit für mein Unternehmen?
19:30 -> Praxisbeispiel: Chatbots zur Reperaturannahme, Erkenntnissgewinn und Produktentwicklung
22:40 -> Praxisbeispiel: Klassifikation von Video-Rohmaterial bei multinationalen Medienunternehmen
33:02 -> Praxisbeispiel: GravityCV.com - Erkennung von strukturierten Daten in unstrukturierten Word/PDF Dateien für die automatisierte Datenübernahme
40:36 -> Weitere Infos im Skillbyte Blog
Abonnieren Sie diesen Podcast und besuchen Sie uns auf www.skillbyte.de
Feedback und Fragen gerne an podcast@skillbyte.de
AUTOMATISCH ERZEUGTES TRANSKRIPT
Herzlich willkommen zum Ersten Podcast, das ist heute eine Premiere des Skillbyte Podcast Skillbyte Podcast Nummer 1 und unser heutiges Thema ist Künstliche Intelligenz, Funktionsweise und Anwendungsbeispiele aus der Praxis. Und ja, ich bin ja heute mit Masiar.
Hallo Maurice, Hallo Masiar und zusammen sind wir betreuen wir die Softwareentwicklung bei Skillbyte bzw. die Big Data Sparte bei Skillbyte und möchten heute ein bisschen über das Thema Künstliche Intelligenz sprechen. Was ja. Ich glaube, das kann man unumwunden sagen, in der letzten Zeit sehr, sehr häufig in den Medien aufgetreten ist, in diversen positiven wie negativen Kontexten und auch von Kundenseite oder Kooperationspartner Seite sehr oft an uns herangetragen wurde.
Ja, genau das, was man merkt ist, dass viele Kunden verunsichert sind bzw. die Themen gar nicht auseinanderhalten können. Künstliche Intelligenz ist ein sehr weiter Begriff. Weitere Begriffe wie Machine Learning spielen eine Rolle und man weiß eigentlich nicht, was die einzelnen Begriffe bedeuten und letztendlich, was für einen selber wichtig im Unternehmen ist oder was man davon einsetzen kann. Künstliche Intelligenz sind nicht unbedingt Roboter, da denkt man sofort an Robotik oder selbstfahrende Autos. Aber künstliche Intelligenz ist viel mehr.
Und was wir versuchen wollen, ist hier, die Begrifflichkeit ein bisschen auseinander zu ziehen und ein paar Fallbeispiele zu nennen oder zu zeigen, wo welcher Begriff hin passt und wie man das Fallbeispiel mal auf das eigene Unternehmen beziehen kann.
Das ist ja dann sicherlich auch der Wert für unsere Zuhörer. Was konkret mache ich mit dem Thema Künstliche Intelligenz? Wir können einfach mal anfangen und definieren, was künstliche Intelligenz ist. Was das gerade schon gesagt, dass es ein sehr weiter Begriff für einen selber bedeutet. Künstliche Intelligenz oder KI ki im englischsprachigen Kontext ist. Für mich persönlich bezeichnet das teilweise auch sehr alte Technologien oder Algorithmen, wo es einfach darum geht, die klassische Softwareentwicklung. Da programmiert man quasi die Befehle direkt runter und hinterher kann man, hält sich das Programm stoisch an die Befehle und führt die einfach nacheinander aus.
Und wenn es zum Beispiel zu einem Fehler kommt oder zu einer Entscheidung kommt, dann kann man hinterher nachvollziehen Okay, das und das ist der Programmablauf Plan. Und deshalb ist diese Entscheidung von dem von der Software getroffen worden, oder? Deshalb ist dieser Fehler passiert bei künstlicher Intelligenz. Für mich persönlich sind das man hat nicht mehr, man programmiert nicht mehr Software, sondern man hat Datensätze, also zwei oder oder zehntausende Bilder, wo hundert Hunde und Katzen drauf sind.
Oder man gibt einem Algorithmus dieses Daten Sample oder 90 prozent dieses Daten Samples, damit er lernt was macht einen Hund aus, was macht eine Katze aus und kann dann später auf Bildern, die der Algorithmus nicht kennt, dann eine Vorhersage treffen? Ist da ein Hund oder eine Katze drauf? Und wenn der Algorithmus sich entscheidet, da ist ein Hund drauf oder eine Katze drauf, das kann richtig und das kann falsch sein. Dann kann man nicht mehr sagen okay, aufgrund dieser und jener Programm Verzweigung hat er sich für Hund oder Katze entschieden, sondern auf Basis seines Wissens oder seiner antrainierten Entscheidung hat er, ist die Funktion, die Strafaktion so entstanden, dass sie sich vor Hund oder Katze entscheiden muss.
Das ist für mich der Schlüssel Unterschied in diesen Technologien.
Ah ja, interessant. Also im Prinzip, dass du letztendlich eine Software, ein Datenmodell erstellst, was mit unvorhergesehenen Daten zurechtkommt. Das heißt bei der Software, wie du sagtest, läuft das Ganze nach einem ganz bestimmten Schema von A bis Z. Genau. Und jetzt mit dieser künstlichen Intelligenz kann die Software dann auch mit dieser Situation umgehen, die ja vorher nicht bekannt oder gesehen hat.
Genau, genau. Bei klassischer Softwareentwicklung ist es ja häufig so Man spezifiziert ein Format, ein Datenformat, ein Bildformat oder sonst irgendwas. Und dann werden alle Bilder in genau diesem Format gespeichert oder alle Texte genau in diesem Format umgewandelt nach vorher festgelegten Regeln. Und jetzt ist es halt so ich. Ja, ich trainiere auf mir bekannten Samples einen Algorithmus, der dann hinterher unbekannte oder mir auch unbekannte Testdaten von der Welt zugespielt bekommt und dann seine Entscheidung auf Basis seines Wissens trifft.
Und das kann auch dieses Wissen oder diese Auswahl der Tests Samples. Das unterliegt natürlich auch Fehleinschätzungen. Es ist zum Beispiel vor einigen Wochen habe ich das in der Zeitung gelesen, dass da gibt es einen Feldversuch in Amerika, wo die Rückfall Wahrscheinlichkeit von Straftätern vorhergesagt werden sollte. Und diesen Algorithmus jaja, der Algorithmus hat halt Menschen mit dunkler Hautfarbe benachteiligt. Ja, ja, das heißt genau die Vorurteile, die die Menschen sozusagen haben oder die, die in diesen Test Sample Zs drin stecken, die nehmen natürlich auch die Maschinen oder die diese Algorithmen dann eben an, sodass man sehr genau aufpassen muss, was man da denn hinein füttert am Anfang.
Da fällt mir auch ein Beispiel ein Microsoft hat sein Boot mit künstlicher Intelligenz auf Foren losgelassen, um zu lernen und nach einem Monat hat der Bot quasi ein Rassist oder ein Rechtsradikaler. Und man hat ihn sofort abgeschaltet, weil er sich dieses dieses Verhalten angeeignet hat. Also das kann auch nach hinten losgehen.
Aber was waren das für Foren? Also ganz normale Foren oder irgendwelche Foren, die erwarten lassen, dass das Verhalten so gar nicht, aber kann man auch im Netz mit Sicherheit nachlesen, oder? Das ging auf jeden Fall nach hinten los. Die haben sofort abgeschaltet.
Okay, aber das Beispiel zeigt genau das, worauf ich hinauswill. Oder man muss sehr genau aufpassen, nur weil man dann glaubt, grade da wird ja auch sehr viel künstliche Intelligenz als Allheilmittel für alle möglichen Probleme und Kontexte beworben von großen Cloud Anbietern. Gerade da muss man schon sehr genau hingucken. Es ist eine Lösung für vieles oder man kann viele technische Probleme dadurch verbessern. Aber ich glaube auch, dass man da sehr vorsichtig sein muss.
Für mich ist das Thema wie Falk oder ich sehe es wie folgt. Also es gibt ja dieses Machine Learning, damit fing ja im Prinzip alles an. Dieses Könnte, diese künstliche Intelligenz ist auch nicht neu. Also das ist im Prinzip eine sehr alte Technologie oder algorithmische. Ich habe selbst mal in meiner Diplomarbeit in dieser Richtung geschrieben. Also das Thema ist sehr alt. Also ich habe vor 25 Jahren geschrieben, insofern das ist nichts Neues, das hat halt nur eine Renaissance erlebt.
Oder ist es gerade so gehandhabt worden, weil die Berechnung sehr kostenintensiv ist? Und inzwischen ist Hardware so winzig geworden, dass man parallel diese dieses Lernen, was ja das die eigentliche Zeit kostet, zur gleichen Zeit auch vielen, vielen, vielen Maschinen und auf Grafikkarten ausführen kann. Deswegen ist das jetzt so interessant. Aber das Machine Learning an sich ist eigentlich keine künstliche Intelligenz. Das hat eher mit lineare Algebra zu tun. Beispiel in der Suchmaschine Wenn ich eine Suchmaschine hatten, die den Begriff ein und ich bekomme eine Liste von Ergebnissen, dann steckt dahinter Machine Learning oder lineare Algebra, nämlich der, der legt im Prinzip das, was ich eingebe in die Suchmaschine, als auch alle Dokumente, die er gespeichert hat, in einen eindimensionalen Raum und die Eingabe wird quasi autorisiert.
Und dieser Vektor wird auch in diesen Raum projiziert. Und mit lineare Algebra, also Cosinus und Winkeln, wird berechnet, wie nah die eingegebenen Suchbegriff zu den Dokumenten passt. Dann wird ein Ranking erstellt und dann wird das, was am meisten passt, ganz oben ausgegeben. Das heißt, wir nutzen Machine Learning jeden Tag und hinter vielen, vielen Funktionalitäten. Was wir im Web haben, steckt Machine Learning, oder? Ein anderes Thema ist, wenn du viele Dokumente, viele E-Mails stell dir vor 100, 150000 oder eine Million E-Mails und du möchtest die E-Mails klassifizieren?
Sind das Bestellungen, die die Kunden eingeben? Oder sind das Beschwerden? Mal ganz einfache Beispiele und das System versteht gar nicht. Ist das eine Bestellung oder ist es eine eine, eine Beschwerde? Sondern es lernt anhand vieler dieser dieser vielen Dokumente, dass bestimmte Wörter zusammen häufig vorkommen. Und der Cluster hat quasi diese Dokumente in zwei Teile und weist aber den Kontext nicht. Die Bedeutung kennt der nicht. Ein Mensch muss sagen Okay, das, was du jetzt hier zusammengefasst, dass auf der einen Seite sind oder E-Mails und das, was du hier zusammengefasst hast, sind zum Beispiel Beschwerde.
Das passiert aber alles auf Wahrscheinlichkeitsrechnung und lineare Algebra hat sehr, sehr wenig mit künstlicher Intelligenz zu tun könnten. Legends spielt dann eine Rolle, wo man versucht, das menschliche Gehirn nachzuempfinden, nämlich mithilfe von Neuronen der Das menschliche Hirn ist ja ein assoziativ Computer, ein assoziativ Supercomputer, der gelernt hat, Dinge zu abstrahieren auf Basis von Lernen. Das heißt, ein kleines Kind auf der Herdplatte packt und in dem Moment merkt das tut weh, das mache ich nicht noch mal.
Das heißt eine eigene Erfahrung oder die Erfahrung von außen. Wenn zum Beispiel Eltern sagen Geh da nicht hin, sonst fällst du runter und oder geh da lang, da bist du sicher. Das heißt, dieses Lernen, das nimmt das Kind auf und wird mit der Zeit immer intelligenter und denkt über Wow, vorherige Gelerntes nicht mehr nach. Das ist dann intus. So funktioniert für mich auch künstliche Intelligenz. Tatsächlich. Es gibt Neuronen, die miteinander verschachtelt werden und die mit der Zeit was lernen.
Beispiel Bilderkennung Ein Bild, ein zweidimensionales Bild einer Katze wird auch quasi in einen Eingang Vektor gepackt. Das heißt, alle Farbwerte, die so ein Bild beinhaltet, werden in ihn codiert und in so ein neuronales Netz gespeist. Und macht man das mit hunderttausend oder fünf Millionen Katzen Bildern, dann lernt dieses System irgendwann Unmengen. Mensch muss natürlich sagen Pass auf, dass es ein Katzenbilder und zwar eine Katze, die sich von vorne anschaut. Das ist in Katzen Bild wo die Katze wurde Katze von hinten zu sehen ist von der Seite groß klein.
Diese Farbe, jede Farbe, möglichst viele. Je mehr, desto besser. Und irgendwann lernt das System zu abstrahieren. Das heißt, welche sogenannten Features oder Merkmale machen eine Katze aus? Ganz ähnlich wie ein Mensch lernt. Was macht denn für unsere Katze aus? Die spitze Ohren, die kleine Nase, die die Schnur, der Schnurrbart oder die Schubart Haare, der Schwanz? All diese Merkmale sind für uns Abstraktionen. Wenn wir das nicht mal die Katze in freier Wildbahn sehen, sagen wir Ja, das ist eine Katze.
Und ganz genau so funktioniert das mit der künstlichen Intelligenz. Wobei das natürlich sehr, sehr weit weg ist von dem, was der Mensch eigentlich als Intelligenz bezeichnet. Da fehlen zum Beispiel auch Emotionen drin. So ein Deep Learning Modell, wie man es nennt, Deep Learning, weil es mehrere Schichten dieser neuronalen Layer sind, also wie das menschliche Gehirn funktionieren. Die haben keine Emotionen, die sagen Katze ja, Katzen nein. Wenn du dem sagst Töte die Katze, sagt Mensch, da kommt dieser Niedlichkeit Faktor, der diese Emotion ins Spiel wurde Sache Stopp!
Nein, ich töte keine Katze im Computer. Hat diese Emotion nicht letztendlich verwertet für diese Daten? Und der Mensch sag ihm, was du mit diesen Daten machst. Ganz ganz ganz krasses Beispiel. Was immer wieder verwendet wird, ist bei selbstfahrenden Autos. Wenn du in einer Situation bist, wo du auf eine Personengruppe zu fährst, viel zu schnell um was macht die künstliche Intelligenz? Dann entscheidest du dich in die Gruppe zu halten, zu bremsen. Bremsen sind kaputt, funktionieren nicht.
Die andere Möglichkeit ist rechts runter, rechts runter bedeutet aber den Abgrund runter. Also im Prinzip deinen eigenen Tod. Diese Ethik, diese Emotion kennt die Maschine nicht. Das heißt, irgendein Mensch muss ihm dann beibringen, was zu tun ist in diesen Situationen. Und das ist genau diese Ethik Diskussion um künstliche Intelligenz. Wobei ich finde ganz ehrlich diese Diskussion in Deutschland, bevor wir die Technologie eigentlich ganz verstanden haben, immer schon über kontrollieren und regulieren. Und das ist eigentlich der falsche Weg.
Aber das ist vielleicht Thema eines anderen Podcast.
Ja, ja, das geht. Geht sehr weit. Ich meine, das ist natürlich schon wichtig, dass man sich da Gedanken macht, aber das Verständnis, was möglich ist und wie es funktioniert, das sehe ich auch. Also bevor man etwas reguliert, muss man es verstehen, oder? Verständnis sollte immer der erste Schritt sein, bevor man anfängt, da direkt die Daumenschrauben an. Wenn man versteht, dass das solche Modelle, also künstliche Intelligenz, letztendlich auf Daten basieren.
Das heißt vielen Daten, wo ein Mensch gesagt hat, dass es so das ist eine Katze und das ist ein Hund, damit die Maschine lernen kann. Man hört in den Nachrichten, dass sie vielleicht auch mitbekommen, dass Google oder Amazon Mitarbeiter bei Alexa mithören. Das was, das wird auch in den Medien so ich sage mal an die Wand gemalt wie den Teufel. Wenn man aber versteht, dass die Daten das Wichtige sind, dann versteht man vielleicht auch den Hintergrund.
Also das Privatleben der Leute interessiert Amazon oder Google. Komma Null. Darum geht es gar nicht, sondern die wollen einfach validieren Hey, das was du verstanden hast, Alexa, war das jetzt richtig? War das wirklich das, was der Mensch sagen wollte? Und dann sagen sie ihm ein Ja oder Nein, das war's. Die wollen den Algorithmus verbessern und nicht in die Wohnzimmer hören. Was der eine oder andere macht. Das interessiert keine Sau.
Helm Das wollen vielleicht Amazon und Facebook, nicht aber die Geheimdienste in den Ländern, in denen sich Amazon und Facebook dann befinden. Aber das ist wieder auch eine. Ich meine da, wenn man so weit geht, dann ist man nicht sicher, weil der könnte auch genauso gut ein Telefon anzapfen oder andere Möglichkeiten. Also wie ist denn das zur Eingangs schon erwähnt? Das ist ja schon ein Dickicht dieser Preisbereich. Und für unsere Zuhörer glaube ich es ganz wichtig zu unterscheiden Was ist denn Hype und was ist jetzt wirklich praktische Anwendbarkeit?
Wir haben ja jetzt auch Beispiele noch aus der Praxis, die wir erzählen können, wo konkret etwas umgesetzt wurde aus dem Thema KI. Aber ich glaube, das ist, das ist ganz wichtig, weil da sehr viel auch die, die das Wort Wort Sau durchs Dorf getrieben hat.
Immer eine Rolle. Da immer wo es um eine neue Technologie geht, übertreiben es die Firmen natürlich, weil sie ihre Produkte verkaufen wollen, Dienstleistungen verkaufen wollen. Nichtsdestotrotz ist also meine persönliche Meinung ist, dass das künstliche Intelligenz. Damit meine ich jetzt diese gesamte Machine Learning, künstliche Intelligenz, based Learning, was auch immer wirklich unseren Alltag verändern wird, es wird wirklich große Umwälzungen geben. Allein wenn du daran denkst, selbstfahrende Autos, wenn man 5 Jahre 10 Jahre weiterdenkt, dass die Prognose von vielen Führenden, auch Forschungsinstituten, Universitäten, die sagen, das autonome Fahren wird in 5 bis 10 Jahren Mainstream sein, das wird so viel verändern.
Allein im Jobmarkt. Was es da bedeutet? Ja, denken die ganzen Taxifahrer. Denk an die Busfahrer und so weiter und so fort. Es wird. Die das Bild der Innenstädte verändern Es sind so große Umwälzung allein in diesem Bereich von von den ganz anderen Sachen mal abgesehen. Wenn dann die ganzen Chatbot denkst ich weiß nicht, ob du es mitbekommen hat, es aber auch. Doch haben wir uns doch darüber unterhalten, wo ein Google Books eine Diskussion hat.
Angerufen in einem Friseursalon und hat einen Termin gemacht für für einen Haarschnitt und die Dame auf der anderen Seite konnte gar nicht unterscheiden oder konnte nicht sagen Ist das jetzt ein Mensch oder eine Maschine? Jetzt denkt ihr das mal 5 Jahre weiter. Es ist wirklich sehr sehr viel verändert. Insofern glaube ich nicht bei diesem Thema, dass es ein Hype ist. Man muss sich mit dem Thema auseinandersetzen, sonst fallen wir hintenan und laufen. Die anderen laufen uns davon.
Ja, das ist ja auch so Ein Mann hat irgendwann durchbricht man diese Schallmauer oder hat diesen Durchbruch und kann das eigene Gesicht auf jeden Prominenten glaubhaft setzen, oder du kannst die prominente Stimme zusätzlich zu dem prominenten Gesicht animieren, dass es ein glaubhaftes, das so ein glaubhaftes Video erstellt. Und das wird gerade in ich sag mal Ländern, wo die Regierung vielleicht nicht so gefestigt ist, wird das ein riesen Problem werden. Ich sag mal, du könntest ja irgendwie den Politiker des Landes irgendwas sagen lassen und das bei Facebook teilen.
Wenn und das so die Leute aufhetzen und für deine Kampagne dann benutzen. Und die Leute, wenn die nicht wissen. Es gibt diese Möglichkeit, dass das Video gefälscht ist und die Fälschung supergut und das kann mit diesen Technologien gemacht werden, dann ist fallen die auf diesen Taschenspielertrick sag ich mal herein. Das ist so wie heute der Enkeltrick per Telefon. Die Leute haben immer gelernt, wenn wenn das Telefon klingelt. Da muss nicht immer jemand Nettes anrufen. Und genauso muss man lernen.
Nicht nur weil Text gedruckt ist oder weil ich ein Video sehe, was scheinbar den Tatsachen entspricht, muss das wirklich es echt sein? Also da wird die Medienkompetenz wichtiger. Wer noch ordentlich mitwachsen müssen, braucht glaube ich auch in der Pflicht, das zu fördern. Dieses Wissen, diese diese Erziehung drum herum, statt nur Angst zu machen, dass die Technologie verteufeln sollte, mein Lieber, weil die wird kommen. Egal wie wir uns dagegen stemmen. Die Technologie wird kommen, uns überrumpeln, wenn wir nicht vorbereitet sind.
Deswegen besser erziehen, den Leuten erklären und mitnehmen anstatt Angst zu machen. Weil das. Weil es keinem geholfen.
Weil das stimmt.
Das viele, viele Vorteile. Ja, wir haben einige Projekte gemacht, wie zum Beispiel für eine große Elektronik Plätze in Deutschland, die neue Dienstleistungen finden wollten, was sie im Store verkaufen können. Und um jetzt mal auf ein wirtschaftliches Beispiel zu kommen, wie man das verwenden kann. Genau das finde ich. Sie sind dann hingegangen, haben zum Beispiel sämtliche Diskussionsforen, wo es um Hard und Software geht, Hard und Software. Probleme von Smartphones haben wir diskret. Das heißt also quasi, wir haben ein Programm geschrieben, was auf diese Webseiten, auf diese Foren geht, sich den Inhalt extrahiert, aufbereitet und analysiert und haben versucht herauszufinden, was ist das Thema oder das größte Problem, wo sich die Leute am meisten drüber unterhalten.
Und dann haben wir festgestellt, dass es ein ein bestimmtes Thema ist, in dem Fall eines Backups von Mobil Daten bei dem Telefon Wechsel oder wenn das Telefon kaputt geht. Und diese Firma hat dann aus diesem, weil es wusste was die Leute wirklich beschäftigt hat ein Dienstleistungs Produkt drum herum gebaut und das in den Stores angeboten, was Riesenerfolg war. Und das war ein sehr sehr sehr einfaches Projekt. Das war innerhalb von vier Tagen erledigt, aber man sieht daran, was man alles damit machen kann.
Und das ist ein sehr simples Beispiel, ein Helm.
Aber man hätte ja wahrscheinlich aus den Informationen noch weitere 2 3 Produkte oder Services schnüren können und das war ja erst der erste Aufschlag und das ist ja schon ein Riesenerfolg, dass man weiß, was die Leute da draußen beschäftigt, wenn ich einen stationäres Geschäft habe, weil ich muss mich ja irgendwie grade bei Elektronik Produkten wie Mobiltelefonen. Das war dein Beispiel, muss ich mich ja irgendwie abgrenzen, dann durch Service, weil sonst bestellen die Leute alles nur noch online. Also gerade in dem Bereich, bei dem ging es darum, eine Entscheidung zu treffen, die auf Daten basiert.
Das heißt, wir bereiten Daten so auf in verständliche Formen. Das heißt, wir visualisieren die Daten auch so, dass das der Kunde sofort versteht, was diese Daten aussagen sollen und welche Chancen sich daraus ergeben. Das heißt im Prinzip KPI KPIs, die die Daten basiert sind, und diese Entscheidungen zu treffen, basierend auf Daten und nicht auf Bauchgefühl oder was man glaubt, was der Kunde braucht, sondern was der Kunde tatsächlich gesagt hat, was er braucht, um diese Daten zu nehmen, aufzubereiten, zu verwerten und dann zur Entscheidung vorzulegen, damit das kann man zum Beispiel mit mit Machine Learning und Künstliche Intelligenz machen.
Ja, das war auf jeden Fall ein super schönes Projekt, fand ich, weil das sehr schnell einen sehr großen Erfolg erzielt hat. Leute, die im Projektgeschäft lange tätig sind, wissen, dass das nicht immer so sein muss. Aber das war auf jeden Fall ein. Eine tolle, tolle Erfolgsgeschichte. Ich selber habe ein Projekt nicht begleitet, aber mitbekommen. Da ging es darum, dass bei einem großen europäischen Fernsehsender und auch einer Produktionsfirma, da gehen halt pro Sekunde etwa drei Videos, ein Rohmaterial von Nachrichtensendungen oder von Redakteuren, die überall auf der Welt eben Material zuführen.
Auch für Beiträge, die dann in den Nachrichten gesendet werden. Und diese dieses Rohmaterial. Da gibt es eine ganze Heerschar von Leuten, die dieses Rohmaterial sofort sichten, mit Informationen versorgen. Wo wurde es aufgenommen, wann wurde es aufgenommen? Welche Personen sind zu sehen? Welche Rechte gibt es für das Video? Also wo darf es überall gesendet werden? Welche Altersfreigabe gibt es? Voraussichtlich gibt es da Gesichter drauf, für die keine Freigabe vorliegt, also die verpixelt oder weg geblendet werden müssen.
Und der erste Schritt eines jeden Videos ist, dass dieses Video eben klassifiziert wird anhand des Inhaltes für. Ich glaube, es gibt elf Kategorien. Also eine Kategorie könnte zum Beispiel VIP sein, also für Stars und Sternchen, Wirtschaft, Sport, solche, um das ganz grob zu kategorisieren. Wenn du weißt, du hast ein Video, wo Angela Merkel steht und das ist mit Sport getaggt, dann hast du eine andere Erwartung, als wenn das mit Politik oder Wirtschaft getaggt ist, weil sie halt auf einem Sportevent bei dem WM-Finale gratuliert oder so was.
Genau. Und diese Klassifikation ist der erste Schritt in dieser Metadaten Erfassung, die sehr umfangreich ist. Und diese elf Keywords, die wurden eben trainiert und das Videomaterial bei der Ankunft hat ein System das schon vorgestellt. Also es hat beispielsweise erkannt, da ist Frau Merkel und Wladimir Putin drauf. Das ist wahrscheinlich Politik und vielleicht auch Wirtschaft. Und dann wurden die sozusagen vor ausgewählt und das war von ich glaube von 20 Leuten die eben diese Metadaten Erfassung gemacht haben konnten, dann ich glaube 12 Leute, also acht Leute haben das dann weiterhin gemacht und zwölf Leute konnten sich dann der erweiterten Metadaten widmen und mussten nicht mehr.
Mit diesen Klassifikation ist ja mit dieser Klassifikation beschäftigt werden. Sozusagen konnten also qualitativ höherwertige Metadaten an die Videomaterial Clips dran schreiben, als das vorher möglich war, weil sie jetzt eben mehr Zeit hatten, weil der Computer sozusagen schon die die Vorauswahl trifft. Und das hat zu einem relativ hohen Grad. Ich glaube am Beginn war die Quote lag bei 89 prozent und später wurde es noch mal verbessert, da lag sie bei über 95 prozent. Hat der hat diese Klassifikation geklappt?
Und das ist natürlich auch eine riesen Veränderung oder Verbesserung der Wertschöpfungskette, weil da werden jetzt keine Leute arbeitslos, weil die können natürlich andere sinnvolle Sachen machen, aber die die Metadaten zu den vorhandenen Videomaterial werden einfach umfangreicher und können eben besser verschlagwortet werden. Das Material wird einfach wertvoller, das Archiv man möchte etwas Wichtiges gesagt, finde ich, dass man nicht immer Sorge haben muss, dass an diesem Beispiel sieht man super, dass dann der Computer oder der Algorithmus Menschen ersetzt.
Es hilft ihm einfach, sich auf wesentlich wichtigere Dinge zu konzentrieren, weil das ist mal die 08 15 Arbeit oder dass das die STANDARD Arbeit quasi von einem Computer erledigt wird und man dann höherwertige Arbeit machen kann.
Meinem Eindruck nach. Ich fand das Team das sogar gut, weil es sich jetzt nicht mehr mit ich sag mal diesem Dummy Aufgaben beschäftigen muss, sondern eben dann wirklich gucken kann. Oder eben diese kniffligen Fälle zugespielt bekommen. Da ist Frau Merkel und Wladimir Putin sind auf irgendeinem Sportevent und der Computer weiß nicht. Ja, ist das jetzt Politik? Ist das Wirtschaft? Ist das Sport? Ist das vielleicht alles, wo dann wirklich menschliche Intelligenz notwendig ist? Wo man sich den Clip vielleicht auch kurz angucken muss und entscheiden muss?
Ah okay, die treffen sich am Rande vom Sport Event halt zufällig und besprechen irgendwas. Das ist eher Politik. Oder Sie stehen auf dem Siegerpodest und überreichen bei den Olympischen Spielen in Russland irgendein Preis. Dann ist es definitiv. Hat es dann Sport Charakter? Ja genau. Da ist dann doch der Mensch gefragt, weil die Maschine da nicht. Vielleicht ist das ein paar Jahren möglich, da die Quote weiter zu verbessern, aber es wird immer. Streitbare Fälle geben ein anderes Beispiel habe ich jetzt gestern gelesen, ganz witzig ein etwas kritisches Beispiel.
Und zwar ist es wohl so, dass Frauen im Internet häufig ungefragt Fotos von männlichen Geschlechtsteilen per privat message zugeschickt bekommen, bei Facebook, bei Twitter usw.. Und es wird ein neuronales Netz trainiert. Was entscheiden kann. Ist das ein. Ist das ein dick Pick oder nicht? Und wenn du mehr überlegst, wie viele Menschen tagtäglich. Es gibt ja auch bei den Social Networks bei diesen melden Button. Wenn du da drauf klickst, wird das ja irgendjemandem vorgelegt, der dann entscheiden muss.
Ist das? Kann man das Bild zulassen oder nicht? Wie viel, wenn das funktioniert? Wie vielen Menschen man erspart sich durch Heerscharen von dick Pics zu graben den ganzen Tag und sich dann vielleicht anderen Sachen zuzuwenden zu können, das ist ja, da ist das Potenzial riesig. Sowohl wirtschaftlich durch Einsparung als auch auf der Schonung der menschlichen Psychologie will ich ja absolut das absolut und das System da weiteres erkennen kann. Ähm, bei dem Thema. Also das Thema Sicherheit Predictive Analytics, das heißt, aufgrund von bestehenden Daten oder eingehenden Daten in der Vergangenheit kann ich Aussagen über die Zukunft treffen.
Sehr häufig wird das eingesetzt. Ich sage mal bei im Industriesektor, um vorherzusagen, wann ein bestimmtes Teil eventuell kaputt gehen könnte, weil es langsam anfängt, Muster aufzuweisen, die darauf hindeuten, dass ein bestimmtes Teil defekt ist. Und das hilft die Industrie, Milliarden einzusparen, wenn die Systeme mitlaufen, mit der Zeit lernen und und merken okay, welche Daten Muster wie zum Beispiel bestimmte Sensoren, Temperatur, Leitfähigkeit, was auch immer ein Fehler bedeuten. Und das wird quasi über Branchen hinweg oder in derselben Branche geteilt.
Diese Daten, so dass jeder davon profitieren kann und man viel schneller merkt, bevor ein Gerät kaputt gehen kann und es vielleicht zu einem Ausfall von Systemen kommen kann, was wiederum hilft, Millionen einzusparen.
Naja, da ist ein Riesenpotenzial, gerade bei der Industrie, da oft kleinste Veränderungen in der Ausschussware hinten haben wir einen riesen Einfluss auf das Sendemast 4.0. Denkst also jetzt mit 5G, wo die Kommunikation zwischen vielen einzelnen Geräten viel schneller wird oder fast in Echtzeit möglich ist. Und all diese Geräte miteinander Daten austauschen, kommunizieren, denken. Das vernetzte Auto wird welche Datenmengen auf und zuströmen. All diese Daten auszuwerten und Vorhersagen zu treffen über keine Ahnung, über Staus, über Unfälle, über was auch immer.
Das ist ein Riesenfehler, die sich da auftun.
Ja, also was ich immer denke, was so zum Himmel schreien ineffizient ist, das hat jetzt unbedingt gar nichts mit KI zu tun. Aber also so eine ganz normale Straßenkreuzung mit einer Ampel. Wie viel Zeit stehst du an einer Ampel? Es ist rot, entweder als Fußgänger oder als Autofahrer. Und du siehst, es kommt kein Auto von rechts bis links und du könntest eigentlich waren. Also ich lebe in einer Großstadt. Wenn ich jedes Mal bei jeder roten Fußgängerampel das abwarten würde, glaube ich, würde ich am Tag nicht viel Strecke zurücklegen können.
So, und das ist ein Problem. Also jetzt nehmen wir die Fußgänger vielleicht mal raus, aber die Autos in dem Moment, wo die Autos kommunizieren können. Lieber Ampel, ich fahre mit Tempo 50 auf dich zu. Kann die Ampel, weil sie das Umfeld kennt, eine Entscheidung treffen? Okay. Außer dir, liebes Auto, fährt aber kein anderer hier auf diese Ampel zu. Du einfach durch, solange du 50 fährst. Und dann könnte der Verkehr, wenn an einer Kreuzung so nett artig quasi immer durchgeführt werden, wenn die Leute kein Gas geben dürfen oder nicht bremsen dürfen oder die Ampel sozusagen für diese Kreuzung schon die Kontrolle übernimmt und einfach den Auto Strom steuert.
Was das für einen Bus darstellen würde, das mag ich mir gar nicht auszurechnen. Natürlich wird es, geht das nur bis zu einem gewissen Grad an, wieder die normale Ampel oder die das normale Vorgehen an der Ampel aber an sonst ist das. Wäre diese Verbesserung alleine, würde so viele tausend Warte Stunden und Liter Sprit sparen.
Unglaublich schnell. Elon Musk sagt ja sogar, dass man, wenn das Auto vernetzt ist und selbstfahrende Autos Autos gibt, dass man gar keine Ampeln mehr braucht.
Genau das wäre die nächste. Der nächste Schritt sozusagen, dass man die Ampeln abbaut. Ich denke mir heute auch die meisten Leute haben ein Navigationsgerät. Wenn der deutsche Staat sagen würde Pass auf, begeben wir, schenkt euch alle ein Navigationsgerät und bauen alle Schilder ab. Oder fast alle Schilder ab. Da wird der mit so einem riesen Plus und da wird man da rausgehen. Das definitiv dumme deutsche legendäre Schilderwald ist ja sehr bekannte Narayen. Ein Beispiel finde ich das noch ganz wichtig, dass wir das hier erwähnen sollte.
Und das ist das von unserem eigenen Produkt eigene Skillbyte Produkt Gravitas Viacom. Und vielleicht, weil du dich intensiver damit beschäftigt hast, möchtest du kurz erzählen, wie aus unstrukturierten Daten eingesetzt wird? Diese unstrukturierten Daten in strukturierte Daten zu überführen?
Also wir setzen bei bei Gravity Quickie oder oder Machine Learning in Ihnen auf zwei Ebenen ein. Das eine ist also erst einmal kurz zu gravitative. Du kannst dort ein Online-Kauf führen, managen und verteilen. Und das erste. Oder die erste Herausforderung wurde ich in einem Tweet registriert, ist okay, wo fange ich an, wie gebe ich meine Daten einmal? Die meisten werden schon ein ziviles Geschehnis wie ein Lebenslauf wird oder PDF Format haben und es gibt viele verschiedene Formate.
Der eine macht Tabellen, der andere schreibt einfach untereinander her und wir haben ein System trainiert, wo wir hunderttausende von Lebensläufen Helm System zugeführt haben. Und das Team hat mit der Zeit gelernt. Das sind Kontaktinformationen. Das ist eine Projekt History. Das ist ein Zeitraum für eine Projekt Historie. Das sind Skills und das heißt, du kannst in jedweder Form dein Zivi hochladen als PDF oder wird und das System hat eine Genauigkeit Quote von 90 bis 95 prozent. Das heißt, er erkennt mit 90 prozentiger Wahrscheinlichkeit alle die relevanten Informationen und überführt diese unstrukturierten Daten aus wird oder PDF in ein strukturiertes Format, so dass es dann quasi wiederum online nutzen kann, zum Vermittler oder einem Kunden zur Verfügung zu stellen.
Das heißt ganz plastisch gesprochen bei Gravity usw. Wenn man sich normal anmeldet, müsste man ja jetzt seinen Namen eintragen, sein Geburtsdatum, seine Adresse, seine Skills. Und wenn ich aber schon einen Lebenslauf habe im Monat Format oder auch auf einer anderen auf von einer anderen großen Job Social-Media Webseite, dann könnte ich das sozusagen exportieren. Als Word-Dokument oder als PDF lag es bei Gravity, wie hoch und erkennbar hier das ist der Name, das ist die Adresse der Person, das ist das letzte oder der letzte Arbeitgeber dieser Person und füllt das quasi schon.
Das ist dann ausgefüllt, aber der Nutzer kann dann natürlich noch, wenn ihm irgendwie ein Tippfehler aus auffällt oder so was, kann er da noch eingreifen und das dann auch korrigieren.
Genau das ist die erste Ebene. Die zweite Ebene ist hier ähnlich wie bei diesen Foren, wo wir die Produkte herausgefunden haben, als haben wir alle relevanten deutschen Stellen Börsen und was wir dann machen ist aus diesen Job Beschreibungen die Skills herausfiltern, das was wir am System entwickelt, was erkennt, was ein Skill ist. Also ich spreche jetzt vom IT Umfeld, weil das ist eine relativ komplexe Geschichte und wir müssen natürlich die Domäne ein bisschen einschränken. IT-Sektor bewegen haben wir ein Modell trainiert, was er kennt, was zum Beispiel Java ist?
Er weiß, Java ist eine Programmiersprache. Er weiß, dass zum Beispiel Linux ein Betriebssystem ist und was jetzt passiert, ist es ganz spannend, auch wenn es für uns oder für einen, der sich in dieser Geschichte ein bisschen auskennt, sehr trivial ist. Aber für eine Maschine ist es halt eben nicht trivial. Zum Beispiel, wenn du in der Jobbeschreibung was von Red Hats liest, also einer bestimmten Linux-Distribution oder Suse oder Debian, dann weiß das System, dass es sich letztendlich um Linux handelt.
Warum ist das interessant? Weil wenn auf der anderen Seite die CVS haben bzw. User Profile haben im System, dann können wir dem User eine Jobbeschreibung oder einen Job als passend darstellen. Wenn dort Linux erwähnt ist, also beim User ist zum Beispiel Red Head erwähnt. Er hat geschrieben Ich habe Rated administriert und in der Jobbeschreibung steht wir suchen einen Linux Administrator, dann weiß es das System. Ah Linux oder Rated ist ein Linux System und kann die beiden Mädchen sehr einfach gesprochen.
Das heißt es entstehen so Ontologien von Technologien, dass man quasi den ganzen Stack dann erkennt. Richtig.
Wir haben quasi das Domänen Wissen um die Begriffe in ein mathematisches Modell gesteckt wurde das Matching zwischen diesen beiden ermöglichen können wir letztendlich als Freiberufler versus welche zuhören. Die werden genau wissen was was wir meinen. Man wird tagtäglich bombardiert worden von Richter Kollegen, die einem sehr unpassend oder unelegant Projekte vorschlagen. Ich habe ich letztens, weil ich irgendwo in meinem Profil Projektleitung stehen hatte, weil ich das mal kurze Zeit gemacht habe, hat mir einer einen Architekten Projekt angeboten Bauleitung, weil da weil er gesagt hat okay a Projektleitung Projektleitung.
Für ihn war das ein Match. Das könnte zum Beispiel mit unserem Algorithmus Software Architekt ist Architekt.
Ja, es ist kein Witz passiert und ich bin mir sicher, dass andere Kollegen, die jetzt gerade zuhören, auch viele Stories erzählen können.
Ja, das glaube ich auch. Da wird auch ich glaube, dieses Recruitment funktioniert auch momentan einfach mit dem Wasserschlauch präzisiert. Wenn eine Stelle irgendwo offen ist oder eine Projekt Anfrage irgendwo offen ist, wird auch. Aus allen Kanälen gefeuert und das ist der Grund, warum da die Menschen so viele Unarten, gemessene Projekte oder unangemessen sind, ja nicht. Also die Skills passen dann vielleicht nicht zu dem Skill Set, was die Person hat oder die Firma hat oder was der Festangestellte dann eben liefern kann, weil es eben einfach an alle per E-Mail rausgeschickt wird.
Das Problem ist ja viel subtiler, selbst wenn z.B. bei mir in der Nähe ein Profil. Ich habe vor 25 Jahren als Werkstudent aber programmiert so eine Programmiersprache für SAP und ich werde heute noch angeschrieben von Vermittlern. Stehen Sie für ein Projekt zur Verfügung. Das ist absolut nicht mehr relevant für mich und in meinem Sinne. Und das heißt, was ich sagen will Das Recruiting heute ist sehr rückständig. Da gab es ja kaum Fortschritte. Und was wir jetzt als Skillbyte quasi versuchen wollen, ist auf ein Steckenpferd von mir ist, diese Branche komplett umzukrempeln und zu digitalisieren.
Und das versuche mit Gravity und den Ideen der künstlichen Intelligenz dahinter.
Ja, ja, ich denke, das ist das Gravitas. Wie am Schluss noch mal erwähnen, ist doch ein eine ein toller Übergang. Wie gesagt, wenn uns Leute zuhören, ihr könnt euch gerne anmelden auf Gravity kommen, schickt uns Feedback, wie ihr zurechtkommt, ob euer hochgeladen wird und PDF Lebenslauf perfekt erkannt wurde.
Wobei Maurice, da muss ich sagen, diese Funktionalität kommt jetzt mit dem Relaunch im November, da sind wir ja gerade dran. Also in der Beta gibt es das schon und das ausprobieren können es die Kollegen erst im November.
Okay, ab November 2019 sollten wir vielleicht dazu sagen damit, falls uns jemand dann später noch hört, er Bescheid. Falls ja, ansonsten glaube ich Was für unsere Hörer auch interessant ist, ist der Blog von skillbyte. Ihr könnt gerne auf www. Skillbyte de slash Blog vorbeischauen. Da haben wir mal viele Artikel auch zum Thema KI. Das letzte ist jetzt hier zum Thema Produktion umfangreicher Blog-Artikel erschienen, aber auch zu generellen BigData Problemen, Software Engineering Themen und auch in der letzten Zeit relativ sind viele Artikel zum Thema Dev OPs aufgekommen, weil das ja auch ein sehr stark nachgefragt.
Das Thema ist auch viel um Wissen in Markt oder bei den bei den Kunden häufig weil sie durch die Marketingabteilung der großen Hersteller doch etwas desinformiert sind oder über optimistisch informiert wurden, dass man dann wirklich noch mal sagen kann was was da, ja was da eigentlich geht. Ja, ich finde das immer ganz wichtig, dass man den Kunden oder so sehe ich unsere Rolle, dass man den Kunden dann auch ehrlich zeigt, was da geht und was da nicht geht und sich nicht auf die reinen Marketing Broschüren verlässt, weil da doch sehr oft etwas übertrieben wird.
So, das ist jetzt nicht speziell in der IT so. Wenn unsere Zuhörer Feedback haben Masiar ich denke, da können Sie einfach eine E-Mail an Info Skillbyte e schreiben und dann sind wir gespannt, was da für Feedback kommt, was uns an Feedback erreichen wird. Genau, genau. Also abonniert auch gerne den Podcast oder gebt uns einen Daumen hoch oder runter, dann Daumen runter. Okay, wenn man Daumen runter gibt, dann aber gerne auch Feedback schreiben, was wir besser machen können und welches Thema wir verbessern.
Und sehr gerne welches Thema dann? Interessant ist oder dass wir den Verbesserungsvorschlag dann auch in der nächsten Episode aufgreifen können und den, wenn er unseren Lesern hilft, dann erwähnen können. Ja, das ist doch super schön Masiar ich danke dir ganz herzlich für dieses Maurice.
Vielen Dank den Zuhören.
Vielen Dank! Und wir hören uns bis dahin. Ciao, ciao!