Detektivgeschichten aus dem Random Forest
Shownotes
Jetzt sind Sie dran: "Entweder oder? Entscheiden Sie sich jetzt." Welche Fragen "rehalitätsnah"-Host Dr. Marco Streibelt für Sie vorbereitet hat, hören Sie in der neuen Folge "E" wie "Entscheidungen". Mit Dr. Mathis Elling vom Institut für Qualitätssicherung in Prävention und Rehabilitation an der Deutschen Sporthochschule Köln (kurz: iqpr) spricht er über Entscheidungen und das Machine Learning. Kann das maschinelle Lernen, als Teilgebiet der Künstlichen Intelligenz, Vorhersagen treffen – zum Beispiel zum Reha-Erfolg? Wie weit ist die Deutsche Rentenversicherung hier? Das technische Modell wird anhand von Fußballschuhen und der Prozess mit der Allegorie einer Dektektivgeschichte erzählt. Entscheidungsbäume wachsen hier zu einem Entscheidungswald zusammen und der Random Forest kommt ins Spiel. Entscheiden Sie sich jetzt fürs Zuhören!
Foto: DRV Bund, Johannes Schuurmans
Impressum: https://www.deutsche-rentenversicherung.de/DRV/DE/Service/Footer/Impressum/impressum_node.html
Transkript anzeigen
00:00:00: Heute frage ich
00:00:06: Sie.
00:00:08: Berge oder mehr?
00:00:10: Musik oder Stille?
00:00:12: Popcorn, süß oder salzig?
00:00:15: Aber eigentlich will ich wissen, wie entscheidungsfreudig sind Sie?
00:00:19: Wie schnell haben Sie gerade eine Auswahl getroffen?
00:00:22: Oder überlegen Sie immer noch?
00:00:25: Können Maschinen uns die Entscheidungen abnehmen?
00:00:27: Sind diese dann besser?
00:00:29: Darüber sprechen wir heute.
00:00:30: Und was hat das mit der Rehabilitation zu tun?
00:00:33: Auch das klären wir.
00:00:35: Hab ich jetzt einfach mal so entschieden.
00:00:37: Los geht's.
00:00:38: Jetzt noch smarter.
00:00:39: Mit E wie Entscheidungen.
00:00:52: Entweder Berge oder mehr.
00:00:55: Bei mir sind's ja die Berge.
00:00:57: Das wissen alle, die uns zugehört haben, das habe ich in der Vergangenheit schon häufiger erwähnt.
00:01:01: Aber Achtung, Wortspiel!
00:01:03: Können wir mit Entscheidungen auch Berge in der Rehabilitation versetzen?
00:01:07: und geht da noch mehr?
00:01:09: Ganz konkret, wie gut kann das Machine Learning oder zu Deutsch das maschinelle Lernen als Teilgebiet der künstlichen Intelligenz vorhersagen treffen?
00:01:18: Zum Beispiel zum Reha-Erfolg.
00:01:20: Wie funktioniert das?
00:01:22: Wie weit sind wir da in der Rentenversicherung?
00:01:25: Das wird heute eine eher wissenschaftlich methodische, aber hochspannende Folge.
00:01:30: Ich verspreche, wir werden Komplexes, einfach und nachvollziehbar vorstellen.
00:01:34: Das ist mein Anspruch, und das ist auch der Anspruch meines Gastes.
00:01:41: Mein Gast heute ist Dr.
00:01:43: Mattis Elling vom Institut für Qualitätssicherung in Prävention und Rehabilitation, einem Aninstitut der Deutschen Sporthochschule Köln, kurz IGUPR.
00:01:53: Und ich sage herzlich willkommen lieber Mattis.
00:01:55: Vielen Dank, dass ich hier sein darf.
00:01:56: Wir steigen gleich in unseren realitätsnah Zeitjet und fliegen gemeinsam ins Jahr zwei Tausend Vierzig.
00:02:04: Und ich frage dich Mattis, wie sieht denn dann die Datennutzung in der digitalen Welt aus?
00:02:08: Welche Rolle spielen Daten dann?
00:02:10: Okay, wir befinden uns also im Jahr zwanzig vierzig.
00:02:13: Daten werden allgegenwärtig sein.
00:02:14: KI-Modelle werden kontinuierlich mit riesigen vernetzten Datenströmen gefüttert.
00:02:20: Ich glaube aber, dass die Frage weniger relevant ist, wie schnell Daten fließen, sondern dass es viel wichtiger ist, welche Qualität Daten haben, wie verlässlich sie sind, wie sie verknüpft werden können und vor allem auch, wie wir mit Datenentscheidung treffen können.
00:02:33: Und da kommt dann das Maschinenlearning ins Spiel.
00:02:35: Ich glaube, darüber werden wir dann später mehr erfahren.
00:02:37: Da werden wir gleich mehr darüber erfahren, wären wir das Märken in den Zwanzigvierzig so im allgemeinen Leben?
00:02:43: Ja, grundsätzlich ist es ja so, dass es eigentlich Einmal die riesige Chance gibt mit KI, mit künstlichen Intelligenz.
00:02:50: Also man kann Nutzen aus Daten ziehen, aber gleichzeitig gibt es natürlich auch den Datenschutz.
00:02:53: Also ich denke, es wird sich viel verändern.
00:02:55: Wir werden wahrscheinlich anders mit Daten umgehen.
00:02:58: Vielleicht werden wir irgendwie individueller unsere Datenpreis geben können.
00:03:01: Daten werden immer wichtiger werden, aber gleichzeitig gibt es natürlich auch noch diese gegenläufige Kraft eigentlich.
00:03:06: Und ich kann es schwer beantworten, was in den Zwanzigvierzig sein wird, aber auch in der Reha werden Daten noch größeren Stellenwert bekommen.
00:03:13: Und du hast den Datenschutz ja auch angesprochen, wenn wir auch gleich noch darauf kommen.
00:03:16: Die Daten gehören ja jemanden, nämlich der eigenen Person und das ist dann umso wichtiger, wie man das macht.
00:03:21: Zunächst aber zu dir.
00:03:23: Im beruflichen Kontext, wie würdest du dich anderen Menschen vorstellen?
00:03:26: Ja, also ich habe Gesundheitswissenschaften und Psychologie studiert und die Zeit habe ich in Maastricht, also in den Niederlanden verbracht.
00:03:33: Und dann habe ich auch in dem Bereich promoviert zum Thema Behaviour Change Interventions.
00:03:38: Also eigentlich bin ich in der Gesundheitspsychologie zu Hause.
00:03:41: Aber ich habe mich auch schon immer sehr für quantitative Methoden interessiert.
00:03:46: Und nach einer Promotion bin ich dann nach Köln gezogen und seit mittlerweile fast drei Jahren arbeite ich beim IQPR.
00:03:52: Und hier hatte ich viel mit Routine-Datensätzen zu tun, zum Beispiel mit der RSD, also der Reha-Statistik-Datenbasis, der Deutschen Rentenversicherung.
00:03:59: Und in diesem Zuge bin ich dann auch auf das Thema Maschinenlearning gekommen und habe da verschiedene Algorithmen ausprobiert.
00:04:05: Algorithmen an sich sind ja steinalt.
00:04:09: Ich liebe ja den Podcast Geschichten aus der Geschichte, muss ich einfach mal so sagen, und das hier ist heute meine Geschichte.
00:04:22: Das kann ich nicht ausbrechen.
00:04:24: Ich fange noch mal.
00:04:26: Der persische Mathematiker und ich hoffe, dass ich den Namen richtig ausspreche, Al-Khwarizmi, lateinisch besser Algorithmi, der um das Jahr eighthundertzwanzig nach Christus in Bagdad lebte, schrieb ein bedeutendes Werk über Indische, heute sagen wir.
00:04:42: Arabische Zahlen und Rechenverfahren, das später ins Lateinische übersetzt wurde und den Titel trägt Algorithmi denumero indodum, also Algorithmi über die indischen Zahlen.
00:04:55: Daraus wurde über die Jahrhunderte der Begriff Algorithmus, so wie wir ihn heute kennen, der ursprünglich einfach ein Rechenverfahren bezeichnete.
00:05:03: Heute bezeichnet man damit eine eindeutige Handlungsvorschrift, um ein Problem zu lösen, also eine Schritt für Schritt Anleitung für Daten, wie bei einem Kochezept, nur eben für Mathematik oder Computer.
00:05:16: Und maschinelles Lernen ist eine Weiterentwicklung dieses Algorithmos.
00:05:21: Da kommst du wieder ans Spiel Mathis.
00:05:23: Inwiefern ist das eine Weiterentwicklung?
00:05:25: Wie lernt die Maschine da?
00:05:26: Was ist der Unterschied zu einem klassischen Algorithmus?
00:05:28: Ja,
00:05:28: das ist auf jeden Fall eine schöne Geschichte.
00:05:30: Der große Unterschied ist der, dass, so wie du gesagt hast, beim klassischen Algorithmus haben wir ganz klar festgelegte Rechenschritte.
00:05:36: Also wie du sagtest, wie beim Kochezept eigentlich.
00:05:39: Beim maschinellen Lernen ist das anders.
00:05:41: Wir geben keine klaren Regeln vor, sondern wir geben der Maschine ganz viele Daten, also riesige Mengen an Daten.
00:05:47: Und die Maschine muss also eigentlich selber Muster in diesen Daten finden, Gesetzmäßigkeiten finden und schauen, wie die mit dem Outcome, also mit dem Ergebnis, assoziiert sind.
00:05:57: Also wir sagen nicht, das sind die Regeln, mach das mal.
00:06:00: Per Apö, sondern wir sagen, hier ist das Outcome.
00:06:02: und finde du selber Gesetzenmäßigkeiten in den Daten, die mit dem Outcome assoziiert sind.
00:06:07: Aufmerksam, Höhrende kennen das aus unserer Folge mit dem Jörg Gerke über künstliche Intelligenz, weil er genau dieses Verfahren ja anwendet, um zum Beispiel die Qualitätssicherungen in unserer EM-Renten-Begutachtung zu verbessern.
00:06:20: Aber wie trifft die Maschine Entscheidungen?
00:06:23: Wie?
00:06:23: Wahrscheinlich schaffen sie Gewissheit.
00:06:25: Tatsächlich geht es bei Maschinen lernen, ... um Wahrscheinlichkeiten, nicht Gewissheiten.
00:06:28: Also die Maschine kann nicht sagen, ... ... mit absoluter Gewissheit ist es so und so, ... ... sondern stattdessen sagt ihr zum Beispiel ... ... mit einer Wahrscheinlichkeit von sieben Achtzig Prozent ... ... tritt dieses oder jenes Ereignis ein.
00:06:37: Und hier ist ganz wichtig einmal zu betonen, ... ... dass natürlich ... ... die Daten, die erstmal zugrunde liegen, ... ... die sind eigentlich entscheidend.
00:06:44: Also wie man so schön sagt, ... ... garbage in, garbage out, ... ... wenn man da Müll als Daten reinsteckt, ... ... dann kommt da auch kein gutes Modell raus.
00:06:50: Wenn die Praxis schlecht agiert, ... ... dann wird die schlechte Praxis repliziert.
00:06:54: Ja, das ist korrekt.
00:06:55: Also es ist ja nicht allein die Praxis, sondern es sind vor allem die Daten, die in der Praxis produziert werden.
00:07:00: Also das heißt, wenn wir jetzt irgendwie schlecht berichtete Daten haben oder zum Beispiel jetzt, wenn wir jetzt wirklich in der Reha-Welt bleiben und wir haben es mit irgendwelchen Entlassungsberichten zu tun, der eine Arzt oder die eine Ärzte macht es so, die andere so und das ist ganz unterschiedlich und wir finden da gar keine Muster, dann wird es schwierig.
00:07:14: Wenn wir aber einen riesigen Datensatz haben, wirklich einen Statz an Daten, dann wird es einfacher.
00:07:19: Das ist erstmal das Grundlegende.
00:07:20: Also man muss immer verstehen, Modell kann natürlich nur so gut sein wie irgendwie die Daten, die dem zugrunde liegen.
00:07:26: Um jetzt nochmal zu der Frage zurückzukommen, also ich glaube eine Maschine kann keine Gewissheit schaffen in dem Sinn, aber sie kann uns auf jeden Fall sehr gut helfen, mit Unsicherheiten umzugehen, sodass wir eine bessere Entscheidung treffen können.
00:07:35: Und
00:07:35: wissen wir auch warum?
00:07:36: Also können wir die... Gedanken gegen Maschine nachverziehen?
00:07:40: Ja, das ist tatsächlich ein riesiger Punkt, der jetzt auch eigentlich so der nächste große Punkt wird, der erforscht werden muss.
00:07:46: Weil natürlich ist es grundsätzlich so, im Unterschied zu den klassischen Algorithmen oder zu den klassischen Verfahren, zum Beispiel Regierungsanalyse, sind ja mal Verfahren des maschinellen Lernens grundsätzlich Blackbox.
00:07:58: Also man kann erstmal nicht einfach so den Deckel öffnen und reinschauen, aber... Das ist jetzt eben das, was wir in der Forschung auch machen.
00:08:05: Es gibt halt wiederum Methoden, die genau das erlauben, sozusagen den Deckel aufzumachen und gucken, was passiert in dieser Blackbox, welche Variablen haben, welchen Einfluss, um das dann eben zu quantifizieren und so dann auch das Modell eigentlich erst interpretierbar zu machen.
00:08:21: Können wir das vielleicht an einem konkreten, aber sehr einfachen anschaulichen Beispiel aus dem Alltag mal durchgehen?
00:08:28: Irgendeine Entscheidung von mir.
00:08:30: Ich kaufe mir Fußballschuhe.
00:08:32: Ich will eine Entscheidung im Sportgeschäft treffen.
00:08:34: Welche Schuhe kaufe ich mir?
00:08:36: Wie würde eine Maschine diese Entscheidung versuchen zu replizieren?
00:08:40: Also zuerst würde die Maschine dann gucken, was hast du denn in der Vergangenheit gemacht?
00:08:43: Also sozusagen die Erfahrung, die in der Vergangenheit mit Fußbälschungen gesammelt hast, die ist dein erst mal entscheiden.
00:08:48: Also die Maschine würde dann gucken.
00:08:49: Okay, du hast also Schuhe von jener Marke gekauft, zum Beispiel mit dünnen Sohlen, mit dicken Sohlen und dann natürlich auch gucken.
00:08:59: Wie haben dir diese Schuhe gefallen und wie lange hast du sie zum Beispiel getragen?
00:09:02: Also das ist jetzt erstmal sozusagen der Erfahrungsschatz, den diese Maschine hat.
00:09:06: Das können wir auch, das nennen wir dann auf den Trainingsdatensatz.
00:09:09: Also anhand dieser Trainingsdaten kann ein Modell trainiert werden und das kann er eben ja in der Zukunft entscheiden, welche Schuhe du kaufen sollen würdest.
00:09:17: Das
00:09:18: heißt, je mehr die Maschine über mein bisheriges Kaufverhalten bei Fußball schon weiß, desto besser kann sie für mich vorher sagen, welche mir demnächst am besten passen.
00:09:25: Das ist korrekt.
00:09:26: Also es ist wirklich entscheidend, wie viel Erfahrungsschatz sozusagen, wie viel Trainingsdaten vorliegen und umso mehr Trainingsdaten vorliegen, umso besser auch das Modell in der Regel.
00:09:36: Heißt aber auch, dass wenn ich mich aus datenschutzrechtlichen Gründen, wenn ich da sehr restriktiv mit meinen Informationen umgehe, dann kann mir die Maschine weniger gut helfen in der Zukunft bei meiner Entscheidung, als wenn ich das offen lege.
00:09:47: Ja, das ist korrekt.
00:09:48: Also zum Beispiel jetzt ganz konkret, wenn zum Beispiel nur die Daten bestehen, die Schuhe waren günstig oder teuer.
00:09:55: Kann das viel weniger erklären, als wenn du zum Beispiel den Preis der Schuhe als kontinuierliche oder als metrische Variable hättest?
00:10:03: Also tatsächlich den konkreten Preis.
00:10:06: Und natürlich auch andere Informationen.
00:10:07: Wenn die fehlen, dann würde die Maschine nur mir immer die billigsten anbieten, zum Beispiel.
00:10:12: Ja, genau, dann würde sie halt irgendwie denken, okay, der als letztes ein Schuh in der Preisklasse zum Beispiel gekauft, dann macht er das wieder.
00:10:19: Aber wenn du eben einen Größenerfahrungsschatz hast, dann kann die Maschine genauer entscheiden.
00:10:23: Alles klar.
00:10:23: Das heißt, die Modelle sind umso besser, je mehr sie über die jeweilige Entscheidungssituation wissen.
00:10:28: Das heißt, retrospektiv werden meine Erfahrungen, meine Erfahrungswissen genutzt, um diese Kaufentscheidung vorherzusagen.
00:10:34: Okay, wenn ich die jetzt schlecht finde, was macht die Maschine dann?
00:10:38: Ja, das ist ein iterativer Prozess, also du kannst dann wiederum der Maschine dieses Feedback zurückgeben im Sinne von, okay, diese Schuhe haben wir jetzt nicht gefallen und so wird auch der Algorithmus daraus lernen und die wahrscheinlich dieses paar Schuhe und auch Schuhe, die ähnlich Eigenschaften haben, erstmal nicht mehr vorschlagen.
00:10:55: Das heißt, die Maschine und ich, wir können uns verbessern.
00:10:59: Ja,
00:10:59: auf jeden Fall.
00:10:59: Also das ist erstmal grundlegend so bei Maschinen-Learning.
00:11:02: Also der Algorithmus kann sich dann mit der Zeit, wenn er, ja.
00:11:05: in einem Modell, in einem Anwendungsbeispiel angewendet wird, immer weiter verbessern.
00:11:10: Das ist interessant, skalieren wir das mal hoch.
00:11:12: Wir sind jetzt nicht bei der individuellen Kaufentscheidung, wir sind jetzt hier bei der Rentenversicherung.
00:11:15: Die macht Reaptation eine Million medizinische Rehalleistungen pro Jahr, nun mal so als Orientierung.
00:11:21: Wie können wir als Rentenversicherung dieses Machine Learning nun nutzen?
00:11:25: in dem Kontext?
00:11:26: Grundsätzlich
00:11:26: ist es ja so, in der Rehawelt haben wir es mit sehr vielen verschiedenen Menschen zu tun, also mit verschiedenen Erwerbsbiografien, mit verschiedenen Erkrankungen, Behinderungen etc.
00:11:37: Und das heißt, wir haben es mit sehr komplexen Daten zu tun.
00:11:39: In der Vergangenheit war es eigentlich so, dass wir alle Vorhersagemodelle immer mit der logistischen Regression, grundsätzlich mit einer Regressionsanalyse gemacht haben.
00:11:49: Nun ist es aber so, dass die Regressionsanalyse grundsätzlich nur lineare Zusammenhänge erkennen kann.
00:11:55: Und oft ist die Realität eben komplexer als so in den Jahren Zusammenhang.
00:11:58: Das heißt, wenn zwei Tage länger gearbeitet?
00:12:01: Exakt.
00:12:01: Eigentlich wie ein Skiberregler.
00:12:03: Also du sagst zum Beispiel, jetzt mit jedem Jahr, den dieser alter Skiberregler nach rechts gedrückt wird, sinkt vermutlich die Wahrscheinlichkeit zurück in Arbeit zu kommen.
00:12:12: Okay.
00:12:13: So.
00:12:14: Und bei Machine Learning ist viel besser dazu geeignet, auch komplexere Zusammenhänge in den Daten zu finden.
00:12:21: Also jedes Altersjahr wird sozusagen isoliert für sich genommen?
00:12:24: ohne dass sozusagen ein allgemeiner Zusammenhang zwischen diesen beiden Informationen hergestellt wird.
00:12:29: Ja genau, ganz richtig.
00:12:30: Also erstmal ist es so, dass eben nicht dieser Linearzusammenhang grundsätzlich angenommen wird.
00:12:35: Und zweitens ist es ganz wichtig, dass man auch alle Interaktionen sich anschaut.
00:12:39: Bei Regressionsanalyse gibt es natürlich grundsätzlich auch Interaktion zwischen Variablen.
00:12:43: Das heißt eine Wechselwirkung zwischen zwei Variablen.
00:12:45: Das klären wir gleich.
00:12:46: Aber die muss eben manuell vom Forscher, von der Forscherin vorher so in die Regressionsgleichung eingegeben werden.
00:12:54: Das kann man sich vorstellen, wie so ein Detektiv, also wenn es ein Regressionsdetektiv gibt, dann muss man dem Detektiv sagen, okay, das sind die Verdächtigen und der und der hat vielleicht noch einen Komplizen.
00:13:04: Bei Machine Learning ist es hingegen so, dass der Detektiv einfach am Tatort ist, alle Daten sich anguckt, alle Personen befragt und selber dann überlegt, okay, die Person könnte verdächtig sein.
00:13:15: oder die Person wiederum könnte mit der anderen Person zusammenverdächtig sein.
00:13:19: Das heißt, wir sind hier viel freier und müssen nicht vorab definieren, was wir eigentlich untersuchen wollen, sondern entdecken auch Muster, die uns als Forscherinnen so nicht bekannt waren.
00:13:29: Okay, das heißt, wir treffen keine Annahmen über die Art des Zusammenhangs zwischen den Informationen und wir treffen auch keine Auswahl.
00:13:38: welche Information oder welche Informationskombinationen verwendet werden soll.
00:13:42: Okay, und Interaktion heißt ja, dass das Zusammentreffen von zwei Informationen noch mal einen gesonderten Effekt auf den Outcome ausübt.
00:13:52: Zum Beispiel, wenn jemand arbeitslos wird, dann hat das ein Risiko auf die er späterer Werbstätigkeit.
00:13:57: Das wissen wir.
00:13:58: Menschen, die längere Arbeitslosigkeitszeiten haben, haben geringere Wahrscheinlichkeit wieder zu arbeiten später.
00:14:03: Und wenn diese Personen aber zusätzlich jetzt noch irgendeine andere Informationen mitbringen, zum Beispiel eine geringe Bildung.
00:14:12: Wir wissen, dass eine geringe Bildung für sich auch ein Effekt hat.
00:14:15: Aber wenn das beides zusammenkommt, dann wird es quasi noch ein stärkere Effekt.
00:14:18: Ja, super erklärt.
00:14:19: Also grundsätzlich haben wir... Danke.
00:14:22: Grundsätzlich haben wir natürlich solche Interaktionen auch in der Vergangenheit schon berücksichtigt, aber wie gesagt eben
00:14:27: nur vorgegeben.
00:14:28: Also weil wir genau diese Annahme hatten, dass zum Beispiel Arbeitslosigkeit und Bildung gemeinsam noch einen besonderen Effekt hat.
00:14:33: Ja genau,
00:14:34: vielleicht
00:14:34: ist es gar nicht Arbeitslosigkeit und Bildung, sondern vielleicht ist es Arbeitslosigkeit und ob eine andere Person im Haushalt lebt.
00:14:40: Und darüber haben wir bislang keine Erkenntnisse, also auch keine Hypothesen.
00:14:44: Also würden wir es nie überprüfen in der Regression.
00:14:46: Und ganz kurz noch, wenn wir drei Informationen haben, die wir jetzt in so ein Modell reinschicken, dann haben wir ja theoretisch sieben verschiedene Einflussmöglichkeiten.
00:14:58: Weil ja, alle Informationen in Kombination zueinander auch getestet werden.
00:15:02: Das heißt, so ein Modell explodiert ja von der Komplexität her.
00:15:05: Das können wir in einer Regression überhaupt nicht mehr abbilden.
00:15:07: Richtig,
00:15:07: ja.
00:15:08: Also mit jedem weiteren, mit jeder We... Also grundsätzlich ist es so, dass ein Modell noch gut funktioniert, wenn man vielleicht ein oder zwei Interaktionstermin das Modell einschließt.
00:15:15: Aber mit jeder weiteren Interaktion steigt dann eben einfach die Komplexität des Modells so stark, dass es auch für uns Forscherinnen irgendwann schwierig wird, das Modell zu interpretieren.
00:15:25: Und das ist ja eigentlich die große Stärke.
00:15:26: von einer Regierungsanalyse, dass sie von Haus aus interpretierbar ist.
00:15:30: Aber wenn wir dann eben ein Haufen Interaktion nach rein, naja, schütten, packen, dann wird es schwer.
00:15:36: Okay, gut, das habe ich verstanden.
00:15:38: Jetzt nochmal zurück zur Rentenversicherung.
00:15:40: Wo kann sie das konkret nutzen?
00:15:42: Also es gibt ganz unterschiedliche Anwendungsbereiche, denke ich.
00:15:46: Zuerst ist es einmal so, dass gerade auch Bevor die Reha eigentlich beginnt, wird es schon ganz spannend, weil man muss ja eigentlich gucken, welche Personen hat eigentlich den größten Nutzen bei welcher Reha-Maßnahmen.
00:15:56: Also sowohl bei der medizinischen Reha als auch beruflichen Reha könnte man also so Prognosemodelle aufstellen und vorher schon abschätzen.
00:16:02: Okay, diese Person braucht vielleicht noch ein Vorbereitungskurs vor der Umschulung.
00:16:07: Bei dieser Person können wir uns das sparen, so können auch Kosten gespart werden, weil die wahrscheinlich schon die nötigen Voraussetzungen mitbringt.
00:16:12: Ah ja, wir können quasi die Leute in Gruppen einteilen und denen dann spezifischere und bessere Angebote machen.
00:16:19: Richtig,
00:16:19: also in Gruppen einteilen hört sich dann immer schwierig an, aber wir wissen ja schon aus der Forschung, es gibt keinen one-size-fits-all, sondern wir wollen eigentlich immer gucken, wie können wir den RehabilitantInnen die beste Reha geben.
00:16:32: Und das ist eben ganz unterschiedlich, das kann ganz unterschiedlich sein.
00:16:35: Genau, da hilft so eine Maschine natürlich sehr.
00:16:36: Also ist ja mal so idealtypisch, würde man sagen, jeder Fall wird einzeln angeschaut, sehr intensiv und man würde dann wahrscheinlich auch jedem die beste Form von Reaktion geben können.
00:16:43: Aber so viel Zeit hat kein Mensch.
00:16:45: Und das ist ja auch bei einem von fünf Millionen Anträgen im Jahr.
00:16:48: Wenn man sich überlegt, dass die Rentenversicherung jeden Antrag so intensiv anguckt, dann würde das sämtliche Kosten sprengen.
00:16:53: Und da sind solche vorbereitenden Analysen auch über Maschine das Lernen geeignet, um Risikogruppen zum Beispiel zu schaffen.
00:17:01: Und dann kann man da nochmal reingucken.
00:17:02: Passt der da wirklich rein?
00:17:03: Das geht dann schneller.
00:17:04: Genau,
00:17:05: richtig.
00:17:05: Also es ist auch ganz wichtig, die Maschine nimmt natürlich nicht die Entscheidung ab, also am Ende entscheidet immer noch der Mensch.
00:17:10: Aber sie kann eben dem Menschen helfen, die Entscheidung zu treffen.
00:17:13: Und das haben wir jetzt schon gesehen, teilweise auch sehr gut.
00:17:16: Also
00:17:16: halt mal fest, Zugang, Reha-Zugang, ganz wichtiger Zugang zu Leistung, weil man besser die Risikoprofile abschätzen kann, auch nicht unbedingt besser, aber ich will sagen, effizienter.
00:17:26: Effizienter.
00:17:27: Und man muss natürlich sagen, Mathis, wir als Rentenversicherung mit unseren... was weiß ich, vierzig Millionen aktiv versicherten.
00:17:34: Wir haben natürlich endlos viele Daten, um genau solche, theoretisch solche Maschinen zu füttern, um genau auf der Basis dann unsere Prozesse, unsere Steuerungsprozesse, zu optimieren.
00:17:44: Also schneller zu vielleicht sogar besseren oder zu einem gleich guten Entscheidung zu kommen.
00:17:49: Und dann geht es so weiter, wenn wir dann einmal in der Reha sind, wirkt die Reha selber auch noch ein riesiges Potenzial.
00:17:54: Also wir sehen ja auch viele Leute haben zum Beispiel zu Tage solche Smartwatches an.
00:17:58: Und da kommen wir dann schon fast in den Bereich von Big Data.
00:18:00: Also es geht wirklich um Sensor-Daten, die in Echtzeit eigentlich schauen, okay, wie geht es der Person?
00:18:05: Und so kann zum Beispiel während dieser Therapie geguckt werden, ist die Person überfordert, vielleicht sogar unterfordert.
00:18:11: Also so kann der Therapieverlauf eigentlich ganz individuell angepasst werden.
00:18:16: Und vor allem ...
00:18:17: Man kann eingreifen dann sofort, ne?
00:18:19: Exakt,
00:18:19: das Ganze ist eine Echtzeit.
00:18:20: Also es ist nicht das danach, nach der Reha, der Rebilitanz zum Beispiel, also eigentlich war das total langweilig.
00:18:25: Ich fühlte mich überhaupt nicht gefördert, sondern Echtzeit kann man eben sehen, okay, die Person... braucht mehr oder weniger unterstützt.
00:18:32: Der
00:18:32: Puls ist immer noch bei achtzig.
00:18:33: Da kann man noch was draufpacken.
00:18:35: Okay, gut.
00:18:35: Sehr schön.
00:18:36: Also für so eine Therapieoptimierung oder Therapiesteuerung auch.
00:18:39: Also auch wieder ein Steuerungsthema.
00:18:40: Und
00:18:40: dann geht es eigentlich genauso weiter.
00:18:42: Also auch nach der Reha ist dann die Frage, welche Personen brauchen zum Beispiel noch eine zusätzliche Nachsorgeleistung?
00:18:47: Und bei welchen Personen, die sind schon so fit, die werden jetzt sowieso zurück in Arbeit kommen.
00:18:52: Okay, alles klar.
00:18:53: Und dann kann ich mit den einen was anderes besprechen als mit den anderen.
00:18:57: Sehr schön.
00:18:58: Ja, glaube ich, haben wir einen guten Einblick gekriegt.
00:19:00: Ich glaube, dass das die Reha-Steuerung, den Reha-Prozess ziemlich optimieren kann.
00:19:05: Heißt aber, dass man diese Daten auch hat.
00:19:06: Jetzt fahre ich mal gerade in Bezug auf diese Sensor-Daten und Smartwatch.
00:19:09: Wie weit sind wir denn da jetzt?
00:19:11: Ja, grundsätzlich ist es so, dass eigentlich die Technik auch immer günstiger geworden ist.
00:19:14: Und man sieht es ja auch, wie viele Leute mit Zwarthwasches rumlaufen.
00:19:18: Also das Problem ist, glaube ich, weniger, dass die Technik noch nicht vorhanden ist.
00:19:21: Sondern dann kommt wieder die Frage, wollen wir das dann überhaupt?
00:19:23: Wollen wir den Therapeut innen, diese Arbeit?
00:19:26: Abnehmen ist ja das falsche Wort.
00:19:27: Aber ich denke, hier muss man, bevor man jetzt einfach so irgendwas in den Reha-Alltag integriert, muss erst mal geforscht werden, dass eben noch nicht passiert, sofern ich das zumindest
00:19:37: jetzt überblicke.
00:19:37: Und es ist natürlich auch die Frage, wollen wir die Daten so frei durch den Etter jagen?
00:19:41: Diese Daten gehen ja dann an einen allgemeinen Server irgendwo, wo die Reha auch darauf zugeladen kann, die Reha-Einrichtung, damit sie die verwenden kann.
00:19:48: Ja, ganz richtig, also gerade in Europa ist ja auch der Datenschutz wirklich ein hohes Gut.
00:19:52: Und so wird es natürlich immer dabei bleiben, dass eigentlich zwei Kräfte sind, die da irgendwie gegenläufig sind.
00:19:57: Also einmal der Datenschutz, das heißt, bleiben die Daten auf Servern, die wir kontrollieren können, zum Beispiel ist ... gäbe ja auch die Möglichkeit, dass die Daten alle bei Servern bleiben, die sogar in der Reha-Einrichtung stehen.
00:20:09: Dass sie sozusagen die Reha-Einrichtung gar nicht verlassen, so wie man Montania zum Beispiel auch bögen über Patientinnen ausfüllt, die auch in der Reha-Einrichtung bleiben.
00:20:18: In der Akte.
00:20:19: In einer Akte, in einer digitalen Akte, die auf einem Server in der Reha-Einrichtung stehen und der Revilitan dann selber entscheiden kann, okay, diese Daten möchte ich zum Beispiel auch... teilen und diese Daten vielleicht lieber nicht.
00:20:29: Und auch wenn ich dann in eine Folgeleistung komme, kann der Patient auch wiederum entscheiden, okay, das möchte ich teilen, das ist denke ich eigentlich so der Optimalzustand, wie er irgendwann mal sein kann.
00:20:39: Heißt aber, dass die Patientinnen eine gewisse Kompetenz brauchen, einzuschätzen, was ist da jetzt noch sinnvoll und wo ist es nicht mehr sinnvoll für mich?
00:20:50: Ich glaub, dass vor allem da erst mal jetzt noch viel Forschung gemacht werden muss.
00:20:54: Also erst mal wirklich mal geguckt wird, wir haben jetzt ja einfach eine Gruppe zum Beispiel, die arbeitet mit solchen ... ... Echtzeit-Analysen und eine Gruppe, die arbeitet nicht mit Echtzeit-Analysen, wirklich mal ein ganz klassises RCT zum Beispiel ... ... durchzuführen und dann eben zu gucken, wo's ein Unterschiede ist.
00:21:09: Das Return to Work in der Gruppe vielleicht sogar höher oder tut sich nix.
00:21:12: Und natürlich auch qualitativ zu gucken, wie haben die Leute das wahrgenommen.
00:21:15: Vielleicht fühlen sich auch gerade, also ist jetzt ein ... Vorurteil, aber gerade ältere Rehabilitantinnen eher unwohl dabei, wenn sie die ganze Zeit so ein technisches Gerät mit sich tragen.
00:21:24: Wer
00:21:24: die Hypothese für die Regression?
00:21:25: Könnte
00:21:25: sein.
00:21:27: Gut, Mathis, du weißt es ja auch aus diversen Forschungsprojekten.
00:21:31: Du kennst das Thema.
00:21:32: ja, die Rentenversicherung ist da ja schon unterwegs.
00:21:33: Also wir versuchen unsere Entscheidung ja schon Datenbasier zu unterstützen.
00:21:37: Wir haben tatsächlich auf Basis eines herkömmlichen Modells, eines Regressionsmodells ja schon einen Risikoscore entwickelt.
00:21:44: Das heißt, wir haben die Möglichkeit zu sehen auf Basis der Erwerbsverläufe von unseren Versicherten, ob diese Versicherten eventuell in Risiko haben in den nächsten fünf Jahren.
00:21:54: Gesundheitsbezogen rauszufallen.
00:21:56: Wir nennen das Risiko in nächster Erwerbsminderungsrente.
00:21:58: Das ist insofern spannend, weil die Menschen nicht zu uns kommen müssen und den Antrag stellen müssen, sondern wir können den Menschen einen Brief schreiben beispielsweise und sagen, könnte es sein, dass du uns brauchst.
00:22:11: Eventuell ist es sinnvoll, wir sind die Rentenversicherung, wir machen Reha, weil nicht jeder weiß ja, dass wir Reha machen.
00:22:15: Das heißt, wir haben auch die Möglichkeit proaktiv auf Menschen zuzugehen.
00:22:18: Das tun wir jetzt schon.
00:22:19: Was jetzt noch fehlt, wäre dein Machine Burning, um dieses Modell, diesen Risikoindex noch weiter zu optimieren.
00:22:24: Geht das?
00:22:24: Ja, auf jeden Fall.
00:22:25: Also das ist in der Tat so, dass der Risikoindex natürlich schon was ganz Besonderes ist, was es ja sonst so auch nicht in dieser Welt gibt.
00:22:31: Der Unterschied ist natürlich der, dass wir da wiederum mit den klassischen Verfahren, oder es wurde nicht wir, andere Leute haben mit den klassischen Verfahren gerechnet und man könnte natürlich überlegen, ob man auch jetzt hier das Ganze nochmal auf ähnliche Art und Weise macht mit Verfahren des maschinen Lerns.
00:22:45: Vielleicht wird der Risikoindex dann noch besser im Sinne von, dass er bessere Vorhersagen treffen kann.
00:22:50: wissen wir natürlich nicht.
00:22:51: Um
00:22:51: nicht unnötig Menschen anzuschreiben, die es nicht brauchen.
00:22:53: Richtig,
00:22:54: also genau.
00:22:55: Und also es gibt natürlich nur relativ wenig Leute, die am Ende wirklich in der Werbsminderungsrente gehen.
00:22:59: Das heißt, wir wollen eigentlich den Anteil reduzieren, die dann sozusagen unnötigerweise angeschrieben werden.
00:23:04: Da bin ich gespannt.
00:23:05: Gut, aber kommen wir nochmal zurück zu der methodischen Geschichte.
00:23:09: Und ich muss jetzt erwähnen, dass ich mich mit dem Thema durchaus auch in letzter Zeit beschäftigt habe.
00:23:13: Ich durfte ja mit Diamantis und anderen Kollegen eine wissenschaftliche Publikation gestalten, die auch, glaube ich, demnächst veröffentlicht wird.
00:23:20: oder schon veröffentlicht ist, weiß ich gar nicht.
00:23:21: Ja,
00:23:22: noch nicht veröffentlicht, aber es ist sehr interessant zu sehen.
00:23:24: Normalerweise ist es ja sehr schwer, Gutachter in eine Kommentare zu bekommen.
00:23:29: Und hier war es jetzt wirklich ganz anders.
00:23:30: Also wir haben die jetzt als Preprint veröffentlicht.
00:23:33: Und in den ersten Tagen kamen direkt fünf Zusagen von Personen, die das ja reviewen wollten.
00:23:38: Also das Interesse auf jeden Fall sehr groß.
00:23:40: Und vielleicht ist dann ja auch schon veröffentlicht, wenn diese Podcastfolge rauskommen.
00:23:43: Vielleicht lösen wir es auf, Mathis.
00:23:45: Worum geht es in der Veröffentlichung?
00:23:46: Wir haben also geguckt, wie gut ein Verfahren, das maschinelle Lerns, den das Return to Work, den Return to Work vorhersagen kann.
00:23:56: Also die berufliche Wiedereingliederung.
00:23:58: Nach einer medizinischen Rehabilitation.
00:24:00: Und zwar aufgrund von muskisch-gelett Erkrankungen.
00:24:02: So was haben wir also in der Vergangenheit traditionell immer mit logistischen Regressionsanalysen gemacht.
00:24:07: Hab ich übrigens gemacht, muss man dazusagen.
00:24:10: Also wir haben bei der Rentenversicherung genau eine solche Analyse in den letzten Jahren durchgeführt und haben auf Basis unserer Daten solche Regressionsmodelle gerechnet und auch veröffentlicht.
00:24:20: Die jälzige Veröffentlichung, die ihr macht, die nimmt genau darauf Bezug und schaut, ob durch das Maschinen der Lernen dasselbe rauskommt auf Deutsch gesagt.
00:24:28: Ja, also wir haben uns Verfahren bedient, die auf Entscheidungsbäumen basieren.
00:24:32: Also ein Entscheidungsbaum kann man sich eigentlich ganz simpel vorstellen.
00:24:35: Also angenommen, ich will jetzt entscheiden, ob ich heute lieber ins Kino gehe, heute Abend oder zum Restaurant.
00:24:40: Und dann wäre zum Beispiel die erste Frage, ist heute Montag und dann gehe ich vielleicht lieber ins Kino, weil Restaurants oft Montags geschlossen haben.
00:24:46: Also ein Entscheidungsbaum ist eigentlich eine Abfolge von verschiedenen Fragen.
00:24:50: Und die wichtigste wird zuerst genommen und dann die nächste.
00:24:52: Exakt.
00:24:53: Aber das Wichtigste ist natürlich, wir haben uns jetzt nicht einfach nur ein einzigen Entscheidungsbaum überlegt, weil der liegt natürlich bei vielen Leuten dann falsch, das ist logisch, sondern wir haben uns einen ganzen Wald von Entscheidungsbäumen bedient.
00:25:04: Ein Entscheidungswald.
00:25:05: Ein Entscheidungswald.
00:25:06: Schön.
00:25:06: Das ist auch maschinelles Lernen, also es ist gleiche.
00:25:09: Genau, also es gibt verschiedene Verfahren des maschinellen Lernens.
00:25:12: Und dann gibt es eben die, die auf Entscheidungsbäumen basieren.
00:25:15: Vielleicht hat der eine oder andere schon mal Random Forest gehört.
00:25:18: Das ist so eines der beliebtesten Verfahren.
00:25:21: Wir haben uns jetzt Boosted Decision Trees bedient.
00:25:24: Der Unterschied ist der, dass beim Boosted... Decision trees die Bäume, die wachsen sozusagen nacheinander.
00:25:31: Und das ist der Vorteil, dass jeder weitere Baum auch aus den Fehlern der vorherigen Bäume lernen kann.
00:25:38: Ah
00:25:38: ja, okay.
00:25:39: Und grundsätzlich ist es so, dass momentan bei tabularen Daten, es ist eigentlich so, dass auch diese Verfahren, die wir ja zu verwendet haben, so als der Goldstandardien.
00:25:48: Was sind tabulare Verfahren?
00:25:50: Tabulare
00:25:50: Daten.
00:25:51: Also genau, also jetzt nicht Bilderkennung oder sowas, sondern wirklich einfach Statistikdaten.
00:25:56: Richtig,
00:25:57: ja.
00:25:57: Also, okay, das heißt, wir haben maschinelles Lernen angewandt in der Publikation.
00:26:01: Habt ihr gemacht, haben wir nicht gemacht.
00:26:02: Wir haben sozusagen den Vorreiter gebaut, nämlich die Regression.
00:26:05: Und wir haben ja tatsächlich dann auch Erkenntnisse gehabt in der Regression.
00:26:08: Wie waren die Erkenntnisse Ergebnisse bei euch?
00:26:10: Also grundsätzlich war es schon so, dass wir auch größtenteils festgestellt haben, dass die Predektoren, die sich als wichtig herausgestellt haben in eurer Forschung, auch bei uns wichtig waren.
00:26:21: Es hat sich aber auch gezeigt, dass es durchaus Merkmale gibt, die einfach auch in der Vergangenheit noch nicht... Verwendung fanden, auch auf... Auch teilweise aus inhaltlichen Gründen, zum Beispiel Prozessmerkmale.
00:26:33: Aber in unserer Studie hat sich jetzt gezeigt, dass auch diese Prozessmerkmale einen großen Beitrag zur Vorhersage leisten können.
00:26:39: Also wenn man ist ja natürlich die Frage, was will man jetzt, wenn man ein Baseline-Modell, wo man nur Daten hat, die wirklich zu reher beginnen, feststehen und will dann den Erfolg, also die ins Return to Work-Vorhersagen oder will man nur die wissenschaftliche Forschungsfrage beantworten, wie können wir ein möglichst gutes RTW-Modell aufstellen?
00:26:55: Also das eine ist... Okay, den Unterschied habe ich noch nicht verstanden.
00:27:00: Das muss ich noch mal erklären.
00:27:01: Ja, also die grundsätzliche Fragestellung ist die.
00:27:04: Also wir haben also in der Reha Statistic Datenbasis ganz verschiedene Variablen.
00:27:07: Da sind Sachen wie das Alter zum Beispiel, da ist zum Beispiel die Erwerbsbiografie dabei, aber wir haben auch Merkmale, die entstehen erst im Prozess der Rehabitation.
00:27:15: Ach
00:27:15: so, und die sind dann zum Zeitpunkt, zum Beispiel der Antragstellung, nicht verfügbar?
00:27:20: Das heißt, solche Modelle könnte man nicht nehmen, um auf Basis der Antragstellung sozusagen zu erkennen, in welche Leistung gehört der Mensch.
00:27:26: Das gehen wir dann nicht, weil da auch Daten drin sind, die später erst entstehen.
00:27:29: Korrekt.
00:27:29: Zum Beispiel Daten aus einem Entlastungsbericht können dann da drin stehen.
00:27:33: Aber
00:27:33: das könnte ich in der Regression ja auch machen.
00:27:35: Das ist jetzt nicht das große Thema.
00:27:36: Genau.
00:27:37: Und der andere große Punkt, was jetzt das Besondere ist, an unserem neuen Verfahren, ist der, dass wir eben vorab keine Annahmen getroffen haben, welche Variablen wie miteinander interagieren.
00:27:48: Wir sind also ganz frei daran gegangen und haben einfach den Algorithmus seine Arbeit machen lassen.
00:27:53: Okay.
00:27:54: Und der hat sich also selber überlegt, hat selber die Muster in den Daten gefunden, hat auch so Interaktion gefunden, die uns zum Beispiel vorher noch nicht bewusst waren, aber die wir auch inhaltlich plausibilisieren konnten.
00:28:04: Also in der Regression, gerade weil Interaktionen schnell das Modell aufblähen, ist es ja so, dass wir in einer normalen Regression eher Thesen basiert, einzelne Interaktionen testen.
00:28:14: weil wir sozusagen wissen aus früheren Studien, da könnte ein Entfluss bestehen oder wir haben den begründeten Hinweis darauf und dann nehmen wir das bewusst rein.
00:28:21: Hier war es frei.
00:28:22: Das heißt, wir haben nicht gewusst, welche Interaktion zum Schluss rauskommt bei den Top Ten.
00:28:27: Was würdest du aus einer wissenschaftlichen Perspektive, was ist das bessere Verfahren?
00:28:30: Kann man das sagen überhaupt?
00:28:31: Ja, ich glaube eben.
00:28:33: Ich glaub, genau das kann man schwer sagen.
00:28:34: Es gibt nicht das bessere Verfahren.
00:28:36: Also die, die jetzt sagen, okay, Regressionsanalyse, das ist interpretierbar, das haben wir schon immer so gemacht.
00:28:41: Das machen wir weiterhin.
00:28:43: Die, denke ich, ja, die machen sich zu einfach.
00:28:47: Aber die Leute, die jetzt einfach sagen, okay, es gibt was Neues, das nutzen wir jetzt.
00:28:50: Wir packen jetzt einfach alle Daten in meinen eigenen Algorithmus, verstehen eigentlich gar nicht, was da im Hintergrund passiert.
00:28:54: Die machen sich's noch einfacher.
00:28:56: Man muss also irgendwas dazwischenfinden.
00:28:58: Das ist das Entscheidende.
00:28:59: Also das ist eben auch das Interessante, was wir jetzt eben machen wollen.
00:29:02: vergleichen, zu gucken, was sind Merkmale, die eben ihr herausgefunden habt, was Merkmale, die wir herausgefunden haben, was würde man wiederum sehen, wenn man jetzt wiederum iterativ vorgeht und die Merkmale, die wir jetzt als wichtig identifiziert haben, wiederum in die Regressionsanalyse aufnimmt.
00:29:18: Also ich glaube, es gibt kein entweder oder, sondern das Wichtige ist, dass man sich beide Verfahren bedient.
00:29:24: Ich denke ja, und das ist auch ein kleiner methodischer Exkurs jetzt, oder meine These wäre, dass Machine Learning insbesondere dann angewandt werden kann, wenn man explorativ vorgeht.
00:29:35: Wenn man also tatsächlich eine Information bestmöglich erklären will, völlig egal wie, Hauptsache bestmöglich erklärt.
00:29:42: und explorativ heißt, ich weiß noch nicht welche Einflüsse, kann aber danach mir Überlegungen machen, warum diese Einflüsse so relevant sind, während die Regression sich sehr gut bietet.
00:29:52: bei Thesen prüfenden Verfahren, wo ich also vorher eine klare Hypothese habe ich testet, zum Beispiel ein RCT, wo ich die Wirksamkeit an der Maßnahme teste.
00:30:00: Das kann ich nicht mit Machine Learning machen.
00:30:02: Also da habe ich nämlich eine klare Hypothese und die muss da rein und die muss getestet werden.
00:30:05: dieser Zusammenhang.
00:30:06: Ja, da bin ich auf jeden Fall d'accord.
00:30:08: Also grundsätzlich ist es ja so, dass das große Ziel im maschinen Lernen ist, meistens einfach ein möglichst gutes Modell zu erschaffen.
00:30:15: Genau.
00:30:15: Also eine besonders gute Vorhersage-Güte.
00:30:18: Wohingegen in der klassischen Statistik, sag ich mal, wollen wir ja eigentlich meistens Hypothesen testen.
00:30:23: Richtig.
00:30:24: Genau.
00:30:25: Und damit kommen wir auch schon, würde ich sagen, zum Realitätscheck.
00:30:29: Realitätscheck.
00:30:32: Ich habe gelernt, Maschinelles Lernen ist ein Teil von KI.
00:30:37: Maschinelles Lernen bedeutet, dass ich bestimmte Informationen, Endpunkte, bestmöglich Aufkläre oder Erkläre um.
00:30:47: Und das ist die zweite Info für mich, gerade in der Reha, insbesondere die Steuerung zu verbessern.
00:30:51: Also tatsächlich uns dabei zu unterstützen bei der Vielzahl für Menschen, die zu uns kommen, relativ schnell und gut zu wissen, wer was benötigt.
00:30:59: Das ist sozusagen eine große Stärke, da können wir unsere Daten für verwenden.
00:31:03: Ich habe auch gelernt, dass alle Menschen sich mit diesem Thema auseinandersetzen sollten, weil sie eine gute Entscheidung in der Zukunft treffen müssen, in welchen Kontexten sie welche Daten für welche Zwecke bereitstellen wollen.
00:31:16: Ich finde, da muss man sich Gedanken darüber machen, auch als Normalbürgerin, weil da kann man nicht pauschal sagen, ich mache nix oder ich gebe alles frei, sondern da muss man genau überlegen, in dem Kontext ist es sinnvoll, weil es mir hilft, zum Beispiel Gesundheitsdaten, verschiedenen Trägern oder verschiedenen Institutionen bereitzustellen, um eine bestmögliche Versorgung zu bekommen.
00:31:34: sinnvoll sein, ob ich meine Kaufentscheidung durch Maschen eines Lernen unterstützen lassen möchte, durch personellisierte Werbung ist wieder eine ganz andere Frage.
00:31:40: Also da muss man, glaube ich, sehr informiert sein in Zukunft.
00:31:44: Und deswegen ist das interessant, das betrifft uns alle.
00:31:46: Das ist auch eine Erkenntnis, die ich habe.
00:31:48: Und das Dritte ist, für die Wissenschaft, es gibt nicht das Verfahren der Wahl, das Bestmögliche, sondern das Machine Learning, reiht sich ein in die empirischen Methoden und kann vor allem explorative Dinge gut machen, also eine Modellgüte optimieren.
00:32:02: Man kann damit aber schlecht Hypothesen testen.
00:32:04: Würdest du mir zustimmen?
00:32:05: Auf jeden Fall.
00:32:07: Gut, Mattis.
00:32:07: Dann kommen wir zum Schluss.
00:32:08: Vielen Dank für das interessante Interview.
00:32:11: Ich freue mich auf die Daten gesicherte Zukunft.
00:32:13: Ich freue mich auf die Nutzung der Daten im Rentenversicherungskontext.
00:32:18: Ich kann schon in die Zukunft sehen und weiß, was passiert.
00:32:22: Nämlich ein Spiel.
00:32:23: Bist du bereit?
00:32:24: Ich bin bereit.
00:32:32: Also Mattis, entweder eine Entscheidung in zero Komma drei Sekunden treffen wie ein Algorithmus oder drei Tage lang grübeln wie ein echter Mensch.
00:32:39: Ja, ich würde sagen, wenn es um die Entscheidung beim Essen geht, im Restaurant zum Beispiel, dann zero Komma drei Sekunden.
00:32:43: Aber immer wenn es um Menschen geht und das ist eine Reha ja so, dann sollten sie lieber die drei Tage sein.
00:32:47: Und wie bist du?
00:32:48: Was bist du für ein Typ?
00:32:49: Also bist du eher jemand, der schnell entscheidet?
00:32:50: Tatsächlich, ich kann relativ schnell entscheiden, ja.
00:32:52: Und fährst gut mit der Geschichte?
00:32:54: Ja, würde ich sagen.
00:32:55: Alles
00:32:55: klar.
00:32:56: Es gibt ja Menschen, die brauchen länger.
00:32:58: Also ich kenne auch Menschen, die im Restaurant länger brauchen bei der Auswahl.
00:33:01: Nee, nee, im Restaurant wird es mich erstören, wenn Leute da ewig über die Speisekarte, auch wenn die Speisekarte zu lang ist.
00:33:06: Ich würde der ersten Bauch heraus entscheiden und das schmeckt dann auch meistens.
00:33:09: Und man weiß ja auch nicht, wie die Alternative war.
00:33:10: Richtig.
00:33:12: Okay, zweite Frage.
00:33:13: Entweder aus Fehlern lernen wie ein Mensch oder nie Fehler machen, aber auch nie Neues erleben wie ein hochsensibler, übervorsichtiger Algorithmus.
00:33:21: Ja, das finde ich ist auf jeden Fall aus Fehler lernen.
00:33:23: Das ist deutlich wichtiger.
00:33:25: Try and Error gibt es ja sogar.
00:33:26: Also es ist ja ein wissenschaftliches Prinzip.
00:33:28: Der Signifikantstest, der ja eine Nulliopothese ablehnt, ist ja nach dem Prinzip erstellt.
00:33:35: Der Erkenntnistheoretiker Karl R. Popper hat das in den zwanziger Jahren entwickelt.
00:33:43: Aus dem Scheitern lernen.
00:33:45: Das ist, ehrlich gesagt, das ist ein Prinzip, was ich sehr früh während meines Studiums verinnerlicht und verstanden habe.
00:33:51: Deswegen kann ich glaube ich auch so gut Statistik und was ich auch finde, in allen Lebensbereichen gut funktioniert.
00:33:56: Denn wenn ich bestätigt werde, lerne ich nichts dazu.
00:33:59: Gut.
00:33:59: Und natürlich auch an dich die Frage Mattis, Berge oder mehr?
00:34:02: Bei mir sind es auf jeden Fall die Berge.
00:34:04: Also ich bin ein absoluter Bergmensch und war auch schon viel in unterschiedlichen Regionen der Welt unterwegs.
00:34:08: Okay, höchster Berg?
00:34:10: Island Peak im Himalaya.
00:34:12: Oh, das ist bestimmt hoch.
00:34:13: Ja, sechstausend.
00:34:15: Okay, alles klar.
00:34:17: Ich war stolz, ich war vor ein paar Jahren stolz, dass ich über dreitausend war.
00:34:22: Wie lange hast du gebraucht, um da hochzukommen?
00:34:23: Man muss da ja irgendwie pausen.
00:34:25: Man muss akklimatisieren erst mal.
00:34:26: Also es dauert, bei uns war es tatsächlich das Problem, dass wir erst mal nicht hinfliegen konnten.
00:34:30: Da mussten wir den Helikopter noch schadern.
00:34:31: Das ist alles länger gedauert, deswegen so anderthalb Wochen.
00:34:33: Aber normalerweise sollte man sich eigentlich noch mehr Zeit vorab nehmen, um sich zu akklimatisieren.
00:34:37: Und die Helikopter sind ja sehr günstig, habe ich gehört.
00:34:39: Ja, ja.
00:34:39: Aber muss man auf jeden Fall viel Schmielgeld bezahlen.
00:34:43: Gut, danke für diese Antwort.
00:34:45: Also eher Berge, da sind wir uns ähnlich als mehr.
00:34:49: Gut, ich beende diese Folge mit einer Weisheit.
00:34:51: Zwischen den Bergen und dem Meer liegt oft nur eine Entscheidung und der Mut, sich zu bewegen.
00:34:58: Oder, wie ich auch gerne sage, wenn ich diesen See sehe, brauche ich kein Meer mehr.
00:35:04: Aber hast du den aufgeschrieben, Herr Garnet?
00:35:05: Entschuldigung,
00:35:08: ich mach weiter.
00:35:12: Vielen Dank fürs Zuhören.
00:35:13: S-M-A-R-T.
00:35:14: Smart.
00:35:15: wird immer smarter.
00:35:16: Wir hören uns im nächsten Monat wieder mit R, R wie Resilienz in der Digitalisierung und der Rehabilitation.
00:35:23: Ich freue mich drauf.
Neuer Kommentar