Der neue Algorithmus des MIT kann menschliche Interaktionen vorhersagen, bevor sie unangenehm werden

$config[ads_kvadrat] not found

Wecke Deine geistigen Kräfte: Der Weg zu mehr Konzentration, Wahrnehmung & Bewusstsein

Wecke Deine geistigen Kräfte: Der Weg zu mehr Konzentration, Wahrnehmung & Bewusstsein
Anonim

Unsere Unfähigkeit, andere Menschen zu lesen, hat zu epischen High-5-Misserfolgen und fehlenden Küssen geführt. Menschliche Interaktionen sind selbst nach einer lebenslangen Erfahrung schwer vorherzusagen. Aber Forscher am Computer- und künstlichen Intelligenzlabor des MIT denken, dass sie helfen können: Mit einem neuen Algorithmus zum tiefgreifenden Lernen, der vorhersagen kann, wann zwei Personen umarmen, küssen, sich die Hände schütteln oder hoch fünf sind, haben sie einen großen Schritt in Richtung Zukunft gemacht gesegnet ohne diese unangenehmen Momente.

Sie hoffen auf ihren neuen Algorithmus - trainiert auf 600 Stunden YouTube-Videos und Fernsehsendungen wie Das Büro, Scrubs, Urknalltheorie, und Desperate Housewives - kann verwendet werden, um weniger sozial schwierige Roboter zu programmieren und Headsets im Stil von Google Glass zu entwickeln, um Aktionen für uns vorzuschlagen, bevor wir überhaupt die Chance haben, zu verfehlen. In der Zukunft, die sie sich vorstellen, werden Sie nie wieder eine Chance versäumen, mit Ihrem Kollegen die Spitzenklasse auszustrahlen.

Die Erkenntnis, dass Roboter auf die gleiche Weise sozial werden, wie wir sie tun, war der Schlüssel zum Erfolg des Algorithmus. "Menschen lernen automatisch, durch Erfahrungen Handlungen zu antizipieren. Deshalb haben wir uns dafür interessiert, Computer mit dem gleichen gesunden Menschenverstand durchdringen zu wollen", sagt Dr. CSAIL Ph.D. Student Carl Vondrick, der erste Autor eines einschlägigen Papiers, das diese Woche auf der Internationalen Konferenz für Computer Vision und Mustererkennung vorgestellt wurde. „Wir wollten zeigen, dass Computer allein durch das Betrachten einer großen Anzahl von Videos ausreichend Wissen erwerben können, um konsequent Vorhersagen über ihre Umgebung treffen zu können.“

Vondrick und sein Team lehrten die zahlreichen "neuronalen Netzwerke" des Algorithmus, um in diesem Fall riesige Datenmengen zu analysieren, die Stunden von Jim und Pam 's High Five, und Mike und Susans verstohlene Küsse allein. Unter Berücksichtigung von Faktoren wie ausgestreckten Armen, einer erhobenen Hand oder eines längeren Blicks ahnte jedes der neuronalen Netzwerke, was in der nächsten Sekunde passieren würde, und der allgemeine Konsens der Netzwerke wurde als abschließende "Vorhersage" in der Studie.

Der Algorithmus hat es in 43% der Fälle richtig gemacht. Dies scheint zwar nicht hoch genug zu sein, um zu garantieren, dass unsere alltäglichen Interaktionen weniger komisch sind, aber es ist eine große Verbesserung der bestehenden Algorithmen, die eine Genauigkeit von nur 36 Prozent haben.

Außerdem können Menschen Aktionen nur in 71 Prozent der Zeit vorhersagen. Wir brauchen alle Hilfe, die wir bekommen können.

Im zweiten Teil der Studie wurde der Algorithmus gelernt, um vorhersagen zu können, welches Objekt - inländische Sitcom-Heftklammern wie Fernbedienungen, Geschirr und Abfalleimer - fünf Sekunden später in der Szene erscheinen würde. Wenn zum Beispiel eine Mikrowellentür geöffnet wird, ist die Wahrscheinlichkeit hoch, dass als nächstes eine Tasse erscheint.

Ihr Algorithmus ist für Google Glass noch nicht genau genug, aber mit Antonio Torralba, Mitautor - finanziert durch einen Google-Fakultätsforschungspreis und Vondrick, der mit einem Google-Ph.D. arbeitet Gemeinschaft - wir können darauf wetten, dass es dorthin kommt. Vondrick prognostiziert, dass zukünftige Versionen des Algorithmus dazu verwendet werden können, Roboter so zu programmieren, dass sie mit Menschen interagieren, oder sogar Sicherheitskameras lehren, sich registrieren zu lassen, wenn eine Person herunterfällt oder verletzt wird.

"Ein Video ist nicht wie ein Buch" Wählen Sie Ihr eigenes Abenteuer ", in dem Sie alle möglichen Pfade sehen können", sagt Vondrick. "Die Zukunft ist von Natur aus mehrdeutig, daher ist es spannend, sich selbst herauszufordern, ein System zu entwickeln, das diese Repräsentationen verwendet, um alle Möglichkeiten vorwegzunehmen."

$config[ads_kvadrat] not found