Psssst ... Das Smart Home hört mit

  Unterhaltungselektronik und Haustechnik, die aufs Wort hört - das klang bis vor Kurzem noch nach Science Fiction, ist jedoch längst Realität und entwickelt sich gerade zu einem echten Boom-Markt. Und in der Tat ist die Idee ja auch durchaus oool. Statt mit einem Haufen Fernbedienungen zu hantieren oder unter einem halben Dutzend Apps die jeweils richtige zu finden, steuert man seine gesamte Haustechnik einfach mit ganz normalen Sprachanweisungen. Ob es darum geht, das Licht zu dimmen, die Heizung zu regeln oder schlicht ein bestimmtes Lied über die Anlage abzuspielen - solange die Spracherkennung die Anweisung versteht und eine Anbindung an die jeweilige Technik besteht, ist das alles kein Problem. Außerdem können sich so auch sehr einfach Informationen aus dem Internet abrufen und vorlesen lassen, etwa den Wetterbericht für morgen oder die Verkehrssituation auf dem Heimweg.  

Das Rennen ist eröffnet

Amazons Echo ist derzeit der Platzhirsch unter den smarten Heimprodukten - und verkauft sich offensichtlich hervorragend Bereits seit dem letzten Jahr vermarket Amazon seine "Alexa" genannte Sprachsteuerungs-Technologie im Smarthome-Lautsprecher Echo und der kleineren Version Echo Dot. Und das scheinbar so erfolgreich, dass man sich in Deutschland erst einmal auf eine Warteliste setzen lassen muss, damit man eine Einladung(!) zur Bestellung erhält - irgendwann. Der PC-Riese Lenovo (früher unter dem Kürzel IBM bekannt) hat gerade auf der CES eigene Produkte angekündigt, die ebenfalls Alexa nutzen werden. Und es hat sehr nachvollziehbare Gründe, warum gerade Amazon so intensiv in diesen Markt drängt. Kein anderer Anbieter kann die Bereiche Suche, Service und Verkaufen so eng miteinander verzahnen, wie das mächtige Online-Kaufhaus, dass sich somit anschickt, der größte Konkurrent von Google zu werden.  
Lenovo vertraut ebenfalls auf die Alexa-Technologie von Amazon und hat auf der CES eigene smarte Produkte vorgestellt   Google selbst will da natürlich gegenhalten und bietet mit dem "Google Home" seit Neuestem einen sehr ähnlichen Ansatz an. Apple schien mit Home Kit eine Zeit lang die Nase vorn zu haben, doch viel mehr als eine nette Idee ist das System bisher nicht. Mindestens einen ganzen Schritt weiter denken aktuell der koreanische Elektronik-Riese LG und das deutsche-schweizerische Unternehmen digitalSTROM. Beide haben in Las Vegas sprachgesteuerte Roboter vorgestellt, die das Zeug haben sollen, uns als digitale Butler im Alltag zu unterstützen.  
Google nennt seine Alexa-Komkurrenz schlicht "Home"  

Hitech vom Feinsten

Für viele eine befremdliche Vorstellung: Dank moderner Spracherkennung sollen smarte Roboter wie der "Pepper" von digitalSTROM bald ganz alltägliche Begleiter werden (Bild: obs/digitalSTROM)   Die Technologie hinter den verschiedenen Angeboten ist in der Tat faszinierend. Nach wie vor ist das Verstehen von natürlicher Sprache eine gigantische Herausforderung für jeden Computer und wurde erst durch jüngste Entwicklungen auf dem Gebiet der Künstlichen Intelligenz (KI) in der heutigen Form möglich. Ein KI-System unterscheidet sich von einem herkömmlichen Computer vor allem dadurch, dass es selbstlernend ist. Es braucht also keine menschlichen Programmierer mehr, um neue Sprachbefehl zu implementieren. Vielmehr wird das System mit jeder Anfrage ein kleines bisschen schlauer und kann deshalb im Gegensatz zu den ungewollt komischen Anfängen der Spracherkennung zunehmend auch Dialekte, Akzente und umgangssprachliche Formulierungen verstehen.  
Spacherkennung hat schon so ihre Tücken ... nicht nur für Schotten!   Dieses selbstständige Lernen setzt eine erhebliche Rechenleistung voraus und erfordert vor allem gigantisch große Datenbanken, die mit rasanter Geschwindigkeit wachsen. Weder diese Speicherkapazität noch die nötige Rechenpower sind auf einem günstigen Gerät für den Heimgebrauch vorhanden, deshalb werden die Spracheingaben über das Internet an große Server geschickt, dort verarbeitet, interpretiert und wieder an das Gerät zu Hause zurück geschickt. Und genau darin sehen viele eine Gefahr.  

Aufmerksame Zuhörer

Denn damit sie sofort auf Sprachbefehle reagieren können, belauschen diese Geräte ständig ihre Umgebung - Amazons Echo nutzt dafür beispielsweise gleich sieben einzelne Mikrofone. Erkennen Sie ein voreingestelltes Stichwort ("Alexa", "Okay, Google", "Hey, Siri" ...) nehmen sie die folgende Sprachanweisung auf und senden sie zur Analyse an den Server im Internet. So weit, so gut und hilfreich, doch niemand weiß wirklich, was genau mit den anderen Tonaufnahmen der Umgebung passiert. Amazon gibt zum Beispiel an, dass intern im Gerät jeweils die letzten 60 Sekunden der Aufnahme gespeichert werden, danach sollen die Daten überschrieben und so dauerhaft gelöscht werden. Diese relativ lange Aufnahmedauer sei notwendig, um die tatsächlichen Sprachbefehle korrekt im Kontext interpretieren zu können. Andere Hersteller schweigen sich zu solchen Details aus, werden aber wohl mit ähnlichen Methoden und Daten arbeiten.  
Mit nicht weniger als als 7 Mikrofonen lauscht Amazons Echo ständig auf sein Stichwort.   Würde es dabei bleiben, gäbe es an Echo & Co. eigentlich wenig auszusetzen. Es mag ein wenig befremdlich erscheinen, ständig von einem Elektronikgerät belauscht zu werden. Doch wenn die Daten nur im Gerät bleiben und dort nach 60 Sekunden wieder gelöscht werden ist dieser Eingriff in die Privatsphäre kaum erwähnenswert. Jeder Facebook-Nutzer, jeder Besitzer eines Smartphones gibt freiwillig wesentlich mehr von sich selbst preis und erlaubt den Anbieter sogar explizit die Nutzung dieser personenbezogenen Daten für kommerzielle Zwecke jeder Art. Doch ein wenig Unbehagen bleibt. Zunächst einmal nagt ein gewisses Misstrauen gegenüber den Technologiekonzernen am guten Gefühl. Spracherkennung, da sind sich alle einig, wird eine DER Schlüsseltechnologien der nächsten Jahre sein und einen gigantisch großen Markt eröffnen. Und je besser die eigene Spracherkennung funktioniert, um so größere ist das Kuchenstück, dass sich der Anbieter vom zu erwartenden Umsatzkuchen abschneiden darf. Und da die Qualität der Erkennung wesentlich von den Lernfähigkeiten der KI-Server abhängt, scheint es schon durchaus verführerisch, die ständig lauschenden Geräte klammheimlich zum Aufbau der eigenen Sprachdatenbank zu nutzen und sich so einen Vorteil gegenüber der Konkurrenz zu verschaffen. Datenschutzbeauftragte, Hacker und Sicherheitsexperten auf der ganzen Welt werden zwar geradezu darauf lauern, einem Hersteller solch eine missbräuchliche Nutzung der Audiodaten nachzuweisen. Aber wie man aktuell am Beispiel Volkswagen sieht, gehen im harten Wettbewerb moralische und juristische Bedenken schon mal über Bord, wenn der Konkurrenzdruck nur groß genug ist. Es ist also zumindest nicht ausgeschlossen, dass große Anbieter wie Apple, Amazon oder Google irgendwann dieser Versuchung erliegen. Die AGBs, die man vor der Inbetriebnahme eines solchen Geräts akzeptieren muss, erlauben den Anbieter auf jeden Fall wie üblich eine enorm weitreichende Nutzung der erhobenen Daten.  
  Ebenso besteht natürlich zumindest theoretisch die Gefahr, dass sich ein Außenstehender Zugriff auf diese Daten verschafft oder direkt auf die verbauten Mikrofone verschafft. Um funktionieren zu können, benötigen Geräte mit Sprachtechnologie logischerweise zwingend einen zweigleisigen Zugang zum Internet - sie müssen Daten sowohl senden als auch empfangen können. Auch wenn die Hersteller glaubhaft versichern, diesbezüglich alle erdenklichen Sicherheitsvorkehrungen getroffen zu haben, ein solcher Schutz kann nie zu 100 Prozent sicher sein. Es ist also nicht ganz ausgeschlossen, dass der heimische Smarthome-Lautsprecher von einem Hacker zur Wanze umfunktioniert wird. Und sicherlich wird in den Geheimdiensten weltweit auch schon nach Möglichkeiten gesucht, die neuen Technologien für den großen Lauschangriff nutzbar zu machen. Sind das alles nun Gründe für übertriebene Paranoia? Schließlich sind wir heutzutage ständig von Gerätschaften wie Smartphones, Tablets oder Laptops umgeben, die sehr viel leichter zu hacken sind, und bei deren Nutzung wir ganz freiwillig eine unübersehbare Datenspur hinterlassen. Doch mit der Spracherkennung und dem dafür notwendigen Dauerbelauschung durch die smarten Geräte erhält das Ganze schon eine ganz neue Dimension. Man stelle sich vor, man unterhält sich mit seinem Partner oder seiner Partnerin über die Planung fürs Abendessen und wird plötzlich von der intelligenten Haustechnik mit dem Hinweis auf einen neuen Pizza-Lieferdienst ganz in der Nähe unterbrochen. Heute ist das eine gruselige Vorstellung, doch in zehn Jahren mag uns das ganz normal vorkommen. Denn eines haben Apple, Google, Amazon, Facebook, WhatsApp, Twitter, Instagram und viele mehr längst bewiesen: Trotz aller ursprünglicher Bedenken sind die Menschen am Ende gerne bereit, ihre persönlichen Daten preis zu geben, wenn nur der Nutzen für sie stimmt. Smarte Haustechnik mit echter, intelligenter Spracherkennung wird kommen, das ist keine Frage. Aber vielleicht ist genau jetzt der richtige Zeitpunkt sich darüber Gedanken zu machen, welche Freiheiten man den Entwicklern solcher Technologien geben will und welche lieber nicht.