Große Sprachmodelle haben einem großen Publikum die Möglichkeiten der Künstlichen Intelligenz (KI) vor Augen geführt. Mit wenigen Stichworten generieren KIs realistische Bilder von beliebigen Orten. Allerdings stoßen sie nach Ansicht von Niantic bei der realistischen Einschätzung der räumlichen Dimensionen von Objekten oder dem Ausfüllen von Lücken an Grenzen. Ihnen fehlt das sogenannte räumliche Vorstellungsvermögen, das menschlichen Betrachtern eigen ist.
Die Lösung dafür sieht der Softwareentwickler in einem spezialisierten KI-Modell. Die nötige Datenbasis für das geplante Large Geospatial Modell (LGM) liefern dabei Spieler von Pokémon Go und Nutzer der Scaniverse-App.
So verwendet Niantic die Bilddaten seiner Apps
Als Grundlage hierfür dient ein bereits während der vergangenen fünf Jahre für den Aufbau seines Visual Positioning System (VPS). Diesem genügt ein einfaches Foto, um Position und Ausrichtung auf einer dreidimensionalen Karte zu bestimmen.
Als Grundlage für die Karte dienen dabei die mit den Apps des Softwareentwicklers gewonnenen Scans der Orte. Nach Angaben von Niantic sind in VPS bereits zehn Millionen dieser Orte weltweit inkludiert, von denen eine Million über einen Service genutzt werden können. Zudem soll der Datenbestand schnell wachsen. Pro Woche kommen demnach eine Million neue Orte hinzu.
Allerdings waren die Nutzer bisher nicht von allen Tricks begeistert, die Niantic ersonnen hat, um an möglichst gute Scans zu kommen. So wurden in Pokémon Go sogenannte Pokéstops eingerichtet. Wurden diese gescannt, erhielt der Spieler eine kleine Belohnung. Allerdings wurden die Aufgaben oftmals als nervig wahrgenommen und mit qualitativ schlechten Scans quittiert.
Ausgangspunkt für räumliche Intelligenz
Mit den Scans sind zudem für die Nutzung in neuronalen Netzen optimierte Informationen verbunden, sodass gleichzeitig ein neuronales Netzwerk im VPS entsteht. 50 Millionen davon will Niantic bisher bereits trainiert haben, wobei mehrere Netze zu einem Ort gehören können. Mit jedem neuen Training können sie mit den jeweils neuesten Scan-Daten aktualisiert werden. Im nun anstehenden Schritt sollen diese in einem Large Geospatial Modell (LGM) verknüpft werden, um eine Art räumliche Intelligenz für geografische Standorte bereitzustellen, die über die lokale Grenze hinausreicht und global zur Verfügung steht. Dabei sollen auch Orte zur Verfügung stehen, die noch nicht vollständig gescannt wurden.
Mit seinem LGM erhofft sich Niantic neue Wege der Interaktion im physischen Raum eröffnen zu können. Einsatzmöglichkeiten werden im Bereich der Navigation und in Verbindung mit Wearables. Selbst einfache Gadgets könnten zu einem Ort nutzerspezifische Empfehlungen ausspielen.