Microsoft kündigt neue Funktionen für seinen Cloud-Dienst Project Oxford an. Mit dabei ist eine API, die auf Fotos Emotionen erkennen soll.
Microsofts Cloud-Dienst Project Oxford bekommt neue Funktionen: verbesserte Spracherkennung (auch in lauten Umgebungen), Videostabilisierung, eine ständig lernende Rechtschreibprüfung und Emotionserkennung. Das teilte das Unternehmen auf der Konferenz "Future Decoded" mit, wie Business Insider berichtet.
Die neuen Dienste sollen im Dezember in den Client-Bibliotheken Einzug finden. Interessierte können Rechtschreibprüfung und Emotionserkennung bereits jetzt auf der Homepage des Projekts ausprobieren. Zorn, Verachtung, Ekel, Furcht und Freude
Für die Identifizierung von Emotionen sendet ein Programm ein Bild an die Face-API. Diese erkennt die Gesichter darauf und liefert eine Analyse, welche Emotionen es jeweils erkannt hat. Die Demoversion auf der Website erkennt acht Stimmungen: Neutral, Zorn, Verachtung, Ekel, Furcht, Freude, Traurigkeit und Überraschung.
Die neue Rechtschreibprüfung versteht Wörter in ihrem Kontext und kann zentral im Wortschatz erweitert werden – etwa durch technische Entwicklungen oder Trends. Bisher gibt es jedoch noch keine Informationen, welche Sprachen sie neben Englisch versteht. Im Dezember sollen die neuen Funktionen in den Client-Bibliotheken Einzug finden.
Microsoft hat Project Oxford im Frühjahr gestartet. Bisher konnten Entwickler Beta-Versionen der Face-API zur Gesichtserkennung, von Computer Vision zur Analyse von Bildern sowie der Speech-API als Schnittstelle zwischen gesprochenen und geschriebenen Texten verwenden. Ende Oktober war das Angebot mit LUIS um ein Modul zum Verständnis natürlicher Sprache erweitert worden.