KI-Start-up Cohere will Sprach-KI zum Massenmarkt machen

KI-Start-up Cohere will Sprach-KI zum Massenmarkt machen

Das US-Start-up Cohere wimdet sich der Entwicklung fortschrittlicher Sprach-KI und geht in den Wettbewerb mit etablierten großen Playern wie OpenAI. Es startet mit reichlich Rückenwind.

Circa 2017 gab es bei Sprach-KI einen großen Sprung nach vorne: Forscher:innen bei Google entwickelten eine neue Form neuronaler Netze, sogenannte Transformer (Erklärung). Im Unterschied zu den vorher eingesetzten LSTM-Netzen („Long short-term memory“) können sie tausende statt bis zu hundert zusätzliche Wörter an Kontext erfassen. Außerdem skalieren Transformer mit Rechenleistung.

Ehemalige von Google Brain gründen Sprach-KI Start-up

Entwickelt wurden Transformer wesentlich bei Google Brain in Toronto unter der Leitung des Turing-Preisträgers und „KI-Papstes“ Geoffrey Hinton. Damals im Team und direkt an der Transformer-Entwicklung beteiligt: Aidan Gomez und Nick Frosst. Gomez war als studentischer Praktikant bei Brain in Toronto und London unterwegs, der erfahrenere Frosst war der erste Angestellte in Hintons Google Brain KI-Labor in Toronto.

Gemeinsam mit dem dritten Mitgründer Ivan Zhang starteten sie 2019 Cohere, das Sprach-KI auf das nächste Level bringen soll. Dabei haben sie die Unterstützung von Hinton, der KI-Wissenschaftlerin Fei-Fei Li (Ex-Google, jetzt Stanford & Bayer) und weiteren Investoren. In der ersten Finanzierungsrunde erhält Cohere 40 Millionen US-Dollar.

Mit dem Geld soll weiteres Personal eingestellt und die bestehende Sprach-KI-Plattform auf weitere Sektoren wie die Finanz- und Gesundheitsbranche ausgeweitet werden. Die Stoßrichtung bei der Entwicklung der Sprach-KI bringt die Firma bei Twitter auf den Punkt.

„Sehr große Sprachmodelle ermöglichen Computern jetzt ein viel besseres Verständnis der menschlichen Kommunikation“, sagt Hinton. „Das Team von Cohere entwickelt eine Technologie, die diese Revolution im Verstehen natürlicher Sprache viel breiter verfügbar machen wird.“

Cohere will GPT-3 in besser und mit Zugang für alle entwickeln

Bei Cohere arbeiten die drei Gründer Gomez, Frosst und Zhang gemeinsam mit rund 40 Kolleg:innen an „sehr großen neuronalen Netzen“ mit Fokus auf Produkten für alle. Der Zugang erfolgt mittels einer API, Interessierte können sich auf eine Warteliste setzen lassen.

Die mächtige Sprach-KI GPT-3 von OpenAI etwa ist am Markt zwar ebenfalls über eine API verfügbar, aber OpenAI wählt seine Kunden sorgsam aus. Microsoft als OpenAIs Exklusivkunde hat direkten Zugang zum neuronalen Netz.

„Niemand hat Zugang zu diesen hochwertigen natürlichen Sprachmodellen. Diejenigen, die Zugang zu einem Supercomputer im Wert von einer Viertelmilliarde Dollar haben, also all die großen FAANG-Unternehmen (Facebook, Amazon, Apple, Netflix und Google), können das“, sagt Gomez. „Wir wollen die Kosten für diesen Supercomputer übernehmen und all diesen Unternehmen Zugang gewähren, die sonst keine Produkte oder Funktionen auf der Grundlage dieser Technologie entwickeln könnten.“

Im Vergleich zu GPT-3 verspricht Cohere umfangreiche Optionen wie die Klassifizierung von Stimmungen und Textarten. Grundlage dafür sei ein umfassenderes Verständnis der menschlichen Sprache, einschließlich Semantik, Gefühlen und Tonfall. Als Einsatzszenarien nennt das Start-Up Unterstützung von Autor:innen, die Automatisierung von Chatbots oder die Moderation auf Webseiten.

Ethischen Fragen etwa zu im Sprachmodell enthaltenen menschlichen Vorurteilen will das Start-up mit Qualitätskontrollen vor Veröffentlichung eines Modells und anschließendem Monitoring begegnen. Begleitende „Data Statements“, die KI-Trainingsdaten, Limitierungen und Risiken beschreiben, sollen für zusätzliche Transparenz sorgen.

Weiterlesen über Künstliche Intelligenz:

Quelle: Fast Company, The Globe and Mail, Cohere