Weshalb eine Künstliche Intelligenz in die Schule muss

Die großen Fortschritte der KI-Entwicklung entstehen durch mehr Daten, größere Netzwerke, mehr Rechenleistung. Könnten sie in Zukunft auch außerhalb der Cloud laufen?

Der Trend bei Sprach-KIs geht zu immer größeren Modellen, die immer mehr Daten schlucken. Zu diesen Riesen gehören Googles Sprach-KI BERT, OpenAIs GPT-2, Facebooks RoBERTa und Nvidias Megatron. Letztere ist die aktuellste Sprach-KI, 24-mal größer als BERT-large und fünfmal größer als GPT-2.

Doch die riesigen KI-Modelle benötigen viel Rechenleistung: Nvidia empfiehlt für das Training von Megatron 512 Grafikchips. Und wer OpenAIs GPT-2 nachtrainieren will, bringt mit der neuesten Version selbst schnelle Server-Grafikkarten an ihr Limit.

Da die Sprachmodelle viel Rechenleistung und Energie benötigen, laufen sie nur in der Cloud. Kleinere Modelle können zwar lokal ohne Internetverbindung auf dem Smartphone oder auf einem Roboter ausgeführt werden - aber sie leisten dafür deutlich weniger.

Es braucht also kleinere KI-Modelle, die dennoch an die Leistungsfähigkeit ihrer riesigen Verwandten herankommen. Doch wie soll das gehen?

Back to School (of AI)

Die Lösung könnte eine Art KI-Schule sein, in der die kleinen KIs von den großen lernen.

KI-Forscher nennen diesen Prozess Destillation: Ein großes KI-Modell agiert als Lehrer, ein kleines als Schüler. Beim Training gibt die große KI ihr Wissen weiter: bei einer Sprach-KI etwa die 20 wahrscheinlichsten Worte, die einen unvollständigen Satz vollenden.

Das kleine KI-Modell lernt so, die Ergebnisse des großen KI-Modells zu reproduzieren – ohne dessen Umfang anzunehmen.

Forscher haben diese Methode nun auf die Sprach-KI BERT angewandt. Das Ergebnis: BERTs Schüler DistilBERT ist 60 Prozent kleiner, schneller und erreicht 95 Prozent von BERTs Leistung. In Zukunft soll DistilBERT noch mit weiteren Kleinmachmethoden, wie der Entfernung einiger Netzwerkverbindungen, geschrumpft werden.

Empfehlung

KI in der Praxis

OpenAI nennt GPT-4 Turbo das "smarteste" Modell, aber das bedeutet nicht viel

Auf ähnliche Art hat Google den eigenen Next-Gen-Assistant verkleinert, der Ende des Jahres ohne Internetverbindung lokal auf Pixel-Smartphones laufen soll. Das knapp 100 Gigabyte große Sprachmodell wurde dafür auf knapp 0,5 Gigabyte reduziert.

Quelle: Medium

Weshalb eine Künstliche Intelligenz in die Schule muss

Back to School (of AI)

OpenAI nennt GPT-4 Turbo das "smarteste" Modell, aber das bedeutet nicht viel

Weiterlesen über Künstliche Intelligenz:

OpenAI: Mehr als 300 GPT-3 Apps am Start

Zehn nützliche Fähigkeiten, die Künstliche Intelligenz jetzt schon hat

GPT-3: OpenAI gibt Preise und Zugänge bekannt

Prompts mit vielen Beispielen verbessern die Leistung großer Sprachmodelle

US Air Force testet erfolgreich KI-gesteuertes Kampfflugzeug im simulierten Luftkampf

KI-Forscher warnt: Durch Sprachmodelle droht ein "Wissenskollaps"

Weshalb eine Künstliche Intelligenz in die Schule muss

Back to School (of AI)

Weiterlesen über Künstliche Intelligenz:

Artikel teilen

Bankverbindung