OpenAI veröffentlicht die Vollversion der Text-KI “GPT-2”, die vor neun Monaten noch “zu gefährlich” für eine Veröffentlichung war. Wie kommt es dazu?

Als das KI-Unternehmen OpenAI im Februar die Text-KI GPT-2 veröffentlichte, tat es das mit einem öffentlichkeitswirksamen Begleittext: Die Text-KI sei “zu gefährlich”, um sie in der Vollversion zu veröffentlichen, da böse Geister das Internet mit glaubhaften Fake-Texten überfluten könnten. Stattdessen stellte OpenAI GPT-2 in einer abgespeckten Version zur Verfügung, die nur einen Bruchteil der maximal möglichen Leistung bot.

Wir spulen neun Monate vor: OpenAI veröffentlicht die Vollversion von GPT-2 mit 1.558 Millionen Parametern. Als Vergleichswert: Die erste Version bot 124 Millionen und die letzte aktuelle Version 774 Millionen Parameter. Umso mehr Parameter, desto glaubwürdiger werden die generierten Texte, wobei die Qualitätsunterschiede nach oben hin geringer ausfallen.

Weshalb jetzt der Kurswechsel bei OpenAIs Veröffentlichungsstrategie? Zum einen, schreibt OpenAI, habe es bislang keine Anzeichen für einen Missbrauch der schwächeren Vorgängerversion gegeben. Die Vollversion von GPT-2 erstellt laut einer Partnerstudie der Cornell Universität nur geringfügig glaubhaftere Fake-Texte mit einem “Glaubwürdigkeitswert” von 6,92 statt 6,72 von zehn Punkten.

Zum anderen wurde GPT-2 zwischenzeitlich von Studierenden nachgebaut und durch noch umfangreichere Modelle übertroffen. “Wir sind uns bewusst, dass wir nicht alle Bedrohungen kennen und dass motivierte Akteure Sprachmodelle ohne Modellfreigabe replizieren können”, schreibt OpenAI.

Das gestaffelte Vorgehen bei der Veröffentlichung von GPT-2 über neun Monate hinweg habe jedoch wertvolle Einblicke in die Herausforderungen und Chancen von “verantwortungsvollen Veröffentlichungsnormen bei Künstlicher Intelligenz” geschaffen.

GPT-2 1.558: Text-KI im Browser testen

Die Webseite “Talk to Transformer” hat die GPT-2-Vollversion in eine einfache Weboberfläche eingebettet: Die KI benötigt zwei bis drei einleitende Sätze und erweitert diese dann mit einem kurzen Text. GPT-2 reagiert auf den Stil der Eingabe und unterscheidet beispielsweise zwischen dem Anfang einer News, eines Gedichts oder eines Romans.

Input:

On Stage at the Oculus Connect 6, Facebook-CEO Mark Zuckerberg announced its company’s first AR-Goggle. The shift to AR, Zuckerberg explained, is part of his bigger plan to establish a new computing paradigm for everyone.

Outpout:

“If you’re going to build a computer, the first thing you should do is make it a computer for people,” Zuckerberg said in his keynote. “It’s what people have always wanted.”

According to Oculus, its AR-Goggles will be available for purchase in early 2016.

[…]

Zuckerberg described AR as the “next computing platform” to follow on from the iPhone, which he believes is the most pervasive computing device ever made. That paradigm shift, Zuckerberg told us, is one that he and his team at Facebook are working on. “When we think about the Internet in 20 years, it will be like looking at the internet today. This is the same type of computing,” he said.

Zuckerberg also shared that the company’s AR goggles are a part of Facebook’s efforts to develop a new type of virtual reality. He called it an “experimental” form of virtual reality and not something that Facebook currently markets. He didn’t specify the form the new form of VR would take, but he did hint at what he thought the product might look like.

“I see a future in virtual reality where you have people sitting around a virtual campfire… and having this experience.”

GPT-2 1.558

Einige Tests zeigen: Auch die Vollversion von GPT-2 löst das grundlegende Problem KI-generierter Texte nicht. Sie können zwar mitunter in sich glaubwürdige Sätze oder ganze Abschnitte enthalten. Jedoch fehlt der Blick fürs große Ganze und Zusammenhänge innerhalb eines Themas. Ein Verständnis für den Inhalt ist ohnehin nicht gegeben: GPT-2 rechnet Buchstaben aus und reiht sie aneinander.

Dennoch sieht OpenAI eine Missbrauchsgefahr durch politische Extremisten, die GPT-2 für ihre Inhalte feinjustieren. Das Partnerinstitut “Middlebury Institute of International Studies’ Center on Terrorism, Extremism, and Counterterrorism (CTEC)” habe in einem Test nachgewiesen, dass GPT-2 “künstliche Propaganda” generieren könne.

Die Erkennung von KI-generierten Fake-Texte sei “eine Herausforderung”: Ein von OpenAI entwickeltes Erkennungsmodell erziele Erkennungsraten von circa 95 Prozent für GPT-2 Fake-Texte, was nicht ausreichend sei. Das Erkennungsmodell müsse daher mit Metadaten-Methoden, durch menschliches Urteil und Aufklärungsmaßnahmen ergänzt werden.

Input:

After trying Oculus Quest for the first time, President Donald Trump told the audience that he’s not a fan of VR. Young people might get corrupted by the technology, Trump thinks.

Outpout:

“You know,” Trump told the crowd, “I’m not a believer in it.”

At this point in the Q&A, I had my doubts.

I was about to have a conversation with a President who has said a bunch of really ridiculous things over the course of his campaign. I didn’t know if he’d make that point again, but it felt a little like it was a foregone conclusion.

That moment, where I started questioning whether President Trump was the person I’d thought I knew was what was the biggest shock of my trip to Los Angeles. When I’d walked through the airport a day earlier, I’d said I was looking forward to my first day as a reporter. As soon as I saw his name on the big screen, my stomach dropped. There’s a difference between being a journalist and being a politician, I told myself.

GPT-2 1.558


MIXEDCAST #167: Varjo VR-2 Ersteindruck, Hololens 2teindruck und AR-Brillen-Schwemme | Alle Folgen


Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.