Beitrag drucken

Neues Whitepaper der Plattform Lernende Systeme

Wo bleiben die europäischen KI-Sprachmodelle?

Expertinnen und Experten der Plattform Lernende Systeme beleuchten in einem neuen Whitepaper, wie es um die Entwicklung europäischer bzw. deutscher KI-Sprachmodelle bestellt ist.


Große Sprachmodelle wie ChatGPT oder PaLM 2 versprechen mächtige KI-Lösungen für Wirtschaft und Gesellschaft. Ihre Ergebnisse sind jedoch nicht immer nachvollziehbar, oft fehlerhaft oder mit Vorurteilen behaftet. Expertinnen und Experten der Plattform Lernende Systeme sehen die Forschung in Deutschland in einer guten Ausgangsposition, um die technischen Herausforderungen der KI-Technologie anzugehen, sie im Sinne europäischer Werte zu entwickeln und so ihre Potenziale für Deutschland und Europa auszuschöpfen. Voraussetzung dafür sei ein europäisches Ökosystem für die Entwicklung großer Sprachmodelle sowie eine anwendungsnahe Forschung, die den Transfer in die industrielle Praxis erleichtere, so die Experten der Plattform. In einem aktuellem Whitepaper benennen sie die dringlichsten Forschungsbedarfe und Handlungsoptionen.

Obwohl deutsche Forscherinnen und Forscher an vielen Stellen an der Entwicklung großer Sprachmodelle beteiligt sind, dürfe die Forschung und Entwicklung in Deutschland in diesem dynamischen Forschungsfeld, das stark durch außereuropäische Akteure und große Technologieunternehmen geprägt wird, nicht den Anschluss verlieren, heißt es in dem Whitepaper.

„Wenn wir Sprachmodelle für Anwendungen in und aus Europa nutzen wollen, brauchen wir europäische Sprachmodelle, die die hiesigen Sprachen beherrschen, die Bedürfnisse unserer Unternehmen und ethischen Anforderungen unserer Gesellschaft berücksichtigen. Aktuell werden die Sprachmodelle aber von amerikanischen und chinesischen Tech-Riesen erstellt – und kontrolliert“, so Volker Tresp, Professor für Maschinelles Lernen an der Ludwig-Maximilians-Universität München und Leiter der Arbeitsgruppe Technologische Wegbereiter und Data Science der Plattform Lernende Systeme.

Wie steht es um deutsche Sprachmodelle?

Aktuell gibt es nur wenige einsprachige, sogenannte monolinguale Modelle, die auf ausschließlich deutschen Textdaten beruhen. Auch Modelle, die domänen-spezifische Sprache sensibler Anwendungsbereiche wie Medizin und Justiz berücksichtigen, sind nicht verbreitet. Viele bedeutende, mehrsprachige Modelle wie GPT-4 sind hingegen für die öffentliche Forschung meist nicht offen zugänglich.

„Sprachmodelle verfügen über ein enormes wirtschaftliches Potenzial. Für einen Großteil der deutschen Unternehmen ist es aber nicht rentabel, Sprachmodelle für den Einsatz im eigenen Betrieb aufzubauen. Leider existiert derzeit jedoch kein ausreichend leistungsfähiges und kommerziell nutzbares Modell für die deutsche Sprache. Wir benötigen daher offen zugängliche Modelle – insbesondere auch für die deutsche Sprache – sowie Methoden, mit denen sich diese kostengünstig an die spezifischen Anforderungen verschiedener Industriezweige anpassen lassen“, sagt Alexander Löser, Gründer und Sprecher des Forschungszentrums Data Science an der Berliner Hochschule für Technik und Mitglied der Arbeitsgruppe Technologische Wegbereiter und Data Science.


Das könnte Sie auch interessieren:

Im Centre for European Research in Trusted AI (Certain) wollen die Beteiligten Technologien entwickeln, bei denen vertrauenswürdige künstliche Intelligenz einen Schwerpunkt bildet. Der Projekt-Kick-off fand nun in Saarbrücken statt.‣ weiterlesen

Patentanmeldungen im Bereich der additiven Fertigung (3D-Druck) sind zwischen 2013 und 2020 mit einer durchschnittlichen jährlichen Rate von 26,3 Prozent gestiegen. Wie das Europäische Patentamt weiter berichtet, wurden seit 2001 weltweit mehr als 50.000 bedeutende Erfindungen im Zusammenhang mit 3D-Druck-Technologien als internationale Patentfamilien (IPF) veröffentlicht.‣ weiterlesen

570 Aussteller präsentieren vom 3. bis zum 5. Oktober im dänischen Herning Innovationen für die europäische Industrie. Rund 100 Aussteller kommen aus Deutschland.‣ weiterlesen

Nach Proelia, IambOO und Giuneco hat der Softwareanbieter Remira mit Optisoft und Gea Soft zwei weitere Unternehmen in Italien übernommen.‣ weiterlesen

Zsuzsanna Friedl wird HR-Chefin bei T-Systems und löst zum 1. Januar Georg Pepping ab, der das Unternehmen verlässt.‣ weiterlesen

Der Robotikspezialist Exotec hat Christian Eberle zum Maintenance Director für Zentraleuropa ernannt. Der studierte Maschinenbauer war zuletzt für Amazon tätig.‣ weiterlesen

Check Point Software Technologies hat in der ersten Hälfte des Jahres 2023 einen massiven Anstieg von DDoS-Angriffen (Distributed Denial of Service) beobachtet. Die Attacken haben dabei ein neues Niveau an Raffinesse, Häufigkeit und Umfang erreicht, mit dem sich Unternehmen nun auseinandersetzen müssen.‣ weiterlesen

Mit dem richtigen Verhalten verhindern Mitarbeitende Cyberattacken – soweit die Theorie. Die Praxis sieht aber anders aus, wie die aktuelle Arbeitnehmerumfrage 'Cybersicherheit in Zahlen' von G Data CyberDefense, Brand Eins und Statista belegt.‣ weiterlesen

Wie können Sie Ihre Mitarbeiter durch KI, mobile Geräte und Roboter in der Instandhaltung und im technischen Service unterstützen? Welchen Mehrwert hat der Einsatz neuer Technologien für die Steuerung knapper Ressourcen und die Interpretation von real-time Daten für die vorausschauende Wartung? Antworten gibt das Anwenderforum 'Einsatz mobiler Lösungen und Technologien' am 18. und 19. Oktober in Hannover.‣ weiterlesen

Nach Schätzungen des Ifo Instituts ging die Zahl der Kurzarbeitenden im August zurück – auch in der Industrie. Jedoch verzeichneten nicht alle Industriebranchen Rückgänge.‣ weiterlesen