SLMs statt LLMs: Wie KI in vertikalen Märkten wirklich wirksam wird
David Worlock über die Potenziale von Small Language Models
Foto: KI-generiert, Freepik
Was Special-Interest-Verlage aus dem Erfolg der SLMs für Wissensprodukte, Metadaten und neue Vermittlerrollen lernen können
Generative KI ist allgegenwärtig – doch in vielen Branchen bleibt der große Umbruch erstaunlich lange aus. Statt spektakulärer „Gamechanger“ sehen wir häufig nur Gewinne in den Prozessen. Der eigentliche Hebel aber entsteht dort, wo Wissen eng umrissen ist, Daten sauber kuratiert sind und Aufgaben klar definiert werden können: in vertikalen Märkten. Genau hier gewinnen Small Language Models (SLMs) an Boden. Sie laufen kostengünstiger, reagieren schneller und lassen sich präziser auf Domänen trainieren – oft kombiniert mit RAG und Agenten, die Recherche, Entwurf und Workflows automatisieren. Der Blick auf Gesundheitswesen und Recht zeigt, wie schnell solche Systeme in den Arbeitsalltag kommen können.
Für Special-Interest-Verlage und wissensgetriebene Plattformen steckt darin eine Einladung: Daten strukturieren, Ontologien schärfen, Metadaten aufwerten – und neue Vermittlerrollen zwischen Inhalt, Technologie und Anwendung besetzen.
Man könnte argumentieren, dass wir die letzten drei Jahre in einem seltsamen Zustand der massenhaften Verleugnung verbracht haben. Während die Leistungsfähigkeit generativer KI und die enorme Datenabdeckung der über Nacht berühmt gewordenen LLM-Umgebungen uns davon abgehalten haben, die Leistungsfähigkeit von KI in bestimmten Umgebungen infrage zu stellen, sind viele Beobachter überrascht, wie lange es gedauert hat, bis KI-Lösungen in vertikalen Märkten und professionellen Bereichen Fuß fassen konnten. Und wo es Gewinne gab, handelte es sich um Gewinne in Bezug auf Prozesse und Produktivität und nicht um Lösungen, die das Spiel komplett verändern.
Vom LLM-Hype zu den SLM-Hebeln: Wann kommt der vertikale Durchbruch?
Jeden Tag kommen neue Nachrichten von der KI-Front. Durchbrüche in der Medizin oder Teilchenphysik, die das Gesundheitswesen in den nächsten 5 bis 10 Jahren verändern werden. In der Welt der Daten und Inhalte haben einige große Content-Anbieter Allianzen mit KI-Entwicklern – in der Regel OpenAI oder Microsoft – geschlossen, um zu versuchen, effektive Lösungen rund um „offene“ oder halboffene LLMs zu entwickeln. Einige davon waren sehr erfolgreich, aber andere wurden wohl kaum über den Bereich der Suchmaschinen hinaus getestet. Einige von uns fragen sich daher, wann wir die tatsächlichen Auswirkungen der KI in vertikalen Märkten mit vielen Spezialdaten sehen werden. Diejenigen, die diese Frage beantworten, scheinen oft auf eine andere, kleinere Art von KI-Modellierungsumgebung zurückzugreifen. Definitionen sind wichtig. Hier ist die beste, die ich finden konnte: „Ein SLM ist ein kleines Sprachmodell: ein neuronales Sprachmodell mit weit weniger Parametern und Ressourcen als ein typisches LLM, das auf Effizienz und oft auf bestimmte Domänen oder Aufgaben optimiert ist.“
Die ersten SLM-Hotspots: Gesundheitswesen und Kundenservice
Wer macht das, wo findet es statt und funktioniert es? Die beiden Hotspots scheinen im Gesundheitswesen und im Kundenservice zu liegen, und man kann verstehen, warum dies der Fall sein könnte. Ein häufig zitiertes Beispiel ist clinicalBERT, eine SLM-Version des grundlegenden LLM von Google. Krankenhäuser neigen dazu, es für bestimmte Zwecke zu verwenden: Diagnostik in eng definierten Bereichen, Patientenmanagement, Prognosen. Die wichtigsten Vorteile sind, dass es sich im Vergleich zur LLM-Entwicklung um kostengünstige Installationen handelt, dass das Krankenhaus, das das System erstellt, über alle dafür erforderlichen Daten verfügt und dass dies die Genauigkeit und auch die Latenz (die Geschwindigkeit, mit der Antworten zurückkommen, die in den meisten Fällen sofort erfolgen muss) verbessert. Dies erklärt auch, warum SLMs so häufig im Kundenservice und in Kundenfeedback- und Empfehlungsmaschinen im Einzelhandel anzutreffen sind.
Recht als SLM-Treiber: Präzedenzdaten, Entwürfe, Dokumentenflüsse
Ein weiterer Bereich, in dem die SLM-Entwicklung eine wichtige Rolle spielt, ist das Rechtswesen und Anwaltskanzleien. Dies ist im Zusammenhang mit dem Verlagswesen besonders interessant. Die weltweit größten Rechtsdatenbanken – Thomson Reuters, Lexis, vLex/Clio – wurden alle von Grund auf neu aufgebaut oder sind Partnerschaften mit großen LLMs eingegangen. Aber auch Anwaltskanzleien, insbesondere natürlich die größeren, haben eine wichtige Rolle bei der Entwicklung von SLMs gespielt. Diese konzentrieren sich auf die Nutzung der eigenen Präzedenzfallbibliotheken der Kanzlei, um Entwurfs- und Dokumentenverwaltungssysteme zu schaffen, die echte Produktivitätsvorteile bieten. Und genau hier gibt es erhebliche Fortschritte beim Übergang zur nächsten Stufe: diese Installationen zu Kernelementen des Arbeitsablaufs der Kanzlei zu machen.
So arbeitet Legal mit SLMs: dokumentenintensive Routinen
Das führende US-amerikanische Anwaltsmagazin Attorneys beschreibt das Nutzungsmuster wie folgt: „SLM-basierte Systeme in Anwaltskanzleien werden am häufigsten für dokumentenintensive, wiederkehrende Aufgaben eingesetzt: Unterstützung bei der Vertragsprüfung und -erstellung, Recherche und Zusammenfassung, E-Discovery und Compliance-/Änderungsüberwachung, wobei sie zunehmend auch in der Workflow-Automatisierung und im Fallmanagement eingesetzt werden.
Gemeinsame Grundlage: Aktualisierbare Fachdaten, RAG und Agenten
Die Anforderungen, die diesen rasanten Entwicklungen sowohl im Rechtswesen als auch im Gesundheitswesen zugrunde liegen, sind sehr ähnlich. Beide Bereiche benötigten die Möglichkeit, Fachdaten bei Bedarf zu aktualisieren und abzurufen. Die Schnittstelle, die dies ermöglicht, ist als RAG (Retrieval Augmented Generation) bekannt. Darüber hinaus machte die Möglichkeit, Agenten für die Ausführung definierter Aufgaben einzusetzen, die SLM-Umgebung wesentlich praktischer und dynamischer.
Warum gerade diese Sektoren zuerst profitieren
Obwohl weiterhin über eine rasante Entwicklung von SLM-basierten Diensten im Finanzwesen, im Bankwesen und im Einzelhandel berichtet wird, bleiben diese beiden ursprünglichen Bereiche am prominentesten. Dies liegt wahrscheinlich an den definierten Taxonomien, die in diesen beiden Bereichen verwendet werden, sowie an den definierten Aufgabenlisten und den klaren Produktivitätssteigerungen, die sofort erzielt werden konnten.
Neue Vermittlerrollen: Vom Verlag zum Wissensengineering
Einige Kommentatoren sehen in diesen Entwicklungen das Ende des Verlagswesens als Vermittler zwischen Content-Erstellern und Content-Nutzern. Andere erkennen, dass neue Vermittlerrollen entstehen, wenn diese Technologien in vertikalen Marktsektoren mit spezialisierten Daten alltäglich werden. Die Aufwertung dieser Daten durch Struktur und ontologische Beziehungen – und noch effektivere Metadaten – ist nach wie vor eine Aufgabe, die erfüllt werden muss, und ein Preis, den der Markt zahlen wird, wenn er dadurch schneller an verwertbare Daten gelangt. Gleichzeitig könnte das Potenzial für eine Zusammenarbeit zwischen datenreichen Informationsdienstleistern und Technologieunternehmen zur Schaffung einer verkleinerten maschinellen Intelligenz in Nischen- und vertikalen Sektoren, die sich immer weiter verengen werden, wirklich interessante Möglichkeiten eröffnen. Und auf der langen Reise vom Drucker über den Verlag zum Informations- und Datenanbieter entsteht nun eine weitere Etappe: die Übertragung von Daten in Wissensengineering und Informationsarchitektur.

David Worlock ist als Senior Advisor bei Outsell Inc. tätig und unterstützt Führungskräfte der internationalen Medien-, Verlags- und Informationsbranche bei Strategiefragen. Zuvor gründete er 1985 das Beratungsunternehmen Electronic Publishing Services Ltd. (EPS), das 2006 von Outsell übernommen wurde. Bereits 1980 übernahm er die Leitung von EUROLEX, einem der ersten Online-Rechtsdienste in Großbritannien. Seine berufliche Laufbahn begann Worlock 1967 bei Thomson Reuters, wo er später als Group Executive Publisher im Schulbuchbereich Verantwortung trug. Mit jahrzehntelanger Erfahrung gilt er als Kenner der digitalen Transformation von Verlags- und Informationsmärkten.
