Vertrauenswürdige KI

Unser Angebot Large Language Model as a Service (LLMaaS) ermöglicht Ihnen den Zugriff auf hochmoderne Sprachmodelle, deren Inferenz mit einer qualifizierten Infrastruktur durchgeführt wird SecNumCloud, zertifiziert HDS für das Hosting von Gesundheitsdaten und damit souverän, in Frankreich berechnet. Profitieren Sie von einer hohen Leistung und optimaler Sicherheit für Ihre KI-Anwendungen. Ihre Daten bleiben streng vertraulich und werden nach der Verarbeitung weder ausgewertet noch gespeichert.

Einfache und transparente Preisgestaltung

0.9 €

pro Million eingegebener Token

4 €

pro Million ausgegebener Token

21 €

pro Million Reasoning-Tokens

Berechnet auf einer in Frankreich ansässigen Infrastruktur, qualifiziert SecNumcloud und HDS-zertifiziert.

Note zum Preis "Argumentation" : Dieser Preis gilt speziell für Modelle, die eingestuft werden als "Raison" oder "Hybrid" (Modelle, bei denen die Fähigkeit "Argumentation" aktiviert), wenn die Argumentation aktiv ist und nur auf Token, die mit dieser Aktivität verbunden sind.

Große Modelle

Unsere großen Modelle bieten Spitzenleistungen für die anspruchsvollsten Aufgaben. Sie eignen sich besonders für Anwendungen, die ein tiefes Sprachverständnis, komplexes Denken oder die Verarbeitung langer Dokumente erfordern.

Durch die Kombination von bemerkenswerter Effizienz mit geringen Rechenressourcen bietet dieses Modell umfangreiche mehrsprachige Fähigkeiten, die acht Hauptsprachen (Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch, Hindi und Thai) abdecken. Sein Kontextfenster mit 60.000 Token ermöglicht die gründliche Analyse komplexer Dokumente und langer Konversationen, wobei eine außergewöhnliche Gesamtkonsistenz gewahrt bleibt. Optimiert zur Minimierung von Verzerrungen und problematischen Antworten.

Parameter :

70 milliards

Kontext Größe :

60000

Führerschein :

LLAMA 3.3 Community Licence

Energieeffektivität :

8.87 kWh/Marke

CO₂-Äquivalent :

204.01 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Dialog

Mehrsprachig

Teil der Qwen3-Serie. Dieses Modell mit 235 Milliarden Parametern wurde entwickelt, um sich bei Aufgaben wie Deep Reasoning, komplexer Codegenerierung und nuanciertem Verständnis über große Zusammenhänge hinweg auszuzeichnen. Unterstützt über 100 Sprachen und integriert hybride Denkweisen.

Parameter :

235 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

6.35 kWh/Marke

CO₂-Äquivalent :

146.05 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Mehrsprachig

Sehr breit

DeepSeek-R1 671B stellt eines der größten offenen Modelle dar, das für die anspruchsvollsten Denkaufgaben und die Erzeugung von Text in außergewöhnlicher Qualität bestimmt ist.

Parameter :

671 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

8.33 kWh/Marke

CO₂-Äquivalent :

191.59 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Argumentation

Extrem breit

Dieses Modell mit seiner unübertroffenen Hardware-Effizienz verfügt über native multimodale Fähigkeiten und zeichnet sich durch mehrsprachige Leistung in über 140 Sprachen aus. Das beeindruckende Kontextfenster mit 120.000 Token macht sie zur idealen Wahl für die Analyse sehr umfangreicher Dokumente, die Suche nach Dokumenten und alle Anwendungen, die das Verständnis erweiterter Kontexte erfordern. Seine optimierte Architektur ermöglicht einen flexiblen Einsatz, ohne die Qualität der Ergebnisse zu beeinträchtigen.

Parameter :

27 milliards

Kontext Größe :

120000

Führerschein :

Google Gemma Nutzungsbedingungen

Energieeffektivität :

3.91 kWh/Marke

CO₂-Äquivalent :

89.93 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vision

Agent

Schnell

Großer Kontext

FP8-Version des MoE-Modells Qwen3 30B-A3B. Beinhaltet einen "Thinking"-Modus für komplexes Denken und einen schnellen "Non-Thinking"-Modus. Verbesserte Fähigkeiten in Reasoning, Code, Mathematik und Agent (Tools/MCP). Unterstützt mehr als 100 Sprachen. Ideal für ein optimales Verhältnis von Leistung und Kosten.

Parameter :

30 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

2.58 kWh/Marke

CO₂-Äquivalent :

59.34 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

MoE

Agent

Argumentation

Schnell

Mehrsprachig

DeepSeek-R1 70B wurde für komplexe Denk- und Generierungsaufgaben entwickelt.

Parameter :

70 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

11.44 kWh/Marke

CO₂-Äquivalent :

263.12 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Argumentation

Breite

Spezialisierte Vorlagen

Unsere spezialisierten Modelle sind für bestimmte Aufgaben wie Code-Generierung, Bildanalyse oder die Verarbeitung strukturierter Daten optimiert. Sie bieten ein hervorragendes Verhältnis von Leistung und Kosten für gezielte Anwendungsfälle.

Teil der Qwen3-Serie, trainiert auf ~36T Token. Verbesserte Fähigkeiten in Reasoning, Code, Mathematik und Agent (Tools/MCP). Unterstützt über 100 Sprachen und hybride Denkweisen.

Parameter :

14 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

2.65 kWh/Marke

CO₂-Äquivalent :

60.95 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Schnell

Mehrsprachig

Dieses mittelgroße Modell vereint hochwertige Leistung und Betriebseffizienz und bietet einen Großteil der Fähigkeiten seines großen Bruders mit 27B Parametern in einem leichteren Format. Ideal für Einsätze, bei denen es auf Qualität und Geschwindigkeit ankommt, ohne die Rechenressourcen der größeren Modelle.

Parameter :

12 milliards

Kontext Größe :

120000

Führerschein :

Google Gemma Nutzungsbedingungen

Energieeffektivität :

2.73 kWh/Marke

CO₂-Äquivalent :

62.79 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vision

Schnell

Großer Kontext

Diese kompakte Version der Gemma 3 ist für ressourcenbeschränkte Einsätze optimiert, wobei sie für ihre Größe eine bemerkenswerte Leistung beibehält. Seine effiziente Architektur ermöglicht eine schnelle Inferenz auf Standardhardware und ist ideal für Anwendungen, die eine schnelle Reaktionsfähigkeit und einen großen Einsatz erfordern. Trotz ihrer geringen Größe behält sie multimodale Fähigkeiten bei, um sowohl Text als auch Bilder zu verarbeiten.

Parameter :

4 milliards

Kontext Größe :

120000

Führerschein :

Google Gemma Nutzungsbedingungen

Energieeffektivität :

0.93 kWh/Marke

CO₂-Äquivalent :

21.39 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vision

Schnell

Kompakt

Großer Kontext

Effizient

Dieses ultrakompakte Modell stellt die Quintessenz der Effizienz dar und ermöglicht Einsätze in Umgebungen mit extrem begrenzten Ressourcen. Trotz seiner minimalen Größe bietet er erstaunliche Grundfähigkeiten für einfache bis moderate Textaufgaben mit einer außergewöhnlichen Inferenzgeschwindigkeit. Außerdem unterstützt es die Integration mit externen Tools über function calling.

Parameter :

1 milliards

Kontext Größe :

32000

Führerschein :

Google Gemma Nutzungsbedingungen

Energieeffektivität :

1.32 kWh/Marke

CO₂-Äquivalent :

30.36 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Ultrakompakt

Embedded

Effizient

Fine-tuned auf synthetische Anweisungen (ChatGPT, Gemma) und benutzerdefinierte Prompts. Nicht für Code/Math optimiert. Trainiert auf 4k-Kontext, behält aber die Fähigkeit des Basismodells für 32k bei. Modell in Entwicklung.

Parameter :

7 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

1.32 kWh/Marke

CO₂-Äquivalent :

30.36 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Französisch

Open-Source

Effizient

Trotz seiner moderaten Größe weist dieses Modell eine bemerkenswerte Leistung auf, die mit vielen proprietären Modellen, die wesentlich größer sind, konkurrieren kann. Seine genial optimierte Architektur erleichtert den lokalen Einsatz in einer Vielzahl von Infrastrukturen. Dank nativer multimodaler Fähigkeiten kann sie sowohl Text als auch Bilder verarbeiten, ohne auf externe Systeme angewiesen zu sein. Die Apache-2.0-Lizenz bietet maximale Flexibilität für kommerzielle Einsätze und Anpassungen und macht sie zur idealen Wahl für Unternehmen, die Leistung und gesetzliche Auflagen gegeneinander abwägen wollen.

Parameter :

24 milliards

Kontext Größe :

60000

Führerschein :

Apache 2.0

Energieeffektivität :

3.7 kWh/Marke

CO₂-Äquivalent :

85.1 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vision

Agent

Sicherheit

Bemerkenswerte Leistungen in Codegenerierung und algorithmischem Denken (60.6% LiveCodeBench Pass@1, 1936 Codeforces, 92.6% HumanEval+). Trainiert über RL (GRPO+) mit schrittweiser Verlängerung des Kontexts (32k -> 64k). Transparentes Projekt (Code, Dataset, offene Logs). Ermöglicht die Integration fortschrittlicher Code-Generierungsfähigkeiten, ohne auf proprietäre Lösungen angewiesen zu sein.

Parameter :

14 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

2.95 kWh/Marke

CO₂-Äquivalent :

67.85 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Programmierung

Argumentation

Open-Source

Mathematik

Schnell

Dieses kompakte Modell erreicht das bemerkenswerte Kunststück, bei einer Vielzahl von Aufgaben im Bereich des visuellen Verständnisses mit der Leistung weitaus größerer Modelle gleichzuziehen. Seine Fähigkeit, den visuellen Inhalt von Dokumenten - Texte, Tabellen, Grafiken und Diagramme - direkt zu interpretieren, ohne einen herkömmlichen OCR-Schritt zu durchlaufen, stellt einen bedeutenden Fortschritt in Bezug auf Effizienz und Genauigkeit dar. Dieser integrierte Ansatz reduziert Erkennungsfehler erheblich und ermöglicht ein kontextbezogeneres und differenzierteres Verständnis des visuellen Inhalts.

Parameter :

2 milliards

Kontext Größe :

16384

Führerschein :

Apache 2.0

Energieeffektivität :

1.13 kWh/Marke

CO₂-Äquivalent :

25.99 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vision

Sicherheit

Schnell

Kompakt

Effizient

Diese Version 8B des Granite 3.3-Modells bietet deutliche Verbesserungen bei den allgemeinen Benchmarks (AlpacaEval-2.0, Arena-Hard) und Verbesserungen in Mathematik, Codierung und Befehlsverfolgung. Es unterstützt 12 Sprachen, Fill-in-the-Middle (FIM) für den Code, den "Thinking"-Modus für strukturiertes Denken und den Aufruf von Funktionen. Lizenziert unter Apache 2.0. Ideal für allgemeine Aufgaben und die Integration in KI-Assistenten.

Parameter :

8 milliards

Kontext Größe :

60000

Führerschein :

Apache 2.0

Energieeffektivität :

2 kWh/Marke

CO₂-Äquivalent :

46 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Sicherheit

Effizient

Kompakte Version von Granite 3.3 (2B Parameter) mit denselben Verbesserungen in den Bereichen Reasoning, Instruction-Following, Mathematik und Coding wie die Version 8B. Unterstützt 12 Sprachen, Fill-in-the-Middle (FIM), den "Thinking"-Modus und Funktionsaufrufe. Lizenziert als Apache 2.0. Ausgezeichnete Wahl für schlanke Implementierungen, die lange kontextbezogene und schlussfolgernde Fähigkeiten erfordern.

Parameter :

2 milliards

Kontext Größe :

120000

Führerschein :

Apache 2.0

Energieeffektivität :

1.2 kWh/Marke

CO₂-Äquivalent :

27.6 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Sicherheit

Schnell

Effizient

Ideal für den allgemeinen Gebrauch, bei dem eine längere Gedankenverarbeitung und eine höhere Genauigkeit erforderlich sind. Nützlich für juristische Recherchen, Finanzprognosen, Softwareentwicklung und kreatives Storytelling. Löst Herausforderungen in mehreren Schritten, bei denen es auf Transparenz und Genauigkeit ankommt.

Parameter :

24 milliards

Kontext Größe :

40000

Führerschein :

Apache 2.0

Energieeffektivität :

4.64 kWh/Marke

CO₂-Äquivalent :

106.72 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Argumentation

Mehrsprachig

Die MoE-Architektur (Mixture-of-Experts) dieses Modells stellt einen bedeutenden Fortschritt in der Optimierung von Sprachmodellen dar, da sie eine Leistung ermöglicht, die mit der von weitaus größeren Modellen vergleichbar ist, während der Speicherplatzbedarf deutlich geringer bleibt. Dieser innovative Ansatz aktiviert dynamisch nur die relevanten Teile des Netzwerks für jede spezifische Aufgabe und sorgt so für eine bemerkenswerte Energie- und Recheneffizienz, ohne Kompromisse bei der Qualität der Ergebnisse einzugehen.

Parameter :

3 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

0.73 kWh/Marke

CO₂-Äquivalent :

16.79 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Sicherheit

Schnell

MoE

Wirksamkeit

Effizient

Mit ausgezeichneten Fähigkeiten im logischen Denken und einem tiefen semantischen Verständnis zeichnet sich dieses Modell durch seine Fähigkeit aus, die Feinheiten und Implikationen in komplexen Texten zu erfassen. Sein Design legt Wert auf konsistentes Denken und analytische Genauigkeit, wodurch es sich besonders für Anwendungen eignet, die eine sorgfältige und kontextbezogene Analyse von Informationen erfordern. Seine moderate Größe ermöglicht einen flexiblen Einsatz bei gleichbleibend hoher Leistung in einem breiten Spektrum anspruchsvoller analytischer Aufgaben.

Parameter :

14 milliards

Kontext Größe :

32000

Führerschein :

LLAMA 3.2 Community Licence

Energieeffektivität :

3.05 kWh/Marke

CO₂-Äquivalent :

70.15 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Verständnis

Analyse

Schnell

Diese erweiterte Version des Cogito-Modells treibt die Fähigkeiten des Denkens und Verstehens noch weiter voran und bietet eine unübertroffene Analysetiefe für die komplexesten Anwendungen. Sein ausgeklügeltes architektonisches Design ermöglicht es, mehrstufige Argumentationen mit Strenge und Präzision anzugehen und dabei eine bemerkenswerte Gesamtkonsistenz zu bewahren. Ideal für geschäftskritische Anwendungen, die eine künstliche Intelligenz erfordern, die zu differenziertem Denken und einem tiefgreifenden Kontextverständnis fähig ist, das mit der Analyse menschlicher Experten in Spezialgebieten vergleichbar ist.

Parameter :

32 milliards

Kontext Größe :

32000

Führerschein :

LLAMA 3.2 Community Licence

Energieeffektivität :

5.73 kWh/Marke

CO₂-Äquivalent :

131.79 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Verständnis

Analyse

Teil der Qwen3-Serie, trainiert auf einem umfangreichen Datenkorpus. Dieses Modell mit 32 Milliarden Parametern wurde entwickelt, um sich bei komplexen Aufgaben auszuzeichnen, über 100 Sprachen zu unterstützen und hybride Denkweisen für eine bessere Leistung zu integrieren.

Parameter :

32 milliards

Kontext Größe :

40000

Führerschein :

Apache 2.0

Energieeffektivität :

N.C.

CO₂-Äquivalent :

N.C.

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Mehrsprachig

Großer Kontext

Dieses Modell verwendet einen innovativen RL-Ansatz mit ergebnisbasierten Belohnungen (Genauigkeitschecker für Mathematik, Codeausführung für Codierung) und mehrstufigem Training, um die allgemeinen Fähigkeiten zu verbessern, ohne die spezialisierten Leistungen zu verschlechtern. Es beinhaltet Agentenfähigkeiten, um Werkzeuge zu nutzen und das Denken anzupassen. Apache 2.0-Lizenz.

Parameter :

32 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

5.22 kWh/Marke

CO₂-Äquivalent :

120.06 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Codierung

Mathematik

Diese kompakte Version des DeepSeek-R1 stellt ein optimales Gleichgewicht zwischen Leistung und Effizienz dar. Sie behält die wichtigsten Denk- und Analysefähigkeiten ihres größeren Gegenstücks bei, ermöglicht aber einen leichteren und flexibleren Einsatz. Sein sorgfältig optimiertes Design sorgt für hochwertige Ergebnisse bei einer Vielzahl von Aufgaben und minimiert gleichzeitig die Anforderungen an die Rechenressourcen. Diese Kombination macht ihn zur idealen Wahl für Anwendungen, die einen agilen Einsatz ohne größere Kompromisse bei den Kernfähigkeiten erfordern.

Parameter :

14 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

3.05 kWh/Marke

CO₂-Äquivalent :

70.15 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Kompakt

Vielseitig

Schnell

Diese mittlere Version des DeepSeek-R1-Modells kombiniert auf intelligente Weise Leistung und Effizienz und bietet eine deutlich verbesserte Leistung im Vergleich zur 14B-Version, während sie gleichzeitig eine kleinere Grundfläche als die 70B-Version beibehält. Diese strategische Position in der Produktreihe macht ihn zu einer besonders attraktiven Option für Einsätze, bei denen erweiterte Denkfähigkeiten ohne die Hardwareanforderungen der größeren Modelle benötigt werden. Dank ihrer Vielseitigkeit kann sie sich bei einer Vielzahl von Aufgaben auszeichnen, von der Textanalyse bis hin zur Generierung strukturierter Inhalte.

Parameter :

32 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

5.54 kWh/Marke

CO₂-Äquivalent :

127.42 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Argumentation

Vielseitig

Bietet die Argumentationsfähigkeiten der Cogito-Familie in einem sehr leichten Format (3 Milliarden Parameter), das sich ideal für den Einsatz in eingebetteten Systemen oder CPU-Umgebungen eignet.

Parameter :

3 milliards

Kontext Größe :

32000

Führerschein :

LLAMA 3.2 Community Licence

Energieeffektivität :

0.86 kWh/Marke

CO₂-Äquivalent :

19.78 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Argumentation

Kompakt

Embedded

Effizient

Schnell

Dieses Modell wurde entwickelt, um dichte Vektordarstellungen von Text zu erzeugen, und ist für Effizienz und Leistung bei semantischen Ähnlichkeitsaufgaben, Clustering und Klassifizierung optimiert. Dank seiner geringen Größe ist es ideal für den Einsatz in großem Maßstab.

Parameter :

0.278 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

N.C.

CO₂-Äquivalent :

N.C.

Werkzeuge (Fonctions) :

Vision (Bilder) :

Einbetten

Kompakt

Semantik

Effizient

Leichtgewichtige Version der Guardian-Familie, die darauf trainiert ist, schädliche Inhalte, Verzerrungen und Sicherheitsrisiken in textbasierten Interaktionen zu erkennen und herauszufiltern. Bietet robusten Schutz mit einem geringen computationalen Fußabdruck. Auf 8k Tokens begrenzter Kontext.

Parameter :

2 milliards

Kontext Größe :

8192

Führerschein :

Apache 2.0

Energieeffektivität :

N.C.

CO₂-Äquivalent :

N.C.

Werkzeuge (Fonctions) :

Vision (Bilder) :

Sicherheit

Konformität

Kompakt

Filterung

Effizient

Mittelgroßes Modell der Guardian-Familie, das eine gründlichere Sicherheitsanalyse als die Version 2B bietet. Ideal für Anwendungen, die eine strenge Überwachung der Inhalte und eine strikte Einhaltung der Vorschriften erfordern.

Parameter :

8 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

N.C.

CO₂-Äquivalent :

N.C.

Werkzeuge (Fonctions) :

Vision (Bilder) :

Sicherheit

Konformität

Filterung

Das kleinste Modell der Qwen 2.5-Serie, das grundlegende Sprachverarbeitungsfähigkeiten bei minimaler Grundfläche bietet. Ideal für sehr einfache Aufgaben auf IoT- oder Mobilgeräten.

Parameter :

0.5 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

0.95 kWh/Marke

CO₂-Äquivalent :

21.85 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Ultrakompakt

Schnell

Embedded

Effizient

Etwas größeres Modell als Version 0.5B, das verbesserte Fähigkeiten bietet, aber immer noch sehr effizient ist. Geeignet für mobile oder eingebettete Anwendungen, die etwas mehr Leistung benötigen.

Parameter :

1.5 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

0.58 kWh/Marke

CO₂-Äquivalent :

13.34 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Kompakt

Schnell

Embedded

Effizient

Bietet solide mehrsprachige Fähigkeiten und ein allgemeines Verständnis in einem 14B-Format. Geeignet für eine Vielzahl von Anwendungen, die ein zuverlässiges Modell ohne die Anforderungen sehr großer Modelle benötigen.

Parameter :

14 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

3 kWh/Marke

CO₂-Äquivalent :

69 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vielseitig

Mehrsprachig

Schnell

Version 32B von Qwen 2.5, die im Vergleich zur Version 14B eine höhere Leistung liefert, insbesondere beim Argumentieren und Befolgen komplexer Anweisungen, und dabei leichter ist als das Modell 72B.

Parameter :

32 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

5.73 kWh/Marke

CO₂-Äquivalent :

131.79 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vielseitig

Mehrsprachig

Argumentation

Bietet einen guten Kompromiss zwischen den Fähigkeiten der Modelle 1.5B und 14B. Ideal für Anwendungen, die ein gutes allgemeines Verständnis in einem leichten und schnellen Format erfordern.

Parameter :

3 milliards

Kontext Größe :

32000

Führerschein :

MIT-Lizenz

Energieeffektivität :

0.9 kWh/Marke

CO₂-Äquivalent :

20.7 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Kompakt

Schnell

Vielseitig

Effizient

Bietet einen guten Kompromiss zwischen den Fähigkeiten von ultrakompakten und größeren Modellen. Ideal für Anwendungen, bei denen ein gutes allgemeines Verständnis in einem leichten und schnellen Format erforderlich ist.

Parameter :

0.6 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

0.9 kWh/Marke

CO₂-Äquivalent :

20.7 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Kompakt

Schnell

Vielseitig

Effizient

Etwas größeres Modell als Version 0.6B, das verbesserte Fähigkeiten bietet, aber immer noch sehr effizient ist. Geeignet für mobile oder eingebettete Anwendungen, die etwas mehr Leistung benötigen.

Parameter :

1.7 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

0.65 kWh/Marke

CO₂-Äquivalent :

14.95 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Kompakt

Schnell

Embedded

Effizient

Diese kompakte Version des Qwen3-Modells ist für ressourcenbeschränkte Einsätze optimiert, wobei sie für ihre Größe eine bemerkenswerte Leistung beibehält. Seine effiziente Architektur ermöglicht eine schnelle Inferenz auf Standardhardware.

Parameter :

4 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

1.13 kWh/Marke

CO₂-Äquivalent :

25.99 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Kompakt

Effizient

Version 8B von Qwen3 mit verbesserten Fähigkeiten in den Bereichen Argumentation, Code, Mathematik und Agent. Unterstützt über 100 Sprachen und hybride Denkweisen.

Parameter :

8 milliards

Kontext Größe :

32000

Führerschein :

Apache 2.0

Energieeffektivität :

1.87 kWh/Marke

CO₂-Äquivalent :

43.01 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Argumentation

Agent

Mehrsprachig

Effizient

Qwen2.5-VL ist Qwens neues visionär-sprachliches Flaggschiffmodell, das einen deutlichen Fortschritt im Vergleich zu Qwen2-VL darstellt. Schlüsselmerkmale - Visuelles Verständnis (gemeinsame Objekte, Texte, Grafiken, Symbole, Layouts). Visual-Agent-Fähigkeiten (Argumentation, dynamische Lenkung von Werkzeugen für Computer-/Telefonnutzung). Präzise visuelle Lokalisierung (umschließende Boxen, Punkte, stabile JSON-Ausgaben). Generierung strukturierter Ausgaben (Rechnungen, Formulare, Tabellen). Qwen2.5-VL-3B übertrifft sogar die Version 7B von Qwen2-VL.

Parameter :

3.8 milliards

Kontext Größe :

128000

Führerschein :

Apache 2.0

Energieeffektivität :

0.83 kWh/Marke

CO₂-Äquivalent :

19.09 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vision

Agent

Argumentation

Schnell

Effizient

OCR

Visuelle Lokalisierung

Edge AI

Parameter :

8.3 milliards

Kontext Größe :

128000

Führerschein :

Apache 2.0

Energieeffektivität :

1.46 kWh/Marke

CO₂-Äquivalent :

33.58 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Vision

Agent

Argumentation

Effizient

OCR

Visuelle Lokalisierung

Foundation-Sec-8B-Modell (Llama-3.1-FoundationAI-SecurityLLM-base-8B), das auf Llama-3.1-8B basiert und auf einem Cybersicherheitskorpus vortrainiert ist. Konzipiert für Bedrohungserkennung, Schwachstellenbewertung, Sicherheitsautomatisierung usw. Optimiert für den lokalen Einsatz. 16k-Token-Kontext.

Parameter :

8 milliards

Kontext Größe :

16000

Führerschein :

Apache 2.0

Energieeffektivität :

2.46 kWh/Marke

CO₂-Äquivalent :

56.58 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Sicherheit

Kompakt

Devstral ist ein agentischer LLM für Aufgaben der Softwareentwicklung. Es zeichnet sich durch die Verwendung von Werkzeugen aus, mit denen man Codebanken durchsuchen, mehrere Dateien bearbeiten und Agenten für die Softwareentwicklung füttern kann. Es ist ab Mistral Small 3.1 verfeinert und verfügt über ein langes Popup-Fenster mit bis zu 128k Tokens.

Parameter :

24 milliards

Kontext Größe :

120000

Führerschein :

Apache 2.0

Energieeffektivität :

4.5 kWh/Marke

CO₂-Äquivalent :

103.5 CO₂e/Mtoken

Werkzeuge (Fonctions) :

Vision (Bilder) :

Agent

Programmierung

Open-Source

Großer Kontext

Vergleich der Modelle

Diese Vergleichstabelle hilft Ihnen bei der Auswahl des für Sie am besten geeigneten Modells anhand verschiedener Kriterien wie Kontextgröße, Leistung und spezifische Anwendungsfälle.

Modell	Herausgeber	Einstellungen	Kontext (k tokens)	Energieeffizienz *
Große Modelle
Llama 3.3 70B	Meta	70B	60000
Qwen3 235B	Qwen Team	235B	32000
DeepSeek-R1 671B	DeepSeek AI	671B	32000
Gemma 3 27B	Google	27B	120000
Qwen3 30B-A3B FP8	Qwen Team	30B-A3B	32000
DeepSeek-R1 70B	DeepSeek AI	70B	32000
Spezialisierte Vorlagen
Qwen3 14B	Qwen Team	14B	32000
Gemma 3 12B	Google	12B	120000
Gemma 3 4B	Google	4B	120000
Gemma 3 1B	Google	1B	32000
Lucie-7B-Instruct	OpenLLM-Frankreich	7B	32000
Mistral Small 3.1	Mistral AI	24B	60000
DeepCoder	Agentica x Together AI	14B	32000
Granit 3.2 Vision	IBM	2B	16384
Granit 3.3 8B	IBM	8B	60000
Granit 3.3 2B	IBM	2B	120000
Magistral 24B	Mistral AI	24B	40000
Granit 3.1 MoE	IBM	3B	32000
Cogito 14B	Deep Cogito	14B	32000
Cogito 32B	Deep Cogito	32B	32000
Qwen3 32B	Qwen Team	32B	40000	N.C.
QwQ-32B	Qwen Team	32B	32000
DeepSeek-R1 14B	DeepSeek AI	14B	32000
DeepSeek-R1 32B	DeepSeek AI	32B	32000
Cogito 3B	Deep Cogito	3B	32000
Granite Embedding	IBM	278M	32000	N.C.
Granit 3 Guardian 2B	IBM	2B	8192	N.C.
Granit 3 Guardian 8B	IBM	8B	32000	N.C.
Qwen 2.5 0.5B	Qwen Team	0.5B	32000
Qwen 2.5 1.5B	Qwen Team	1.5B	32000
Qwen 2.5 14B	Qwen Team	14B	32000
Qwen 2.5 32B	Qwen Team	32B	32000
Qwen 2.5 3B	Qwen Team	3B	32000
Qwen3 0.6b	Qwen Team	0.6B	32000
Qwen3 1.7b	Qwen Team	1.7B	32000
Qwen3 4b	Qwen Team	4B	32000
Qwen3 8b	Qwen Team	8B	32000
Qwen2.5-VL 3B	Qwen Team	3.8B	128000
Qwen2.5-VL 7B	Qwen Team	7B (8.3B)	128000
Foundation-Sec-8B	Foundation AI - Cisco	8B	16000
devstral 24B	Mistral AI & All Hands AI	24B	120000

Legende und Erklärung

: Von der Vorlage unterstützte Funktionalität oder Fähigkeit

: Feature oder Fähigkeit, die von der Vorlage nicht unterstützt wird

* Energieeffizienz : Zeigt einen besonders niedrigen Energieverbrauch an (< 2.0 kWh/Mtoken)

* Schnell : Modell, das in der Lage ist, mehr als 50 Token pro Sekunde zu erzeugen

Anmerkung zu den Leistungsmessungen

Die Geschwindigkeitswerte (Tokens/s) stellen Leistungsziele dar. unter realen Bedingungen dar. Der Energieverbrauch (kWh/Mtoken) wird wird berechnet, indem die geschätzte Leistung des Inferenzservers (in Watt) durch die gemessene Geschwindigkeit des Modells (in Token/Sekunde) dividiert und dann in Kilowattstunden pro Million Token umgerechnet (Division durch 3,6). Diese Methode bietet einen praktischen Vergleich der Energieeffizienz. verschiedener Modelle, der eher als relativer Indikator als als als absolutes Maß für den Stromverbrauch.

Empfohlene Anwendungsfälle

Im Folgenden finden Sie einige häufige Anwendungsfälle und die dafür jeweils am besten geeigneten Modelle. Diese Empfehlungen basieren auf der spezifischen Leistung und den Fähigkeiten der einzelnen Modelle.

Mehrsprachiger Dialog

Chatbots und Assistenten, die in mehreren Sprachen kommunizieren können, mit automatischer Erkennung, Aufrechterhaltung des Kontexts über die gesamte Konversation hinweg und Verständnis für sprachliche Besonderheiten

Empfohlene Modelle

Llama 3.3
Mistral Small 3.1
Qwen 2.5
Granit 3.3

Analyse langer Dokumente

Verarbeitung umfangreicher Dokumente (>100 Seiten) mit Kontexterhaltung über den gesamten Text, Extraktion von Schlüsselinformationen, Generierung relevanter Zusammenfassungen und Beantwortung spezifischer Fragen zum Inhalt

Empfohlene Modelle

Gemma 3
DeepSeek-R1
Granit 3.3

Programmierung und Entwicklung

Generierung und Optimierung von Code in mehreren Sprachen, Debugging, Refactoring, Entwicklung vollständiger Funktionen, Verständnis komplexer algorithmischer Implementierungen und Erstellung von Unit-Tests

Empfohlene Modelle

DeepCoder
QwQ
DeepSeek-R1
Granit 3.3
Devstral

Visuelle Analyse

Direkte Verarbeitung von Bildern und visuellen Dokumenten ohne OCR-Vorverarbeitung, Interpretation von technischen Diagrammen, Grafiken, Tabellen, Zeichnungen und Fotos mit Generierung von detaillierten Texterklärungen zum visuellen Inhalt.

Empfohlene Modelle

Granit 3.2 Vision
Mistral Small 3.1
Gemma 3
Qwen2.5-VL

Sicherheit und Compliance

Anwendungen, die spezifische Sicherheitsfunktionen erfordern; Filterung sensibler Inhalte, Nachvollziehbarkeit der Argumentation, Überprüfung der DSGVO/HDS, Risikominimierung, Schwachstellenanalyse und Einhaltung von Branchenvorschriften

Empfohlene Modelle

Granite Guardian
Granit 3.3
Devstral
Mistral Small 3.1
Foundation-Sec-8B

Leichte und eingebettete Einsätze

Anwendungen, die einen minimalen Ressourcen-Fußabdruck erfordern, Einsatz auf Geräten mit begrenzter Kapazität, Echtzeit-Inferenz auf Standard-CPUs und Integration in eingebettete oder IoT-Systeme.

Empfohlene Modelle

Gemma 3
Granit 3.1 MoE
Granite Guardian
Granit 3.3

Große Modelle

Llama 3.3 70B

Qwen3 235B

DeepSeek-R1 671B

Gemma 3 27B

Qwen3 30B-A3B FP8

DeepSeek-R1 70B

Spezialisierte Vorlagen

Qwen3 14B

Gemma 3 12B

Gemma 3 4B

Gemma 3 1B

Lucie-7B-Instruct

Mistral Small 3.1

DeepCoder

Granit 3.2 Vision

Granit 3.3 8B

Granit 3.3 2B

Magistral 24B

Granit 3.1 MoE

Cogito 14B

Cogito 32B

Qwen3 32B

QwQ-32B

DeepSeek-R1 14B

DeepSeek-R1 32B

Cogito 3B

Granite Embedding

Granit 3 Guardian 2B

Granit 3 Guardian 8B

Qwen 2.5 0.5B

Qwen 2.5 1.5B

Qwen 2.5 14B

Qwen 2.5 32B

Qwen 2.5 3B

Qwen3 0.6b

Qwen3 1.7b

Qwen3 4b

Qwen3 8b

Qwen2.5-VL 3B

Qwen2.5-VL 7B

Foundation-Sec-8B

devstral 24B

Vergleich der Modelle

Empfohlene Anwendungsfälle

Mehrsprachiger Dialog

Analyse langer Dokumente

Programmierung und Entwicklung

Visuelle Analyse

Sicherheit und Compliance

Leichte und eingebettete Einsätze