Chinas Alibaba übertrifft Meta mit neuen Qwen 3-KI-Modellen

Zusammenfassung:

  • Der chinesische Technologieriese Alibaba hat eine Familie von Open-Source-KI-Modellen namens Qwen 3 auf den Markt gebracht. Die Kollektion umfasst 8 neue Modelle.
  • Das führende Modell, Qwen3-235B-A22B MoE, wurde mit 235 Milliarden Parametern trainiert, wobei 22 Milliarden Parameter aktiviert waren.
  • Das kleinere Modell, Qwen3-30B-A3B MoE, das nur 3 Milliarden aktivierte Parameter hat, übertrifft GPT-4o bei weitem.

Der chinesische Technologieriese Alibaba hat in seiner Qwen 3-Serie acht neue Open-Source-Modelle für künstliche Intelligenz (KI) auf den Markt gebracht. Zu den neuen Qwen 3-Modellen gehören zwei MoE-Modelle (Mixture of Experts), Qwen3-235B-A22B und Qwen3-30B-A3B. Das Qwen3-235B-A22B ist das größte und führende Modell mit insgesamt 235 Milliarden Parametern und 22 Milliarden aktivierten Parametern.

Qwen 3 KI-Modelle von Alibaba eingeführt

Das Qwen3-30B-A3B ist ein kleineres MoE-Modell mit insgesamt 30 Milliarden Parametern und 3 Milliarden aktivierten Parametern. Darüber hinaus gibt es innerhalb der Qwen 3-Serie sechs dichte Modelle, darunter Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B und Qwen3-0.6B. Diese neuen Alibaba Qwen 3 AI-Modelle stärken die Position des Unternehmens im Bereich der künstlichen Intelligenz weiter.

Alle Qwen 3-Modelle unterstützen Hybrid Thinking Modes, d. h. sie sind gleichzeitig inferentielle KI-Modelle und traditionelle große Sprachmodelle (LLMs). Im „Denkmodus“ kann das Modell schrittweise Schlussfolgerungen ziehen, während es im „Nicht-Denkmodus“ eine schnelle Antwort liefert. Diese Funktion erhöht die Flexibilität bei der Verwendung des Modells in verschiedenen Anwendungen.

Außerdem, Unterstützung Qwen 3-Modelle unterstützen mehr als 119 Sprachen und Dialekte weltweit. Es ist eines der vielseitigsten mehrsprachigen Modelle. Darüber hinaus hat Alibaba die Unterstützung des Model Context Protocol (MCP) für Qwen 3-Modelle verbessert und so zusätzliche agentische Funktionen freigeschaltet. Diese Verbesserung ermöglicht es den Modellen, den Kontext besser zu verstehen und intelligentere Entscheidungen zu treffen.

In Bezug auf die Leistung liefert das größere Modell Qwen3-235B-A22B wettbewerbsfähige Ergebnisse im Einklang mit DeepSeek R1 und Grok 3 Beta und Gemini 2.5 Pro und OpenAI o1. Interessant finde ich, dass das kleinere Modell Qwen3-30B-A3B, das nur 3 Milliarden aktive Parameter hat, DeepSeek V3 und das GPT-4o-Modell von OpenAI übertrifft. Dies deutet auf eine hohe Ressourceneffizienz und die Fähigkeit hin, mit einer kleineren Modellgröße eine hervorragende Leistung zu erzielen.

Laut Alibaba schneiden die Qwen 3-Modelle in den Bereichen Programmierung, Mathematik, Naturwissenschaften und allgemeine Fähigkeiten gut ab. Insgesamt stellt Qwen 3 eine Familie fortschrittlicher und leistungsfähiger KI-Modelle aus China dar. Mit dem kommenden DeepSeek R2 ist China nun gut aufgestellt, um mit westlichen KI-Laboren zu konkurrieren. Diese Entwicklung spiegelt Chinas rasanten Fortschritt im Bereich der künstlichen Intelligenz wider.

Kommentarfunktion ist geschlossen.