Deepseeks Entwicklung von 1,6 Mrd. USD: Entlarven des Erschwinglichkeitsmythos

Deepseeks neuer Chatbot bietet eine beeindruckende Einführung: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Diese KI, ein Produkt des chinesischen Startups Deepseek, ist schnell zu einem wichtigen Spieler geworden und hat sogar zu einem erheblichen Rückgang des Nvidia -Aktienkurs beigetragen.

Bild: Ensigame.com

Der Erfolg von Deepseek beruht auf seinen innovativen Architektur- und Trainingsmethoden. Schlüsseltechnologien umfassen:

Multi-Token-Vorhersage (MTP): Anstatt Wörter einzeln vorherzusagen, prognostiziert MTP mehrere Wörter gleichzeitig, steigern Sie die Genauigkeit und Effizienz.
Mischung von Experten (MOE): Diese Architektur verwendet 256 neuronale Netze in Deepseek V3, wodurch acht für jede Token -Verarbeitungsaufgabe aktiviert wird, das Training beschleunigt und die Leistung verbessert.
Multi-Head Latent Achtung (MLA): MLA extrahiert wiederholt wichtige Details aus Textfragmenten und stellt sicher, dass wichtige Informationen nicht übersehen werden, was zu einem differenzierteren Verständnis der Eingabedaten führt.

Deepseek behauptete zunächst eine bemerkenswert niedrige Ausbildungskosten von nur 6 Millionen US -Dollar für Deepseek V3 mit nur 2048 GPUs. Die semianalyse ergab jedoch eine weitaus umfangreichere Infrastruktur: ungefähr 50.000 NVIDIA Hopper -GPUs (einschließlich 10.000 H800, 10.000 H100s und zusätzliche H20S), die auf mehrere Rechenzentren ausgebreitet sind, was eine Gesamtinvestition von rund 1,6 Milliarden US -Dollar und Betriebskosten in Höhe von etwa 944 Mio. USD entspricht.

Bild: Ensigame.com

Deepseek, eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, besitzt seine Rechenzentren und bietet Kontrolle über Optimierung und schnellere Innovationsimplementierung. Dieser selbstfinanzierte Ansatz verbessert die Flexibilität und Entscheidungsfindung. Das Unternehmen zieht Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von chinesischen Universitäten.

Bild: Ensigame.com

Der Schulungskostenanspruch in Höhe von 6 Mio. USD scheint eine erhebliche Untertreibung zu sein, die nur die Nutzung der GPU vor der Training darstellt, ohne Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur. Die tatsächliche Investition von Deepseek in die KI -Entwicklung übersteigt 500 Millionen US -Dollar. Trotzdem ermöglicht seine magere Struktur effiziente Innovationen im Vergleich zu größeren, bürokratischeren Unternehmen.

Bild: Ensigame.com

Der Erfolg von Deepseek unterstreicht das Potenzial gut finanzierter unabhängiger KI-Unternehmen, mit Branchenriesen zu konkurrieren. Während seine "revolutionäre Haushaltsansprüche" übertrieben ist, ist sein Erfolg unbestreitbar mit erheblichen Investitionen, technologischen Durchbrüchen und einem starken Team verbunden. Der Kontrast ist im Vergleich der Schulungskosten stark: Deepseeks R1 kostete 5 Millionen US-Dollar, während Chatgpt-4 100 Millionen US-Dollar kosten. Es ist jedoch immer noch billiger als seine Konkurrenten.