Benchmarks — Hummingbird gegen FastAPI und Fastify

Swift auf dem Server mit Hummingbird

Eine Reihe über Server-Side Swift mit dem Hummingbird-Framework — von der ersten Route bis zum deploybaren LLM-Gateway auf Linux.

Wir bauen ein OpenAI-kompatibles LLM-Gateway in Swift mit dem Hummingbird-Framework. Das Gateway läuft gegen ein lokales MLX-Modell auf Apple Silicon und ist als vollständig statisch verlinktes Binary auf Linux deploybar — mit Streaming, API-Key-Auth, Rate-Limiting, Prometheus-Metrics und Distributed Tracing. Demo-Projekt ist swift-mlx-gateway auf Codeberg, pro Artikel ein Git-Tag zum Mitziehen. Sechs Artikel plus Prolog.

  1. 0

    Swift auf dem Server — Hummingbird 2 und ein lokales LLM-Gateway

    Prolog · Serie: Swift auf dem Server mit Hummingbird. Warum Swift auf dem Server 2026 keine Liebhaberei mehr ist, wie Hummingbird sich von Vapor unterscheidet und warum wir ein lokales LLM-Gateway als Demo-Projekt gebaut haben.
    13. May 2026
  2. 1

    Hello Hummingbird — Das Skelett

    Artikel 1 · Swift auf dem Server mit Hummingbird. Wir legen das Projekt an, schreiben Package.swift, richten den AsyncParsableCommand-Einstiegspunkt ein und bauen einen minimalen Router mit /healthz und /v1/models bis curl eine Antwort liefert.
    14. May 2026
  3. 2

    Zwei Protokolle, ein Backend — Anthropic und OpenAI mit Codable

    Artikel 2 der Hummingbird-Reihe. Wir implementieren die Anthropic Messages API und die OpenAI Chat Completions API im selben Gateway: Codable-Typen für beide Protokolle, zwei POST-Endpoints, Eingabevalidierung, Mock-Inferenz.
    15. May 2026
  4. 3

    Echte Inferenz — MLXClient und das lokale Modell

    Artikel 3 der Hummingbird-Reihe. Wir verbinden das Gateway mit mlx_lm.server: MLXClient als Swift actor, Formatkonvertierung von Anthropic nach OpenAI, Fehler-Mapping mit HTTP-Statuscodes. Nach diesem Artikel liefert das Gateway echte Modellantworten.
    15. May 2026
  5. 4

    Streaming — Tokens fließen wenn sie entstehen

    Artikel 4 der Hummingbird-Reihe. Wir ergänzen beide Endpoints um Streaming via Server-Sent Events: MLXClient.completeStream als AsyncThrowingStream, Anthropic-Events, OpenAI-Chunks, Task-Cancellation. Tokens erscheinen beim Client direkt während das Modell generiert.
    16. May 2026
  6. 5

    Auth und RequestContext — wir machen das Tor zu

    Artikel 5 der Hummingbird-Reihe. Wir fügen API-Key-Auth, Token-Bucket-Rate-Limiting und spec-konforme Error-Responses hinzu — und nutzen dabei den generischen RequestContext aus Hummingbird 2, das Feature das uns typsicheren Middleware-Zustand ohne Dictionaries gibt.
    17. May 2026
  7. 6

    Observability und Linux-Deployment — vom swift run zum systemd-Service

    Artikel 6 der Hummingbird-Reihe. Wir ergänzen das Gateway um Prometheus-Metriken via swift-metrics und swift-prometheus, einen /metrics-Endpoint, MetricsMiddleware und TracingMiddleware. Dazu Cross-Compile auf ein statisch gelinktes Linux-Binary via Swift Static Linux SDK, ein Multi-Stage-Dockerfile und eine systemd-Unit für den Betrieb auf bare-metal Linux.
    19. May 2026
  8. 7

    Benchmarks — Hummingbird gegen FastAPI und Fastify

    Artikel 7 der Hummingbird-Reihe. Wir messen das LLM-Gateway gegen funktional äquivalente Implementierungen in FastAPI und Fastify — mit fairem Middleware-Stack, deterministischem Backend-Stub und oha als Lastgenerator. Was dabei rauskommt, ist gleichzeitig das erwartete und das überraschende Ergebnis.
    20. May 2026