Foundry Local som API-exempel

Det här exemplet visar hur man använder Microsoft Foundry Local som en REST API-tjänst utan att förlita sig på OpenAI SDK. Det demonstrerar direkta HTTP-integrationsmönster för maximal kontroll och anpassning.

Översikt

Baserat på Microsofts officiella Foundry Local-mönster erbjuder detta exempel:

Direkt REST API-integration med FoundryLocalManager
Anpassad implementation av HTTP-klient
Modellhantering och hälsokontroll
Hantering av både strömmande och icke-strömmande svar
Produktionsklara felhanterings- och återförsökslogik

Förutsättningar

Foundry Local Installation

# Install from GitHub releases
winget install Microsoft.FoundryLocal

Python-beroenden

pip install foundry-local-sdk requests asyncio aiohttp

Arkitektur

┌─────────────────┐    ┌──────────────────┐    ┌─────────────────┐
│   Your App      │───▶│  REST API Client │───▶│  Foundry Local  │
│                 │    │                  │    │   Service       │
│ - Custom Logic  │    │ - HTTP Requests  │    │ - Model Loading │
│ - Business Rules│    │ - Authentication │    │ - Inference     │
│ - Data Pipeline │    │ - Error Handling │    │ - Health Check  │
└─────────────────┘    └──────────────────┘    └─────────────────┘

Nyckelfunktioner

1. Direkt HTTP-integration

Enbart REST API-anrop utan SDK-beroenden
Anpassad autentisering och headers
Full kontroll över begäran/svarshantering

2. Modellhantering

Dynamisk laddning och avladdning av modeller
Hälsokontroll och statusövervakning
Insamling av prestandamått

3. Produktionsmönster

Återförsöksmekanismer med exponentiell backoff
Circuit breaker för felhantering
Omfattande loggning och övervakning

4. Flexibel svarshantering

Strömmande svar för realtidsapplikationer
Batchbearbetning för hög genomströmning
Anpassad svarsparsing och validering

Användningsexempel

Grundläggande API-integration

from api_client import FoundryAPIClient

# Initialize the API client
client = FoundryAPIClient()

# Simple completion
response = await client.complete(
    prompt="Explain quantum computing",
    model="phi-4-mini",
    max_tokens=500
)
print(response.content)

Strömmande integration

# Stream responses for real-time applications
async for chunk in client.stream_complete(
    prompt="Write a story about AI",
    model="phi-4-mini"
):
    print(chunk.content, end="", flush=True)

Hälsokontroll

# Check service health
health = await client.health_check()
print(f"Service Status: {health.status}")
print(f"Active Models: {health.loaded_models}")
print(f"Memory Usage: {health.memory_usage}")

Filstruktur

07/
├── README.md              # This documentation
├── requirements.txt       # Python dependencies
├── api_client.py         # Core API client implementation
├── health_monitor.py     # Health checking and monitoring
├── examples/
│   ├── basic_usage.py    # Simple API integration example
│   ├── streaming.py      # Streaming response example
│   ├── batch_processing.py # Batch processing example
│   └── production.py     # Production-ready implementation
└── tests/
    ├── test_api_client.py    # Unit tests for API client
    └── test_integration.py   # Integration tests

Microsoft Foundry Local Integration

Detta exempel följer Microsofts officiella mönster:

SDK-integration: Använder FoundryLocalManager för tjänstehantering
REST-endpoints: Direkta anrop till /v1/chat/completions och andra endpoints
Autentisering: Korrekt hantering av API-nycklar för lokala tjänster
Modellhantering: Kataloglistning, nedladdning och laddningsmönster
Felhantering: Microsoft-rekommenderade felkoder och svar

Komma igång

Installera beroenden
```
pip install -r requirements.txt
```
Kör grundläggande exempel
```
python examples/basic_usage.py
```
Testa strömning
```
python examples/streaming.py
```
Produktionsinställning
```
python examples/production.py
```

Konfiguration

Miljövariabler för anpassning:

FOUNDRY_MODEL: Standardmodell att använda (standard: "phi-4-mini")
FOUNDRY_TIMEOUT: Begäran timeout i sekunder (standard: 30)
FOUNDRY_RETRIES: Antal återförsöksförsök (standard: 3)
FOUNDRY_LOG_LEVEL: Loggnivå (standard: "INFO")

Bästa praxis

Anslutningshantering: Återanvänd HTTP-anslutningar för bättre prestanda
Felhantering: Implementera korrekt återförsökslogik med exponentiell backoff
Resursövervakning: Spåra modellens minnesanvändning och prestanda
Säkerhet: Använd korrekt autentisering även för lokala tjänster
Testning: Inkludera både enhets- och integrationstester

Felsökning

Vanliga problem

Tjänsten körs inte

# Check Foundry Local status
foundry status

# Start if needed
foundry start

Problem med modellens laddning

# List available models
foundry model list

# Download specific model
foundry model download phi-4-mini

Anslutningsfel

Kontrollera att Foundry Local körs på rätt port
Kontrollera brandväggsinställningar
Säkerställ korrekta autentiseringsheaders

Prestandaoptimering

Anslutningspoolning: Använd sessionsobjekt för flera begäranden
Asynkrona operationer: Utnyttja asyncio för samtidiga begäranden
Caching: Cacha modellsvar där det är lämpligt
Övervakning: Spåra svarstider och justera timeouts

Lärandemål

Efter att ha genomfört detta exempel kommer du att förstå:

Direkt REST API-integration med Foundry Local
Mönster för anpassad implementation av HTTP-klient
Produktionsklar felhantering och övervakning
Microsoft Foundry Local tjänstearkitektur
Prestandaoptimeringstekniker för lokala AI-tjänster

Nästa steg

Utforska Exempel 08: Windows 11 Chat-applikation
Testa Exempel 09: Multi-Agent Orchestration
Lär dig Exempel 10: Foundry Local som verktygsintegration

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Foundry Local som API-exempel

Översikt

Förutsättningar

Arkitektur

Nyckelfunktioner

1. Direkt HTTP-integration

2. Modellhantering

3. Produktionsmönster

4. Flexibel svarshantering

Användningsexempel

Grundläggande API-integration

Strömmande integration

Hälsokontroll

Filstruktur

Microsoft Foundry Local Integration

Komma igång

Konfiguration

Bästa praxis

Felsökning

Vanliga problem

Prestandaoptimering

Lärandemål

Nästa steg

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Foundry Local som API-exempel

Översikt

Förutsättningar

Arkitektur

Nyckelfunktioner

1. Direkt HTTP-integration

2. Modellhantering

3. Produktionsmönster

4. Flexibel svarshantering

Användningsexempel

Grundläggande API-integration

Strömmande integration

Hälsokontroll

Filstruktur

Microsoft Foundry Local Integration

Komma igång

Konfiguration

Bästa praxis

Felsökning

Vanliga problem

Prestandaoptimering

Lärandemål

Nästa steg