Skip to content

Latest commit

 

History

History
171 lines (121 loc) · 12.8 KB

File metadata and controls

171 lines (121 loc) · 12.8 KB

Kapitola 07: EdgeAI Príklady

Edge AI predstavuje spojenie umelej inteligencie s edge computingom, umožňujúce inteligentné spracovanie priamo na zariadeniach bez závislosti na cloudovej konektivite. Táto kapitola skúma päť rôznych implementácií EdgeAI na rôznych platformách a frameworkoch, ktoré ukazujú všestrannosť a silu spúšťania AI modelov na okraji.

1. EdgeAI na NVIDIA Jetson Orin Nano

NVIDIA Jetson Orin Nano predstavuje prelom v dostupnom edge AI výpočtovom prostredí, poskytujúc až 67 TOPS výkonu AI v kompaktnom formáte veľkosti kreditnej karty. Táto výkonná edge AI platforma demokratizuje vývoj generatívnej AI pre nadšencov, študentov a profesionálnych vývojárov.

Hlavné vlastnosti

  • Poskytuje až 67 TOPS výkonu AI—zlepšenie o 1,7X oproti predchodcovi
  • 1024 CUDA jadier a až 32 Tensor jadier pre AI spracovanie
  • 6-jadrový Arm Cortex-A78AE v8.2 64-bitový CPU s maximálnou frekvenciou 1,5 GHz
  • Cena len $249, čo poskytuje vývojárom, študentom a tvorcom najdostupnejšiu platformu

Aplikácie

Jetson Orin Nano vyniká pri spúšťaní moderných generatívnych AI modelov vrátane vision transformers, veľkých jazykových modelov a vision-language modelov. Je špeciálne navrhnutý pre GenAI prípady použitia a teraz môžete spustiť niekoľko LLM na zariadení veľkosti dlane. Populárne prípady použitia zahŕňajú AI-poháňanú robotiku, inteligentné drony, inteligentné kamery a autonómne edge zariadenia.

Viac informácií: NVIDIA's Jetson Orin Nano SuperComputer: The Next Big Thing in EdgeAI

2. EdgeAI v mobilných aplikáciách s .NET MAUI a ONNX Runtime GenAI

Toto riešenie demonštruje, ako integrovať Generatívnu AI a Veľké Jazykové Modely (LLMs) do multiplatformových mobilných aplikácií pomocou .NET MAUI (Multi-platform App UI) a ONNX Runtime GenAI. Tento prístup umožňuje .NET vývojárom vytvárať sofistikované AI-poháňané mobilné aplikácie, ktoré bežia natívne na Android a iOS zariadeniach.

Hlavné vlastnosti

  • Postavené na frameworku .NET MAUI, poskytujúcom jednotný kódový základ pre Android a iOS aplikácie
  • Integrácia ONNX Runtime GenAI umožňuje spúšťanie generatívnych AI modelov priamo na mobilných zariadeniach
  • Podpora rôznych hardvérových akcelerátorov prispôsobených pre mobilné zariadenia, vrátane CPU, GPU a špecializovaných mobilných AI procesorov
  • Platformovo špecifické optimalizácie ako CoreML pre iOS a NNAPI pre Android cez ONNX Runtime
  • Implementuje kompletný generatívny AI cyklus vrátane predspracovania, inferencie, spracovania logits, vyhľadávania a vzorkovania, a správy KV cache

Výhody vývoja

Prístup .NET MAUI umožňuje vývojárom využiť ich existujúce C# a .NET zručnosti pri vytváraní multiplatformových AI aplikácií. Framework ONNX Runtime GenAI podporuje rôzne modelové architektúry vrátane Llama, Mistral, Phi, Gemma a mnohých ďalších. Optimalizované ARM64 jadrá urýchľujú INT4 kvantizované násobenie matíc, čím zabezpečujú efektívny výkon na mobilnom hardvéri pri zachovaní známeho .NET vývojového prostredia.

Prípady použitia

Toto riešenie je ideálne pre vývojárov, ktorí chcú vytvárať AI-poháňané mobilné aplikácie pomocou .NET technológií, vrátane inteligentných chatbotov, aplikácií na rozpoznávanie obrázkov, nástrojov na preklad jazykov a personalizovaných odporúčacích systémov, ktoré bežia úplne na zariadení pre zvýšenú ochranu súkromia a offline schopnosti.

Viac informácií: .NET MAUI ONNX Runtime GenAI Example

3. EdgeAI v Azure s Small Language Models Engine

Azure EdgeAI riešenie od Microsoftu sa zameriava na efektívne nasadenie Malých Jazykových Modelov (SLMs) v hybridných prostrediach cloud-edge. Tento prístup prekonáva medzeru medzi cloudovými AI službami a požiadavkami na edge nasadenie.

Výhody architektúry

  • Bezproblémová integrácia s Azure AI službami
  • Spúšťanie SLMs/LLMs a multimodálnych modelov na zariadení aj v cloude pomocou ONNX Runtime
  • Optimalizované pre nasadenie v podnikovej škále
  • Podpora kontinuálnych aktualizácií a správy modelov

Prípady použitia

Implementácia Azure EdgeAI vyniká v scenároch vyžadujúcich AI nasadenie na podnikovej úrovni s cloudovými schopnosťami správy. To zahŕňa inteligentné spracovanie dokumentov, analýzu v reálnom čase a hybridné AI pracovné postupy, ktoré využívajú cloud aj edge výpočtové zdroje.

Viac informácií: Azure EdgeAI SLM Engine

Windows ML predstavuje najmodernejší runtime od Microsoftu optimalizovaný pre výkonné inferencie modelov na zariadení a zjednodušené nasadenie, slúžiaci ako základ Windows AI Foundry. Táto platforma umožňuje vývojárom vytvárať AI-poháňané Windows aplikácie, ktoré využívajú celý rozsah PC hardvéru.

Schopnosti platformy

  • Funguje na všetkých Windows 11 PC s verziou 24H2 (build 26100) alebo vyššou
  • Funguje na všetkom x64 a ARM64 PC hardvéri, dokonca aj na PC bez NPU alebo GPU
  • Umožňuje vývojárom priniesť vlastné modely a efektívne ich nasadiť naprieč ekosystémom silikónových partnerov vrátane AMD, Intel, NVIDIA a Qualcomm, pokrývajúc CPU, GPU, NPU
  • Vďaka infraštruktúrnym API už vývojári nemusia vytvárať viacero verzií svojej aplikácie na zacielenie rôznych silikónov

Výhody pre vývojárov

Windows ML abstrahuje hardvér a poskytovateľov vykonávania, takže sa môžete sústrediť na písanie svojho kódu. Navyše, Windows ML sa automaticky aktualizuje na podporu najnovších NPU, GPU a CPU, keď sú vydané. Platforma poskytuje jednotný rámec pre AI vývoj naprieč rôznorodým Windows hardvérovým ekosystémom.

Viac informácií:

Foundry Local umožňuje vývojárom na Windows a Mac vytvárať aplikácie na Retrieval Augmented Generation (RAG) pomocou lokálnych zdrojov v .NET, kombinujúc lokálne jazykové modely so schopnosťami semantického vyhľadávania. Tento prístup poskytuje AI riešenia zamerané na ochranu súkromia, ktoré fungujú výlučne na lokálnej infraštruktúre.

Technická architektúra

  • Kombinuje jazykový model Phi, Lokálne Embeddingy a Semantické Jadro na vytvorenie RAG scenára
  • Používa embeddingy ako vektory (polia) hodnôt s pohyblivou desatinnou čiarkou, ktoré reprezentujú obsah a jeho semantický význam
  • Semantické Jadro funguje ako hlavný orchestrátor, integrujúci Phi a Inteligentné Komponenty na vytvorenie plynulého RAG pipeline
  • Podpora lokálnych vektorových databáz vrátane SQLite a Qdrant

Výhody implementácie

RAG, alebo Retrieval Augmented Generation, je len sofistikovaný spôsob, ako povedať „vyhľadajte nejaké informácie a vložte ich do promptu“. Táto lokálna implementácia zabezpečuje ochranu údajov pri poskytovaní inteligentných odpovedí založených na vlastných znalostných databázach. Prístup je obzvlášť cenný pre podnikové scenáre vyžadujúce suverenitu údajov a offline schopnosti.

Viac informácií:

Windows Foundry Local

Microsoft Foundry Local poskytuje OpenAI‑kompatibilný REST server poháňaný ONNX Runtime na spúšťanie modelov lokálne na Windows. Nižšie je rýchly, overený súhrn; pozrite si oficiálnu dokumentáciu pre úplné detaily.

Inštalácia alebo aktualizácia na Windows (cmd.exe):

winget install Microsoft.FoundryLocal
winget upgrade --id Microsoft.FoundryLocal
foundry --version

Preskúmajte kategórie CLI:

foundry model --help
foundry service --help
foundry cache --help

Spustite model a objavte dynamický endpoint:

foundry model run gpt-oss-20b
foundry service status

Rýchla REST kontrola na zoznam modelov (nahraďte PORT zo statusu):

curl -s http://localhost:PORT/v1/models

Tipy:

Windows EdgeAI Vývojárske Zdroje

Pre vývojárov špecificky zameraných na Windows platformu sme vytvorili komplexnú príručku, ktorá pokrýva celý Windows EdgeAI ekosystém. Tento zdroj poskytuje podrobné informácie o Windows AI Foundry, vrátane API, nástrojov a najlepších praktík pre EdgeAI vývoj na Windows.

Windows AI Foundry Platforma

Windows AI Foundry platforma poskytuje komplexný súbor nástrojov a API špeciálne navrhnutých pre Edge AI vývoj na Windows zariadeniach. To zahŕňa špecializovanú podporu pre NPU-akcelerovaný hardvér, integráciu Windows ML a techniky optimalizácie špecifické pre platformu.

Komplexná príručka: Windows EdgeAI Vývojárska Príručka

Táto príručka pokrýva:

  • Prehľad a komponenty Windows AI Foundry platformy
  • Phi Silica API pre efektívnu inferenciu na NPU hardvéri
  • API pre počítačové videnie na spracovanie obrázkov a OCR
  • Integráciu a optimalizáciu Windows ML runtime
  • Foundry Local CLI pre lokálny vývoj a testovanie
  • Stratégie optimalizácie hardvéru pre Windows zariadenia
  • Praktické príklady implementácie a najlepšie praktiky

Pre vývojárov používajúcich Visual Studio Code poskytuje rozšírenie AI Toolkit komplexné vývojové prostredie špeciálne navrhnuté na vytváranie, testovanie a nasadzovanie Edge AI aplikácií. Tento toolkit zjednodušuje celý Edge AI vývojový pracovný tok v rámci VS Code.

Vývojárska príručka: AI Toolkit pre Edge AI Vývoj

Príručka AI Toolkit pokrýva:

  • Objavovanie a výber modelov pre edge nasadenie
  • Lokálne testovanie a optimalizačné pracovné toky
  • Integráciu ONNX a Ollama pre edge modely
  • Techniky konverzie a kvantizácie modelov
  • Vývoj agentov pre edge scenáre
  • Hodnotenie výkonu a monitorovanie
  • Prípravu na nasadenie a najlepšie praktiky

Záver

Týchto päť implementácií EdgeAI demonštruje vyspelosť a rozmanitosť edge AI riešení dostupných dnes. Od hardvérovo akcelerovaných edge zariadení ako Jetson Orin Nano po softvérové frameworky ako ONNX Runtime GenAI a Windows ML, vývojári majú bezprecedentné možnosti na nasadenie inteligentných aplikácií na okraji.

Spoločným prvkom všetkých týchto platforiem je demokratizácia AI schopností, ktorá robí sofistikované strojové učenie dostupným pre vývojárov na rôznych úrovniach zručností a prípadov použitia. Či už ide o tvorbu mobilných aplikácií, desktopového softvéru alebo embedded systémov, tieto EdgeAI riešenia poskytujú základ pre ďalšiu generáciu inteligentných aplikácií, ktoré fungujú efektívne a súkromne na okraji.

Každá platforma ponúka jedinečné výhody: Jetson Orin Nano pre hardvérovo akcelerované edge výpočty, ONNX Runtime GenAI pre multiplatformový mobilný vývoj, Azure EdgeAI pre podnikové cloud-edge integrácie, Windows ML pre Windows-natívne aplikácie a Foundry Local pre implementácie RAG zamerané na ochranu súkromia. Spoločne predstavujú komplexný ekosystém pre EdgeAI vývoj.

Ďalší AI Toolkit


Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.