LIBRISTO
LIBROAMANTO
kötelező
Legyen része a világ minden tájáról összegyűlt könyvbarátok közösségének és élvezze a rengeteg előnyt. Ingyenes regisztráció
0
Ingyenes szállítás a FoxPost futárszolgálattal, 19 990 Ft feletti vásárlás esetén
DPD gyűjtőpont 990 Ft DPD futárszolgálat 1 190 Ft GLS pont 1 190 Ft Magyar Posta 1 795 Ft PostaPont / Csomagautomata 1 690 Ft Magyar Posta 1 690 Ft FoxPost 1 190 Ft Packeta 1 190 Ft GLS futár 1 690 Ft

Ingyenes szállítás 19 990 Ft feletti rendelés esetén – Packeta, Fox Post Box és DPD csomagpont átvétellel

Multimodal AI Systems Engineering

Building Production Vision-Language Models, Document AI, and Cross-Modal Retrieval Pipelines

Nyelv AngolAngol
Könyv Puha kötésű
Könyv Multimodal AI Systems Engineering ChatVariety Team
Libristo kód: 52841685
Kiadó Independently published, június 2026
Master the Production Lifecycle of Vision-Language ModelsThe gap between a simple VLM demo and a hig... Teljes leírás
? points 27 b Új Új
4 013 Ft
Várható készletfeltöltés Küldés 14. 06. 2026

Akár 30 napos visszaküldési lehetőség

Master the Production Lifecycle of Vision-Language Models

The gap between a simple VLM demo and a highly reliable, cost-effective production system is enormous. Multimodal AI Systems Engineering bridges this gap, providing ML engineers, AI platform architects, and computer vision specialists with the definitive blueprint for deploying multimodal AI at enterprise scale.

This comprehensive, hands-on guide skips the high-level hype and dives straight into the concrete architectures, optimization pipelines, and serving infrastructure required to run models like LLaVA, SigLIP, and Qwen-VL in production environments.

What you will master inside this book:
  • Core Architectures: Deep dive into CLIP, ViT, SigLIP, and modern vision-language models (VLMs).
  • Multimodal RAG Pipelines: Design cross-modal embedding spaces, joint vector stores, and advanced retrieval pipelines.
  • Inference Optimization: Implement quantization, ONNX, TensorRT, and continuous batching to slash latency and costs.
  • Document AI & Vision: Build robust extraction pipelines for OCR, layout detection, form processing, and temporal video modeling.
  • Fine-Tuning & Serving: Scale training with LoRA, QLoRA, and DPO, and serve models with NVIDIA Triton Server.
  • Enterprise Evaluation: Rigorously evaluate and monitor VLMs using standardized benchmarks and automated CI/CD evaluation loops.

Whether you are building next-generation Document AI pipelines, complex cross-modal search engines, or deploying fine-tuned VLMs onto edge devices, this book delivers the battle-tested engineering patterns you need to succeed in the real world.

Színésznő & Poliglott
EWA KASP részére
A videó lejátszása
Ewa Kasp
A Libristo rendelkezik az idegennyelvű könyvek legnagyobb kínálatával. Ezért vásárolom a könyveket itt.
Ajándékozza oda ezt a könyvet még ma
Nagyon egyszerű
1 Tegye a kosárba könyvet, és válassza ki a kiszállítás ajándékként opciót 2 Rögtön küldjük Önnek az utalványt 3 A könyv megérkezik a megajándékozott címére

Belépés

Bejelentkezés a saját fiókba. Még nincs Libristo fiókja? Hozza létre most!

 
kötelező
kötelező

Nincs fiókja? Szerezze meg a Libristo fiók kedvezményeit!

A Libristo fióknak köszönhetően mindent a felügyelete alatt tarthat.

Libristo fiók létrehozása
Libroamiko könyvtanácsadó
Szia, Libroamiko vagyok, segíthetek?