LIBRISTO
LIBROAMANTO
kötelező
Legyen része a világ minden tájáról összegyűlt könyvbarátok közösségének és élvezze a rengeteg előnyt. Ingyenes regisztráció
0
Ingyenes szállítás a FoxPost futárszolgálattal, 19 990 Ft feletti vásárlás esetén
DPD futárszolgálat 1 190 Ft Posta 1 795 Ft PostaPont / Csomagautomata 1 690 Ft Postán 1 690 Ft GLS pont 1 390 Ft FoxPost 1 190 Ft Packeta 1 190 Ft DPD gyűjtőpont 990 Ft GLS futár 1 790 Ft

Ingyenes szállítás 19 990 Ft feletti rendelés esetén – Packeta, Fox Post Box és DPD csomagpont átvétellel

Quantized Model Deployment

INT8 and FP16 Compression for Mobile Acceleration

Nyelv AngolAngol
Könyv Puha kötésű
Könyv Quantized Model Deployment Clara Whiskers
Libristo kód: 52388434
Kiadó Independently published, május 2026
What if the only thing standing between your neural network and real-time mobile performance is the... Teljes leírás
? points 51 b Új Új
7 426 Ft
Beszállítói készleten Küldés 9-15 napon belül

30 nap a termék visszaküldésére

What if the only thing standing between your neural network and real-time mobile performance is the precision you refuse to give up?
Your model ran flawlessly in PyTorch-400MB of FP32 weights, a 350-watt GPU, and all the thermal headroom in the world. Then you deployed it to a phone. It stuttered. It heated up. The OS killed it before it produced a single inference. The market no longer asks whether AI can run on mobile. It asks why your AI is slower and less accurate than the cloud version. The answer is not your architecture. It is your precision.
This book is the field manual for engineers who refuse to accept the old compromise of smaller models and weaker accuracy. Inside, you will learn:
• Why INT8 and FP16 are not arbitrary format choices, but hardware-mandated keys to dedicated acceleration paths on Snapdragon, Apple Neural Engine, and MediaTek APU • How naïve post-training quantization can crater accuracy by double-digit percentages-and the calibration, range estimation, and outlier handling techniques that prevent it • The exact deployment architecture for TensorFlow Lite, Core ML, ONNX Runtime Mobile, and NNAPI, including operator fusion and numerical equivalence testing • Why quantization is the only optimization that simultaneously improves latency, accuracy, and power consumption-and how to combine it with pruning and knowledge distillation for wearables and IoT
Stop accepting the compromise between speed and accuracy. Build models that run cooler, faster, and sharper on the devices already in your users' pockets. The precision you can no longer afford is the precision you can finally reclaim.

Színésznő & Poliglott
EWA KASP részére
A videó lejátszása
Ewa Kasp
A Libristo rendelkezik az idegennyelvű könyvek legnagyobb kínálatával. Ezért vásárolom a könyveket itt.
Ajándékozza oda ezt a könyvet még ma
Nagyon egyszerű
1 Tegye a kosárba könyvet, és válassza ki a kiszállítás ajándékként opciót 2 Rögtön küldjük Önnek az utalványt 3 A könyv megérkezik a megajándékozott címére

Belépés

Bejelentkezés a saját fiókba. Még nincs Libristo fiókja? Hozza létre most!

 
kötelező
kötelező

Nincs fiókja? Szerezze meg a Libristo fiók kedvezményeit!

A Libristo fióknak köszönhetően mindent a felügyelete alatt tarthat.

Libristo fiók létrehozása