↓ Skip to main content

About Posts Categories

Mixed Precision

Extreme and Mixed-Precision Quantization: From FP8 to Binary Neural Networks

31 March 2026

AI Accelerator Quantization FP8 INT4 Binary Neural Networks BitNet QuIP AQLM HQQ Mixed Precision LLM Optimization Model Compression GGUF KV-Cache Vision Transformer Diffusion Models Inference Optimization

Quantization-Aware Training (QAT): A Comprehensive Deep Dive

31 March 2026

AI Accelerator Quantization QAT Model Compression STE LSQ PACT Binary Networks QLoRA Mixed Precision TensorRT Edge AI Inference Optimization

Categories
Tags

© 2026

Powered by Hugo & Blowfish

Categories

▶ Humanoid Robot
▶ Autonomous Driving
▶ Spiking Neural Network
▶ 3D Vision
▶ 2D Vision
▶ AI Accelerator
▶ LLM
▶ Artificial Intelligence
▶ Computer Science
▶ Circuits
▶ Quantum
▶ Math