↓ Skip to main content

About Posts Categories

Edge Deployment

Advanced Pruning Methods for Deep Neural Networks

31 March 2026

AI Accelerator Pruning Deep-Learning Model Compression Sparsity Movement Pruning SNIP GraSP SynFlow Lottery Ticket Knowledge Distillation Gradient Pruning Structured Pruning Neural Architecture Inference Optimization Edge Deployment

Post-Training Quantization (PTQ): A Comprehensive Deep Dive

31 March 2026

AI Accelerator Quantization PTQ Model Compression Inference Optimization TensorRT GPTQ SmoothQuant AWQ LLM Edge Deployment

Quantization Fundamentals for Deep Learning

31 March 2026

AI Accelerator Quantization Deep-Learning Model Compression Inference Optimization INT8 FP8 Edge Deployment Tensor Cores Calibration Number Representation

Categories
Tags

© 2026

Powered by Hugo & Blowfish

Categories

▶ Humanoid Robot
▶ Autonomous Driving
▶ Spiking Neural Network
▶ 3D Vision
▶ 2D Vision
▶ AI Accelerator
▶ LLM
▶ Artificial Intelligence
▶ Computer Science
▶ Circuits
▶ Quantum
▶ Math