conftrace_

model compression

3283 papers

Explore in graph

Also known as

MC

Co-occurring keywords

knowledge distillation (3680) large language model (12755) neural network (6616) efficient computing (779) neural network optimization (1293) transfer learning (5442) convolutional neural network (4216) neural network pruning (265) language model (4573) parameter efficiency (415)

Papers

DiTFastAttnV2: Head-wise Attention Compression for Multi-Modality Diffusion Transformers ICCV 2025

Variance-Based Pruning for Accelerating and Compressing Trained Networks ICCV 2025

Memory-Efficient Generative Models via Product Quantization ICCV 2025

A Good Teacher Adapts Their Knowledge for Distillation ICCV 2025

Inheriting Generalized Learngene for Efficient Knowledge Transfer across Multiple Tasks AAAI 2025

Adaptive Computation Modules: Granular Conditional Computation for Efficient Inference AAAI 2025

AtomNet: Designing Tiny Models from Operators Under Extreme MCU Constraints AAAI 2025

MLWQ: Efficient Small Language Model Deployment via Multi-Level Weight Quantization EMNLP 2025

Quantum-Infused Whisper: A Framework for Replacing Classical Components IJCNLP 2025

PPC-GPT: Federated Task-Specific Compression of Large Language Models via Pruning and Chain-of-Thought Distillation EMNLP 2025

Heuristic-free Knowledge Distillation for Streaming ASR via Multi-modal Training AAAI 2025

MOBIUS: Big-to-Mobile Universal Instance Segmentation via Multi-modal Bottleneck Fusion and Calibrated Decoder Pruning ICCV 2025

ShortV: Efficient Multimodal Large Language Models by Freezing Visual Tokens in Ineffective Layers ICCV 2025

AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations COLING 2025

Dense2MoE: Restructuring Diffusion Transformer to MoE for Efficient Text-to-Image Generation ICCV 2025

Sweeping Heterogeneity with Smart MoPs: Mixture of Prompts for LLM Task Adaptation AAAI 2025

RED-CT: A Systems Design Methodology for Using LLM-labeled Data to Train and Deploy Edge Linguistic Classifiers COLING 2025

General Compression Framework for Efficient Transformer Object Tracking ICCV 2025

EffiVLM-BENCH: A Comprehensive Benchmark for Evaluating Training-Free Acceleration in Large Vision-Language Models ACL 2025

Resource-Efficient Anonymization of Textual Data via Knowledge Distillation from Large Language Models COLING 2025

AIQViT: Architecture-Informed Post-Training Quantization for Vision Transformers AAAI 2025

“Give Me BF16 or Give Me Death”? Accuracy-Performance Trade-Offs in LLM Quantization ACL 2025

MaCP: Minimal yet Mighty Adaptation via Hierarchical Cosine Projection ACL 2025

Large Language Models Are Overparameterized Text Encoders NAACL 2025

Assigning Distinct Roles to Quantized and Low-Rank Matrices Toward Optimal Weight Decomposition ACL 2025