Library/AutoAWQForked

casper-hansen/AutoAWQ

AutoAWQ

AutoAWQ implements the AWQ algorithm for 4-bit quantization with a 2x speedup during inference. Documentation:

View on GitHub↗Upstream casper-hansen/AutoAWQ↗

Builder

casper-hansen

casper-hansen • individual

Stars

2,351

Using upstream star count

Forks

304

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Aug 25, 2023

Project creation date

README Summary

It is no secret that maintaining a project such as AutoAWQ that has 2+ million downloads, 7000+ models on Huggingface, and 2.1k stars is hard for a solo developer who is doing this in their free time.

Community Evaluation

Loading…

AI Dev Skills

Unmapped

Hardware-Aware OptimizationInference AccelerationLarge Language Model DeploymentMemory OptimizationModel CompressionModel QuantizationNeural Network OptimizationTransformer Architecture

Taxonomy

AI Trends

Model Efficiency On-device AI Green AI Democratized AI Access Edge Computing

Recent Activity

Updated 1 years ago

7 Days

30 Days

90 Days

Quality

production

Quality: high
Maturity: production

PM Skills

Cost & EfficiencyData & Evaluation

Languages

Python100.0%

Timeline

Project created: Aug 25, 2023
Forked: Mar 22, 2026
Your last push: 1 years ago
Upstream last push: 1 years ago
Tracked since: May 11, 2025

Similar Repos

pgvector cosine similarity · $0

Loading…

Library/AutoAWQForked

casper-hansen/AutoAWQ

AutoAWQ

AutoAWQ implements the AWQ algorithm for 4-bit quantization with a 2x speedup during inference. Documentation:

View on GitHub↗Upstream casper-hansen/AutoAWQ↗

Builder

casper-hansen

casper-hansen • individual

Stars

2,351

Using upstream star count

Forks

304

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Aug 25, 2023

Project creation date

README Summary

Community Evaluation

Loading…

AI Dev Skills

Unmapped

Hardware-Aware OptimizationInference AccelerationLarge Language Model DeploymentMemory OptimizationModel CompressionModel QuantizationNeural Network OptimizationTransformer Architecture

Taxonomy

AI Trends

Model Efficiency On-device AI Green AI Democratized AI Access Edge Computing

Recent Activity

Updated 1 years ago

7 Days

30 Days

90 Days

Quality

production

Quality: high
Maturity: production

PM Skills

Cost & EfficiencyData & Evaluation

Languages

Python100.0%

Timeline

Project created: Aug 25, 2023
Forked: Mar 22, 2026
Your last push: 1 years ago
Upstream last push: 1 years ago
Tracked since: May 11, 2025

Similar Repos

pgvector cosine similarity · $0

Loading…

AutoAWQ

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos

AutoAWQ

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos