Library/vllm-turboquantForked

mitkox/vllm-turboquant

vllm-turboquant

vLLM 0.18.1rc1 with TurboQuant

View on GitHub↗Upstream mitkox/vllm-turboquant↗

Builder

mitkox

mitkox • individual

Stars

592

Using upstream star count

Forks

104

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Mar 25, 2026

Project creation date

README Summary

<p align="center"> <picture> <source media="(prefers-color-scheme: dark)" srcset="https://raw.githubusercontent.com/vllm-project/vllm/main/docs/assets/logos/vllm-logo-text-dark.png"> <img alt="vLLM" src="https://raw.githubusercontent.com/vllm-project/vllm/main/docs/assets/logos/vllm-logo-text-light.png" width=55%> </picture> </p>

Community Evaluation

Loading…

AI Dev Skills

Unmapped

Taxonomy

AI Trends

Model Quantization On-device AI Small Language Models Inference Optimization Efficient AI Model Compression Quantization-Aware Optimization

Recent Activity

Updated 2 months ago

7 Days

30 Days

90 Days

turboquant: correctness fixes, prefill fast path, and metadata improvements

mitkox • Mar 27, 2026

5fc73a3

Initial commit

mitkox • Mar 26, 2026

7a8a095

Quality

beta

Quality: medium
Maturity: beta

PM Skills

Cost & EfficiencyScale & ReliabilityProduct Discovery

Languages

Python100.0%

Timeline

Project created: Mar 25, 2026
Forked: Mar 28, 2026
Your last push: 2 months ago
Upstream last push: 1 months ago
Tracked since: Mar 27, 2026

Similar Repos

pgvector cosine similarity · $0

Loading…

Library/vllm-turboquantForked

mitkox/vllm-turboquant

vllm-turboquant

vLLM 0.18.1rc1 with TurboQuant

View on GitHub↗Upstream mitkox/vllm-turboquant↗

Builder

mitkox

mitkox • individual

Stars

592

Using upstream star count

Forks

104

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Mar 25, 2026

Project creation date

README Summary

Community Evaluation

Loading…

AI Dev Skills

Unmapped

Taxonomy

AI Trends

Model Quantization On-device AI Small Language Models Inference Optimization Efficient AI Model Compression Quantization-Aware Optimization

Recent Activity

Updated 2 months ago

7 Days

30 Days

90 Days

turboquant: correctness fixes, prefill fast path, and metadata improvements

mitkox • Mar 27, 2026

5fc73a3

Initial commit

mitkox • Mar 26, 2026

7a8a095

Quality

beta

Quality: medium
Maturity: beta

PM Skills

Cost & EfficiencyScale & ReliabilityProduct Discovery

Languages

Python100.0%

Timeline

Project created: Mar 25, 2026
Forked: Mar 28, 2026
Your last push: 2 months ago
Upstream last push: 1 months ago
Tracked since: Mar 27, 2026

Similar Repos

pgvector cosine similarity · $0

Loading…

vllm-turboquant

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos

vllm-turboquant

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos