Library/megablocksForked

databricks/megablocks

megablocks

MegaBlocks is a light-weight library for mixture-of-experts (MoE) training. The core of the system is efficient "dropless-MoE" ([dMoE](megablocks/laye

View on GitHub↗Upstream databricks/megablocks↗

Builder

databricks

databricks • individual

Stars

1,566

Using upstream star count

Forks

228

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Jan 26, 2023

Project creation date

README Summary

MegaBlocks is a light-weight library for mixture-of-experts (MoE) training. The core of the system is efficient "dropless-MoE" ([dMoE](megablocks/layers/dmoe.py), [paper](https://arxiv.org/abs/2211.15841)) and standard [MoE](megablocks/layers/moe.py) layers.

Community Evaluation

Loading…

AI Dev Skills

Unmapped

CUDA Kernel OptimizationDistributed TrainingGPU ComputingLarge Language Model TrainingMemory OptimizationMixture of Experts ArchitectureSparse Neural NetworksTransformer Architecture

Recent Activity

Updated 11 months ago

7 Days

30 Days

90 Days

Quality

beta

Quality: high
Maturity: beta

PM Skills

Cost & EfficiencyScale & Reliability

Languages

Python100.0%

Timeline

Project created: Jan 26, 2023
Forked: Mar 16, 2026
Your last push: 11 months ago
Upstream last push: 2 months ago
Tracked since: Jun 26, 2025

Similar Repos

pgvector cosine similarity · $0

Loading…

Library/megablocksForked

databricks/megablocks

megablocks

MegaBlocks is a light-weight library for mixture-of-experts (MoE) training. The core of the system is efficient "dropless-MoE" ([dMoE](megablocks/laye

View on GitHub↗Upstream databricks/megablocks↗

Builder

databricks

databricks • individual

Stars

1,566

Using upstream star count

Forks

228

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Jan 26, 2023

Project creation date

README Summary

Community Evaluation

Loading…

AI Dev Skills

Unmapped

CUDA Kernel OptimizationDistributed TrainingGPU ComputingLarge Language Model TrainingMemory OptimizationMixture of Experts ArchitectureSparse Neural NetworksTransformer Architecture

Recent Activity

Updated 11 months ago

7 Days

30 Days

90 Days

Quality

beta

Quality: high
Maturity: beta

PM Skills

Cost & EfficiencyScale & Reliability

Languages

Python100.0%

Timeline

Project created: Jan 26, 2023
Forked: Mar 16, 2026
Your last push: 11 months ago
Upstream last push: 2 months ago
Tracked since: Jun 26, 2025

Similar Repos

pgvector cosine similarity · $0

Loading…

megablocks

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos

megablocks

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos