Library/ROLLForked

alibaba/ROLL

ROLL

An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models

View on GitHub↗Upstream alibaba/ROLL↗

Builder

alibaba

alibaba • individual

Stars

3,306

Using upstream star count

Forks

297

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

May 28, 2025

Project creation date

README Summary

Community Evaluation

Loading…

AI Dev Skills

Unmapped

Deep Reinforcement LearningDistributed ComputingGPU OptimizationLanguage Model Fine-tuningLarge Language Model TrainingModel ParallelismParallel ProcessingReinforcement LearningScalable ML Systems

Taxonomy

AI Trends

Large Language Models Reinforcement Learning from Human Feedback Scalable AI Training Distributed AI Systems

Recent Activity

Updated 3 months ago

7 Days

30 Days

90 Days

add reference to notable work

pUmpKin-Co • Mar 26, 2026

f509efc

Update config name in run_onpolicy_distill_pipeline.sh

JoeyChow • Mar 24, 2026

345edea

fix: disable reward normalization for SWE configs with group_size=1

shamanez • Mar 24, 2026

52e0978

Quality

research

Quality: medium
Maturity: research

PM Skills

Cost & EfficiencySafety & AlignmentScale & ReliabilityDeveloper PlatformAI-Native Architecture

Languages

Python100.0%

Timeline

Project created: May 28, 2025
Forked: Mar 29, 2026
Your last push: 3 months ago
Upstream last push: 2 months ago
Tracked since: Mar 29, 2026

Similar Repos

pgvector cosine similarity · $0

Loading…

Library/ROLLForked

alibaba/ROLL

ROLL

An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models

View on GitHub↗Upstream alibaba/ROLL↗

Builder

alibaba

alibaba • individual

Stars

3,306

Using upstream star count

Forks

297

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

May 28, 2025

Project creation date

README Summary

Community Evaluation

Loading…

AI Dev Skills

Unmapped

Deep Reinforcement LearningDistributed ComputingGPU OptimizationLanguage Model Fine-tuningLarge Language Model TrainingModel ParallelismParallel ProcessingReinforcement LearningScalable ML Systems

Taxonomy

AI Trends

Large Language Models Reinforcement Learning from Human Feedback Scalable AI Training Distributed AI Systems

Recent Activity

Updated 3 months ago

7 Days

30 Days

90 Days

add reference to notable work

pUmpKin-Co • Mar 26, 2026

f509efc

Update config name in run_onpolicy_distill_pipeline.sh

JoeyChow • Mar 24, 2026

345edea

fix: disable reward normalization for SWE configs with group_size=1

shamanez • Mar 24, 2026

52e0978

Quality

research

Quality: medium
Maturity: research

PM Skills

Cost & EfficiencySafety & AlignmentScale & ReliabilityDeveloper PlatformAI-Native Architecture

Languages

Python100.0%

Timeline

Project created: May 28, 2025
Forked: Mar 29, 2026
Your last push: 3 months ago
Upstream last push: 2 months ago
Tracked since: Mar 29, 2026

Similar Repos

pgvector cosine similarity · $0

Loading…

ROLL

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos

ROLL

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos