tardis-key

Follow

🎯

Focusing

Xiaobo Hu tardis-key

🎯

Focusing

Follow

17 followers · 34 following

Zhejiang University -> Huawei
Hangzhou,China

Achievements

Achievements

Pinned Loading

ROLL ROLL Public

Forked from alibaba/ROLL

An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models

Python
siiRL siiRL Public

Forked from sii-research/siiRL

siiRL: Shanghai Inovation Institute RL Framework for LLM Post-Training

Python
verl verl Public

Forked from verl-project/verl

verl: Volcano Engine Reinforcement Learning for LLMs

Python 2
rl-insight rl-insight Public

Forked from verl-project/rl-insight

Provide performance insight capabilities for RL frameworks.

Python
verl-project/rl-insight verl-project/rl-insight Public

Provide performance insight capabilities for RL frameworks.

Python 36 27