rbao2018

Follow

BaoRong rbao2018

Follow

8 followers · 19 following

Shanghai,China

Achievements

Achievements

Pinned Loading

self_ref_feedback self_ref_feedback Public

Code for Improving Large Language Model Alignment from Self-Reference Model Feedback

Python 7
slime slime Public

Forked from THUDM/slime

slime is a LLM post-training framework aiming at scaling RL.

Python
sgl-project/sglang sgl-project/sglang Public

SGLang is a fast serving framework for large language models and vision language models.

Python 19.5k 3.2k
volcengine/verl volcengine/verl Public

verl: Volcano Engine Reinforcement Learning for LLMs

Python 15k 2.4k
QCT QCT Public

Quantitative Strategy Trading in Cryptocurrencies

Python