examples

RLLaVA Examples

Comprehensive examples for training and evaluating vision-language models with reinforcement learning.

Documentation

Training Guide - How to train models on various tasks
Evaluation Guide - How to evaluate trained models

Directory Structure

examples/
├── algorithms/       # RL algorithm scripts (GRPO, RLOO, DAPO, etc.)
├── tasks/            # Task-specific training scripts
├── eval/             # Evaluation scripts
├── format_prompt/    # Prompt templates
├── reward_function/  # Reward functions
└── config.yaml       # Base configuration

Name		Name	Last commit message	Last commit date
parent directory ..
algorithms		algorithms
eval		eval
format_prompt		format_prompt
reward_function		reward_function
tasks		tasks
tinyllava		tinyllava
README.md		README.md
config.yaml		config.yaml
config_grounding.yaml		config_grounding.yaml
config_lora.yaml		config_lora.yaml
eval.md		eval.md
train.md		train.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

RLLaVA Examples

Documentation

Directory Structure

FilesExpand file tree

examples

Directory actions

More options

Directory actions

More options

Latest commit

History

examples

Folders and files

parent directory

README.md

RLLaVA Examples

Documentation

Directory Structure