microsoft
diff --git a/‎src/train/SeleKT/selekt.py‎
Lines changed: 5 additions & 3 deletions b/‎src/train/SeleKT/selekt.py‎
Lines changed: 5 additions & 3 deletions
diff --git a/‎src/train/sft/run.sh‎
Lines changed: 63 additions & 0 deletions b/‎src/train/sft/run.sh‎
Lines changed: 63 additions & 0 deletions
diff --git a/‎src/train/sft/sft.py‎
Lines changed: 7 additions & 4 deletions b/‎src/train/sft/sft.py‎
Lines changed: 7 additions & 4 deletions
@@ -300,8 +300,10 @@ def train(args):
         print(f'Resuming from checkpoint: {last_checkpoint}')
 
 
-    # response_template = "#RESPONSE\n"
-    # collator = DataCollatorForCompletionOnlyLM(response_template=response_template, tokenizer=tokenizer)
+    collator = None
+    if args.is_conversational_training:
+      response_template = "#RESPONSE\n"
+      collator = DataCollatorForCompletionOnlyLM(response_template=response_template, tokenizer=tokenizer)
 
     callback = Callback(base_model_path=args.base_model_path, flush_steps=1, alpha=args.alpha)
     trainer = SFTTrainer(
@@ -310,7 +312,7 @@ def train(args):
         train_dataset=dataset,
         args=training_config,
         callbacks=[callback],
-        # data_collator=collator,
+        data_collator=collator,
     )
     callback.set_trainer(trainer)
     print(f"Starting training for epoch {args.num_train_epochs}")
 
@@ -0,0 +1,63 @@
+#!/bin/bash
+
+
+export MODEL_NAME=""
+export DESC=""
+
+OUTPUT_DIR=""
+TRAIN_DATA=""
+MODEL_PATH=""
+
+mkdir -p $OUTPUT_DIR
+
+accelerate launch \
+      --config_file=../configs/general_acc.yaml \
+      sft.py \
+      --model_name_or_path "$MODEL_PATH" \
+      --train_data_path "$TRAIN_DATA" \
+      --output_dir ${OUTPUT_DIR} \
+      --num_train_epochs 3 \
+      --model_max_length 16384 \
+      --per_device_train_batch_size 1 \
+      --gradient_accumulation_steps 4 \
+      --save_strategy "epoch" \
+      --save_steps 760 \
+      --save_total_limit 25 \
+      --learning_rate 1e-5 \
+      --warmup_ratio 0.1 \
+      --weight_decay 0.1 \
+      --logging_steps 5 \
+      --lr_scheduler_type "cosine" \
+      --report_to "wandb" \
+      --gradient_checkpointing True \
+      --deepspeed ../configs/ds_config.json \
+      --bf16 True \
+      --run_name "" \
+
+
+
+accelerate launch \
+      --config_file=../configs/general_acc.yaml \
+      sft.py \
+      --model_name_or_path "${MODEL_PATH}" \
+      --train_data_path "$TRAIN_DATA" \
+      --output_dir ${OUTPUT_DIR} \
+      --num_train_epochs 3 \
+      --model_max_length 16384 \
+      --per_device_train_batch_size 1 \
+      --gradient_accumulation_steps 4 \
+      --save_strategy "epoch" \
+      --save_steps 760 \
+      --save_total_limit 25 \
+      --learning_rate 1e-5 \
+      --warmup_ratio 0.1 \
+      --weight_decay 0.1 \
+      --logging_steps 5 \
+      --lr_scheduler_type "cosine" \
+      --report_to "wandb" \
+      --gradient_checkpointing True \
+      --deepspeed ../configs/ds_config.json \
+      --bf16 True \
+      --run_name "" \
+      --is_conversational_training \
+
@@ -65,6 +65,8 @@ def parse_args():
     parser.add_argument("--debug", type=bool, default=False)
     parser.add_argument("--packing", type=bool, default=True,
                       help="Whether to use packing for training")
+    parser.add_argument("--is_conversational_training", type=bool, action='store_true',
+                      help="Whether to use conversational training format")
 
     args, _ = parser.parse_known_args()
     return args
@@ -108,7 +110,6 @@ def __init__(self, flush_steps=None):
         self.flush_steps = flush_steps
 
     def on_step_end(self, args, state, control, model, processing_class , **kwargs):
-        # import sys; sys.exit(0)
         if state.global_step % self.flush_steps == 0:
             get_accelerator().empty_cache()
             if dist.is_initialized():
@@ -172,8 +173,10 @@ def main():
     if last_checkpoint:
         print(f'Resuming from checkpoint: {last_checkpoint}')
 
-    # response_template = "#RESPONSE\n"
-    # collator = DataCollatorForCompletionOnlyLM(response_template=response_template, tokenizer=tokenizer)
+    collator = None
+    if args.is_conversational_training:
+      response_template = "#RESPONSE\n"
+      collator = DataCollatorForCompletionOnlyLM(response_template=response_template, tokenizer=tokenizer)
 
     # Initialize trainer
     trainer = SFTTrainer(
@@ -182,7 +185,7 @@ def main():
         train_dataset=dataset,
         args=training_config,
         callbacks=[Callback(flush_steps=1)],
-        # data_collator=collator,
+        data_collator=collator,
     )
 
     # Start training