Multi-Marginal Schrödinger Bridge (Multi-Marginal-SB)

Overview

This repository implements the Multi-Marginal Schrödinger Bridge (Multi-Marginal-SB) framework for generative modeling tasks, such as face editing, image translation (e.g., face-to-dog), and Brownian bridge generation. The project leverages models like ALAE and StyleGAN2 for latent space manipulations and is inspired by advancements in optimal transport and diffusion processes.

For detailed technical explanations, model architectures, and experimental results, refer to the ICLR Submission Document.

Features

Multi-Marginal SB Training: Train models for multi-distribution bridging.
Face Editing: Edit faces based on text prompts.
Image Translation: Translate between domains like faces and dogs.
Brownian Bridge Generation: Generate interpolations and animations.
Pre-trained Checkpoints: Available for quick inference.

Installation

Prerequisites

Python 3.10+
PyTorch 1.10+
Additional dependencies: numpy, matplotlib, torchvision, pillow, tqdm

Setup

Clone the repository:

git clone https://github.com/yourusername/Multi-Marginal-SB.git
cd Multi-Marginal-SB

Install dependencies:
```
pip install -r requirements.txt
```
(Note: Create a requirements.txt file with the listed dependencies if not present.)
Download pre-trained checkpoints from Google Drive. Extract and place them in the appropriate directories (e.g., checkpoints/).

Usage

Key Scripts

Below is a list of main scripts and their purposes. For full details on each script's functionality, parameters, and outputs, refer to the ICLR Submission Document.

train_unpaired_ALAE.py: Trains an unpaired LightSB model for latent space encoding.
encode_dogs_with_stylegan2.py: Encodes dog images into StyleGAN2 latent space using projection.
train_face2dog.py: Trains a LightSB model for face-to-dog translation.
train_face_editing_sb.py: Trains MultiMarginalSB for face editing tasks using text prompts.
train_text2face_paired.py: Trains a paired model for text-to-face generation.
train_dog2face.py: Trains a model for dog-to-face translation.
train_mapper_only.py: Trains a mapper network independently.
train_multi_marginal.py: Trains the core multi-marginal Schrödinger Bridge model.
latent_bridge_adult2children.py: Generates latent bridges from adult to children faces.
generate_gif_brownian_bridge.py: Generates GIF animations of Brownian bridges.
generate_lambda_sweep_demo.py: Demonstrates lambda parameter sweeps for generation.
generate_prompt_brownian_bridge.py: Generates Brownian bridges based on prompts.
encode_captions.py: Encodes text captions into latent representations.
face_edit.py: Performs face editing inference using trained models.
generate_from_noise.py: Generates images from noise inputs.
generate_from_text.py: Generates images from text descriptions.
display_dog2face.py: Displays dog-to-face translation results.
distributions.py: Utility for handling data distributions.

Example Commands

Train face editing model:
```
python train_face_editing_sb.py
```

Generate from text:

python generate_from_text.py --prompt "a smiling face"

For custom parameters, refer to each script's configuration section.

Checkpoints

Download pre-trained models and checkpoints from this Google Drive folder. Files include:

ALAE.zip: ALAE model checkpoints.
checkpoint.zip: Various training checkpoints.
clip-vit-base-patch16.zip: CLIP model for text encoding.
data.zip: Encoded Image and caption latent.

Extract and place them in the project folder.

Contributing

Contributions are welcome! Please open an issue or submit a pull request for bug fixes, features, or improvements.

License

This project is licensed under the MIT License - see the LICENSE file for details.

Acknowledgments

Based on ALAE and StyleGAN2 implementations.
Inspired by Schrödinger Bridge and optimal transport literature.

For questions, contact [[email protected]].

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multi-Marginal Schrödinger Bridge (Multi-Marginal-SB)

Overview

Features

Installation

Prerequisites

Setup

Usage

Key Scripts

Example Commands

Checkpoints

Contributing

License

Acknowledgments

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
src		src
README.md		README.md
display_dog2face.py		display_dog2face.py
distributions.py		distributions.py
encode_captions.py		encode_captions.py
encode_dogs_with_stylegan2.py		encode_dogs_with_stylegan2.py
face_edit.py		face_edit.py
generate_from_noise.py		generate_from_noise.py
generate_from_text.py		generate_from_text.py
generate_gif_brownian_bridge.py		generate_gif_brownian_bridge.py
generate_lambda_sweep_demo.py		generate_lambda_sweep_demo.py
generate_prompt_brownian_bridge.py		generate_prompt_brownian_bridge.py
latent_bridge_adult2children.py		latent_bridge_adult2children.py
requirements.txt		requirements.txt
train_dog2face.py		train_dog2face.py
train_face2dog.py		train_face2dog.py
train_face_editing_sb.py		train_face_editing_sb.py
train_mapper_only.py		train_mapper_only.py
train_multi_marginal.py		train_multi_marginal.py
train_text2face_paired.py		train_text2face_paired.py
train_unpaired_ALAE.py		train_unpaired_ALAE.py

Folders and files

Latest commit

History

Repository files navigation

Multi-Marginal Schrödinger Bridge (Multi-Marginal-SB)

Overview

Features

Installation

Prerequisites

Setup

Usage

Key Scripts

Example Commands

Checkpoints

Contributing

License

Acknowledgments

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages