GitHub - shivabioinformatics/variant-core: A memory-optimized, strictly-typed genomic parser for clinical pipelines

VariantCore: High-Performance Genomic Data Structures

VariantCore is a lightweight, memory-efficient library for parsing VCF and BED files. It is designed for clinical pipelines where data integrity and memory footprint are critical.

Why this exists? (Engineering Philosophy)

Most ad-hoc bioinformatics scripts lack type safety and consume excessive memory. I built this library to demonstrate how Domain-Driven Design can improve pipeline reliability.

Installation

You can install VariantCore directly from GitHub using pip:

pip install git+https://github.com/shivabioinformatics/variant-core.git

Usage

Reading VCFs

from variant_core import VCFReader

# Lazy loading with generators keeps memory usage low
reader = VCFReader("data/sample.vcf")

for variant in reader:
    if variant.is_snp():
        print(f"Found SNP: {variant.chrom}:{variant.pos}")

Reading BED Files

from variant_core import BEDReader

# Automatically handles whitespace and 0-based coordinates
bed = BEDReader("data/targets.bed")

for region in bed:
    print(f"Target Region: {region}")

Testing

To run the test suite:

pip install -r requirements.txt
pytest

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
src/variant_core		src/variant_core
tests		tests
.gitignore		.gitignore
README.MD		README.MD
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Installation

Usage

Reading VCFs

Reading BED Files

Testing

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Installation

Usage

Reading VCFs

Reading BED Files

Testing

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages