downloads

flowr: Streamline your workflows¶

The documentation is outdated, please use: docs.flowr.space

This framework allows you to design and implement complex pipelines, and deploy them on your institution’s computing cluster. This has been built keeping in mind the needs of bioinformatics workflows. However, it is easily extendable to any field where a series of steps (shell commands) are to be executed in a (work)flow.

Highlights¶

Effectively process a pipeline multi-step pipeline, spawning it across the computing cluster
Example:
- A typical case with next-generation sequencing, a sample with tens of fastq files)
- Each file can be processed (aligned) individually, each using multiple cores
- Say 50 files using 10 cores each, totalling 500 cores across several machines, for one sample
- flowr further supports processing multiple samples in parrellel, spawning thousands of cores.
Reproducible, with cleanly structured execution logs
Track and re-run flows
Lean and Portable, with easy installation
Supports multiple platforms (torque, lsf, sge, slurm ...)

A few lines, to get started:¶

## From the official R repository (may be a few versions behind)
install.packages("flowr")

## OR

install.packages(devtools)
devtools::install_github("sahilseth/flowr")

library(flowr) ## load the library
setup() ## copy flowr bash script; and create a folder flowr under home.
run('sleep', execute=TRUE,  platform='moab') ## submit a simple example

Here is a shiny app, flow_creator which helps you build a flow.
A few slides providing a quick overview.

Contents:¶

Table of Contents¶

Get started
- Toy example
- Stitch it
- Plot it
- Dry Run
- Submit it
- Check its status
- Kill it
- Re-run a flow
Ingredients for building a pipeline
- 1. Flow Definition
- 2. Flow mat: A table with shell commands to run
  - Example:
Submission types
Dependency types
Relationships
Available Pipelines
Cluster Support
Example of building a pipeline
FAQs
Help on Available functions
- check_args
  - Description
  - Usage
  - Arguments
  - Examples
- check
  - Description
  - Usage
  - Arguments
  - Examples
- fetch
  - Description
  - Usage
  - Arguments
  - Examples
- flow
  - Description
  - Usage
  - Arguments
  - Examples
- get_unique_id
  - Description
  - Usage
  - Arguments
  - Examples
- get_wds
  - Description
  - Usage
  - Arguments
  - Examples
- job
  - Description
  - Usage
  - Arguments
  - Examples
- kill
  - Description
  - Usage
  - Arguments
  - Examples
- flowopts
  - Description
  - Usage
  - Arguments
  - Format
  - Examples
- plot_flow
  - Description
  - Usage
  - Arguments
  - Examples
- queue
  - Description
  - Usage
  - Arguments
  - Details
  - Examples
- rerun
  - Description
  - Usage
  - Arguments
  - Details
  - Examples
- run
  - Description
  - Usage
  - Arguments
  - Examples
- setup
  - Description
  - Usage
  - Arguments
  - Details
  - Examples
- status
  - Description
  - Usage
  - Arguments
  - Details
  - Examples
- submit_flow
  - Description
  - Usage
  - Arguments
  - Examples
- test_queue
  - Description
  - Usage
  - Arguments
  - Examples
- to_flow
  - Description
  - Usage
  - Arguments
  - Value
  - Details
  - Examples
- to_flowdef
  - Description
  - Usage
  - Arguments
  - Examples
- to_flowdet
  - Description
  - Usage
  - Arguments
  - Details
  - Examples
- to_flowmat
  - Description
  - Usage
  - Arguments
  - Examples
- whisker_render
  - Description
  - Usage
  - Arguments
  - Examples

Indices and tables¶

Aknowledgements¶

Jianhua Zhang
Samir Amin
Kadir Akdemir
Ethan Mao
Henry Song
An excellent resource for writing your own R packages: r-pkgs.had.co.nz

comments powered by Disqus