Labsergen BCL2FASTQ Pipeline

bcl2fastqpipelinemainidea3

The BCL2FASTQ Pipeline consists of an interface in command line, flexible and friendly, which I  developed in the LANGEBIO Genomic Services department because we need to make use of illumina’s software applications  in a more simple way.

The BCL2FASTQ Pipeline allows to :

  1. set sequencing instrument (HiSeq/MiSeq).
  2. set storage to save data.
  3. create a well-defined directory structure to save data like fastq results and samplesheets per library per line.
  4. format conversion (samplesheet xlsx to csv automatically)
  5. bcl to fastq conversion
  6. biostatistical reports available through the flowcellid per line per run.
  7. partial or complete analysis of a run.

;)

mapping IonTorrent data using Omixon Letter Space Toolkit

Mapping  Ion Torrent data using Omixon

you will need

  1. fastq files
  2. reference file
  3. Omixon Letter Space shell scripts and java jar files.
  4. Omixon properties file
  5. Omixon Profile file ( 454, Ion Torrrent..)

Ok let’s see,

How to run :

[jacob@localhost omixon-letter-space-toolkit]$ ./orm.sh orm.properties.workcopy

orm.sh is a shell script that allows to run omixon java jar file :

#!/bin/bash
config=$1;
java -Xmx1000M -jar omixon-letter-space-toolkit.jar -config $config;

orm.properties.workcopy it is my own profile properties file to set input and output files

###################################################
# main control section, which of the steps to run #
###################################################
# the name of this process
toolkit.process=orm
# whether or not to use all available processors, default false
toolkit.useAllProcessors=false
#toolkit.useAllProcessors=true
############################
# orm input/output files   #
############################
# the input reference url to use
orm.referenceUrl=testingData/reference/e_coli_dh10b.fasta
# the url of where to write the output
orm.outputUrl=testingData/test2.sam
# the url to use for the input fastq file
orm.inputUrl=testingData/reads/R_2011_04_07_12_44_38_user_CB1-42-r9723-314wfa-tl_sample_data.fastq
##################
# orm profiles   #
##################
# the easiest way to run orm is with the built-in profiles
# see the orm.default.properties file and/or the README.txt for more
orm.profile=

Output

User parameters:
orm.inputUrl=testingData/reads/R_2011_04_07_12_44_38_user_CB1-42-r9723-314wfa-tl_sample_data.fastq
orm.outputUrl=testingData/test2.sam
orm.profile=
orm.referenceUrl=testingData/reference/e_coli_dh10b.fasta
toolkit.process=orm
toolkit.useAllProcessors=false

Progress message: Preparing reference and input
Progress message: Running alignment
Progress: 0%
Progress: 1%
Progress: 2%

Progress: 98%
Progress: 99%
Progress message: Preparing results
Progress message: Done

Ouput Sam file: test2.sam

You will need implement pipeline to convert sam to binary sam file then you could use bam stats scripts.

SOLiD Bioinformatics and Conference at INMEGEN Mexico D.F.

Last week at the invitation of Applied Biosystems Mexico I attended a bioscope training. The training and the conference took place at the INMEGEN in Mexico City. The training was taught by Leonardo Varuzza (ABI Brazzil) ,my friend, thank you very much Leonardo, very nice to see you once again.

The training was excellent we were basically working on the bioscope command line(Mapping, Small RNA, Ma to Sam and Bam using ini files and plan files..and more stuff), we work editing configuration files and analyzing the results too.

I also thank very much my friend Herbert Garcia (ABI Mexico) for all your help, I appreciate your help, thanks Herbert nice to see you again.

A salute to dr. Claudia Rangel and Rodrigo Garcia (INMEGEN) thanks for letting me take the course in INMEGEN.

Keo nice to meet you too. :)

for more details browse to: http://solid.community.appliedbiosystems.com/groups/bioinformatics/blog/2011/01/15/solid-bioinformatics-and-conference-at-inmegen-mexico-df

BioinformáticaViva Q&A

He lanzado el sitio BioinformaticaViva Q&A para ayudarnos todos.

Es bien sabido que un cuello de botella es que después de la secuenciación del ADN y obtener los datos es necesario analizar   estos datos para obtener ciertos resultados.

Para ayudarnos todos a todos un poco,como vengo mencionando, he abierto un nuevo sitio de red, el cual desde mi punto de vista nos va permitir integrar una comunidad de usuarios de bioinformática,poco a poco, la cual debe ser capaz de compartir, colaborar, preguntar y resolver dudas sobre análisis de bioinformática para posteriormente aplicar el conocimiento generado por la comunidad en tu trabajo, en tus estudios, en casa, en donde tu quieras y como tu quieras.

Uno de los varios objetivos es impulsar la bioinformática en México pero al ser una comunidad integrada por gente repartida en el mundo también vamos impulsar el desarrollo bioinformático en todos los países de la gente que este participando en la comunidad.

Para mayor información sobre el sitio consulta el FAQ:

http://answers.bioinformaticaviva.org/index.php?qa=FAQ

Ayudémonos y hagamos de todo esto algo que nos beneficie a todos por igual.

Vamos a que estás esperando participa !!!

Pubget Find papers fast

Pubget resuelve el problema de acceso y tiempo invertido en buscar documentación sobre investigación en bio ciencia, en lugar de buscar resultados que nos proporcionan solo ligas hacia los artículos, con Pubget las búsquedas te devuelven el articulo(pdf) directamente a descargar todo en linea, pubget proporciona acceso abierto y comercial.

En mi opinión es buena opción, yo no lo había probado hasta ahora y pude encontrar cosas interesantes, para quien no pueda pagar una suscripción para obtener las revistas y/o artículos pues Pubget es una buena opción.

Incluso puedes crear un widget para tu pagina web y vincular los artículos hacia los visitantes de tu pagina web..excelente opción y sí aun es poco , existe un plugin para firefox para hacer tus búsquedas desde el mismo navegador web firefox.

http://pubget.com/widgetizer/create

http://pubget.com/help/firefox_plugin