BCL2FASTQ WEB UI Pipeline , Web Services (Mono C#), Shell Scripts, Linux HPC, Illumina HISEQ 2500 Sequencing on our lab :D

mono-logo

I’m still using Mono on Bioinformatics !! 

En el laboratorio de los Servicios Genómicos

lab1   lab2lab3

lab4

Hemos desarrollado una sencilla aplicación de software, para Cluster de Computo o Servidor dedicado sobre un Kernel Linux , la cual nos permite analizar y conversar los resultados del proceso de secuenciación de las plataformas Illumina HiSeq/MiSeq a un resultado en un formato legible para el usuario final. Los resultados directos del equipo secuenciador son datos crudos (illumina bcl raw files) que miden alrededor de 2-3 Terabytes por una corrida de secuenciación aproximadamente, quizá mas o menos.

Componentes y Módulos del Pipeline

La aplicación se conforma de los siguientes componentes:

    1. Interfaz Web de usuario y simple, desarrollada con Google Web Kit
    2. Servicios Web con paso de mensajes via Xml a través de Mono C#, XSP4 (.NET 4) Application Server
    3. Pipeline desarrollado con Scripts de Shell
    4. Scripts desarrollados en Python para proceso de SampleSheet
    5. Scripts Illumina Casava Bcl2Fastq

Procesamiento del Pipeline

Parámetros de Entrada

El Pipeline toma como entrada los siguientes parámetros importantes:

1. El sistema de almacenamiento usado (server storage) , es decir el servidor de disco donde se encuentran los resultados de la secuenciación de las muestras, dicho servidor de almacenamiento deberá estar montado sobre el Cluster de Computo o sobre el servidor donde se procesaran los resultados crudos de la secuenciación a un formato legible como FastQ.

2. El instrumento de secuenciación illumina que se empleo para llevar a cabo la secuenciación de las muestras.

3. El nombre de la corrida de secuenciación propiamente.

4. El nombre de la corrida de secuenciación amigable propiamente.

5. Se tomara en  cuenta si se uso dual index.

6. Se toma en cuenta si se procesara las hojas de trabajo , samplesheets.

7. Se toma en cuenta cuales lineas de una corrida se procesaran y en que orden.

 Procesamiento

bcl2fastqpipe1

  1. Determinar cual directorio de almacenamiento correspondiente al storage se usara en base a la selección del usuario.
  2. Determinar la ruta completa del directorio correspondiente a la corrida en proceso de conversión.
  3. Determinar la ruta completa del directorio de resultados correspondiente a la corrida en proceso de conversion.
  4. Determinar la ruta hacia el directorio de las intensidades de la corrida en proceso.
  5. Se procesa cada linea por cada corrida y para cada linea :
  • Convierte samplesheet de formatos xls,xlsx a csv.
  • Usar esta hoja csv para instruir a Casava para realizar la conversión de BCL hacia FASTQ correspondiente.
  • Generar un reporte html con las estadisticas del resultado de la conversión.

6. Enviar una notificación a los usuarios responsables del servicio de secuenciación al momento que el proceso ha terminado.

bcl2fastq2

La orden de ejecución del Pipeline se lleva a cabo a través de un servicio web que se consume a través de una interfaz gráfica de usuario simple, la cual es desarrollada bajo Google Web Kit.

bcl2fastqpipeline

El Servicio Web está desarrollado en C# en Linux totalmente  y corre bajo el Application Server Mono XSP4 usando un profile de .NET Framework 4 bajo un sistema operativo empresarial CentOS Linux como lo es en nuestro caso el nodo maestro de nuestro Cluster de Computo HPC de operación principal.

bcl2fastqui2

No hace falta mencionar que la aplicación web que se ha desarrollado usa sin duda herramientas como DojoToolkit, JQuery y varias librerías excelentes =D

La siguiente imagen solo muestra un extracto de las operaciones que el Pipeline va ejecutando durante su flujo de operación:

bcl2fastqui4

Anexo #1

La conversión de los resultados BCL del instrumento de secuenciación HiSeq requieren una hoja de datos denominada samplesheet , esta samplesheet es manipulada por el operador o responsable de la secuenciación o corrida de las muestras, básicamente está hoja contiene datos importantes sobre las secuencias entre ellos el indice (secuencia de nucleotidos) que el software debe usar para separar las lecturas en su correspondiente grupo, veamos un ejemplo:

ss1

La hoja o samplesheet antes de usarla para los propósitos del análisis es necesario tenerla en un formato “sin formato” es decir solo texto plano , por ejemplo necesitamos un archivo donde las columnas están separadas por coma (CSV) y para ello contamos con un pequeño programa escrito en Python para realizar tal conversión de formato XLS,XLSX a CSV .

Labsergen BCL2FASTQ Pipeline

bcl2fastqpipelinemainidea3

The BCL2FASTQ Pipeline consists of an interface in command line, flexible and friendly, which I  developed in the LANGEBIO Genomic Services department because we need to make use of illumina’s software applications  in a more simple way.

The BCL2FASTQ Pipeline allows to :

  1. set sequencing instrument (HiSeq/MiSeq).
  2. set storage to save data.
  3. create a well-defined directory structure to save data like fastq results and samplesheets per library per line.
  4. format conversion (samplesheet xlsx to csv automatically)
  5. bcl to fastq conversion
  6. biostatistical reports available through the flowcellid per line per run.
  7. partial or complete analysis of a run.

;)

App: Illumina UMSi for HISEQ and MiSEQ

Soft1

time goes so fast !!!

I developed this based desktop app using Visual Basic 6 programming language for the illumina instrument HiSeq and MiSeq.

This desktop app runs on Microsoft Windows 7 it allows to attach a Linux Network Storage via smb protocol . software requirements are Linux distribution running Samba daemon and the shares properly set.

Vb6app2

 

 

getXSQ v0.1 for SOLiD 5500 instrument

if you want to copy your results from your SOLiD 5500 instrument to Server Storage you could use following bash script

There is a basic script , the main idea is that you can convert your XSQ files to colorspace, quality and fastq (ECC) values.

My current getXSQ WorkFlow:

S5 means SOLiD 5500

SS means Server Storage

SOLiD5500 –> scan xsq results(S5) –> copy xsq results to server storage(S5) –> convert xsq results to csfasta/qual/fastq (SS)–> minimal reads counting(SS)

#!/bin/bash

# GetXSQ v0.1 allows to copy from SOLiD 5500 instrument results to Custom Server Storage
# by Jacob Israel Cervantes Luevano jacobnix@gmail.com

# GetXSQ is free software; you can redistribute it
# and/or modify it under the terms of the GNU General Public
# License as published by the Free Software Foundation;
# either version 3 of the License, or (at your option) any later version.

# GetXSQ is distributed in the hope that it will be useful,
# but WITHOUT ANY WARRANTY; without even the implied warranty of
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
# See the GNU General Public License for more details.

# You should have received a copy of the GNU General Public License
# along with GetXSQ; if not, write to the Free Software Foundation,
# Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301 USA

CWD=$PWD
storage=$2
user=$4
remotedir=$6

echo "getXSQ.sh allows to copy from SOLiD 5500 instrument results to Custom Server Storage"
echo "Copyright 2012 by Jacob Israel Cervantes Luevano"
echo "usage: getXSQ.sh --storage ip_address --user remote_username --remotedir dir"

for XSQ in `tree -i -f | grep xsq`
do
 xsqFile=`readlink -f $XSQ`
#printf "`$xsqFile` \n"
 printf "copying xsq file $xsqFile to Storage $storage \n"
 scp $xsqFile $user@$storage:$remotedir
 printf "xsq file $xsqFile copied successfully !!\n"
#convert to csfasta/qual/fastq from xsq @ storage
done
-- INSERT --

This script is partially finished if you want to help ..email me

xsq-tools on CentOS Linux 6

Follow this unofficial tutorial step by step to run xsq-tools on CentOS Linux 6 and OpenSuse Linux

1. If you are using CentOS Linux 6, OpenSuse Linux check which GNU LIBC version you have   installed. you can use this command

[jacob@localhost xsq-tools]$ ldd – -version
ldd (GNU libc) 2.12

Copyright (C) 2010 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
Written by Roland McGrath and Ulrich Drepper.

to run xsq-tools you will need GNU libc version 2.5+ !!

2. Get Official xsq-tools software package distribution from LifeTech/ABI

3. Open your favorite Linux console command and untar/unzip xsq-tools package.

4. If you want to convert your xsq solid 5500 output files you will need to use the convertFromXSQ.sh shell script.

5. Backup the official convertFromXSQ.sh shell script.

6. Download unofficial convertFromXSQ.sh shell script and save in your official xsq-tools directory,

7. Download script from here

8. Rename script convertFromXSQ.sh1.txt to convertFromXSQ.sh

9. Set execution permission to shell script ( chmod +x convertFromXSQ.sh )

10. Change to xsq-tools directory using linux command line (cd XSQ_Tools)

11. Extras: You can run unofficial convertFromXSQ.sh shell script like this samples

$ remember, cd XSQ-Tools first

(A) $ ./convertFromXSQ.sh -c data/Frag.xsq

(B, from any location)

$ convertFromXSQ.sh -c /home/jacob/XSQ-Tools/data/Frag.xsq -o $HOME

(C) $ ./convertFromXSQ.sh – -rootXSQ `pwd` -c data/Frag.xsq (- – rootXSQ paramater is useful to myXSQ application)

That’s all.

Notes:

[1] If you do not set XSQ_TOOLS environment variable, the  unofficial convertFromXSQ.sh set XSQ_TOOLS environment variable  automatically.

[2] Follow LifeTech/ABI official readme documentation to install xsq-tools, the   unofficial script updates your .bashrc ,bash_profile in user home   directories but I disabled exporting PATH environment variable because I   need to do some tests, if you want to run unofficial convertFromXSQ.sh from any   location you will need to update and export your PATH environment   variable manually.

I hope that help you , it works for me !!

http://solid.community.appliedbiosystems.com/groups/bioinformatics/blog/2011/11/04/script-launch-xsqtools

Follow this unofficial tutorial step by step to run xsq-tools on CentOS Linux 6 and OpenSuse Linux

1. If you are using CentOS Linux 6, OpenSuse Linux check which GNU LIBC version you have   installed. you can use this command

[jacob@localhost xsq-tools]$ ldd – -version
ldd (GNU libc) 2.12

Copyright (C) 2010 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
Written by Roland McGrath and Ulrich Drepper.

to run xsq-tools you will need GNU libc version 2.5+ !!

2. Get Official xsq-tools software package distribution from LifeTech/ABI

3. Open your favorite Linux console command and untar/unzip xsq-tools package.

4. If you want to convert your xsq solid 5500 output files you will need to use the convertFromXSQ.sh shell script.

5. Backup the official convertFromXSQ.sh shell script.

6. Download unofficial convertFromXSQ.sh shell script and save in your official xsq-tools directory,

7. Download script from here

8. Rename script convertFromXSQ.sh1.txt to convertFromXSQ.sh

9. Set execution permission to shell script ( chmod +x convertFromXSQ.sh )

10. Change to xsq-tools directory using linux command line (cd XSQ_Tools)

11. Extras: You can run unofficial convertFromXSQ.sh shell script like this samples

$ remember, cd XSQ-Tools first

(A) $ ./convertFromXSQ.sh -c data/Frag.xsq

(B, from any location)

$ convertFromXSQ.sh -c /home/jacob/XSQ-Tools/data/Frag.xsq -o $HOME

(C) $ ./convertFromXSQ.sh – -rootXSQ `pwd` -c data/Frag.xsq (- – rootXSQ paramater is useful to myXSQ application)

That’s all.

Notes:

[1] If you do not set XSQ_TOOLS environment variable, the  unofficial convertFromXSQ.sh set XSQ_TOOLS environment variable  automatically.

[2] Follow LifeTech/ABI official readme documentation to install xsq-tools, the   unofficial script updates your .bashrc ,bash_profile in user home   directories but I disabled exporting PATH environment variable because I   need to do some tests, if you want to run unofficial convertFromXSQ.sh from any   location you will need to update and export your PATH environment   variable manually.

I hope that help you , it works for me !!

Talleres Internacionales de Bioinformática / International Workshops on Bioinformatics – 2012



Nos es grato informarle que el Nodo Nacional de Bioinformática
(NNB-UNAM) y la Sociedad Iberoamericana de Bioinformática (SOIBio), con
el apoyo del Centro de Ciencias Genómicas (CCG-UNAM), el Instituto de
Biotecnología (IBt-UNAM), la Licenciatura en Ciencias Genómicas
(LCG-UNAM) y EMBnet organizan los Talleres Internacionales de
Bioinformática - 2012, que se llevarán a cabo del 16 al 27 de enero de
2012 en las instalaciones del CCG en Cuernavaca Morelos, México.

En la semana del 16 al 20 de Enero se impartirán 2 talleres de nivel
básico dirigido a principiantes en el área. En la semana del 23 al 27 de
Enero se ofrecerán 2 talleres especializados, uno dirigido a gente
trabajando en análisis de datos generados por secuenciadores de nueva
generación y otro para Administradores de Sistemas.

Para los detalles de los programas y procedimiento de registro, favor de
visitar el sitio web del evento:

http://congresos.nnb.unam.mx

Comité Organizador
TIB -2012
---------------------------
We are pleased to announce that the National Node of Bioinformatics
(NNB-UNAM) and the Iberoamerican Society of Bioinformatics (SOIBio),
with support from the Center for Genomic Sciences (CCG-UNAM), the
Institute of Biotechnology (IBT-UNAM), the Undergraduate Program in
Genomics Sciences (LCG-UNAM) and the EMBnet, organize the “International
Workshops on Bioinformatics – 2012” which will be held from January 16th
to 27th, 2012 in the CCG facilities in Cuernavaca Morelos, Mexico.

Two Basic or introductory workshops will be offered during the first
week (January 16th-20th), geared towards beginners in the field. Two
advanced workshops will be offered during the second week (January 23rd
to 27th), one designed for people working with data generated by next
generation sequencers, and the other for System Administrators.

For the details on the programs and registration procedure, please visit
the event website:

http://congresos.nnb.unam.mx

Organizing Committee
IWB - 2012

BioScope: validar genomas de referencia

Comentando con Leonardo Varuzza , le decía que el plugin de ma.to.bam de BioScope generaba un error y aunque nuestro mapeo a nuestra referencia era correcto y completo , nuestro formato bam no se generaba y por ende cualquier otro tipo de análisis que dependiera de este formato ya no seria viable.

Pues una sugerencia de Leonardo, gracias Leonardo :D, era verificar el genoma de referencia y más pronto que un calcetín recordé el script “reference_validation.pl” que en ocasiones pasadas lo había probado con buenos resultados.

En ocasiones puede que por las prisas no le demos un buen vistazo a nuestras referencias, y BioScope tiende a darnos sorpresas al intentar generar los ficheros bam resultantes del proceso de mapeo hacia nuestra referencia.

Para ello una buena solución pueden ser las siguientes:

1) Desarrollas tu propio script y validas el formato fasta de tu referencia.

2) Usas el script “reference_validation.pl” que viene con BioScope el cual precisamente permite validar tu genoma de referencia.

Para evitar reinventarnos la rueda usaremos la opción 2.

un ejemplo:

$reference_validation.pl -r ATH_TAIR10.dna.complete.fa -o ATH_TAIR10.dna.complete.valido.fa

Hecho lo anterior no debes tener problema al usar BioScope en tus análisis.

FAQ

¿Donde existe el script?

En tu cluster de computo , previa instalación de BioScope.

¿Cómo lo uso?

Así no mas

$reference_validation.pl -r miGenoma.fasta -o miGenomaVALIDO.fasta

el parámetro -r es para definir tu genoma de referencia
el parámetro -o es para definir el genoma de referencia valido y usable en BioScope

Amenaza de Explosivos en Cinvestav Langebio Guanajuato

Todo transcurrió el sábado 27 de Agosto del presente año 2011, me dirigía hacia el Cinvestav Langebio básicamente apoyar en algunas cuestiones laborales , al llegar a mi trabajo, alrededor de las 8:15 am nos comentaron que no había acceso al laboratorio ya que había una amenaza de bomba, para ese entonces , el personal del laboratorio y vigilancia ya había realizado el contacto con las autoridades correspondientes.

Posteriormente llegaron cuerpos de la policía municipal , protección civil, bomberos, policía federal y el ejercito mexicano.

Todo mundo con la inquietud, tensión e incertidumbre de la posible amenaza de bomba.

Tome algunas imágenes y vídeo con mi iPhone:

Posteriormente se dio la orden de desalojar los laboratorios para evitar cualquier daño a la integridad de trabajadores (internos y externos) y personal en general de las instituciones.

No cabe duda que la inseguridad no solo ocurre en ciudades grandes como México D.F. , Monterrey y Guadajalara, tengamos muy en cuenta que los delincuentes están a la orden del día casi en cualquier lugar y a cualquier hora, sin embargo personal del todo el Cinvestav, el Langebio, autoridades federales y estatales todos comprometidos apoyando en la medida de lo necesario con un poco de miedo por la bomba , pero aún así con la camiseta puesta.

Workshop “Sequencing Data Visualization for SOLiD Users” México 2011

Muy rápido pasa el tiempo y bien dice la gente que recordar es vivir.

El pasado 4 de Julio asistí junto con el personal del área de genomica y estudiantes de doctorado al Workshop “Sequencing Data Visualization for SOLiD Users” el cual se llevo a cabo en las oficinas de Life Technologies de México.

Apenas llegue a mi habitación cuando ya estaba instalando algunos de los programas en mi computadora portátil y la mac.

llegamos algo cansados y teníamos hambre por lo que decidimos cenar y disfrutar de una muy buena platica con todos , después ya bien comiditos nos fuimos a instalar las computadoras con los programas necesarios para el Workshop, yo me desvele un poco más tiempo ya que una computadora estaba dando mucha guerra pero como dicen que no hay peor lucha que la que no se hace finalmente quedo lista.

Leonardo inicio con el Workshop hablando sobre los análisis de los datos de Bioinformática en general, muy buena platica.

El workshop estuvo bien , estuvimos usando varias herramientas para visualización de secuencias como Magic Viewer, ChipViewer , Tablet y BamViewer , está platica fue impartida por la gente de Winter Genomics, también ellos hablaron sobre Galaxy solo que por alguna extraña razón el sitio web oficial de Galaxy se bloqueo, lo bueno es que tenia configurado Galaxy en mi propia computadora portátil por lo que les pasamos la dirección de mi computadora para que todos pudieran entrar a Galaxy y seguir trabajando con el WorkShop.

Alrededor de las 2:15 salimos a comer , todos estuvimos invitados a comer por parte de  Life Technologies México , gracias.

Al termino de la comida regresamos a la siguiente parte del workshop, Leonardo realizo una demostración del nuevo software de análisis de datos de SOLiD “LifeScope”.

De imprevisto me anime a participar complementando un poco sobre Galaxy y BioScope, pero mi computadora portátil no pudo reconocer el proyector por lo que solo use la computadora de Leonardo para presentar algo rápido.

Comente brevemente 3 puntos:

    1. BioScope ahora puede ser capaz de correr en Ubuntu Linux Desktop y Servidor para ello hice algunos cambios en los scripts de instalación de BioScope.

 

  1. Es posible usar TMAP , la herramienta para mapear secuencias de Ion Torrent dentro Galaxy así como Velvet y Mira , para ello visita el siguiente enlace.
  2. Desarrolle un pequeño pipeline que permite generar las secuencias de referencia en el formato que Galaxy necesita para ser usadas dentro de Galaxy con Blast , para descargar o verificar el software haz clic aquí.

Al termino hicieron la entrega de constancias de participación y nos despedimos , no sin antes tomar un par de fotos para el recuerdo.

Saludos a Guillermo , Rodrigo y Herbert García  ;)

Me dio mucho gusto saludar a Carol Carrillo y Rodrigo García.

Gracias todos por el Workshop , la asistencia y la convivencia muy agradable , espero que se vuelva a promover y organizar este tipo de eventos que nos permiten conocer y compartir la información que es provechosa para todos, desde luego cuenten con mi participación

Gracias.

un par de horas antes de iniciar México BIO

Hoy llegue a eso de las 6:45 de la mañana a LANGEBIO y pase al auditorio con Maggy para ver si necesitaba ayuda en algo en particular pero al parecer no había nada que pudiera hacer en ese momento, aunque me quede con las ganas de participar haciendo algo :( en fin.

Al cabo de unos segundos y antes de ir a mi lugar de trabajo pase a tomar algunas fotos al área de difusión y de nuevo al auditorio de LANGEBIO porque después no tendría acceso a las conferencias ni a los stands puesto que no hay “money,cash, $$” para pagar el acceso al evento.

Les dejo algunas imágenes :

En mi facebook añadí mas imágenes..

Encuesta Curso Linux Básico en LANGEBIO

Por favor déjanos escuchar tu opinión a la vez que nos ayudas a mejorar los cursos que estaremos impartiendo próximamente , para ello haz clic en la siguiente liga para acceder a la encuesta.

En breve estará disponible el material presentado durante el curso para descargar.

Gracias por tu participación.

Clase de Bioinformática Cinvestav (4/Feb/2010)

El pasado 4 de febrero  me solicitaron cooperar e impartir una clase ,a un grupo de alumnos de maestría, sobre una introducción a la bioinformática, describí un panorama general sobre los puntos que en mi opinión serian provechosos para los estudiantes.

Así mismo me permití hacer una breve encuesta a los alumnos para mi propia auto-evaluación de la clase y la  evaluación del recorrido de los alumnos en el laboratorio de Langebio , los resultados de la encuesta al menos para mi fueron provechosos ya que los puntos que impartí mostraron en términos generales donde y como aplica la bioinformática en los proyectos de investigación.

A continuación dejo disponible 2 documentos:

  1. las preguntas que sirvieron como examen para los estudiantes.
  2. la opinión, ideas y sugerencias de los estudiantes acerca de la presentación y recorrido en langebio.

Opino que es importante tomar en cuenta estos resultados ya que sirve como base para mejorar la manera en como se desarrollan los contenidos y el recorrido por Langebio (en el caso de la clase de bioinformática).

Imágenes del curso básico de GNU/Linux 2010

Después de 3 largos días, el curso de GNU/Linux básico llego a su fin. fue agradable saber que hubo más de 30 personas interesadas en aprender a usar Linux y que al menos 28 personas se presentaron a tomar el curso.

Principalmente ,el alcance del curso se oriento al manejo básico de comandos  sin dejar a un lado una breve introducción al Software Libre, al GNU y a Linux, ya que es importante que la gente sepa que es el software libre.

Curso Básico de Bio-Linux (28,29 y 30 Sept 2010)

El próximo 28 de Septiembre estaré impartiendo un curso de Bio-Linux en LANGEBIO-CINVESTAV.

El curso dura 8 hrs aprox. y el horario es de 9 a 6pm, desde luego tendremos tiempos de descanso.

El curso se llevara a cabo en el aula de capacitación ‘in silico’ del Langebio (Edificio B, primer piso).

Para inscribirse haz clic en la siguiente liga y sigue las indicaciones:

http://www.langebio.cinvestav.mx/bioinformatica/cursos/linux/index.html

Nota: el curso se repetirá los días 29 y 30 de Septiembre bajo el mismo horario y lugar.

Clínica “Instalación del sistema operativo BioLinux en una PC”

El próximo jueves 23  de Septiembre estaré impartiendo una clínica sobre como instalar BioLinux en una computadora PC, la clínica se volverá a repetir el día viernes 24 de Septiembre.

El horario es de 9 a 12 de la mañana para ambos días. la clínica se llevara a cabo en el aula de capacitación ‘in silico’ de LANGEBIO (Edificio B, primer piso).

Para más información e inscripción visita la siguiente liga: http://www.langebio.cinvestav.mx/bioinformatica/cursos/linux/index.html

Descarga el póster en formato PDF.

Bioinformatica en México

Ahora la gente de Ciencia y Tecnología, Investigación, Desarrollo e Innovación Tecnológica en Madrid me ha colocado dentro de su comunidad de bioinformatica y biología computacional, el cual, como lo describe José María Fernández, Madri+d-Bioinformatica es el primer weblog de Bioinformática en España y que ha sido creado como un punto de encuentro y discusión de la comunidad bioinformática de nuestro ámbito más cercano.

José María Fernández dice:

Tras la vuelta de las vacaciones me he encontrado entre los mensajes relacionados con este blog uno escrito por Jacob Israel, en el cuál me habla sobre “Jacob bioinformatics web log”, el nuevo blog de bioinformática y de actividades de bioinformática en México que acaba de abrir. Si os preguntáis dónde se hace bioinformática en México, pues por ejemplo en el centro donde trabaja Jacob, el Laboratorio Nacional de Genómica para la Biodiversidad.

Una de las principales peculiaridades del blog de Jacob es que podéis encontrar entradas escritas tanto en inglés como en español. Para cualquier blogger es un buen ejercicio intelectual, porque obliga a buscar formas de expresar ideas y términos nuevos tanto en inglés como en español, de forma que sean inteligibles. Y para el lector también es un buen reto, en caso de que le dé pereza leer en inglés.

El blog tiene pinta de estar enfocado en parte a las herramientas de Next Generation Sequencing y al día a día dentro del laboratorio, ya que sus entradas describen, por ejemplo, problemas encontrados a instalar software bioinformático o nuevas versiones.

¡Bienvenido a la blogosfera, Jacob!

Enlaces

Muchas gracias José María

¿ Qué es Madri+d ?

El Sistema madri+d es una red de trabajo que agrupa a instituciones públicas y privadas de investigación y a las asociaciones empresariales regionales, que cubre los aspectos esenciales de comunicación entre el sector productor de conocimiento y el sector industrial con el objetivo de mejorar la competitividad mediante la transferencia de conocimiento.

Ahora desde Madri+d ya saben de la existencia de LANGEBIO y en consecuencia eso desencadena o desencadenara, tanto como ustedes lo quieran, una serie de posibles colaboraciones, trabajo, participación, proyectos y una comunidad que puede dar solución a muchos problemas en la investigación para México y España o ambos, básicamente mi objetivo es el de impulsar y levantar la bioinformatica en México siendo Cinvestav y Langebio el eje-pilar inicial y fundamental , en consecuencia opino que puede haber toda clase de servicios, colaboraciones, proyectos..el limite lo defines tu…

Jacob Israel Cervantes Luevano

Desarrollando sobre BioScope 1.2

En meses pasados estuve haciendo un poco de ingeniería inversa para añadir un nuevo menú y cuadro de dialogo con Java Rich Faces bajo el menú  de ayuda de BioScope, cabe señalar que NO es simplemente editar HTML.

BioScope es el nuevo sistema de análisis de datos para el instrumento SOLiD de Applied Biosystems.

BioScope es una excelente herramienta, pero la realidad es qué los usuarios finales necesitan acceso a más documentación qué les permita rápidamente trabajar con los análisis de datos y BioScope como tal no viene con documentación accesible para los usuarios finales , en este sentido para el beneficio de todos modifique un poco BioScope.

¿ Porque hacer Ingeniería inversa ?

Porque BioScope NO es Software Libre y por lo tanto no tengo acceso al código fuente del programa, más sin embargo siempre hay métodos de hacer las cosas.

Algunas imágenes del avance (puedes hacer clic sobre cada imagen para obtener una mejor vista de la imagen) :

Tengo nuevas ideas para BioScope , entre ellas añadir varias opciones de ensamblado con las lecturas de SOLiD desde el mismo BioScope.