Crear lista de datos agrupados por nombre provenientes de dos columnas adyacentes (60.000 filas)
publicado
Hola a todos:
Soy nuevo en el foro, gracias de antemano por su ayuda.
Estoy trabajando con plantillas de datos bioinformáticos muy extensas (60.000 filas) y busco una forma de aliviarme el trabajo
Tengo dos columnas adyacentes. Columna A contiene nombre de genes (alrededor de 1000 genes, repetidos a lo largo de la columna en diferentes frecuencias hasta llegar a aproximadamente 60.000 filas), ordenados alfabéticamente. Para cada nombre de gen, una columna adyacente (columna contiene un nombre de secuencia asociada. Toda la información está en texto.
utr|3OMYR000001|p-ras omy-miR-nov217-3p_3
utr|3OMYR000001|p-ras omy-miR-nov53-5p
utr|3OMYR000001|p-ras omy-miR-nov53-5p_3
utr|3OMYR000001|p-ras omy-miR-nov91-3p
utr|3OMYR000001|p-ras omy-miR-nov62-3p_4
utr|3OMYR000001|p-ras omy-miR-nov20-5p_2
utr|3OMYR000002|ghs-r omy-miR-nov213-3p_4
utr|3OMYR000002|ghs-r omy-miR-nov120-5p_29
utr|3OMYR000002|ghs-r omy-miR-nov213-3p
utr|3OMYR000003|LOC100135986 tni-miR-15b-5p_2
utr|3OMYR000003|LOC100135986 dre-miR-107b-3p_2
utr|3OMYR000003|LOC100135986 omy-miR-nov217-3p_12
utr|3OMYR000003|LOC100135986 omy-miR-nov37-5p_17
utr|3OMYR000003|LOC100135986 omy-miR-1308_12
utr|3OMYR000003|LOC100135986 omy-miR-1308_7
utr|3OMYR000003|LOC100135986 omy-miR-1308_15
utr|3OMYR000003|LOC100135986 omy-miR-nov37-5p_22
utr|3OMYR000003|LOC100135986 omy-miR-nov37-5p_19
utr|3OMYR000003|LOC100135986 omy-miR-nov37-5p_21
utr|3OMYR000004|hsp70a omy-miR-nov101-5p_7
utr|3OMYR000004|hsp70a cca-miR-96-5p_2
Necesito agrupar en una nueva hoja el listado de secuencias que se encuentra en columna B para cada gen. La forma manual de hacerlo que encontré es filtrar la columna A, copiar los datos filtrados y pegarlos en una hoja nueva con la función transponer, pero al ser cerca de 1000 genes, el proceso es interminable...
Muchas gracias!!!
Featured Replies
Archivado
Este tema está ahora archivado y está cerrado a más respuestas.
Hola a todos:
Soy nuevo en el foro, gracias de antemano por su ayuda.
Estoy trabajando con plantillas de datos bioinformáticos muy extensas (60.000 filas) y busco una forma de aliviarme el trabajo
Tengo dos columnas adyacentes. Columna A contiene nombre de genes (alrededor de 1000 genes, repetidos a lo largo de la columna en diferentes frecuencias hasta llegar a aproximadamente 60.000 filas), ordenados alfabéticamente. Para cada nombre de gen, una columna adyacente (columna
contiene un nombre de secuencia asociada. Toda la información está en texto.
utr|3OMYR000001|p-ras omy-miR-nov217-3p_3
utr|3OMYR000001|p-ras omy-miR-nov53-5p
utr|3OMYR000001|p-ras omy-miR-nov53-5p_3
utr|3OMYR000001|p-ras omy-miR-nov91-3p
utr|3OMYR000001|p-ras omy-miR-nov62-3p_4
utr|3OMYR000001|p-ras omy-miR-nov20-5p_2
utr|3OMYR000002|ghs-r omy-miR-nov213-3p_4
utr|3OMYR000002|ghs-r omy-miR-nov120-5p_29
utr|3OMYR000002|ghs-r omy-miR-nov213-3p
utr|3OMYR000003|LOC100135986 tni-miR-15b-5p_2
utr|3OMYR000003|LOC100135986 dre-miR-107b-3p_2
utr|3OMYR000003|LOC100135986 omy-miR-nov217-3p_12
utr|3OMYR000003|LOC100135986 omy-miR-nov37-5p_17
utr|3OMYR000003|LOC100135986 omy-miR-1308_12
utr|3OMYR000003|LOC100135986 omy-miR-1308_7
utr|3OMYR000003|LOC100135986 omy-miR-1308_15
utr|3OMYR000003|LOC100135986 omy-miR-nov37-5p_22
utr|3OMYR000003|LOC100135986 omy-miR-nov37-5p_19
utr|3OMYR000003|LOC100135986 omy-miR-nov37-5p_21
utr|3OMYR000004|hsp70a omy-miR-nov101-5p_7
utr|3OMYR000004|hsp70a cca-miR-96-5p_2
Necesito agrupar en una nueva hoja el listado de secuencias que se encuentra en columna B para cada gen. La forma manual de hacerlo que encontré es filtrar la columna A, copiar los datos filtrados y pegarlos en una hoja nueva con la función transponer, pero al ser cerca de 1000 genes, el proceso es interminable...
Muchas gracias!!!