Buscar palabras claves en un tweet y codificarlas automáticamente
publicado
Hola,
a partir de un listado de códigos o lista de palabras clave pre-existente, se trataría de:
PRIMER PARTE (FÁCIL)
1. Buscar en una columna con tweets si aparece o no esa palabra o código.
2. En caso de que no aparezca, en otra columna se indicaría '0'
3. En caso de que sí aparezca se indicaría '1'.
SEGUNDA PARTE (MÁS COMPLEJO)
En el contenido de un tweet pueden mencionarse varios temas.
Tenemos un libro de códigos con varios temas.
Por ejemplo:
1. Tema 1
2. Tema 2
etc.
Se trataría entonces de hacer una clasificación o codificación múltiple.
1. Buscar en una columna con tweets si aparecen o no esa palabras o códigos. Las mayúsculas y minúsculas y las tildes serían indiferentes.
2. En caso de que no aparezcan, en otra columna se indicaría '0'
3. En caso de que sí aparezcan se indicaría '1', '2', '3' o el código que corresponda a cada palabra clave encontrada.
4. En caso de que un mismo tweet pueda ser clasificado con varios códigos porque tiene varias palabras clave, entonces se podría colocar cada código en una columna de resultado diferente.
Si una palabra clave aparece más de una vez, en cada columna se indicaría, en el orden en que está en el tweet.
Lo ideal sería facilitar la lista global de temas, para que operara de una vez con todos los temas.
Hola,
a partir de un listado de códigos o lista de palabras clave pre-existente, se trataría de:
PRIMER PARTE (FÁCIL)
1. Buscar en una columna con tweets si aparece o no esa palabra o código.
2. En caso de que no aparezca, en otra columna se indicaría '0'
3. En caso de que sí aparezca se indicaría '1'.
SEGUNDA PARTE (MÁS COMPLEJO)
En el contenido de un tweet pueden mencionarse varios temas.
Tenemos un libro de códigos con varios temas.
Por ejemplo:
1. Tema 1
2. Tema 2
etc.
Se trataría entonces de hacer una clasificación o codificación múltiple.
1. Buscar en una columna con tweets si aparecen o no esa palabras o códigos. Las mayúsculas y minúsculas y las tildes serían indiferentes.
2. En caso de que no aparezcan, en otra columna se indicaría '0'
3. En caso de que sí aparezcan se indicaría '1', '2', '3' o el código que corresponda a cada palabra clave encontrada.
4. En caso de que un mismo tweet pueda ser clasificado con varios códigos porque tiene varias palabras clave, entonces se podría colocar cada código en una columna de resultado diferente.
Si una palabra clave aparece más de una vez, en cada columna se indicaría, en el orden en que está en el tweet.
Lo ideal sería facilitar la lista global de temas, para que operara de una vez con todos los temas.
Gracias por la ayuda.
ejemplo2 tweets.xls