r página de códigos de secuencia de comandos a Unicode

Un usuario Pregunto ✅

Sashan

Estoy extrayendo datos de Twitter para mi experimento de aprendizaje automático
Después de obtener los datos de mi búsqueda, quiero convertirlos en un marco de datos como este:

tweets <- searchTwitter ("Bicester Village", n = 1000)

df <- do.call ("rbind", lapply (tweets, as.data.frame))

Los datos de Twitter llegan como una lista de elementos de S4. Puedo realizar experimentos con éxito en mi R Studio y obtener los resultados que deseo.

Luego quiero ver si los datos se mostrarán en las fuentes, pero veo este error:

Error

Detalles: «No se pueden traducir bytes [ED][A0] en el índice 1 de la página de códigos especificada a Unicode «.

Intenté sin parar convertir a UTF-8 (que no es un problema en R Studio), pero no tuve suerte

Hola @sashan,

¿Puede compartir algún contenido detallado sobre este tema?

Como mencionaste sobre el uso del script r con la API de Twitter, también puedes echar un vistazo al artículo a continuación:

Análisis de Twitter usando SSIS 2016 y SQL Server R Services

Saludos,

Xiaoxin Sheng

Anónimo

En respuesta a v-shex-msft

Hola @sashan

Yo también tengo el mismo problema.

He resuelto esto de la siguiente manera

biblioteca (twitteR)
biblioteca (stringi)
tweets <- searchTwitter ("Bicester Village", n = 100, lang = "en")
df <- twListToDF (tweets)
df $ texto <- stri_encode (df_tweets $ texto, "", "UTF-8")

Pero lo extraño es que funciona bien en RStudio pero no en power bi query a veces

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *