lunes, 17 de mayo de 2010

La API de Twitter ahora extrae más datos de los tweets


Uno de estos usos podría ser la mejora de los resultados de búsqueda que estamos viendo en Twitter .

El anuncio llegó ayer de la mano del desarrollador de plataforma de Twitter Raffi Krikorian a través del Google Group sobre la API del microblog. Según Krikorian, “cerca del 50% de los tweets” contienen al menos una mención @, mención a una lista, URL o etiqueta.

Los desarrolladores que quieran comprender el texto del tweet tienen que interpretarlo para intentar extraer esas entidades (lo cual pude resultar realmente duro y difícil al trabajar con caracteres unicode) y después posiblemente hacer otra llamada REST para resolver esos datos.

Ejemplo - Entidades Twitter - ReadWriteWeb-esLa funcionalidad había estado disponible previamente a través del miembro del equipo de internacionalización de Twitter Matt Sanford como librería de texto de twitter en github. Sin embargo, ahora esta interpretación de datos de tweets formará parte de las cargas de JSON y XML que ofrece la API de Twitter, lo que quiere decir que probablemente veamos a muchos más desarrolladores incluir funciones que utilicen esta información.

Como se puede ver en el ejemplo que hemos incluido, el nuevo formato de datos estructurados incluirá un identificador único, una ubicación de cadena y los demás datos para cada “entidad”. Antes de añadirse esto a la API de Twitter, el desarrollador era el responsable de interpretar la cadena. La nueva función debería no sólo fomentar el lanzamiento de nuevas funciones y mashups, sino que también es probable que fomente un almacenamiento más eficiente de los datos y unos resultados más fructíferos en las consultas.

Otra cuestión que hay que tener en cuenta es que esto debería aligerar la carga de la API de Twitter, aunque sólo sea en un porcentaje diminuto, ya que los programas tendrán que hacer menos llamadas a la API.

Via Twiitboy