Structured Blogging

Estructurar el contenido de las entradas de las bitácoras, acción a la que los anglosajones han bautizado con el nombre de ‘Structured Blogging’ es la última gran idea en la teoría de la información adaptada a Internet.

Todos somos conscientes del gran avance que supuso la creación de los agregadores, programas cuya popularidad es ya tal que incluso Microsoft coquetea con integrar un agregador web en su herramienta de búsqueda. El fundamento y base de estos programas son los feeds, fuentes de datos que incluyen información sobre las entradas y el contenido de la bitácora de forma estructurada. El que la información tenga una estructura fija posibilitó la creación de programas que supieran como manejarla, los agregadores de feeds.

Con el concepto de structured blogging se pretende llegar un poco más allá. Si antes se definía una estructura para diferenciar las distintas entradas y las partes que las conforman, en este caso se pretende definir una estructura fija para ciertos tipos de entradas, lo que permitiría crear herramientas que pudieran aprovecharse de la transformación del contenido de la entrada de texto simple a datos reales.

Supongamos por ejemplo que se popularizara una cierta estructura para las críticas de películas, libros o música. Podríamos entonces crear herramientas con directorios de las distintas críticas para una determinada obra, puntuaciones medias, clasificaciones de las distintas obras según su puntuación, etc.

Por otra parte, si se popularizara un formato para especificar citas (una conferencia, la fecha de liberación de determinado programa, una reunión de profesionales sobre determinado tema…) podríamos crear una herramienta que agregara esta información, permitiéndonos conocer con un solo click los eventos interesantes para cierto día, o quién acudiría a qué cita.

Estos dos últimos ejemplos son los que ya están implementados en un plugin creado para WordPress, incluído ya en esta bitácora, y del cual podeis ver un ejemplo en la entrada anterior, una review sobre la serie de anime Kurau Phantom Memory.

En el caso de que el tema de la estructuración de la información no sea de vuestro interés, quizás os llame más la atención de la posibilidad de asociar un estilo diferente según el tipo de entrada, como el caso del fondo de rollo de película en el ejemplo anterior. En todo caso echadle un vistazo, porque la idea es muy interesante.

Comentarios
  1. mmm, no acabo de pillarlo aunque debo reconocer que no lo he mirado muy detenidamente 😳

    Para esto no tenemos ya el RDF e incluso hasta cierto punto el Dublin Core???

    Voy a dar una opinión desinformada (como de costumbre :grin:), a mi me parece que esto no es más que reinventar estándares existentes de una forma más limitada y simple de implementar.

    ivan

    Responder

  2. no, no tiene que ver con el formato utilizado, si no con que se utilice para el contenido de la entrada en sí

    da igual cómo sea el sublenguaje de xml que utilices. lo interesante está en darle ese formato, esa estructura, al contenido de la entrada y no al contenido de la bitácora como hasta ahora. es parecido a lo que comentaban ¿en ask jeeves? sobre functional blogging.

    pasar de las entradas en las bitácoras de simple texto, a información que se pueda procesar y con la que hacer cosas interesantes 🙂

    Responder

  3. Merci por la aclaración, ahora tiene más sentido la iniciativa. Sin embargo, después de ver el contenido generado por la entrada de anime, no me acaba de conquistar la implementación 🙁
    Me parece genial que se estructure el contenido pero bajo mi punto de vista, un contenido ‘estructurado’ es útil solo para las maquinas, a un humano le da igual como esté escrito, simplemente vé el resultado final.
    En el ejemplo del anime hay un conjunto de divs con classes asignadas, que incorporan elementos ‘validos’ pero totalmente innecesarios, ya que el después se incluye lo mismo pero basado en xml.

    De todas formas me parece una buena idea en general y habrá que seguir su desarrollo de cerca 🙂

    Responder

  4. pues claro que a tí te da igual como esté escrito 😛
    y claro que es para las máquinas…

    imaginate una nueva web a la que hacer ping cada vez que escribas una nueva review de una película. esa web coge tu entrada y como sabe que tal cosa es la puntuación, tal la imagen, tal el argumento,…. pues puede almacenarlas como tal… ahora los datos tienen sentido para la aplicación y se pueden hacer 1001 y una cosas dependiendo del tipo de entrada que se te ocurra implementar. no es un simple conjunto de caracteres sin ningún sentido para la máquina. ¡son datos!

    Responder

  5. yommismo

    […]imaginate una nueva web a la que hacer ping cada vez que escribas una nueva[…]

    Creo que aquí lo importante es la palabra ping. Que sentido tiene engordar innecesariamente el contenido. Si es más fácil enviar esa información mediante un ping a la máquina que se encarga de indexar esa información
    O mejor aún. Implementar un sistema alternativo para que los robots, de esa máquina que indexa, naveguen por ese contenido alternativo. Dejando la puerta así abierta como esta ahora para que cualquier robot navegue, pero con la salvedad de que seria muchísimo más eficiente. Ya que este recibiría solo aquella información que realmente es relevante para él.

    Responder

  6. Una función muy útil… A ver si cuaja.

    Responder

  7. GIGIO

    Sobre agrecadores web, mientras que microsoft monta su buscador de RSS encontre este que es super interesante. CanalRSS.com

    Responder

  8. Igual no me expliqué bíen. Lo que quería decir es que no tiene mucho sentido, al menos así lo creo, incluir los divs en el feed rss. Ya que solo sirven a efectos de presentación en html, además de que los datos tambíen se incluyen en un vocabulario xml, por lo que cada ‘agregador’ (web, desktop, pda …) puede mostrarlos como quiera.

    Responder

  9. Creo que aquí lo importante es la palabra ping. Que sentido tiene engordar innecesariamente el contenido. Si es más fácil enviar esa información mediante un ping a la máquina que se encarga de indexar esa información
    O mejor aún. Implementar un sistema alternativo para que los robots, de esa máquina que indexa, naveguen por ese contenido alternativo. Dejando la puerta así abierta como esta ahora para que cualquier robot navegue, pero con la salvedad de que seria muchísimo más eficiente. Ya que este recibiría solo aquella información que realmente es relevante para él.

    de verdad que me estais estresando 🙄 da igual que tu le tengas que mandar un ping o que ellos indexen los ‘feeds’ que tengan agregados. si ese no es el tema…

    el tema es que… si mandas un ping a una aplicación web… tendrás que darle una cierta estructura al contenido que le mandas para que sepa interpretarlo, ¿no? que es un programa. no es una persona, coño. por mucho que tu veas que tal parte es la nota y tal otra el argumento o los actores, el programa no lo va a saber

    igual que ocurre con los feeds. si no le dijeras “lo que te pongo entre etiquetas title es el título, entre category la categoría, etc…” ¿como coño iba a saberlo el agregador? por muy listo que sea deep blue

    Responder

  10. yommismo

    No se porque te ha parecido que en mi nota te hablaba de personas. Me referia a eso precisamente, a un programa. Creo que sería más eficiente en terminos de ancho de banda para tí, como creador de la nota, y para la máquina que indexa en términos de ciclos de CPU.
    Si el contenido que tiene que leer esta lo recibe “limpio” de cualquier cosa.

    Responder

  11. ajá. pero es que te estas liando. o me estas liando a mí y no sé a que te refieres 😛

    si tuvieras la misma información con un contenido menor, cojonudo. podrías enviar la entrada sin añadidos y en paz. pero es que no tienes la misma información. si no le añades estructura la máquina no lo va a saber interpretar. asi que si le envías solo un grupo de letras (texto simple) la información es 0

    ¿qué ocurre con los feeds? que tienes que crear un sublenguaje de xml y decidir que title será el título y content el contenido. no te vale solo mandarle el texto de la entrada en sí, que sería más “limpio” en el sentido de que son menos caracteres, porque eso no sería más que texto sin sentido para la máquina

    decir que no es una buena idea porque es menos “limpio”, tiene el mismo sentido que decir que las bases de datos tampoco lo tienen, porque la idea es exactamente la misma

    Responder

  12. yommismo

    Sí, seguramente me estoy haciendo la picha un lio.
    Pensaba que lo que “interpreta la máquina” cuando responde a ese ping, es lo que aparece en el contenido ese <subnode alternate-for-id=”sbentry_1″… …</subnode>.
    A lo que y me refería era ¿porqué eso esta ahí y no por decirlo de alguna manera en un sitio aparte donde solo se envie eso?
    No me refería a la estructura que me parece genial, solo echo en falta quizás el idioma, sino a dondé se presenta para que la máquina la indexe.
    Nada para aclararme creo que me bajaré el WordPress y ese plugin para ver como tira esta historia.
    Por cierto, ¿algún ejemplo de un sitio de esos a los que se hace ping? Más que nada para ver como funciona la otra parte.

    Responder

  13. Ya lo estoy usando, esta genial, eso si creo que se lleva mejor con el UTF-8

    Responder

  14. […] Hace tiempo ya que se empezó a hablar (1, 2, 3, 4 ) de este tipo de blogging. Es un proyecto bastante interesante y por ello permitidme recordarlo. […]

    Responder

Deja un comentario