domingo, 16 de enero de 2011

¿Traducir? No sin mi Corpus

Bueno bueno, parece que nuestro pequeño rincón empieza a tomar más forma.
A petición de nuestra seguidora nº1, María Gomez Castro, de Madrid, dedicaremos esta sección a los Corpus lingüísticos.



¿Que no sabéis lo que son?
La verdad que son múltiples las definiciones que se le han dado a este concepto. Pero, para que lo entendamos todos, we will keep it simple! ;)

Un corpus lingüístico no es más que un conjunto ordenado de textos en formato electrónico, que deben tener ciertas características.



Y ahora algunos os estaréis preguntando:  
-Bueno, ¿y esto no es lo mismo que Internet?

-Not at all. Es verdad que en Internet también podremos encontrar posiblemente todos los textos de los que antes hablabamos, pero sin ningún tipo de control lingüístico. La información en Internet es ilimitada, lo que suele ser un aspecto negativo cuando el traductor necesita una respuesta rápida. Además, ¿qué grado de fiabilidad tiene dicha información?

El Corpus lingüístico, trabaja con textos bien "mantenidos" y controlados por los lingüistas y que están sistematizados por expertos informáticos.

La creación de esta herramienta ha provocado un cambio de rumbo en la labor de traducción, facilitando enormemente la investigación en este campo.


Como ya sabemos, el arte del traductor, no está en traducir un texto por sí mismo, sin recurrir a ninguna herramienta. Todo lo contrario, lo que hoy en día se buscan son "TRADUCTORES CAPACES DE ESPECIALIZARSE EN TEMAS CONCRETOS EN UN BREVE PERÍODO DE TIEMPO, QUE USEN LOS ENTORNOS INFORMÁTICOS Y LOS RECURSOS PROPIOS DE LA TRADUCCIÓN; O SEA, PROFESIONALE VERSÁTILES Y ADAPTABLES A LAS PRESIONES Y EXIGENCIAS DE LA SOCIEDAD".


Así que, manos a la obra, reciclaos, y sacad el máximo provecho de este recurso.

Os queremos introducir en este campo mediante dos ejemplos de Corpus; el CREA y el CORDE.
Son los corpus de la Real Academia Española. Son una inmensa obra colectiva en la que participaron especialistas de las universidades de toda España.

CREA (Corpus de referencia del español actual)

http://corpus.rae.es/creanet.html


  • 160 millones de palabras textuales (tokens)
  • Textos publicados desde 1975 hasta la actualidad
  • Textos publicados en libros, revistas, periódicos
  • Hipercampos: ciencia, tecnología, ciencias sociales, pensamiento, política, economía, arte, ocio, vida cotidiana, salud y ficción

CORDE (Corpus diacrónico del español)

http://corpus.rae.es/cordenet.html

  • 300 millones de palabras textuales
  • Textos desde la etapa más antigua de la lengua hasta la actualidad
  • Hipercampos: todos los anteriores + poesía de todo tipo, prosa narrativa, prosa didáctica, jurídica, científica y textos periodísticos

Para que os vayáis familiarizando con la página, vamos a realizar una consulta práctica con CORDE. Imaginémosno que tenemos que realizar una traducción de la obra Campos de Castilla, de Antonio Machado. Nos interesa saber cuántas veces aparece el topónimo Castilla a lo largo de la obra:

  1. En la casilla consulta, introducimos "Castilla"
  2. En la casilla autor, introducimos "Machado"
  3. En la casilla obra, introducimos "Campos de Castilla"

Obtenemos como resultado, 36 ocasiones en las que aparece Castilla.

Rápido y fácil! :)

Os proponemos ahora que practiquéis con otras consultas que penséis os pueden ser útil a la hora de enfrentaros a una traducción

2 comentarios:

  1. María Gómez Castro17 de enero de 2011, 17:11

    Gracias por haber publicado esta entrada que tanta falta me hacía.
    Es todo un honor que mencionéis mi nombre en vuestro blog

    María

    ResponderEliminar
  2. Bien hecho chicas, María Gómez hace bien en seguiros:)

    ResponderEliminar