1. Introducción

El proyecto MTUOC proporciona un cliente (MTUOC-Translator) capaz de enviar peticiones de traducción a un servidor y recibir la traducción. Admite archivos en formato texto y XLIFF. MTUOC-Translator está diseñado para trabajar con MTUOC-server, pero es capaz de enviar peticiones a servidores MTUOC, Moses, Server, ONMT, NMTWizardd y ModernMT. Estos son los mismo tipos de servidor que puede mimetizar MTUOC-server, así que puede trabajar con MTUOC-server independientemente de con qué tipo de servidor lo hayamos puesto en marcha. Además, MTUOC-Translator será capaz de funcionar contectándose a servidores de los tipos indicados, si necesidad de que sean realmente un MTUOC-server.

MTUOC-Translator se distribuye tanto en código fuente Python como en un ejecutable para Windows. Se puede descargar de Github: https://github.com/aoliverg/MTUOC-translator

Una vez descargado el archivo no es necesario instalar nada y se puede ejecutar directamente el programa. Si trabajas en Windows puedes hacer directamente doble clic sobre el archivo ejecutable. En Linux o Mac puedes utilizar la versión Python. Es posible que te falte algún paquete o librería, y tendrás que instalarlas. El programa funciona con la versión 3 de Python. Las librerías que quizás tengas que instalar (se puede hacer con pip3, o pip según tu instalación de Python) son:

pip3 install lxml, regex, pyyaml, websocket, wesocket-client, requests

Una vez instalados los prerequisitios se puede ejecutar el programa haciendo:

python3 MTUOC-Translator.py

El programa es muy fácil de utilizar, una vez se pone en marcha aparece una interfaz con 4 pestañas:

  • Connect to
  • Test
  • Text File
  • XLIFF

2. Pestaña connect to

1586872604356-954.png

Esta pestaña nos permite conectarnos a un servidor. Para ello tenemos que indicar la IP del servidor (Server IP:). Si el motor corre en la mimsma máquina tenemos que indicar localhost. También tenemos que indicar el puerto que utiliza el motor (Server port). Tenemos que indicar el tipo de servidor al que nos conectamos (Server type) de uno de la lista (MTUOC, Moses, OpenNMT, NMTWizard, ModernMT). Si pretendemos exportar el resultado de las traducciones a un archivo TMX tenemos que indicar los códigos de la lengua de partida (Source Language) y de llegada (Target Language). Esta información únicamente se utiliza en la exportación en TMX. Podemos escoger segmentar o no y el archivo de segmentación SRX a utilizar. Por defecto se utiliza el proporcionado (segment.srx). Haciendo clic al botón Connect no conectaremos al servidor. Para desconectarnos podemos utilizar el botón Disconnect.

3. Pestaña Test

1586880550909-232.png

Esta pestaña permite probar el sistema (tiene que estar conectado al sistema de T.A.). Si se pone una oración en el cuadro de texto superior y se hace clic en el botón Translate, la traducción aparecerá en el cuadro de texto inferior. Si se hace clic en el botón Clear se borra el contenido de ambos cuadros de texto.

4. Pestaña Text File

1586880758759-352.png

En esta pestaña podemos traducir archivos de texto. Es muy importante tener en cuenta si queremos segmentar el texto o no. Si queremos segmentarlo, hay que activar la segmentación y seleccionar un archivo SRX en la pestaña Connect to. En general, si el texto no está segmentado, será necesario segmentarlo ya que el servidor de T.A. espera recibir segmentos. Esta pestaña se utiliza a menudo para traducir conjuntos de evaluación, que acostumbran a estar ya segmentados (tienen un segmento por linea). Es este caso es importante no segmentar los textos.

Para seleccionar el archivo de entrada utilizaremos el botón Select source file. Una vez seleccionado la ruta del archivo se muestra en el cuadro de texto de la derecha del botón. También se genera automáticamente un nombre para la memoria TMX en caso que queramos exportarla. Para seleccionar el archivo de entrada utilizaremos el botón Select target file. Una vez seleccionado la ruta del archivo se muestra en el cuadro de texto de la derecha del botón. Si queremos exportar la memoria en TMX tenemos que marcar la casilla de selección Export TMX. Si el nombre de la memoria de traducción generado automaticamente nos parece bien, no será necesario utilizar el botón Select TMX file. Si queremos seleccionar otro archivo para la memoria TMX, podemos utilizar el botón Select TMX file o bien editar el contenido del cuadro de texto correspondiente. Para empezar la traducción pulsaremos el botón Translate.

5. Pestaña XLIFF

1586881789148-434.png

En esta pestaña podemos traducir archivos XLIFF. Para seleccionar el archivo de entrada utilizaremos el botón Select source file. Una vez seleccionado la ruta del archivo se muestra en el cuadro de texto de la derecha del botón. También se genera automáticamente un nombre para la memoria TMX en caso que queramos exportarla. Para seleccionar el archivo de entrada utilizaremos el botón Select target file. Una vez seleccionado la ruta del archivo se muestra en el cuadro de texto de la derecha del botón. Si queremos exportar la memoria en TMX tenemos que marcar la casilla de selección Export TMX. Si el nombre de la memoria de traducción generado automaticamente nos parece bien, no será necesario utilizar el botón Select TMX file. Si queremos seleccionar otro archivo para la memoria TMX, podemos utilizar el botón Select TMX file o bien editar el contenido del cuadro de texto correspondiente. Para empezar la traducción pulsaremos el botón Translate.

6. Archivo de configuración

MTUOC-Translator utiliza un archivo de configuración (config-translator.yaml) que permite establecer las opciones por defecto al poner en marcha el programa. Se trata de un archivo de texto que contiene:

Server:
  ip: localhost
  port: 8000
  type: MTUOC
  #One of MTUOC, Moses, OpenNMT, NMTWizard, ModernMT

Filepath:
  path_in: /home/user
  path_out: /home/user

Segmentation:
  segment: False
  #True or False
  SRX_file: segment.srx

LanguageCodes:
  source: en
  target: es


Textfile:
  encoding: utf-8

Podemos establecer estos parámetros por defecto editando este archivo para ahorrar tiempo cuando utilizamos el programa.

 

Tags:
Created by Antoni Oliver on 2019/07/26 12:36